Текст
                    В. Г. ЛЕВИЧ, Ю. А. ВДОВИН, В. А. МЯМЛИН
КУРС
ТЕОРЕТИЧЕСКОЙ
ФИЗИКИ
Том II
КВАНТОВАЯ МЕХАНИКА. КВАНТОВАЯ
СТАТИСТИКА И ФИЗИЧЕСКАЯ
КИНЕТИКА
Под редакцией чл.-корр. АН СССР В. Г. ЛЕВИЧА
ИЗДАНИЕ ВТОРОЕ, ПЕРЕРАБОТАННОЕ
Допущено Министерством высшего и среднего специального образования СССР
в качестве учебного пособил для студентов физико-технических специальностей
высших учебных заведений.
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
MOCK В А 1971


530. 1 Л 37 УДК 530. 1 @75. 8) Левич Вениамин Григорьевич Вдовин Юрий Александрович Мямлин Виктор Алексеевич КУРС ТЕОРЕТИЧЕСКОЙ ФИЗИКИ Том II Мм 1971 г., 936 стр. с илл. Редакторы Л. Ф. Верес, В. И. Рыдник Техн. редактор С. #¦ Шкляр Корректор Т. С. Вайсберг Сдано в набор 13/VI 1971 г. Подписано к печати 7/Х 1971 г. Бумага 60X90Vie. Физ. печ. л. 58,5. Условн. печ. л. 58,5. Уч.-изд. л. 58,69. Тираж 48000 экз. Т-13397. Цена книги 2 р. 19 к. Заказ № 1058. Издательство «Наука». Главная редакция физико-математической литературы. Москва, В-71, Ленинский проспект, 15. Ордена Трудового Красного Знамени Ленинградская типография № 2 имени Евгении Соколовой Главполиграфпрома Комитета по печати при Совете Министров СССР. Измайловский проспект, 29. 2-3-2 77 — 71
ОГЛАВЛЕНИЕ Предисловие ко второму изданию „ 9 часть v КВАНТОВАЯ МЕХАНИКА Глава I Основы квантовой механики 11 § 1. Физические основы квантовой механики 11 § 2. Волновая функция 18 § 3. Принцип суперпозиции. Разложение по плоским волнам ... 24 § 4. Соотношения неопределенности и связь квантовой механики с классической 28 § 5. Принцип причинности в квантовой механике 32 Глава II. Уравнение Шредингера , 35 § 6. Волновое уравнение Шредингера 35 § 7. Плотность потока вероятности 39 § 8. Частица в одномерной прямоугольной потенциальной яме . . .41 § 9. Частица в трехмерной прямоугольной потенциальной яме . . 45 § 10. Линейный осциллятор .... ... 46 §11. Трехмерный осциллятор 51 § 12. Отражение и прохождение через потенциальный барьер ... 53 § 13. Одномерное движение . . ... 59 § 14. Уравнение Шредингера для системы частиц 63 Глава III. Математический аппарат квантовой механики 67 § 15. Линейные операторы 67 § 16. Собственные значения и собственные функции операторов ... 71 § 17. Эрмитовы операторы . . . . .73 § 18. Ортогональность и нормировка собственных функций эрмитовых операторов ... . . . .... ... 76 § 19. Разложение по собственным функциям . . 78 § 20. Квантовомеханические величины и операторы 80 § 21. Волновая функция и вероятность результатов измерений ... 82 § 22. Средние значения 84 § 23. Коммутация операторов 87 § 24. Неравенства Гейзенберга 91 § 25. Скобки Пуассона 92 § 26. Операторы и собственные функции координаты и импульса . . 95 § 27. Оператор Гамильтона ... . 100 § 28. Стационарные состояния ... . . 102 § 29. Интегральная форма уравнения Шредингера ... .104 § 30. Собственные значения и собственные функции операторов мо- момента и квадрата момента 10Э 1*
4 ОГЛАВЛЕНИЕ § 31. Дифференцирование операторов по времени 115 § 32. Интегралы движения 118 § 33. Четность 121 § 34. Соотношение неопределенности для времени и энергии .... 124 Глава IV. Движение в поле с центральной симметрией 128 § 35. Уравнение Шредингера . . . 128 § 36. Свободное движение частицы с заданным моментом количества движения 136 § 37. Сферическая яма 137 § 38. Движение в кулоновском поле 140 Глава V. Квазиклассическое приближение 149 § 39. Предельный переход к классической механике 149 § 40. Решение уравнения Шредингера вблизи точки поворота . . .154 § 41. Движение в потенциальной яме в квазиклассическом приближе- приближении 158 § 42. Прохождение через потенциальный барьер .... . . 161 § 43. Квазиклассическое движение в центрально-симметричном поле 165 Глава VI. Матричная форма квантовой механики 167 § 44. Операторы и матрицы 167 § 45. Основы матричного исчисления 170 § 46. Геометрическая интерпретация волновой функции и канониче- канонические преобразования 178 § 47. Собственные функции и собственные значения оператора, за- заданного в матричной форме . . 181 § 48. Непрерывные матрицы. Обозначения Дирака 184 § 49. Представления Шредингера, Гейзенберга и представление взаи- взаимодействия . 191 § 50. Линейный осциллятор (матричное представление) 197 § 51. Матричные элементы оператора момента 200 § 52. Сложение моментов количества движения 205 Глава VII. Теория возмущений , . , . . 210 § 53. Теория возмущений, не зависящих от времени 210 § 54. Теория возмущений при наличии вырождения ...... 214 § 55. Теория нестационарных возмущений . . 220 § 56. Переход системы в новые состояния под влиянием возмущений 222 § 57. Адиабатическая теория возмущений 230 § 58. Теория возмущений в интегральной форме 232 Глава VIII. Спин и тождественность частиц 234 § 59. Спин элементарных частиц 234 § 60. Операторы спина 236 §61. Собственные функции операторов проекций спина частиц. Мат- Матрица поворота . . 240 § 62. Полный момент количества движения ... . * 247 § 63. Уравнение Паули. Вектор плотности потока вероятности . . 250 § 64. Тождественность частиц. Принцип тождественности частиц. Сим- Симметричные и антисимметричные состояния ... 253 § 65. Волновые функции для системы фермионов и бозонов. Принцип Паули 257 § 66. Волновая функция системы из двух тождественных частиц со спином 1/2 . . . . . '. 260 § 67. Обменное взаимодействие и понятие о химическом и сильном ядерном взаимодействии 263
ОГЛАВЛЕНИЕ 5 Глава IX. Приложения квантовой механики к рассмотрению свойств атомных и ядерных систем 275 § 68. Атом гелия . 275 § 69. Вариационный принцип . . . . 279 § 70. Метод самосогласованного поля (метод Хартри—Фока) . . .281 § 71. Статистическая модель атома 285 § 72. Квантовые числа, характеризующие состояния электронов в ато- атомах 291 § 73. Периодическая система элементов 297 § 74. Эффект Зеемана 306 § 75. Эффект Пашена — Бака и диамагнетизм атомов 311 § 76. Теория дейтона 313 § 77. Теория ядерных оболочек 318 Глава X. Теория двухатомных молекул 321 § 78. Адиабатическое приближение и классификация электронных термов 321 § 79. Молекула водорода и понятие о теории химической связи . . 324 § 80. Взаимодействие атомов на больших расстояниях 331 § 81. Сопоставление молекулярных термов с атомными 334 § 82. Вращение и колебания молекул 336 Глава XI. Теория рассеяния ¦ 342 § 83. Амплитуда и сечение рассеяния 342 § 84. Формула Борна . . 343 § 85. Рассеяние быстрых заряженных частиц атомами 351 § 86. Фазовая теория рассеяния 353 § 87. Рассеяние сферической потенциальной ямой (понятие о резо- резонансном рассеянии) 359 § 88. Упругое рассеяние тождественных частиц 363 § 89. Учет поляризации в процессах рассеяния 367 § 90. Переход к классическому пределу в квантовых формулах рас- рассеяния . . . . 373 § 91. Общая теория неупругого рассеяния и поглощения частиц . . 379 § 92. Дифракционное рассеяние быстрых нейтронов ядрами .... 385 § 93. Рассеяние медленных частиц. Пороговое приближение .... 388 § 94. Формула Брейта — Вигнера 390 § 95. Матрица рассеяния (S-матрица) 395 § 96. S-матрица и теория возмущений 401 § 97. Аналитические свойства S-матрицы 404 § 98. Обращение времени и принцип детального равновесия .... 410 Глава XII. Метод вторичного квантования и теория излучения . . . 415 § 99. Вторичное квантование для систем бозе- и ферми-частиц . .415 § 100. Квантовая механика фотона 423 § 101. Квантование поля излучения 427 § 102. Взаимодействие электрона с излучением 430 § 103. Поглощение и излучение света 433 § 104. Дипольные переходы в атомных системах 436 § 105. Квадрупольное и магнитное дипольное излучения 438 § 106. Правила отбора 439 § 107. Фотоэффект ... 442 § 108. Рассеяние света атомами 445 § 109. Теория естественной ширины линии 451
5 ОГЛАВЛЕНИЕ Глава XIII. Релятивистская квантовая механика 456- § 110. Релятивистское волновое уравнение для частицы со спином нуль .... ... .... 456 § 111. Плотность заряда и поток вероятности для частиц со спином нуль . 458 § 112. Понятие о поле ядерных сил 460 § 113. Уравнение Дирака 464 § 114. Плотность вероятности и поток вероятности в теории Дирака 469 § 115 Решение уравнения Дирака для свободной частицы ... 471 § 116. Понятие о позитроне 474 § 117. Спин частиц, описываемых уравнением Дирака 479 § 118. Переход от уравнения Дирака к уравнению Паули и магнит- магнитный момент частицы . 481 § 119. Атом водорода в теории Дирака . 484 § 120. Инвариантность уравнения Дирака по отношению к отраже- отражению, повороту и лорепцеву преобразованию координат . . . 486 § 121. Законы преобразования билинейных комбинаций, составлен- составленных из волновых функций . .... 489 § 122. Понятие о слабых взаимодействиях. Несохранение четности . 491 § 123. Теория двухкомпонентного нейтрино. Универсальное четырех- фермионное взаимодействие 496 Глава XIV. Некоторые вопросы квантовой электродинамики .... 503 § 124. Функция Грина уравнения Дирака 503 § 125. Функция Грина для системы из двух частиц 509 § 126. Диаграммы Фейнмана 513 § 127. Комптон-эффект ... 519 § 128. Смещение термов атома водорода под влиянием поля вакуума (лэмбовское смещение) 527 Глава XV. Основы теории элементарных частиц 532 § 129. Элементарные частицы и их свойства 532 § 130. Типы взаимодействий элементарных частиц 535 § 131. Группы симметрии в квантовой механике 533 § 132. Изогруппа SUB) и ее представления 543 § 133. Изомультиплеты элементарных частиц 548 § 134. Волновые функции системы нуклонов и я-мезонов 554 § 135. Изотопически-инвариантное взаимодействие 558 § 136. Рассеяние нуклонов и я-мезонов 561 § 137. Унитарная группа SUC) и ее представления 5Б7 § 138. Восьмеричный формализм и унитарные мультиплеты .... 57? § 139. Некоторые следствия строгой унитарной симметрии 577 § 140. Понятие о нарушенной унитарной симметрии 582 § 141. Составные модели в схеме унитарной симметрии. Кварки . . 586 § 142. Общая оценка унитарной симметрии 590 ЧАСТЬ VI КВАНТОВАЯ СТАТИСТИКА И ФИЗИЧЕСКАЯ КИНЕТИКА Глава I. Квантовая статистика * ... 59fr § 1. Статистическая матрица и статистический оператор 596 § 2. Статистическое распределение в квантовой статистике .... 600 § 3. Статистическое распределение в идеальном газе 6Э?
ОГЛАВЛЕНИЕ 7 § 4. Вырожденный идеальный бозе-газ 612 § 5. Неидеальный бозе-газ. Сверхтекучесть 617 Глава II. Физическая кинетика 626 § 6. Постановка проблемы 626 § 7. Закон сохранения массы и диффузионный поток 629 § 8. Закон сохранения импульса и уравнения движения сплошной среды 633 § 9. Закон сохранения энергии и перенос энтропии в движущейся сплошной среде 637 § 10. Уравнения Фоккера — Планка 642 § 11. Основное кинетическое уравнение 650 § 12. Обсуждение основного кинетического уравнения ...... 656 § 13. Неравновесные системы с отрицательной температурой и уси- усиление ими электромагнитных волн ". . 660 Глава III. Кинетическая теория газов и газоподобных систем .... 665 § 14. Кинетическое уравнение Больцмана 665 § 15. Основное кинетическое уравнение для коррелятивной функции 670 § 16. Вывод уравнения Больцмана из основного кинетического урав- уравнения 674 § 17. Обобщенное уравнение переноса и свойства аддитивных инва- инвариантов 680 § 18. Уравнения переноса массы, импульса и энергии 633 § 19. Закон возрастания энтропии 687 § 20. Равновесное и локально равновесное распределение в идеальном газе 689 § 21. Общая теория решения уравнения Больцмана 693 § 22. Уравнения гидродинамики, вязкость и теплопроводность газов 70Э § 23. Время релаксации 708 § 24. Диффузия легкой примеси в основном газе 711 § 25. Термодиффузия в газах 717 § 26. Дисперсия звука 719 § 27. Линеаризованное уравнение Больцмана для квазигазовых систем 721 § 28. Решение уравнения Больцмана для квазигазовых систем во внешнем поле сил 725 § 29. Кинетическое уравнение для неодноатомных газов 727 § 30. Замедление быстрых нейтронов 732 § 31. Пространственное распределение нейтронов 741 § 32. Кинетическое уравнение в плазме без столкновений 745 § 33. Дисперсия и затухание плазменных волн 748 § 34. Кинетическое уравнение в плазме с учетом столкновений . . . 756 § 35. Установление равновесия в электронно-ионной плазме .... 761 Глава IV. Методы временных коррелятивных функций и теория Онзагера 765 § 36. Реакция системы на внешнее динамическое возмущение. Класси- Классический расчет 765 § 37. Реакция системы на внешнее динамическое возмущение. Кван- Квантовый расчет 771 § 38. Реакция системы на термическое возмущение 773 § 39. Вычисление кинетических коэффициентов и связь с уравнением Больцмана 777 § 46. Теория Онзагера 7?0 § 41. Следствия из соотношений Онзагера 785 § 42. Неравновесные процессы в однокомпонентной системе .... 788
8 ОГЛАВЛЕНИЕ § 43. Неравновесные процессы в многокомпонентных системах, (диф- (диффузия и термодиффузия) 790 § 44. Флуктуационно-диссипативная теорема 794 Глава V. Теория твердого тела 799 § 45. Твердое тело как квантово-механическая система 799 § 46. Кристаллическая решетка 802 § 47. Колебания решетки . 805 § 48. Волновая функция электрона, движущегося в периодическом поле 811 § 49. Энергетический спектр электрона, движущегося в периодиче- периодическом поле 813 § 50. Система электронов в твердом теле 827 § 51. Модель металла, полупроводника и диэлектрика . ... 835 § 52. Магнитные свойства металлов. Парамагнетизм электронного газа 839 § 53. Диамагнетизм электронного газа 842 § 54. Ферромагнетизм 846 § 55. Взаимодействие электронов с колебаниями решетки 852 § 56. Полный гамильтониан твердого тела 859 Глава VI. Кинетические свойства твердых тел 863 § 57. Кинетическое уравнение для электронов в металлах 863 § 58. Электропроводность металлов 865 § 59. Эффект Холла 868 § 60. Оптические свойства системы электронов проводимости .... 873 § 61. Длина свободного пробега электрона в металлах 874 § 62. Интеграл столкновений для электронов в металле 881 § 63. Решение кинетического уравнения 884 § 64. Сверхпроводимость 88& § 65. Теория ферми-жидкости 897 § 66. Электроны в кристаллах диэлектриков 905 § 67. Внешний фотоэффект с поверхности металла 907 Глава VII. Взаимодействие излучения с газом свободных электронов 912 § 68. Разреженная плазма в поле низкочастотного излучения . . . 912 § 69. Кинетические уравнения для электронов и фотонов 917 § 70. Кинетика бозе-конденсации фотонного газа 922 § 71. Подвижность электрона в поле излучения 925 § 72. Система электронов в произвольном поле излучения 931 § 73. Обсуждение результатов и области применимости теории . . . 933
ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ Быстрое развитие теоретической физики и расширение об- области ее приложений сделало актуальным такие ее разделы, ко- которые еще несколько лет назад находились в начальной стадии развития. Это определило необходимость существенной перера- переработки второго тома «Курса теоретической физики». Часть IV, посвященная теории электромагнитного поля в веществе, перемещена в том I. В часть V — квантовую механику включена теория S-матрицы, переработан и написан заново ряд параграфов. В настоящее время «Курс теоретической физики» был бы не полным, если бы в нем не нашло отражение современ- современное состояние теории элементарных частиц. Поэтому часть V завершает глава XV, посвященная основам теории. Естественно, что сложность проблемы и стремление избежать вульгаризации привели к тому, что глава XV потребует от читателя больших усилий для усвоения. Однако для чтения этой главы не потре- потребуется какой-либо специальной подготовки. Во втором издании «Курса теоретической физики» помещена новая, VI часть, «Квантовая статистика и физическая кинетика». Поскольку наиболее актуальные приложения теории связаны с использованием расчетного аппарата квантовой механики, физи- физическая кинетика следует за квантовой механикой. Часть V, «Квантовая механика», в основном написана Ю. А. Вдовиным и В. А. Мямлиным под общим руководством В. Г. Левича. При этом Ю. А Вдовиным были написаны гла- главы И, IV, V, VI, VIII, XII и §§ 9, 95, 97, 98; В. А. Мямлиным главы IX, X, XI, XIII. Главы I, III, VII В. Г. Левичем и Ю. А. Вдо- Вдовиным совместно. Глава XIV совместно Ю. А. Вдовиным и В. А. Мямлиным. В. Г. Левичем написаны §§ 67, 69, 70, 94, 96, 100, 119 и 128. Глава XV «Основы теории элементарных частиц» целиком написана А. И. Наумовым, которому мы выражаем за
10 ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ это искреннюю благодарность. В. Г. Левичем проведено редак- редактирование всего материала части V. Часть VI — «Квантовая ста- статистика и физическая кинетика» написана В. Г. Левичем кроме §§ 48, 62, 63, написанных В. А. Мямлиным, и §§ 5 и 64, написан- написанных всеми авторами совместно. В заключение мы хотели бы выразить благодарность всем лицам, помогавшим нам при подготовке этой книги, в особен- особенности В. С. Маркину, В. В. Толмачеву, А. М. Бродскому, Р. Р. Догонадзе, А. М. Головину. И. В. Савельев указал ряд опечаток и неточностей предыдущего издания, которые теперь исправлены. Л. Д. Конкина помогла в оформлении рукописи. Замечания читателей и студентов, пользовавшихся первым" изданием книги, были для нас очень важны и нашли свое отра- отражение во втором издании. Авторы
ЧАСТЬ V КВАНТОВАЯ МЕХАНИКА ГЛАВА I ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ § 1. Физические основы квантовой механики Квантовая механика, как и всякая физическая теория, воз- возникла в тесной связи с развитием новой области эксперимен- экспериментальных исследований. Эти исследования, начавшиеся с изуче- изучения свойств излучения черного тела, в начале нашего века быстро распространились на явление фотоэффекта, а затем на атомные системы. В рамках этой книги мы не можем последо- последовательно осветить всю историю развития новых представлений о характере атомных процессов, имевшую своим итогом созда- создание современной квантовой механики. Укажем лишь, что это были мучительные поиски, потребовавшие огромных усилий крупнейших физиков нашего века. Несомненно, что создание квантовой механики было величайшим триумфом современной науки. Трудности, стоявшие на пути развития квантовой меха- механики, были связаны с тем, что свойства частиц, из которых по- построены атомные системы, кардинальным образом отличаются от свойств макроскопических тел. Законы классической меха- механики и классической электродинамики оказались непригодными для описания поведения отдельных молекул и атомов, а также элементарных частиц — электронов, протонов, нейтронов и т. д. В дальнейшем элементарные частицы, а иногда отдельные ато- атомы и молекулы мы будем объединять термином микрочастицы. Как мы увидим, отличительной особенностью микрочастиц яв- является то, что их движение не подчиняется законам классической механики. С рядом фактов, свидетельствующих о непригодности классических представлений в области атомных процессов, мы познакомились выше, в частности в теории электромагнитного поля и особенно в статистической физике. Так, в статистической физике мы видели, что основная величина, характеризующая состояние отдельных атомов и молекул — их энергия, пробегает дискретный ряд значений. Прямое доказательство дискретности состояний атомных си- систем было получено в опытах Франка и Герца A913 г.). Как
12 ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ [ГЛ. Г известно, в опытах Франка и Герца пучок электронов с заданной энергией поступал в сосуд, наполненный газом. Ток электронов, прошедших через газ, как функция ускоряющего потенциала, обнаруживал ряд резких минимумов. Положение этих миниму- минимумов характерно для природы атомов газа. Такая зависимость тока от потенциала может быть истолкована следующим обра- образом. Электроны испытывают столкновения с атомами и пере- передают им энергию в тех случаях, когда энергия электронов имеет определенное значение, равное разности энергий двух возмож- возможных состояний атома. При этом атом переходит в состояние с большей энергией — возбужденное состояние, а в величине тока электронов появляется минимум. Если энергия электронов имеет другое значение, они испытывают лишь упругие соударения. Та- Таким образом атом, как целое, может получать извне только определенные порции энергии. Это означает, что энергия атома принимает только дискретный ряд значений или, иначе говоря, атом обладает дискретным спектром энергий. Дискретный ха- характер энергетических состояний влечет за собой дискретный характер атомных переходов. При переходе атома из возбужден- возбужденного в более низкое энергетическое состояние разность энергий излучается в виде светового кванта. Энергия атома не единственная величина, которая может принимать лишь дискретные или, как говорят, 'квантованные значения. В опытах Штерна и Герлаха было показано, что та- таким же дискретным спектром значений обладает и механический момент атома. В этих опытах пучок атомов проходит через неод- неоднородное магнитное поле <9#, постоянное по направлению. Выби- Выбирая это направление за ось z, можно написать для силы, дей- ствующеи на атом, выражение Hz-^j5-» где \хг — проекция маг- магнитного момента атома на направление поля. Если считать, что теорема о пропорциональности между магнитным и механиче- механическим моментом (см. ч. I, § 22) справедлива для атомов, то из этого следует, что средняя сила оказывается пропорциональной величине Lz, где Lz — проекция момента количества движения атома на направление поля *). Опыт Штерна и Герлаха показал, что пучок атомов откло- отклоняется в магнитном поле, разбиваясь на ряд отдельных пучков. Это означает, что проекция механического момента атома на направление поля может принимать лишь дискретный ряд зна- значений. Каждому допустимому значению Lz отвечает свое значе- значение силы и соответствующая величина отклонения в неоднород- неоднородном магнитном поле. Таким образом, каждый из возникших пучков содержит атомы с данным значением величины Lz. 1) См. однако, гл. VIII.
§ 1] ФИЗИЧЕСКИЕ ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ 13 Дискретный характер допустимых значений основных вели- величин, характеризующих состояние атомных систем, глубоко про- противоречит всей совокупности представлений классической меха- механики. Из общих положений классической механики следует, что бесконечно малая сила вызывает бесконечно малое изменение равновесного состояния системы. Поэтому все механические ве- величины, зависящие от состояния системы, как, например, энер- энергия, количество движения и т. п., являются непрерывными функ- функциями состояния. Дискретность состояний и скачкообразное изменение состояний микрочастиц непосредственно противоречит указанному общему принципу. Трудность понимания свойств микрочастиц усугубляется тем, что наряду со свойствами дискретности некоторых величин, ха- характеризующих состояние частиц, в ряде опытов проявлялась ясно выраженная непрерывность этих же величин. Так, напри- например, тормозное рентгеновское излучение электронов в поле ядер имеет непрерывный спектр, что свидетельствует о непрерывном изменении энергии излучающих частиц. Оказалось, что микрочастицы удивительным образом соче- сочетают в себе свойства обычных частиц— корпускул *) и свойства волн. Это основное свойство микрочастиц носит название кор- пускулярно-волнового дуализма. Основной особенностью корпускул, изучаемых в классиче- классической механике, является наличие у них определенной простран- пространственной протяженности. Идеализацией корпускулы служит ма- материальная точка, не имеющая размеров и двигающаяся по оп- определенной траектории. Свойства волновых процессов в классической физике до из- известной степени являются обратными свойствам корпускуляр- корпускулярных объектов. Монохроматическая волна прежде всего обладает бесконечной протяженностью в пространстве. Поэтому лишено смысла утверждение «монохроматическая волна находится в данной точке пространства». Не имеет также смысла говорить о траектории монохроматической волны. Локализация волново* го процесса в пространстве неизбежно связана с созданием вол- волнового пакета (см. ч. I, § 35). Размеры волнового пакета тем меньше, чем большее число волн с различными частотами уча- участвует в его образовании. Это свойство волновых процессов со- совершенно не зависит от их физической природы, — оно справед- справедливо для упругих, электромагнитных и других волн. Таким образом, в классической физике локализованные корпускулы и делокализованные в пространстве волновые процессы являются в известном смысле антиподами. *) Во избежание путаницы, корпускулами мы будем называть частицы, движущиеся по законам классической механики.
14 ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ [ГЛ I Оказалось, что у микрочастиц имеет место сочетание корпус- корпускулярных и волновых свойств, необъяснимое с точки зрения обычных наглядных представлений классической физики. Выра- Выражаясь точнее, в некоторых условиях микрочастицы ведут себя как корпускулы, а в других условиях те же микрочастицы обна- обнаруживают чисто волновые свойства. Наконец, в некоторых опы- опытах одновременно проявляются и корпускулярные, и волновые свойства. Корпускулярно-волновой дуализм свойств микрочастиц был первоначально обнаружен в опытах со световыми квантами. Волновые свойства электромагнитного поля достаточно хорошо известны. Отметим лишь, что корпускулярная теория Ньютона могла успешно конкурировать с волновой теорией в объяснении таких явлений, как прямолинейное распространение и преломле- преломление света. Однако эта теория была полностью оставлена после открытия интерференции, дифракции и двойного лучепрелом- лучепреломления. Что же касается корпускулярных свойств электромагнитного поля, то они особенно наглядно проявляются в эффекте Комп- тона (ч. II, § 17; см. также тл. XIV). Действительно, этот эффект допускает только одну интерпретацию — корпускулярную. Ни- Никакими соображениями, основанными на волновых представле- представлениях, невозможно объяснить появление электронов отдачи: па- падающая электромагнитная волна не может вызвать движения одного из атомных электронов, не возмутив при этом движения остальных электронов. Между тем, как мы видели в § 17 ч. II, теория, основанная на представлении о соударении двух ча- частиц — падающего фотона и атомного электрона, правильно пе- передает закономерности процесса. Корпускулярная природа света проявляется с такой же на- наглядностью при фотоэффекте, в явлении отдачи при излучении атомов и т. п. Таким образом, волновая теория света, успешно применявшаяся при рассмотрении широчайшего круга электро- электромагнитных явлений, оказалась совершенно непригодной для объ- объяснения ряда процессов, в которых проявлялась корпускулярная природа света. Создавшуюся ситуацию кратко характеризовали словами — имеется дуализм свойств электромагнитного поля. Иногда свет проявляет волновую природу, иногда ведет себя как поток фо- фотонов. Совокупность экспериментальных данных показала, что ка- каждому фотону следует приписать энергию Е и импульс р, рав- равные соответственно Я = /ш>, A,1) о <'2>
§ 11 ФИЗИЧЕСКИЕ ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ 15 где Ь — постоянная Планка /г, деленная на 2я и равная Ь = = 1,054- Ю'27 эрг-сек и X = Х/2п. Оказалось далее, что корпуску- лярноволновой дуализм имеет место не только для фотонов, но и для всех микрочастиц. Корпускулярные свойства микрочастиц обнаружены сравни- сравнительно давно. Особенно ярко они проявляются при наблюдениях с камерой Вильсона. Как известно, микрочастицы, проходя че- через камеру Вильсона, наполненную насыщенным паром, произ- производят на своем пути ионизацию. Ионы, созданные микрочастиц цами, становятся центрами конденсации, которую можно непо- непосредственно наблюдать в виде штрихообразных следов. Точно также при движении в фотоэмульсии, наносимой толстыми слоя- слоями на фотопластинку, частицы оставляют фотографическое изо- изображение— след своей траектории. Все это заставляло думать, что микрочастицы двигаются по определенным траекториям и по своим свойствам подобны обычным корпускулам. Однако описываемые ниже опыты позволили установить, что это не так и что корпускулярно-волновой дуализм свойств является основ- основной чертой всех микрочастиц. Следует, однако, подчеркнуть, что обнаружению волновых свойств электронов, протонов и других микрочастиц предшествовало развитие системы представлений квантовой механики, в которой существование волновых свойств микрочастиц было предсказано теоретически. Рассмотрим следующий опыт. Через малое отверстие в не- непроницаемом экране последовательно пропускаются отдельные электроны, прошедшие через фиксированное ускоряющее поле. Проходя через отверстие, электроны попадают на фотопластин- фотопластинку, вызывая ее почернение в местах попадания. Если бы элек- электроны двигались как корпускулы по законам классической ме- механики и не взаимодействовали с краем экрана, то все они по- попадали бы в центр фотопластинки, образуя пятно почернения. В действительности, электроны должны взаимодействовать с атомами экрана. Поскольку последние находятся в тепловом движении, это взаимодействие имеет случайный характер. По- Поэтому, естественно, было бы ожидать, что электроны вызовут почернение фотопластинки, сходное с тем, которое вызывает мо- молекулярный пучок, выходящий из узкого отверстия. Именно, число электронов, отклоненных от прямолинейного пути и не попавших в центр экрана, зависит от величины отклонения по закону ошибок. Интенсивность почернения, пропорциональная числу электронов, попавших в данную точку, должна была бы выражаться формулой Гаусса. В действительности, ничего подобного на опыте не наблю- наблюдается. Если последовательно пропускать через отверстие боль- большое число электронов, то можно обнаружить следующее:
16 ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ [ГЛ. I 1) существуют зоны на фотопластинке, в которые электроны никогда не попадают — «запрещенные» зоны. Эти зоны имеют характер концентрических колец вполне определенной ширины; 2) зоны попадания электронов образуют систему концентри- концентрических колец, чередующихся с «запрещенными» кольцами. Проводя опыт достаточно долго, т. е. пропуская достаточно много электронов, можно получить полосы почернения, совер- совершенно идентичные с полосами, возникающими при дифракции света от круглого отверстия. На рис. 1 справа изображена такая Рис. I. дифракционная картина1). Слева же расположена кривая ин- интенсивности попаданий электронов в зависимости от угла ди- дифракции д. Тот же результат получается и при другой постанов- постановке описанного опыта. Вместо того чтобы пропускать электроны поодиночке, можно направить на отверстие экрана пучок элек- электронов. Пучок должен быть достаточно разреженным, чтобы взаимодействие между электронами не играло роли. При прохо- прохождении пучка электронов через отверстие экрана сразу возник- возникнет дифракционное распределение интенсивности почернения фотопластинки 2). Таким образом, движение каждого отдельного электрона су- существенным образом отличается от движения классической ча- частицы, проходящей через щель в экране. На первый взгляд может показаться, что результаты описан- описанных измерений можно интерпретировать следующим образом: *) Местам почернения фотопластинки соответствуют на рисунке светлые полосы. 2) С экспериментальной стороны второй метод проведения опыта является более простым, и он был осуществлен Девиссоном и Джермером в 1927 г., после создания квантовой механики. Опыт с одиночными электронами был выполнен лишь в 1948 г. В. А. Фабрикантом, Л. М. Биберманом и Н. Суш- .киным.
§ 1J ФИЗИЧЕСКИЕ ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ 17 по каким-то неизвестным причинам в природе могут реализо- реализоваться не все возможные траектории движения электронов, а лишь некоторые, допустимые. Совокупность этих допустимых траекторий определяет места попадания электронов на пластин- пластинку. Однако другие опыты показывают ошибочность подобной трактовки. Рассмотрим непроницаемый экран с двумя отверстиями1). Если поочередно закрывать одно из отверстий, а через другое пропускать последовательно отдельные электроны, то после про- прохождения большого числа электронов на фотопластинке возник- возникнут две описанные выше картины интерференционных полос с центральным пятном против каждого из отверстий. Откроем те- теперь оба отверстия и пропустим через них электроны. Допустим, что каждый из электронов двигается по определенной дозволен- дозволенной траектории. Проходя через одно из отверстий, электрон вы- вызывает почернение в определенном месте фотопластинки. Сум- Суммарная картина почернения, создаваемая большим числом электронов, при этом должна была бы являться простым нало- наложением интенсивностей почернений, возникавших при пропуска- пропускании электронов через одно отверстие. Иначе говоря, должно по- получиться такое почернение пластинки, что и при последователь- последовательном прохождении электронов сперва через одно, а потом через другое отверстие. Фактически, однако, картина распределения интенсивности почернения имеет совершенно иной характер. По- Почернение фотопластинки в точности соответствует картине ди- дифракции от двух щелей. Это означает, что никаких возможных или допустимых траекторий электрона не существует. Подобно волне, электрон обладает интерференционными свойствами и бессмысленны были бы попытки установить, через какую из двух открытых щелей «в действительности» прошел данный электрон. Мы видим, что с электроном связан некоторый волновой про- процесс, электрон обладает волновыми свойствами. Именно из-за этих волновых свойств отдельный электрон, проходящий через одно отверстие, может попасть в одни области фотопластинки и не может попасть в другие ее участки. При прохождении через две щели волновые свойства отдельного электрона проявляются в том, что на его движение влияют обе щели. Дозволенные и недозволенные для попадания участки фотопластинки совпадают с темными и светлыми зонами при дифракции от двух щелей. Было бы неверным, однако, на основании сказанного попы- попытаться отождествить электрон с некоторой волной. Если бы это *) Обсуждаемый ниже опыт является схематизацией реального опыта, в котором вместо| .дисврау^тш Пт af0^^—H| отверстиями наблюдалась лдфрйСТрЙк сЙТёГгроно^ от кристаллической! рдаезу.
18 ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ [ГЛ Г было так, то потемнение фотопластинки, на которую попадает дифрагированная волна (отдельный электрон), было бы блед- бледной копией потемнения, образованного многими электронами. Отдельный электрон сразу давал бы всю картину интерфе* ренции. Мы подчеркивали, что на опыте отдельный электрон попа- попадает в определенную точку пластинки как обычная корпускула. Отличие отдельного электрона от корпускулы проявляется в том, что места попадания на фотопластинку определяются со- совершенно иным законом, чем места попадания корпускулы. Та- Таким образом, волновые свойства, как показывает дифракцион- дифракционный опыт, присущи каждому отдельному электрону, но наглядно выявляются они только в большом числе одинаковых экспери- экспериментов (последовательное прохождение большого числа элек- электронов). Заметим, что хотя всюду говорилось об электроне, это в рав- равной степени относится и к любой другой микрочастице. Дифрак- Дифракционные опыты были осуществлены с нейтронами, протонами и другими микрочастицами. Квантовомеханическая трактовка описанных дифракционных опытов будет дана в следующем параграфе. Здесь мы еще раз подчеркнем, что в дифракционных опытах с электронами прояв- проявляется тот же корпускулярно-волновой дуализм, который ранее был установлен для световых квантов. Дифракционные опыты позволяют дать ответ на вопрос: «что такое электрон — волна или корпускула?». При этом в термины «волна» и «корпускула» мы вкладываем привычный нам класси- классический смысл. Ответ, непосредственно вытекающий из описан- описанных опытов, заключается в том, что электрон не является ни волной (иначе один электрон давал бы полную дифракционную картину), ни корпускулой, которая движется по определенной траектории (как это показывает опыт с двумя щелями). Элек- Электрон является микрочастицей, обладающей специфическими свойствами. § 2. Волновая функция Наличие у электрона волновых свойств показывает, что элек- электрону следует сопоставить некоторое волновое поле. Амплитуду этого волнового поля, зависящую от координат и времени, мы будем называть волновой функцией г|) (я, (/, 2, t). Иногда ее для краткости именуют также ф-функцией. Физическое толкование волновой функции (впервые данное М. Борном) заключается в следующем: величина |i|?(x, у, г, t) \2dV пропорциональна вероятности того, что электрон будет обнару-
3 2] ВОЛНОВАЯ ФУНКЦИЯ 19 жен в момент времени t в элементе объема dV, расположенном в окрестности точки х, у, г. Обозначая эту вероятность через dW, имеем dW~\$(x,y,z,t)?dV. B,1) Основанием для подобной трактовки служат следующие рассу- рассуждения. В опытах с пропусканием отдельных электронов через одну или две щели мы видели, что место попадания электрона на фотопластинку являлось до известной степени случайным. Электрон мог совершенно случайно попасть в ту или иную точку будущего дифракционного кольца. Поэтому поведение электро- электрона должно характеризоваться некоторой вероятностной функ- функцией. Интенсивность почернения пластинки в данном месте про- пропорциональна числу попадающих электронов. Ясно, с другой сто- стороны, что эта вероятностная функция должна быть связана со свойствами волнового поля. Только при этом можно совместить вероятностный характер потемнения пластинки в данном месте со строгим пространственным распределением полос потемнения. Именно совместить случайный характер попадания электрона в данную точку с его волновыми свойствами можно только допу- допустив, что вероятность обнаружения электрона в данном месте пропорциональна интенсивности волнового поля |г|)|2. Эта связь и дается формулой B,1). Физическая трактовка волновой функции, даваемая форму- формулой B,1), ясно показывает, что волновое поле г|) (х, у, г, t) суще- существенно отличается от других волновых полей, известных в клас- классической физике. Это особенно наглядно проявляется в том, что непосредственный физический смысл имеет только величина ]г|)|2. Сама волновая функция может быть, вообще говоря, комплекс- комплексной величиной. Кроме того, волновые функции г|) и Лг|), где А — любая постоянная, отвечают одному и тому же физическому со- состоянию частицы, поскольку в силу определения B,1) обе эти волновые функции приводят к одному и тому, же пространствен- пространственно-временному распределению вероятности обнаружения ча- частицы. В силу теоремы сложения вероятностей (см. § 2 ч. III) опре- определение B,1) может быть дополнено следующим условием нор- нормировки: Jl, B,2) где стоящий слева интеграл, взятый по всему пространству, есть вероятность обнаружить частицу в момент времени t в любой точке пространства. Эта вероятность естественно равна единице. Волновые функции ф, удовлетворяющие условию нормировки, называются нормированными. Для нормированных волновых
20 ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ [ГЛ. I функций соотношение B,1) можно переписать в виде dW = | ф (*, у, г, t) ?dV = p (*, у, z, t) dV, B,3) где p{x,y,z,t)—плотность вероятности. Вероятность W{Vf t) обнаружения частицы в некотором конечном объеме V в момент времени t по теореме сложения вероятностей равна W(V, t)=jdW=j\*(x,y, г, t) \4V. B,4) v v Условию B,2) нельзя удовлетворить в том случае, если интеграл Г | г|) |2 dV является расходящимся. Это может иметь место, в частности, если квадрат модуля волновой функции |г|)|2 не стре- стремится к нулю на бесконечности. Физически это означает, что имеется конечная вероятность обнаружения частицы в любой точке пространства. Как проводить нормировку волновой функ- функции в этом случае, будет показано в § 18. Заметим, что волновая функция, нормированная условием B,2), определена с точностью до множителя eia, где а — любое действительное число, ввиду равенства \eia\2=l. Наряду с волновой функцией одной микрочастицы необходи- необходимо ввести понятие волновой функции системы микрочастиц. Пусть имеется система N частиц, взаимодействующих между со- собой по произвольному закону. Этой системе частиц можно со- сопоставить волновую функцию ^(-^l> Уи %U Х2> У2> %2> • • • » -*ч*> У if Zi> • • •> XN> Уы> ^N* 4* где / — индекс частицы. При дальнейшем построении квантовой механики мы будем исходить из допущения, что между описанием отдельной микро- микрочастицы и системы микрочастиц нет какой-либо принципиаль- принципиальной разницы и трактовки ^(x9y9z9t) и у(хи У и zu *2, z/2, z2, ••• ..., xN, yN, zNy t) должна быть одной и той же. Иными словами, физический смысл волновой функции системы N частиц заклю* чается в том, что величина dW -1 ф (г1э г2, ..., rN, t) |2 dVx dV2... dVN B,5) дает вероятность того, что в некоторый момент времени t пер- первая частица находится в элементе объема dVu окружающем точку Г\, вторая частица — в элементе объема dK2, окружающем точку г2, и т. д. Здесь через гг- обозначена для краткости со- совокупность координат (Xi,yuZi). Заметим, что на основании
§ 2] ВОЛНОВАЯ ФУНКЦИЯ 2! теоремы сложения вероятностей величина rl,r2, ..., rN, t)dV2...dVN B,6). представляет собой вероятность найти первую частицу в элемен- элементе объема dV\, при произвольном расположении остальных ча- частиц системы (по координатам которых выполняется интегриро- интегрирование). Очевидно, что вероятность dW\, даваемая формулой B,6), должна быть идентична с определением B,3). Аналогич- Аналогичные соотношения могут быть написаны и для остальных частиц системы. Таким образом dW дает вероятность найти данную конфигурацию системы в пространстве. Условие нормировки волновой функции системы N частиц имеет вид: J I Ч> (г1э г2, ..., rN, t) p dVx dV2...dVN = L B,7) Ясно, что волновая функция системы N частиц нормирована не в реальном трехмерном пространстве, а в ЗМ-мерном конфи- конфигурационном пространстве. Ввиду принципиального сходства между волновой функцией одной частицы и системы частиц мы будем обозначать волновую функцию одной буквой \|). Ниже совокупность координат иногда для краткости обозначается через х. Из сказанного вытекает, что величина |г|)|2 должна быть- истолкована как вероятность не в трехмерном, а в конфигура- конфигурационном пространстве. Вместе с тем, введение волновой функ- функции системы частиц особенно наглядно подтверждает невозмож- невозможность истолкования волновой функции как величины, описываю- описывающей волновой процесс, сходный с электромагнитной или акустической волной и распространяющийся в реальном про- пространстве. Действительно, всякий волновой процесс в реальном пространстве характеризуется совокупностью трех переменных координат и времени. Между тем волновая функция системы N частиц зависит от SN координат и времени. Поэтому при истолковании ф-функции как обычной волны пришлось бы либо отказаться от допущения о едином смысле волновой функции одной микрочастицы и системы микрочастиц, либо ввести гипо- гипотезу о существовании реального многомерного пространства. И то и другое находится в вопиющем противоречии с совокуп- совокупностью опытных фактов. Рассмотрим важный частный случай системы невзаимодей- невзаимодействующих частиц. При этом обнаружение r'-й частицы в элементе объема пространства dVi, k-й частицы в элементе объема dVk и т. д. должны быть независимыми событиями. На основании теоремы умножения вероятностей можно в этом случае формулу
22 ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ [ГЛ. I B,5) написать как dW = d\Vx d\V2 ... d\VN = = I ih (г1э t) I2 dV{ | tfc (r2> 0 |2 rfK2 ... | i>iV (Глг, О |2 dtV Это означает, что волновая функция системы невзаимодействукь щих частиц равна *(г1э г2, ..., г^, 0 = ^1(^1,0^2(^2, t) ... ^у^лг, 0- B,8) Ниже (см. § 64) будет особо рассмотрен случай, когда систе^ ма построена из тождественных микрочастиц (например, из электронов или из протонов и т. д.). Прежде чем попытаться построить волновую функцию для простейшего случая движения микрочастицы^ необходимо сде- сделать следующее весьма важное замечание. На первый взгляд можно было* бы предположить, что для описания состояний ми- микрочастиц, которые представляют собой совершенно новые по своей физической природе объекты, необходимо ввести в физику новые понятия. Оказывается, однако, что это не совсем так. Со- Состояние и характер движения микрочастиц можно до известной степени характеризовать величинами и терминами классической физики. На это указывает корпускулярно-волновой дуализм ми- микрочастиц, состоящий в том, что в некоторых опытах микро- микрочастицы проявляют себя как объекты с волновой природой, в других опытах они ведут себя как обычные корпускулы. Мы, в известной мере, уже допустили, что к микрочастице применимы понятия классической механики, когда ввели стати- статистическую (вероятностную) трактовку волновой функции. Дей- Действительно, утверждение «микрочастица может быть обнару* жена в элементе объема dV» уже содержит допущение, что воз- возможен классический подход к описанию ее состояния путем задания ее положения в пространстве. Если бы микрочастица была во всем подобна волне, то уже сама постановка вопроса, «где можно обнаружить микрочастицу», была бы лишена смыс* ла. С другой стороны, наличие дифракционной картины позво- позволяет в известных условиях сопоставить микрочастице другое классическое понятие — определенную длину волны А,, и гово- говорить о длине волны, отвечающей волновой функции частицы. Классические понятия, такие как положение частицы, длина волны и т. д., могут применяться к микрочастице лишь в извест- известных пределах. На этом мы подробно остановимся в § 4. Самым ¦существенным является не то, что при описании микрочастиц понятия классической физики имеют ограниченную примени- применимость, а то, что они могут и должны использоваться при опи- описании новых объектов, так не похожих на обычные макроскопи- макроскопические тела или волны.
§ 2] ВОЛНОВАЯ ФУНКЦИЯ 23. Мы предположим, что состояние электрона, свободно движу- движущегося в пространстве, можно характеризовать энергией Е и импульсом р. При этом связь между энергией и импульсом дается классической формулой (релятивистские соотношения будут учтены в гл. XIII) Допустим, что пучок электронов, прошедших через строго опре- определенную ускоряющую разность потенциалов и приобретших определенную энергию, поступает в' дифракционное устройство (на практике таким устройством обычно служит кристалличе- кристаллическая решетка). Формула B,9) позволяет говорить об опреде- определенном импульсе электрона. С другой стороны, зная дифракционную картину, можно (см. § 36 ч. IV) найти отвечающую электрону длину волны Я. Ока- Оказывается, что между величинами Я и р существует соотношение р-^-АА. B,10) Соотношение B,10), впервые предложенное в 1924 г. де Бройлем на основе теоретических соображений, носит название формулы де Бройля. Волну, связанную с движением микроча- микрочастицы, называют волной де Бройля. Мы видим, что формула де Бройля совпадает с формулой A,2) для световых квантов. Частоты, отвечающие волнам де Бройля, не могут быть непосредственно определены эксперимен- экспериментальным путем. Естественно, однако, допустить, что к волнам де Бройля применимо то же соотношение между энергией и ча- частотой, что и для световых квантов, т. е. E = h«>. B,11) Основываясь на соотношениях B,10) и B,11), представим волновую функцию свободной частицы в виде плоской монохро- монохроматической волны %{r, t) = Ле<*<*'-«'>) = Ae^ipr~Et). B,12) Ниже будет пояснено, почему typ(r, t) следует записывать в виде экспоненциальной функции, а не синуса или косинуса (см. §6). Постоянная А определяется условием нормировки (см. § 26). По определению k — волновой вектор
24 ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ [ГЛ. I С помощью формул B,9), B,10) и B,11) можно найти за- закон дисперсии волн де Бройля Соответствующая фазовая и групповая скорости равны ° <215> Формула B,16) показывает, что групповая скорость волн де Бройля совпадает с обычной скоростью макроскопической ча- частицы. Если бы мы взяли за исходное выражение для скорости частицы величину игр, то соотношение между энергией и часто- частотой B,11) можно было получить как следствие этого опреде- определения. Фазовая скорость волн де Бройля v$ не имеет непосред- непосредственного физического смысла. Это становится особенно ясным, если воспользоваться релятивистским выражением для связи энергии с импульсом частицы Е = Ур2с2 + т2с* = Vh2c2k2 + m2c* = /ко. При этом v - Ю - Е -if с2 1 m т. е. v$ больше скорости света. § 3. Принцип суперпозиции. Разложение по плоским волнам1) Выше мы рассматривали явление дифракции электронов на экране с ограниченным числом щелей. Фактически, однако, на- наблюдается дифракция электронов от кристаллической решетки. Этот случай дифракции имеет не только практический, но и большой принципиальный интерес. Мы видели в § 36 ч. IV, что селективное отражение рентгено- рентгеновых лучей имеет место при выполнении условий Брэгга — Вуль- фа. Если отвлечься от несущественных деталей, то оказывается, что дифракция электронов на кристаллической решетке проис- происходит аналогично дифракции рентгеновых лучей. При этом в результате рассеяния электронов от монокристаллического образца возникает ряд селективных отражений. Каждое из се- селективных отражений отвечает определенному импульсу или {) При чтении этого параграфа рекомендуем предварительно возвратиться к § 35 ч. I.
§ 3] ПРИНЦИП СУПЕРПОЗИЦИИ 25* в силу B,10) определенной длине волны. Таким образом, кри- кристаллическая решетка представляет собой прибор, который раз- разлагает исходный немонохроматический пучок электронов на ряд пучков, каждый из которых отвечает электронам опреде- определенной длины волны. Мы уже указывали, что опыт с электронным пучком эквива- эквивалентен совокупности последовательно произведенных измерений с большим числом электронов, находящихся в тождественных внешних условиях. Поэтому можно сказать, что дифракцион- дифракционная решетка играет роль прибора, который анализирует исход* ное состояние микрочастицы, разлагая его на совокупность от- отдельных состояний с определенными значениями импульса. Так как состоянию с определенным импульсом отвечает плоская волна вида B,12), то, следовательно, в общем случае волновая функция, описывающая исходное состояние электрона, падаю- падающего на решетку, может быть представлена в виде суперпози- суперпозиции плоских волн, т. е. оо ф (х, y,z,t) = J с (рх, ру, рг) % (х, у, z, t) dpx dp у dpz. C,1) — оо Физически это означает, что волновую функцию электрона в произвольном состоянии можно рассматривать как результат наложения волновых функций, отвечающих состояниям с опре- определенным значением импульса. Не следует удивляться тому, что один электрон (или другая микрочастица) может находиться в определенном состоянии, не имея при этом вполне определенного значения импульса. Хотя понятием импульса, перенесенным на микрочастицу из класси- классической механики, можно пользоваться в квантовой механике, состояние микрочастицы не задается по тем же законам, что и состояние частицы в классической механике. Мы вернемся к об- обсуждению вопроса о характеристике состояния микрочастицы в последующих параграфах. Выбирая коэффициент А в формуле B,12) в виде (см. § 26) л = (^> C-2> имеем С математической точки зрения формула C,3) представляет разложение функции г|)(г, t) в интеграл Фурье. Амплитуда с(р) показывает, с каким весом состояние фр представлена
26 ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ [ГЛ. I в состоянии, описываемом волновой функцией ty(r,t). Согласно равенству Персеваля (см. приложение II, 9), имеем = j\c\2dp. C,4) При выборе коэффициента А в виде C,2), в равенстве C,4) не содержится числовых коэффициентов. Естественно допустить, что |с(р)|2 может быть связано с плотностью вероятности р(р) обнаружить у частицы, находящейся в состоянии г|э(г, /), зна- значение импульса, равное р. Именно, естественно предположить, что Р(р) = \с(р)\2. C,5) Мы пишем знак равенства, а не знак ~ (пропорциональности), так как функция г|) нормирована условием B,2). При этом имеет место равенство (см. C,4)) j\c(p)\2dp=l. C,6) Мы вернемся еще к обсуждению формулы C,5) в § 21. Равенство C,3) является частным случаем одного из важ- важнейших положений квантовой механики — принципа суперпо- суперпозиции. Содержание этого принципа сводится к следующему: если квантовая система может находиться в состояниях, описы- описываемых функциями \j?i, \|J, •. •, фть то линейная комбинация (суперпозиция) волновых функций \рп Ф = 2с^, C,7) п где сп — произвольные постоянные, также является волновой функцией, описывающей одно из возможных состояний системы. Важность принципа суперпозиции заключается, в частности, в том, что он ограничивает возможные уравнения для определе- определения г|э линейными уравнениями (см. § 6). Если индекс д, харак- характеризующий состояние, пробегает непрерывный ряд значений, то суммирование в формуле C,7) должно быть заменено интег- интегрированием. В дальнейшем мы вернемся еще к обсуждению понятия «состояние квантовой системы», а также смысла коэф- коэффициентов сп (см. § 21 и 23). В качестве примера применения принципа суперпозиции рас- рассмотрим свободную частицу, импульс которой не имеет строго определенного значения, но может лежать в малом интервале Ар около значения р0, а именно: р0 — Ар ^ Р ^ ро + Ар. Для простоты рассмотрим случай одномерного движения. Согласно
§ 3] ПРИНЦИП СУПЕРПОЗИЦИИ 27' C,3) волновую функцию электрона можно написать в виде Ро + Др . Го-Ар o + A Коэффициент Л для одномерного движения равен ^ (ср. Bяй)/2 ) § 26). В соответствии с результатами § 35 ч. I разложение C,8) выражается формулой, совпадающей с C5,2) ч. I, /т- sin Гд* (, - (*») t\] * <*•') = У 1г2с'(*о) г м<в\ 1 *'(***~<М>- C'9> Формула C,9) показывает, что суперпозиция волновых функций, отвечающих близким значениям импульсов (или вол- волновых чисел), приводит к образованию волнового пакета, пере- перемещающегося с групповой скоростью / е/С0 Из вида волновой функции C,9) ясно, что вероятность об- обнаружить микрочастицу в точке х в момент времени t, пропор- пропорциональная |ф(#,/)|2, имеет резкий максимум, который дви- движется со скоростью уГр- Необходимо подчеркнуть, что равенство C,9) носит прибли- приближенный характер. Учет последующих членов разложения функ- функции со(&) привел бы к выражению для волнового пакета, ши- ширина которого увеличивается со временем. Говорят, что проис- происходит расплывание волнового пакета. Факт расплывания пакета непосредственно следует из того, что каждая волна, образую- образующая пакет, движется со своей фазовой скоростью УФ = х==т"* При появлении квантовой механики делались попытки отож- отождествить электрон с волновым пакетом, построенным из волн де Бройля. Однако факт расплывания волнового пакета свиде- свидетельствует о несостоятельности подобной трактовки. Кроме того, если бы электрон представлял пакет волн, то при этом, как и в случае одиночной волны, невозможно было бы объяснить опыт с дифракцией одиночных электронов.
28 ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ [ГЛ. Г § 4. Соотношения неопределенности и связь квантовой механики с классической Мы воспользуемся представлением волновой функции в виде волнового пакета для обсуждения весьма важного, принци- принципиального вопроса. Речь идет о том, в какой мере и с какой степенью точности можно пользоваться понятиями классической механики в применении к микрочастицам. Мы ограничимся здесь рассмотрением понятий импульса и положения частицы в про- пространстве. В § 24 этот вопрос будет исследован в полной мере. Мы видели в § 35 ч. I, что волновой пакет обладает про- пространственной протяженностью, даваемой формулой C5,7) ч. I. В применении к интересующему нас здесь волновому пакету C,9) эту формулу можно записать в виде Поскольку имеет место расплывание пакета, не учтенное при выводе этой формулы, ее правильно представить как {ipx{ix^h. D,1) Числовой множитель в формуле D,1) будет уточнен в § 24. Аналогичным образом можно написать соотношения для двух других координат и компонент импульса: ^py^y^hi D,2) kpzkz^b. D,3) Формулы D,1) — D,3) носят названия соотношений неопре- неопределенности Гейзенберга. Обсудим смысл этих неравенств, ис- исходя из вероятностной трактовки волновой функции. Если ши- ширина волнового пакета равна Дл;, то согласно сказанному в пре- предыдущем параграфе измерения координаты электрона покажут, что с подавляюще большой вероятностью он будет обнаружен в области пространства Дл:. В этом смысле можно говорить, что координата электрона определена с точностью до величины Дл;. При этом, однако, электрон, находящийся в области Дл:, не опи- описывается плоской волной и не имеет определенного значения импульса. Для образования волнового пакета шириной Дл: необ- необходимо было создать суперпозицию плоских волн с импульсами в интервале ро — Др* ^С Рх ^ Ро + Др*, где Арх определено по формуле D,1). Это означает, что измерения импульса элек- электрона, локализованного в области Дл;, будут приводить к значе- значениям импульса, лежащим в указанном интервале. Иными сло- словами, неопределенность в значении координаты электрона Дл: (локализованного в области Дл:) и неопределенность в значении его импульса Арх связаны соотношением D, 1). Чем меньше ширина пакета Дл:, тем больше Арх. Напротив, если задан ин-
§ 4] СООТНОШЕНИЯ НЕОПРЕДЕЛЕННОСТИ 29 тервал импульсов А/?*, то формула D,1) показывает, что ча- частица с подавляюще большой вероятностью будет обнаружена в области пространства размером Ддг^-г—. Из неравенства D,1) следует, что величины Ал: и Ар* не могут быть равны нулю одновременно. Это означает, что коор- координата х и сопряженный с ней импульс рх не могут одновре- одновременно иметь вполне определенные значения. Таким образом, классические понятия пространственного положения и величины импульса применимы к микрочастице в определенных пределах, даваемых соотношениями Гейзенберга. Всякая попытка одно- одновременно применить к микрочастице понятия импульса и коор- координаты с большей точностью, вне рамок соотношений неопреде- неопределенности, не имеет смысла. Это обстоятельство связано с самой природой микрочастиц, с их корпускулярно-волновыми свой- свойствами. В этой связи нужно предостеречь от ошибки, допускаемой некоторыми авторами, которые полагают, что соотношения неоп- неопределенности Гейзенберга дают ту степень точности, с которой могут быть определены координаты и импульс микрочастицы в рамках квантовой механики. По их мнению, для более точ- точного одновременного определения координат и импульсов необ- необходимо дальнейшее развитие теории. В действительности это не так. Микрочастица является со- совершенно новым, отнюдь не классическим, объектом со своими характерными свойствами и законами движения. Как мы уже указывали, отличительной особенностью микрочастиц является обнаруживаемый ими дуализм волновых и корпускулярных свойств. Из дифракционных опытов вытекает, что частица не имеет траектории. Поэтому описывать ее движение, задавая точ- точное значение координаты и импульса в каждый момент времени, как это делается в классической механике, невозможно. Однако можно указать с некоторой степенью точности величину той области пространства, в которой частица с подавляюще боль- большой вероятностью будет обнаружена, и интервал тех значений импульса, которым она при этом обладает. Значение этих вели- величин дается соотношениями неопределенности Гейзенберга. Заметим, что когда частица имеет вполне определенное зна- значение импульса Арх = 0, то согласно D,1) ее положение совер- совершенно неопределенно, т. е. Дл;->оо. Действительно, состояние с определенным импульсом описывается плоской волной де Бройля. Для такой волны квадрат модуля |г|эр|2 постоянен, т. е. частица с одинаковой вероятностью может быть обнаружена в любой точке пространства. С другой стороны, если задано вполне определенное положе- положение частицы в данный момент времени, то ее импульс совер-
30 ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ [ГЛ. Г шенно неопределен. Может показаться, что полученное соотно- соотношение находится в противоречии с фактом существования от^ четливых треков частиц в камере Вильсона или на фотопла-^ стинке. Однако это противоречие только кажущееся. Действи- Действительно, след электрона в камере Вильсона представляет капельки жидкости, образовавшиеся на созданных им ионах. Раз- Размер капелек дает степень точности, с которой может быть фикси- фиксирована координата частицы. Поскольку размеры капелек по- порядка 10~4 см, неопределенность в координате электрона также имеет порядок 10~4 см. Следовательно, неопределенность соот- соответствующей компоненты импульса крх~-г— ~ 10~3 г- см/сек. Так как масса электрона равна ~ 10~27 г, то неопределенность в составляющей скорости, направленной перпендикулярно к тре- треку, будет равна Avx = — ?±.рх = 104 см/сек. Но следы в камере Вильсона оставляют лишь достаточна быстрые электроны, имеющие скорость v порядка ^ЛО9 см/сек. Мы видим, следовательно, что в указанных условиях Avx <y и приближенно можно говорить о движении частицы вдоль неко- некоторой траектории в камере Вильсона. Соотношение неопределенности Гейзенберга, записанное в виде ^vx^x>Л> D,4) показывает, что понятия классической физики оказываются при- применимыми с тем большей степенью точности, чем больше мас- масса частицы. Ввиду малости квантовой постоянной Ъ, неопреде- неопределенность в значениях координаты и скорости становится прене- пренебрежимо малой у частиц макроскопически малого, но еще не атомного размера. Пусть, например, мы имеем тело размером около 1 микрона с массой всего 10~10 г. Тогда D,4) дает Ди^Дх ~ 107 см21сек. Если, например, положение тела определено с точностью 10~6 см A/100 его размеров), то kvx ~ 10~"п см/сек. Скорость броуновского движения частицы с массой Ю0 г со- составляет ~10 см/сек. Мы видим, что погрешность в скорости, связанная с соотношением неопределенности, пренебрежимо мала уже у такого небольшого тела. Тем более она не играет роли у макроскопических тел.
§ 4] СООТНОШЕНИЯ НЕОПРЕДЕЛЕННОСТИ 31 Приведенные оценки являются иллюстрацией общего важ- важного положения квантовой механики, именуемого принципом соответствия: при переходе к пределу й->0, т. е. в предположе- предположении, что эффектами, пропорциональными квантовой постоян- постоянной Ь, можно пренебречь, законы и соотношения квантовой ме- механики переходят в соответствующие законы и соотношения классической механики. (Более подробно о переходе к класси- классической механике см. гл. V.) В частности, у частиц с большой массой отношение Ь/т столь мало, что практически ее коорди- координата и скорость имеют определенные значения. Такая частица обладает траекторией, по которой она движется в соответствии с законами классической механики. Важность принципа соот- соответствия заключается в том, что он служит методом отыскания квантовомеханических аналогов классических величин. Кванто- Квантовая механика содержит в себе классическую механику как не- некоторый предельный случай, отвечающий й-^0 (другие условия этого перехода см. в гл. V). Благодаря принципу соответствия возможно установить связь между некоторыми квантовомехани- ческими величинами и понятиями классической механики. Наряду с приведенным нами рассуждением, соотношения неопределенности часто получаются из обсуждения возможной степени точности определения координаты и импульса микро- микрочастицы в различных принципиально возможных эксперимен- экспериментах. Мы не будем останавливаться на разборе этих примеров, поскольку в § 24 будет дан строгий вывод соотношений неопре- неопределенности. Заметим, что если задана область возможного движения микрочастицы, например, размер / атома или ядра, то соотно- соотношения неопределенности позволяют качественно оценить зна- значения ее импульса и энергии. Действительно, абсолютная вели- величина импульса того же порядка, что и его неопределенность Д/?~у. Следовательно, р^у, а энергия частицы * " 2m ^ 2ml2 ' Мы видим, что с уменьшением области локализации энергия возрастает. Например, для электрона в атоме / порядка раз- размеров атома, т. е. порядка 10~8 см. Подставляя это значение в D,5), находим, что энергия электрона в атоме Е ;>, 10 эв. Полученное значение дает правильный порядок величины. Рассмотрим далее нуклон (протон или нейтрон), находящий- находящийся в ядре. Размеры ядра порядка 10~12 см. Полагая / ~ 10~12 см и учитывая, что масса нуклона т ~ 10~24г, находим для энер- энергии Е оценку, Е ^ 1 Мэв. Эта оценка также соответствует опыт- опытным данным.
32 ОСНОВЫ КВАНТОВОЙ МЕХАНИКИ [ГЛ. 1 § 5. Принцип причинности в квантовой механике Мы видели в предыдущем параграфе, что понятия классиче- классической физики применимы к микрочастицам лишь в известных пределах. Возникает естественный вопрос: почему мы вообщб можем и должны описывать движение микрочастиц с помощью терминов классической физики? Необходимость введения клас- классических понятий в квантовую механику связана со следующим важным обстоятельством: выяснение свойств и законов движе- движения любых микрообъектов возможно только путем приведения их во взаимодействие с макроскопическими телами. Макроско- Макроскопическое тело, взаимодействующее с микрочастицами, носит название прибора. Процесс взаимодействия между прибором и микрочастицей называется измерением. Разумеется, прибор в этом смысле слова не обязательно яв- является устройством для регистрации свойств микрочастиц, изго- изготовленным искусственно. Прибор есть всякое тело, могущее изменять свое состояние в результате взаимодействия с микро- микрообъектами и с достаточной степенью точности описываемое за- законами классической физики. Процесс взаимодействия прибора с микрочастицей — измерение — является объективным процес- процессом, протекающим в пространстве и времени. Ясно, однако, что, поскольку всякое научное знание может основываться только на факте и характере указанного взаимодействия, все характе- характеристики микрочастиц должны быть непосредственно связаны со свойствами их взаимодействия с макроскопическими телами. Это и означает, что описание микрочастицы должно обязатель- обязательно включать, хотя бы частично, понятия классической физики. Разумеется, могут также существовать и такие характеристики и свойства микрочастиц, которые проявляются во взаимодей- взаимодействиях с приборами, но не имеют никакого классического ана- аналога. Мы увидим, например, в гл. VIII, что такой характеристи- характеристикой микрочастиц является их спин. Взаимодействие между микрочастицами и макроскопиче-* скими телами, разумеется, существенно отличается от взаимо- взаимодействия макроскопических тел между собой. Именно, при взаи- взаимодействии между одним макроскопическим телом и другим, играющим роль прибора, всегда можно считать обратное воз- воздействие прибора на тело как угодно малым или, хотя бы, точ- точно учесть его. Поэтому говорят, что воздействие прибора не изменяет состояние макроскопического объекта. Иначе дело обстоит при взаимодействии физических объек- объектов разной природы — микрочастицы и макроскопического тела — прибора. Здесь принципиально невозможно считать воз- воздействие прибора на микрочастицу малым и несущественным. Рассмотрим один простой пример. Предположим, что совокуп-
§ 5J ПРИНЦИП ПРИЧИННОСТИ В КВАНТОВОЙ МЕХАНИКЕ 33 ность электронов последовательно пропускается через щель в некотором экране. Экран со щелью является макроскопиче* ским телом — прибором, измеряющим у-ю координату элек- электрона с точностью Ду, где Hay — ширина щели. Состояние всех электронов до взаимодействия было одним и тем же. Пусть, например, на прибор падают электроны с опре- определенным направлением импульса р вдоль оси х. При этом ру = 0. Состояние прибора до взаимодействия также является заданным, но заданным макроскопическим образом. В процессе взаимодействия прибора с электроном последний локализуется в области Ду, определяемой размерами отверстия в экране. При этом состояние электрона существенно изменяется. Из состоя-» ния с определенной компонентой импульса ру = 0 электрон пе- переходит в состояние, в котором компонента импульса ру имеет значение, лежащее в интервале Ару ~ -д—. Действительно, как мы знаем, при прохождении электронов через щель возникает дифракция и у электронов появляется слагающая импульса по оси у. Если последовательно пропускать электроны и измерять значения их компоненты импульса pyt то мы будем получать всевозможные значения ру> лежащие в интервале Ару. Мы видим, таким образом, что воздействие прибора на элек- электрон изменяет состояние электрона и при этом принципиально не может быть сделано малым. Хотя до измерения микрообъект и прибор находились в определенном состоянии, результат взаимодействия с прибором не является однозначным: мы полу- получаем состояние с неопределенным значением компоненты им- импульса ру. Мы можем лишь найти вероятность того или иного значения этой величины. В результате проведения последовательной, как угодно боль- большой, серии измерений мы получим не более точное значение ру, а лишь более точное выражение для распределения вероятно- вероятностей различных значений этой величины. Если микрообъект на- находился в заданных внешних условиях, то невозможно, тем не менее, точно предсказать результат измерения. Можно говорить лишь о вероятностном распределении результатов измерения. Это связано не с недостаточностью и пороками теории, но с са- самой природой микрочастиц. Отсюда следует, что принцип меха* нического детерминизма не характеризует свойства микроча- микрочастиц. Заданное начальное значение некоторой величины и опреде- определенный закон взаимодействия не определяют однозначно зна- значение этой измеряемой величины для микрочастицы в после- последующие моменты времени. Таким образом, поведение отдельной микрочастицы, а не только, их совокупности, определяется за- закономерностями статистического типа. Закон причинности для 2 В. Г. Левич и др., том II
34 основы квантовой механики [гл. I микрочастицы приобретает следующий характер: пусть извест- известно состояние частицы в начальный момент времени t = 0. Это означает, что известна ее волновая функция г|? (г, 0). Если из- известны все испытываемые микрочастицей взаимодействия, то, как мы увидим ниже (см. § 6), можно однозначно определить ее волновую функцию в последующие моменты времени t > 0. Из смысла волновой функции вытекает, что тем самым мы можем предсказать вероятности (см. § 21) того, что характери- характеризующие частицу величины — координата, импульс, энергия и другие, будут иметь то или иное значение в любой момент вре- времени t > 0. Сформулированный, таким образом, принцип причинности в квантовой механике имеет значительно более общий характер, чем динамическая закономерность (лапласовский детерминизм) классической механики ]). 1) Более подробное рассмотрение вопросов, затронутых в настоящем параграфе, читатель найдет в работах В. А. Фока «Об интерпретации кван- говой механики», Сборник «Философские вопросы современной физики», Изд-во АН СССР, 1959 и «Квантовая физика и философские проблемы». Сборник «Ленинизм и современное естествознание», «Мысль», 1969 г. См. также Н. Бор, Атомная физика и человеческое познание, ИЛ, 1961.
ГЛАВА II УРАВНЕНИЕ ШРЕДИНГЕРА § 6. Волновое уравнение Шредингера В § 2 мы установили вид волновой функции, описывающей движение свободной частицы с заданным значением импульса. Эта волновая функция имеет вид плоской волны де Бройля. Мы должны теперь перейти к рассмотрению движения частиц во внешних силовых полях. Для этого необходимо найти волновую функцию, описывающую движение частицы в заданном поле сил. Оказывается возможным установить вид дифференциаль- дифференциального уравнения, которому удовлетворяет волновая функция. Из решения этого уравнения может быть найдена сама волновая функция. Заметим прежде всего, что уравнение для волновой функции должно быть линейным. Действительно, функции, удо- удовлетворяющие нелинейному уравнению, не отвечают, очевидно, требованиям принципа суперпозиции. Ясно, далее, что извест- известная уже нам волновая функция, описывающая движение сво- свободной частицы, должна являться решением искомого диффе- дифференциального уравнения в частном случае отсутствия ноля. Та- Таким образом, искомому уравнению должна удовлетворять как плоская волна де Бройля, так и произвольная суперпозиция плоских волн, и поэтому оно не должно содержать характери- характеристик частицы. Нахождение линейного дифференциального урав- уравнения наименьшего порядка, которому удовлетворяет плоская волна де Бройля $(x,t) = Ae-*{pr-Et), F,1) не представляет труда. Для этого заметим, что Кроме того, 2*
36 УРАВНЕНИЕ ШРЕДИНГЕРА (ГЛ. II Учитывая, что для свободной частицы " -*"* МП =?, F,2) 2т **• находим 1^^2m\l^^lFjj2+~dzT)' Последнее уравнение принято записывать в виде Найденное линейное дифференциальное уравнение в част-» ных производных носит название уравнения Шредингера. Оно не содержит каких-либо характеристик состояния частиц, на- например величины ее импульса или энергии. В него входят толь- только масса частицы, а также универсальная постоянная Ь. Урав- Уравнению F,3) удовлетворяет, очевидно, не только волновая функ- функция вида F,1), представляющая волновую функцию частицы с заданным значением импульса, но и любая суперпозиция по- подобного рода волновых функций. Уравнение Шредингера обладает той особенностью, что оно является уравнением первого порядка по времени и содержит множитель /. Последнее означает, что волновая функция долж- должна быть комплексной. Заметим, что в качестве волновой функции свободной ча- частицы, казалось, можно было бы выбрать функцию, выражае^ мую вещественным соотношением, например, в виде бегущей волны -ф = A cos -у (pr — Et). Однако при этом мы не смогли бы построить уравнение первого порядка по времени, решением которого была бы произвольная суперпозиция таких функций. То обстоятельство, что уравнение Шредингера содержит лишь первую производную от волновой функции по времени, тесно связано с выражением принципа причинности в квантовой ме- механике (см. § 5). Действительно, если бы уравнение Шредин- Шредингера содержало, например, вторую производную от волновой функции по времени, то для определения волновой функции в произвольный момент времени t было бы недостаточно знания волновой функции в начальный момент времени. Именно, по- потребовалось бы задать в начальный момент времени также зна- значение и первой производной от волновой функции по времени* Среди решений уравнения F,3) имеются решения, гармони- гармонически зависящие от времени
$ 6] ВОЛНОВОЕ УРАВНЕНИЕ ШРЕДИНГЕРА 37 Подставляя F,4) в F,3)» получим уравнение для функции, зависящей только от координат частицы, >(*)-0. F,5) Последнее уравнение определяет функцию ty(x) для свободной частицы. Проведем обобщение уравнения F,5) на случай ча- частицы, движущейся в силовом поле. В основу этого обобщения положено следующее допущение! энергия ?, фигурирующая в уравнении F,5), представляет кинетическую энергию частицы. Действительно, при свободном движении кинетическая энергия совпадает с полной. Если при искомом обобщении считать энер< гию Е, фигурирующую в уравнении F,5), полной энергией, то волновая функция, описывающая движение электронов в сило* вом поле, не будет зависеть от сил, действующих на частицу* Это было бы, однако, бессмысленным. Таким образом, мы при- приходим к выводу, что в уравнении F,5) под Е следует понимать кинетическую энергию частицы. Обозначая потенциальную энер« гию частицы через У(х), а полную — через ?, получим х) + -|J- (E -?/(*) Ж*) - 0. F,6) Уравнение F,6) представляет искомое обобщение волно- волнового уравнения Шредингера на случай частицы, движущейся в произвольном потенциальном поле, не зависящем от времени. При этом F,6) определяет зависимость волновой функции только от координат. Зависимость от времени по-прежнему оп- определяется соотношением F,4). Уравнение F,6) называется уравнением Шредингера для стационарных состояний. Действительно, плотность вероятности измерения координат частицы, находящейся в состоянии F,4), не зависит от времени Шх, 0РЧЧ>(*. 0)р. F,7) В § 28 будет показано, что вероятности измерения других физических величин в состоянии F,4) также не зависят от времени. Заменяя с помощью F,4) величину Е\р на производную по времени -—-, приходим к общему волновому уравнению Шре- Шредингера где волновая функция \|) зависит от координат х, у7 г, и вре-* менн t.
38 УРАВНЕНИЕ ШРЕДИНГЕРА [ГЛ. IE Уравнение F,8) является основным уравнением квантовой: механики. Волновое уравнение Шредингера F,8) играет в квантовой механике ту же роль, что уравнение Ньютона в классической механике. Его можно было бы назвать уравнением движения квантовой частицы. Задать закон движения частицы в кванто- квантовой механике — это значит определить значение г|э-функщш в каждый момент времени и в каждой точке пространства. Необходимо указать, что проведенные рассуждения не яв~ ляются выводом уравнения Шредингера в строгом смысле это- го слова. Подобно уравнениям Ньютона и Максвелла уравнение- Шредингера явилось, с одной стороны, обобщением известных опытных данных, а с другой стороны, было великим научным предвидением. Мы увидим в дальнейшем, как из уравнения Шредингера вытекает дискретность уровней энергии. Будет ясно также, что уравнение Шредингера удовлетворяет принципу соответствия. Правильность уравнения Шредингера и толкования смысла фи- фигурирующей в нем волновой функции подтверждается огром- огромным опытным материалом современной атомной и ядерной фи- физики. Для получения закона движения частицы — волновой функции г|)(х, t), помимо уравнения Шредингера, должны быть заданы начальные и граничные условия. Поскольку уравнение Шредингера является уравнением первого порядка по времени, необходимо задать начальное значение волновой функции яр(лг, 0). Система граничных условий в общем случае сводится к тре- требованию однозначности и непрерывности волновой функции и: ее первых производных, а также выполнению некоторых усло- условий нормировки. Последние обычно сводятся к условию ограни^ ченности волновой функции по модулю. Совокупность началь- начального условия и условий однозначности, непрерывности и конеч- конечности волновой функции и ее первых производных позволяет найти, в принципе, единственное решение уравнения Шредин- Шредингера— волновую функцию г|р (л:, t)9 Иными словами, если задана начальное значение волновой функции, то из решения уравне- уравнения Шредингера можно однозначно определить состояние кван- квантовой системы для любого последующего момента времени: t > 0. Именно, для t > 0 можно найти волновую функцию си- системы \|)(*, /). Мы увидим в § 23, что задание ^(х, t) является характери- характеристикой квантовой частицы в такой же мере полной, как, напри- например, задание траектории частицы в классической механике. За- Заметим еще, что в некоторых задачах квантовой механики по* тенциальную энергию удобно аппроксимировать разрывной функцией. В точке разрыва потенциальной энергии волновая
$ 7] ПЛОТНОСТЬ ПОТОКА ВЕРОЯТНОСТИ 39 функция и ее первые производные должны оставаться непре- непрерывными. Производная от волновой функции испытывает ска- скачок лишь на поверхности бесконечно большого разрыва потен- потенциальной энергии. Уравнение Шредингера, как и уравнения движения классик ческой механики, допускает «обращение во времени». Действительно, уравнение F, 8) не изменяется при преобра- преобразовании t-*—t и при переходе к комплексно сопряженной функции t|>*. Следовательно, обращенный во времени процесс описывается волновой функцией i|H6p(#> t), причем (*,*)-ФЧ*. -t). F,9) Отметим, что при движении в магнитном поле обращение во времени имеет место лишь при изменении направления магнит- магнитного поля на обратное (см. § 27). Более подробно вопрос об обращении времени мы рассмотрим в § 98. § 7. Плотность потока вероятности Волновая функция, описывающая движение частицы, во* обще говоря, изменяется в пространстве и времени. Однако это изменение не может быть произвольным. Именно, имеет место некоторый закон сохранения. Для фор-» мулировки этого закона рассмотрим интеграл Г | г|э |2 dV, пред-» v «ставляющий вероятность нахождения частицы в объеме V. По- Поступая так же, как и при выводе закона сохранения заряда (см. § 5 ч. I), найдем производную от последнего интеграла по времени. Для вычисления -~ и --^- воспользуемся уравнением Шредингера F,8) и уравнением, сопряженным ему. Тогда получим д dt _ = Ш J div <* V^*"" *'V*> dV' <7' *> Воспользовавшись теоремой Гаусса — Остроградского, имеем Г div (ф V\|>* — if* Vij)) dV = 0A!) Vip* —1|)* Vip) dSt v s где поверхность S охватывает объем V, Поэтому f\$?dV _ | | 1П |«# Л I/ i i dt
40 УРАВНЕНИЕ ШРЕДИИГЕРА [ГЛ. IF Введем вектор /, определенный соотношением Тогда G,2) перепишется в виде \dS. G,4) 5 Формула G,4) показывает, что плотность вероятности удовле- удовлетворяет закону сохранения, а введенный нами вектор / имеет смысл плотности потока вероятности. Соотношение G,4) может быть переписано в дифференциальной форме в виде уравнения непрерывности -^ + div/-0. G,5) Интеграл от нормальной составляющей вектора / по некоторой поверхности представляет вероятность того, что частица пере- сечет указанную поверхность в единицу времени. Рассмотрим, в частности, свободное движение. Волновую функцию возьмем в виде плоской волны ty = AeH . Ис* пользуя соотношение G,3), получаем /-ТГРИР. G,6) Применим теперь соотношение G,4) ко всему пространству, т. е. будем считать поверхность S бесконечно удаленной. Еслигр- является квадратично-интегрируемой функцией, то подынтег- подынтегральная функция в интеграле по поверхности убывает быстрее, чем —у, а поверхность интегрирования растет пропорциональ* но г2. В итоге интеграл по поверхности в G,4) обращается в нуль. Если же г|? не стремится указанным образом к нулю при г->оо, как, например, в случае плоской волны, то на бесконеч* ности имеется поток частиц. Если этот поток является стацио* нарным, то волновую функцию можно нормировать так, что вектор / представляет вектор плотности потока частиц. Заметим, наконец, что плотность потока / заведомо обра-» щается в нуль, если состояние системы описывается действи* тельной волновой функцией \|>, что непосредственно следует из формулы G, 3). Соотношение G,5), записанное в форме ^j- + div/ = 0. G,7) можно трактовать как закон сохранения числа частиц (ср. §5ч.1).
§ 8] ЧАСТИЦА В ОДНОМЕРНОЙ ПРЯМОУГОЛЬНОЙ ЯМЕ 41 § 8. Частица в одномерной прямоугольной потенциальной яме Прежде чем перейти к рассмотрению реальных атомных си- систем, обсудим общие свойства решений уравнения Шредингера на некоторых простейших моделях. Рассмотрим прежде всего одномерное движение частицы в потенциальном поле, опреде- определенном следующим образом: U(x) , I oo при Подобное потенциальное поле мы будем именовать бесконечно глубокой потенциальной ямой. Ясно, что в такой яме частица может двигаться только в области пространства 0 ^ х ^ /. На границе ямы на частицу действуют сколь угодно боль- большие силы, которые не позволяют ей выйти наружу, так что ча« стица как бы заключена в некоторой области пространства, ограниченной идеально отражающими стенками. Оказывается, что на таком простейшем примере можно будет установить ряд свойств квантовомеханических систем. Существенно, что эти свойства не связаны с моделью, а имеют общий характер. Кро- Кроме того, интерес к этой задаче определяется также и тем, что модель потенциальной ямы часто с успехом используется для грубого описания ряда систем, например электронов в металле или нуклонов в ядре. Решение уравнения Шредингера следует написать в двух областях: вне потенциальной ямы и внутри нее. Поскольку ча- частица не может находиться вне потенциальной ямы, ее волновая функция равна нулю вне промежутка 0 < х < L Из условия не- непрерывности следует, что она равняется нулю также и в точ- точках х = 0 и х = /, т. е. ( = ^ (/) = 0. (8,1) Требование (8, 1) служит граничным условием для решения уравнения Шредингера внутри потенциальной ямы. В области О < х < I уравнение Шредингера для стационарных состояний F,6) имеет вид Решение последнего уравнения можно, очевидно, записать как (8,3) где k=*y -j^-. Используем теперь граничные условия (8,1). Из соотношения -ф = 0 при х = 0 следует a = 0. Условие
42 УРАВНЕНИЕ ШРЕДИНГЕРА [ГЛ. 1Г гр (/) = 0 дает kl = nn, (8,4) где п — любое целое число, большее нуля. В дальнейшем она будет именоваться квантовым числом. При п = 0 мы имели бы г|)==0, что означало бы отсутствие частицы во всем простран- пространстве. Условие (8, 4) позволяет найти возможные значения энер- энергии частицы Е п2- <8'5> Мы видим, что уравнение Шредингера имеет решения, удовле- удовлетворяющие граничным условиям только при дискретных зна- значениях квантового числа п. Таким образом, энергия частицы в бесконечно глубокой потенциальной яме оказывается кванто- квантованной. Дискретность энергии возникла естественным образом^ без каких-либо дополнительных предположений. В данном слу- случае она оказалась непосредственно следующей из граничных условий, налагаемых на волновую функцию на концах проме- промежутка интегрирования. Состояние частицы с наименьшей воз- возможной энергией будет в дальнейшем именоваться нормальным или основным, все остальные состояния — возбужденными. Энергия нормального состояния частицы в бесконечно глубокой потенциальной яме получается из формулы (8,5) при п = 1: Заметим, что значение минимальной энергии частицы находится в соответствии с принципом неопределенности. Действительно, неопределенность координаты частицы Да: ~ L Неопределен- Неопределенность импульса Др порядка у. Так как р>Др, то минимальная: энергия частицы оказывается равной 2т ^ 2ml2 » что по порядку величины совпадает с (8, 6). Определим теперь расстояние между соседними уровнями: энергии (An =1): Расстояние между уровнями увеличивается с уменьшением массы частицы и размеров области ее движения /. Так, напри- например, для электрона (m ~ 107 г), заключенного в области I ~ 5-\0~* см, находим Д? ~ 1 эв. Напротив, в случае моле- молекулы с m ~ 103 г, движущейся, например, в области / ~ 10 см, расстояние между уровнями составляет Д? ~ 100 эв. Это рас-
^§ 8] ЧАСТИЦА В ОДНОМЕРНОЙ ПРЯМОУГОЛЬНОЙ ЯМЕ 43 стояние настолько мало, например, по сравнению с kT = 0,025 эв, Что практически энергию молекулы можно считать непрерывно изменяющейся величиной. Найдем отношение ¦ рп , т. е. относительное расстояние Д? 1 между уровнями энергии. Мы видим, что " ~ — и стремится к нулю при очень больших п. Дискретность квантовых состоя- йий перестает проявляться при больших квантовых числах и фактически наступает переход к непрерывному изменению энергии. Рассмотрим несколько подробнее свойства волновых функ* дий частицы в потенциальной яме. Волновая функция, отвечаю- отвечающая п-му уровню энергии, имеет вид % = Ansin^x. (8,7) Постоянную Ап определим из условия нормировки Тогда Г Г 1 / о о Отсюда А»-"/у. (8,8) Таким образом, значение постоянной не зависит от кванто- квантового числа п. Плотность вероятности |г|э|2 нахождения частицы в различ- различных точках внутри ямы иллюстрируется на рис. 2. В классиче- классической механике частица, движущаяся в потенциальной яме, с равной вероятностью может находиться в любой точке внутри ямы (прямая на рис. 2). Действительно, вероятность dWl{a обнаружения частицы в интервале dx пропорциональна времени <dt нахождения частицы в этом интервале: Поскольку на частицу внутри ямы никакие силы не дей- действуют, она движется с постоянной скоростью v и, следователь- следовательно, dWKn не зависит от х. При увеличении квантового числа п
44 УРАВНЕНИЕ ШРЕДИНГЕРА [ГЛ. II (энергии частицы) максимумы распределения вероятностей стремятся сблизиться друг с другом. В пределе п ->- оо распре-» деление вероятностей, получаемое из квантовомеханического расчета, приводит к тем же результатам, что и классическое распределение. Это следует из того, что функция sin2 ^j- х бы- быстро осциллирует при изменении х и при интегрировании по лю- любому конечному интервалу может быть заменена на 7г. Таким образом, рассмотрение простейшей квантовомеханической си- системы приводит нас к следующим выводам, имеющим, как мы убедимся в дальнейшем, совершенно общий характер: 1) энергия микрочастицы, движущейся в потенциальной яме, пробегает дискретный ряд значений; Рис. 2. 2) даже при Е = Е\ (нормальное состояние) частица не находится в состоянии полного покоя с кинетической энергией, равной нулю; 3) дискретный характер энергетических уровней прояви ляется при малой массе частиц и малых размерах области, в которой происходит движение; 4) при больших значениях квантовых чисел квантовомеха* нические соотношения переходят в формулы классической фи- физики. Последнее утверждение является частным случаем общего принципа соответствия, с которым мы будем еще неоднократно встречаться. В дальнейшем при рассмотрении квантового осциллятора или атомных систем мы увидим, что квантование состояний мо- может иметь место в системах, не ограниченных какими-либо не- непроницаемыми стенками. Вместе с тем мы увидим, что наличие дискретных энергетических состояний не является непременным признаком квантовомеханических систем. В некоторых случаях квантовомеханические системы обладают непрерывным спек* тром.
§ 9] ЧАСТИЦА В ТРЕХМЕРНОЙ ПРЯМОУГОЛЬНОЙ ЯМЕ 45 § 9. Частица в трехмерной прямоугольной потенциальной яме Рассмотрим теперь более сложный случай движения ча* стицы в трехмерной бесконечно глубокой потенциальной яме. Будем считать, что область пространства, в которой движется частица, определяется неравенствами 0<a:</i; 0 < у < 12\ О < z < /з. Волновое уравнение в этом случае можно записать в виде 2т \ дх2 ^ ду* ^ дг2 ) ^ 1У'[) Граничные условия аналогичны (8,1) и имеют вид у, 2) = ф(л;, 0, z) = ty(x, у, 0) = У, «)-*(^ 1ъ *НФ(*, У, /з) = 0. (9,2) Решение уравнения (9,1) запишем в виде -ф = В sin kxx sin k2y sin kzz. (9,3) Подставляя ф в уравнение, получаем соотношение ?(*?+1Й + *Э-Я. (9,4) Из граничных условий (9,2) следует k2l2 = п2я, (9,5) где /ii, п2 и я3 — целые числа. Подставляя значения &ь *2 и kz в (9,4) и (9,3), получаем выражения для энергии и волновой функции я2*2 /л? л2 п2Л 1++ (9j6) *1.«л - В sin -5Ь? sin-^ sin^. (9,7) Постоянная В опять определяется из условия нормировки и равна /5; (9.8)
46 УРАВНЕНИЕ ШРЕДИНГЕРА [ГЛ. II Рассмотрим, в частности, частицу, движущуюся в потен- потенциальной яме кубической формы, т. е. случай 1\ = /2 = /з = /. Энергия частицы в этом случае равна Из формулы (9,9) легко увидеть, что одно и то же значение энергии может осуществляться при помощи различных комби- комбинаций чисел п\, П2 и я3. Это означает, что несколько различных квантовых состояний с разными волновыми функциями отве- отвечают одному и тому же значению энергии. Такие уровни энер- энергии называются вырожденными, а число различных состояний, отвечающих данному уровню энергии, — кратностью вырож- вырождения. Рассмотрим, например, уровень энергии где п\ + п\ + п\ = 6. Так как каждое из п — целое число, боль- большее нуля, то этому равенству можно удовлетворить тремя раз- различными комбинациями чисел пи п<ь, п3: 1) пх = 2, n2= 1, п3= 1, 2) п{ = 1, я2 = 2, п3= 1, 3) п{ = 1, П2= 1, я3 = 2. Таким образом, данному уровню энергии отвечают 3 различных состояния \p2ib *Рш> Фиг- Следовательно, кратность вырождения данного уровня равна трем. С явлением вырождения мы часто будем сталкиваться при рассмотрении более сложных систем, например, атомов. § 10. Линейный осциллятор Переходя к более сложным квантовомеханическим систе- системам, мы остановимся на теории линейного гармонического ос- осциллятора. Такой осциллятор представляет квантовый аналог частицы, совершающей малые линейные колебания около поло- положения равновесия. Примером малых колебаний в атомных си- системах могут служить малые колебания атомов в молекуле (ср. §41 ч. III). Не менее важным примером может служить также тепловое движение кристалла, которое может быть представлено в виде совокупности линейных гармонических осцилляторов. С задачей о гармоническом осцилляторе мы встретимся также и в кванто- квантовой электродинамике, где произвольное электромагнитное поле
§ 10] ЛИНЕЙНЫЙ ОСЦИЛЛЯТОР 47 представляется в виде суперпозиции независимых квантовых осцилляторов (см. § 101). Приведенные примеры показывают, что теория линейного гармонического осциллятора является одной из важных задач квантовой механики. Потенциальная энергия линейного гармонического осцилля- осциллятора дается известной формулой U =—~—• Поэтому уравне- уравнение Шредингера F,6) для линейного гармонического осцилля- осциллятора имеет вид ?3 р,_1* „о,,) При его решении удобно перейти к безразмерным переменным ж- <I0>2> В новых обозначениях уравнение Шредингера приобретает вид A0,3) Важным отличием осциллятора от рассмотренных выше при- примеров является то, что в этом случае движение частицы не ограничено какой-либо непроницаемой стенкой. Поэтому у ос- осциллятора нет граничных условий, подобных условиям (8,1). Единственным требованием, которое налагается на волновую функцию осциллятора, является требование ее квадратичной интегрируемости. Мы увидим, что уравнение Шредингера для осциллятора имеет решение, удовлетворяющее последнему тре- требованию, только при некоторых вполне определенных значениях параметра К. Эти значения называются собственными значе- значениями уравнения A0,3). Для того чтобы выяснить общий характер решений послед- последнего уравнения, рассмотрим асимптотическое поведение ty(l) при очень больших значениях аргумента g'S> Я. При g ^> К в уравнении A0,3) можно опустить Ягр по сравне- сравнению с ?2<ф. При этом имеем, очевидно, -7iW-t4 = 0. A0,4) Асимптотическим решением последнего уравнения, удовлет- удовлетворяющим требованию конечности при больших §, служит функция г|) = Л!те". A0,5) где А — некоторая постоянная и т — любое конечное число,
48 УРАВНЕНИЕ ШРЕДИНГЕРА (ГЛ. II Второе независимое решение уравнения A0,4) *ф~е 2 не* ограниченно возрастает при ^->оо и должно быть опущено. Будем пытаться искать решение уравнения A0,3) в виде Ъ = е *f(l), A0,6) где /(?) —новая неизвестная функция, которая при §->-оо ве- ведет себя как gm. Подставляя A0,6) в A0,3), приходим к сле- следующему уравнению для функции /: ^-26-^- + (A.-l)f-O. A0,7) Поскольку точка g = 0 не является особой точкой уравнения A0,7), решение этого уравнения будем искать в виде степен- степенного ряда /(!)=2а*1*. A0,8) fe=0 Производные -Jr и -^ имеют вид -3f-Ц*****-1 Щг=^к(к-\)а&к-* A0,9) Подставляем ряды A0,9) в уравнение A0,7), получаем Для того чтобы степенной ряд вида 2 ?ng* был тождественно п равен нулю, необходимо, чтобы обращались в нуль все коэф- коэффициенты сп. Полагая равным нулю коэффициент при gfc, полу-» чаем рекуррентную формулу 2k + 1 — А, /1 л 11 ч а 0°П) Нетрудно видеть, что при g -¦ оо такой ряд ведет себя, как е*\ так как в этом случае существенны большие k и A0,11) дает ak+2 ~ BAt) flft. При этом функция ф A0,6) неограниченно воз- возрастает. Но такое решение должно быть опущено. Мы получим решение, удовлетворяющее необходимым усло- условиям конечности и ведущее себя при ?—*оо как A0,5) только в том случае, если ряд A0,8) сведется к полиному, т. е. обо- оборвется на каком-то члене. Так, предположим, что ап Ф 0, ап+2 = = 0. Тогда все последующие коэффициенты также обратятся в нуль, и функция f сведется к полиному п-й степени. Из A0,11) следует, что при этом выполняется условие 2/г+1 -Л = 0, A0,12)
§ 10] ЛИНЕЙНЫЙ ОСЦИЛЛЯТОР 49 где п — целое число, п ^ 0, так как п — это номер члена, на котором ряд обрывается. Подставляя в A0,2) значение К, получаем A0,13) Отсюда видно, что энергия осциллятора может принимать толь- только дискретные значения, причем уровни энергии расположены друг от друга на одинаковых расстояниях, равных йо>. Выпишем волновую функцию, отвечающую п-ыу возбужден- возбужденному уровню энергии в виде 1М6)-Л|*"ТШ. (ЮЛ 4) где fn(l) —полином д-й степени с коэффициентами, определяе- определяемыми соотношением A0, 11), и Ап — множитель, определяемый условием нормировки. Полиномы fn(l) носят название полино- полиномов Чебышева — Эрмита и обозначаются через Hn(Q. Поли- Полиномы Чебышева — Эрмита часто представляют в виде Я„(|) = (-1)п^^^. A0,15) Они удовлетворяют дифференциальному уравнению = 0, A0,16) которое получается из A0, 7) с учетом условия A0, 12). Выпишем несколько первых полиномов Чебышева — Эрмита: Но (|) - 1, Я1 (|) = 2gt Я2 (Б) = 4?2 - 2, #з(|) = 8?3-12§, #4(g)=16?4-48?2+12. A0,17) Зная общий вид полиномов Чебышева — Эрмита, можно вычис- вычислить нормировочный интеграл. При этом для Ап получается х) Вид волновых функций для разных квантовых чисел п указан на рис. 3. Отметим, что волновая функция, отвечающая основ- основному состоянию осциллятора п = 0, нигде не обращается в нуль. Волновая функция tyi(x), отвечающая уровню п = 1, обращается в нуль один раз при х = 0, -фгМ (п = 2) обращается в нуль два раза и т. д. Точки, в которых волновая функция обращается в нуль, называются узлами волновой функции. Легко заметить, ]) См., например, Л. Д. Ландау и Е. М. Лифшиц. Квантовая меха- механика, Физматгиз, 1963, стр. 94,
50 УРАВНЕНИЕ ШРЕДИНГЕРА [ГЛ. II что число узлов волновой функции равно квантовому числу п. Последнее утверждение не является специфическим для осцил- осциллятора. Можно утверждать, что вообще в одномерном случае Рис. 3. число узлов волновой функции определяется квантовым чис- числом д1). Вероятность найти частицу в точке х, в интервале dx равна Эти вероятности для разных п изображены на рис. 4. Сравним полученные выражения с вероятностью нахождения частицы в данной точке, вычисленной с по- помощью классической механики. Пос- Последняя определяется как отношение времени dt пребывания в окрестно- окрестности данной точки к периоду движе- движения. Классическая вероятность ока- оказывается наибольшей вблизи точек поворота х = ±*о, в которых ско- скорость движения обращается в нуль. Напротив, в окрестности точки х = 0 частица имеет наибольшую ско- скорость и вероятность ее обнаруже- обнаружения минимальна. Из рассмотрения кривых рис. 4 видно, что вероятность найти кван- квантовую частицу отлична от нуля и в классически недостижимой обла- области за пределами точек поворота. При больших квантовых чис- числах (рис. 5) в согласии с принципом соответствия квантовое рас- распределение вероятности приближается к классическому. В заключение отметим, что наименьшее возможное значение энергии осциллятора, равное -у, отлично от нуля. Это озна- 1) Р. Курант и Д. Гильберт, Методы математической физики, Гос- техиздат, 1951, т. I, стр. 382.
11] ТРЕХМЕРНЫЙ ОСЦИЛЛЯТОР 51 чает, что квантовый осциллятор никогда не может находиться в состоянии абсолютного покоя. Это обстоятельство в свою оче- очередь связано с соотношением неопределенности. По порядку величины энергия осциллятора равна Ъ \* Ар2 2m Рассматривая эту величину как функцию Др, легко устано- установить, что она минимальна при Др~(тсойI/2 и по порядку 1 А А ill ill In II м 1 J /II / У 1 1 1 I J i i I V л Л h Л 1 (If 1 11 и J i L ii fi V 1 ТГП I J П л u 1 i 1 1 |L iiin i i V VI11111 If H fl I 1 Ml! I U V '1 'l 1 1 J 1 I 1 • -6 -J -4 -d -2 -/ О 1 2 д Рис. 5. 5 6 величины равна Асо. Экспериментально нулевая энергия Ео на- наблюдается при рассеянии света кристаллом, находящимся при температуре, близкой к абсолютному нулю. При абсолютном нуле кристалл находится в основном (низшем) энергетическом состоянии. Тем не менее атомы совершают нулевые колебания, которые вызывают рассеяние света. § 11. Трехмерный осциллятор Рассмотрим теперь движение пространственного трехмер- трехмерного осциллятора. Для общности будем считать, что в трех взаимно перпендикулярных направлениях собственные частоты различны и равны соответственно соь сог, соз- Тогда потенциальная
52 УРАВНЕНИЕ ШРЕДИНГЕРА [ГЛ. I! энергия выражается формулой ^^ A1,1) Уравнение Шредингера соответственно имеет вид Будем пытаться искать решение уравнения A1,2) в виде произ- произведения функций, каждая из которых зависит только от одной координаты ¦ (х, у, z) = ih (x) ifc (у) Ь (z). A1,3> Подставляя A1,3) в A1,2), и разделяя переменные, получаем: (И>4) где Xi = х, х2 =г у, хг = z\ Ех + Е2 + Ег = ?. Таким образом, задача свелась к одномерной. В соответ* ствии с этим, используя A0,13), A0,14) и A0,18), можем на- написать: о о о e где h=V^]rXi ('=1> 2, 3). Полная энергия осциллятора равна В частности, для изотропного осциллятора, у которого coi = @2 = = @3 == со, полная энергия имеет вид + jj, где я^+^ + Яз, (П,7) т. е. Еп зависит от суммы квантовых чисел пи п2у п3. Это значит, что данное значение энергии (данное п) можно получить за счет различных комбинаций п\, п2, Лз. Отсюда следует, что все уровни энергии, за исключением основного п = 0, являются вы- вырожденными. Нетрудно подсчитать кратность вырождения. Для этого фиксируем, кроме /г, еще квантовое число п\. Тогда число возможных троек чисел /ii, n2f пг будет равно числу возможных значений и2, т. е. равно п — П\ + 1, так как п2 может меняться
§ 12] ОТРАЖЕНИЕ И ПРОХОЖДЕНИЕ ЧЕРЕЗ БАРЬЕР 5? от нуля до п — п\. Суммируя полученное выражение по всем возможным значениям числа Пи найдем полное число комбина- комбинаций из трех квантовых чисел пи яг, Яз, дающих в сумме задан- заданное число /г, т. е. кратность вырождения я-го уровня энергии: A1,8)- § 12. Отражение и прохождение через потенциальный барьер Из других сравнительно простых задач квантовой механики остановимся на движении частиц в поле сил, которое может- быть представлено в виде потенциального барьера. Это озна- означает, что силы действуют на частицу в некоторой ограниченной области пространства. Вне этой области частица движется как свободная. Мы увидим, что изуче- изучение движения частиц в поле, i/0 имеющем вид барьера простей- простейшей формы, позволит выявить / ряд важных и принципиально но- й р р ^ вых свойств квантовых частиц. О я Начнем наше рассмотрение с про- Рис. 6. стейшего прямоугольного бес- бесконечно протяженного одномерного потенциального барьера, изображенного на рис. 6. В классической механике всякая ча- частица, двигающаяся слева направо с энергией, меньшей высоты барьера ?/0, полностью отражается от потенциальной стенки. Область х > О является для нее недоступной, так как в этой области полная энергия частицы была бы меньше потенциаль- потенциальной. Это означало бы, что кинетическая энергия должна была бы быть отрицательной, что, очевидно, невозможно. Если же,, напротив, Е больше Uo, то по законам классической механики частица беспрепятственно проходит над барьером, двигаясь- в области х > О с меньшей кинетической энергией, равной. Е—и0. Рассмотрим теперь движение частицы в тех же условиях по законам квантовой механики. Для этого напишем уравнение Шредингера для стационарных состояний частицы в поле бес- бесконечно протяженного барьера && "<*>¦-*¦. 02,1) где U — потенциальная энергия, график которой изображен на рис. 6. Решения уравнения A2, 1) удобно рассмотреть в двух:
54 УРАВНЕНИЕ ШРЕДИНГЕРА [ГЛ. II различных областях. Область / простирается от х = —оо до х = О, область // — от х = 0 до х = оо. Напишем уравнение Шредингера для каждой из указанных областей: A2,2) где введены обозначения Решения этих уравнений соответственно запишутся в виде 0, 1 0.\ г|) {х) = Л2е<*'* + B2e-ik'*, x>0. В этих формулах члены вида eikx представляют плоскую волну, распространяющуюся в положительном направлении оси х, а e-ikx — плоскую волну, распространяющуюся в обратном на- направлении. Амплитуды Аи В\, А2 и В2 являются постоянными интегрирования. Зададим поток частиц, падающих на барьер. Пусть /о — плотность потока падающих частиц. Тогда, согласно G>6)> и т Выберем для простоты поток таким, чтобы можно было поло- положить А\ = 1. Для определения остальных постоянных рассмотрим поведе- поведение волновой функции на границе областей / и // в точке х = 0. В силу общих условий, накладываемых на волновую функцию и ее производную (см. § 6), они должны оставаться непрерывными даже в точке разрыва потенциальной энергии. Поэтому при х = 0 должны иметь место равенства О), A2,5) 0). A2,6) Из соотношений A2,5) и A2,6) можно определить еще две по- постоянные интегрирования А2 и В\. Что касается постоянной В2, то мы должны положить В2 = 0. Действительно, мы задаем поток частиц, распространяющихся в положительном направле- направлении оси х. При Е > Uo (т. е. при вещественном kr) слагаемое
§ 12] ОТРАЖЕНИЕ И ПРОХОЖДЕНИЕ ЧЕРЕЗ БАРЬЕР 55 в волновой функции, пропорциональное e~ih'x, представляет пло« скую волну, распространяющуюся в обратном направлении. В области / в отрицательном направлении оси х распростра- распространяется отраженная волна. В области // отраженной волны, оче- очевидно, нет и, следовательно, нет волны, распространяющейся справа налево. Поэтому мы должны приравнять нулю ампли- амплитуду В2 этой волны. Если же Е < Uo (kf — чисто мнимая вели- величина), то функция егШх .экспоненциально возрастает при #-> — оо, что противоречит условию конечности волновой функ- функции. В силу этого коэффициент В2 должен быть равен нулю и при мнимом значении W\ т. е. при Е < Uo. Рассмотрим более детально случай, когда полная энергия частицы больше высоты потенциального барьера Е > ?/0. Из соотношений A2,5) и A2,6), учитывая A2,4), имеем 1 + В{ = А2, Из этих уравнений находим амплитуды А2 и Вх: Мы видим, что В\ — амплитуда отраженной волны, отлична от нуля, хотя Е > Uo. Это обстоятельство обусловлено волновыми свойствами частиц. Волна частично отражается, частично про- проходит в область //. Отношение плотности потока отраженных частиц /г к плотности потока падающих /0 назовем коэффициен- коэффициентом отражения R. Соответственно, отношение плотности потока проходящих частиц jD к плотности потока падающих назовем коэффициентом прохождения D. Учитывая A2,4), находим Так как /0 = —, получаем R = D= 4kk' Мы видим, что автоматически выполняется соотношение R + D^l, A2,9) выражающее закон сохранения числа частиц. Отметим, что выражения A2,8) оказываются симметрич- симметричными по отношению к k и к\ т. е. для частиц заданной
i56 УРАВНЕНИЕ ШРЕДИНГЕРА (ГЛ. II энергии Е коэффициент отражения (а также и прохождения) оказывается не зависящим от направления движения частиц. Частицы, движущиеся слева направо, т. е. против действия силы в точке х = О, имеют такую же вероятность отразиться в этой точке, что и частицы той же энергии, двигающиеся справа на- -лево, по направлению действия силы в точке х — 0. Это обстоя- обстоятельство также обусловлено волновым характером процесса и имеет соответствующую оптическую аналогию. Рассмотрим теперь случай Е < ?/0. При этом к' — чисто лнимая величина, которую удобно записать в виде к' = Ы, где -?). A2,10) Амплитуда отраженной волны Si оказывается комплексной величиной, а коэффициент отражения R равен />-1-Л-0. A2,11) Отраженная волна запишется в виде т. е. отражение приводит к сдвигу фазы волны. Из A2, 12) следует, что этот сдвиг равен A2,13) Хотя отражение и является полным, тем не менее волновая функция в области // отлична от нуля и имеет вид е-"* A2,14) Соответственно плотность вероятности того, что частица нахо- находится в точке х в области х > 0, равна Мы видим, что поведение квантовых частиц существенно от- отличается от классических. Для частицы, двигающейся по зако* нам классической механики, область х > 0 при Е < Uo являлась запретной. Напротив, частица, движущаяся по законам кванто- квантовой механики, с известной вероятностью может проникнуть в эту область. Проникновение частиц в область запрещенных энергий представляет специфически квантовый эффект, полу- получивший название туннельного эффекта. Эффективная глубина проникновения в область //, т. е. расстояние 6х от границы об« ласти //, на котором вероятность нахождения частицы еще за-
§ 12] ОТРАЖЕНИЕ И ПРОХОЖДЕНИЕ ЧЕРЕЗ БАРЬЕР 57 метно отлична от нуля, как видно из формулы, имеет порядок, величины 6#~~. При х^8х плотность вероятности A2,15) оказывается экспоненциально малой. Оценим эффективную глубину проникновения для электро- электрона, считая, что f/0 — ^ — 1 эв = 1,6-10~12 эрг. Для 6* имеем,, очевидно, 6 Ь 1(Г27 10~8 см ===10 см /2- 10~27- 1,6- 10~12 Оценка показывает, что весь эффект может быть заметен толь- только в области микроскопических размеров. Таким образом, как этого и следовало ожидать, туннельный эффект не может про- проявляться при движении макроскопических тел, для которых справедливы законы классической механики. Чтобы фактически обнаружить частицу в области //, мы должны локализовать ее там в некотором малом интервале Ах ^ 8х. При этом, локализуя частицу, мы заведомо меняем ее состояние (ее энергию), так как в силу соотношения неопреде- неопределенностей Ар^-jj-^foe. Частица, которую мы обнаружим где-- где-то в области //, уже не будет обладать первоначальной энер- энергией Е. С неопределенностью в импульсе связана неопределенность в кинетической энергии частицы: 2т ^ 2т ' Подставляя сюда выражение для х A2,10), мы получаем: // Таким образом, неопределенность Рис. 7. энергии частицы, локализованной в области под барьером, больше той энергии, которой ей не хва- хватает до высоты барьера. Рассмотрим кратко барьер конечной протяженности, изо- изображенный на рис. 7. Частицы падают на барьер, двигаясь в по- ложительном направлении оси х. Используя результаты и обо- обозначения предыдущего рассуждения, мы сразу можем выписать волновую функцию в трех различных областях: х<0, ?/ = 0, / A ?/ = ?/0, // A2,17) x>a, ?/ = 0. /// A2,18>
58 УРАВНЕНИЕ ШРЕДИНГЕРА [ГЛ. II При этом (как и в случае бесконечно протяженного барье- барьера) мы опять положили амплитуду падающей волны, равной единице. Поскольку в области /// нет отраженной волны, в ка- качестве решения взята только волна, распространяющаяся в по-* ложительном направлении оси х. Выпишем условия непрерыв- непрерывности волновой функции и ее первой производной на границах областей, аналогичные A2,5) и A2,6): -о), 1 -0). j Подставляя в эти соотношения A2,16) — A2,18), получаем си^ стему уравнений относительно В\, А2, В2 и Лз*. 1 + В{ = А2 + Въ A2eik'a + В2е~Ша = A3eika, ь A2 20) k A - В{) = W (А2 - B2)f A2eik'a - В2е~Ша = -~ ^3eika. Рассмотрим сразу наиболее интересный случай Е < Uo< Если бы движение частиц происходило по законам классиче- классической механики, то барьер был бы для них полностью непрозрач- непрозрачным и в точке х = 0 частицы испытывали бы полное отражение от потенциального барьера. Иначе дело обстоит в случае микро- микрочастиц, движение которых описывается законами квантовой механики. Разрешая систему A2,20) относительно Л3 и учитывая, что kr = m, где к определена в A2, 10), получаем Амплитуда плоской волны оказывается отличной от нуля в области за барьером, хотя энергия частицы меньше высоты барьера Е < [/о. Это означает, что микрочастица с известной вероятностью может пройти через потенциальный барьер путем туннельного перехода. Туннельное прохождение частиц, перво- первоначально казавшееся парадоксальным эффектом, в настоящее время не только обнаружено на опыте, но играет фундаменталь- фундаментальную роль в ряде областей физики, в частности, в ядерной фи- физике. Достаточно сказать, что с туннельным прохождением че- через барьер связаны а-распад радиоактивных ядер, явление самопроизвольного деления ядер урана и т. п. Туннельным пере- переходом обусловлено явление холодной эмиссии электронов из металлов в сильном электрическом поле и ряд других про- процессов. Определим коэффициент прохождения D микрочастиц через барьер: j j 4kn D = 17 e I Az I2 = (k2 + x2J sh2 ш + 4kW # A2,22)
§ 13] ОДНОМЕРНОЕ ДВИЖЕНИЕ 59 Если %а > 1, то shxa « у еха, и выражение A2,22) упрощается: Основная зависимость коэффициента прохождения от ши- ширины и высоты барьера определяется экспоненциальным мно- множителем. Обозначая предэкспоненциальный множитель через Д>, имеем ~ a Vim (Щ-Е) A2,24) Мы видим, что вероятность прохождения через барьер не слишком мала, если ¦§¦ Y2m(U0-E)a^l. A2,25) Условие A2,25) может, очевидно, выполняться только в области микроявлений. Так, если мы подставим в A2,25) величины ядер- ядерных масштабов а ~ 10~13 см, т ~ 10~24 г (масса нуклона), С/о — Е ~ 10 Мэв A0~5 эрг), то, произведя оценку, находим, что D ~ е~1. Таким образом, частица может с заметной вероят- вероятностью пройти через барьер, высота которого превышает ее энер* гию на 5—10 Мэв, Совершенно иной результат получится для той же частицы и той же высоты барьера, если его простран* ственная протяженность будет составлять а ~ 1 см. Тогда D ~ 10~13. Это означает, что в области макроскопических явле- явлений эффект туннельного перехода практически полностью от* сутствует. Вероятность туннельного прохождения через барьеры произвольной формы мы рассмотрим в § 42. §13. Одномерное движение 1) В этой главе был рассмотрен ряд простых задач квантовой механики, относящихся к одномерному движению. Рассмотрен* ные трехмерные задачи также сводятся к одномерным, потому что уравнение Шредингера с потенциалом U (х, у, z) = Ux {х) + U2 {у) + U3 (z) сводится к одномерным уравнениям с потенциалами U\, U$ и Us соответственно. Полученные результаты позволяют сделать не« которые общие выводы о свойствах одномерного движения ча- частиц. !) См. подробнее Л. Д. Ландау и Е. М. Л и ф ш и ц, Квантовая меха- механика, Физматгиз, 1963, стр. 83.
60 УРАВНЕНИЕ ШРЕДИНГЕРА [ГЛ. II При одномерном движении уровни энергии могут принадле- жать как к дискретному (см. § 8—11), так и к сплошному спект- спектру (§ 12). Состояниям дискретного спектра, как мы видели, от- отвечают квадратично интегрируемые волновые функции, т. е.. волновые функции, для которых условие нормировки может быть написано в виде Это условие означает, что движение финитно, т. е. вероятность обнаружить частицу на сколь угодно больших расстояниях ис-» чезающе мала. Наоборот, если частица может уходить на сколь угодно боль- большие расстояния, т. е. движение инфинитно, ее волновая функция квадратично не интегрируема. Можно показать, что в этом слу« чае энергия принадлежит сплошному спектру. Предположим, что потенциальная энергия частицы U(x) как-то меняется от ее значения при #-^оо, ?/(оо), которое мы выберем за начало от-* счета энергии, до значения U(—оо) = Uo при x->oo. Будем считать, для определенности, f/0 положительным, Uo > 0. Функ- Функция U(x) может меняться совершенно произвольно. Предполо- Предположим лишь, что она имеет минимум J7min < 0. Тогда при энергии итт < Е < 0 частица не может уйти на бесконечность. При этих значениях энергии движение финитно, а спектр дискретен. Уровни энергии дискретного спектра не вырождены. Последнее утверждение легко доказывается от противного. Действительно, если предположить, что i|)i и гр2 — два решения уравнения Шре« дингера, отвечающее одному и тому же значению энергии ?, то они удовлетворяют соотношению J_ _?$L _ 2m (f 7 ~ _ J_ d^o «t dx2 "" fi2 yU C)~ i|J dx2 > т. e. -ф, dx2 ф2 dx2 ' Интегрируя это соотношение по х, получаем Ф2-^--^,^= const. A3,1) Но на бесконечности *фi = грг = 0. Поэтому постоянная в правой части соотношения A3,1) равна нулю, следовательно, Интегрируя еще раз по х, получаем -фг = const -tyi. Это озна- означает, что обе функции описывают одно и то же состояние, т. е« вырождение отсутствует.
$ 13] ОДНОМЕРНОЕ ДВИЖЕНИЕ 61 В области 0<E<U0 частица может распространяться в сторону положительных х как угодно далеко. Поэтому движение инфинитно, а энергети- энергетический спектр — сплошной. Волновые функции при этом также не вырождены. Действительно, предыдущее доказательство спра- справедливо и в этом случае, так как волновые функции обращают- обращаются в нуль при *->—оо. Асимптотические выражения для вол* новых функций при х -^ ± оо легко получить из уравнения Шредингера если подставить туда U = О при х-+ оо и U = Uo при х-*— оо. Соответственно получаем а|э {х) = A sin {kx + а) при лс->оо, A3,2) и ${х) = Ве*х при х-> — оо, A3,3) где k V2E и K = т. е. решение имеет вид стоячей плоской волны при л;->оо и экспоненциально затухает при х -*• — оо. В энергетической области движение инфинитно в обе стороны. Энергетический спектр — сплошной. Так как уравнение Шредингера — второго порядка, оно имеет два линейно независимых решения. В этой области энергий оба эти решения удовлетворяют необходимым требова- требованиям. Поэтому уровни энергии — двукратно вырождены. Асимп- Асимптотическое выражение для волновой функции имеет вид kx9 A3,4) где одно слагаемое соответствует частице, движущейся в поло- положительном направлении оси х, а второе — частице, движущейся в отрицательном направлении оси х. Предположим теперь, что поле неограниченно возрастает, т. е. | U(x) |-> оо при д:-> ± оо. В качестве простейшего и в тоже время важного примера рассмотрим задачу о движении части- частицы в однородном внешнем поле ?/(*)=-/.*. Ось х мы выбрали в направлении поля. Через / обозначена сила, действующая на частицу /==~"~^~- Потенциальную
62 УРАВНЕНИЕ ШРЕДИНГЕРА [ГЛ. II энергию мы отсчитываем от ее значения при х = О, поэтому ?7@) = 0. Уравнение Шредингера для движения в таком поле имеет вид 5- + ТГ(* + /*)*-0. A3,5) Введем вместо х новую переменную: Соответственно уравнение A3,5) будет иметь вид $0. A3,6) Решение уравнения A3,6) может быть выражено через функцию Бесселя Более удобным является выражение решения A3,6) через так называемую функцию Эйри. Именно, решение уравнения A3,6), конечное при всех значениях т|, имеет вид A3,7) где через Ф(г\) обозначена функция Эйри оо Ф(л)=у^ j cos (^+ur\)du, A3,8) а С — нормировочная постоянная. Таким образом, уравнение Шредингера A3,5) имеет реше- решение, удовлетворяющее необходимым требованиям при любом значении энергии Е. Следовательно, при движении в однород- однородном поле энергетический спектр частицы является сплошным, что соответствует инфинитному движению. В данном случае U ~*—оо при х->оо, т. е. неограниченным является движение в положительном направлении оси х. Волновая функция A3,7) имеет достаточно простой вид при tj-»-±oo. Пользуясь известными асимптотическими выраже- выражениями для функции Эйри (см. сноску, стр. 59), имеем 1->-°о, A3,9) T) при Г1">о°- A3'10)
§ 14] УРАВНЕНИЕ ШРЕДИНГЕРА ДЛЯ СИСТЕМЫ ЧАСТИЦ 63 Постоянная С определяется из условия нормировки. Интег- рал от квадрата модуля волновой функции A3,7) по всему про- пространству, конечно, расходится, что соответствует инфинитному движению. Правила нормировки в подобных случаях мы обсу- обсудим в § 18. § 14. Уравнение Шредингера для системы частиц В предыдущих параграфах мы рассмотрели законы движе- движения одной частицы во внешнем поле. Однако круг рассмотрен- рассмотренных задач был весьма ограничен. В самом деле, уже простейшая система — атом водорода — представляет собой, строго говоря, систему из двух частиц. Тем более это относится к таким систе- системам, как многоэлектронные атомы, молекулы, ядра атомов, твердое тело и т. д. Обобщая результаты, полученные в § 6, сформулируем основное уравнение квантовой механики — урав- уравнение Шредингера для системы N частиц. Оно имеет вид: N N ^ -(ri,r2, ...,глг)г|). A4,1) Здесь лапласиан Дг- л а2 , а2 действует на координаты 1-й частицы. иг(Г{)—потенциальная энергия 1-й частицы во внешнем поле. UB3 — потенциальная энергия взаимодействия частиц между собой, тг — масса /-й ча- частицы. Суммирование проводится по всем частицам системы. Волновая функция, описывающая систему частиц, в соответ- соответствии с § 2 зависит от координат всех частиц и времени г|)(гьг2, ...,глг, t). Уравнение Шредингера для стационарных состояний имеет вид N N ?ф. A4,2) В качестве простейшего примера интегрирования уравнения A4,2) рассмотрим систему невзаимодействующих друг с другом частиц, т. е. будем предполагать, что энергия взаимодействия равна нулю UB3 = 0. В этом случае уравнение Шредингера мож- можно переписать в виде N А+и
64 УРАВНЕНИЕ ШРЕДИНГЕРА [ГЛ. II где члены в каждой скобке зависят только от координат соответ- соответствующей частицы. Будем искать волновую функцию г|) в виде произведения функций, зависящих от координат отдельных ча- частиц, г|) = ф1(г1)Ф2(г2)...^(Ы. A4,4) После подстановки в уравнение Шредингера получаем N * fa) • • • *<-! fa Разделив правую и левую части на функцию tf, найдем В правой части уравнения стоит постоянная величина. Левая часть составлена из суммы членов, каждый из которых есть функция своей независимой переменной. Для того чтобы равен- равенство имело место при всех значениях независимых переменных, необходимо, чтобы выполнялись условия N - ¦?- ДА (г,) + Ut (г,) Ь (г() = ЕМ (г,), 2 Ег = Е9 где Е{ — постоянные величины, которые, как легко видеть, пред- представляют энергии отдельных частиц. Таким образом, если левая часть уравнения Шредингера мо- может быть представлена в виде суммы A4,3), то волновая функ-» ция системы распадается на произведение волновых функций, а энергия системы является суммой энергий отдельных частиц. Полученные результаты имеют простой физический смысл- Мы предполагали, что энергия взаимодействия между частица- частицами равна нулю. Естественно поэтому, что полная энергия всей системы складывается из суммы энергий отдельных частиц, дви- движение же каждой частицы происходит независимо от движения других частиц. Вероятность обнаружения координат частиц за-« писывается в виде dW(ru гъ ..., г*)Ч *i(ri) PI Ъ(г,) р •.. I ^Ы fdVx ... dVM. Последний результат находится в полном согласии с теоремой умножения вероятностей независимых событий. Рассмотрим далее более подробно систему из двух частиц с массами т\ и /Лг. Будем предполагать, что потенциальная энер«
§ 14] УРАВНЕНИЕ ШРЕДИНГЕРА ДЛЯ СИСТЕМЫ ЧАСТИЦ 65 гия взаимодействия зависит только от расстояния между части- частицами, а внешнее поле отсутствует. Уравнение Шредингера для стационарных состояний в этом случае имеет вид ., га). A4,5) Преобразуем это уравнение, введя новые координаты R и г, оп- определяемые соотношением +m2 A4,6) Заметим, что новые переменные совершенно аналогичны коорди- координатам центра тяжести и относительного движения в классиче- классической механике. В результате несложных, но несколько длинных преобразований уравнение Шредингера преобразуется к виду Здесь М и |х— полная и приведенная массы системы М = т{ + тъ | [ A4,8) [ ^ тх +т2 ) Мы видим, что левая часть уравнения Шредингера опять распадается на сумму двух слагаемых и имеет вид, аналогичный уравнению A4,3). В этом случае решение уравнения Шрединге- Шредингера можно представить в виде Подставляя A4,9) в A4,7) и повторяя преобразования, про- проведенные ранее, получаем - ^ Агф0 + U (r) ifo = ?гг|H, A4,11) ER + Er=E. A4,12) Уравнение A4,10) является уравнением Шредингера для сво- свободной частицы с массой М. Его решением служит функция ±рп <p(R) = Aeh , A4,13) где через Р обозначен полный импульс системы. 3 В5 Г5 Левич и др., том II
66 УРАВНЕНИЕ ШРЕДИНГЕРА ГГЛ. II Величина ER равна р2 nR 2M и является кинетической энергией движения системы как целого. Таким образом, в соответствии с A4,9) и A4,13) решение уравнения Шредингера может быть представлено в виде 1_PR *(rb r2) = Aeh 4>0(r). A4,14) Из полученных формул видно, что центр тяжести системы движется в пространстве как свободная частица, а относитель- относительное движение частиц совершается независимо от движения цент-» ра тяжести и описывается функцией -фо, удовлетворяющей урав- уравнению A4,11). Полная энергия системы складывается из энергий относительного движения и движения центра тяжести. Мы ви- видим, следовательно, что в квантовой механике, как и в класси- классической физике, задача движения двух частиц, потенциальная энергия взаимодействия U которых зависит только от расстоя- расстояния между ними U(\r\ — г2|), сводится к задаче движения од- одной частицы с приведенной массой \х, во внешнем поле Ut
ГЛАВА III МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ § 15. Линейные операторы Выше мы видели, что при решении уравнения Шредингера можно найти волновые функции и энергию системы. Последняя в некоторых случаях (частица в потенциальной яме) имеет дис- дискретный, в других (свободная частица; частица, проходящая че- через барьер) непрерывный ряд значений. Зная волновую функцию -ф, мы могли найти вероятность на- нахождения частицы в данной точке пространства, а также сред- средние значения величин, зависящих от координат. При этом, как это было показано в § 4, координаты и соответствующие проек- проекции импульса частицы одновременно не имеют определенных значений. Однако использованный нами расчетный аппарат был недостаточен для ответа на ряд важных вопросов. В виде при- примера приведем некоторые из них. Какие именно величины не могут иметь одновременно определенные значения? Как найти среднее значение величин, которые не являются функциями ко- координат? Какие характеристики квантовомеханической системы должны быть заданы для того, чтобы ее состояние было пол- полностью определено? Своеобразие задач квантовой механики потребовало разви- развития и применения специального математического аппарата. Математический аппарат квантовой механики должен соот- соответствовать физической постановке задач квантовой механики. Оказалось, что в математике был уже разработан соответствую- соответствующий математический аппарат — теория линейных операторов. Мы рассмотрим сперва основы этой теории, а в дальнейшем по- покажем, как аппарат теории линейных операторов может быть связан с задачами квантовой механики. Под оператором будем понимать рецепт или правило, по ко- которому одной функции ф(*1,х2, *з> •••) переменных хих2, хг, ... сопоставляется другая функция %(xi,x2, хг, ...) тех же пере- переменных.
68 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III В дальнейшем операторы мы будем обозначать при помощи букв со шляпкой, например F. С помощью символа F правило перехода от функции ф и функции % можно записать в виде % = h- A5,1) Рассмотрим несколько простейших операторов. Оператор F может, например, означать дифференцирование по какой-либо переменной 5c(*i, х2, .. .) = -тгг-ф(*1, *2> •••)• ох. Символически этот оператор записывается как F = — dxt' Операторы дифференцирования будут встречаться особенно ча- часто. Поэтому мы введем для них специальное наименование дифференциальных операторов. Оператор F может также озна- означать умножение на какую-либо величину, возведение в степень и т. д. Оператор независимой переменной х определим как умноже* ние на эту переменную Х = *ф. В операторном виде может быть представлено также и инте- интегральное соотношение между функциями ф и %: dl = F<p. A5,2) Функция K(xf Ь) носит название ядра интегрального опера- оператора F. Подчеркнем, что мы и раньше пользовались дифференциаль- дифференциальными операторами — оператором V —'•^"+/77+*"^"» опе~ д2 д2 д2 ратором Лапласа А = -^2"+ -^р-+ -^г- и Другими. Определим теперь линейный оператор F как такой оператор, для которого выполнены равенства A5,3) A5,4) где С — произвольная постоянная. Отсюда следует, что F (С,ф! + С2ф2) = dFtfx + С2Рф2, A5,5)
3 15] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 69 где Си Сг — произвольные постоянные. Очевидно, что перечис- перечисленные выше операторы являлись линейными операторами. В квантовой механике по причинам, ясным из дальнейшего, мы будем иметь дело исключительно с линейными операторами. Все дальнейшее будет относиться только к линейным опера- операторам. Комбинируя два заданных оператора F и R, можно опреде- определить их сумму и произведение. Под суммой операторов F и R мы будем понимать оператор G, определенный соотношением G = F + R, 1 ~ ~ 1 A5,6) Под произведением двух операторов F и R будем понимать оператор L = FR, заключающийся в последовательном примене- применении операторов R и F ?ф = /Ч#Ф). A5,7) Если же сначала применяется оператор F, а затем оператор R, то их произведением будет оператор U = RF L'<? = R(h). A5,8) Заметим, что операторы L и L7, вообще говоря, не совпадают между собой, т. е. произведение операторов существенно зави-* сит от порядка сомножителей. В соответствии с этим алгебра операторов — это алгебра некоммутирующих величин. Два опе- оператора называются коммутирующими между собой, сели произ- произведение операторов не зависит от порядка сомножителей, и не- коммутирующими в обратном случае. В качестве примера най- найдем произведение оператора дифференцирования по х на опера- оператор умножения на х при обоих порядках сомножителей, т. е< положим Оператор произведения L будет равен в соответствии с A5,7) Найдем теперь оператор U = RF:
70 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III1 Мы видим, следовательно, что в этом случае оператор V равен и не совпадает с оператором L. Таким образом, операторы L и L' не коммутируют. Используя полученные выражения для one* раторов L и Z/, мы можем написать д д * дх Х Х дх "" 1# Стоящую в этом операторном соотношении единицу есте- естественно назвать единичным оператором. Если бы в качестве оператора F мы взяли оператор умножения на какую-либо дру- другую независимую переменную, скажем на у, то оказалось бы„ д что операторы -г— и у коммутируют Для некоторых операторов оказывается выполненным соотно- соотношение FR=-RF. A5,Ю> В этом случае операторы F и R называются антикоммутирую- щими. Оператор, равный FR—RF, мы будем называть комму- коммутатором операторов F и R и обозначать при помощи волнистых скобок, т. е. FR-RF = {Ft R} A5,11) Данному оператору F можно сопоставить обратный опера* тор F~K Обратный оператор определяется соотношениями f"lF^ = ^y FF"l^ = ^ или FF~l = F-lF=\. A5,12) Если F — некоторый дифференциальный оператор, то опера- оператор jF, обратный к данному, имеет вид интегрального операто* ра. Действительно, предположим, что имеет место соотношение Ф(х). A5,13) Тогда, действуя на правую и левую части этого равенства опе- оператором F~ly получим ?1 A5,14)
4 16] СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ФУНКЦИИ 71 С другой стороны, соотношение A5,14) можно написать в виде /A5,15) где функция G(x, х')> называемая функцией Грина уравнения {15,13), удовлетворяет соотношению FG{x,' х') = Ь{х-х'). A5,16) Действительно, если мы подействуем на правую и левую части равенства A5,15) оператором F> то при условии A5,16) мы опять придем к соотношению A5,13). Сравнивая A5,14) и A5,15), мы видим, что функция Грина G(x> x') является ядром интеграль- интегрального оператора F~l. Из уравнения A5,16) функция Грина G(xy x') определяется неоднозначно. Для однозначного опреде- определения нужно задать еще некоторые условия типа граничных ус- условий. Соотношение A5,13) можно рассматривать как некоторое уравнение относительно функции ty{x) с заданной функцией <р(х), решение которого дается формулой A5,15). Следует толь- только иметь в виду, что для получения общего решения мы должны добавить к A5,15) общее решение tyo(x) однородного уравнения Тогда имеем ¦ (х) -*)(*)+ J G (х, *') ф (*') dx'. A5,17) Найденное соотношение понадобится нам в дальнейшем. § 16. Собственные значения и собственные функции операторов Рассмотрим операторное соотношение Л|) = А1). A6,1) Соотношение A6,1) означает, что при применении оператора F к функции г|) снова получается функция -ф, умноженная на не- некоторую постоянную F. Совершенно очевидно, что при данном виде оператора F соотношению A6,1) может удовлетворять от- отнюдь не всякая функция г|э. Иными словами, соотношение A6,1) является уравнением. Вид функции г|э может быть получен пу- путем решения уравнения A6,1). Если оператор F является линей- линейным дифференциальным оператором, то уравнение A6,1) будет дифференциальным уравнением. Поскольку из вида уравнения
72 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. ГII сразу ясно, что г|э = 0 является его тривиальным решением, A6,1) представляет линейное однородное дифференциальное уравнение. Исследование таких линейных однородных уравне- уравнений является важнейшей задачей теории операторов. В дальнейшем нас будут интересовать не любые операторы F и функции -ф, а лишь функции, удовлетворяющие определенным условиям: 1) функция i|) должна существовать во всей области изме- изменения независимых переменных. Например, в случае декартовых координат, в области — оо<лс<оо, — оо < г/ < оо, — со< < z < оо; 2) в области существования функция if» должна быть конеч- конечной и непрерывной, вместе со своей первой производной; за иск- исключением, может быть, особых точек; 3) функция г|э должна быть однозначна. Совокупность условий 1)—3) мы будем именовать стандарт- стандартными условиями. Оказывается, что уравнение A6,1), вообще говоря, имеет решения, отличные от тривиального и удовлетво- удовлетворяющие стандартным условиям не при всех значениях парамет- параметра Fy а лишь при некоторых избранных его значениях. Избран- Избранные значения F, при которых существуют нетривиальные реше- решения уравнения A6,1), именуются собственными значениями оператора F, а соответствующие им решения уравнения A6,1) — собственными функциями оператора F. Приведем прежде всего знакомые уже нам задачи о собст- собственных функциях и собственных значениях. 1) При рассмотрении задачи о движении частицы в потен- потенциальной яме мы решали уравнение A6,1) с дифференциаль- «*ч /"/2 ным оператором F = — -j-?. Граничные условия приводили к собственным числам (8,5) и собственным функциям (8,7) опера- оператора F. 2) Если при том же виде оператора мы не требуем обраще- обращения i|? в нуль на границах промежутка @,/), то решения (8,2) будут иметь вид Если к2 > 0, то при всех значениях х функция \|э конечна, так что решение удовлетворяет стандартным условиям. При отрицав тельных к2 ф = Ае~ш + Векх, где k = Ы, решений, удовлетворяющих стандартным условиям, не суще- существует.
§ 17] ЭРМИТОВЫ ОПЕРАТОРЫ 73 3) В задаче об осцилляторе мы рассматривали решение уравнения A6,1) для оператора (см. A0,3)) 2Е Задача имела решения при F = -^ = 2п + 1. Из приведенных примеров ясно, что совокупность собствен* ных значений оператора, которую мы будем именовать его спек- спектром, может быть как дискретной (пример 1 и 3), так и непре- непрерывной (пример 2). В первом случае мы будем именовать спектр дискретным, во втором — непрерывным или сплошным. Можно доказать, что собственные функции, отвечающие дискретному спектру собственных значений, — квадратично интегрируемы, т. е. интеграл [l^pdV сходится. Собственные функции, отве- отвечающие сплошному спектру собственных значений, — квадра- квадратично неинтегрируемы. Если каждому собственному значению оператора принадлежит одна и только одна собственная функция i|), спектр носит название невырожденного. Если, на- напротив, одному собственному значению F отвечает несколько, например s различных собственных функций, то данное соб- собственное значение называют вырожденным с кратностью выро- вырождения s. Приведенные примеры важны в том отношении, что они про- проясняют наш интерес к теории операторов. Задача о нахождении решения уравнения Шредингера представляет частный случай задачи о собственных функциях операторов определенного вида. Прежде чем от этого эвристического рассуждения перейти к установлению более полной связи между понятиями кванто- квантовой механики и теорией линейных операторов, необходимо еще рассмотреть некоторые важные свойства операторов определен-. ного класса. § 17. Эрмитовы операторы Собственные значения F в операторном уравнении A6,1) мо- могут быть, вообще говоря, комплексными. Нас, однако, будут ин- интересовать лишь такие уравнения, которые приводят только к вещественным собственным значениям. Оказывается, что суще- существует класс операторов, которые могут обладать только веще- вещественными собственными значениями. Такие операторы носят название эрмитовых или самосопряженных. Каждому линейно- линейному оператору F можно сопоставить некоторый другой оператор F+, который мы будем называть оператором, сопряженным к данному, или эрмитово сопряженным. Сопряженный оператор
74 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. ИГ определяется условием J V/%dV=j%(Р+%УdV. A7,1> Здесь, как всегда, звездочкой обозначены комплексно сопряжен- сопряженные величины. Интегрирование в A7,1) ведется по всей области изменения независимых переменных. Через dV мы обозначили элемент объема этой области. Функции \|)i, грг должны удовлетворять необходимым требо- требованиям для сходимости интегралов в A7,1). Кроме того, они должны удовлетворять некоторым граничным условиям, кото- которые обычно сводятся к требованию, чтобы функции i|?i и грг об- обращались в нуль на бесконечности. В остальном же функции ifi и of>2 достаточно произвольны. Если оператор F совпадает са своим сопряженным оператором F+ = F> то такой оператор на* зывают эрмитовым или самосопряженным. Соотношение A7,1) в этом случае имеет вид J ^{F% dV = J %F% dV. Здесь мы через F* обозначили оператор, определяемый соотно* шением В качестве примера найдем оператор, сопряженный к опера- оператору дифференцирования F =-j^- Полагая, что функции -фь ip* обращаются в нуль на бесконечности, получаем, производя а A7,1) интегрирование по частям: Сравнивая с A7,1), находим оператор Р+: r dx ' Мы видим, что оператор Р+ в данном случае не совпадает с one* ратором F, т. е. оператор дифференцирования не является само* сопряженным. Если, однако, в качестве оператора F взять опе- оператор i-fa-* T0 легко видеть, что такой оператор уже будет эрмитовым. Действительно, в этом случае имеем, интегрируя па частям:
<§ 171 ЭРМИТОВЫ ОПЕРАТОРЫ 75 и соотношение A7,2) теперь выполняется. Отсюда следует, что оператор F = / -т— эрмитов. Определим еще оператор F, который называется оператором, транспонированным с исходным оператором F: J tf/% dV = J */*! dV. A7,3) Сравнивая A7,3) с A7,1), получаем F+ = F*. Найдем далее оператор L+, сопряженный оператору L, яв- являющемуся произведением двух операторов L = FR. Из опре-» деления A7,1) имеем J ¦;? (#Ч>2) dV = J (Ь2) (F+%)* dV. Поменяем функции (/^фг) и (^+ф1) местами. Тогда получим J ^\FR% dV = J (F%y R% dV. Используем, далее, опять соотношение A7,1) J ^\FR% dV=\% (R+ (F+%) У dV. Из этого выражения получаем оператор L+ = (FR) + + = R+F+. A7,4) Мы видим, что оператор, сопряженный произведению, равен произведению сопряженных операторов, взятых, однако, в об- обратном порядке. Таким образом, если операторы F и R само- самосопряженные, т. е. F+ = F, R+ = R, то их произведение будет самосопряженным оператором только в том случае, если они коммутируют. Действительно, при этих условиях имеем = RF = FR. A7,5) Так как каждый оператор заведомо коммутирует сам с со- собой, то из A7,5) следует, что если оператор F эрмитов, то эрми- эрмитовым будет и оператор F2 = FF, а также вообще оператор Fn = *= F >F ... F, где п — целое положительное число. п Перейдем теперь к доказательству основной теоремы о ве- вещественности собственных значений эрмитовых операторов.
76 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III Для этого перепишем еще раз уравнение A6,1), предположив для конкретности, что оператор F обладает дискретным спектром Умножив уравнение слева на ф* и интегрируя, получаем Если оператор F эрмитов, то легко видеть, что собственные значения Fn, определенные в A6,1), вещественны. Действитель- Действительно, учитывая условия эрмитовости A7,2), находим г п с Г п. J \^n?dV Таким образом, мы доказали, что эрмитовы (самосопряженные) операторы имеют только действительные собственные значения. § 18. Ортогональность и нормировка собственных функций эрмитовых операторов Собственные функции линейного эрмитового оператора F, отвечающие различным собственным значениям Fn и Fm, взаим- взаимно ортогональны, т. е. удовлетворяют соотношению Пфп). A8,1) Действительно, функции tyn и ty*m удовлетворяют уравне- уравнениям A6,1) Поскольку оператор F эрмитов, имеем \VjbdV=jqnH*mdV. A8,3) Используя уравнения A8,2), перепишем равенство A8,3) в виде F Отсюда следует:
§ 18] ОРТОГОНАЛЬНОСТЬ И НОРМИРОВКА 77 Так как по предположению Fm ф Fn, то мы получаем m%dV = b, A8,5) что и доказывает наше утверждение. Так как собственные функции удовлетворяют однородному линейному уравнению, то они определены с точностью до произ- произвольной постоянной. Имея в виду дальнейшее, мы будем нормировать собствен- собственные функции дискретного спектра условием )>„^=1. A8,6) Собственные функции, удовлетворяющие соотношению A8,6), мы будем именовать нормированными на единицу. Формулы A8,1) и A8,6) объединим в одну )ndV = bnm, A8,7) где 6nm — символ Кронекера: 1 п = ту О пфт. Рассмотрим теперь случай вырожденных состояний, когда одному и тому же собственному значению Fn принадлежит не- несколько собственных функций ipnU ipn2, ..., ipns, где 5 — крат- кратность вырождения. В качестве решения уравнения A8,2), отвечающего собст- собственному значению Fn, можно взять произвольные линейные ком- комбинации этих функций i|/«. = 2 а. яЬ . A8 8) Соответствующим подбором коэффициентов а^г можно добиться взаимной ортогональности собственных функций ty'nk, принадле- принадлежащих одному и тому же собственному значению Fn. Наклады- Накладывая также условие нормировки, получаем • dV = bu. A8,9) Условие A8,9) еще не определяет полностью значения коэффи- коэффициентов akr. Действительно, если функции \рПк уже ортогональ- ортогональны между собой и мы произвели преобразование A8,8), то орто- ортогональность сохранится, если г=1
78 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III Таким образом, в выборе коэффициентов а,ы остается еще известный произвол. Рассмотрим, наконец, волновые функции сплошного спектра. Для волновых функций сплошного спектра i|)f(#) условие орто- ортогональности доказывается аналогично A8,3) — A8,5): A8,11) С другой стороны, условие нормировки уже не может быть записано в виде A8,6), так как волновые функции сплошного спектра квадратично не интегрируемы. Интеграл Г |^y?|2dV для них расходится. Эта расходимость связана с тем, что собствен- собственные функции сплошного спектра не обращаются в нуль на бес- бесконечности. Собственные функции сплошного спектра удобно нормировать на 6-функцию Дирака (см. приложение III), так что условия ортогональности и нормировки могут быть выра- выражены аналогично A8,7) F'). A8,12) Нормировка на б-функцию, конечно, не является единственно возможной. Ниже мы встретимся и с другими способами нор- нормировки собственных функций сплошного спектра (см., напри- например, §26). § 19. Разложение по собственным функциям В предыдущем параграфе мы доказали, что система соб- собственных функций произвольного линейного самосопряженного оператора является системой ортогональных функций. Оказьь вается, что такая система функций является полной. Произволь- Произвольную непрерывную функцию, определенную в той же области изменения независимых переменных и удовлетворяющую широ- широкому классу условий, можно разложить по этой системе соб^ ственных функций1). Мы приведем здесь сперва условия полноты системы соб- собственных функций для случая оператора F, обладающего дис- дискретным спектром. Напишем разложение функции я|э в ряд по собственным функциям г|?п, предполагая последние нормирован- нормированными на единицу, в виде Ф(*)-2 *«*»(*). A9,1) !) В. А. Смирнов, Курс высшей математики, Физматгиз, 1958, т. IV, стр. 133.
§ 19] РАЗЛОЖЕНИЕ ПО СОБСТВЕННЫМ ФУНКЦИЯМ 79 Амплитуды сп можно определить, воспользовавшись ортого- ортогональностью собственных функций. Умножая A9,1) на ^*т{х) и интегрируя по всей области изменения независимых переменных, получаем J С (х) * (х) dV = 2 сп J *; (*) % (х) dV. п При этом мы изменили порядок суммирования и интегрирова- интегрирования. В силу ортогональности собственных функций A8,7), из всех членов суммы, стоящей в правой части равенства, отличен от нуля только член сд = /п. Соответственно имеем A9,2) Подставляя это выражение в A9,1) и снова изменяя порядок суммирования и интегрирования, получаем )'. A9,3) Для того чтобы это выражение было справедливым для про-* извольной непрерывной функции я|)(*), необходимо выполнение равенства Соотношение A9,4) выражает условие полноты системы собст* венных функций г|)п(*). Если оператор F обладает сплошным спектром, то разложение функции ty{x) по его собственным функциям представится уже не суммой, а интегралом A9,5) Амплитуды c(F) находятся так же, как и в случае дискрет- дискретного спектра. Умножая левую и правую части уравнения A9,5) на функцию i|^.,(#) и интегрируя по всей области изменения не- независимых переменных, находим J Чу (х) ¦ (х) dV = J с (F) dF J ^ (х) ^ (х) dV. Предполагая, что собственные функции ^(л:) нормированы на б-функцию, окончательно получаем A9,6)
80 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. Ш С частным случаем подобного разложения (разложения по плоским волнам) мы уже встречались в § 3. Условие полноты в случае сплошного спектра записывается аналогично A9,4) b(x-xT). A9.7) § 20. Квантовомеханические величины и операторы Мы можем теперь перейти к обсуждению основного посту- постулата квантовой механики, устанавливающего связь между реальными физическими величинами, характеризующими свой- свойства квантовомеханических систем, и математическим аппара- аппаратом квантовой механики. В классической механике состояние системы определяется совокупностью координат и импульсов (или величин, выражаю- выражающихся ч?р§з них), входящих в уравнение движения. Все вели- велиртзщ р ) чины, характеризующие состояние системы, называют механи- механическими йеличинами. В квантовой механике величины, играющие аналогичную роль будут называться квантовомеханическими величинами. Их также часто именуют физическими величинами ил.: динамическими переменными. На примерах, разобранных выше, были выяснены некоторые свойства квантовых систем. К ним относятся в первую очередь: 1) наличие соотношения неопределенности между значения- значениями канонически сопряженных физических величин (таких, как, например, координата и импульс); 2) существование дискретного и непрерывного спектров зна- значений физических величин (например, энергии квантового ос- осциллятора и свободной частицы); 3) существование суперпозиции квантовых состояний (на- (например, суперпозиции состояний свободной частицы); 4) непрерывный переход от понятий квантовой механики к понятиям классической механики при переходе к системам, в которых можно считать постоянную Планка бесконечно малой величиной, а квантовые числа — бесконечно большими (прин- (принцип соответствия). Первая и вторая особенности квантовомеханических величин как раз соответствуют свойствам линейных операторов — их не* коммутативности и существованию спектра собственных значе- значений. Поэтому естественно высказать следующее основное допу* щение: «каждой квантовомеханической величине F соответствует некоторый линейный эрмитовый оператор F. Спектр собствен- собственных значений оператора F представляет спектр возможных (из-» меряемых) значений этой величины»*
§ 20] КВАНТОВОМЕХАНИЧЕСКИЕ ВЕЛИЧИНЫ И ОПЕРАТОРЫ 81 Собственная функция ^f(x) оператора F представляет вол- волновую функцию системы в состоянии, в котором величина, изо- изображаемая оператором F> имеет данное определенное значе- значение F. Требование эрмитовости оператора связано, очевидно, с ве- вещественностью значений реальных физических величин, тогда как требование линейности связано с принципом суперпозиции. Совершенно ясно, что высказанное утверждение приобретет конкретный смысл лишь после того, как оно будет дополнено указанием на то, как именно может быть найден оператор, отвечающий данной квантовомеханической величине. Если бы такой рецепт был известен, то сформулированный постулат по- позволил бы определить спектр возможных значений этой вели- величины. Справедливость основного постулата может быть устано- установлена только согласием между выводами квантовой механики и опытом. Для определения вида линейных операторов, отвечающих определенным квантовомеханическим величинам — квантовоме- ханических операторов, необходимо воспользоваться принципом соответствия. Именно естественно допустить, что между кванто- вомеханическими операторами, описывающими движение частиц в квантовой механике, имеют место те же соотношения, что и между их «оригиналами» — величинами классической механики. Так, например, оператор полной энергии Н связан с оператора- операторами кинетической энергии f и потенциальной энергии 0 соотно- соотношением H = T + U. B0,1) В свою очередь оператор Т равен ? = ?-, B0,2) где р— оператор импульса, и т. п. Этими соотношениями мы, в сущности, уже пользовались в предыдущей главе при получении уравнения Шредингера. Если квантовомеханические операторы связаны между собой обыч- обычными соотношениями классической механики, то достаточно по- получить выражение для одного оператора, чтобы построить затем полную систему операторов квантовой механики. Предельный переход к классической механике при й->0 будет обеспечен ав- автоматически, если только исходный оператор выбран правильно, с учетом этого условия. Такой подход представляется вполне правдоподобным, хотя и не строгим. В дальнейшем будет изло- изложен другой, более последовательный метод построения опера- операторов*
82 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III В качестве исходных операторов можно выбрать операторы координаты и импульса. Оператор координаты г, как и всякий оператор, отвечающий независимой переменной, сводится к умножению на эту перемен-* ную, т. е, х = х; р = у; z = z. B0,3) Для установления вида оператора импульса р можно вос- воспользоваться тем, что свободная частица описывается уравне- уравнением Шредингера F,5) С другой стороны, это уравнение можно в силу сказанного выше написать как k Отсюда следует, что операторы рх, руу pz могут быть выбраны в виде Таким образом, оператор компоненты импульса сводится к диф- дифференцированию по соответствующей координате. Множитель i обеспечивает эрмитовость оператора р. Прежде чем перейти к построению операторов, отвечающих квантовомеханическим ве- величинам, более последовательным методом, рассмотрим два принципиальных вопроса: вопрос о смысле собственных функ- функций операторов и о возможности одновременного измерения двух квантовомеханических величин. § 21. Волновая функция и вероятность результатов измерений Пусть F представляет некоторый квантовомеханический опе- оператор, для которого можно написать: Для определенности будем считать, что оператор F имеет дис- дискретный спектр собственных значений Fn и каждому из них от- отвечает одна собственная функция -фп (спектр невырожденный). Поскольку собственные функции -фп образуют полную систему функций, волновую функцию г|) можно разложить в ряд *=2сЛ1|>||. B1,1)
$ 21] ВОЛНОВАЯ ФУНКЦИЯ И ВЕРОЯТНОСТЬ 83 На основании принципа суперпозиции мы можем заключить, что состояние системы, описываемое волновой функцией г|э, может быть представлено в виде суперпозиции состояний с определен- определенными значениями Fn физической величины F. Амплитуда ст в разложении B1,1) показывает, с каким ве- весом в состоянии -ф представлено состояние \f>m. Иными словами, амплитуда ст характеризует вероятность того, что при измере- измерениях величины F, производимых над системой, находящейся в состоянии с волновой функцией г|), будет обнаружено значение, равное Fm. В квантовой механике принимается, что указанная вероятность равна квадрату модуля амплитуды разложения \ст\2. Таким образом, если мы хотим найти вероятность того, что при измерениях, производимых над системой в состоянии ф, для физической величины F будет найдено значение Fm, следует разложить волновую функцию г|) по собственным функциям опе- оператора F. Квадрат модуля соответствующей амплитуды разло- разложения \ст\2 дает искомую вероятность. Если величина F изме- изменяется непрерывно (сплошной спектр), то можно говорить о ве- вероятности того, что при измерении будет получено значение Т7, лежащее в интервале между F и F + dF. Соответствующая ве- вероятность дается выражением dW = \c(F)\2dF. B1,2) Так, при разложении -ф по плоским волнам (см. § 3) квадрат модуля соответствующей амплитуды разложения дает вероят- вероятность того, что при измерении получится некоторое заданное значение импульса. Вероятности измерений заданных значений величины Z7, оп^ ределенные, как это указано выше, удовлетворяют соотноше^ ниям: , \ B1,3) j\c(F)fdF=l ] (при условии, что волновая функция -ф является квадратично- интегрируемой, а собственные функции оператора F нормировав ны условием A8,7) или A8,12)). Докажем в виде примера последнее из этих соотношений. Пользуясь A9,5) и A9,6), получаем J c*(F)c(F)dF= J c'(F)dF J Vp = J ф(x)dV j c"(FL>;(x)dF=j$(x)г|>*(x)dV = 1. B1,4)
84 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III Совокупность амплитуд сп (или c(F) в случае сплошного спектра) полностью определяет волновую функцию \|э. Поэтому задание амплитуд разложения волновой функции по собствен- собственным функциям какого-либо оператора эквивалентно заданию самой волновой функции.. В связи с этим часто применяется следующая терминология. Волновая функция г|)(#) называется волновой функцией, задан- заданной в координатном представлении (^-представлении); совокуп- совокупность всех амплитуд c(F) называют волновой функцией в /"-представлении. В этом смысле соотношения A9,5) и A9,6) следует считать совершенно симметричными. Соотношение A9,5) выражает разложение волновой функции ф, взятой в ко- координатном представлении, по собственным функциям ^f{x) оператора /, взятым также в ^-представлении. Амплитуды раз- разложения c(F) представляют волновую функцию в /-представ- лении. С другой стороны, соотношение A9,6) выражает разло- разложение волновой функции с(/), взятой в /-представлении, по функциям ty*F(x), которые имеют смысл собственных функций оператора координаты, взятых в /-представлении (ср. D8,19)). Амплитуды разложения ty(x) представляют собой волновую функцию в ^-представлении. Мы будем говорить также, что не- некоторый оператор D задан в /-представлении, если он воздей- воздействует на функцию, заданную в /-представлении, например, Dc(F)=b(F). С этой точки зрения, сформулированное нами утверждение, что \c(F)\2dF равно вероятности обнаружить си- систему в состоянии с заданным значением /, становится почти очевидным. Действительно, \ty(x) \2dx есть вероятность того, что координата частицы лежит в интервале dx. Ввиду равноправия х- и /-представлений \c(F)\2dF естественно трактовать как ве- вероятность того, что измерение величины / приведет к ее значе- значению, лежащему в интервале между / и / + dF. § 22. Средние значения Предположим, что состояние системы описывается волновой функцией i|?(a:), которая не является собственной функцией опе- оператора /, отвечающего квантовомеханической величине /. Как мы уже выяснили выше, это означает, что в данном состоянии величина / не имеет определенного значения. При измерениях, производимых над системой, может с известной вероятностью получиться любое собственное значение /п. В связи с этим есте- естественно попытаться найти среднее значение величины / в дан- данном состоянии. Под средним мы, как всегда, понимаем матема- математическое ожидание (среднее арифметическое) данной величины.
§ 22] СРЕДНИЕ ЗНАЧЕНИЯ 85 Рассмотрим ансамбль, т. е. большое число совершенно оди- одинаковых экземпляров системы. Каждая из этих систем описьь вается одной и той же волновой функцией ф. Будем производить измерение величины F в каждой из систем. Среднее значение, полученное в совокупности этих измерений, мы и будем имено- именовать средним значением величины F. По общим формулам тео- теории вероятностей (см. § 3 ч. III) мы можем написать: F=2iWnFa, B2,1) п где Wn — вероятность получить при измерении величины F соб- ственое значение Fn. Используя выражения для вероятностей Wn, полученные нами в предыдущем параграфе, имеем для слу-> чая дискретного спектра F=%\Cn?Fn B2,2) П или, если оператор F обладает сплошным спектром, F= j\c(F)\2FdF. B2,3) Эти формулы можно преобразовать так, чтобы вместо ам- амплитуд разложения волновой функции по собственным функциям оператора F они содержали непосредственно волновую функ- функцию ty(x) (преобразовать в координатное или любое другое представление). Для определенности предположим, что опера- оператор F обладает дискретным спектром (в случае непрерывного спектра формулы преобразования выводятся аналогичным об- образом). Используя выражение для амплитуд A9,2), получаем: Р = 2 Cn°nF.n = 2 CJPH J ¦„ (X) V (X) dV. п п Так как собственные функции г|)п(*) удовлетворяют уравнению то последнее соотношение можно переписать в виде F = 2 ся J ¦•/?!>,, dV = J dV^F ^ cn%. п п Учитывая B1,1), получаем окончательно B2,4) Отметим, что это выражение должно быть написано в не- несколько более общем виде, если волновая функция -ф не
86 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III нормирована на единицу. В этом случае r • B2,5) I i|L dV Если волновая функция г|) является собственной функцией опе- оператора F А|) = Fmty, то величина F имеет вполне определенное значение, равное собственному значению Fm. При этом, как и следовало ожидать, среднее значение величины F совпадает с этим собственным значением F = Fm. Соотношение B2,4) может быть исходным при подборе опе- оператора, отвечающего данной физической величине. Так, из него сразу следует, что в координатном представлении оператор ко- координаты сводится к умножению на эту координату. Действительно, исходя из физического смысла волновой функции, мы можем написать выражение для среднего значения координаты в виде jV= j г|)*;и|) dV. B2,6) Сравнивая это выражение с B2,4), мы видим, что оператор ко- координаты х сводится к умножению на координату х. Аналогич- Аналогичным образом, если мы имеем произвольную функцию от коорди- координат U(x,y,z), то ее среднее значение дается выражением U(x, у, z) = J 11|) p U (х, у, z) dV = J г|)*[/А|) dV. B2,7) Из этого выражения следует, что оператор произвольной функ- функции от координат, взятый в координатном же представлении, сводится к умножению на эту функцию. Это, конечно, отвечает сделанному нами ранее утверждению. Вообще оператор, отве- отвечающий физической величине F, в своем собственном /"-пред- /"-представлении сводится к умножению на величину F. Это общее утверждение легко пояснить так же, как мы сделали на примерз координаты. Среднее значение величины F, полученное с по- помощью функций c(F), т. е. волновой функции в ^-представле- ^-представлении, дается формулой F = J | с (F) |2 FdF = J с* (F) Fc (F) dF. С другой стороны, общее выражение для среднего через опера-» тор F, взятый в .F-представлении, должно иметь вид = J c*(F)Fc(F)dF. Сравнивая эти выражения, мы видим, что оператор F в своем собственном представлении сводится к умножению на FA
§ 23] КОММУТАЦИЯ ОПЕРАТОРОВ 87 § 23. Коммутация операторов Одним из важнейших вопросов, возникающих в квантовой механике, является вопрос о возможности одновременного изме- измерения значений физических величин, относящихся к данной квантовомеханической системе. Для того чтобы две величины F и R могли бы иметь опре- определенные значения в некотором состоянии, описываемом волно- волновой функцией \|)n(#), эта волновая функция, очевидно, должна быть собственной функцией операторов F и R, т, е. должны од- одновременно удовлетворяться два уравнения: Юп(*)-Юп(х). Подействуем на первое уравнение оператором R, а на вто- второе — оператором F: Правые части этих уравнений равны, следовательно, равны и левые части, т. е. ИЛИ (RF-FRHn = 0. B3,2) Если общие собственные функции \|)n образуют полную си-» стему функций, то произвольную волновую функцию г|) можно разложить по этой системе функций. Действуя на функцию ком- коммутатором RF — FR, мы получим, очевидно, n = O. B3,3) Символически последнее равенство можно записать в виде RF-FR = 0. B3,4) Мы доказали таким образом, что если две квантовомехани* ческие величины могут одновременно иметь определенные зна- значения, то операторы, отвечающие им, должны коммутировать. Конечно, если эти величины имеют одновременно определенные значения только в некоторых особых состояниях (так что общие собственные функции ipn не образуют полной системы функций), то соответствующие операторы не коммутируют (см., напри- например, § 30).
88 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. Ill Можно доказать и обратную теорему: если два оператора F и R коммутируют между собой, то они будут иметь общие соб- собственные функции. Для доказательства подействуем на уравне- уравнение для собственных функций оператора F оператором R. Вос- Воспользуемся при этом тем, что операторы F и R коммутируют .между собой. Тогда получим: Мы видим, что функция г|/ = /?г|) также является собствен- собственной функцией оператора jF, принадлежащей собственному зна- значению F. Если вырождение отсутствует, то функция i|/ описы- описывает то же состояние, что и функция -ф, и, следовательно, может отличаться от *ф лишь на постоянный множитель /?, т. е. Мы доказали таким образом, что функция г|) будет одновре- одновременно собственной функцией операторов F и R. Доказательство легко обобщается и на тот случай, когда имеется вырождение. При этом, однако, не любая собственная функция оператора F или 7? будет одновременно собственной функцией обоих опе- операторов. Тем не менее для коммутирующих операторов всегда можно построить полную систему общих собственных функций. Резюмируя сказанное, мы можем утверждать: если двум квантовомеханическим величинам отвечают коммутирующие операторы, то эти величины будут одновременно иметь опре- определенные значения; если же операторы не коммутируют, то эти величины, вообще говоря, одновременно не могут иметь определенных значений, за исключением лишь особых случаев (см. §30). Поясним это одним конкретным примером. Оператор коорди- координаты х и оператор соответствующей проекции импульса рх мо- могут быть выбраны как пример некоммутирующих операторов. Отвечающие им величины х и рх, как мы знаем, одновременно (т. е. в одном и том же состоянии) не имеют определенных зна- значений. Наоборот, операторы координаты и проекции импульса на разные оси, например х и руу коммутируют между собой. Со- Соответствующие величины х и ру одновременно измеримы. Одно- Одновременно могут иметь определенные значения проекции импуль- импульса на разные оси (px,py,Pz) или координаты (xfy,z). Мы можем теперь уточнить понятие «заданное состояние си- системы» в квантовой механике. Состояние системы задано, если задана волновая функция, описывающая эту систему. Однако, мы ни при каких условиях не можем непосредственно измерить
§ 23] КОММУТАЦИЯ ОПЕРАТОРОВ 89' саму волновую функцию. Физический смысл имеет лишь квад- квадрат модуля ее, трактуемый, как соответствующая вероятность- Выход из этого кажущегося противоречия заключается в сле- следующем: когда мы говорим, что задано состояние системы, то это означает, что задано значение определенной совокупности квантовомеханических величин. Эта совокупность величин, за- задание которой полиостью определяет состояние системы, назы- называется полным набором квантовомеханических величин. В клас- классической физике, чтобы задать состояние системы в какой-то момент времени, нам требовалось задать значения всех обоб- обобщенных импульсов и обобщенных координат в этот момент вре- времени. Всего, если классическая система имеет п степеней сво- свободы, требовалось задать значения 2п переменных величин. Для микросистемы, т. е. системы, описываемой квантовой механикой, полный набор, очевидно, не может включать в себя и импульсы и координаты частиц, так как эти величины одновременно не имеют определенных значений. Для того чтобы задать состояние системы в квантовой механике, достаточно задать только коор- координаты частицы или только ее импульсы или вообще любую совокупность независимых величин,,, одновременно измеримых и число которых равно числу степеней свободы системы. Тогда волновая функция, описывающая данное состояние си- системы, будет собственной функцией операторов величин, входя- входящих в полный набор, отвечающей заданным собственным зна- значениям. Например, если система обладает тремя степенями свободы, то в качестве величин, образующих полный набор, могут быть выбраны проекции импульса рх, руу pz. Соответствующая волно- волновая функция имеет вид B,12). О состояниях, характеризуемых заданием в данный момент времени некоторого полного набора величин, говорят как о со- состояниях, описанных полным образом, или «чистых» состояниях. Этим состояниям однозначно сопоставляется соответствующая волновая функция. В данный момент времени эта волновая функция выбирается как собственная функция операторов всех величин, входящих в полный набор. Заметим, что некоторое «чистое» состояние мы получим и в том случае, если волновая функция, отвечающая этому состоянию, представлена в виде не- некоторой суперпозиции собственных функций, например в виде суперпозиции плоских волн C,3). Информацию о развитии про- процесса во времени мы получаем, решая уравнение Шредингера F,8) с данным начальным условием и определяя, таким обра- образом, волновую функцию в последующие моменты времени. Следует заметить, что помимо «чистых» состояний иногда приходится иметь дело с так называемыми «смешанными» со- состояниями (см. § 89). В этих состояниях волновая функция
90 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III системы не определена. Можно говорить лишь о вероятности Рп реализации того или иного «чистого» состояния фп (неполное описание). Если нас интересует вероятность измерения Лп-го значения величины F, то в «чистом» состоянии гр(лг) эта вероятность опре- определяется квадратом модуля |rm|2 соответствующей амплитуды разложения функции г|э по собственным функциям г|^(х) опера- оператора F 2 * (Fm) = | см f = | J * (x) С (х) dV |2. B3,5) Если система находится в «смешанном» состоянии, то для полу- получения искомой вероятности мы должны разложить по функциям {) волновые функции уп{х) Ф/г (X) = 2 k где Cj B3,6) Вероятность измерения в состоянии фп Fm-ro значения величи- величины F дается квадратом модуля амплитуды разложения cmn« В свою очередь состояние фп (х) реализуется с вероятностью Рп« Таким образом, окончательно, но теореме умножения вероятно- вероятностей, получаем: r(Fm) = 2PJcmnf. B3,7) п Для того чтобы сравнить полученные результаты, предста- представим волновую функцию г|) в виде суперпозиции функций <рп{х) п Тогда, как легко видеть из B3,5) и B3,6), ст=%Ьпстп. B3,8) Подставляя это значение в выражение B3,5), получаем W (Fm) = J ЬпСтп 2 = S I Ьп I' I Cmn P + у S S bnbk0mnCmk, B3,9) n ¦ n n ф k причем 2 2
§ 24] НЕРАВЕНСТВА ГЕЙЗЕНБЕРГА 91 Мы видим, что полученное выражение отличается от резуль- результата, даваемого формулой B3,7), наличием двойной суммы, ко- которая выражает своеобразную интерференцию между состоя- состояниями. В случае «смешанных» состояний такая интерференция отсутствует. Все приведенные рассуждения непосредственно обобщаются и на случай сплошного спектра. § 24. Неравенства Гейзенберга Мы выяснили в предыдущем параграфе условия, при кото- которых возможно одновременное измерение двух физических вели- величин. Предположим теперь, что две физические величины F и R одновременно не имеют определенных значений. Тогда операто- операторы, отвечающие этим величинам F и /?, не коммутируют между собой. Предположим, что имеет место соотношение FR-RF = iB, B4,1) где В, как это следует из A7,4), некоторый эрмитов оператор* Представляет интерес определить в общем виде, каково ми- минимально возможное значение произведения флуктуации дан- данных величин. За меру, характеризующую отклонения отдельных результатов измерения величин F и R от их средних значений, выберем среднеквадратичные отклонения (дисперсии) AF2 и ДЯ2, где Для среднеквадратичных отклонений соответственно имеем ~ ^~ _~ J B4,2) А/?2 = (/? — /?J = /?2 — /?2. Не ограничивая общности, мы можем положить F = 0 и Л = О (иными словами, понимать под F и R отклонение этих ве- величин от их среднего значения), Рассмотрим интеграл / (ее) = J | (aF - iR) \|) |2 dV. B4,3) Здесь г|э — волновая функция, интегрирование производится по всей области изменения независимых переменных, а а — произ- произвольный вещественный параметр. Интеграл B4,3) является не отрицательным /(а) ^ 0. Перепишем его в виде / (а) = J (aF - iR) *ф • (aF* + iR*)ty* dV.
92 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III Воспользовавшись самосопряженностью операторов F и R, по- получаем /(а)= J q>* = J г|>* (а2?2 - а/ (F R - ДР) + Я Учитывая B4,1) и используя выражение B2,4) для среднего значения, имеем Условие того, что этот квадратичный по а трехчлен не отрица-» телен, запишется в виде 4ДЯД#2>52 B4,4) или ^\Bl B4,5) Формула B4,5) дает искомое соотношение между погрешностя- погрешностями д/1 и Д#. Она устанавливает минимально возможное значе* ние произведения этих погрешностей. Рассмотрим частный случай, взяв за величины F и R соот- соответственно рх и х. Тогда из B0,3) и B0,4) следует В = —й, и мы имеем: УЩУ*Ш>^. B4,6) Таким образом, соотношение неопределенности B4,5) имеет вполне общий характер. Соотношение неопределенности для ко- координаты и импульса является частным случаем соотношения B4,5). Все сопряженные квантовомеханические величины не могут •быть измерены одновременно. Минимальные неточности в их значениях при одновременном измерении связаны с величиной В. Наоборот, коммутирующие между собой квантовомеханиче* ские величины, для которых В = 0, могут быть измерены одно-" временно с произвольной степенью точности. § 25. Скобки Пуассона Мы рассмотрели в § 20 один из возможных методов нахо- нахождения операторов, изображающих те или иные физические ве-» личины. Более последовательно этот вопрос был рассмотрен Дираком. Дирак предположил, что в квантовой механике, так же, как и в классической, можно ввести понятие скобок Пуас-
§ 25] СКОБКИ ПУАССОНА 93 сона1). Так, если двум классическим величинам F, R отвечает скобка Пуассона, F dR dF dR\ то изображающим эти величины операторам F> R отвечает кван-» товая скобка Пуассона [F, R]. Далее предполагалось, что свой- свойства квантовых скобок Пуассона в точности соответствуют свой- свойствам классических скобок Пуассона с тем лишь условием, что для квантовых скобок существен порядок сомножителей. Выпи- Выпишем свойства скобок Пуассона: [Л ?] = -[?,?], B5,1) [Л С] = 0, B5,2) где С — число. [Л + F2y R] = [Fl9 R] + [F2y R], B5,3) [F, Ri + R2] = lh Ri] + lh hi B5,4) [FiK R] = lK R] h + Л [F* R], B5,5) IF, R{R2] = [Л R{] R2 + Ri [F, R2], B5,6) IF» lh h] ] + [F3, [Flt F2] ] + [F2 [F3y Fi\ ] - 0. B5,7) Выбор скобок Пуассона как основы для построения системы квантовомеханических операторов связан с тем, что они, как мы увидим, непосредственно выражаются через коммутаторы соот- соответствующих операторов. Последняя комбинация операторов является основой для их физического толкования. Рассмотрим скобку Пуассона [F\F2, R\R2], для вычисления которой можно воспользоваться выражениями B5,5) и B5,6)- Соответственно получим: ihh, rA]=if» RA]F2+Fiih rA] = &h x[F2t Ri]R2 + FiRi[F29 R2] h R2]F2. г) О скобках Пуассона в классической механике см. Л. Д. Ландау и Е. М. Лифшиц, Механика, Физматгиз, 1958, стр. 169; Г, Голдстейн, Классическая механика, Гостехиздаг, 1957, стр.* 274,
94 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III Приравнивая оба полученных результата, находим Поскольку последнее равенство должно удовлетворяться то- тождественно, имеем: где С — некоторая вещественная постоянная. Вещественность С следует из того, что скобка Пуассона двух действительных переменных также должна быть веществен- вещественной. Так, если F+ = F, R+ = Ry то должно быть [F, R]+ = [F, R], Однако [F9 R]+ = - iC (FR - RF)+ = - iC* (RF - FR) -r-~- [Ft R] и поэтому С* = С. Из классической теории скобок Пуассона следует, что постоянная С имеет размерность \/эрг сек. Ее чис- числовое значение может быть определено только путем сравнения выводов теории с опытными данными. Оно оказалось равным •г-. Окончательно имеем (FR-RF)=^[F, R]. B5,8) При переходе к классической механике1), т. е. при й-^ мутатор {FR}, как это и следовало ожидать, обращается в нуль. Естественно допустить, что, хотя бы в простейших случаях, сами квантовые скобки Пуассона имеют те же значения, что и клас« сические скобки. Для канонически сопряженных переменных координат и импульсов в классической механике имеем [ft, Xk] = *tk (Л * = 1, 2, 3). B5,9) Здесь и в дальнейшем мы используем такие обозначения} *!=*> Pl = Px> *2 = У> Р2 = Ру> *3 = *, РЗ = Рг- Такие же выражения можно написать для квантовых операто- операторов координаты и проекции импульса. Поэтому коммутаторы J) Подробнее см. гл. V.
§ 26] ОПЕРАТОРЫ И СОБСТВЕННЫЕ ФУНКЦИИ 95 соответствующих величин приобретают вид: PiPk — PkPt = О, Pi*k~*kPi~Tbik V, k=l, 2, 3). B5,10) Мы воспользуемся этими равенствами для определения операто- операторов координаты и импульса. § 26. Операторы и собственные функции координаты и импульса Начнем с установления вида операторов в координатном представлении1). В этом представлении волновая функция, ха- характеризующая состояние частицы, зависит от ее координат г|? (х, уу г). Координаты х, у> z являются независимыми перемен- переменными. Поэтому отвечающие им операторы, в соответствии с вы- выводами § 20 и § 22, сводятся к умножению на эти координаты *, = *, (/=1,2,3). B6,1) Перестановочные соотношения B5,10) перепишем в виде (Pk*k ~ xrfk) ф = у Ф (* = 1, 2, 3), B6,2) (РЛ-**Р*)Ф = О Aфк), B6,3) iPtPk-PkPi)^ = O (/,?=1,2, 3). B6,4) Уравнениям B6,2) — B6,4) можно удовлетворить произвольной функцией -ф, положив Й д » где a(xi, X2, х$)—произвольная вещественная функция. Веще-' ственность а требуется для эрмитовости оператора pk. Функцию а можно без ограничения общности результата положить рав- равной нулю. Действительно, действие оператора B6,5) на произ- произвольную функцию г|э переводит ее в функцию г|/= — -^-+ i axk + -^-Ф- С другой стороны, если мы подействуем на функцию eh а<ф оператором у-^г~> то получим функцию ен аг|/. Следо- к вательно, переход от оператора B6,5) к оператору -г-?— l axk См. В. А. Ф о к, Начала квантовой механики, Кубуч, 1932, стр. 32.
96 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III эквивалентен переходу от волновой функции -ф к функции h так как * G1^+15-)* ******* ^-71^* ¦'• Как мы увидим, в § 46 волновая функция всегда определена с точностью до некоторого так называемого унитарного пре- преобразования, частным случаем которого является преобразова- преобразование B6,6). Операторы B6,5) и операторы fe=7F (k = xt у, г) имеют одинаковый спектр собственных значений. Поэтому, не ограничивая общности, можно вместо операторов B6,5) поль- пользоваться операторами для проекций импульса, имеющими в ко- координатном представлении вид (ср. § 20) А Ь д Ь д Ь д Р P P или, в векторной форме, P = yV, B6,8) где V — оператор градиента. Воспользуемся теперь не координатным, а импульсным пред- представлением, в котором волновая функция зависит от трех проек- проекций импульса: pXi pyi pz. Отвечающие им операторы сводятся к умножению на величины рх> ру, рг. Оператор координаты в этом представлении находится на основании тех же соотношений коммутации и оказывается равным *-й1?:; y=ihi^' i=ib-^' B6-9) или Пользуясь B6,7), легко установить перестановочные соотно- соотношения оператора р и произвольной функции U{x,y,z) VU B6,10)
§ 26] ОПЕРАТОРЫ И СОБСТВЕННЫЕ ФУНКЦИИ 97 Аналогичным образом вычисляется коммутация оператора г с произвольной функцией f(px, ру, рг) rf^fr^ih^. B6,11) Уравнения для собственных функций и собственных значе- значений операторов рх, ру, рг имеют вид Выпишем решение первого уравнения: где a(y,z)—произвольная функция. Аналогичные решения имеются и для • функций г|)р и г|эр . Функции г|эр , г|)р , г|)р удов- летворяют необходимым требованиям, в частности условию конечности (см. § 16) при любых вещественных значениях рх, ру, pz. Таким образом, оператор импульса имеет сплошной спектр собственных значений. Волновая функция % = Ае*рг, B6,13) где А — постоянная, является собственной функцией операторов Рх, Ру, Pz и описывает состояние с заданным импульсом р. В та- таком состоянии может находиться свободно двигающаяся части- частица. Этот вывод находится в полном соответствии с результа- результатом § 2. Постоянная А определяется из условия нормировки. Так как оператор импульса обладает сплошным спектром, то его соб- собственные функции удобно нормировать на б-функцию. Найдем сначала нормировочный коэффициент А в случае одномерного движения. Полагая J ф* \|у dx=*b{px — p'x) и учитывая (III, 5), полу- получаем Л = п-э так что окончательно e*V- B6'14) В трехмерном случае для волновой функции B6, 13) соответ- соответственно имеем ¦'-¦cdii*e>- B6'15) 4 В. Г. Левич и др., том II
98 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ (ГЛ. III Иногда оказывается более удобным другой способ норми- нормировки плоских волн, именуемый нормировкой в «ящике». Зада- Зададим волновую функцию в произвольно большом, но конечном объеме V. В качестве нормировочного объема выберем куб с длиной ребра L и центром в начале координат. Потребуем, чтобы на стенках куба волновые функции B6,12) удовлетво* ряли условию периодичности, т. е. в соответствующих точках противоположных граней куба волновые функции принимали б?1 одинаковые значения. При этих условиях вектор импульса уке не изменяется непрерывным образом, а пробегает дискрет- дискретный набор значений 2лЬ 2пЬ Рх = — пх\ Ру = "Г" nv* рг где nXi ny% nz — положительные или отрицательные целые чис- числа, включая нуль. Выбирая ребро куба L достаточно большим, можно сделать расстояние между соседними собственными зна- значениями вектора импульса сколь угодно малыми. Нормировоч- Нормировочный коэффициент, определяемый из условия \А\2 j\e^pr ~dV = l, равен Л =~i^-. Соответственно волновая функция при такой B6>17) нормировке имеет вид В §§ 12 и 13 мы нормировали волновые функции вида B6,13), задавая плотность потока вероятности /о. Действитель- Действительно, в этом состоянии согласно G, 6) /о = 1ЛР?. B6,18) Полагая, например, А = 1, получаем л>-¦?¦=*. B6>19> т. е. при такой нормировке плотность потока вероятности чис- численно равна скорости частицы. Если же Л =—7=-, то это соот- У v ветствует нормировке на единичную плотность потока вероят* ности и т. д. Легко видеть, что операторы рх, ру, рг простым образом свя- связаны с операторами бесконечно малого сдвига соответственно по осям х, у, z. Действительно, сдвинем нашу систему или, что
§ 26] ОПЕРАТОРЫ И СОБСТВЕННЫЕ ФУНКЦИИ 99 эквивалентно, начало координат вдоль оси х на расстояние Ая. Тогда старые и новые координаты связаны соотношением х' = х - Их, у' = у, z' = z. Выразим функцию г|)(л:, у, г) через новые координаты х\ у\ z'. Соответственно получим, ограничиваясь первым членом разло- разложения в ряд Ъ(х, У, г) = г|>(*' + Д*, У', г') |J Оператор A+Ал:^г| естественно назвать оператором сдвига на расстояние Ах вдоль оси х. Обозначим этот оператор через Rxr так, что y', z'). B6,20) Мы видим, что оператор сдвига Rx связан с оператором соот- соответствующей проекции импульса рх Rx=l+j-Axflx. B6,21) Вид оператора импульса рх можно было бы получить также, исходя из выражения для оператора Rx !). Выпишем уравнение для собственных функций и собствен- собственных значений оператора координаты в координатном же пред- представлении Здесь Хо — некоторое конкретное значение координаты х. Опе- Оператор к в своем собственном представлении сводится к умноже- умножению на х. При этом из уравнения B6,22) следует, что Кроме того, функции гр^0 (х) должны удовлетворять условию ор« тогональности и нормировки Из этих соотношений вытекает, что функция tyx (x) имеет вид (см. приложение III) ¦()*() B623) !) См. Л. Д. Ландау и Е. М. Лифшиц, Квантовая механика, Физ- матгиз, 1963, стр. 61. Аналогичное заключение относится и к операторам проекции импульса на оси у и г. 4*
100 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III Аналогичным образом запишутся собственные функции опера- операторов у и z. Так как операторы проекций координат jc> у, z ком- коммутируют между собой, их величины измеримы одновременно. Соответственно, если система обладает тремя степенями сво- свободы, три проекции координат х> у, z могут быть выбраны в ка- качестве величин, образующих полный набор. Волновая функция, описывающая состояние с тремя заданными координатами хо, Уо, го, имеет вид % (г) = 6(х-хо)д(у- у0) б (z - г0) = б (г - г0). B6,24) Аналогичным образом напишется и собственная функция опе- оператора импульса в импульсном же представлении. § 27. Оператор Гамильтона Важнейшим оператором квантовой механики является опе- оператор полной энергии Н. Как и в классической механике, он слагается из операторов кинетической и потенциальной энер- энергии. Построим, прежде всего, оператор кинетической энергии ча- частицы. Кинетическая энергия связана с импульсом частицы в нерелятивистском приближении, которым мы сейчас только и интересуемся, обычным соотношением 9 9 9 9 Заменяя в этом соотношении импульс частицы р на оператор р, получим оператор Г, который назовем оператором кинетической энергии (см. также § 20) Оператор кинетической энергии, очевидно, коммутирует с оператором импульса. Перейдем теперь к оператору полной энергии Н. Поскольку потенциальная энергия зависит только от координат х, у, z, от- отвечающий ей оператор в координатном представлении просто совпадает с функцией U(x,y,z). Соответственно имеем: H=--^A + U(x,y,z). B7,3) Поскольку в формуле B7, 3) оператор полной энергии выражен через оператор импульса (но не оператор скорости), он пред- представляет квантовомеханический оператор Гамильтона, часто именуемый гамильтонианом. Выражение для гамильтониана может быть легко обобщено на случай, когда частица движется
<§ 27] ОПЕРАТОР ГАМИЛЬТОНА Ю1 в нестационарных внешних полях. При этом #=-^Д + ?/(г, *), B7,4) где U(r,t) —так называемая силовая функция, связанная с си- силой, действующей на частицу соотношением Найденные формулы для оператора Гамильтона неприменим^ в случае движения частицы в поле, сил, зависящих от ее скоро- скорости. К ним относится, прежде всего, случай движения заряжен* ной частицы в магнитном поле. Для получения оператора Гамильтона в этом случае вос- воспользуемся общими правилами. Выпишем функцию Гамильтона классической механики для частиц, движущихся в электромаг- электромагнитном поле. Согласно D1,4) ч. I, имеем где вектор р — обобщенный импульс частицы, а А и ср — век- векторный и скалярный потенциалы, е — заряд частицы. Согласно общему правилу, заменим в формуле B7,5) функцию Гамильто- Гамильтона оператором Гамильтона, обобщенный импульс — оператором импульса. Векторный и скалярный потенциал, зависящие только от координат и времени, можно оставить без изменений, по* скольку в координатном представлении применение соответ- соответствующих операторов сводится к умножению на эти функции. Тогда находим: С помощью найденного нами оператора Гамильтона основное уравнение квантовой механики — уравнение Шредингера — мо- может быть представлено в виде й-^-Я*. B7,7) Операторная форма записи уравнения Шредингера имеет наиболее общий характер и пригодна для описания движения частицы в произвольном стационарном или нестационарном поле. В частности, в таком виде оно справедливо и в случае движения частицы в электромагнитном поле. Как и классиче- классическую функцию Гамильтона, гамильтониан можно преобразовать к произвольной криволинейной системе координат. Для этого следует лишь преобразовать к этой системе дифференциальный оператор Лапласа Д. В зависимости от симметрии поля сил удобно выбирать ту или иную систему криволинейных координат.
102 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. НЕ в которой выражение для потенциальной энергии частицы при- приобретает наиболее простой вид. В частности, как мы увидим: в § 35, часто удобно записывать оператор Гамильтона в сфери- ческой системе координат. Оператор Гамильтона системы частиц может быть построен по той же схеме, которая была уже успешно применена к слу- случаю одной частицы. Именно, следует написать классическое выражение для функции Гамильтона, а затем заменить все вхо- входящие в него величины на квантовомеханические операторы. Классическое выражение для гамильтониана системы N ча- частиц имеет вид N 2 N н - 2 -иг+2 и* <г*>+и* <27>8> где pk, tn>k и Uk{fk) соответственно импульс, масса и потен^ циальная энергия k-й частицы во внешнем поле; UB3 — потен- потенциальная энергия взаимодействия частиц. Оператор Гамильтона мы получим, если заменим импульсы частиц на соответствующие операторы pfe, где индекс k обозна- обозначает дифференцирование по координатам k-й частицы. После указанной замены получим уравнение Шредингера. Оно имеет вид N N ^ вз. B7,9> Очевидным образом обобщается и выражение оператора Га- Гамильтона B7, 6) для системы заряженных частиц, находящихся во внешнем электромагнитном поле. § 28. Стационарные состояния Предположим, что гамильтониан системы не зависит от вре« мени явно. В этом случае уравнение Шредингера B7,7) допу- допускает разделение переменных. Этим обстоятельством мы вос- воспользовались уже в § 6. Однако сейчас мы можем более глубока проанализировать получающееся при этом решение. Ищем решение уравнения Шредингера B7,7) в виде . B8,1) где под х мы понимаем всю совокупность координат, от кото* рых зависит волновая функция. Подставляя это выражение в B7,7), получаем Ш
<§ 28] СТАЦИОНАРНЫЕ СОСТОЯНИЯ ЮЗ Разделив левую и правую части последнего уравнения на ip(jc, t), имеем . ?ft 1 ... Я* (*) 1 dt %- o|) (x) • Отношение, стоящее в левой части равенства, может зависеть только от времени t, а отношение, стоящее в правой части — только от координат системы. Из равенства этих отношений следует, что каждое из них равно одной и той же постоянной, которую обозначим через Е. Тогда получим: где С — произвольная постоянная. Мы видим, что постоянная Е имеет смысл собственного зна- значения оператора Я, т. е. определяет возможные значения энер- энергии системы, а функция гр(дг) описывает состояние с заданной энергией. Оператор Гамильтона может обладать как дискретным, так и непрерывным спектром, как мы это видели на разобранных выше примерах. Часто приходится встречаться и со смешанным спектром: дискретным в одном интервале энергий и сплошным в другом. Предполагая для определенности, что оператор Н обладает дискретным спектром, выпишем волновые функции B8,1) ¦nfoO-*«(*)e~*V. B8,2) Состояния системы, описываемые волновыми функциями типа B8,2), называются стационарными. Волновые функции стационарных состояний зависят от времени по гармоническому р закону с частотами ©я = -у-. Как мы уже отмечали в § 6, в стационарном состоянии плотность вероятности нахождения частицы в данной точке пространства не зависит от времени. Действительно, Wn(x9 *)Ч*.(*. О Р. Подставляя выражение B8,2) для волновой функции, найдем Wn (х, t) = | фя (х) |2 = Wn (x9 0). B8,3) Можно легко обобщить это утверждение. Вероятность W(Fky t) наблюдать собственное значение Fk, в стационарном состоянии yn(x,t) не зависит от времени. По общим правилам (см. § 21), для того чтобы получить искомую вероятность, мы должны разложить волновую функцию фп(*»0 по собственным
104 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. Ill' функциям ipFk оператора F, и взять квадрат модуля соответ- соответствующей амплитуды разложения с& По формуле A9,2) н (о - J % (*. о ък wdVr=*~ *v J ¦» w ¦;, w ^ • Соответствующая вероятность W(Fh91) равна ^ (^, 0 4 «* @12 -1 J *» (*) *;A (*) dV |2 = Г (F4t 0). B8,4) Произвольное решение уравнения Шредингера i|)(jc, ?) может быть разложено по волновым функциям B8,2). Функция ty(xyt) при этом описывает состояние, в котором энергия системы не имеет определенного значения. § 29. Интегральная форма уравнения Шредингера Оказывается, что дифференциальному уравнению Шредин- Шредингера можно сопоставить интегральное уравнение. В ряде слу- случаев последняя форма имеет ряд преимуществ как с принци- принципиальной стороны, так и с точки зрения чисто расчетных удобств. Принципиальное достоинство интегрального представ- представления уравнений квантовой механики тесно связано с разви- развитием идей Фейнмана ]) и с квантовой теорией поля (см. гл. XIV). В § 58 мы подробно остановимся на достоинствах прибли- приближенных методов решения уравнения Шредингера в интеграль- интегральной форме. Рассмотрим одну частицу с гамильтонианом Я, зависящим, вообще говоря, от времени. Пусть в начальный момент времени задана волновая функция *> = ¦('!, 'О- B9,1) Волновая функция удовлетворяет уравнению Шредингера B9,2) Волновая функция частицы, удовлетворяющая уравнению B9,2) при граничном условии B9,1) в момент времени /2 > t\y может быть представлена в виде ¦ (г2, Ь) = J К (>> к\ гь h) ф (г1э *,) йтх. B9,3) Функция /C(r2, h\ Ги t\) является функцией Грина уравне- уравнения B9,2) (ср. § 19). Формула B9,3) допускает наглядную !) См. Р. Фейнман, А. Хите, Квантовая механика и интегралы по траекториям, «Мир», 1968.
<§ 29] ИНТЕГРАЛЬНАЯ ФОРМА УРАВНЕНИЯ ШРЕДИНГЕРА 105 интерпретацию: функция Грина представляет амплитуду пере- перехода частицы из начального состояния с волновой функцией t|)(rb/i) в состояние с волновой функцией ty(r2yt2)y где t2 > tx. Поскольку формула B9,3) определяет волновую функцию только при t2 > t\, функцию Грина можно доопределить требо- требованием K(r2tt2; гь tx) = 0 при t2<tx. Для того чтобы соотношение B9, 3) было эквивалентно B9, 2) и B9, 1), функция Грина должна удовлетворять уравнению [ih -^ - Я (г2, /2) ] К (r2, t2; гь tx) = Ihb (t2 - tx) p (r2 - rx). B9,4) Действительно, при t2 > tx функция Грина удовлетворяет урав- уравнению [ih ^ - Я (г2, *2)] К(r2, t2; rXy tx) = 0. B9,5) Действуя на обе части B9,3) оператором [ih——/Л при t2>t] и учитывая уравнение B9,5), приходим к тождеству. В том, что определенная уравнением B9,4) функция Грина удовлетворяет начальному условию B9,1) при t2 = tu легко убедиться, если проинтегрировать B9,4) по бесконечно малому интервалу 2Д/~> 0 около момента t\. Тогда имеем (ih-^-H(r2,t2))K(r2yt2; rbtx \t Имеем, очевидно, lim Г Я (r2, t2) К (r2, t2\ ru tx) dt2 = 0, lim in -^r~ ]\ (r2, t2\ f\y tx) ato = t"A \r2f откуда t{; rl9tx) = b (r2-rx). B9,6) Таким образом, если функция Грина удовлетворяет уравнению B9,4), то B9,3) представляет собой решение уравнения Шре- дингера с соответствующим начальным условием (задача Коши)*
106 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. Ilf Иными словами, если известна амплитуда перехода, то тем самым известна и волновая функция. С другой стороны, ампли- амплитуда перехода обладает некоторыми важными особенностями^ делающими ее в ряде отношений более удобной (хотя и столь же полной характеристикой системы), чем волновая функция.. Рассмотрим сначала случай, когда гамильтониан Но си- системы не зависит от времени явно. Тогда можно найти общук> связь между волновыми функциями стационарных состояний фя(*\0 и уровнями энергии системы и амплитудой перехода* Последнюю для системы с гамильтонианом Яо мы будем обо- обозначать как Ко- Амплитуда должна удовлетворять уравнению г,). B9,7> Если Яо не зависит от времени явно, то волновую функцию^ удовлетворяющую уравнению B9,2), можно представить в виде -A.* t *n(r,t) = un(r)e H \ где ifn образует полный набор ортонормированных функций-. В силу последнего свойства \|эп всегда можно написать разло- разложение /СоB, 1)-*о(г2,Л; ru <,)-Sc«(ri, Ь)Ъп(г2, t2)Q(t2-ti), B9,8) где 8 (t2 — ^i) — ступенчатая функция B9'9> С помощью 0-функции учтено поведение Ко при t2<t\. Под- Подставляя разложение B9,8) в B9,4), находим [ih ±- - Я0(г2)] 2 сп (г„ /,) *, (r2, t2) 9 (/, - /,) = ±- ] С другой стороны, [ih j^-Ho (г^] S cn%Q (t2 - Ь) = ИЛ (tt - /,) б (г2 - г,), откуда Но для 1|з„ имеет место условие полноты (см. A9,4)) 2 W'i) ¦.('!)-ее*-'О-
$ 291 ИНТЕГРАЛЬНАЯ ФОРМА УРАВНЕНИЯ ШРЕДИНГЕРА 107 Поэтому для коэффициентов сп находим « окончательно получаем Л0B, 1) = /Co(r2, t2; г„ *,) = = 9 (/, - /,) S «. (г2)«; (г,) ехр [ - -i En (t2 - /,)]. B9,10) Суммирование переходит в интегрирование в случае непрерыв- непрерывного спектра. В виде примера получим явное выражение для функции Грина свободной частицы. В этом случае так что 8 (/,-/,) 2 (/,-/,) Амплитуда перехода /Со(^2, ^; ^1,^1) или в более краткой записи /Со B,1) обладает следующими важными свойствами: 1. Амплитуда перехода зависит только от разности fe — tu как это видно из формулы B9, 10), 2. Исходя из первого свойства амплитуду перехода /Со(**з>^з» ^i> ^i) = ^o(^3> ri> *3 — *i) можно представить в виде Ко (гз, г1э /3 -1\) = J ^0 (г3, г2, /з - '2) ^Со (г2, г1э /2 - /,) rfr2. B9,11) Это означает, что переход можно рассматривать как совокуп- совокупность последовательных переходов A->2), B->3) по всевоз- всевозможным положениям 2. Формула B9,11) выражает принцип суперпозиции. Доказа- Доказательство ее элементарно: tfofo, r29 t3- = J J /Co(r3, r2f h-t2)K0{r2, rlt *2- Но Ф(г3, *з)= |^о(^з, rlf /3-'i)*(n» Сравнение этих формул сразу дает B9,11).
108 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. Ill 3. Фурье-компонента амплитуды перехода Ко определяет спектр собственных значений энергии системы. Действительно, найдем фурье-компоненту функции Ko(r2yr\,t2—^1): К0(г2, rl9 (o) = S un ft) < (r0 J exP [" l'bEn «2 -«,)] exp [to (t2 - /,)] X где обозначено: / = J 9 (/2 - /,) exp [ -| ?я D - /,)] exp [m (/, - /,)] d (t2 - f,); 0-функция может быть представлена в виде контурного инте- интеграла При этом для / находим Отсюда для Ко(г2, ги (о) получаем r1)«n(r2)---^-—• B9,14) Мы видим, что собственным значениям энергии Еп отвечают полюса фурье-компоненты амплитуды перехода w = EJft. Таким образом, зная амплитуду перехода Ко, можно непо- непосредственно найти спектр энергий Еп. Вернемся к общему случаю оператора Гамильтона, завися- зависящего от времени. Обычно его можно представить в виде суммы Я = Я0(г)+С/(г, 0, где #о не зависит от времени. Часто U(rJ) представляет пере-» менное внешнее поле, действующее на частицу. В этом случае функция Грина К удовлетворяет уравнению г1) B9,15)
§ 30] СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ФУНКЦИИ Ю9 и обращается в нуль при t2 < t\\ /СB, 1) = 0 при t2<tx. B9,16) Дифференциальному уравнению B9,15) для функции Грина можно сопоставить интегральное уравнение 1) = /С0B, l)-iJKoB,3)UC)K(S,l)d%9 B9,17) где dAx = dx dy dz dt. В интегральном уравнении /СоB, 1) считается известной функцией, а /Со B,3) Г/C) является его ядром. В этом легко убедиться, действуя .на уравнение B9,17) оператором /fi -tj— Яо (г2) . Тогда получаем, учитывая B9, 7), [ih-^-H0(r2)]KB, I) = «ft(/2-f,)б(г2_г,) + С/B)/СB, 1). Таким образом, мы снова приходим к уравнению B9,15). Начальное условие B9,16) содержится в B9,17), поскольку /СоB, 1) = 0 при t2<tx. Интегральная форма уравнения для амплитуды перехода B9,7) особенно удобна потому, что она позволяет получить /СB, 1) в виде ряда последовательных приближений (см. § 58). § 30. Собственные значения и собственные функции операторов момента и квадрата момента Построим теперь операторы, которые будут играть важную роль в дальнейшем изложении, — операторы проекций момента количества движения и квадрата момента количества движе- движения. Заменяя по общему правилу в классическом определении момента количества движения механические величины кван- товомеханическими операторами, находим: C0,1) Совокупность операторов 1Х> 1У и lz мы будем называть опера- оператором момента количества движения I. Последняя величина обладает всеми свойствами момента количества движения.
ПО МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III В частности, как мы покажем ниже, она подчиняется таким же законам сохранения, что и момент в классической механике. Построим, далее, оператор квадрата момента количества движения I2=l2x + Vy + Ib C0,2) Рассмотрим перестановочные соотношения для введенных операторов. Заметим прежде всего, что операторы проекций момента количества движения на разные оси координат не ком- коммутируют между собой. Действительно, вычислим, например, коммутатор Txly — 'lylx- Пользуясь выражениями C0,1), имеем * д \( д д гШгх С другой стороны, переставляя операторы, найдем _ 2/ д2 2 д2 д2 , д , д2 \ Вычитая из верхнего равенства нижнее, окончательно получаем Производя циклическую перестановку координат х, у, z, полу- получаем еще два равенства: И* li 1 (зо,зо Из соотношений C0,3) следует, что проекции момента количе- количества движения частицы /х, lyt lz не могут одновременно иметь определенные значения. Исключением является состояние, когда момент количества движения равен нулю, так как при этом J, ss fу = Г2 = 0. В то же время операторы проекций Гх, 1У и Г2 коммутируют с оператором квадрата момента /2, т. е. имеют ме- место соотношения C0,4)
§ 30] СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ФУНКЦИИ 111 Эти соотношения легко доказываются с помощью C0,3)- Дока- Докажем, например, первое из них. Из соотношения C0,3), умножая его соответственно справа и слева на 1У, имеем lylx = lyljy Вычитаем из верхнего соотношения нижнее, получаем Аналогичным образом, UI - 71ТХ = - ih AГУ + Цг). Учитывая также, что /*/* — 7*& «= 0, и складывая полученные равенства, находим JxP-l% = 0. Таким же образом доказываются и два оставшиеся соотно- соотношения C0,4). Из этих соотношений следует, что квадрат пол- полного момента количества движения и одна из его проекций на произвольную ось могут одновременно иметь определенные зна- значения. Заметим, что правила коммутации, аналогичные C0,3), C0,3'), справедливы также для операторов момента количества движения и координаты, момента количества движения и им- импульса. Опуская простое доказательство, приведем два соотно- соотношения: Ь& ~ fix = '**• ~ ~ C0,5) lxPy-pylx=Wz. Остальные четыре равенства получаются циклической переста- перестановкой индексов. Соотношения C0,3), C0,4), C0,5) совпадают с соответствующими классическими выражениями при условии, конечно, что мы от коммутаторов перейдем к классическим скоб* кам Пуассона. Определим, далее, возможные значения проекции момента количества движения на произвольно выбранное направление в пространстве и возможные значения квадрата момента (т. е. собственные значения этих операторов). При решении соответ- соответствующих уравнений для собственных функций и собственных значений удобно перейти к сферической системе координат. Переход от декартовых координат х, у, z к переменным г, в, ф в формулах C0,1), C0,2) производим по обычным правилам замены переменных. Опуская эти элементарные
П2 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III вычисления, приведем результат: k C0,7) C0,8) C0,9) где Д^, ф — угловая часть оператора Лапласа, взятого в сфери- сферической системе координат. Выбрав за ось z некоторое произвольное направление в про- пространстве, определим собственные функции и собственные зна- значения оператора проекции момента на это направление. Урав« нение для собственных функций и собственных значений опера- оператора 1г имеет вид Решением этого уравнения служит г|) = г|)(г, О)е~Ф, C0,11) где г|э(г, Ф) — произвольная функция. Волновая функция, являющаяся решением уравнения C0,10), должна удовлетворять условию однозначности. По- Поскольку ф — циклическая переменная, изменяющаяся от 0 до 2я, условие однозначности запишется в виде или Последнее условие выполняется, если lz = mfi, где т — це- целое положительное или отрицательное число (включая и нуль), В дальнейшем оно будет называться магнитным квантовым числом. Так как ось z не выделена какими-либо физическими усло- условиями, тот же результат имеет место и для операторов 1Х и ?у. Таким образом, проекция момента на произвольно выделен- выделенное направление в пространстве принимает целочисленные (в единицах Ь) значения. При определенном значении проек- проекции lz две другие проекции момента не имеют никакого опреде- определенного значения. Это означает, что если в состоянии с задан- заданным lz производить измерения значений проекций 1Х и 1У, то для последних может быть найдено любое возможное значение.
§ 30] СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ФУНКЦИИ 113 Собственная функция оператора tZi зависящая от угла ср и нормированная на единицу условием 2Я J *« имеет вид ^^ф. C0,12) Определим теперь собственные значения и собственные функции оператора квадрата момента I2 ру> = /2^ C0,13) Подставляя в C0, 13) выражение для ?2, даваемое формулой C0, 9), получаем уравнение 1 д ( ^ib \ I ^^ib /^ t ¦ I sin хг * I "'1 * ^~~~~^~" —_—. I¦¦ ¦ *m sis \j (oiJ14f Уравнение для собственных функций оператора I2 является ши- широко известным уравнением для сферических функций1). Уравнение C0,14) имеет решения, удовлетворяющие стан- стандартным условиям, сформулированным в § 16 только при зна- значениях -gr= /(/+ 1), где I — целое положительное число (вклю- (включая и нуль). Квантовое число I получило название азимуталь- азимутального квантового числа. Таким образом, оператор квадрата мо- момента имеет дискретный спектр собственных значений ). C0,15) Решение уравнения C0,14) для собственных функций опе- оператора квадрата момента имеет вид 1)?4я C0,16) где т — целое число, принимающее значения т = 0, ±1, ±2, ... 5.., ±/; k = т при т > 0 и k = 0 при т < 0. Через Р™ мы обозначили присоединенный полином Ле- жандра 2ll\ g C0,17) !) См., например, В. И. Смирнов, Курс высшей математики, т. III, ч. 2, Физматгиз, 1956, стр. 499; В. А. Фок, Начала квантовой механики, Кубуч, 1932, стр. 118.
114 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III Постоянный множитель в формуле C0,16) определяется из ус- условия нормировки функций Yim на единицу Я 2Я J J Y'lm (О- Ф) Yl'm' (О. Ф) Sin * d<> d4> - Mm»'- C(>' 18> 0 0 Из формул C0,15) и C0,16) следует, что каждому собствен- собственному значению квадрата момента отвечает B1 + 1) собственных функций Yim (отличающихся числом т). Таким образом, соб- собственные значения квадрата момента являются вырожденными. Смысл указанного вырождения, а следовательно числа т, легко поняты Подействуем на волновую функцию Yim оператором \. Тогда получим tYimib Ч)~ЪтГш(*9 ф). C0,19) Мы видим, что волновая функция У/т является одновремен- одновременно собственной функцией операторов 72 и Г2. Отсюда ясно, что квантовое число т, входящее в C0,16), характеризует вели- величину проекции момента на ось z в данном состоянии, а волно- волновая функция Yim описывает состояние с заданным полным мо- моментом и его проекцией на ось z. Резюмируя, мы можем сказать, что величина квадрата пол- полного момента количества движения определяется по формуле C0,15) азимутальным квантовым числом I, пробегающим ряд целочисленных значений. При фиксированном значении квад- квадрата момента проекция момента на произвольно ориентирован- ориентированную ось z может принимать B1 + 1) значений, от —/до +t (в единицах Ь). Никакие другие значения проекции момента при заданном / невозможны. Так как ось z ориентирована совер- совершенно произвольно, то, естественно, и проекции момента на оси х и у при заданном / также принимают значения от —/ до + /. При / = 0 проекция момента на любую ось также равна нулю. Это есть единственное состояние, когда проекции момента на разные оси одновременно имеют определенное значение. Вол- Волновая функция Yim при этом (I = 0) сводится к постоянной, которая является собственной функцией всех операторов **> ly> lz» Заметим, что собственное значение квадрата полного момен- момента I2 = ЬЧA + 1) всегда больше квадрата максимальной проек- проекции момента, равной ЪЧ2. Если бы эти величины совпадали, то это означало бы, что в состоянии, в котором проекция момента на некоторую ось имеет максимальное значение, две другие проекции равны нулю. Последнее, однако, невозможно, так как при определенном значении одной из проекций момента две
$31] ДИФФЕРЕНЦИРОВАНИЕ ОПЕРАТОРОВ ПО ВРЕМЕНИ Ц5 другие не могут иметь никаких определенных значений, хотя бы и нулевых. Покажем, наконец, что оператор момента количества движе- движения связан с оператором бесконечно малого поворота системы вокруг начала координат. Действительно, повернем систему ко- координат на малый угол 6<р, например вокруг оси z. Старые и новые координаты точки связаны соотношениями х' = х + у 6ф, х = хг — у' бф, if = - л:бф + уу у = х' бф + у', Zr = 2, Z = Zf. Следовательно, при повороте волновая функция ф (х, у, z), вы- выраженная через новые переменные, имеет вид -Ф(лг, у, г) = Оператор W7 естественно назвать оператором поворота. Мы на- нашли, что оператор Wz поворота на малый угол бф вокруг оси z связан с оператором 72 соотношением ^ = 1 + -у 6Ф?2. C0,20) Такая же связь, конечно, имеет место и для любой другой оси. § 31. Дифференцирование операторов по времени Построим теперь оператор Д отвечающий производной по времени от квантовомеханической величины, описываемой опе- оператором F. Совершенно ясно, что обычное определение произ- производной от функции неприменимо к квантовомеханической вели- величине, описываемой оператором F. Для определения понятия производной мы вновь воспользуемся аналогией с классической механикой. Как известно, в классической механике производная по времени от некоторой механической величины F может быть выражена через классическую скобку Пуассона dt dt ^l/7' l J' где Н — функция Гамильтона.
116 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III Переходя от классических величин к квантовомеханическим операторам и от классической скобки Пуассона к квантовой, по- получим выражение для оператора F F = ^L + [H, F]. C1,1) Если оператор F не зависит от времени явно, то оператор F имеет вид F = [Н, F] = ± (HF - FH). C1,2) Из свойств квантовых скобок Пуассона сразу следуют выра- выражения для производной от суммы F и произведения L двух опе- операторов D и R F-5 + R, C1,3) l t DR. С помощью формулы C1,1) для производной от квантового оператора можно найти выражение для производной по времени от среднего значения величины F. Дифференцируя выражение B2, 4) для среднего, находим Выразим производные -^- и -~- через волновые функции с помощью уравнения Шредингера и уравнения с ним сопря- сопряженного. Тогда имеем' J (Я>*) /ф dV = J (Fi|)) H V dV, так как интеграл не изменяется при перестановке подынтеграль- подынтегральных функций. Из эрмитовости оператора Н следует, что J (?ф) НV rfK = J ф*яН dl/. Окончательно получаем ^) C1,4)
§31] ДИФФЕРЕНЦИРОВАНИЕ ОПЕРАТОРОВ ПО ВРЕМЕНИ Ц7 Сравнивая полученное выражение с определением среднего от производной F, мы приходим к важному равенству ]F = F... C1,5) В виде примера определим операторы х и рх. Поскольку операторы координаты и импульса явно от времени не зависят, имеем * = [#, *], (ад В такой форме операторные уравнения C1,6) аналогичны клас- классическим уравнениям Гамильтона. Раскроем коммутаторы, стоя- стоящие в правых частях равенств C1,6), предполагая при этом, что гамильтониан имеет вид й=-ы№+Р1 +" #)+и <*» У' z' ')• Учитывая, что операторы координаты и импульса равны > rx i дх 7 получаем поскольку х и U(x, у, 2, t) коммутируют. Вычисляя коммутатор операторов р\ и х, найдем Окончательно получаем: * = [#, х] = -±-рх. C1,7) Мы видим, что оператор скорости х связан с оператором им- импульса рх таким же соотношением, каким в классической меха- механике связаны между собой эти величины. Найдем оператор рх Итак, имеем Рх--Ш-- C1,8).
118 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III Мы получили операторное уравнение движения в форме уравнения Ньютона. Уравнения C1,7), C1,8) можно написать также для средних значений соответствующих величин * = *=-^Р*, ?х^хв-|-. C1,9) Последние соотношения носят название теорем Эренфеста. Вы- Выражая рх через х, находим "Й--15Г. C1Л0) В такой форме это уравнение очень близко по внешнему виду к уравнению Ньютона классической механики. § 32. Интегралы движения Предположим, что оператор F не зависит от времени явно и коммутирует с оператором Гамильтона Н. В этом случае, со- согласно C1,2) оператор производной по времени равен нулю, и из соотношения C1,5) вытекает, что среднее значение вели- величины F не изменяется во времени F = 0. C2,1) Постоянна во времени также вероятность того, что при измере- измерении F мы получим какое-то возможное значение Fn этой вели- величины. Действительно, эта вероятность дается квадратом модуля |сп@12 коэффициента разложения волновой функции ty(x,t)t описывающей состояние системы^ в момент времени /, по соб- собственным функциям оператора F. Поскольку, однако, оператор F коммутирует с оператором Я, оба оператора имеют общие собственные функции $п(х, t) = tyn(x)e н п (см. § 23). Раз- Разложение \|)(л:, t) по собственным функциям оператора F можно представить в виде * (*, t)=I>cn @) е" Еп\п (х) = 2сп (t) o|,n (х). C2,2) п п Следовательно, 2 Лр = const. Такие величины в квантовой механике, так же как и в механике классической, принято именовать интегралами движения. Из сказанного ясно, что квантовомеханическая величина является интегралом движения, если:
§32] ИНТЕГРАЛЫ ДВИЖЕНИЯ 119 1) ее оператор не зависит от времени явно; 2) этот оператор коммутирует с оператором Гамильтона. Зная операторы различных квантовомеханических величин и оператор Гамильтона, можно найти законы сохранения. Нахождение законов сохранения в квантовой механике столь же существенно для исследования движения системы, как и в классической механике. Как и в классической меха- механике1), законы сохранения импульса и момента количества движения тесно связаны со свойствами однородности и изотро- изотропии пространства. Так, из изотропии пространства следует, что гамильтониан замкнутой системы или системы в поле сил с центральной симметрией не должен изменяться при произ- произвольном бесконечно малом повороте. Математически это выра- выражается в том, что гамильтониан Н должен коммутировать с опе- оператором поворота W. Но оператор поворота на малый угол вокруг некоторой оси (например оси г), как мы знаем (см. § 30), связан простым образом с оператором проекции момента количества движения на эту ось. Поэтому следствием коммута- коммутации оператора Wz с гамильтонианом Й является коммутация с гамильтонианом оператора 7Z, откуда и вытекает закон сохране- сохранения этой величины. То обстоятельство, что мы рассматривали поворот лишь на малый угол, несущественно, поскольку пово- поворот на конечный угол можно разбить на совокупность малых поворотов. Итак, мы видим, что сохранение момента количества движе- движения связано с изотропией пространства. Аналогичным образом легко видеть, что сохранение им- импульса связано с однородностью пространства. Действительно, из однородности пространства следует, что оператор сдвига не должен изменять гамильтониан замкнутой системы, т. е. дол- должен коммутировать с ним. Но так как оператор сдвига R свя- связан с оператором соответствующей проекции импульса (см. § 26), то мы сразу приходим к закону сохранения импульса. Закон сохранения энергии замкнутой системы или системы в стационарных внешних полях можно связать с произволь- произвольностью выбора начала отсчета времени (однородность во вре- времени). Это означает, что законы движения системы не должны зависеть от выбора начала отсчета времени. Введем оператор трансляции на малый интервал времени б/, T(8t), определяемый соотношением 9 F0 ф (х, t) = ф (х, t + Ы). C2,3) 1) См., например, Л. Д. Ландау и Е. М. Л и ф ш и ц, Механика, Физ- матгиз, 1958, стр. 23.
120 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III Раскладывая функцию -ф(л:, t + 8t) в ряд по малому интер- валу 8t и ограничиваясь членами первого порядка малости, по- получим 9 (+6*-J-)l>(x, t). Отсюда следует, что оператор Т{Ы) имеет вид . C2,4) Требование независимости законов движения системы от вы-» бора начала отсчета времени выражается коммутацией опера- оператора 9°(8t) с гамильтонианом системы 9(Ы)Н = НУ(Ы). C2,5) Используя для T(8t) выражение C2,4), мы можем перепи- переписать соотношение C2, 5) в виде дН =0. C2,6) dt Но равенство C2,6) и выражает закон сохранения энергии. Действительно, оператор Н заведомо коммутирует сам с собой и условие Н = 0, означающее закон сохранения энергии, сво- сводится к C2,6). Существованию интеграла движения отвечает простое свой- свойство волновой функции. Если оператор 7 отвечает некоторой со- сохраняющейся величине, то наряду с волновой функцией «ф уравнению Шредингера будет удовлетворять и волновая функция я|/ = е'а/Ч C2,7) где а — произвольное вещественное число, а оператор еш по- понимается в смысле разложения в степенной ряд Действительно, подставляя г|/ в уравнение Шредингера, на- .ходим ^ = Й -? е^Ц = Не^ ^ C2,8) Но поскольку /, как оператор сохраняющейся величины, удов- удовлетворяет условию коммутации /Я-Я/ = 0, -ff = 0,
§ 33] ЧЕТНОСТЬ 121 имеем -jj- [е^ i|)) = eiaT ^, JJeia?<b = eia7 Я* и уравнение C2,8) удовлетворяется непосредственно. Рассмотрим некоторые простые примеры. Начнем со случает свободной частицы. Гамильтониан при этом будет иметь вид Очевидно, что [Н,рх] = [Н,ру] = [Н, /)г] = 0. Следовательно, Рх = Ру==Рг = 0- C2,7> Если свободная частица в какой-то начальный момент нахо- находилась в состоянии с заданным импульсом, то это значение импульса сохраняется во времени. В качестве другого примера рассмотрим частицу, движу- движущуюся в поле, создаваемом бесконечной однородной пло- плоскостью (плоскость ху). Потенциальная энергия частицы в та- таком поле зависит только от расстояния до плоскости ?/=?/(|| так что гамильтониан имеет вид С таким гамильтонианом коммутируют операторы рХУ руу /2. Это означает, что при движении в поле однородной плоскости (ху) сохраняются компоненты импульса частицы рх и ру и г-я ком- компонента момента количества движения lz. § 33. Четность Рассмотренные выше законы сохранения — закон сохране- сохранения энергии, импульса и момента количества движения яв- являются квантовомеханическими аналогами законов сохранения классической механики. Оказывается, однако, что в квантовой механике существуют и законы сохранения, не имеющие клас- классического аналога. Один из таких законов тесно связан со свой- свойствами пространства и имеет весьма общий характер. Именно, гамильтониан замкнутой системы не должен изменяться при следующих преобразованиях координат: 1) трансляции начала координат на произвольный отрезок; 2) повороте на произвольный угол; 3) преобразовании инверсии в начале координат, т. е. за- замене Xi~>-—Х{, при которой знаки всех координат изменяются на обратные.
122 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III С первыми двумя преобразованиями, как мы видели в пре- предыдущем параграфе, были связаны закон сохранения импульса и момента количества движения. С преобразованием инверсии в квантовой механике оказывается связанным еще один общий закон сохранения. Подобно введенным ранее операторам пере- переноса и поворота можно ввести и соответствующий оператор ин- инверсии т ht) = a*(-rtt), C3,1) где а — некоторая постоянная. При двухкратном применении оператора инверсии 7 мы при- приходим к исходному состоянию. Отсюда следует, что а2 = 1, т. е. а= ±1. Таким образом, вообще, выполняется условие /г|)(г, t)=±ty(-r, t), C3,2) т. е. при инверсии может менять знак непосредственно сама вол- волновая функция, а не только аргумент г, от которого она зави- зависит. Свойство волновой функции преобразовываться при инвер- инверсии с о=+1 ил-и а = —1 зависит от внутренних свойств ча- частиц, описываемых этой волновой функцией. О частицах, которые описываются волновыми функциями, удовлетворяющими условию говорят, что они обладают положительной внутренней чет- четностью. Наоборот, частицы, которые описываются волновыми функциями, удовлетворяющими условию имеют отрицательную внутреннюю четность. Предположим, что гамильтониан замкнутой системы имеет вид А + Легко видеть, что этот гамильтониан не изменяется при замене Г{ ->• —Ги т. е. он удовлетворяет условию Это означает, что оператор 7 коммутирует с гамильтонианом ТЙ = Й1. C3,3) Определим собственные значения % оператора инверсии 7 . C3,4)
§ 33] ЧЕТНОСТЬ 123 Применим к этому уравнению оператор инверсии еще раз. Так как при двукратном отражении мы возвращаемся к исходному значению координат, то это преобразование является тожде- тождественным Нк = Фя = */*L = ^ 4V C3,5) Отсюда получаем, что собственные значения X равны ±1. О со- состоянии, которому отвечает Я=+1, говорят, что оно имеет положительную четность или является четным. Наоборот, со- состояние с Я = —1 имеет отрицательную четность или является нечетным. Если оператор четности коммутирует с оператором Гамильтона, то имеет место закон сохранения четности. Закон сохранения четности, как и другие законы сохранения, накла- накладывает определенные ограничения на возможные изменения состояний системы. Именно, если система была в четном состоя- состоянии, то она будет оставаться в этом состоянии, не переходя в нечетное состояние. Аналогично дело обстоит, естественно, и с системой, находящейся в нечетном состоянии. Определим четность состояния частицы с моментом количе- количества движения, равным /. То обстоятельство, что момент коли- количества движения и четность могут быть определены одновре- одновременно, следует из коммутации соответствующих операторов: {/,U = 0; {/, У = 0; {/,/J-0; {7, Р} = 0. C3,6) Из самих выражений для операторов момента lx, ly, lz ясно, что они не изменяются при преобразовании инверсии. В сфери- сферической системе координат преобразование инверсии имеет вид г->г; Ф-^я-Ф; ф-хр + я. C3,7) Зависимость волновой функции частицы с определенным мо- моментом / от углов О, ф дается сферической функцией Yim($, ф) (см. § 30). При преобразовании инверсии C3,7) имеем cosft-*—cosu и ?*тф->(— \)meim. Как преобразуется присо- присоединенный полином Лежандра Р™{1) при изменении знака его аргумента, легко определить из формулы C0,17). Так как Pd—?)= (—W(?), то мы получаем, что Pf(— ?) = = (~1)/+тРГ(|). Учитывая также множитель (—1)т, который дает функция eimv, находим, что при инверсии волновая функ- функция в целом умножается на множитель (—1)'. Принимая во внимание также множитель а =» ±1, связанный с внутренними свойствами частиц, получаем: Я = (~1)/а. C3,8) Таким образом, состояния с четными / имеют положительную четность, если а = 1, и отрицательную, если а = —1. Состояния
124 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. III с нечетными / имеют соответственно отрицательную четность при а = 1 и положительную, если а = —1. Если мы имеем си* стему невзаимодействующих частиц, то четность системы опре- определяется произведением четностей отдельных частиц. Действи- Действительно, в § 14 мы видели, что волновая функция системы невзаимодействующих частиц может быть записана в виде произ- произведения волновых функций отдельных частиц. Но отсюда сразу следует, что при преобразовании инверсии четности, относя- относящиеся к отдельным частицам, перемножаются. Если каждая из частиц находится в состоянии с определенным моментом коли- количества движения (движение в центральном поле), то четность всей системы может быть записана в виде Я = (-1J'*Па4> C3,9) где второй множитель определяется произведением внутренних четностей частиц. Наряду с другими законами сохранения закон сохранения четности является одним из наиболее общих законов природы. Невозможность переходов замкнутой квантовомеханической си- системы из состояний с одной четностью в состояния с другой чет- четностью — так называемых запрещенных переходов, подтверж- подтверждается обширным экспериментальным материалом как атомной, так и ядерной физики. Однако в последнее время (см. § 122) было установлено, что закон сохранения четности не является универсальным физическим законом. При некоторых процессах, происходящих с элементарными частицами, закон сохранения четности нарушается. § 34. Соотношение неопределенности для времени и энергии Из общего аппарата квантовой механики может быть выве- выведено, как показал Л. И. Мандельштам и И. Е. Тамм1), соотно- соотношение между неопределенностью в энергии АЕ и некоторым интервалом времени М. Действительно, полная энергия замкну- замкнутой системы может не иметь определенного постоянного во вре- времени значения. Постоянно во времени, как мы выяснили в § 32, ее среднее значение и вероятности измерения того или иного возможного значения. Иными словами, сохраняется во времени вид функции распределения по энергиям. Зная функцию распределения, можно определить обычным образом величину среднеквадратичного отклонения энергии Д?, которая тоже, естественно, сохраняется во времени. Энергия бу- ') Л. И. Мандельштам и И. Е. Т а м м, Изв. АН СССР, сер. физич. 9, 122 A945),
§ 34] СООТНОШЕНИЕ НЕОПРЕДЕЛЕННОСТИ 125 дет иметь вполне определенное значение (Д? = 0) только, если система находится в стационарном состоянии. Характерным признаком стационарного состояния является постоянство во времени физических величин, относящихся к данной системе. Итак, предположим, что замкнутая система находится в на- начальный момент времени в состоянии с неопределенной энер- энергией Е. Пусть, далее, R — некоторая величина, оператор кото- которой R не зависит от времени явно. Для данной величины можно определить обычным образом ее среднеквадратичное отклоне- отклонение Д7? и среднее значение Л. Пользуясь B4,5) и C1,5), напи- напишем соотношения -j\{HR-RH)\9 C4,1) C4,2) Подставляя C4,2) в C4,1), соответственно получаем ^E^R>^\R\. C4,3) Это соотношение связывает между собой неопределенность в энергии Д?, неопределенность AR в величине R и скорость из- изменения среднего значения величины R. Соотношение C4,3) можно переписать в несколько более удобном виде, если ввести интервал Д^—время, за которое среднее значение R меняется на величину порядка своего среднеквадратичного отклонен ния AR Д* = 4Д-. C4,4) R Тогда имеем Д?Дг>|. C4,5) В частности, из C4,3) следует, что для того, чтобы величина R могла меняться со временем, R должна обладать отличной от нуля дисперсией. Итак, мы видим, что существует определенная зависимость между дисперсией полной энергии системы и скоростью измене- изменения произвольных величин, относящихся к рассматриваемой си- системе. В качестве наиболее простого примера рассмотрим одномер* ный волновой пакет. За величину R возьмем координату х9 R = х. Тогда AR есть ширина пакета, а Д^ — время прохожде- прохождения пакета через какую-то точку пространства. Соотношение C4,5) показывает, что время прохождения существенно зави- зависит от дисперсии полной энергии Д?,
126 МАТЕМАТИЧЕСКИЙ АППАРАТ КВАНТОВОЙ МЕХАНИКИ [ГЛ. ПГ Из неравенства C4,5) следует также определенная связь между временем жизни данного состояния и неопределенностью в энергии АЕ этого состояния. Так, полагая At равным т — пе- периоду полураспада системы, мы получаем по порядку величины г-44» <34>6> где Г — неопределенность в энергии начального состояния, дает ширину соответствующей спектральной линии. Более детально вопрос о связи закона распада с функцией распределения энер- энергии рассмотрен в работе Н. С. Крылова и В. А. Фока !). В этой работе также показано, что, так как соотношение C4,5) вы- выведено с использованием уравнения Шредингера, оно не может быть применено к процессам измерения. Это следует, например, из того, что данный объект во время процесса измерения уже не составляет замкнутой квантовомеханической системы. Для процессов измерения соответствующее неравенство должно быть сформулировано в виде некоторого физического принципа (сформулированного Бором) A{E-E')At>h, C4,7) где Е и Е' — значения энергии объекта до и после процесса из- измерения, а А{Е— Е') —абсолютная величина неопределенности в изменении энергии объекта, т. е. соответствующая погрешность измерения, если оно производилось за время At. Соотношение C4,7) очень важно для анализа результатов измерения, т. е. проверки на опыте результатов, даваемых кван- квантовой механикой. Мы проиллюстрируем его на простейшем примере свободной частицы. Для измерения величин Е, р, v (энергии, импульса, скорости), относящихся к частице (частице- объекту), нужно рассмотреть столкновение этой частицы с дру-* гой системой (частицей-прибором). Предполагая для простоты движение одномерным, напишем закон сохранения импульса p + k-t/-kf = O. C4,8) Здесь через k и k' мы обозначили импульс частицы-прибора до и после столкновения. Штрихами мы будем обозначать вели- величины, относящиеся к системам после столкновения. Можно счи- считать, что импульс частицы-прибора до и после столкновения измерен точно. Тогда из соотношения C4,8) следует равенство погрешностей в измерении импульса частицы-объекта до и после столкновения Др = Др'. C4,9) J) И. С. Крылов и В. А. Фок, ЖЭТФ 17, 93 A947).
§ 34] СООТНОШЕНИЕ НЕОПРЕДЕЛЕННОСТИ 127 Погрешность в измерении энергии может быть выражена через погрешность в измерении импульса, так как Д? = *jL др = v др, Д?' = Щ- Ар' = v' A/?'. Ввиду равенства погрешностей Др и Др' имеем Д (Е - Е') = | v - v' | Ар. C4,10) Умножим равенство C4,10) на время измерения А/. Тогда по- получим А (? - Е') At = | v -г i/ | Ар А/. C4,11) Но величина |у — v'\At представляет ту дополнительную по- погрешность в координате, которая появилась за время измере- измерения Д? Полная неопределенность координаты Ах может быть записана в виде где (Ал:) о — неопределенность координаты частицы-объекта, имевшаяся до рассматриваемого столкновения. В частности, (Ах) о может быть достаточно малым. То обстоятельство, что при этом будет большой величина (Ар) о, не существенно, по- поскольку (Ар)о никак не связано с рассматриваемой погреш- погрешностью Ар. Соотношение неопределенности Гейзенберга Ар Ах ^ Ь должно выполняться независимо от величины (ДхH, следова- следовательно, \v-v'\AtAp>h. C4,12) Сравнивания с C4,11), приходим к неравенству A(E-E')At>h C4,13) в согласии с C4,7). Мы видим, что погрешность в измерении энергии стремится к нулю, только если процесс измерения длится достаточно долго (в пределе при Д^ -> оо). Отметим еще, что, как следует из C4,12), измерение им- импульса при данной величине погрешности Др заведомо ведет к изменению скорости частицы: а следовательно, к изменению и импульса. Только если измере- измерение производится сколь угодно долго (Д/->оо), импульс не изменяется. Конечно, длительное измерение импульса может иметь смысл, только если частица свободна. Итак, мы видим, что процесс измерения импульса через небольшие промежутки времени неповторим. Измерение переводит микрообъект в со- совершенно новое состояние (ср. § 5).
ГЛАВА IV ДВИЖЕНИЕ В ПОЛЕ С ЦЕНТРАЛЬНОЙ СИММЕТРИЕЙ § 35. Уравнение Шредингера Мы можем теперь применить развитый в предыдущей главе расчетный аппарат квантовой механики к изучению свойств реальных систе^м. Естественно остановиться прежде всего на атоме водорода как простейшей атомной системе. В атоме водо- водорода потенциальная энергия взаимодействия электрона с ядром зависит только от расстояния между ними \г{ —г2 жения двух частиц с законом взаимодействия U( . Задача дви- — г2\) сво- сводится, как мы выяснили в § 14, к задаче движения одной ча- частицы с приведенной массой \л в поле U(r). Ввиду большой разницы в массах приведенная масса jli очень близка к массе электрона. Если также пренебречь размерами протона, то атом водорода представляет электрон, движущийся в кулоновском поле неподвижного центра. Такое поле является частным слу- случаем поля с центральной симметрией, в котором потенциаль- потенциальная энергия зависит только от расстояния до силового центра. Мы рассмотрим движение электрона в поле с центральной сим- симметрией самого общего вида* а затем уже перейдем к случаю кулоновского поля. Уравнение Шредингера для стационарных состояний части- частицы, движущейся в силовом поле с потенциальной энергией U(г), имеет вид ^ C5,1) В случае потенциального поля с центральной симметрией урав- уравнение Шредингера удобно преобразовать к сферическим коор- координатам, поскольку потенциальная энергия зависит только от расстояния до начала координат г. Выражая оператор Лапласа в сферических координатах, имеем J 0- C5'2)
§ 35] УРАВНЕНИЕ ШРЕДИНГЕРА 129 Это уравнение удобно преобразовать, введя в него явным об- образом оператор квадрата момента Г2. Подставляя его значение согласно формуле C0,9), имеем окончательно (*-?/(r))*==0. C5,3) Покажем, прежде всего, что при движении в поле с цент- центральной симметрией, помимо закона сохранения энергии, имеют место еще два закона сохранения — закон сохранения полного момента количества движения и проекции момента на ось z> произвольным образом ориентированную в пространстве; при- причем, когда мы говорим о сохранении полного момента, то имеется в виду величина, изображаемая оператором Ъ (квадрат момента). Для этого, согласно общим правилам, рассмотрим условия коммутации операторов^ I2 и 12 с гамильтонианом. В нашем случае гамильтониан Н можно, очевидно, написать в виде В оператор ?2 входят только угловые переменные О, ер, а также операторы дифференцирования по этим переменным. Поэтому оператор Р коммутирует с любым оператором дифференцирова- дифференцирования по г, а также с оператором самой координаты г HP - РЙ = 0. C5,5) Аналогичное соотношение имеет место и для оператора /2 ввиду того, что, как мы видели в § 30, он коммутирует с опера- оператором Т2 C0,4): ЙГя-ТяН = 0. C5,6) Поскольку при движении в поле с центральной симметрией сохраняются три величины — энергия, квадрат момента /2 и проекция момента на произвольную ось /z, мы будем рассматри- рассматривать состояния с заданными значениями этих трех величин. Напомним, что при движении в поле с центральной симмет- симметрией законы сохранения энергии, полного момента количества движения и его проекции на ось г имеют место и в классической механике. Мы рассмотрели уже ранее состояния системы с заданными значениями полного момента и его проекции на оси г. Соб- Собственные значения операторов ?2 и 1г характеризовались азиму- азимутальным и магнитным квантовыми числами / и т, а собствен- собственными функциями этих операторов служили сферические функ- функции Ylm{$, ф) с индексами /, т. 5 В. Г. Левип и др., том II
130 ДВИЖЕНИЕ В ПОЛЕ С ЦЕНТРАЛЬНОЙ СИММЕТРИЕЙ [ГЛ. IV Уравнение C5,3) допускает разделение переменных. Угловая часть его совпадает с уравнением C0,14). Она описывает дви- движение с заданными значениями / и т. Поэтому решение C5,3) естественно пытаться искать в виде ¦ (г, Ф, фН*(г)У1т(Ф, ф). C5,7) Подставляя выражение C5,7) в уравнение C5,3) и учиты- учитывал, что l2Ylm = ЬЧA + 1)У;т, мьтриходим к следующему урав- уравнению для радиальной части волновой функции R{r): Мы видим, что выражение для радиальной составляющей R волновой функции \|) существенно зависит от вида потенциаль- потенциальной энергии U(г). В то же время угловая часть К/т(Ф, ф) вол- волновой функции определяется лишь величиной момента количе- количества движения частицы (число /) и его проекцией на ось z (число т). Состояния с заданным моментом количества движе- движения обозначаются малыми буквами латинского алфавита: / = 0 12 3 4 5 6 7 spdfghik Значением квантового числа / определяется также четность состояния. В § 33 мы показали, что в состоянии с заданными полным моментом количества движения и его проекцией на ось г четность равна (—1)', т.е. при преобразовании инверсии сфери- сферическая функция Yim переходит в (—\)lYtm. Так как радиальная волновая функция, зависящая от абсолютной величины радиуса- вектора, не меняется цри инверсии, то указанный закон преоб- преобразования относится и к полной волновой функции ¦ 0% *, Ф)->(-1)Ч(г, О.Ф). Таким образом, состояния s, d, g, ... являются четными, а р, f, h... — нечетными (при положительной внутренней четности). Вероятность того, что электрон, находящийся в состоянии •ф(/-, ¦&, ф) = /?(г)У^т('в, ф), будет обнаружен в бесконечно ма- малом элементе объема с координатами г, Ф, ф, дается формулой dW (г, <К Ф) = | г!) (г, Of Ф) р г2 dr dQ, C5,9) где dQ = sin О dd dy. Если проинтегрировать это выражение по всем значениям углов О, ф, то мы получим вероятность обнару- обнаружить электрон в сферическом слое между г и г + dr ) = \R{r)?r2dr. C5,10)
§ 35] УРАВНЕНИЕ ШРЕДИНГЕРА 131 Проинтегрировав C5,9) по всем значениям радиуса г от О до оо, находим вероятность dW(ft, ф) обнаружить электрон в те- телесном угле du в направлении, определяемом углами Ф, q> C5,11) Из определения сферической функции C0,16) следует, что последнее выражение не зависит от угла ср. Это означает, что в плоскости, перпендикулярной оси z, распределение вероят- вероятности нахождения частицы совершенно симметрично. Напомним, что под осью z мы понимаем произвольно выбранное направле- направление в пространстве, причем фиксирована проекция момента ко- количества движения на это направление. Таким образом, из C5,11) следует dWun~\ P? (cos О) Г du. C5,12) Распределение вероятности C5,12) определяется двумя кван- квантовыми числами / и т, т. е. зависит от величины полного мо- момента количества движения и его проекции на ось z. Состояние с / = 0 (s-состояние) обладает сферической сим- симметрией, так как при / = 0 (следовательно и т = 0) Pq = const dWu—^dQ. C5,13) В р-состоянии (/ = 1) распределение вероятности дается сле- следующими выражениями: dW\ ±i = ^ 8я C5,14) Графически, для различных / и m, распределения C5,12) пред- представлены на рис. 8 в виде полярных диаграмм 1). Рассмотрим более детально уравнение C5,8) для радиаль- радиальной составляющей волновой функции. Прежде всего из него следует, что энергия частицы не зависит от проекции момента количества движения на ось z. Это связано с тем, что в сфери- сферически-симметричном поле все направления являются равно- равноправными. Таким образом, изотропия пространства приводит к вырождению уровней системы, энергия которых не зависит от квантового числа т. Следует заметить, что вырождение все- всегда обусловлено определенными свойствами симметрии рассмат- рассматриваемой системы. sf\V7 1) Вероятность —-Jp- отложена по радиусу-вектору, проведенному под углом Ф к оси z. б*
132 ДВИЖЕНИЕ В ПОЛЕ С ЦЕНТРАЛЬНОЙ СИММЕТРИЕЙ Вместо функции R удобно ввести функцию %(г): Для х(г) находим d2% . 2] dr2 "*" П [ГЛ. IV C5,15) C6,16) Условие конечности волновой функции при г = О приводит к требованию Х@)-0. C5,17) Уравнение для радиальной функции C5,8) свелось к урав- уравнению одномерного движения с эффективной потенциальной энергией, равной ?/9фФ(г) = ?/(г) + ^-^^-. C5,18) Как и в классической механике, величина -= * * име- именуется центробежной энергией. Не конкретизируя детального вида потенциальной энергии U(г), можно, тем не менее, сделать определенные заключения 1=0 р-электроны d-электроны f-элешроны Рис. 8. о поведении волновой функции вблизи начала координат и на очень больших расстояниях от силового центра. Исследуем сперва область малых расстояний г—>0. Будем считать, что вблизи начала координат потенциальная энергия взаимодействия U(r) изменяется достаточно медленно, так что
$ 35] УРАВНЕНИЕ ШРЕДИНГЕРА 133 имеег место условие \imr2U(r) = 0. C5,19) г-»0 Это условие означает, что |?^@| ПРИ г~*0 растет медленнее, чем 1/г2. Оно выполнено, в частности, для электрона, находя- находящегося в кулоновском поле ядра. При этом в уравнении C5,16) при г-* О можно пренебречь членами Е% и U(r)% по сравнению с членом т; 2 -%. Тогда получим 0 Решение последнего уравнения ищем в виде Подставляя это выражение в уравнение, имеем Y(Y -1)-/(/+1). C5,20) Уравнение C5,20) имеет два корня: Второй корень мы должны отбросить, так как ему отвечает функция /?, которая неограниченно возрастает при г—>0. Та- Таким образом, окончательно получаем, что на малых расстояниях %(r) ~ гг+1, а радиальная часть волновой функции выражается формулой R(r) = Arl. C5,21) Вероятность найти частицу на данном расстоянии г от цент- центра независимо от углов О и ср дается квадратом модуля ра- радиальной функции, т. е. величиной \R\2r2 dr. Из C5,21) следует, что при малых г эта вероятность про- пропорциональна r2l+2 dr и тем меньше, чем больше /. Центробеж- Центробежная сила как бы отбрасывает частицу от центра. Исследуем далее асимптотическое поведение волновой функ- функции на больших расстояниях от начала координат. На больших расстояниях сила, действующая на частицу, стремится к нулю й, следовательно, потенциальная энергия f/(r)—к некоторой постоянной. Всюду, где это не оговорено особо, мы будем вы- выбирать эту постоянную за начало отсчета потенциальной энер- энергии, т. е. считать, что lim U(r) = 0. Тогда в уравнении C5,16) при больших г можно пренебречь
134 ДВИЖЕНИЕ В ПОЛЕ С ЦЕНТРАЛЬНОЙ СИММЕТРИЕЙ {ГЛ. IV" слагаемыми U% и ^~ rt % по сравнению с членом ^х1)- При этом уравнение C5,16) приобретает вид -0 + k\ = 0, k = |/M . C5,22) Решение последнего уравнения можно, очевидно, написать как % = A[eikr+A2e-ikr, C5,23> где А\ и Лг — постоянные интегрирования. Рассмотрим, прежде всего, решения, отвечающие положи- положительным значениям энергии. При Е > О величина ft, определяе- определяемая формулой C5,22), имеет вещественное значение. Радиаль- Радиальная часть волновой функции C5,15) сводится к сумме двух, функций Акт p-ikr /?(г) = Л1^7- + Л2^г-. C5,?4> Так как оба слагаемых ограничены по модулю, то ни одна и& постоянных А\ и Лг не должна быть равной нулю. Вдали от силового центра радиальная функция представляет суперпози- суперпозицию сходящейся и расходящейся сферических волн. Определенное заключение может быть сделано и относитель- относительно энергетического спектра частицы при произвольном виде энергии взаимодействия U(r). Действительно, функция C5,23) не обращается в нуль на бесконечности, что соответствует инфи- нитному движению, т. е. движению, при котором частица или система уходит на бесконечность. Интеграл от квадрата модул» функции C5,24), взятый по всему пространству, расходится. Но„ как мы отметили в § 16, такие функции отвечают сплошному спектру. Следовательно, при Е > 0 энергетический спектр яв- является сплошным. Если радиальная составляющая плотности потока равна нулю, то функция C5,24) должна быть веществен- вещественной. Соответственно полагаем: Л! =™ А'е% А2 = - -1- А'г~\ C5,25) причем А' к а уже действительны. Тогда в соответствии с C5,24) радиальная функция R при- приобретает вид R = A'sin{krr + a), C5,26) где фаза а зависит от k, /, а также конкретного вида функции х) Из более детального анализа следует, что это законно, если потен- потенциальная энергия на бесконечности убывает по закону 1/гп, где п > 1. См.„ например, Л. Д. Ландау и Е. М. Л и ф ш и ц, Квантовая механика, Физ- матгиз, 1963, стр. 138, 547; В. А. Фок, Начала квантовой механики, Кубуч» 1932, стр. 126.
$ 35] УРАВНЕНИЕ ШРЕДИНГЕРА 135 U(г). В следующем параграфе мы покажем, что для свобод- яой частицы (U=0)a = ~. В соответствии с этим полагаем а = —^ + бь C5,27) где фазы 6г непосредственно связаны с действием силового поля на частицу и обращаются в нуль для свободного движения. Рассмотрим теперь область отрицательных энергий Е < 0. Поскольку кинетическая энергия частицы всегда положительна, лолная энергия может быть отрицательной только в случае при- притяжения частицы к центру. Если Е < 0, величина k имеет чисто мнимые значения, т.е. k = Ы, где и = |/ р—. Радиальная функция C5,24) запишется в виде р-ъг jar R^A{^-r + A2^r. C5,28) Чтобы удовлетворить требованию конечности волновой функции лри г -> оо, мы должны положить постоянную А2 равной нулю R = A{^-. C5,29) Тогда радиальная волновая функция R стремится к нулю при г-*оо. Это означает, что вероятность нахождения частицы на бесконечно большом расстоянии от центра сил равна нулю. Следовательно, движение частицы является финитным. Мы ви- видим, что имеется сходство между выводами квантовой и клас- классической механики: при положительной полной энергии (Е > > U(оо)) частицы уходят на бесконечность, при отрицатель- отрицательной — совершают финитное движение. Рассмотрим теперь вопрос о спектре энергий при Е < 0. Как мы выяснили, этим энергиям отвечает финитное движение и со- соответствующие волновые функции C5,29) квадратично интегри- интегрируемы. Такие волновые функции, как указывалось в § 16, при- принадлежат дискретному спектру. Следовательно, при Е < 0 мы имеем дискретный энергетический спектр. Общее решение уравнения Шредингера C5,2) можно пред- представить в виде суперпозиции волновых функций C5,7) Ф (/*, #, Ф) = 2 BlmRt (r) Ylm (#, Ф). C5,30) 1,т Для решения, не зависящего от угла ф, мы имеем более про- простое выражение (суперпозиция состояний с т = 0) Ч> (г, О) = 2 cfa (г) Рг (cos *). C5,31)
136 ДВИЖЕНИЕ В ПОЛЕ С ЦЕНТРАЛЬНОЙ СИММЕТРИЕЙ [ГЛ. IV § 36. Свободное движение частицы с заданным моментом количества движения До сих пор мы представляли свободно движущуюся частицу плоской волной е1 &г-<**\ где k — волновой вектор частицы k = jr, a <* = -§-• Эта волновая функция описывает стационар- стационарное состояние с определенным значением импульса и энергии Е = -^— частицы. Для дальнейшего нам следует найти волно- волновые функции таких стационарных состояний свободно движу- движущейся частицы, в которых, помимо определенного значения энер- энергии Е, заданы также величина ее момента количества движе- движения и проекции момента на ось г. В классической механике свободная частица, движущаяся с определенным импульсом, ав- автоматически обладает и определенным моментом количества движения. В квантовой механике положение существенно ме- меняется. В состоянии с заданным импульсом момент количества движения является неопределенной величиной. С другой стороны, в состоянии с заданным моментом количества движения и его проекцией на ось z направление импульса также неопределен- неопределенно. Это связано с тем, что соответствующие величины одновре- одновременно не могут иметь определенных значений. Для того чтобы найти нужную нам волновую функцию, рас-» смотрим движение свободной частицы в сферических коорди- координатах. Положив в уравнении Шредингера C5,3) U(r) === О, имеем й2 1 д Ь Будем искать волновую функцию свободной частицы в виде Ф*/т (г, Ф, Ф) = Rkl (r) Ylm (ф, Ф). C6,2) При этом радиальная функция Rki должна удовлетворять урав- уравнению C5,8), в котором следует положить U в О Здесь мы выразили энергию Е через волновое число k. При 1 = 0 уравнение перепишется в виде ) 0- C6>4> Решением последнего уравнения, не обращающимся в беско- бесконечность в начале координат, служит функция ^ C6,5)
$ 37] СФЕРИЧЕСКАЯ ЯМА 137 Для нахождения решения уравнения C6,3) при / Ф О введем но- новую функцию по формуле C6,6) где 5 = kr. При такой замене уравнение C6,3) легко преобразо- преобразовать к виду Решением уравнения C6,7), удовлетворяющим условию ко- конечности волновой функции в начале координат, является функ- функция Бесселя полуцелого порядка Z(s)-C/|+±(s). C6,8) Соответственно для радиальной функции имеем . C6,9) Вдали от начала координат (г-*оо) можно воспользоваться известным асимптотическим выражением для функции Бесселя и получить асимптотическое значение Rhi{r) | fer ' C6'1Q) Постоянная С определяется условием нормировки. На малых расстояниях от силового центра (''—>О) радиальная функция C6,9) приобретает вид Rkt~rl C6,11) в согласии с общим выражением C5,21). § 37. Сферическая яма В качестве наиболее простого и в то же время важного при- примера рассмотрим движение частицы в поле с центральной сим- симметрией, определяемом выражением U(r)J-U° (Г<а)' [ 0 (г>а). Поле такого типа принято называть сферически-симметричной потенциальной ямой. Потенциальная яма, изображенная на
138 ДВИЖЕНИЕ В ПОЛЕ С ЦЕНТРАЛЬНОЙ СИММЕТРИЕЙ [ГЛ. IV рис. 9, представляет идеализированную модель системы, в ко- которой силовое взаимодействие с центром осуществляется так называемыми короткодействующими силами. Под короткодей- короткодействующими силами понимают силы, которые настолько быстра спадают с расстоянием, что их можно считать практически равными нулю на расстояниях, превышающих некоторое рас- расстояние а, именуемое радиусом действия короткодействующих: . сил. Важность рассмотрения систем с ко- * роткодействующими силами ясна, на- например, из того, что к силам этого типа . и ^ принадлежат силы взаимодействия ме- V | __, ^ аду нуклонами — ядерные силы. Идеализация системы с помощью мо- модели сферической потенциальной ямы сводится к предположениям о полной изотропии сил и постоянстве потенциаль- потенциальной энергии при г < а. Для простоты рассмотрим движение- Рис. 9. частицы с моментом количества движе- движения / = 0. Возможны, очевидно, два раз- различных режима движения. При Е < 0 полная энергия частицы меньше, чем потенциальная энергия на бесконечности, что соот- соответствует финитному движению. Наоборот, при Е > 0 имеет ме- место инфинитное движение. Первому случаю, которым мы и огра- ограничимся, соответствует дискретный энергетический спектр, вто- второму — непрерывный. Волновая функция частицы с / = 0 зависит только от коор- координаты г, но не от углов О и ср. Уравнение Шредингера после подстановки %(r) = rR(r) будет иметь вид C5,16) C7,1) 0 § C7,2> Напишем решение уравнения C7,1) в виде %(r) = A sin кг + В cos кг, C7,3) где обозначено Для конечности волновой функции R в начале координат необ- необходимо положить х@) = 0. Следовательно, внутри ямы реше- решение уравнения C7,1) имеет вид X (г) = Л sin иг. C7,4)
СФЕРИЧЕСКАЯ ЯМА 139 Решение вне ямы, обращающееся в нуль на бесконечности, вы- выражается формулой () Ве-«'9 C7,5) где через к' обозначена величина х' = "I/ -gj-1 E |. Из непрерывности волновой функции следует, что решение {37,4) должно непрерывно переходить в решение C7,5) на по- поверхности сферы г = а. Производная от волновой функции так- также должна быть непрерывна на этой поверхности. Поэтому мы можем приравнять друг другу логарифмические производные от функций C7,4) и C7,5) при г = а. Тогда получаем: — х'. C7,6) C7,7) C7,8) Это соотношение можно переписать в виде 1 sinxa = ± 1 яли, учитывая выражение для х и и', имеем sinxa= ± 2mU0a2 ка. Корни уравнения C7,8) определяют уровни энергии частицы ъ яме. Уравнение C7,8) удобно решать графически. Именно, зшрни уравнения C7,8) являются точками пересечения прямых на и у\ = - у w/^2 ^a с кривой sinxa (см. рис. 10). При этом долж- должны быть выбраны только такие точки пересечения, для которых ctgxa имеет ъ соответствии с C7,6) отрицательные значения. Из графика рис. 10 вид- видно, что корни уравнения C7,8) существуют не все- всегда. Чтобы появилось связанное состояние (уро- (уровень энергии), яма долж- Рис. 10. на быть достаточно глу- глубокой. Определим минимальную глубину ?/омин, соответствую- соответствующую появлению первого уровня энергии. Как видно из рис. 10, первый уровень появляется при условии, что прямая проходит -через вершину синусоиды ха = ~. При этом тангенс угла
140 ДВИЖЕНИЕ В ПОЛЕ С ЦЕНТРАЛЬНОЙ СИММЕТРИЕЙ [ГЛ. IV наклона прямой равен 2/я. Следовательно, минимальная потенциальная энергия U0Mvm, при которой существует связан- связанное состояние частицы в сферической яме, определится усло- условием ¦j/__JL_=l, откуда II — п* ^2 И7 QV ^ 0 мин— о rnffi * ^ * '' Первый уровень энергии в потенциальной яме минимальной глубины ?7омпн мы найдем из условия или 1^0 мин~ 1^1 I) =-2"- Учитывая значение Uo мин, находим, что ?i = 0, т. е. энергия ча- частицы на первом уровне равна нулю, никаких других уровней в яме не имеется. С увеличением глубины ямы энергия первого уровня также понижается и становится отрицательной. На гра- графике это соответствует уменьшению угла наклона прямой к оси абсцисс. При некотором угле наклона помимо корня, соответ- соответствующего первому уровню, появится и второй корень. Послед- Последний отвечает появлению в яме второго уровня энергии. С уве- увеличением глубины ямы число точек пересечения на графике возрастает, что отвечает увеличению числа уровней энергии у частицы в потенциальной яме. В заключение подчеркнем, что отсутствие связанных состоя- состояний частицы в потенциальной яме глубиной Uo < U0Mjm пред- представляет специфический квантовомеханический эффект, не имею- имеющий аналога в классической физике. Действительно, как бы ни была мала глубина ямы в классической физике, частица, по- попавшая в яму с начальной кинетической энергией, меньшей глу- глубины ямы, будет удерживаться в ней как угодно долго. В кван- квантовой механике это положение в общем случае не имеет места. § 38. Движение в кулоновском поле Как мы уже указывали, важнейшим примером движения ча- частицы в поле с центральной симметрией является движение электрона в кулоновском поле атомного ядра. Простейшую атомную систему такого рода, состоящую из ядра и одного элек- электрона, представляет атом водорода, а также ион любого атома,. в котором остался только один электрон. Другим примером мо-
§ 38] ДВИЖЕНИЕ В КУЛОНОВСКОМ ПОЛЕ 141 жет служить атом мезоводорода, состоящий из протона и отри- отрицательно заряженного мезона. Задача движения двух тел, ядра и электрона, сводится к за- задаче движения одной частицы с приведенной массой |i в куло- новском поле (см. § 14). Совершенно ясно, что теория атома водорода и водородо- подобных систем чрезвычайно важна, поскольку эти системы являются простейшими атомными системами. Кроме того, ока- оказывается, что в случае движения частицы в кулоновском поле ядра можно получить полное аналитическое решение уравнения Шредингера. Это позволяет наглядно проследить за проявле- проявлением общих квантовомеханических закономерностей в атомных системах. Потенциальная энергия электрона, движущегося в поле ядра с зарядом Ze, дается формулой U(r)--Z?-. C8,1) Выпишем уравнение Шредингера для радиальной волновой функции C5,8): MHL+lLf( lf) = o. C8,2) Мы будем первоначально интересоваться состояниями, при- принадлежащими дискретному энергетическому спектру. В соответ- соответствии с выводами § 16 эти состояния отвечают финитному дви- движению электрона и, следовательно, их энергия отрицательна ?<0 (см. §35). При решении уравнения C8,2) удобно перейти к безразмер- безразмерным величинам. Это сделает все формулы менее громоздкими. В качестве основных величин выберем заряд электрона е, его приведеную массу \х и постоянную Планка Ь. Из этих величин можно составить комбинацию, имеющую размерность длины я = ^. C8,3) Как мы увидим ниже, эта длина является характерным атомным размером. Если положить приведенную массу \х рав- равной массе электрона т, то а = 0,529* 10~8 см. Система единиц, в основу которой положены величины е, \i и я, называется кулоновой системой. Единицей скорости будет служить величина е2/Ь, равная Vi37 скорости света, единицей энергии — величина, равная ?o = lf = !- C8,4)
142 ДВИЖЕНИЕ В ПОЛЕ С ЦЕНТРАЛЬНОЙ СИММЕТРИЕЙ [ГЛ. IV При jli = т Ео = 4,30- К)1 эрг = 27,07 эв. Введем в уравнение C8,2) безразмерную переменную р и энергию е р-тг» e=-i- <38>5> Тогда это уравнение перепишется в виде f)-»- см» На малых расстояниях функция R ведет себя, согласно C5,21),_как р1. На больших расстояниях эта функция имеет вид /j~e~/2ep (см. C5,29)). В соответствии с этим будем пытаться искать решение уравнения C8,6) в виде *(p)-pfe-ft>t>(p)f C8,7) где р= |/2е ¦ Подставляем выражение C8,7) в C8,6), после про- простых вычислений получаем |^ ^ p-p/) = 0. C8,8) Введем новую переменную C8,9) Обозначая штрихом дифференцирование по этой новой пере- переменной, имеем () 0. C8,10) Радиальная волновая функция R должна оставаться конеч- конечной во всей области изменения переменной ? как при | -* сю, так и при I -* 0. Решение уравнения C8,10) ищем в виде ряда о F) =2**6*. C8,11) Подставляя C8,11) в уравнение C8,10) и собирая члены при одинаковых степенях ?, получаем = 0. C8,12) Равенство C8,12) будет выполняться при произвольных значе- значениях |, если равны нулю коэффициенты при всех степенях |. Приравнивая поэтому квадратную скобку нулю, приходим к сле- следующей рекуррентной формуле: C8,13)
§ 38] ДВИЖЕНИЕ В КУЛОНОВСКОМ ПОЛЕ 143 Заметим, что функция и, определяемая рядом C8,11), с ко- коэффициентами aki удовлетворяющими C8,13), может быть вы- выражена через вырожденную гипергеометрическую функцию 1) 2l + 2l) C8,14) Легко показать аналогично тому, как это сделано в § 10, что ряд C8,11) расходится, как е* при ?->оо. Это означает, что если бы волновая функция выражалась рядом C8,11), она не удовлетворяла бы условию конечности на сколь угодно большом расстоянии от силового центра. Для того чтобы определить функцию, обладающую должными свойствами и являющуюся решением уравнения C8,10), мы должны так же, как это было сделано при решении задачи об осцилляторе, оборвать ряд на некотором члене, т. е. свести его к полиному. Если при некото- некотором значении числа k = nr коэффициент ряда av+i обращается в нуль, то согласно C8,13) обращаются в нуль и все после- последующие коэффициенты аП/>+2, ап +з и т. д. В этом случае беско- бесконечный ряд сводится к полиному степени пг. При больших зна- значениях i функция и(?) будет возрастать по степенному закону v(l) ~ ?Я|>- Волновая функция C8,7) при этом будет стре- стремиться к нулю на бесконечности за счет экспоненциального мно- множителя. При ? —>0 полином и(?) стремится к постоянной вели- величине по, а волновая функция C8,7) соответственно обращается в нуль или стремится к постоянной. Мы видим, таким обра- образом, что волновая функция будет удовлетворять стандартным граничным условиям. Посмотрим теперь, при каких условиях коэффициент ряда аПг_н обращается в нуль. Согласно C8,13) для этого необхо- необходимо равенство нулю выражения /ir + f+l-y = O. C8,15) Так как пг — целое число (включая и нуль), то сумма (пг + I + + 1) также является целым положительным числом. Обозначим ее через /г, п = пг + I + 1. Целое число п называется главным квантовым числом, число пг — радиальным квантовым числом. При фиксированном значении азимутального квантового числа / имеем: я>/+1. Соотношение C8,15) определяет, очевидно, расположение уровней энергии системы. Учитывая значение р, находим: е = ^г- <38>16) ]) См. В. И. Смирнов, Курс высшей математики, Физматгиз, 1953, т. III, ч. 2, стр. 422.
144 ДВИЖЕНИЕ В ПОЛЕ С ЦЕНТРАЛЬНОЙ СИММЕТРИЕЙ [ГЛ. IV Переходя от атомных к обычным единицам C8,4) и C8,5), по- получаем ?* = -w=-13>5J^e- <38>17> Эта формула, впервые полученная Н. Бором еще до появле- появления современной квантовой механики, определяет дискретные энергетические уровни в атоме водорода и водородоподобных ионах. Мы видим, что уровни энергии зависят только от глав- главного квантового числа п. Значению п = 1 соответствует низший энергетический уровень (основное состояние) частицы в куло- новом поле. С ростом п расстояние между уровнями умень- уменьшается, уровни сгущаются при я—>оо, Д?-*0 и дискретный спектр переходит в непрерывный. Радиальная функция Rnt дается формулой /?„,= const Ъ1е-Щ>A), C8,18) где полином v(Q с коэффициентами, определяемыми рекуррент- рекуррентной формулой C8,13), совпадает с точностью до множителя с обобщенным полиномом Лагерра1). Поэтому в нашем случае радиальная функция приобретает вид Rni-Antl'e-^Lfti1®. C8,19) Обобщенный полином Лагерра L%(Q выражается через про- производные от многочленов Лагерра, которые определяются соот- соотношением Ln(t) = e^(e-h% C8,20) так что L7{l) = -^nLn(D- C8,21) Коэффициенты Ani C8,19) определяются из условия норми- нормировки 2). Радиальные волновые функции, принадлежащие, на- например, двум нижним уровням энергии, имеют вид C8,22) C8,23) C8,24) !) См. сноску на стр. 143. 2) Вычисление нормировочного интеграла проведено, например, в книге Л. Д. Ландау и Е* М. Л и ф ш и ц, Квантовая механика, Физматгиз, 1963, стр. 150.
§ 38] ДВИЖЕНИЕ В КУЛОНОВСКОМ ПОЛЕ 145 Здесь вместо g введена опять переменная р (см. C8,9)). Под- Подчеркнем, что волновая функция полностью определяется сово- совокупностью значений трех квантовых чисел: п, I и /п, тогда как уровни энергии C8,17) зависят только от главного квантового числа п. Таким образом, энергетические уровни атома водорода являются вырожденными. Мы видели в § 35, что вырождение по магнитному квантовому числу т — общее свойство движения в поле с центральной симметрией. Однако в кулоновском поле уровни энергии оказываются вырожденными также и по ази- азимутальному квантовому числу /. Это вырождение характерно только для движения в кулоновском поле. Достаточно слегка изменить закон сил, и энергия становится зависящей от азиму- азимутального квантового числа. Поэтому вырождение, характерное для кулоновского поля, получило наззание случайного вырожде- вырождения. Найдем кратность вырождения n-го уровня энергии. Так как при заданном п азимутальное квантовое число пробегает все целочисленные значения от 0 до п — 1 и, в свою очередь, каждому I соответствует 2/ + 1 возможных значений квантового числа т, то кратность вырождения равна SB/+l) = tt2. C8,25) Каждому уровню энергии Еп принадлежит п2 различных волно- волновых функций. Рассмотрим более детально уровни энергии атома водорода. Они даются формулой C8,17), в которой нужно положить Z=l. Энергия основного состояния определяет потенциал ионизации атома водорода. Согласно квантовой теории света, разности энергетических состояний определяют частоты электромагнит- электромагнитных волн, излучаемых атомом (см. § 103): h<o = Em-En. C8,26) Величина En/h называется спектральным термом. Разности этих спектральных термов и определяют частоты излучения. Подста- Подставляя в формулу C8,26) выражение C8,17), получаем: v=-E = *(i-i-)> *>» <38>27) Величина R называется постоянной Ридберга R e 15F в 3>27 • 1015 ceK~K <38>28) Все частоты, относящиеся к переходам на один и тот же нижний уровень, образуют спектральную серию. Так, если в формуле C8,27) положить п = 1, то мы получим серию Лай- мана. Она лежит в ультрафиолетовой части спектра. Переходы
146 ДВИЖЕНИЕ В ПОЛЕ С ЦЕНТРАЛЬНОЙ СИММЕТРИЕЙ [ГЛ. IV на уровень п = 2 лежат в области видимой части спектра. Со- Совокупность этих спектральных линий образует серию Бальмера. Спектральные серии, соответствующие переходам на уровни п = 3 и т. д., лежат в инфракрасной области спектра. Для водо- родоподобных ионов соответствующие спектральные линии сдвигаются в область более коротких длин волн, так как ча- частоты возрастают в Z2 раз. Найдем, далее, вероятность C5,10) обнаружения электрона, находящегося в различных квантовых состояниях, на заданном расстоянии г от ядра. Ос- Основное состояние электрона в атоме водорода описыва- описывается волновой функцией фюо = Яю^оо- Угловая часть волновой функции сводится при /=0, т = 0 к постоянной й/ О,/ V ч ч 30 5 Ю tf 20 25 а) s-coc/пояния A-0) 0,2 О,/ //-In у/ > 0,2 О/ 5 /О /5 20 25 б) р-состояния A=/) (см. § 30), т. е. состояние сферически-симметрично. Ве- Вероятность обнаружить элек- электрон, находящийся в основ- основном состоянии г|)юо, на за- заданном расстоянии от ядра дается выражением г / > — Пользуясь C8,22), получаем О 5/0/5 20 25 дО в) d- состояния (I =2) и состояние 4f Рис. 11. d\Vl0 = -^e «r2 dr. C8,29) Мы видим, что эта ве- вероятность отлична от нуля во всем пространстве, хотя и быстро падает с ростом л Простое вычисление пока- показывает, что кривая dWw/dr имеет максимум на расстоя- расстоянии г = а, где величина а определена формулой C8,3) и: носит название боровского радиуса. Вид функции \Rni\2r2 для различных пи/ приведен на рис. 11. По абсциссе отложено рас- расстояние от центра р = —. По ординате — плотность вероятности as\Rni\2p2' Отметим, что число нулей радиальной волновой функ- функции Rni совпадает со значением радиального квантового числа пг. На больших расстояниях радиальная волновая функция имеет вид
$ 38] ДВИЖЕНИЕ В КУЛОНОВСКОМ ПОЛЕ 147 Вычисленная с помощью этой функции плотность вероят- вероятности быстро спадает на расстояниях порядка -=-• Отсюда вид- но, что величина -=- характеризует размеры атома, так как вероятность обнаружить электрон на больших расстояниях весьма мала. До сих пор мы рассматривали связанные состояния электро- электрона в кулоновском поле ядра. В кулоновском поле в связанном состоянии могут находиться и другие, отрицательно заряженные частицы, например я- и ^-мезоны. Такие образования, как мы уже упоминали, получили название мезоатомов. В качестве простейшего примера рассмотрим мезоатом во- водорода, или, как его называют, мезоводород. Уровни энергии мезоводорода и волновые функции мезона даются формулами C8,17), C8,18), C8,19), в которых, однако, приведенная масса электрона \х должна быть заменена на приведенную массу ме- мезона р/. Эффективные размеры атома мезоводорода определяют- определяются величиной а' = Л- а, которая существенно меньше эффектив- эффективных размеров атома водорода. В частности, масса лг-мезона равна 273 электронным массам и соответственно а' ~ 0,2 . 1(Г10 см. В атоме мезоводорода я-мезон находится на значительно меньших расстояниях от ядра, чем электрон. Наличие ядерного взаимодействия я-мезона с ядром приводит к тому, что уровни энергии C8,17), полученные для чисто кулоновского поля, не- несколько смещаются. Экспериментальное исследование этого сме- смещения позволяет сделать некоторые выводы о характере ядер- ядерного взаимодействия я-мезонов и нуклонов. Следует заметить, что время существования мезоатомов ограничено временем жизни самих мезонов. Как известно, мезоны являются не- нестабильными частицами, испытывающими распад с некоторым средним временем жизни т, характерным для данного сорта мезонов. До сих пор мы ограничивались рассмотрением дискретного энергетического спектра, т. е. считали энергию отрицательной. Рассмотрим теперь сплошной энергетический спектр Е > 0, я = — -§-<0 C8,5). Введем обозначения с учетом C8,7), C8,9), C8,15) ° | =/*; п = -|-=-/-§'• Б — 2/Ар. C8,31)
148 ДВИЖЕНИЕ В ПОЛЕ С ЦЕНТРАЛЬНОЙ СИММЕТРИЕЙ [ГЛ. 1\Г Используя C8,7), C8,14) и C8,31), запишем радиальную вол- волновую функцию непрерывного спектра в виде Яы = "(зШУГ W*~^ (l+l + if;2l + 2, ШР), C8,32) здесь Ch — нормировочный множитель. Если функции Rki нормировать на 6-функцию по kt то этот множитель равен V^i^\(f)\ <38>33> Асимптотическое выражение радиальной волновой функции при больших р определяется формулой х) Rki ~ |/"| -fj sin (ftp + 4 In 2?p - f I + 6t), C8,34) где (Г — гамма-функция комплексного переменного. Ее аргумент равен 6z). От общего асимптотического выражения радиальной волно- волновой функции в центрально-симметричном поле C5,26) выраже- выражение волновой функции C8,34) (кулоновское поле) отличается наличием медленно возрастающего логарифмического члена в аргументе у синуса. 1) См. Л. Д. Ландау и Е. М. Лифшиц, Квантовая механика, Физ- матгиз> 1963 стр. 154; В. А. Фок, Начала квантовой механики, Кубуч, 1932, стр. 155.
ГЛАВА V КВАЗИКЛАССИЧЕСКОЕ ПРИБЛИЖЕНИЕ § 39. Предельный переход к классической механике Мы неоднократно отмечали существование принципа соот- соответствия и правила перехода соотношений квантовой механики в формулы классической механики при Ь —> 0. Сейчас мы уточ- уточним условия этого перехода и вместе с тем получим важный приближенный метод решения уравнения Шредингера х) (метод ВКБ). Если положить Ь = 0 непосредственно в уравнении Шредин- Шредингера то оно теряет смысл. Поэтому, чтобы произвести указанный пре- предельный переход, представим волновую функцию -ф в виде ±s h C9,2) Подставляя это выражение в уравнение C9,1), получаем урав- уравнение для функции S: Формально разложим теперь функцию S по степеням вели- величины h/i 5 = 5O+D)S1 + DJS2+ ... C9,4) Подставляем разложение C9,4) в уравнение C9,3) и прирав- приравниваем коэффициенты при одинаковых степенях й. С точностью до членов, пропорциональных первой степени величины /?, *) Метод Вен-щеля, Крамерса, Бриллюэна. G. Wentzel, Zeits, f. Physik 38, 518 A926); L. В r i 11 о u i n, Comptes Rendus 183, 24 A926); J. de Physique 7, 353 A926); H. A. Kramers, Zeits, f. Physik 39, 828 A926); U. Jeff revs, Proc. London Math. Soc. B) 23, 428 A923).
150 КВАЗИКЛАССИЧЕСКОЕ ПРИБЛИЖЕНИЕ [ГЛ. V получаем два уравнения: -ж—й-^^' + ж^- <39-6> Уравнение C9,5) совпадает с уравнением Гамильтона — Якоби классической механики х) для функции действия So. Для выяс- выяснения смысла уравнения C9,6) напишем выражение для плот- плотности вероятности нахождения частицы в данном месте про- пространства в виде р = |г|)|2 = е25'. C9,7) Умножая C9,6) на р и учитывая, что f- = 2^-p; Vp = 2VSlPr получаем ~ Ж = li (VS° Vf> + p AS^ = div (i p VS°) * C9'8> Уравнение C9,8), эквивалентное уравнению C9,6), предста- представляет уравнение непрерывности. Оно показывает, что плотность вероятности перемещается в пространстве с такой же ско- скоростью v = — VS0 и по той же траектории, по которой пере- перемещается частица в классической механике. Напомним, что, по- поскольку скорость направлена по нормали к поверхностям So = = const, траектории классической частицы ортогональны к по- поверхностям So — const. В квазиклассическом приближении по- поверхности S = const естественно назвать поверхностями равной фазы волновой функции. Найдем теперь волновую функцию стационарных состояний частицы в квазиклассическом приближении, причем мы ограни- ограничимся одномерным движением, так что -ф = г|)(х, t). В силу ус- условия стационарности имеем $(x,t) = e h ¦(*). C9,9) В соответствии с этим в формулах C9,2) и C9,4) полагаем So(x, t)=-Et + S'o(x), C9,10) тогда как функции Si, S2, ... и т. д. можно считать не завися- зависящими от времени. 1) Об уравнении Гамильтона — Якоби в классической механике см. Л. Д. Ландау и Е. М. Л и ф ш и ц, Механика, Физматгиз, 1958, стр. 184; Г. Голдстейн, Классическая механика, Гостехиздат, 1957, стр. 296.
§ 39] ПРЕДЕЛЬНЫЙ ПЕРЕХОД К КЛАССИЧЕСКОЙ МЕХАНИКЕ 151 Из уравнения C9,5) получаем откуда х S'O {x) = ± j V2m(E-U(x)) dx = ± J p (x) dx, C9,12) где Как и следовало ожидать, мы получили обычные формулы клас- классической механики. Из уравнения C9,6) мы можем теперь определить функ- функцию Si. Учитывая, что она постоянна во времени, находим dx dx ' 2 rfjc2 ИЛИ 1 d*2 1 dx ~ 2 rfs? ~ 2p dx • ^'^' Интегрируя, получаем S^-ylnp C9,15) (постоянную интегрирования мы учтем непосредственно в вы- выражении для волновой функции). Из определения C9,2) и из полученных выражений C9,10) и C9,15) легко найдем волновую функцию частицы с точностью до членов первого порядка по степеням b/i: ад=^ДЬ>-+^е-т^>- E>Ut C9Iб) Cl 4r[\P(x)\dx C9,160 Характер полученной волновой функции существенно зави- зависит от знака разности (Е—U). Если Е > U, то импульс яв- является вещественным. Это отвечает движению частицы в об- области, дозволенной по классической механике. При этом волно- волновая функция имеет характер осциллирующей функции. Период осцилляции тем меньше, чем больше величина импульса р. Множитель -7=-~-т=- имеет простой смысл. Вероятность У Р У v
152 КВАЗИКЛАССИЧЕСКОЕ ПРИБЛИЖЕНИЕ [ГЛ. V нахождения частицы в области от х до х + dx пропорциональна времени пребывания частицы в этой области | ty{x) \2dx~——~dtt т. е. получается тот же результат, что и в классической меха- механике. Совершенно иной характер имеет волновая функция в об- области недозволенных энергий, при Е < U. Здесь импульс ста- становится мнимым, а волновая функция превращается в сумму экспоненциальных выражений. В точке Е = U (именуемой точ- точкой поворота) р = О и полученное выражение для волновой функции теряет смысл. Как ясно из последующего, вблизи точки поворота квази- квазиклассическое приближение становится неприменимым. Между тем, не зная волновую функцию в точке поворота, нельзя произ- произвести смыкание волновой функции на границе дозволенной и не- недозволенной области. Иными словами, нельзя определить по- постоянные, фигурирующие в осциллирующем и экспоненциальном выражениях, без чего квазиклассические волновые функции не имеют никакой практической ценности. Однако прежде чем перейти к расчету волновой функции в точке поворота, следует выяснить, почему в этой точке квазиклассическое решение те- теряет смысл. Для этого оценим пределы применимости получен- полученных выражений C9,16) и C9,16'). Прежде всего заметим, что при подстановке в уравнение C9,3) S = 50 мы опустили, как малый, член у-А50. Чтобы это было справедливо, должно выполняться неравенство I y~ ASo I < у- (V50J, C9,17) или, учитывая, что VSo = р, ?|Vp|<p2. C9,18) Для одного измерения последнее неравенство перепишется в виде 'Ср2. C9,19) Вводя вместо импульса р волновое число k и соответствующую длину волны Х = — = у, имеем U<L C9>20> Таким образом, мы видим, что уравнение Шредингера сво- сводится к уравнениям C9,5), C9,6) при выполнении условия C9,20). Именно, для применимости квазиклассического прибли- приближения необходимо, чтобы длина волны де Бройля достаточно медленно изменялась в пространстве от точки к точке. Иными
§ 39] ПРЕДЕЛЬНЫЙ ПЕРЕХОД К КЛАССИЧЕСКОЙ МЕХАНИКЕ 15? словами, относительное изменение волнового числа на протяже- протяжении длины волны должно быть мало по сравнению с единицей Х-т- -jr- <С 1. Отметим также, что и относительное изменение К CLX I производной от волнового числа k на протяжении длины волны де Бройля для частицы должно быть мало. Действительно, при получении уравнений C9,5), C9,6) мы воспользовались также условием fcl AQ I **' I Л С I OJOk 01 \ П \ ZAOj | <^ч | ZAOO |« \O\Jy/Li) Учитывая одномерность задачи и вводя волновое число k, перепишем это неравенство в виде d2k dx2 dk Х< .2* I C9,22) dx При движении частицы в потенциальном поле U(x) удоб- удобно выразить волновое число через потенциальную энергию по формуле и представить условие C9,20) в виде < 1 C9,23) < 1. C9,24) или т Ь2 Пользуясь C9,22), можно написать соответствующее нера- неравенство и для второй производной от функции U. Отсюда вид- видно, что квазиклассическое приближение справедливо: 1) когда длина волны де Бройля достаточно мала (т.е. ча* стица является достаточно быстрой); 2) при достаточно медленном изменении потенциальной энер- энергии от точки к точке, когда на длине порядка X не происходит заметного изменения импульса частицы. Из C9,23) становится ясно, почему квазиклассическое вы- выражение для волновой функции теряет смысл в точке поворота. Уже вблизи точки поворота импульс частицы становится ма- малым и квазиклассическое приближение оказывается непри- неприменимым. Формулировки «достаточно мала» и «достаточно медленно» в 1) и 2) должны подчеркнуть то обстоятельство, что поскольку в критерии C9,20) — C9,24) входит масса частицы и конкрет- конкретная характеристика поля — величина dU/dx, то в разных полях и для разных частиц квазиклассическое приближение будет справедливо при движении с различными энергиями. Для.
154 КВАЗИКЛАССИЧЕСКОЕ ПРИБЛИЖЕНИЕ [ГЛ. V качественных оценок можно переписать C9,20) в упрощенном виде. Именно, считая, что изменение длины волны происходит в области действия силового поля, имеющего конечную протя- протяженность а, можно вместо C9,20) записать: или 2ma2 C9,25) Для а-частиц (т = 6,7-10~24 г) с энергией Е = 1 Мэв, проле- пролетающих через атомную оболочку (а ~ 10~8 см), неравенство C9,25) выполняется в хорошем приближении. Напротив, для тех же а-частиц с энергией 10 Мэв, испытывающих непосред- непосредственное соударение с ядром (а ~ 10~13 см), квазиклассическое рассмотрение неприменимо. В области существенно больших энергий применение квазиклассического приближения оказы- оказывается возможным и при рассмотрении некоторых процессов, связанных с ядерными соударениями. § 40. Решение уравнения Шредингера вблизи точки поворота Вернемся теперь к рассмотрению поведения волновой функ- функции вблизи точки поворота. Идея этого рассмотрения заключается в следующем: по- поскольку вблизи точки поворота квазиклассическое приближение оказывается неудовлетвори- неудовлетворительным, необходимо найти решение уравнения Шрединге- Шредингера, не используя это прибли- приближение. Возможность получения такого решения при произволь- произвольном виде потенциальной энер- энергии связана с тем, что выра- выражение для потенциальной энер- энергии вблизи точки поворота допускает весьма существен- существенное упрощение (см. ниже). Ес- Если искомое решение найдено, то следует определить его асим- асимптотическое поведение на больших расстояниях по обе стороны от точки поворота, в тех областях, где уже справедливо квази- квазиклассическое приближение. Потребовав совпадения квазиклас- квазиклассического решения с полученным асимптотическим выражением, мы сможем определить соответствующие постоянные. Переходя к реализации этой программы, заметим, что около точки поворота (рис. 12) можно разложить потенциальную и 0 . с а х Рис. 12.
§ 40] РЕШЕНИЕ У. Ш. ВБЛИЗИ ТОЧКИ ПОВОРОТА 155 энергию U(x) в ряд по малым отклонениям ? = х — а и огра- ограничиться линейным членом в этом разложении. При этом мы предполагаем, что в точке поворота кривая U(x) имеет плав- плавный ход, как это изображено на рис. 12. Мы будем также счи- считать, что область х > а простирается до бесконечности. Вблизи точки х = а можем записать: Jx-a)+ ... D0,1) Потенциальная энергия в точке а совпадает с полной энергией частицы U (а) = Е. Обозначим через / силу, действующую на с dU I частицу в точке поворота / = —^- , и введем новую пере- р у менную 1 = х — а=—т—. Уравнение Шредингера вблизи точки х = а запишем как ^ = 0. D0,2) Уравнение Шредингера такого вида было нами рассмотрено в § 13. Уравнение D0,2) совпадает с уравнением A3,5) при Е = 0. Следовательно, волновая функция, удовлетворяющая уравнению D0,2) и условию конечности при g—*±оо, выра- выражается через функцию Эйри. Мы воспользуемся сразу асимпто- асимптотическими выражениями A3,9) и A3,10). Это означает, что рас- рассматриваются значения |, достаточно большие, чтобы можно было пользоваться acnivптотическими выражениями, и в тоже время такие, что разложение D0,1) еще применимо. В полях, удовлетворяющих условию квазиклассичности, такая область, как правило, существует. Соответственно в области х » а решение уравнения D0,2) имеет вид <40>3> где 2С — постоянная нормировки. Импульс р при движении в поле D0,1) имеет вид р = V2m (?-?/)= l/2m/f. D0,4) Выразим через переменную | действие х I I J pdx=\pdl=VW JVa = 4 VWi3/a- D0,5)
156 КВАЗИКЛАССИЧЕСКОЕ ПРИБЛИЖЕНИЕ [ГЛ. V Пользуясь D0,5), мы можем представить волновую функцию D0,3) в виде x-f)' D0i6) Мы видим, что функция D0,6) имеет квазиклассический вид [см. C9,16)]. Найдем теперь функцию в области х < а. Пользуясь опять асимптотическим выражением A3,9) и выражениями D0,4), D0,5), имеем D0,7) где С — та же нормировочная постоянная, что и в формуле D0,6). Таким образом, мы получили выражение для квазиклас- квазиклассической волновой функции, справедливой слева и справа от точки поворота х = а. Выпишем окончательно выражения квазиклассической волно- волновой функции: с* 1 Г * J \p\dx VTH D0,8) 2С -4= cos - Vp U Постоянная С определяется из условия нормировки. Аналогичным образом, если разрешенная область лежит слева от точки поворота Ь, т. е. U(x) < Е при х < b и U(x) > Е яри х > 6, то волновая функция запишется в виде -4- f \P\dx VTpT $ D0,9) Итак, нами найдена в квазиклассическом приближении •функция у\р(х), удовлетворяющая уравнению Шредингера. По- Полученное решение не является еще полным, поскольку линейное
i 40] РЕШЕНИЕ У. Ш. ВБЛИЗИ ТОЧКИ ПОВОРОТА 157 уравнение второго порядка имеет два линейно независимых ре- решения. В случае волновой функции, зависящей от одной неза- независимой переменной, второе решение уравнения Шредингера может быть легко получено. Именно, если xpi и грг — две линейно независимые функции, удовлетворяющие одномерному уравне- уравнению Шредингера и отвечающие энергии Е, то они всегда свя- связаны соотношением _L ^!iL - -L г|)! dx2 г|J dx2 Интегрируя, получаем •-const. D0,10) D0,11) Решение, линейно независимое от D0,8), ищем в виде с* \p\dx 1}Г\Р\ ' " D0,12) (if \ os ^- pdx + a) (x>a). *(*) = Выражения D0,8) и D0,12) следует подставить в соотношение D0,11). При этом в силу неравенства C9,20) достаточно огра- ограничиться дифференцированием по аргументам экспоненциаль- экспоненциальной и тригонометрической функций. Приравнивая выражения, получаемые при х < а и х > а, находим Окончательно полагаем: Таким образом, решение, линейно независимое от D0,8), может быть выбрано в виде ¦ю- В VTFT D0,13)
158 КВАЗИКЛАССИЧЕСКОЕ ПРИБЛИЖЕНИЕ [ГЛ. V Соответственно решение, линейно независимое от D0,9), напи- напишется как D0,14) Полученные выражения будут непригодными в том случае, когда в точке поворота, например, точке 6, потенциальная энер- энергия скачком обращается в бесконечность. В этом случае в об- области х > 6, ф = 0. Фаза волновой функции при х < b может быть определена, если условия применимости квазиклассиче- квазиклассического приближения C9,20) остаются справедливыми вплоть до точки х = Ь. При этом, учитывая, что t|)F) = 0, получаем 1 /if \ — sin I -r pdx\. Р \В i ) -ф(х) = Л-~г sin j~ I pdx). D0,15) § 41. Движение в потенциальной яме в квазиклассическом приближении Применим полученные результаты к движению частицы в по- потенциальной яме. При этом мы найдем приближенную формулу для спектра энергии. Ее сравнение с точными формулами позво- позволит нам наглядно судить о степени точности и достоинствах квазиклассического приближения. Наряду с этим решение по- поставленной задачи представляет большой интерес в другом от- отношении. Оно позволяет выяснить связь между квантовой меха- механикой и старой теорией Бора. Рассмотрим, прежде всего, потенциальную яму с бесконечно высокими стенками (см. § 8). Волновая функция в квазикласси- квазиклассическом приближении дается формулой типа D0,15). Именно ±j pdxj. D1,1) В потенциальной яме будет две точки поворота а и 6, в которых волновая функция должна обращаться в нуль. Таким образом, в обоих точках поворота должно выполняться условие ф = 0 или ь
ДВИЖЕНИЕ В ПОТЕНЦИАЛЬНОЙ ЯМЕ 159 Это условие выполнено, если = mt, D1,3) где п — целые положительные числа, начиная с единицы. По- Поскольку импульс постоянен и равен У2тЕ, находим D1,4) ^ ~~ 2т/2 где / = Ь — а — ширина ямы. Мы видим, что в простейшем случае бесконечно глубокой по- потенциальной ямы квазиклассическое приближение приводит к точному выражению для энергетиче- энергетического спектра (см. § 8). Рассмотрим теперь общий случай по- потенциальной ямы, изображенной на рис. 13. Мы будем считать, что запре- запрещенная область простирается справа и слева от точек поворота как угодно да: леко. При этом квазиклассическая вол- волновая функция не будет содержать экс- экспоненциально возрастающих слагаемых и дается формулами типа D0,8) или D0,9). Обе волновые функции, D0,8) и D0,9), описывающие движение частицы в яме, должны быть тождественными выра- выражениями 1 ?-- ^ — I-cos(lf\d*. j\^)=2C'^cos(lJprf*-|) а * ^ х ' (а<х<Ь). D1,5) Последнее возможно лишь в том случае, если сумма обеих фаз равна целому кратному п ь :-j = nnt D1,6) где п — целое число. При этом С'=(-1)«С. D1,7) Если ввести интеграл по периоду классического движения ча- ъ стицы от а до Ь и обратно j pdx = уф pdx, то из D1,6)
160 КВАЗИКЛАССИЧЕСКОЕ ПРИБЛИЖЕНИЕ [ГЛ. V получаем j>pdx = 2nh{n + ^j. D1,8) Последнее выражение представляет не что иное, как правило квантования Бора, из которого определяются стационарные со- состояния частицы в квазиклассическом случае. Таким образом, теория Бора с ее непоследовательным наложением условий кван- квантования на чисто классические величины оказывается совершен- совершенно правильной в пределах квазиклассического приближения. Отметим, что число п равно числу корней квазиклассической волновой функции между точками поворота а и Ь, так как при изменении х от а до b фаза волновой функции возрастает от —я/4 до (я + у)я — —• и, следовательно, косинус п раз обра- обращается в нуль. Чем больше квантовое число п, т. е. чем меньше соответственно длина волны де Бройля, тем лучше условия при- применимости квазиклассического приближения C9,20). Мы долж- должны ожидать, следовательно, что уровни энергии, полученные из условия D1,8), совпадают при больших числах п с их точными значениями, вычисленными из решения уравнения Шредингера. В некоторых случаях однако, как, например, для гармоническо- гармонического осциллятора, формула D1,8) дает правильное значение уров- уровней энергии при любых числах п. Интеграл, стоящий в левой части уравнения D1,8), представляет площадь, охватываемую классической фазовой траекторией частицы с энергией Е на ее фазовой плоскости. Согласно D1,8), эта площадь при п » 1 равна 2пЬп. Поскольку каждому узлу волновой функции отве- отвечает некоторый уровень энергии системы, число п дает нам число состояний с энергиями меньшими или равными Е. Таким образом, на одно квантовое состояние в фазовой плоскости при- приходится площадь, равная 2яй. Число состояний, отвечающих площади на фазовой плоскости Ар Ах, будет равно Чя- («л Обобщая эту формулу на трехмерный случай, очевидно, по- получим число состояний, отвечающих объему Ах Ay Az Арх Ару Арг в фазовом пространстве Эта формула была положена в основу нашего изложения статистической физики. Мы видим, что квазиклассическое при- приближение представляет как бы мост, соединяющий классиче- классическую и квантовую механику. Оно позволяет понять смысл тео- теории Бора и принципа соответствия и дает возможность устра-
§42] ПРОХОЖДЕНИЕ ЧЕРЕЗ ПОТЕНЦИАЛЬНЫЙ БАРЬЕР 161 нить все кажущиеся противоречия между различными сторо- сторонами поведения реальных частиц. С помощью квазиклассиче- квазиклассического приближения мы можем непосредственно проследить за тем, при каких условиях и с какой степенью точности можно перейти к классическому описанию движения частиц в тех или иных задачах. Вместе с тем оно дает сравнительно простой способ прибли- приближенного описания квантовых систем, в частности частиц высокой энергии, нахождения энергетических уровней и т. п. § 42. Прохождение через потенциальный барьер В § 13 мы рассмотрели прохождение микрочастицы через прямоугольный потенциальный барьер. В этом параграфе мы получим более общие формулы для случая прохождения частиц через потенциальные барьеры произ- произвольной формы (рис. 14). Мы будем предполагать, что энергии частиц Е достаточно велики, а ход потенциаль- потенциальной энергии является достаточно плав- плавным для того, чтобы во всем про- пространстве, за исключением лишь не- небольших областей около точек пово- поворота а и 6, были выполнены условия применимости квазиклассического при- приближения. Пусть частица падает на барьер, двигаясь слева направо вдоль оси х. Тогда в области за точкой поворота а, т. е. при х > а, должна существовать только волна, распространяющаяся в по- положительном направлении оси х (в этой области нет отражен- отраженной волны). Квазиклассическая волновая функция при х > а может быть взята в виде суперпозиции выражений D0,8) и D0,13) U Рис. 14. ф (х) = 2С -tL cos Vp D2,1) Поскольку на больших расстояниях от точки а импульс р из- изменяется мало, каждое слагаемое в D2, 1) является наложе- наложением двух плоских волн, распространяющихся в противополож- противоположных направлениях. Легко видеть, что суперпозиция D2,1) опи- описывает волну, распространяющуюся слева направо лишь при условии В=-2С/. В. Г. Левич и др., том II
162 При этом КВАЗИКЛАССИЧЕСКОЕ ПРИБЛИЖЕНИЕ [ГЛ. V D2,2) Найдем квазиклассическую волновую функцию в области Ь<х<а. Беря суперпозицию D0,8) и D0,13) и учитывая найденное соотношение между В и С, получаем Это соотношение удобно переписать в виде 2ieLe (b<x<a), D2,4) где а Пользуясь теперь соотношениями D0,9) и D0,14), не пред- представляет труда получить выражение для волновой функции в области перед барьером D2,5) Итак, мы представили волновую функцию в области перед барьером в виде суперпозиции падающей и отраженной волн. Определим теперь коэффициент прохождения D частиц через
§ 42] ПРОХОЖДЕНИЕ ЧЕРЕЗ ПОТЕНЦИАЛЬНЫЙ БАРЬЕР 163 барьер. Пользуясь D2,2), вычисляем плотность потока частиц, прошедших через барьер /пр /пр = 4!С|2-^. D2,6) Плотность потока падающих частиц в соответствии с D2,5) равна 1AJ D2,7) Следовательно, для коэффициента прохождения D получаем следующее выражение: D2>8) Для достаточно широкого потенциального барьера e~2L <C 1, и мы получаем D = e-2L = e a . D2,9) Отметим, что если потенциальная энергия с одной стороны барьера меняется достаточно быстро, так что квазиклассическое приближение неприменимо, то в выражении D2,9) появится предэкспоненциальный множитель. Однако основной экспонен- экспоненциальный множитель не меняется. Формула D2,9) широко при- применяется в квантовой механике для вычисления вероятностей прохождения частиц через потенциальные барьеры. В виде примера рассмотрим теорию а-распада. Хорошо из- известно, что все тяжелые ядра с массовыми числами порядка двухсот оказываются нестабильными по отношению к а-рас- паду. Вероятность распада сильно зависит от энергии вылетаю- вылетающих а-частиц и изменяется в очень широких пределах. Так, если вероятность распада характеризовать периодом полураспада т, то у Ро234, испускающего а-частицы с энергией 7,8 Мэв, т рав- равно 1,6- Ю сек, а у Th232 при энергии а-частиц, равной 4 Мэв, т равно 1,4 • 1010 лет. Такая резкая зависимость вероятности а-распада от энергии объясняется тем, что частица для вылета из ядра должна пройти через потенциальный барьер1). Дей- Действительно, упрощая рассмотрение, мы можем предположить, что исходное ядро уже содержит готовую а-частицу. При этом задача сводится к вычислению вероятности того, что а-частица покинет исходное, материнское ядро. О R. Gurney, E. Condon, Nature 122, 439 A928); Phys. Rev. 33, 127 A929).
164 КВАЗИКЛАССИЧЕСКОЕ ПРИБЛИЖЕНИЕ [ГЛ. V (r>rQ), Обозначим через U(r) энергию взаимодействия а-частицы с оставшимся дочерним ядром. На малых расстояниях U(r) сводится к потенциалу ядерных сил, который мы будем считать постоянным и равным UOi а на больших расстояниях — к куло- новскому взаимодействию а-ча- а-частицы и оставшегося ядра (рис. 15) 2Ze2 где го — расстояние порядка разме- размера ядра. Воспользовавшись формулой D2,9), мы можем найти для а-ча- стиц вероятность прохождения че- через потенциальный барьер. То обстоятельство, что формула D2,9) выведена для одномерного движения, здесь не существен- существенно, как так мы установили в § 35, что радиальное движение сводится к одномерному с некоторой эффективной потенциаль- потенциальной энергией. Для простоты мы рассмотрим случай, когда / = 0, так что центробежная энергия в расчеты не войдет (см. также следую- следующий параграф). Тогда имеем Рис. 15. где точка поворота а определяется условием а ¦¦ 2Ze2 D2,10) a ji — приведенная масса а-частицы и дочернего ядра. Вычислим ин- интеграл L: t/макс Г0 Уг ' где иы 2Ze2 Произведя замену переменных 1/ -т? = sina, легко по- г f ^макс Го лучим: L = -х— (я — 2a0 — sin 2a0), D2,11) где sin a0:
<§ 43] ДВИЖЕНИЕ В ЦЕНТРАЛЬНО-СИММЕТРИЧНОМ ПОЛЕ 165 и v = У2Е1\л — скорость а-частицы, если пренебречь отличием приведенной массы \х от массы а-частицы. Таким образом, ве* роятность,.прохождения а-частицы через барьер дается выра* жением D = ехр { - Ц?- (я - 2а0 - sin 2а0)}. D2,12) Вероятность а-распада X мы получим, если умножим вероят- вероятность D прохождения через барьер на вероятность а-распада при отсутствии барьера v A, = vD. Величину v трудно вычислить сколько-нибудь точно. Суще- Существенно, однако, что очень сильная зависимость вероятности распада от энергии а-частицы заключена в множителе D. Каче- Качественно эта зависимость хорошо подтверждается экспери- экспериментом. Заметим, наконец, что подобные же рассуждения приме- применимы и к случаю спонтанного деления тяжелых ядер. § 43. Квазиклассическое движение в центрально-симметричном поле Определим приближенное выражение для радиальной со- составляющей волновой функции /?(/*) или функции %(г) = rR при условии, что потенциальная энергия U(r) удовлетворяет усло- условию квазиклассичности. При этом мы можем воспользоваться уже выведенными соотношениями, поскольку функция %(г), как мы знаем (см. § 35), описывается одномерным волновым урав- уравнением Шредингера с эффективной потенциальной энергией При этом нужно, конечно, учитывать, что координата г, в отли- отличие от х, меняется от 0 до <х>. При 1 = 0 имеем ?/эфф(г) = U(r). Если условия квазиклассичности выполняются вплоть до точки г = 0, то соответствующая волновая функция легко может быть получена. Действительно, условие конечности волновой функ^ ции в нуле дает х@) = 0 и, пользуясь D0,27), получаем: В более общем случае / Ф 0 условию квазиклассичности должна удовлетворять эффективная потенциальная энергия #(О- Если считать, что на малых расстояниях основную роль
166 КВАЗИКЛАССИЧЕСКОЕ ПРИБЛИЖЕНИЕ [ГЛ. V играет центробежная энергия —2 2 и р^—> то из уело» вия C9,20) следует /3>1. Соответствующая волновая функция при гС8> я, где а — точка поворота, может быть написана в виде D0,20) при условии, однако, что в центробежной энергии вели- A \2 1 + ~2/ ^: 2m \E-U(r) к^г-Ч • D3,3) где Таким образом, к центробежной энергии добавлен член Ь2/8тг2. Эта добавка приводит к более правильному значению фазы волновой функции. Так, для свободного движения U = 0 фор- формула D3,2) дает для фазы волновой функции на больших расстояниях значение, полученное нами в § 35. >) Ы. A. Kramers, Zeits, f. Physik 39, 828 A926).
ГЛАВА VI МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ § 44. Операторы и матрицы Развитый в предыдущих главах расчетный метод квантовой механики — метод линейных эрмитовых операторов, не яв- является единственным расчетным аппаратом, применяемым в квантовой механике. Оказалось, что наряду с операторами всем механическим величинам в квантовой механике можно сопоста- сопоставить так называемые эрмитовы матрицы. Под матрицей R пони- понимают совокупность величин, образующих таблицу Rn R12 R21 R22 /г2 D4,1) Число строк и столбцов в таблице может в общем случае не совпадать. Каждая из величин (вообще говоря комплексных), стоящих в таблице, носит название матричного элемента. Мат- Матричный элемент имеет два индекса — первый означает номер строки, второй — номер столбца. Понятие о матрицах обычно вводится в связи с линейным преобразованием векторов в про- пространстве л-измерений !). Несколько ниже мы увидим, что в квантовой механике имеется возможность геометрической интерпретации волновой функции, как вектора в некотором воображаемом пространстве. Пока же при помощи весьма общего рассуждения убедимся, что каждому линейному оператору F может быть сопоставлена матрица F с определенными значениями матричных элементов. Задание оператора означает, что задан результат действия *) См. более*подробно В. И. Смирнов, Курс высшей математики, т. III, ч. I, Физматгиз, 1958, стр. 95.
168 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI его на функцию ty(x) Rty(x) = q>{x). D4,2) Перейдем от ^-представления к ^-представлению. Для этого разложим функции г|)(л:) и ф(х) по собственным функциям tym(x) оператора F. Будем предполагать, что оператор F обла- обладает дискретным спектром. Например, представлением такого рода может быть энергетическое представление (?-предста- вление) 2 D4>3> Совокупность амплитуд ст (или Ьп) определяет волновую функцию \|) (или ф) в /'-представлении. Иногда эту совокуп- совокупность удобно обозначать в виде столбца <Ь, D4,4) Разложение D4,3) подставляем в D4,2). Получаем 2 MU4-2 *«*¦«(*). Умножая левую и правую части этого равенства на ^(х) и ин- интегрируя по всей области изменения независимых переменных, найдем 2 D4,5) где Rlm=i^(x)bm(x)dV. D4,6) Соотношение D4,5) определяет непосредственно в F-представ- лении преобразование функции яр в функцию ф под действием оператора R. Оператор R в этом представлении дается форму- формулой D4,6), т. е. в виде матрицы. Таким образом, задание мат- матрицы R эквивалентно заданию самого оператора R. Матричный элемент Rih иногда называют матричным эле- элементом, отвечающим переходу из fe-ro состояния в «-е состояние. Такая терминология основана на следующем рассуждении. Предположим, что исходным состоянием системы является k-e состояние г|?(#)= г|?ь(л;). При действии оператора R имеет место
$ 44] ОПЕРАТОРЫ И МАТРИЦЫ 169 преобразование D4,2). Пользуясь D4,3), D4,5) и учитывая, что в данном случае ст = бт^, bn = Rnu, получаем Ф (х) = ^ = 2»А=2 Rnk^n (x), D4,7) и следовательно квадрат модуля матричного элемента Rik оп- определяет вероятность нахождения системы в f-м состоянии. Зная матрицу, отвечающую величине /?, не представляет труда найти и среднее значение этой величины в некотором со- состоянии г|). По общей формуле B2,4) имеем Подставляя сюда вместо ф разложение D4,3), получаем ^т^„ • D4,8) Заметим, что если мы определим матричные элементы D4,6) с помощью волновых функций г|)т, которые являются собствен- собственными функциями оператора R, то мы тем самым определим матрицу оператора R в собственном представлении ^dV = Л^. D4,9) Мы видим, что в этом случае отличны от нуля лишь мат- матричные элементы с т = /. Матрицы такого вида называются диагональными /?„ О 0 .. О /?22 0 .. R О О R, 33 D4,10) Таким образом, в своем собственном представлении любой опе- оператор изображается диагональной матрицей, причем диагональ- диагональные элементы равны собственным значениям этого оператора. Задание матричных элементов Rmi полностью эквивалентно заданию оператора R. Оно позволяет определить, как мы уви- увидим, собственные значения и собственные функции этого опера- оператора. С другой стороны, если известен оператор R, то могут быть определены и матричные элементы Rmi. Эрмитовость оператора R налагает известное ограничение на вид матричных элементов Rmi- Именно, для матричного эле- элемента R*ml, комплексно сопряженного элементу RmU имеем
170 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ По определению эрмитового оператора так что [ГЛ. VS Мы видим, что из требования эрмитовости оператора выте* кает свойство матричных элементов р = р* /44 11> 1171 ТГИ, \ г г именуемое эрмитовостью матрицы. Итак, каждой физической величине в квантовой механике наряду с эрмитовым оператором R можно сопоставить эрми- эрмитову матрицу /?, матричные элементы которой определяются формулой D4, 6). Как мы увидим ниже, матричная форма квантовой механики в некоторых случаях удобнее операторной. Представление- квантовой механики в матричной форме позволит нам сформу- сформулировать уравнения квантовой механики по образу уравнений классической физики. В них не будет более фигурировать вол- волновая функция. Сами уравнения по форме будут совпадать с уравнениями классической механики, но с тем лишь принци- принципиальным отличием, что в этих уравнениях классические вели- величины будут заменены соответствующими матрицами. Однако прежде чем перейти к систематическому изложению квантовой механики в матричной форме, необходимо привести основные: понятия матричного исчисления. § 45. Основы матричного исчисления В предыдущем параграфе мы определили произвольную матрицу /?, как совокупность величин Rtm9 расположенных в определенном порядке в виде таблицы Rn R12 • • • R21 R22 • • • D5,1) Матрицы, у которых число столбцов равно числу строк, на- называются квадратными. Матрица может быть как конечной,.
•§ 45] ОСНОВЫ МАТРИЧНОГО ИСЧИСЛЕНИЯ 171 если конечно число столбцов и число строк, так и бесконечной, если оно как угодно велико. Матричные элементы RUi #22, ••• ,.., Rnn, •••> образующие диагональ матрицы, называются диа- диагональными. Нулевой матрицей О называют матрицу, все эле- элементы которой равны нулю. Единичной матрицей называют диа- диагональную матрицу, у которой все диагональные элементы равны единице. Будем обозначать эту матрицу через 1: D5,2) т. е. (l)mn = Smn. Матрицу можно рассматривать как некоторое гиперкомплексное число, подобно тому, как совокупность двух чисел а и b можно трактовать как одно комплексное число а + ib. Как и для комплексных чисел, можно построить алгебру гиперкомплексных чисел — матриц, определив действия сложе- сложения и умножения матриц. Суммой двух матриц F и D называется матрица R, каждый из матричных элементов которой равен сумме соответствующих матричных элементов матриц F и D 1 0 0 0 1 0 0 .. 0 .. 1.. ] если \ D5,3) D J При этом складывают или вычитают подобные матрицы, т. е. матрицы, имеющие одинаковое число столбцов и строк. Две ма- матрицы F и D равны между собой, если равны соответствующие матричные элементы если \ D5,4) Fml-Dmi-) Определим, далее, произведение числа k на матрицу D как такую матрицу F, каждый матричный элемент которой равен произведению числа k на соответствующий матричный элемент матрицы D: Матрица L называется произведением матриц F и D,
172 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI если матричный элемент Lmn равен Lmn^FmlDln. D5,6) Это означает, что каждый матричный элемент матрицы L равен сумме произведений элементов /n-й строки матрицы F на эле- элементы az-го столбца матрицы D. Матрицу F можно умножать на матрицу D только в том слу- случае, когда число столбцов матрицы F равно числу строк матри- матрицы D. Подчеркнем, что произведение матриц, как и произведем ние операторов, некоммутативно, т. е. в общем случае FD Ф DF. Если в качестве одного из сомножителей взять единичную матрицу D5,2), то мы придем к равенствам Fl = lF = F, D5,7) т. е. умножение на единичную матрицу коммутативно. Заметим, что при умножений двух матриц с отличными от нуля матрич- матричными элементами может получиться нулевая матрица. Пусть* например, /1 0\ /О (Г Ч. о> Mi 1. Тогда /О L-pD-[o С другой стороны, /О Аналогично D5,6) можно образовать произведение трех и более матриц. Так, если FD = L, то произведение RFD равно (RFD)mn = 2 RmiUn = S 2 RmiFipDpn. D5,8) К точно такому же выражению придем, если возьмем произ-* ведение матрицы (RF) на матрицу Ь. Таким образом, для ма- матричного произведения справедлив сочетательный закон (RF)D = R(FD). D5,9) Легко показать также, что справедлив и распределительный закон D5,10) Определение основных действий над матрицами, даваемое формулами D5,3) — D5,6), полностью соответствуют аналогич-
§ 45] ОСНОВЫ МАТРИЧНОГО ИСЧИСЛЕНИЯ 173 ным соотношениям для линейных операторов. Для формул D5,3) — D5,5) это утверждение очевидно. Нетрудно убедиться в этом соответствии и для формулы D5,6). Пусть ^оператор L равен произведению операторов F и D, т. е. L = FD. Найдем матрицу, отвечающую этому оператору, в некотором произволь- произвольном представлении. Предположим, что оператор D преобразует функцию г|) в функцию ср, а оператор F соответственно ф в %у так что ф = о*>,) g D5,11) Перепишем эти равенства, разложив волновые функции i|v Ф и % в ряд по некоторой системе функций i|)m. Пусть имеют ме- место разложения •Ф = 2 Сг$п\ ф = 2 б/Фг. х = 2 d^ik» n f /г Сравнивая с D4,2) и D4,5), получаем bi = 2 ^//г^/г, ^w = 2 Z7m/Ь/- Подставляя Ъг во второе из полученных равенств, имеем 2 2 D5,12) С другой стороны, учитывая, что % = L\|), можем записать dm=2Zwv D5,13) /г Сравнивая D5,13) с D5,12), приходим к равенству D5,6). Если некоторая матрица F имеет неодинаковое число столб- столбцов и строк, то, вычеркивая некоторое число столбцов или строкг можно прийти к квадратной таблице с равным числом строк и столбцов. Из этой таблицы вычисляется определитель det F ма- матрицы F. Наивысший возможный порядок этого определителя полу- получается при вычеркивании минимального числа строк или столб- столбцов. Наивысший порядок не равного нулю определителя, полу- получающегося из матрицы, называют рангом матрицы. В некоторых приложениях важную роль играет сумма диа- диагональных элементов матрицы, именуемая часто шпуром (нем. Spur — след). По определению
174 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI Матрица F называется несингулярной, если можно построить матрицу, обратную к ней. Обратная матрица, которую мы обо- обозначим через F'\ удовлетворяет уравнениям FF~l=U F~lF=l. D5,14) Чтобы найти элементы матрицы F~\ нужно найти решение си- системы однородных линейных уравнений, которая получается из определения D5,14): 2 (Л«* (F~\n = 6wrt; 2 (F~l)miFtn = бтл D5,15) k i при всевозможных значениях тип. Система уравнений D5,15) может быть разрешена только в том случае, если детерминант det F матрицы F отличен от нуля. (Предполагается, что матрица F — квадратная.) Пользуясь D5,14), легко найти матрицу, обратную произве- произведению матриц RFD... (если она существует) (RFD ...Г1- ... D-lF~]R~l. D5,16) Определим далее матрицу F+, сопряженную (или эрмитово сопряженную) с исходной матрицей F (F+)mn = (Fnmy. D5,17) Комплексно сопряженный матричный элемент (Fnm)* мы будем обозначать как F*nm. Из определения D5,17) непосредственно следует, что (F + D)+ = F+ + D+. D5,18) Легко определить также матрицу, сопряженную произведению матриц. Так, если L = FD, то (L+)mn - Ст = S F*nkDlm = 2 {D+)mk (F+)kn D5,19) и, следовательно, (FD)+ = D+F+. D5,20) В частности, если L = kD, где k — число, то L+ = k'D+. D5,21) Соотношение D5,20), конечно, сразу обобщается на произве- произведение любого числа матриц (FDR ...)+= ... R+D+F+. D5,22)
§ 45] ОСНОВЫ МАТРИЧНОГО ИСЧИСЛЕНИЯ 175 Если матрица F совпадает со своей сопряженной матрицей F+, р _ р+ то она является эрмитовой или самосопряженной. Это определение совершенно аналогично определению эрмитовости оператора (см. D4,11)). Для матричных элементов эрмитовой матрицы имеем: Fnm = (F+)nm = F*mn. D5,23) Матрица F называется унитарной, если F+ = 77-1, Последнее ус- условие можно также переписать как p+F==Fp+=lt D5,24) Если матрицы F и D унитарны, то унитарно и их произведение. Действительно, (Р ?>)+ = D+F+ = /Г1/? = (FD)~l. D5,25) Мы будем встречаться также с простейшими функциями мат- матриц, причем задание функции от матрицы означает задание закона, по которому одной матрице сопоставляется другая мат- матрица. Так как правила умножения и сложения матриц опреде- определены, то не представляет труда ввести понятие целой рацио- рациональной функции f(D) матрицы D. Кроме того, мы будем иметь дело и с более сложными функциями, например вида eD, где D — некоторая матрица. Под функцией eD понимается следую- следующий ряд: eD=l+D + jD*+ ... +~^Dn+ ... D5,26) Покажем, например, что матрица /?, определяемая функцией eiF, R = eiF, где F — произвольная эрмитова матрица, унитарна. Непосредственным вычислением легко проверить, что матрицей 7?-1, обратной R, служит матрица e~iF. С другой стороны, для матрицы, сопряженной к R, имеем (так как F+ = F). Таким образом, R+ = R~l и, следовательно, матрица R унитарна. Сформулированные в этом параграфе правила действия оста- останутся справедливыми и для матриц с бесконечно большим чис- числом столбцов и строк, если только все возникающие ряды, на- например D5,6), будут сходящимися. Как мы уже упоминали ранее, введение матриц тесно свя- связано с понятием о линейном преобразовании я-хМерного вектора.
176 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI Понятие /2-мерного вектора является естественным обобщением обычного понятия о векторе. Вектор х в я-мерном пространстве задается совокупностью /г, вообще говоря, комплексных чисел, именуемых компонентами этого вектора хи х2, ..., хп. Вряд ли стоит оговаривать, что пространство я-измерений не связывается с какой-либо физической реальностью, и вектор в я-мерном про- пространстве имеет характер математического обобщения. Как и для обычных векторов, можно ввести понятие о скалярном про- произведении двух векторов х и у в пространстве я измерений. Именно, скалярное произведение вектора у на вектор х опреде- определяется как (*, У)=%х]У1. D5,27) Если вектор х имеет вещественные компоненты, то определение D5,27) совпадает с обычным определением скалярного произ- произведения. Наоборот, если компоненты хотя бы одного из векторов х или у комплексны, то определение D5,27) приводит к новым важным следствиям. Образуем скалярное произведение вектора х на этот же век- вектор х (*, *)=i*X=2UJ2. D5,28) Оно представляет обобщение понятия о квадрате вектора на случай комплексных значений компонент. Длиной или нормой вектора называют величину У 2|*,Р. D5,29) Скалярное произведение двух векторов в /г-мерном простран- пространстве, очевидно, некоммутативно п п (ж, у) = 2 x\yt Ф (у, ж) = 2 y\xt. i = 1 i •¦= 1 Если скалярное произведение двух векторов равно нулю (х, у) = 0, то такие векторы называются взаимно ортогональ- ортогональными. Рассмотрим две системы координат k и k' с взаимно орто- ортогональными осями. Пусть компоненты некоторого вектора в системе k суть х?-, а в системе kf — x'r Как и в трехмерной евклидовой геометрии, имеет место линейная связь между
$ 451 ОСНОВЫ МАТРИЧНОГО ИСЧИСЛЕНИЯ компонентами, выражаемая соотношением 177 D5,30) Совокупность чисел аги образует матрицу ап а12 ... аы а21 а22 • • • а2п ап{ ап2 ... ап называемую матрицей линейного преобразования. При линейном ортогональном преобразовании D5,30) имеет место условие п п (*,*)= 2 \x, f = (*',*') -S D5,31) Преобразование D5,30), удовлетворяющее требованию D5,31), т. е. оставляющее неизменным квадрат длины вектора, назы- называется также унитарным преобразованием. Понятие вектора с комплексными значениями компонент в л-мерном пространстве может быть обобщено на случай про- пространства бесконечного числа измерений, п-+оо. Пространство с бесконечным числом измерений, для которого справедливо определение D5,28) квадрата длины отрезка, называется про- пространством Гильберта. Вектор в пространстве Гильберта имеет бесконечное число компонент, каждая из которых может быть как вещественной, так и комплексной. Часто векторы в n-мерном пространстве (конечно- и беско- бесконечномерном) представляют в виде матрицы х2 Тогда преобразование D5,30). можно записать в виде х' = ах. Действительно, в компонентах имеем что совпадает с D5,30).
178 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI § 46. Геометрическая интерпретация волновой функции и канонические преобразования Изложенный вкратце математический аппарат, в частности векторное исчисление в пространстве Гильберта, несмотря на свою необычность и абстрактность, оказывается в точности со- соответствующим квантово-механическому подходу к описанию свойств микросистем. Будем рассматривать волновую функ- функцию г|э, характеризующую состояние системы, как вектор \|> в пространстве Гильберта бесконечного числа измерений. Каж- Каждой квантово-механической величине F, характеризующей свой- свойства системы, отвечает определенная система координатных осей или, что тоже самое, система единичных базисных векторов (ортов) i|)i(x), г|J(*), ..., tyn(x) ... Эта система базисных век- векторов (базисных функций) есть не что иное, как система соб- собственных функций оператора F> отвечающих возможным соб- собственным значениям Fb F2y ... (Предполагаем, что спектр дискретный, обобщение на непрерывный спектр дается далее.) Компонентами вектора г|э в выбранной системе координат будут амплитуды Си с2, ... сПу определяемые соотношением D6,1) k Амплитуды cht как мы знаем (см. § 19), равны С другой стороны, это равенство можно рассматривать как ска- скалярное произведение вектора г|э на вектор -фд. ck = = J ¦; (х) ф (х) dV. D6,2) Определение D6,2) соответствует D5,27). Так, если мы имеем два вектора ф(#) и г|)(лс) с компонентами, соответственно Ьи и с&, то скалярное произведение вектора г|) на вектор ф равно (Ф, ^) = 2 Ь\ск = J q>' (jc) $ (х) dV. D6,3) к Совокупность амплитуд с*, как мы знаем, представляет волно- волновую функцию в /^-представлении. Таким образом, совокупность компонент вектора -ф в системе координат, ортами которой слу- служат собственные функции г|)п оператора F, и является волновой функцией в F-представлении. Система базисных векторов фьфг, ••• является системой единичных, взаимно ортогональных векторов. Это следует из условия нормировки и ортогональности собственных функций
§ 46] ИНТЕРПРЕТАЦИЯ ВОЛНОВОЙ ФУНКЦИИ 179 оператора F (см. § 18) J (х) dV = {%, ¦ J = 6Ш. D6,4) Рассмотрим теперь переход от одного представления к дру- другому представлению. Например, переход от представления, в ко- котором диагональна матрица F (F-представление) к представле- представлению, в котором диагональна матрица D (D-представление). Геометрически это означает переход от системы координат, об- образованной базисными векторами г|?т, к системе координат, обра- образованной базисными векторами ф&. Функции tym и щ являются собственными функциями соответственно операторов F и D. Фор- Формулы преобразования мы получим, если разложим функции ф^ по системе базисных функций г|)т (предполагая, что имеется дискретный спектр) 2 D6,5) Очевидно, sik = J4 (*) % W dV = (¦/. Ф*)- D6.6) Матрицу S назовем матрицей преобразования от одного пред- представления к другому (или, соответственно, от одной координат- координатной системы к другой). Определенные заключения о свойствах матрицы S мы можем получить сразу, если учтем, что как си- система функций ф&, так и система функций фт является системой нормированных ортогональных функций. Следовательно, S S L s« - Ьть D6,7) i i или, в матричной форме, 5+S=l. D6,8) Производя обратное разложение функций \|)w по функциям фА, легко получить S5+ = l. D6,9) Из уравнений D6,8), D6,9) следует, что матрица S является унитарной, Sb = S. Преобразование от одного представления к другому, осуществляемое унитарной матрицей S, называется унитарным или каноническим преобразованием. Геометрически оно соответствует некоторому «повороту» в гильбертовом про- пространстве. Не представляет труда получить и непосредственную связь между составляющими произвольного вектора г|? в разных
180 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ (ГЛ. VT системах координат. Пусть / к Воспользовавшись D6,5), имеем Приравнивая выражения при одинаковых ify, получаем *,-2V*- <46-10> Это выражение можно переписать в виде матричного равенства, если рассматривать совокупность амплитуд с1 и c'k как ма- матрицы с и с' с одним столбцом. Тогда c = Sc'. D6,П> Умножая слева на S+, получим: c' = S+c. D6,12) Найдем, далее, как преобразуется произвольная матрица R при переходе к другому представлению. Предположим, что в /^представлении имеет место соотношение D6,13) т или, в матричной форме, b = Rc. D6,14) При переходе к другому представлению амплитуды с и Ь преобразуются в амплитуды с' и Ъг согласно D6,11), D6,12). Мы воспользуемся соотношением D6,11) и выразим в уравне- уравнении D6,14) с и Ь через с' и У. При этом получим Sb' = RSc'. Умножая это уравнение слева на S+, находим Ъг = S+RScr = R 'с'. Таким образом, матрица /?', т. е. матрица R в новом представ- представлении, имеет вид R' = S+RS или (/Пт* = 2E+)т*/?Л. D6,15) Рассмотрим некоторые свойства унитарного преобразования. Покажем, прежде всего, что если какая-то матрица D эрми- эрмитова в одном представлении, то она будет эрмитова и в другом
§47] СОБСТВЕННЫЕ ФУНКЦИИ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 181 представлении. Действительно, согласно D6,15) и D5,22) D' = S+DS, (Z)')+ = S+D+ (S+)+ = S+D+S. Так как D+ = D, получаем, что D' = D'+. Унитарное преобразо- вание сохраняет также вид матричных уравнений. Пусть напри- например, имеем уравнения F + D = R; PL = T. Умножая уравнения слева на S+, а справа на 5, соответственно- получим, пользуясь D5,9), D6,9) S+FS + S+DS = S+RS, S+PSS+LS = S+TS. Воспользовавшись D6,15), перепишем эти уравнения в новом. представлении F' + D' = /?', P'U = Г. Как видим, вид уравнений не изменился. Покажем, что при унитарном преобразовании не изменяется также и шпур ма- матрицы Sp F' - 2 F'nn = S E+L F,ftSftn = м n, I, k = 2^2 ste (s+L = 2 fiAi = sP ^. D6,ie> l,kn l,k При этом мы воспользовались D6,9). Унитарное преобразование сохраняет также детерминант ма- матрицы. Действительно, поскольку детерминант произведения матриц равен произведению детерминантов det FDR = = det F det D det /?, то имеем det F' = det S+ det F det S = det F det (S+S) = det F. D6,17>< Детерминант конечной унитарной матрицы по модулю равен, единице. Покажем это: | det S |2 = (det 5) (det S)*, но (det S)* = det S+, так как при транспонировании матрицы детерминант не меняется. Следовательно, получаем: | det S |2 = det S det S+ = det (SS+) = 1. D6,18)- § 47. Собственные функции и собственные значения оператора, заданного в матричной форме Предположим, что оператор D в ^-представлении задал в виде матрицы D. Посмотрим, как можно найти собственные функции и собственные значения этого оператора. Уравнение-
182 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI для собственных функций и собственных значений в /^представ- /^представлении имеет вид 2 я^-*>.«?>. D7,1) ^>.«? Здесь Dn п-е собственное значение матрицы D; совокупность амплитуд с^\ cf\ ... — собственная функция оператора D в /^-представлении, отвечающая n-му собственному значению. Если собственную функцию написать в виде матрицы с<п> с од- одним столбцом, то уравнение D7,1) можно переписать в виде DcW = DncW. D7,2) Легко видеть, что величины собственных значений не зависят от выбора представления. Действительно, уравнение D7,1) в другом представлении запишется, согласно D6,15) и D6,11), как D 'сЛп) = D'ncAn\ D7,3) где D' = S+DS, с' ~ S?C. Подставляя эти значения в D7,3), по- получим Умножая слева на S, мы опять придем к уравнению D7,2), от- откуда и видно, что Dn = Dn. Задача нахождения собственных значений матрицы D сво- сводится, таким образом, к нахождению такого унитарного преоб- преобразования, которое бы привело матрицу D к диагональному виду. Диагональные элементы такой матрицы, как мы знаем (см. § 44), и являются ее собственными значениями. Итак, если 5 — искомое унитарное преобразование, то D' D7,4) или, умножая слева на S, Учитывая, что (D')mn = /?n6mn, получаем 2/?m*S** = AA«* D7,5) k или ?j(Dmk-Dn6km)Skn = 0. D7,6) В этих уравнениях неизвестны как матричные элементы Sknt так и собственные значения Dn. Если D — квадратная матрица, имеющая N столбцов и столько же строк, то мы имеем для каждого Dn систему из N уравнений (при т = 1, 2, ..., N). По- Поскольку система состоит из однородных линейных уравнений, она
§47] СОБСТВЕННЫЕ ФУНКЦИИ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 183 имеет нетривиальное решение при условии, что ее детерминант обращается в нуль: Dn-Da Dl2 ... Dw D21 Dv-Dn ... D2N D* D, ... DNN-Dn = 0. D7,7) Это уравнение Af-й степени относительно неизвестного Dn. Решая его, найдем N корней, которые и будут собственными значениями" матрицы D. В частности, некоторые значения могут совпадать между собой, тогда имеет место вырождение. Все соб- собственные значения эрмитовой матрицы D будут вещественными. Действительно, матрица D' также эрмитова (см. § 46), а следо- следовательно, (D )пп = (D')*nn или Dn = Ь*. Подставляя значение ?>ь D2 ... DN в систему D7,6), мы для каждого Dn определяем совокупность матричных элементов Sftn(Sin, S2n ...), т. е. в ко- конечном счете определяем матрицу унитарного преобразования S. Сравнивая D7,5) с D7,1), мы видим, что каждый столбец :}2п : I матрицы S является собственной функцией оператора D в /^представлении, отвечающей данному собственному значению Dn. Зная матрицу S, мы можем найти совокупность собствен- собственных функций оператора D и в ^-представлении. Действительно, если в первоначальном F-представлении базисными функциями была совокупность ty\(x), i|J(#)--- собственных функций опе- оператора Z7, то в новом представлении, в котором диагональна матрица D (D-представлении) базисными будут собственные функции (pi(#), Ф2М • • • оператора D. Связь между ними дается формулой D6,5), которая и определяет функции щ{х) D7,8) Если мы имеем две матрицы F и D, то с помощью одного и того же унитарного преобразования S их можно одновременно привести к диагональному виду только в том случае, если они коммутируют, т. е. если FD = DF. Действительно, предположим, что F и D приведены к диагональному виду, соответственно F'
184 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI и D'. Образуем матрицу F'D'\ (F'D')mn = 2 F'mkP'kn = F'mrnD'mn6mn = (D'F')mn. D7,9) Следовательно, F 'D' = D'F'. Поскольку при унитарном преобразовании вид матричного урав- уравнения не меняется (см. § 46), то в исходном представлении имеем FD = DF. Мы доказали, таким образом, что коммутация матриц не- необходима для того, чтобы их можно было привести одновре- одновременно к диагональному виду. Легко показать, что это условие является также и достаточным. В этом параграфе мы всюду предполагали, что имеем дело с конечными матрицами. Если, однако, число строк и столб- столбцов N стремится к бесконечности, то математически вопрос су- существенно усложняется. Система D7,6) будет теперь системой из бесконечно большого числа уравнений. Бесконечно высокой степени будет и уравнение D7,7). Можно показать, однако, что и в этом случае произвольная эрмитова матрица с помощью не- некоторого унитарного преобразования приводится к диагональ- диагональному виду с действительными собственными значениями. Мы не будем останавливаться на доказательстве этого положения. § 48. Непрерывные матрицы. Обозначения Дирака До сих пор при обсуждении свойств матриц мы считали, что переменные пробегают дискретный ряд значений. Ясно, однако, что предыдущие результаты должны быть обобщены на случай переменных, изменяющихся непрерывно. Оказывается, что это обобщение можно провести непосред- непосредственно. Все полученные выше формулы остаются справедли- справедливыми, если в них все суммы заменены на соответствующие ин- интегралы. Например, формула D5,6) для матричного элемента от произведения двух матриц теперь будет иметь вид ayDypdy. D8,1) Интегрирование проводится по всей области изменения соответ- соответствующей переменной. Единичная матрица / определяется те- теперь равенством (а-р), D8,2)
§ 48] НЕПРЕРЫВНЫЕ МАТРИЦЫ. ОБОЗНАЧЕНИЯ ДИРАКА 185 т. е. заменяется б-функцией. При этом, как легко видеть, для произвольной матрицы F справедливо соотношение Fl = lF = F. Формулы § 3, выражающие преобразование волновой функ- функции от координатного представления к импульсному и наоборот, также могут быть написаны в матричной форме. Прежде всего заметим, что координата q в своем собствен- собственном представлении должна выражаться диагональной матрицей (см. § 44). Ограничиваясь, для простоты, одномерным случаем, имеем в соответствии с D8,2) : qxx, = x6(x-x'). D8,3) Найдем в этом представлении матрицу, изображающую импульс частицы. Так же, как и в § 26, будем исходить из соотношения pq-qp = — . D8,4) Покажем, что это соотношение удовлетворяется, если выбрать матрицу р в виде Прежде всего, приравнивая матричные элементы левой и правой, части соотношения D8,4), имеем \ 1 tr П ь i Подставляя сюда D8,3) и D8,5), получим дх я х"Ь {х" -х')^-Ь{х- х") - -хб(х- х") -jjr б (*" - *')] dx" = б (х - *').- Берем интегралы в соответствии с правилами действия над. б-функциями (см. приложение III т. I). Находим, что, поскольку Уб'(У) =~Ь(У) (см. (III. 8)), -(*-*')-^6 (*-*') = 6 (*-*')• Следовательно, мы доказали, что матрицы D8,3) и D8,5) удо- удовлетворяют соотношению D8,4). Если матрицей рхх> подейство- подействовать по правилам D4,5) на некоторую функцию ty(x), то мы по- получим функцию <р(х), равную = J x' = Т S ~к 6 <* ~ " f J * ^ IF 6 (* ~ dx'-
186 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI Интегрируя по частям, получаем Мы видим, что действие матрицы рхх* эквивалентно действию оператора /? = —-^— • Формула преобразования волновой функ- ции от координатного представления к импульсному имеет вид w •"*"**. D8>6) В матричной форме это соотношение, согласно D6,12), можно переписать так: c(p)=jstx$(x)dxt D8,7) где SpX = —ТЧ1е Н является унитарной матрицей преобра- преобразования от ^-представления к ^-представлению. Естественно, что обратное преобразование выполняется матрицей Sxp = J Sxpc(p)dp, D8,8) где 5 1 ДРХ С помощью матрицы Sxp не представляет труда определить вид матрицы координаты q в ^-представлении. Согласно D6,15), имеем или Подставляя в интеграл значение матриц S и qx D8,3), получаем Итак, мы получили матрицу координаты в р-представлении
§ 48] НЕПРЕРЫВНЫЕ МАТРИЦЫ. ОБОЗНАЧЕНИЯ ДИРАКА 187 Этот результат, конечно, можно было бы получить и непосред- непосредственно из соотношения D8,4), поскольку матрица р в своем собственном представлении диагональна. Зная выражение для матриц q и /?, мы можем найти матрицу произвольной функции от q и р. Так, если Я(/?, q) —некоторая функция от р и q, то матрица Я будет получена, если вместо р и q подставить соответствующие матрицы и произвести необхо- необходимые операции по правилам матричного сложения и умноже- умножения. При этом матрица Я, как и соответствующий оператор, понимается в смысле разложения в степенной ряд по q и р. Итак, предположим, что Н(р, q)—некоторая известная функция — гамильтониан системы. В координатном представле- представлении матрицы q и р даются выражениями D8,3) и D8,5). Сле- Следовательно, в этом представлении известна и матрица Я. С по- помощью некоторого унитарного преобразования 5 эта матрица может быть преобразована к диагональному виду Я' = ЕпЬПт- Будем предполагать, для определенности, что матрица Н' обла- обладает дискретным спектром. В противном случае нужно писать не бпш, а 6(п — т) Я/ = 5+Я(р, q)S. Определим матрицу S. Поскольку HS = SH\ имеем J Hxx>Sx-n dx' = 2 SxmH'm4 = EnSxn. D8,10) m Рассмотрим интегралы, стоящие слева, для различных функ- функций Я (/?, q). Прежде всего J 4XX'SX'n ** = *Sa. J PXX'S,n d*-!¦-$; Sxn. Далее, если U(q)—некоторая функция q, то ее матрица, как легко видеть, имеет вид UXX' = U(x)b(x — *'), и интеграл равен Аналогичные результаты получим и для функций от р. Напри- Например, матрица величины р2 равна по правилам матричного пере- перемножения (р2)хх, = (—J ^г" ^ (я — х'). Соответственно интеграл J (PV «л dx' = (-f J J ?r 6 (x - *0 S,'» dx' = (f f -§, Sxn. Для произвольной функции Н(р, q), следовательно, получим J Hxx>SX'n dx' = H [x, f ?) Sxn = HSxn. D8,11)
188 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI Соотношение D8,10) является, очевидно, не чем иным, как урав- уравнением Шредингера, записанным в матричной форме в ^-пред- ^-представлении Не представляет труда переписать это уравнение и в ^-пред- ^-представлении как в операторной, так и в матричной форме. Полагая и обозначая функцию tyn(x) в р-представлении через сп(р) (см. D8,6)), получим (¦Ш+0 (р)) сп (р) - Епсп (р), D8,12) где 0(р) —оператор потенциальной энергии в ^-представлении. В матричной форме уравнение D8,12) имеет вид -g- сп (р) + J UPP'Cn (pf) dp' = Encn (р). D8,12') Здесь t/pp' — матрица оператора ?/, строится с помощью D8,9) или, что то же самое, определяется равенством Uppf = j и (х) е h dx. Уравнение D8,10), пользуясь D8,11), перепишем в виде Мы видим, что матрица S строится из собственных функций $п(х) оператора Н Sxn = ^n(x). D8,13) Если мы имеем некоторый оператор F, то матрица этого опера- оператора в энергетическом представлении дается, как известно, соот- соотношением С другой стороны, это же соотношение можно рассматривать как унитарное преобразование от координатного представления, в котором величина F задана матрицей Fxxf> к энергетическому представлению. Матрица унитарного преобразования дается формулой D8,13). Действительно, StxFxx>Sx>mdxdx'
$ 48] НЕПРЕРЫВНЫЕ МАТРИЦЫ. ОБОЗНАЧЕНИЯ ДИРАКА 189 И по аналогии с D8,11). Следовательно, Рпт = J KxFSxm dx = J ¦; (х) F*m (x) dx, и мы опять пришли к прежнему соотношению. Таким образом, все соотношения, полученные в этой главе для матриц, непо- непосредственно обобщаются и на случай операторов, заданных в дифференциальной форме. Имея в виду это обстоятельство, мы в дальнейшем всегда, употребляя слово «оператор», будем подразумевать, что оператор может быть задан как в диффе- дифференциальной, так и в матричной форме. Кратко остановимся, наконец, на некоторых обозначениях, предложенных Дираком, поскольку они часто встречаются в ли- литературе. Волновую функцию г|) или, вернее, совокупность ее компонент в некоторой координатной системе (в некотором представлении) Дирак называет кэт-вектором и обозначает через |г|э). Напри- Например, волновая функция i|)n/m, описывающая состояние с задан- заданными квантовыми числами я, /, т, обозначается через \nlrn). С другой стороны, о функциях, комплексно сопряженных к рас- рассмотренным, говорят как о бра-векторах и обозначают через (i|)|(ij?/m обозначается соответственно через (nlm\). Название бра и кэт происходит от английского слова «bracket» — скобка ( ). В матричных обозначениях кэт-вектору отвечает некоторый столбец, а бра-вектору — строка. Скалярное произведение бра- вектора i|)J = (b | и кэт-вектора -фа = |а) обозначается через (Ь\а), т.е. j D8,14) С другой стороны, это скалярное произведение можно, очевидно трактовать как волновую функцию -фа в ^-представлении. Дей- Действительно, если мы напишем разложение x)db D8,15) (для дискретного спектра интеграл заменяется суммой), то са(Ь) представляет волновую функцию состояния «а» в 6-предста- влении iP) = J *; (х) % (х) dx = {b\ a). D8,16)
190 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI Соответственно волновая функция состояния «а» в ^-представ- ^-представлении г|)а(х) в обозначениях Дирака имеет вид Ф.(*)-<*|в>. D8,17) В этих обозначениях разложение D8,15) можно переписать как (x\a)=j(x\b)(b\a)db. D8,18) ь Из D8,16) вытекает соотношение (Ь\а) = (а\ЬУ, D8,19) связывающее волновую функцию состояния «а» в Ь-представле- Ь-представлении с волновой функцией состояния «6» в ^-представлении. Вол- Волновая функция, описывающая состояние с заданным импульсом, в координатном представлении чрр (г) в обозначениях Дирака имеет вид е*Р'=*{г]р)- D8>20) Соответственно разложение произвольной функции г|э(г) по пло- плоским волнам напишем как D8,21) Р ИЛИ {r\)=j{r\p)(p\)dp. D8,22) р Собственная функция оператора момента количества движе- движения L2 в координатном представлении в обозначениях Дирака имеет вид Уы (О, Ф) = (*, Ф IU т) = (f | /, т). D8,23) Функция (у /, т) осуществляет переход от представления 1т к координатному представлению. Функция [см. D8,19)], наоборот, осуществляет переход от координатного представления к угловому. В том случае, когда углы Ф, ф определяют направление век- вектора импульса, функция Уы (О, <Р) - <Ф, ФI /, т) = (±- I, т) D8,24)
§ 49] ПРЕДСТАВЛЕНИЯ 191 осуществляет переход от представления 1т к импульсному пред- представлению. Она является собственной функцией оператора L2 в импульсном представлении. Матричный элемент Fba в обозна- обозначениях Дирака имеет вид D8>25) Величины а и 6, характеризующие состояния системы, могут пробегать как дискретный, так и непрерывный набор значений. Если каждое из состояний а и b характеризуется набором кван- квантовых чисел, например п'у /', т' и /г, /-, т, то матричный элемент, обозначаемый обычно через Fn'i'm\nim или Fni^y в обозначе- обозначениях Дирака имеет вид {n'l'm'\F\nlm). § 49. Представления Шредингера, Гейзенберга и представление взаимодействия В этом параграфе мы обсудим некоторые вопросы, связанные с дальнейшим развитием и обобщением математического аппа- аппарата квантовой механики. Имеется в виду рассмотрение спосо- способов описания развития процесса во времени. До сих пор мы всецело основывались на уравнении Шредин- Шредингера согласно которому волновая функция системы ty(xf t) могла быть найдена в произвольный момент времени /, если известно ее начальное значение ty(x, 0). При таком подходе развитию процесса во времени отвечает соответствующее изменение вол- волновой функции системы \j)(x, t). Развитие процесса во времени можно описать с помощью оператора V(t), действующего на волновую функцию, заданную в некоторый начальный момент времени ¦ (*. <НР('Ж*. 0). D9,1) Здесь за начало отсчета времени мы взяли момент t = 0. С рав- равным успехом, конечно, за начало отсчета можно было взять произвольный момент времени / = t0. Подставляя выражение D9,1)^в уравнение Шредингера, получаем уравнение для опера- оператора V(t) Ш1 D9,2) Ш
192 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI при условии (см. D9,1)) V@)= 1. Если оператор Н не зависит от времени явно, то решение уравнения D9,2) можно фор- формально написать в виде удо^-Т^ D9,3) где экспонента понимается в смысле разложения в степенной ряд. Оператор V(t) является, очевидно, унитарным: Унитарность оператора V(t) имеет простой смысл: она отвечает сохранению во времени условия нормировки волновой функции J 0)dV. Таким образом, описание эволюции системы во времени сво- сводится к тому, что волновая функция или вектор состояния \|?(х, t) изменяется во времени. Это изменение можно характе- характеризовать при помощи унитарного оператора V(t), действующего на начальную волновую функцию г|?(х, 0) и в каждый данный момент превращающего ее в функцию i|)(x, t). При этом опера- операторы, характеризующие систему, например, операторы х, р или любые операторы F(x,p)y не изменяются во времени явно. Если характеризовать состояние системы с помощью гиль- гильбертова пространства, то ход эволюции системы можно описать следующим образом: пусть задана система ортов в простран- пространстве Гильберта. Эта система ортов определяется системой соб- собственных функций операторов, образующих полный набор для данной системы. В начальный момент состояние системы за- задается вектором состояния ф(#, 0). Эволюция системы во вре- времени отвечает повороту вектора г|э состояния в гильбертовом пространстве. При этом его длина (г|>, г|э) имеет постоянное зна- значение. Такое описание системы, при котором волновая функция изменяется во времени, а операторы от времени не зависят, но- носит название представления Шредингера. Заметим, что слово «представление» имеет при этом более общий смысл, чем тот, который вкладывался в него до сих пор, и характеризует именно способ описания изменения состояния во времени. В частности, можно задать состояние системы в шредингеровском координат- координатном представлении, шредингеровском импульсном представле- представлении, шредингеровском энергетическом представлении и т. д. До сих пор, говоря о задании волновой функции в том или ином
§ 49] ПРЕДСТАВЛЕНИЯ 193 представлении, мы имели в виду соответствующее шредингеров- ское представление. Как сами операторы х, р и вообще F, так и операторы соответствующих производных по времени х, р и F, в представлении Шредингера не изменяются во времени (мы предполагаем, что нет нестационарных внешних полей). Действительно, оператор F, например, согласно C1,2) имеет вид и не изменяется во времени, так как не изменяются операторы F и Н. Не представляет труда определить и матричные элементы оператора F: (F) = \И Fl f4Q 4V В энергетическом представлении (шредингеровском энергетиче- энергетическом) , т. е. в таком представлении, в котором диагональна ма- матрица Я, соотношение D9,4) имеет вид (F)mn = i {HmmFmn - FmnHnn) = i<*mnFmn, D9,5) где i Г со =4-(Е —Е \ F = Ф (я)^Ф (x)dV. fnn ц \ т п;7 тп j Ттv ' тлх ' Матрица [F)mn, как и матрица {Fmn), не зависит явно от времени. Наряду с представлением Шредингера в квантовой ме- механике часто используется другое представление, именуемое представлением Гейзенберга. В представлении Гейзенберга эволюция системы во времени описывается при помощи операторов, зависящих от времени. При этом сама волновая функция Ф(#) считается зависящей только от координат, но не зависящей от времени. Наглядно картину эволюции в представлении Гейзенберга можно пред- представить себе как поворот системы базисных векторов в гильбер* товом пространстве относительно неподвижного вектора состоя- состояния Ф(х). Переход к представлению Гейзенберга в общем случае осу- осуществляется с помощью унитарного преобразования Ф (х) = V @ ф (х, t) = * (х, 0). D9,6) где Ф(х)—волновая функция (вектор состояния) в представ- представлении Гейзенберга. Пользуясь выражением D9,6) и учитывая, что 7 В. Г. Левич и др., том II
194 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI получаем Ф (х) = ф (х, 0) = ет ЯЧ (*, О- D9,7) В соответствии с общими правилами D6,15) произвольный оператор F, заданный в шредингеровском представлении, будет иметь в гейзенберговском представлении (обозначим через FH) следующий вид: FH=V+(t)FV(t) или Рн = еЪ"'ре~ЪЯ'. D9,8) В начальный момент времени выражения как для волновых функций, так и для операторов в обоих представлениях совпа- совпадают. Заметим, что оператор Н в представлении Гейзенберга будет тот же самый, что и в представлении Шредингера НН = Н. Это сразу следует из формулы D9,8), если учесть, что оператор Н коммутирует со всеми членами ряда разложения функции еп Определим матричные элементы оператора Рн с помощью собственных функций оператора Н (гейзенберговское энергети- энергетическое представление). (FH)mn = S D9,9) Если оператор F является некоторой функцией от Л и /), то, как следует из формулы D9,8), мы получим оператор F в гей- гейзенберговском представлении, беря в этом представлении опера- операторы х и р D9,10) Действительно, если, например, F = p2, то FH = eH p2e H =eH pe h en ре н =РН- Аналогичным образом легко проверить, что Уравнение движения в гейзенберговском представлении получим,
§ 49] ПРЕДСТАВЛЕНИЯ 195 дифференцируя D9,8) Если взять матричный элемент от левой и правой части равен- равенства по функциям tyn(x), то получим, аналогично D9,5), *dF л.) =, ), тп D9,13) Конечно, к точно такому же выражению мы придем, если будем исходить из выражения D9,9), а производную от матрицы FH по времени t определим как такую матрицу, каждый матричный элемент которой равен производной по времени от соответствую- соответствующего матричного элемента матрицы FHy т. е VdTlmn dt~ ~ Штп {F")mn- D9j И) Таким образом, если оператор FH изображает некоторую фи- dFH зическую величину, то оператор —^—соответственно ее про- производную по времени. Отметим, что уравнения C1,7), C1,8) также могут быть вы- выражены в гейзенберговском представлении. Пользуясь D9,11), D9,12), имеем или, в гейзенберговском энергетическом представлении = 1Г (Хн)тп в to™ ^)«« = Ш ^Ри)тп, D9,16) дри\ д I dU\ D9,17) Матричные соотношения D9,16) и D9,17) по внешнему виду соответствуют классическим законам Ньютона. Первоначально квантовая механика была сформулирована Гейзенбергом именно как матричная механика. Каждой механи- механической переменной Гейзенберг сопоставлял некоторую матрицу с элементами, гармонически зависящими от времени. Соотно- Соотношения между матрицами брались в форме классических соот- соотношений, например D9,17). Представления Шредингера и Гейзенберга не исчерпывают все использующиеся на практике методы описания квантовых систем.
196 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI Очень часто в квантовой механике приходится иметь дело с системами, гамильтониан которых может быть разбит на две части: одна из них, Н(°\ представляет собой собственно гамиль- гамильтониан системы, а другая, Н\ описывает взаимодействие данной системы с внешними полями или другими системами. В этом случае часто оказывается удобным пользоваться так называемым представлением взаимодействия, введенным Дираком. Представление взаимодействия является в некотором смысле промежуточным между представлениями Шредингера и Гейзен- берга. Именно, определим волновую функцию в представлении взаимодействия соотношением (?#)(*. t). D9,18) Аналогично, произвольный оператор F в представлении взаимо- взаимодействия определим как Рл- ехр (|Яо/) F ехр (- ±%t). D9,19) В отличие от D9,7) и D9,8), в формулах преобразования D9,18) и D9,19) входит не полный гамильтониан, но лишь гамильто- гамильтониан системы без взаимодействия Но. Не представляет труда получить уравнение, которому удо- удовлетворяет функция <p(#, /). Для этого продифференцируем со- соотношение D9,18) по времени и воспользуемся уравнением Шре- Шредингера = етЙ*Н'Ъ(х, 0 = еТ"°'#'*"%>(*, /) D9,20) или, учитывая D9,19), получим т. е. мы получили уравнение Шредингера с гамильтонианом #?. Из соотношения D9,21) находим закон изменения во вре- времени оператора, заданного в представлении взаимодействия Ц*- = \ (HQFB - ДД) - [Яо, ?J. D9,22) Заметим, что оператор Яо имеет один и тот же вид как в представлении Шредингера, так и в представлении взаимодей- взаимодействия.
§ ?0] ЛИНЕЙНЫЙ ОСЦИЛЛЯТОР (МАТРИЧНОЕ ПРЕДСТАВЛЕНИЕ) 197 Если оператор f зависит от к и /), то аналогично D9,10) легко показать, что FB = F(xB,pB). D9,23) Итак, мы видим, что в представлении взаимодействия зави- зависимость от времени волновой функции определяется оператором взаимодействия Н'Ъу в то время как зависимость от времени, связанная с оператором #0 перенесена непосредственно на опе- операторы. § 50. Линейный осциллятор (матричное представление) В § 10 мы рассмотрели линейный гармонический осциллятор при помощи волнового уравнения Шредингера. Однако перво- первоначально эта задача была исследована матричным методом1). Мы приведем здесь это решение. С одной стороны, оно служит хорошей иллюстрацией использования матричных методов, а с другой стороны, ряд полученных выражений понадобится нам в дальнейшем. Будем исходить из известного выражения для гамильтониа- гамильтониана системы Здесь со — «классическая частота осциллятора». Под операто- операторами р и к в E0,1) понимаются некоторые матрицы, связь ме- между которыми дается уравнениями D9,15), Задачу решаем в гейзенберговском энергетическом представлении. Тогда в соот- соответствии с D9,9) имеем: (хн)пт-хптешпт\ E0.2) Здесь индексами m, n мы обозначаем уровни энергии исследуе- исследуемой системы. К&к следует из D9,15) и E0,1), оператор хн удо- удовлетворяет следующему уравнению движения: д2л -^ + ««„ = 0. E0,3) Мы видим, что в гейзенберговском представлении уравнения движения имеют вид обычных уравнений движения классиче- классической механики. В последних, однако, классическая координата х заменена квантовомеханическим оператором хн. Соответствен- Соответственно для матричных элементов хпт с учетом E0,2) получаем Ч М. Born, W. Heisenberg, P. Iordan, Zeits. f. Physik 35, 557 A925).
198 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VF Из E0,4) следует, что отличны от нуля лишь такие матричные элементы хпт, для которых выполняется условие (оПт = ±со шш Р F • п й т = ± св. Пронумеруем состояния таким образом, что On, n-i = +со, a con, n+i = —со. Следовательно, хпт = 0 при т Ф п ± 1 и Arnm Ф 0 при т = п± 1. E0,5) Матричные элементы лгп, n±i можно определить, исходя иа соотношений коммутации Раскроем это равенство 2 (Pnk4m - XnkPkm) = - *'%m- Согласно D9,16) и D9,9) рпк = im(dnkXnk. Подставляя pnk в по^ следнее выражение и учитывая E0,5), имеем при т = п При этом мы воспользовались тем, что (onm = —(omn, а вместо con, n-i и (On, n+i под старили соответственно +а> и —оз. Посколь- Поскольку матрица координаты эрмитова, то хпт == х*тп, и полученное соотношение перепишем в виде ^ E0,6> Из E0,6) ясно, что квадраты модулей матричных элементов образуют арифметическую прогрессию, с разностью -=—. По^ скольку все члены прогрессии положительны, она должна начи- начинаться с некоторого положительного члена, которому можно приписать индекс п = 0. При этом имеем, очевидно, x\t о Ф 0, х0} _1 se 0. Следовательно, из E0,6) вытекает равенство |ЛГьо1 "~"тссГ# Соответственно для произвольного целого положительного чис- числа п находим i*i2 Из E0,7) непосредственно получаем
$ 50] ЛИНЕЙНЫЙ ОСЦИЛЛЯТОР (МАТРИЧНОЕ ПРЕДСТАВЛЕНИЕ) 199 где р — произвольный фазовый множитель. Воспользовавшись произволом в выборе р, можно положить его равным нулю. Для матричных элементов, зависящих от времени, соответственно получаем, учитывая E0,2), Определим с помощью матриц E0,8) уровни энергии системы Еп- Последние определяются как диагональные матричные эле- элементы оператора Я. Из E0,1) следует, что и 1 V т(°2 V пп = т" 2и PnkPkn Н §~~ 2л Xnkxkn- к к Подставляя ртп = im(umnxmni находим гг т Г - 2 ®пкщ**пк*кп+°>2 2 */1***и1 • Используя очевидные равенства соп& = —coftn; xnk = xkni и учи- учитывая, что матричные элементы хпт отличны от нуля лишь при т = п ± 1, получаем к Пользуясь E0,8) и со2 п ± { = cd2, имеем окончательно что естественно совпадает с A0,13). Вместо операторов р и х часто оказывается удобным ввести оператор а и сопряженный ему оператор d+, определяемые со- соотношениями / г II/ -2SLf _ vV л * E0,11) Из E0,8) следует, что операторы й и d+ имеют следующие, от* личные от нуля матричные элементы («+)п,л-1=(а)л-ьл=^ E0,12) а все остальные матричные элементы равны нулю. Мы ви- видим, следовательно, что у оператора й+ отличны от нуля лишь
200 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI матричные элементы, соответствующие переходу п—1-*/г, т. е. переходу с увеличением квантового числа п на единицу. У опе- оператора а отличны от нуля матричные элементы, соответствую- соответствующие переходу п-*п— 1. В этой связи операторы и назы- называются операторами соответственно поглощения и рождения возбуждения. Для операторов а+ и й имеют место, как это следует из E0,12), следующие перестановочные соотношения: E0,13) Оператор Я, выраженный через операторы а и я+, имеет вид *? E0,14) и с учетом E0,12) мы снова приходим к E0,10). Пользуясь ма- матричным методом, можно также получить выражение для вол- волновых функций осциллятора 1). § 51. Матричные элементы оператора момента2) При исследовании свойств момента количества движения» проведенном в § 30 гл. III, мы исходили непосредственно из вы- выражений C0,1) и C0,2) для операторов момента. В настоящем параграфе мы будем основываться только на перестановочных соотношениях C0,3), C0,3х). Оказывается, что такая постановка вопроса носит более общий характер. В частности, конкретные выражения для операторов C0,1) и C0,2) не могут быть ис- использованы при исследовании свойств собственного момента ко- количества движения — спина, который будет рассмотрен в гл. VIIL Между тем, перестановочные соотношения вида C0,3) остаются справедливыми и для собственного момента количества движе- движения (см. § 60). Исследование свойств момента количества дви- движения, основывающееся на соответствующих перестановочных выражениях, удобно проводить в матричной форме. Будем обо- обозначать матрицы, отвечающие проекциям момента количества движения на оси х, yt z, через Jx> lyy Jz. Изменение обозначений связано с тем, что результаты, полученные в этом параграфе, будут справедливы не только для момента количества движе- движения, связанного с пространственным движением, орбитального момента / = -r(rXV), но и для момента количества движения. !) Л. Д. Л а н д а у и Е. М. Л и ф ш и ц, Квантовая механика» Физматгиз, 1963, стр. 95. 2) Вопросы, затронутые в этом и следующих параграфах этой главы, бо- более подробно рассмотрены в книгах Л. Д. Ландау и Е. М. Л и ф ш и ц, Квантовая механика, Физматгиз, 1963, стр. 111, и Е. Кондони Г. Шортли^ .Теория атомных спектров, ИЛ, 1949.
i 51] МАТРИЧНЫЕ ЭЛЕМЕНТЫ ОПЕРАТОРА МОМЕНТА 201 не связанного с пространственным движением — спина, а также для полного момента количества движения (см. § 62). Введем также матрицу /2, отвечающую квадрату момента количества движения J2 = 1\ + /2 + 7|. Итак, возьмем за основу следующие перестановочные соотношения: . = шя, JyJz-JzJy' hh-hh ¦¦ ihjy. E1,1) Прежде всего из этих соотношений следуют правила коммута- коммутации (доказательство аналогично приведенному в § 30): E1,2) JJ2 - P?z = 0. Мы выберем то представление, в котором диагональны ма- матрицы /2, ?г и Я. Действительно, в § 47 мы доказали, что ком- коммутирующие между собой матрицы могут быть одновременно приведены к диагональному виду. Коммутация некоторой ма- матрицы с матрицей Н выражает закон сохранения соответствую- соответствующей величины (см. § 32). Поэтому предположение коммутации матриц Р и Jz с Н означает лшш> выполнение законов сохра- сохранения. Строки и столбцы рассматриваемых матриц будем нумеро- нумеровать индексами т, /, п. Вещественное число m определяет проек- проекцию момента количества движения на ось 2, /2 = тЬ. Число / характеризует величину полного момента, а число п связано с уровнем энергии системы. Поскольку все рассматриваемые ма- матрицы коммутируют с матрицами Я и Я, они диагональны по индексам / и п. Следовательно, можем написать, используя обо- обозначения Дирака, матричные элементы интересующих нас ма- матриц в виде (мы будем употреблять круглые скобки) (m'j'n' | Н | mjn) = Ejn6n>6mm>6n (m'j'n' | Jz | mjn) = mhbn>bmm>bn {m'j'n' | Jx | mjn) = {Jx)m'm Ьц'Ьп (m'j'n' | Ty | mjn) = (Jy)m>m bu>bn E1,3)
202 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VF Здесь через // мы обозначили собственное значение квадрата момента количества движения^ Для дальнейшего нам будет удобно ввести также матрицы /+ = Jx + i?y и J^ = fx— iJy. Оче- Очевидно, что эти матрицы, как и исходные матрицы Тх и Гу> циа- тональны по индексам / и п. Учитывая последнее, мы будем в дальнейшем опускать индексы / и п. Нашей задачей является определение спектра возможных: значений проекции момента количества движения на произволь- произвольно ориентированную ось, установление связи этих величию с абсолютной величиной момента YJ* и нахождение матриц: (Jx)m'm и (Jy)m'm- Прежде всего покажем, что спектр возмож- возможных значений проекций момента при заданном полном моменте ограничен сверху и снизу. Для этого воспользуемся матричным соотношением Приравнивая диагональные матричные элементы левой и пра- правой части, получим J) - mV - S [(/,)«* (Jx)km + (Jy)mk (Jy)km\ - 2 I (/,)«* I* + I (/„)«* ?» E1,4) При этом мы воспользовались эрмитовостью матриц Jx и Jy^ Итак, правая часть равенства E1,4) заведомо не отрицательна. Отсюда вытекает неравенство или Обозначим через Ш\ и т^ значения квантового числа т, отве- отвечающие соответственно наибольшей и наименьшей возможной проекции момента на ось г. Спектр возможных значений чисел m найдем с помощью матриц7+ и /_. Для этого находим ком- коммутатор этих матриц с матрицей Tz. Пользуясь E1,1), получаем ?2Т+ - Г+Гг = А/+, J2L - 1JZ = - hL. Ei,6> Раскроем первое из этих соотношений (JJ+)m'm№ ~ (J+Jz)m'm" Вычисляя матричный элемент от произведения по правилу D5,6) и учитывая, что матрица /2 диагональна, находим:
$ 51] МАТРИЧНЫЕ ЭЛЕМЕНТЫ ОПЕРАТОРА МОМЕНТА 203 Из равенства E1,7) следует, что матрица /+ имеет отличные от нуля матричные элементы (J+)m'm» лишь при условии т' — — т" = 1, т. е. для переходов, соответствующих увеличению квантового числа т на единицу т-+т + 1. Аналогичным обра- образом из второго равенства E1,6) легко показать, что матрица 7_ имеет отличные от нуля матричные элементы лишь для перехо- переходов с уменьшением квантового числа т на единицу, т. е. т-> ->т— 1. Таким образом, мы приходим к выводу, что, если при заданном // оказывается возможным некоторое значение тЬ проекции момента на ось z, то возможны также значения проек* ции (т + 1)й, (т— 1)й, (т + 2)Ь, (т — 2)Ь и т. д. Мы выяс- выяснили, однако, ранее, что спектр возможных значений числа т должен быть ограничен т2^тК Ши Положив в равенстве E1,7)т" = Ш\ и учитывая, что в нем т' не может принимать значение Ш\ + 1, мы видим, что оно выполняется только при об- обращении в нуль матричного элемента (J+)m +1 m . Следовательно, O. E1,8) Аналогичную ситуацию имеем и при минимальных возможных значениях числа т. Соответствующее равенство здесь также вы- выполняется за счет обращения в нуль матричного элемента 0. E1,9) Таким образом, возможные значения проекции момента равны Ш2Ь, (т2+1)й, (m2 + 2)fi, ..., (rti\—1)й, пг\Ь. При этом раз- разность Ш\ —пг2 может быть равной только целому положительно- положительному числу (включая и нуль). Покажем, что значения чисел Ш\ и т2 определяют величину /у. Действительно, матрицу 72 можно представить в виде J2=J__J+ + Pz + hJz. E1,10) Беря диагональные матричные элементы от левой и правой ча- частей, соответствующие переходу гп\-^т\, имеем Здесь возможно лишь k = т\ + 1, но при этом обращается в нуль матричный элемент от /+ E1,8). Следовательно, / С другой стороны, равенство E1,10) можно переписать также и .в такой форме:
204 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI Если в последнем выражении приравнять диагональные матрич- матричные элементы ni2 -*rri2, то получим: и, следовательно, тх (тх + 1) = т2 (т2 — 1). Это равенство удовлетворяется при условии т2 = гп\ + 1 и тг =—mi. Поскольку, однако, всегда /Пг^/Пь мы должны оставить лишь второй корень тг «= — п%\. Следовательно, ма- максимальная (равная ГП\Ь) и минимальная (равная т<$) возмож- возможные проекции момента количества движения на ось z равны по абсолютной величине. Квадрат полного момента равен, как мы выяснили, величине Ь2т\(гп\ + 1). С другой стороны, мы усло- условились характеризовать эту величину квантовым числом /. По- Поэтому естественно положить т\ = /. При этом имеем: // = ^(/+1). E1,12) Возможные значения проекции момента /2 соответственно равны /Ж-/Й, (/-1M, (/-2)А, ..., (-/+1)Й, -lh. E1,13) Всего проекция момента принимает 2/ + 1 значений. Заме- Заметим, что, поскольку 2/ + 1 — целое положительное число, кван- квантовое число / может принимать лишь целые или полуцелые зна- 1 3 чения / = 0, у, 1, у и т. д. Для орбитального момента коли- количества движения это число, как мы выяснили в § 30, принимает лишь целые значения / = /. Мы увидим, однако, в гл. VIII, что для собственного момента количества движения / может прини- принимать и полуцелые значения. Так как ось z заранее ничем не выделена, то проекция мо- момента количества движения на любую другую ось также дается формулой E1,13). Отметим, что, если число / — целое, то проек- проекции момента на любую ось также целочисленны (в единицах Ь); если же / полуцелое, то проекции момента принимают полуце- полуцелые значения. Найдем теперь матрицы ?х и Ту. Для этого можем воспользо- воспользоваться, например, соотношением E1,10), взяв диагональные ма- матричные элементы левой и правой части. Учитывая также E1,12) „ имеем t +0-21 (/-) причем отличен от нуля лишь член суммы сй = т+ Ь Из эрмитовости матриц Jx и Jy следует, что
§ 52] СЛОЖЕНИЕ МОМЕНТОВ КОЛИЧЕСТВА ДВИЖЕНИЯ 205 Следовательно, предыдущее равенство дает Для матричного элемента (/+)m+i, w имеем Фазу р без ограничения общности можно положить равной нулю. Окончательно получаем (т + 11 /+ |т) = (Jx + //,)„+,,т = Л V(j-m)(] + m+l), nt)(j + m+l) т. е. E1,15) Из определения матриц /+ и /_ следует, что Используя E1,14), получаем E1,16) В качестве примера выпишем матрицы, которые получаются при / = 1: 0 1 0^ 1 ° »,. 1 0. E1,17) § 52. Сложение моментов количества движения Определим возможные значения момента количества движе- движения J, равного сумме двух моментов / = J\ + /2. Пусть J\ и /г — моменты количества движения, относящиеся к двум под- подсистемам, взаимодействием между которыми можно пренебречь.
206 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI Это означает, что операторы 1Х и /2 действуют на переменные, относящиеся к разным подсистемам, и, следовательно, коммути- коммутируют между собой /1/2 = /2/i. Поскольку каждый из операторов $\ и /2 удовлетворяет перестановочным соотношениям E1,1)> то этим же перестановочным соотношениям удовлетворяет и опе- оператор /. Состояние системы будет задано, если будут заданы квантовые числа /ь /2 и т\9 т2, характеризующие полные момен- моменты /? и /2 и их проекции на произвольно ориентированную ось z (мы отвлекаемся от других величин, входящих в полный на- набор, поскольку для дальнейшего они не существенны). При за- заданных /i и /2 каждое из чисел т\ и т2 пробегает соответственно B/i + 1) и B/2 + 1) значений. Следовательно, заданным чис- числам /i и /2 отвечает B/i + 1) B/2 + 1) состояний. Однако вместо четырех чисел /ь /2, ть т2 состояние системы можно характе- характеризовать числами /i, /2, / и т, где / и т — квантовые числа, от- отвечающие полному моменту /2 и его проекции на ось z. Это означает, по-существу, переход от представления /ь /2, ть т2 к представлению /ь /2, /, т. Действительно, операторы, отвечаю- отвечающие последним четырем величинам, с таким же успехом могут входить в полный набор, как и операторы, отвечающие величи- величинам /ь /2, mb m2. Так как имеет место очевидное равенство Jz = = Т\7 + /2z, то квантовое число m равно сумме m = mi + m2. Для квадратов моментов, разумеется, такого простого соотношения уже не существует и нам следует определить возможные значе- значения числа / при заданных ]\ и /2. Прежде всего заметим, что ма- максимальное значение числа / получится, если мы возьмем наи- наибольшее mi, равное /ь и наибольшее т2, равное /2. Следователь- Следовательно, в этом случае / = /i + /2. Возьмем, далее, следующее возможное значение числа т, равное m = j\ + /2— 1. Такое зна- значение числа m может реализоваться либо при mi = /ь т2 = = /2—1, либо при гп\ = ]\—1, т2 =/2. Таким образом, дан- данному значению т = /i + /2 — 1 отвечают два независимых состояния. Следовательно, данному m должно отвечать два воз- возможных значения числа /. Но так как наибольшее возможное значение / равно j\ + /2 и так как число m не может быть боль- больше числа /, то ясно, что выбранному m могут отвечать лишь / = /i + /2 и / = /i + J2 — 1- Выбирая m еще на единицу меньше, мы получим три состояния, отвечающие данному т: 1) mi = /i, m2 = /2 —2; 2) mt = /!— 1, т2 = /2— 1; 3) mi = ]х — 2, т2 = /2. Аналогично предыдущему приходим к тому, что число / мо- может принимать значения / = /i + /2, / = /i + /2 — 1 и / =» //2
§ 52] СЛОЖЕНИЕ МОМЕНТОВ КОЛИЧЕСТВА ДВИЖЕНИЯ 207 Продолжая эти рассуждения и дальше, мы получим, что при данных /i и /2 число / может принимать значения: / = /i + /V, /1+/2-I; /1 + /2-2, .... "/1-/2. E2,1) Всего число / принимает 2/2 + 1 значений (при условии, что /2^/ь в противном случае индексы 1 и 2 нужно поменять ме- местами). Полное число состояний, отвечающих данным j\ и /2, равно как и должно быть. Приведенный результат был получен ранее в так называемой «векторной модели», введенной еще до появ- появления квантовой механики. В векторной модели принимается, что длина вектора /, образованного сложением двух векторов момента \\ и /2, может изменяться скачкообразно на единицу. Она максимальна, когда эти векторы «параллельны» / = jx + /2, и минимальна, когда они «антипараллельны» / = ]г — /2. В том случае, когда нужно сложить три и более момента ко- количества движения, мы должны применять выведенное правило, складывая их попарно. Наряду с возможными значениями / можно найти и вероят- вероятность того, что полный момент системы равен тому или иному возможному значению / при заданных /i и /2. Для этого нужно, согласно общим правилам (§ 21), разложить волновую функ- функцию системы, описывающую состояние с заданными значениями /ь /2, /яь т2, по волновым функция \|)jW состояний с заданными /ь /2, ], т. Поскольку исходная система разбита на две невзаи- невзаимодействующие подсистемы, то ее волновая функция с заданны- заданными /ь т\\ /2, т2 может быть представлена в виде произведения двух функций, относящихся соответственно к каждой из под- систем ^j^rn^^hmS^^hmS2)- Упомянутое разложение имеет вид E2,2) Квадраты модулей коэффициентов С^тг определяют иско- искомые вероятности. Заметим, что поскольку преобразование вол- волновых функций от одного представления к другому осущест- осуществляется унитарными матрицами, мы можем разложение, обрат- обратное E2,2), написать как V - 2 (С'т-тг, т2У ¦& ... ,A) ¦а» B). E2,3) Коэффициенты C!mim2 были вычислены Вигнером методом теории групп. Довольно полную таблицу этих коэффициентов
208 МАТРИЧНАЯ ФОРМА КВАНТОВОЙ МЕХАНИКИ [ГЛ. VI читатель найдет, например, в книге Е. Кондона и Г. Шортли1). Мы же ограничимся рассмотрением наиболее простого случая, когда один из моментов равен половине, а другой произволен. Итак, будем считать, что /2 = -^ • При данном /2 число т2 про- пробегает лишь два значения, а именно: т2 = -н- и т2 = —jr. Co- ответственно разложение E2,3) мы можем переписать, опуская все лишние индексы в виде C-vA. «+* @ **. -V, Подействуем^на левую и правую ^части этого разложения опера- опера/2 (/ /J /2 У| 2/ / С тором /2 = (/j + /2J = /2 + У| + 2/j /2. Скалярное произведение, стоящее справа, удобно несколько преобразовать, так что /2 . /2 + /2 + (/u + ^)(/te . ^J + (;u ^ iT{y) (J2X + /72J + + 2/,Л = /?+/! + /1+/2. + J,J2+ + 2J{J2z. E2,5) При действии этим оператором на левую часть равенства E2,4) получим й2/(/ +1). При действии на правую часть удобно пред- представить оператор /2 в виде^ E2,5), причем нужно помнить, что каждый из операторов /ь f2 действует лишь на волновую функ- функцию соответствующей подсистемы. Из матричных соотношений E1,14) следует, что %г. _Vj B) = Щг а) - л У (/, - «+-J-) (/<+*+т Используя эти соотношения, мы получим следующее уравнение: Ш + !)¦/« = [С/, (/, (h + 1) + т + т) + A) ^ _,А B). См. ссылку на стр. 200.
i 52] СЛОЖЕНИЕ МОМЕНТОВ КОЛИЧЕСТВА ДВИЖЕНИЯ 209 Подставляя в левую часть вместо \|);-т опять разложение E2,4) и приравнивая коэффициенты при одинаковых функциях <фA)г|)B), мы получим два уравнения относительно С/, и С_у2. Из этих двух уравнений, однако, лишь одно будет независимым. Оно дает —-т E2,6) *У> Другое соотношение получим, если учтем, что квадраты моду- модулей этих коэффициентов равны соответствующим вероятностям |C-vJ2 + |Cv,|2=L E2,7) Соотношения E2,6) и E2,7) определяют нам коэффициенты Cl/t и С„ с точностью до несущественного фазового множителя eia (фазу выбираем в соответствии с принятой в таблицах коэффи- коэффициентов Clmmt'f CM- Кондон и Шортли). Поскольку при /2 = Y полный момент / может принимать лишь два значения / /i — ^> получаем следующие значения коэффициентов (см. таблицу)! Таблица коэффициентов &т{ГП2 tt и Cl nt[mt / /l + /|- 1 2 1 2 J -Y- 2/1 /i-i 2/i 1 + + 1 1 1 " 2 1 т Г f 2 = /l l_ — m + 2Л + + Я.+ 2/i + 1 2
ГЛАВА VII ТЕОРИЯ ВОЗМУЩЕНИЙ § 53. Теория возмущений, не зависящих от времени Уравнение Шредингера является линейным дифференциаль- дифференциальным уравнением в частных производных с переменными коэф-- фициентами. Его точное решение может быть найдено лишь для отдельных, наиболее простых задач, часть которых была рас- рассмотрена в предыдущих параграфах. Однако в большинстве случаев получение точного решения уравнения Шредингера сопряжено с огромными математиче- математическими трудностями. Поэтому в квантовой механике разработан ряд приближенных методов его решения. К ним относится рас- рассмотренный уже выше метод квазиклассического приближения. Другим важнейшим приближенным методом решения уравне- уравнения Шредингера является так называемая теория возмущений. Термин «возмущение» и идеи этого метода, представляющего некоторый вариант известного в математике метода разложения по малому параметру, были введены в квантовую механику по аналогии с методом возмущений классической механики, играв- игравшим особенно большую роль в решении задач небесной меха- механики. Мы изложим в общем виде теорию возмущений. Ее прило- приложения к решению конкретных задач будут проиллюстрированы в дальнейшем на многочисленных примерах. Рассмотрим прежде всего простейший случай квантовомеха- нической системы, у которой оператор Гамильтона Н не зависит от времени явно. Предположим, что оператор Н можно представить в виде # = #0+#', E3,1) где оператор Нг можно считать малым по сравнению с операто- оператором /?о (что именно понимается под словом «малый», поясним ниже). Тогда уравнение Шредингера приобретает вид ??*¦ E3,2)
§53] ТЕОРИЯ ВОЗМУЩЕНИЙ, НЕ ЗАВИСЯЩИХ ОТ ВРЕМЕНИ 211 Предположим далее, что решение уравнения Яог|>(О) = ?(оЧ(о) E3,3) известно. Тогда для решения уравнения E3,2) можно восполь- воспользоваться методом, представляющим по существу метод последо- последовательных приближений. В дальнейшем гамильтониан Яо и вол- волновую функцию \|>(°> будем именовать невозмущенными, а опе- оператор Я'— оператором возмущения. «Малость» оператора Я' означает, что под действием возмущения состояние системы должно изменяться сравнительно слабо. Нашей задачей являет- является нахождение решения уравнения Шредингера в предположе- предположении, что волновая функция -ф@) невозмущенной системы известна. Мы будем рассматривать возмущения состояний, принадлежа- принадлежащих к дискретному спектру оператора Яо. При этом, однако, оператор Яо может помимо собственных значений, принадлежа- принадлежащих дискретному спектру, иметь и собственные значения непре- непрерывного спектра. Решение уравнения E3,2) ищем в виде ряда по собственным функциям оператора Яо ¦ (*)-2<Vlf. E3,4) k Если оператор Яо обладает также и непрерывным спектром, то мы должны добавить к сумме E3,4) соответствующий интеграл, взятый по непрерывному спектру. Подставляя сумму E3,4) в уравнение E3,2) с учетом E3,3), получаем: Умножим левую и правую части уравнения на ф{°>* и проинте- проинтегрируем его по всей области изменения независимых перемен- переменных. Воспользовавшись ортогональностью функций -ф^, находим °т (Е ~ Е%) = ? Я^Л> т-1, 2, 3, .... E3,5) где l^ E3,6) есть матричный элемент оператора возмущения, вычисленный с помощью волновых функций невозмущенной задачи. Система уравнений E3,5) в точности эквивалентна уравнению E3,2). Она представляет уравнение Шредингера в энергетическом представлении. Воспользуемся теперь нашим предположением о малости оператора возмущения. При этом уровни энергии и вол- волновые функции в нашей задаче будут близки к соответствующим
212 ТЕОРИЯ ВОЗМУЩЕНИЙ [ГЛ. VII значениям невозмущенной системы. Поэтому будем искать их в виде следующего ряда: E3,7) Здесь ?@), с{т — невозмущенные значения. Поправки ?A), Cm того же порядка малости, что и возмущение, ?B), с^ — квад- квадратичны по возмущению и т. д. Найдем поправку к /г-му уровню энергии и соответственно к л-й собственной функции невозмущенной задачи, ограничиваясь при этом членами второго порядка малости: ¦@) , р{\) , р{2) "+Е"+Ь"> ¦ Eз,8) В этом параграфе мы будем предполагать, что /1-й уровень энергии невозмущенной задачи не вырожден. Для остальных уровней это предположение не обязательно. В нулевом прибли- приближении волновая функция совпадает с функцией ^К Это дает ¦ - 2 W - Iff. т. е. 40) - <W - E3,9) к Подставляя E3,8) в уравнение E3,5), получаем: ). E3,10) В уравнении E3,10) следует приравнять члены одного порядка малости. Для членов первого порядка малости получаем соот- соотношение {Ef - ?g?) ст] + Е^Ьтп - 2 Н'ткЬнп - Н'тп. E3,11) Полагая т = л, находим: ?2} = Япп - J ^0)*ЯЧ0) rf^- E3,12) Мы видим, что поправка первого порядка к уровню энергии равна среднему значению энергии возмущения в невозмущенном состоянии^0). Из уравнения E3,11) при тфп находим поправ- поправку первого порядка к волновой функции <53'13>
§ 63] ТЕОРИЯ ВОЗМУЩЕНИЙ, НЕ ЗАВИСЯЩИХ ОТ ВРЕМЕНИ Выпишем теперь уравнение для членов второго порядка ма- малости: № - Е%) с% + eW + Е(?Ьтп = S Н'тксУ. E3,14) Полагая тфп, находим из уравнения E3,14) поправку второга порядка малости к невозмущенной волновой функции Значение амплитуд с^ и с^ можно получить из условия нор- нормировки, которое с учетом E3,4) запишется в виде 2к*Р=1. E3,16> Подставляя в E3,16) разложение E3,8), получим 2|в*» + сУ» + с1Р|2-1. E3,17) k Приравниваем слева и справа величины одного порядка мало- малости. Тогда имеем E3Л8)> Из соотношений E3,18) следует, что мнимые части амплитуды с{п и cin являются произвольными величинами. Появление этого произвола связано с тем, что волновая функция определена с точностью до фазового множителя eia, где а также можно пред* ставить в виде ряда. В соответствии с этим, без ограничения общности, можем считать 'ftn I2 2f D0)-40)J' E3,19) Здесь штрих у суммы означает, что при суммировании исклю* чается член с k = /г. Из E3,15) находим с$ J^ tT^ cB) m (?f-4o))Do)-^) w-m*
214 ТЕОРИЯ ВОЗМУЩЕНИЙ [ГЛ. VII Полагая в уравнении E3,14) т = п, находим поправку второго порядка к уровню энергии системы: и' н' nk kn E321) Поправка второго порядка к основному уровню энергии оказьь вается отрицательной независимо от характера возмущения. Та- Таким образом, с точностью до членов второго порядка малости энергия системы, как это следует из E3,8), E3,12) и E3,21), равна Е-Е{0) + Н' I V \Hnk\2 Аналогичным образом получаем выражение для возмущенной волновой функции системы ' ijcbf ^0) + • • • E3>23) (Эту формулу мы выписали лишь с точностью до членов пер- первого порядка малости.) Из выражения E3,23) следует, что поправка первого поряди ка будет действительно мала, если выполняется неравенство |яи«|^0)-ЯГ|. E3,24) Таким образом, метод теории возмущений, развитый выше, при- применим, если матричные элементы оператора возмущения малы по сравнению с расстояниями между соответствующими энерге- энергетическими уровнями невозмущенной системы. § 54. Теория возмущений при наличии вырождения Предположим теперь, что собственные значения невозмущен- невозмущенного оператора Но вырождены и кратность вырождения п-го уровня (с энергией ?„0)) равна s. Это означает, что состояние невозмущенной системы с энер- энергией Еп описывается взаимно ортогональными волновыми функ- функциями -ф^, ..., ^nl или их произвольными линейными комбина- комбинациями, которые можно выбрать так, чтобы волновые функции были по-прежнему ортогональны.^При наложении возмущения собственные значения оператора Яо, как правило, оказываются невырожденными или во всяком случае кратность вырождения уменьшается. Это обстоятельство тесно связано с самой приро- природой вырождения. Мы указывали уже в § 35, что вырождение
§ 54] ТЕОРИЯ ВОЗМУЩЕНИЙ ПРИ НАЛИЧИИ ВЫРОЖДЕНИЯ 215 всегда связано с симметрией гамильтониана по отношению к оп- определенному классу преобразований координат системы. Воз- Возмущение, как правило, не обладает той же симметрией. Поэтому и результирующий гамильтониан возмущенной системы не бу- будет иметь прежней симметрии и его уровни энергии не будут вырожденными. Таким образом, возмущение снимает вырожде- вырождение. Например, при рассмотрении движения в центрально-сим- центрально-симметричном поле мы видели, что B1 + 1) -кратное вырождение уровней энергии связано с симметрией (неизменностью) гамиль- гамильтониана по отношению к вращению системы вокруг центра сил. Если поместить теперь систему во внешнее поле, то полный га- гамильтониан уже не будет обладать сферической симметрией. Возмущение (в данном случае внешнее поле) снимает B1 + 1)- кратное вырождение по направлениям момента количества дви- движения. После наложения возмущения вырожденный уровень энер- энергии расщепляется на 5 близких уровней, каждому из которых соответствует своя волновая функция, являющаяся линейной комбинацией функций г|^ "Ф == 2 стг^тГ E4,1) т, г Мы по-прежнему будем считать возмущение малым и будем искать в первом приближении теории возмущений близкие уров- уровни энергии (их часто называют подуровнями), на которые рас- расщепляется вырожденный уровень. Одновременно мы будем искать соответствующую совокупность волновых функций в ну- нулевом приближении. Именно мы должны найти в нулевом при- приближении правильные выражения для амплитуд стг в сумме E4,1), чтобы линейная комбинация E4,1) отвечала бы одному из подуровней, на которые расщепляется исходный уровень энер- энергии и уже мало изменялась при учете возмущения в следующем приближении. Рассмотрим вначале случай двукратного вырождения. В этом случае формула E4,1) дает Подставляя это значение в уравнении Шредингера E3,2), на* ходим -сх{Е- Е<0)) + Н12с2 + Нпс{ = О, схН2Х -с2(Е- ЕЩ + с2Н22 = 0. Полагая Е = ЕЮ + ?(*>, получаем систему однородных урав* нений
.216 ТЕОРИЯ ВОЗМУЩЕНИЙ [ГЛ. VII Условием разрешимости этой системы служит равенство нулю определителя п-?<'> Я12 Я21 Я-?0) ' откуда ( или ?0) = Я .Мы видим, что вырожденный уровень расщепляется на два уровня, отвечающих двум различным знакам перед корнем. Если |Я12|2<(ЯИ-Я22J, то мы возвращаемся к случаю двух независимых уровней, энер- энергии которых равны Ег = ?<°> + Е«> = Е® + Яп +тгЧ- > 1"" 2 Если же I #12 Р ^ #11 ~~ #22» то мы получаем н +Н +1 Я1212 + ( 22 -1 Я12 F - Совершенно аналогичные результаты получаются и в общем случае n-кратного вырождения. Подставляя E4,1) в уравнение Шредингера E3,2), мы полу- получим, аналогично E3,5), стр (Е - ?g?) = S H'mp, krckn E4,2) где обозначено Н' . = [ ti>M*H'ibMdV. лтр\ kr J ™трлл Ykr " ' В уравнении E4,2) мы должны положить т = п и прирав- приравнять друг другу члень! первого порядка малости. В соответствии <: этим мы должны взять амплитуды Ckr в нулевом приближении. Но в нулевом приближении волновая функция tp есть суперпо- суперпозиция функции tf®9 т. е. cfr отличны от нуля лишь при k = п.
§ 54] ТЕОРИЯ ВОЗМУЩЕНИЙ ПРИ НАЛИЧИИ ВЫРОЖДЕНИЯ 21Г Написав энергию Е в уравнении E4,2) в виде Е = Е{п + Е{1\ получаем cfE{l) = S Н'ргс?] E4,3> (мы опустили в обозначениях фиксированный индекс п). Система однородных уравнений E4,3) имеет нетривиальное решение лишь в том случае, если обращается в нуль детерми- детерминант, составленный из коэффициентов при неизвестных, т. е~ при условии Ни — Е #12 ... H\s #21 //22 — Е ... #25 л si tlss — ' 0. E4,4) Уравнение E4,4) называется секулярным или вековым уравне- уравнением. Секулярное уравнение является уравнением 5-го порядка относительно EV) и имеет, следовательно, 5 корней. Разрешив его относительно Е({\ находим для этой величины 5 значений^ Это означает, что n-й уровень энергии расщепляется на s-под- уровней Е{п} + Е\1\ Е(? + Е$\ ..., Е^ + Е^. В частном слу- случае некоторые корни секулярного уравнения могут оказаться равными между собой. При этом возмущение только частично снимает вырождение в системе. Подставляя найденные значения EW в уравнение E4,3), мы можем определить амплитуды cJJ, соответствующие данной по- поправке к энергии ?0>. Тем самым мы найдем в нулевом прибли- приближении правильные волновые функции, отвечающие энергетиче- энергетическим подуровням, на которые расщепляется уровень Еп\ Эти волновые функции уже слабо искажаются под действием воз- возмущения. Изложенный метод применим и в том случае, когда собствен- собственные значения оператора Но не вырождены, однако расположены так близко друг к другу, что неравенство E3,24) не выпол- выполняется ]). В качестве примера применения методов, изложенных в этом и предыдущем параграфах, мы рассмотрим смещение основ- основного энергетического уровня водородоподобного атома, а также- расщепление первого возбужденного уровня, обусловленное ко- конечными размерами ядра. При рассмотрении водородоподобных атомов мы считали,, что электрон находится в кулоновском поле ядра. При этом,. 1) Подробнее см. В. А. Фок, Начала квантовой механики, Кубуч, 1932У. стр. 92.
218 ТЕОРИЯ ВОЗМУЩЕНИЙ [ГЛ. VII однако, не учитывалось отличие поля от кулоновского в области самого ядра. Будем считать ядро равномерно заряженным ша- шариком радиуса г0. Тогда потенциальная энергия электрона при г •< г0 имеет вид [см. (9,4), ч. IV] 3 1 Гамильтонианом возмущения будет отличие потенциальной энер- энергии электрона от ее значения, взятого для чистого кулоновского поля Ze2 /3 \ г2 \ , Ze2 ^ Н' = ro U 2 rl) r Г^Г° E4,6) О, г>г0. Рпределим поправку первого приближения к основному уровню энергии: ?(i) = H'00= f 'Ф^/Г'Фо dV. E4,7) Волновая функция основного состояния согласно C8,22) E4,8) Подставляя E4,8) в E4,7), получаем 2Zr Так как радиус первой боровской орбиты а ~ 10"8 см, a r0 ^ ~ 10~12 еж, то показатель экспоненты в E4,9) очень мал, и экс- экспоненту можно заменить на единицу. Вычисляя интеграл E4,9), находим Даже для самых тяжелых атомов Z ~ 100 отношение Рассмотрим теперь первый возбужденный уровень п = 2. Как мы установили в § 38, этот уровень будет 4-кратно вырож- вырожден (состояния г|Jоо> i|>2ii, i|>2io, ^21,-1). Будем нумеровать эти волновые функции индексом 5, соответственно s = 1, 2, 3, 4. Уже из общих соображений ясно, что возмущение частично снимет вырождение. Действительно, в кулоновском поле мы имеем вы- вырождение по двум квантовым числам / и т. Вырождение по
г 54] ТЕОРИЯ ВОЗМУЩЕНИЙ ПРИ НАЛИЧИИ ВЫРОЖДЕНИЯ 219 квантовому числу / специфично для кулоновского поля. Вырож- Вырождение же по магнитному квантовому числу т имеет место в про- произвольном поле с центральной симметрией. Ввиду того, что поле при учете возмущения уже не будет строго кулоновским, хотя и останется центральным, вырождение по квантовому числу I снимется. Таким образом, мы можем ожидать, что уровень с я = 2 рас- расщепится на 2 уровня с п = 2, / = 0 и « = 2, / = 1. Покажем, что расчет действительно приводит к этому расщеплению. Секулярное уравнение в нашем случае будет иметь вид #21 я4', #12 #32 #42 #23 7 33 #43 ни #24 #34 #44 — Е E4,И) Матричные элементы берутся по функциям tynim: i|>i = tf>2 = ^211, Ч>3 = tp210 И 1|?4 = ф21, -1- Ввиду того, что оператор возмущения #' E4,6) зависит только от координаты г, все недиагональные матричные эле- элементы в E4,11) обращаются в нуль из-за ортогональности сфе- сферических функций C0,18). Действительно, при интегрировании по угловым переменным получим Для диагональных матричных элементов, используя C8,22) — C8,24), получим (интеграл по угловым переменным равен еди- единице) и' н' ы' z% П22 = П33 = Л44 = лл о 24а E4,13) Пренебрегая членами порядка го/а по сравнению с единицей, получаем 1 2V / Zr0 \4 1120 а \ а j ' E4,15)
220 ТЕОРИЯ ВОЗМУЩЕНИИ [ГЛ. VII Мы видим, что исходный уровень расщеплен на два под- подуровня. Смещение каждого из них по отношению к положению исходного уровня дается формулами E4,14) и E4,15). Величина смещения уровня п = 2, / = 0 примерно на порядок меньше, чем смещение уровня п = 1, / = 0. Смещение уровня п =» 2, / = 1 еще меньше благодаря множителю 10" [—-) • Последнее об- обстоятельство обусловлено тем, что электрон в состоянии п = 2, / = 1 находится в основном вне области ядра и искажение куло- новского поля в этой области очень слабо сказывается на его состоянии. Заметим, наконец, что рассмотренные поправки оказываются значительно более существенными для мезоатомов. Это связано с тем, что мезоны значительно тяжелее электронов и потому на- находятся в основном много ближе к ядру (см. § 38). Так для ji-мезоатома относительное смещение уровня с / = 0 примерно в 4-Ю4 раз больше, чем для обычного атома, и становится уже заметной величиной. § 55. Теория нестационарных возмущений Весьма часто возмущения, действующие на квантовомехани- ческую систему, имеют нестационарный характер (т.^е. зависят от времени). Это означает, что оператор возмущения #' является явной функцией времени H'(t). Многочисленные примеры та- такого рода возмущений будут приведены ниже. Мы будем пред- предполагать, что стационарные состояния невозмущенной системы известны, т. е. известны волновые функции удовлетворяющие невозмущенному уравнению ^^t). E5,1) Мы ограничимся сначала простейшим случаем, когда состояния невозмущенной системы принадлежат дискретному спектру. Если на систему действует малое возмущение, описываемое оператором H'(t), то волновая функция возмущенной системы -ф удовлетворяет уравнению /Й-^ = (ЯО + Я')Ф. E5,2) JVleTOA приближенного решения этого уравнения был разработан Дираком и часто называется теорией возмущения Дирака или
§ 55] ТЕОРИЯ НЕСТАЦИОНАРНЫХ ВОЗМУЩЕНИЙ 221 методом вариации постоянных. Состояние возмущенной системы зависит от времени и ее энергия не является интегралом дви- движения. Теперь нашей задачей является не нахождение стацио- стационарных состояний возмущенной системы, так как их не суще- существует, а вычисление зависящей от времени волновой функции системы. Поэтому метод теории возмущений должен быть видо- видоизменен. Решение уравнения E5,2) в методе вариации постоян- постоянных представляется в виде разложения по собственным функ- функциям невозмущенной задачи Поскольку волновые функции tyf*{xft) образуют полную си- систему функций, такое разложение всегда возможно. Коэффи- Коэффициенты разложения Ck(t) являются функциями только времени, но не координат. Подставляя разложение E5,3) в уравнение E5,2), получаем Умножим уравнение E5,4) слева на ^*{х91) и проинтегрируем по всему пространству. Тогда, учитывая уравнение E5,1) и ор- ортогональность волновых функций невозмущенной системы ^0) (, t), имеем F5,5) к где Hmk — матричный элемент оператора возмущения W^(x)rfK, E5,6) — Ek). Система уравнений E5,5) является точной. Она эквивалентна исходному уравнению E5,2), поскольку совокупность коэффи- коэффициентов Ck полностью определяет волновую функцию ф. Ясно од- однако, что решение бесконечной системы уравнений E5,5) не является более простой задачей, чем решение исходного урав- уравнения E5,2). Поэтому для упрощения системы уравнений E5,5) мы должны воспользоваться тем, что возмущение, действующее на систему, является малым. Предположим, что первоначально, при t -^ 0, система находилась в некотором состоянии с волно- волновой функцией я|^°). Тогда при КО в разложении E5,3) все ко- коэффициенты, кроме коэффициента с индексом п, равны нулю,
222 ТЕОРИЯ ВОЗМУЩЕНИЙ [ГЛ. VII 6kn. E5,7) Начиная с момента времени t = О, система подвергается дей- действию малого возмущения. Будем предполагать, что вследствие слабости возмущения волновая функция i|^0) начального состоя- состояния мало меняется с течением времени. Соответственно, коэф- коэффициенты ch(t) в момент времени t > О ищем в виде ск @ = cf (t) + 4° @ + cf (/)+..., E5,8) где Поправка c$(t) имеет тот же порядок малости, что и возмуще- возмущение, cf{t)— квадратична по возмущению и т. д. Подставляя разложение E5,8) в уравнение E5,5), находим tt *W = 2 Н'^Штк'^ = Я^*-1. E5,9) k При этом опущены все члены второго и более высокого порядка -малости по возмущению. Интегрируя E5,9), получаем t с% @ = "Я" J H'mne'*™* dt. E5,10) о Аналогичным образом можно найти поправки к $1 второго и более высокого порядка малости. Например, для поправки вто- второго порядка с(т без труда получается выражение j k о Если возмущение достаточно мало, то в разложении можно ограничиться малым числом членов. Таким образом, волновая функция в любой момент времени t > 0 может быть найдена, в принципе, с желаемой степенью точности. § 56. Переход системы в новые состояния под влиянием возмущений Мы выяснили, что, если на систему, находившуюся при t К О в определенном энергетическом состоянии и описывавшуюся волновой функцией а|40)> действует возмущение H'(t), то при / > 0 система оказывается в новом состоянии с волновой функ-
§ 56] ПЕРЕХОД СИСТЕМЫ В НОВЫЕ СОСТОЯНИЯ 223 цией E5,3). Это означает, что при t>0 система может быть найдена в любом из ее возможных стационарных квантовых со- состояний; вероятность найти систему в некотором квантовом со- состоянии т определяется согласно общим правилам квантовой механики значением величины \ст\2. Так как в начальный мо- момент t = 0 система находилась в п-м стационарном состоянии, то, следовательно, \cm(t) |2 определяет вероятность перехода си- системы из п-го состояния в т-е за время ty Wmn(t) = \cm(t)\2 = ^\cmn{t)\2. Здесь вторым индексом мы отметили начальное состояние системы. Итак, возмущение оказывается причиной, вызывающей пере- переход системы из одного квантового состояния в другое. Харак- Характерной особенностью этого процесса, не имеющей аналогии в классической физике, является то, что данное возмущение вы- вызывает переход системы из стационарного состояния с опреде- определенной энергией в новое состояние, в котором энергия не имеет какого-либо определенного значения. Часто это понимают так, что под действием возмущения система скачком переходит в одно из возможных энергетических состояний. В каком именно состоянии окажется система — дело случая. Однако такая трак- трактовка ошибочна и противоречит физическим основам квантовой механики. В действительности конечное состояние описывается волновой функцией г|э и является поэтому определенным (в кван- товомеханическом смысле) состоянием. Переход из начального в конечное состояние не совершается скачком, а разыгрывается во времени. Действительно, как мы увидим ниже, вероятность перехода определяется характером возмущения и его зависимостью от времени. Наибольший интерес представляют переходы из дискретного в непрерывный спектр, именно такие переходы мы и будем рас- рассматривать в дальнейшем. Для нахождения вероятности перехода необходимо, очевидно, знать зависимость матричного элемента оператора возмущения Hvn от времени. Здесь индексом v мы характеризуем состояние в непрерывном спектре. Рассмотрим прежде всего важный случай, когда оператор возмущения является гармонической функцией времени. При этом матричный элемент оператора возмущения (взятый по не- невозмущенным волновым функциям не зависящим от времени) также является гармонической функцией времени, т. е. #'vn@ = #Cn@) cos cot. E6,1) Будем считать, что частота о удовлетворяет соотношению
224 ТЕОРИЯ ВОЗМУЩЕНИЙ [ГЛ. VII где через Ео обозначено то значение энергии системы, с кото- которого начинается непрерывный спектр. Подставляя выражение E6,1) в E5,10), находим: el(evn+«)'_1 '(•ve-e)Li Здесь вторым индексом у с^ мы отмечаем начальное состояние системы. Так как непрерывный спектр лежит в области больших энергий, чем дискретный, то (ovn > 0. Из структуры выражения E6,2) следует, что при юш » о знаменатель одного из слагае- слагаемых близок к нулю. Переходы в состояния, для которых выпол- выполняется условие (ovn ~ (о, осуществляются с наибольшей вероят- вероятностью. Именно, из дальнейшего будет видно, что вероятность перехода в такие состояния линейно растет со временем. Опу- Опуская поэтому в формуле E6,2) второе слагаемое, имеем Соответственно для квадрата модуля I с^п |2 получаем sin2 т (щп - со) * я | я/ (Оч 12 | «и Г = IF i ^v« @) |2 -Т7 — = ' Д ' '/ («. 0. E6,4) где 1 / ч ? / j\ sin2 at <* = y(u>vn-«>) и /(«»0 = Обычно на практике представляет интерес знание величины |c(v«|2 при больших значениях времени / (напоминаем, что мо- момент включения возмущения принят за начало отсчета времени / = 0). Поэтому необходимо рассмотреть поведение функции f(a, t), когда tf-*oo. Легко видеть, что при а^О и /-*оо, /(a, t) ->0. При а = 0 f@, /) = — и неограниченно возрастает с ростом /, Наконец, интегрируя /(а,/) по всем значениям а, находим 1 f sin2* , , ,-,, еч >— J —ji-dx-L E6,5) Сравнивая указанные свойства функции /(а, /) со свойствами б-функции, мы убеждаемся в их тождественности (см. прило- приложение III). Таким образом, lim/(a, /) есть один из возможных
§ 56] ПЕРЕХОД СИСТЕМЫ В НОВЫЕ СОСТОЯНИЯ 225 конкретных видов 6-функции и мы можем написать: Подставляя это выражение в формулу E6,4) и пользуясь из- известными свойствами 6-функции (см. приложение III), полу- получаем: I2 = E6,6) Формулы E6,4) и E6,6) будут справедливы при условии, что вероятность перехода из данного n-го состояния в любое v-e со- состояние мала, т. е. Лишь при этом выполняется исходное предположение о малости изменения волновой функции начального состояния. Так как вероятность перехода ли- линейно растет со временем, а' то для применимости тео- теории возмущений необходи- необходимо, чтобы время действия возмущения t не было бы слишком большим. Поэто- Поэтому выясним, какие заключе- заключения можно сделать о веро- вероятности перехода за конеч- конечный интервал времени t. . ..^-ч Для этого исследуем фор- -ёл -М- -Л. О п 2я Зя ос мулу E6,4), не переходя к * t t t t t пределу ^->оо, т. е. рас- Рис. 16. смотрим поведение функции /(a, t). График этой функции, зависящей от времени t, как от параметра, представлен на рис. 16. Из вида функции /(a, t) следует, что в основном осущест- осуществляются переходы в такие состояния, для которых величина а лежит в пределах главного максимума, т. е. Да~у. Разброс значений параметра а определяет разброс значений энергии ко- конечного состояния системы A?v~fiAa~y. E6,7) Таким образом, мы приходим к выводу, что за время / система под влиянием возмущения E6,1) может переходить в состояния с энергией ?v = Ef + йсо + A?v, где A?v~-j. 8 В. Г. Левич и др., том II
226 ТЕОРИЯ ВОЗМУЩЕНИЙ [ГЛ. VII Неопределенность энергии конечного состояния AEV -* 0 при / —> оо. Отметим, что именно такую величину неопределенности энергии конечного состояния Д?\,~-^- и следовало ожидать, ис- исходя из соотношения неопределенности для времени и энергии (см. §34). Из требования малости неопределенности энергии конечного состояния A?v по сравнению с энергией йсо вытекает неравен- неравенство '»т- Следовательно, АЕУ <С йсо, если время действия возмущения велико по сравнению с периодом возмущения. Переход к б-функции в формуле E6,6) означает, что время t может быть достаточно большим, так что неопределенностью энергии конечного состояния можно пренебречь, и тем не менее условие применимости теории возмущений еще выполняется. Формула E6,6), содержащая б-функцию, имеет смысл, ко- конечно, лишь потому, что в дальнейшем имеется в виду интегри- интегрирование по аргументу б-функции. Заметим, что условия применимости теории возмущений на- нарушаются при рассмотрении переходов в дискретном спектре в так называемом резонансном случае, т. е. когда |(о&п| ~ со. При этих условиях поправки к волновой функции t|^0) становятся большими и задача должна решаться точно !). Вероятность перехода из квантового состояния с энергией Е{п в состояние непрерывного спектра в интервале dv, отнесенная к единице времени, определяется формулой dWvn = у | сУп |2 dv = -щ | Н'ш @) Г б (?v - Ef - fico) dv. E6,8) При этом волновые функции сплошного спектра должны быть нормированы на б-функцию в v-пространстве. Формула E6,8) показывает, что под влиянием возмущения, гармонически зави- зависящего от времени, система может совершать переходы только в состояния с энергией Вероятность перехода определяется квадратом матричного элемента оператора возмущения и зависит, разумеется, от вы- выбора величин, характеризующих состояние непрерывного спектра. Часто в качестве одного из параметров, характери- характеризующих состояние в непрерывном спектре, выбирают энергию ]) См. Л. Д. Ландау и Е. М. Лифшиц, Квантовая механика, Физ- матгиз, 1963, стр. 173.
§ 56] ПЕРЕХОД СИСТЕМЫ В НОВЫЕ СОСТОЯНИЯ 227 частицы. Тогда, интегрируя по остальным параметрам, имеем dWEn = -2J. | н'Вл @) |2 р (Е) 6 (Е - 40) - to) dE, E6,9) где p(E)dE— число состояний с энергией в интервале от Е до Е + dE и введено обозначение Интегрируя по энергии, находим полную вероятность перехода в единицу времени из состояния с-энергией Е{® в состояние не- непрерывного спектра под влиянием гармонического возмущения: ^(Я), E6,10) где ?«?io) + to. Заметим, что если бы мы в отличие от E6,1) матричный эле- элемент возмущения обозначили, введя экспоненциальные функции, как то числовой коэффициент в формулах E6,8) — E6,10) изменился бы, очевидно, в четыре раза. Например, формула E6,8) пере- перепишется при этом в виде dWvn = Ц-1 #;„ @) |2 б (?v - Ef - fico) dv E6,80 и аналогично изменятся формулы E6,9) и E6,10). Другим важным частным случаем является переход, вызы- вызываемый возмущением, не зависящим от времени. Выражение для вероятности перехода можно получить из формулы E6,8), по- полагая в ней частоту со = 0 и удваивая матричный элемент воз- возмущения. Последнее обстоятельство связано с тем, что при пе- переходе от E6,2) к E6,3) был опущен член, который при со = 0 совпадает с оставленным. Для вероятности перехода имеем dWwo = -у- I #Cvo Г б (?v - EVo) rfv. E6,11) Возмущение, не зависящее от времени может вызывать пере- переходы только в состояние с той же энергией. Иными словами, оно может вызывать переходы лишь между вырожденными со- состояниями. Мы обозначили здесь начальное состояние ин- индексом vo, так как при действии постоянного возмущения основ- основной интерес представляют переходы в непрерывном спектре. Ко- Конечно, все приведенные выше рассуждения, связанные с перехо- переходом к б-функции, сохраняются и в данном случае.
228 ТЕОРИЯ ВОЗМУЩЕНИЙ [ГЛ. VII Интегрируя E6,11) по энергиям конечных состояний, можем записать вероятность перехода в другой форме: 0 = ~y J I "vv01 -^- о \E — ?vo) a? = -g-1 #vv0 I -fir. E6,12) Полную вероятность перехода запишем, аналогично E6,10), в виде !F=-^l#k|2p(?), E6,13) где Пусть, например, конечное состояние характеризуется зада- заданием импульса частицы, так что dv = dpx dp у dpz = р2 dp dQ = pm dE dQ, p2 где E = ~ энергия конечного состояния частицы и dQ — элемент телесного угла. Формула E6,12) перепишется в данном случае в виде dWpVo = Ц. | н'Ръ |2 тр dQ, где р = УШ179. E6,14) Здесь волновые функции конечного состояния должны быть нор- нормированы на б-функцию в импульсном пространстве. При другом способе нормировки этих функций, например нормировке в «ящике» [см. B6,16), B6,17)] интервал конечных состояний dv' будет иметь вид dpx dp у dpzV dv' = dnx dny dnz = щщз—. E6,15) Выражение для вероятности перехода E6,14) при этом, ко- конечно, не изменится. Заметим, наконец, что выражения E6,11) — E6,14) зависят от способа нормировки волновой функции на- начального состояния, также принадлежащего непрерывному спектру. Очень часто матричный элемент оператора возмущения ока- оказывается равным нулю. В этом случае вероятность перехода обращается в нуль. Это значит, что соответствующий переход невозможен в первом приближении теории возмущений. В сле- следующем приближении вероятность соответствующего перехода может оказаться отличной от нуля. Найдем для этого случая вероятность перехода, вызываемого возмущением, не зависящим от времени, во втором приближе- приближении теории возмущений.
56] ПЕРЕХОД СИСТЕМЫ В НОВЫЕ СОСТОЯНИЯ 229 Формула E5,11) дает cl2) t = !j S J ЯСЛ' (t) e1^' dt. E6,16) k 0 J k 0 Входящая сюда сумма (по сплошному спектру — интеграл) бе- берется по промежуточным или, как их иногда называют, вир- виртуальным состояниям, так что сам переход можно трактовать как переход через промежуточные состояния. Необходимо под- подчеркнуть, что переход системы чер.ез промежуточные состояния не является реальным физическим процессом, а служит лишь для трактовки полученных формул. Поэтому, например, при переходах в виртуальные состояния энергия системы не обя- обязана сохраняться. Подставляя в E6,16) выражение для с%] из E6,2) (со = 0) и интегрируя, получаем <56>17> Поскольку по предположению переходы в первом приближении теории возмущения отсутствуют, матричный элемент оператора возмущения #^0 = 0 для переходов, происходящих с сохране- сохранением энергии co^Vo = 0. В соответствии с этим те промежуточные состояния, для которых со№ = 0, не вносят вклада в амплитуду E6,17). Для переходов, происходящих с сохранением энергии1) (©wo= 0)э второе слагаемое в квадратных скобках формулы E6,17) не существенно. Действительно, оно могло бы'дать за- заметный вклад лишь при соу& = 0. Но coVVo = covk + cokVo и при <oVVo = 0 и covfe = 0 получаем, что и сокщ обратится в нуль. Для таких переходов Я^0 = 0 и, следовательно, их можно не учиты- учитывать. Исходя из этого, мы можем переписать E6,17) как где (по сплошному спектру имеется в виду интегрирование). !) Возможность переходов с несохранением энергии связана с предполо- предположением о внезапности включения возмущения, см. E6,1). Более подробное обсуждение этого вопроса см., например, в книге Л. Ш и ф ф а, Квантовая механика, ИЛ, 1957, стр. 234, 251.
230 ТЕОРИЯ ВОЗМУЩЕНИЙ [ГЛ. VIF Мы видим, что при записи в форме E6,18) выражение для амплитуды с® совпадает с E6,2) (со = 0). Поэтому полученные результаты, в частности формула для вероятности перехода E6,8), сохраняются с условием, что мы должны заменить мат- матричный элемент //?Vo на матричный элемент AVVo. § 57. Адиабатическая теория возмущений В некоторых случаях возмущение, действующее на кванто- квантовую систему, связано с медленным, адиабатическим изменением, параметров, от которых зависит состояние системы. В случае адиабатического изменения некоторых параметров,, характеризующих систему, оказывается возможным развить специальный приближенный метод расчета, именуемый адиаба- адиабатической теорией возмущений. Нам придется встретиться с этим методом в дальнейшем при изучении свойств молекул и твер- твердого тела. В таких системах имеются два сорта частиц: легкие электроны, движущиеся с большими скоростями, и тяжелые ядра, совершающие сравнительно медленное движение. Назо- Назовем электроны, входящие в систему, быстрой подсистемой, а тя- тяжелые ядра — медленной подсистемой. Грубо говоря, характер- характерное время, требующееся для изменения состояния быстрой подсистемы, весьма мало по сравнению с соответствующим вре- временем для медленной подсистемы. Сущность адиабатической теории возмущений сводится к тому, что движение быстрой под- подсистемы рассматривается в первом приближении при заданных, координатах медленной подсистемы. Иными словами, движения быстрой и медленной подсистемы являются до известной степени независимыми. Рассмотрим движение системы, состоящей из электронов и ядер. Уравнение Шредингера запишем в виде { 2 Л Здесь т и М — соответственно массы электронов и ядер. Сум- Суммирование по k проводится по координатам электронов, сумми- суммирование по / отвечает суммированию по координатам ядер. U — оператор энергии взаимодействия частиц между собой. Предположим далее, что можно найти решение следующега уравнения Шредингера: " -Ш ? Д* + U (г*' *')] Vn irk, *,) - Еп (Rt) Ф„ {rk, Rt). E7,2) Уравнение E7,2) имеет следующий физический смысл. Ядра предполагаются закрепленными в точках /?*. Нахождение реше-
^§ 57] АДИАБАТИЧЕСКАЯ ТЕОРИЯ ВОЗМУЩЕНИЙ 231 ния уравнения E7,2) сводится к определению характера дви- движения электронов при неподвижных ядрах, т. е. к определению электронной волновой функции фп и уровней энергии электрон- электронной системы. Как видно из уравнения E7,2), уровни энергии электронной подсистемы En(Ri) зависят от координат ядер (тя- (тяжелой подсистемы), как от параметров. Геометрически электронная энергия En(Ri) образует неко- некоторую поверхность в пространстве Ri. Эту поверхность назы- называют электронным термом. Решение уравнения E7,1) представим в виде разложения в ряд по полной системе волновых функций фп, т. е. напишем ¦ (rk9 Ri) = 2 ап (Rt) cprt {rk, Rt). E7,3) п Подставляем E7,3) в E7,1), а затем умножаем уравнение E7,1) на ф^ и интегрируем по координатам электронов dV = .= dV\dV2.... Учитывая формулу + 2 находим следующее уравнение: n i Здесь gradi вычисляется по координатам ядер Ri. Перепишем уравнение E7,4) в виде -Ш 5 А< + Ет Ш] *т (Ki) = Eam (Rt) + Cam, E7,5) где оператор С определен следующим образом: (Ъ2 Г * й2 Г \ E7.6) Оператор С носит название оператора неадиабатичности. Если оператор С считать малым и опустить в уравнении E7,5), то уравнения для функции фт и <хт приобретают вид E7,7) E7,8)
232 ТЕОРИЯ ВОЗМУЩЕНИЙ [ГЛ VU Таким образом, в нулевом приближении по оператору С по- лучаем важный результат. Уравнение E7,7) представляет собой уравнение Шредингера. Координаты ядер входят в это уравне- уравнение как параметры. Функция фт(^, Ri) описывает движение электронов при неподвижных ядрах. Уравнение E7,8) содержит лишь операторы, действующие на координаты ядер. Оно может рассматриваться как уравнение Шредингера для тяжелой под- подсистемы — ядер. При этом энергия электронной подсистемы Em(Ri) играет роль потенциальной энергии ядер. Полная волновая функция системы в нулевом приближении С = О может быть представлена в виде произведения волно- волновых функций ат и фт, т. е. имеет такой же вид, как если бы обе подсистемы были вполне независимыми: ¦ = ат(Л,)фт(гл, Rt). В описанном приближении можно говорить, что электронная подсистема адиабатически следует за движением ядер в том смысле, что при изменении положения ядер Ri электронная под- подсистема остается в том же квантовом состоянии Ет. Однако ее уровень энергии Ет изменяется в соответствии с движением ядер. В общем виде нельзя сформулировать условие малости опе- оператора С. В каждой конкретной задаче этот вопрос следует рас- рассматривать отдельно. Примеры такого рассмотрения могут быть найдены в книгах В. Паули и М. Борна и Хуан Кунь1). § 58. Теория возмущений в интегральной форме Теория возмущений легко может быть развита в рамках фор- формализма Фейнмана2). Для этого удобно основываться на ин- интегральном уравнении B9,5) для функции Грина K(r2t2\ r\t\), которую будем обозначать как К B,1) оо КB, 1) = /С0B, 1)-? \кй{2,Ъ)Н'{Ъ)К(Ъ, l)d%. E8,1) — оо Здесь через /Со B,1) мы обозначили функцию Грина невозму- невозмущенной задачи Н = #0, Н' = 0. Пользуясь малостью возмущения, решаем уравнение E8,1) ме- методом последовательных приближений. В нулевом приближении, 1) В. Паули, Общие принципы волновой механики, Гостехиздат, 1947,. стр. 141; М. Б о р н и X у а н Кунь, Динамическая теория кристаллических ре- решеток, ИЛ, 1958, стр. 193. 2) Ссылка на стр. 104. См. также С. Ш в е б е р, Г. Бете, Ф. Гофман, Мезоны и поля, т. 1, стр. 78, ИЛ, 1957.
§ 58] ТЕОРИЯ ВОЗМУЩЕНИЙ В ИНТЕГРАЛЬНОЙ ФОРМЕ 233 т. е. считая Н' = О, имеем: /СB, 1) = /С0B, 1). E8,2) Следующее приближение мы получим, если подставим в инте- интеграл E8,1) функцию Грина КC,1) в нулевом приближении, т. е. К{{) B, 1) = - у J *о B, 3) Я' C) Ко C, 1) d%. E8,3) Чтобы получить поправку к функции Грина во втором прибли- приближении, мы должны подставить в интеграл E8,1) функцию К C,1) уже с точностью до членов первого порядка малости: К™ B,1) = (^~-J J Ко B, 3) Я' C) КоC, 4) Я' D) Ко D, 1) d*x3 d%. E8,4) Аналогичным образом можно выписать поправку любого по- порядка малости. Окончательно имеем: КBУ 1) = *оB, 1)~/ J^^4)/CoD, l)d*x3d% + ... E8,5) Формулу E8,5) можно интерпретировать следующим образом: нулевой член описывает распространение невозмущенной ча- частицы из точки 1 в точку 2. Следующий член описывает распро- распространение свободной частицы из точки 1 в точку 3. В точке 3 действует возмущение. Затем частица, опять как свободная, рас- распространяется из точки 3 в точку 2. Интегрирование означает, что мы суммируем вклад всех возможных точек 3. Член второго порядка малости учитывает действие возмущения уже в двух точках 3 и 4 и т. д. Вычислив из уравнения E8,5) функцию Грина К в нужном приближерши, мы тем самым знаем и волно- волновую функцию в этом приближении. Удобство интегрального уравнения E8,1) в том и заключается, что оно позволяет чрез- чрезвычайно просто получить ряд теории возмущений. Примеры ис- использования интегральной формы теории возмущений мы рас- рассмотрим в гл. XIII.
ГЛАВА VIII СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ § 59. Спин элементарных частиц До сих пор мы предполагали, что состояние отдельной ми- микрочастицы задано, если известны три ее координаты или три проекции импульса или вообще три величины, образующие пол- полный набор. Оказалось, что целый ряд экспериментальных фак- фактов указывает на существование у ряда микрочастиц, например у электронов, протонов, нейтронов, специфической внутренней степени свободы. С этой внутренней степенью свободы, связан некоторый собственный механический момент частицы, не зави- зависящий от ее орбитального движения. Этот механический момент частицы получил название спина (от английского слова to spin — вращаться). Существование у электрона спина было установ- установлено еще до создания квантовой механики. Были сделаны по- попытки интерпретировать спин как проявление вращения частицы вокруг собственной оси (отсюда и его название). Однако такая классическая трактовка оказалась несостоятельной. Все попыт- попытки получить правильное значение отношения между механиче- механическим и магнитным моментом для системы распределенного вра- вращающегося заряда, оказались безуспешными. Что же касается модели твердого вращающегося шарика (для которой можна получить любое значение этого отношения), то, как было пояс- пояснено в § 13 ч. II, такая модель противоречит общим положениям теории относительности. Разрешение этого противоречия была найдено в квантовой механике. Как мы увидим ниже, внутрен- внутренняя степень свободы и связанный с ней спин имеют специфиче- специфически квантовый характер. При переходе к классической механике Ь ->¦ О спин обращается в нуль. Поэтому спин не имеет никаких классических аналогов и не допускает интерпретации классиче- классического характера. Первоначально гипотеза о существовании спи- спина была выдвинута в связи с расшифровкой спектров щелочных металлов. Позднее был установлен целый ряд фактов, позволив- позволивших однозначно установить правильность этой гипотезы. В опытах Штерна и Герлаха непосредственно наблюдался магнитный момент, не связанный с орбитальным движением
$ 59] СПИН ЭЛЕМЕНТАРНЫХ ЧАСТИЦ 235 электронов. Именно в этих опытах было установлено, что если через неоднородное магнитное поле пропускать пучок атомов водорода, находящихся в S-состоянии, то этот пучок расщеп- расщепляется на два. Между тем в S-состоянии орбитальный механиче- механический момент, а следовательно и орбитальный магнитный момент, отсутствует, и пучок должен был бы проходить магнитное поле, не испытывая никакого отклонения. Двукратное расщепление свидетельствует о двух возможных ориентациях магнитного момента электрона. По величине рас^ щепления можно определить значение спинового магнитного мо- момента. Прямые опыты, проведенные Эйнштейном и де Гаазом, по- позволили определить отношение собственного механического и магнитного моментов. Спин электрона (собственный механический момент) обла- обладает общими свойствами квантовомеханического момента, кото- которые были разобраны в § 51. Строго это было доказано с ш> мощью аппарата теории групп. В частности, собственное значе- значение оператора квадрата спинового момента s2 = s^ + s2y+ 5J выражается формулой s(s+ \)h\ E9,1) где через 5 мы обозначили соответствующее квантовое число — внутреннее или спиновое квантовое число частицы. Часто это квантовое число кратко именуют величиной спина частицы. Число возможных проекций спина на произвольно ориенти- ориентированную ось z равно 25+1. Значение внутреннего числа 5 для той или иной элементарной частицы должно быть определено на опыте. Для электрона существование и величина спина стро- строго вытекают из релятивистской квантовой механики (теории Ди- Дирака), изложению которой будет посвящена гл. XV. Спин наиболее часто встречающихся элементарных частиц равен: электронов 5 = у, протонов и нейтронов 5 = у, я-мезо- нов 5 = 0, ji-мезонов s = y. Это означает, что возможные зна- значения проекций спинового момента на произвольно ориентиро- ориентированную в пространстве ось равны, например, для электрона и других частиц со спином У2 5,= ±-|. E9,2) Соответствующие проекции собственного магнитного момен- момента электрона, как следует из опыта Штерна и Герлаха, равны по абсолютной величине магнетону Бора jj,0 »**e:p "felf "^^ E9'3)
236 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ [ГЛ. VIIT Весьма существенно, что отношение собственного магнитного момента к спиновому механическому моменту равно е/тс в то время как для орбитального движения это отношение вдвое меньше (см. § 63). В § 118 мы покажем, что такая величина собственного маг- магнитного момента также может быть выведена теоретически из релятивистского волнового уравнения Дирака. Спиновые свойства элементарных частиц играют огромную роль как в области микроявлений, так и в поведении макроско- макроскопических тел. Последнее обстоятельство связано с тем, что спин непосредственно определяет статистические свойства систем, по-* строенных из квантовых частиц. § 60. Операторы спина Хотя, как мы увидим ниже, существование у электрона спи- спина и все связанные с ним свойства могут быть установлены тео- теоретически из положений релятивистской квантовой механики, ряд свойств частиц со спином может быть получен и без привле- привлечения релятивистской теории, на основании общих квантовомеха* нических соображений и сравнительно небольшого числа экспе- экспериментальных фактов. Поскольку такая полуэмпирическая теория частиц со спином имеет достаточно простой характер и позволяет получить важные результаты, мы остановимся ниже на ее изложении. Волновая функция частицы со спином будет зависеть не только от ее трех пространственных координат, но и от четвер- четвертой координаты, характеризующей внутреннее состояние части- частицы. В качестве последней можно выбрать величину проекции спина на произвольно ориентированную в пространстве ось z. Тогда волновую функцию можно написать в виде ¦ = Ф(*, sZ9 t). F0,1) В отличие от пространственных координат я, «спиновая коор- координата» sz принимает лишь дискретный ряд значений. Число возможных значений sz определяется свойствами данной эле- элементарной частицы. Как было упомянуто выше, спин большин- большинства элементарных частиц равен половине. Поскольку проекция спина при этом может принимать только два значения, волно- волновую функцию F0,1) удобно записать в виде столбца с двумя
§ 60] ОПЕРАТОРЫ СПИНА 237 строчками:? При этом |i|?i|2dV мы можем интерпретировать как вероят- вероятность того, что в момент времени t электрон находится в эле- элементе объема dV и имеет при этом проекцию спина на ось z, равную у. |i|J|2dV соответственно вероятность того, что у элек- электрона, находящегося в том же элементе объема dV проекция спина на ось z равна — у. Волновая функция -ф(л:, sZJ t) пред- предполагается нормированной так, что где суммирование ведется по всем возможным значениям проек- проекции спина sz. Если вероятность той или иной проекции спина не зависит от координат частицы, то волновую функцию F0,2) можно переписать в виде * = ¦(*, *)Ф. F0,3) (сЛ где i|)(x, t)—обычная (координатная) и ф= — спиновая \С2/ волновые функции, С\ и с2 — некоторые числа. |ci|2 и |с2|2 дают вероятности того, что проекция спина sz равна соответственно + Т И —2- В силу условия нормировки волновой функции имеем: к,|2 + |с2|2=1. F0,4) Определив понятие спиновой волновой функции, мы должны ввести действующие на нее операторы спина. В общем виде дей- ствие оператора на спиновую функцию ср = i сводится к \С2 / тому, что компоненты с\ и с2 заменяются на их некоторую ли- линейную комбинацию 'сА (апсх + аХ2с2\ F0,5) В соответствии с этим спиновый оператор может быть пред- представлен в виде матрицы . F0,6) Oai #22/
238 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ [ГЛ. VIII Правило действия такого оператора на волновую функцию дается формулой F0,5), т. е. «„ al2UcAJancl + a12c2y а2Х а22)\с2] \ас + ас) Если разбиение волновой функции на координатную и спино- спиновую составляющие недопустимо, то формула F0,7) перепишет- перепишется в виде (а« «„WhWe.rt. + e.A) \а21 а22)\^2) \ a2lty{ + a22i|J / Среднее значение оператора й, взятое в состоянии г|э, опреде- определяется согласно общей формуле D4,8): а (х, t) = $[ап% + i|>;al2i|>2 + ^а21% + ^а22%. F0,9) Это равенство можно переписать в матричной форме а(*,/) = ф+Й1|>, F0,Ю) где г|э+ — матрица, состоящая из одной строки с элементами *! и $г *+в(*!*Э- F0'П) Соотношение F0,10) определяет среднее значение величины а в момент времени t в данной точке пространства х. Если это выражение усреднить по всем положениям частицы, то мы по- получим \ F0,12) Введем теперь операторы проекций спина sxi syi sz. В § 51 было показано, что вид этих операторов и все свойства спина могут быть получены, если за основу взяты перестановочные соотношения $у&я-$г&у=Шх, | F0,13) SZSX — §x§z = lft§y. ) То обстоятельство, что операторы проекций спина должны удо- удовлетворять тем же перестановочным соотношениям, что и опе- операторы проекций орбитального момента, конечно, не является случайным. Именно, в § 30 было показано, что оператор проек- проекции орбитального момента на какую-либо ось связан с операто- оператором бесконечно малого поворота вокруг этой оси. Перестановоч- Перестановочные соотношения C0,3) и C0,37) являются следствием этого обстоятельства, т. е. следствием коммутационных соотношений
§60] ОПЕРАТОРЫ СПИНА 239 между операторами бесконечно малых вращений. В следующем параграфе мы покажем, что операторы проекций спина также связаны с операторами поворота, воздействующими, однако, уже не на координатную, а на спиновую функцию. Следствием коммутационных соотношений между операторами бесконечно малых вращений вокруг осей х, у, z и являются перестановоч- перестановочные соотношения F0,13). Приведенные соображения строго обосновываются методами теории групп1). Из соотношений F0,13) следует аналогично C0,4) F0,14) Таким образом, квадрат полного спина и одна из его проек- проекций на произвольную ось могут быть измерены одновременно. Две проекции спина на разные оси одновременно не имеют оп- определенных значений. При 5 = -у матрицы спина s2 = s2x + s2y + s\ и его проек- проекции на ось z в своем собственном представлении имеют вид (диагональные матричные элементы равны собственным значе- значениям соответствующих операторов) Матрицы §х, §у в этом представлении, согласно общей формуле E1,16), запишутся так: (? ~i)f<v (боле) Матрицы oXi ау, а2, отличающиеся от матриц sx, syi sz постоян- постоянным множителем у > носят название матриц Паули. Они удовле- удовлетворяют следующим перестановочным соотношениям: F0,17) = - ozay •• azax = — gxoz 1. l) См. В. Паули, Общие принципы волновой механики, Гостехиздат, 1947, стр. 165.
240 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ [ГЛ. VIII Произвольная матрица второго ранга может быть выражена че- через матрицы Ох, оу, gz и единичную матрицу. Наряду со сходством между орбитальным и спиновым мо- моментами между ними существует принципиальное различие. В то время как орбитальный момент характеризуется кванто- квантовым числом /, могущим принимать любые целочисленные значе- значения независимо от природы частицы, спиновое число 5 прини* мает ограниченный ряд значений, например s = У2 для боль- большинства элементарных частиц. При этом каждый вид элемен- элементарных частиц имеет свое характерное значение спина. Если совершить переход к классической механике, положив Ь ->¦ 0, то, как это было выяснено в § 41, следует одновременно перейти к пределу больших квантовых чисел. Поэтому, хотя по формуле C0,15) I2 = ЬЧ{1 + 1), из условия й-^0 еще не следует, что / = 0, так как одновременно с й->0 следует положить Z-^oo. В случае спинового момента дело обстоит иначе. Поскольку 5 принимает лишь ограниченный ряд значений, переход к класси- классической механике всегда приводит к значению спина 5 = 0. Мы видим, что в классической механике нет никакой величины, ко- которая служила бы классическим аналогом спина. Спин — чисто квантовое понятие, характеризующее специфические свойства микрочастиц. § 61. Собственные функции операторов проекций спина частицы. Матрица поворота Найдем собственные функции и собственные значения опе- /с А раторов sx, sy, s2. Уравнение для собственных функций ( I \С2 / и собственных значений sx оператора sx имеет вид Учитывая F0,16) и производя умножение, получаем ТСЛ (sxc{\ Тс* Раскрываем это равенство: Ic2 = sxcu л _ о с\ — sxc2i F1,1)
§ 61] СОБСТВЕННЫЕ ФУНКЦИИ И МАТРИЦА ПОВОРОТА 241 откуда, перемножая, находим sx: Собственные значения оператора проекции спина, как и сле- следовало ожидать, оказались равными ± -^. Определим вид соб- собственных функций, отвечающих этим собственным значениям. При sx = +y из F1,1) имеем: Учитывая условие нормировки F0,4), окончательно получаем где ai — произвольная фаза. При sx = — у соответственно с{=-с2 и спиновая волновая функция запишется в виде '*' I F1,3) Собственные значения операторов sy и sz, естественно, также равны ± —. Аналогичным образом находим и их собственные функции 'П 1 . / Г Произвольные фазовые множители щ можно положить, в частности, равными нулю. Произведем теперь некоторое вращение системы координат х, у, z-+x\ у', z'. Спиновые волновые функции при этом также изменяются (p->q/. Действительно, переход от системы коорди- координат х, у, z к системе х', у', z' означает соответствующий переход от одного представления к другому. Такой переход, как мы знаем (см. § 46), осуществляется с помощью некоторой унитар- унитарной матрицы Г, так что q/ = fcp. В данном случае унитарную матрицу Т естественно назвать матрицей поворота. Определим эту матрицу. Рассмотрим сначала вращение лишь вокруг оси z
242 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ [ГЛ. VIIT на некоторый угол х\. Согласно D6,15), операторы проекций спи- спина в новом представлении имеют вид §'x=TzSxtz\ $' — T с Т"*1 F1,6) Здесь s'x, s'y, s'z — операторы проекций спина на старые оси ко-» ординат х, у, z, взятые, однако, в новом представлении, связан- связанном с системой х\ у', z'. Поскольку мы рассматриваем вращение вокруг оси 2, оси z и z' совпадают и, следовательно, совпадают операторы проекций спина на эти оси в обоих представлениях (выражаются диагональной матрицей F0,15)). Однако условия того, что оператор проекции спина на ось z выбран в виде диа- диагональной матрицы F0,15), еще не достаточно для определения операторов проекций спина на другие направления. Оператор проекции спина на любое направление будет известен, если мы зададим в виде матриц еще операторы sx и sy в некоторой си- системе координат х, у, 2, с которой мы связываем представление. Мы можем, в частности, выбрать представление, связанное с системой л/, у', z'. В этом представлении (мы его отмечаем штрихами) операторы проекций спина s'X', s'y', sz' на оси х\ у\ z' имеют вид F0,16), F0,15). Ввиду того, что операторы sXi sy, sz отвечают проекциям спинового момента, они должны преобразовываться при враще- вращениях системы координат как проекции момента количества дви- движения, т. е. как компоненты аксиального вектора. Так как мы рассматриваем вращение на угол ц вокруг оси 2, то операторы проекций спина на штрихованные и нештрихованные оси коор- координат связаны между собой соотношениями sx = sX' cos т] — V s*n Л» sy = sx> sin т] + $y> cos т), F1,7) Равенства F1,7) имеют место в любом представлении. В част- частности, в представлении, связанном с повернутой системой коор- координат, имеем sx = s'X' cos т] — s'y' sin т] = 5* cos т] — $y sin т|, ) Sy = sxr sin т] + s'y' cos ц = sx sin r\ + sy cos rj, \ F1,8) S'z = Sz' = Sz. 1 Действительно, обе системы координат, штрихованная и не- штрихованная, совершенно равноправны. Операторы проекций спина на оси штрихованной системы координат, взятые в пред-
$ 61] СОБСТВЕННЫЕ ФУНКЦИИ И МАТРИЦА ПОВОРОТА 243 ставлении, связанном именно с этой повернутой системой коор- координат, имеют, как мы уже отмечали, обычный вид F0,15), F0,16), т. е. совпадают с операторами проекций спина на оси нештрихованной системы координат, взятыми в представлении, связанном с нештрихованной системой координат: s'X' = sx\ s'y' = sy; s'z' = s2. Рассматривая совместно равенства F1,6) и F1,8), мы и найдем матрицу f2. Прежде всего из .F1,6) и F1,8) следует, что sz = fzszf^\ т. е. матрица fz коммутирует с sz. Поскольку ма- матрица s2 диагональна, диагональна и матрица fz (см. § 47). Следовательно, матрица Т z имеет вид 0 а, Условие унитарности матрицы TZ) fjft = ftTz=\ приво- приводит к равенству Vl2 о wi о\ 0 \a2fj \0 \) или |а,|2 = 1 и |а2|2 = 1. Следовательно, матрица fz имеет вид 0 \ ) F1,9) где ai иаг — вещественны. Уравнение F1,6) перепишем в виде Sx* z == TZSX> SyTz = TzSy. Подставляя в эти выражения значения srx и s'y из F1,8) и приравнивая соответствующие матричные элементы, найдем, что равенства удовлетворяются при условии ai —0&2 = Л- Таким образом, для двух фаз ai и аг мы получили только одно условие, их связывающее. Это обстоятельство не является случайным. Дело в том, что матрица tz может содержать про- произвольный общий фазовый множитель, который не скажется ни на каких результатах, так как сами волновые функции опреде- определены с точностью до произвольного фазового множителя. В со- соответствии с этим представим матрицу tz в виде 0 \ J F1,10)
244 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ Матрицу Т2 можем также выразить через матрицу ог: [ГЛ VIII F1,11) или в несколько иной форме: Последнее выражение следует понимать как F1,12) Так как ^=1, <*1 — <*2 и т. д., ряд легко свертывается, и мы опять приходим к формуле F1,11). Если угол поворота мал„ то матрица поворота F1,12) имеет вид F1,13) где мы ввели вместо а2 матрицу Sz — 'x'Oz* Мы получили выра- выражение, которое имеет ту же структуру, что и полученный в § 30 оператор поворота, действующий на функцию, зависящую от пространственных координат. Соотношение типа F1,11) справедливо, конечно, и для по- поворота вокруг любой другой оси, поскольку все направления равноправны. Так, например, выпишем матрицу поворота fx вокруг оси х на не- некоторый угол О: *У' * '<A\-.™eJL_i_;,r sin 4"« F1,13') Произвольный поворот одной координат- координатной системы относительно другой мож- можно охарактеризовать тремя углами Эй- Эйлера О, ф, г|) (рис. 17). Угол г[> — угол между осью Ох и прямой ON пересече- Рис. 17. ния плоскостей хОу и х'О/, д — угол между осями Ог и Ог' и, наконец, ф — угол между ON и осью Ох'. Полное вращение можно разбить на три последовательных вращения: I — вокруг оси г на угол ф; II — вокруг нового положения оси х(ОЧ) на угол Ф и III — во- вокруг нового положения оси Ог на угол ф. Матрица поворота 7* будет равна произведению трех матриц Г = Тг (ф) Тх (О) Т2 ($)*
§ 6!j СОБСТВЕННЫЕ ФУНКЦИИ И МАТРИЦА ПОВОРОТА 245 Пользуясь F1,10) и F1,13х), находим, перемножая матрицы: / i i \ / -^-(Ф+Ф) ft . —г(Ф-Ф) . ft \ / е2 cos"<r te smT I f= . . . F1,14) \ -Л*2 (ф""ф)о;„ * "(ф+ф)^о ° / yte' sin^" e cos"/ Впервые эта матрица была получена Паули. Двухкомпонент- (сЛ ная волновая функция , преобразующаяся при вращении \С2/ системы координат по закону I — т\ , называется спи- «2 J \°2 нором. Введенные нами компоненты спинора обычно обозначают как_ Заметим, что для любого заданного спинора ф = [ 2 1 всегда можно найти такую матрицу f (ф, ft, г|)), что фг= 1, ф2' = 0, т. е. всегда можно определить направление, характеризуемое углами (ф, Ф, г|?), по которому ориентирован спин частицы. Матрицу Т перепишем в виде так что Ф1' = аф1 + где, как это следует из F1,14), а = 6*, P=-Y*, F1,16) аб — pv = 1. Преобразование F1,15) обычно называется бинарным пре- преобразованием. Бинарное преобразование оставляет инвариантными некото- некоторые билинейные формы. Действительно, используя F1,15), F1,16), легко получим для двух произвольных спиноров фит): + ф2*ф2 = const. ФЛ ФЛ> } F1,17)
¦246 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ [ГЛ. VIII Последнее соотношение выражает сохранение нормировки при вращении системы координат. С помощью компонент спиноров г\1, ц2 и ?!, ?2 можно по- построить величины, преобразующиеся при вращении системы ко- координат, как компоненты вектора, т. е. по закону з где <Xik — косинусы углов между старыми и новыми осями коор- координат. Непосредственной проверкой, используя F1,14), F1,15), можно убедиться, что компоненты вектора определяются соот- соотношениями F1,18) Соответственно для квадрата вектора имеем а2 = а\ + а2у + а\ = (т^2 - ту^1J. F1,19) Мы получили, как и следовало ожидать, скалярную величину. Компоненты тензора произвольного ранга Вш... можно опре- определить как произведение аф^Сь... соответствующих компонент векторов. С помощью формул F1,18) мы можем сопоставить^ компонентам Biki... произведения компонент спиноров. Определим, наконец, закон преобразования спинора при ин- инверсии системы координат, т. е. при преобразовании х->- — х% Оператор инверсии обозначим через 7, так что q/ = /cp. F1,20) Преобразование F1,20) опять можно рассматривать как пе- переход к другому представлению. Соответствующее преобразова- преобразование операторов sXi syj s2 аналогично F1,6). С другой стороны, операторы $Х9 syi sz мы можем рассматривать как компоненты аксиального вектора (как и компоненты орбитального момента). Следовательно, эти операторы не должны изменять знак при отражении. Основываясь на этом, получаем аналогично форму- формуле F1,6): sy = by?"\ F1,21)
§ 62] ПОЛНЫЙ МОМЕНТ КОЛИЧЕСТВА ДВИЖЕНИЯ 24Г При двукратном применении матрицы / мы возвращаемся к исходному состоянию и, следовательно, должны получить спи- спинор ф. Кроме того, мы можем получить спинор —ер, если будем рассматривать двукратное отражение как поворот на угол 2я> а при таком повороте, как видно из формул F1,10), F1,IS'), спинор меняет знак. Соответственно имеем: 0\ ) F1,22) Мы видим, следовательно, что матрица / должна коммути- коммутировать с матрицами sx, syj szy а квадрат ее должен давать еди- единичную матрицу, умноженную на ±1. Указанные требования будут выполнены при условии, что 1 0\ ^ /10 /=±@ {) или /-±^0 jj. F1,23) Следовательно, при отражении спинор может преобразовать- преобразоваться следующим образом: ф'=±Ф F1,24) или ф'=±/ф. F1,25) Если закон преобразования определяется верхним знаком в формулах F1,24) и F1,25), то ф иногда называют полярным спинором, если нижним, то — псевдоспинором. § 62. Полный момент количества движения Полный момент количества движения частицы складывается из орбитального и спинового моментов. По правилам сложения векторных операторов имеем для оператора полного момента f: ]=l + s. F2,1) Операторы орбитального и спинового моментов действуют на разные переменные. Первый — на пространственные перемен- переменные, второй — лишь на спиновые. Поэтому оба эти оператора коммутируют между собой. Из этого непосредственно вытекает, что проекции оператора полного момента удовлетворяют тем же правилам коммутации, что и проекции орбитального и спиново- спинового моментов. Эти перестановочные соотношения следуют и из связи оператора полного момента с оператором поворота.
248 спин и тождественность частиц [гл. vni (см. ниже): l]J? l Jxjy-jyjx^ Wz> F2,2) а также lyf-?]y = O, F2,3) M2-E = o. Из соотношений F2,2) следует (см. § 51), что собственные значения оператора /2 имеют вид /2 = Л2/(/+1). F2,4) Значение квантового числа / определяет величину полного момента количества движения. По правилам сложения момен- моментов в квантовой механике E2,1) следует, что число / при задан- заданных /и5 пробегает ряд значений / = U-5|, |/-s|+l, ..., / + s-l, l + s. Квантовое число / принимает целые значения, если спин имеет целочисленное значение, и полуцелые, если спин полу- полуцелый. Покажем, что в случае частицы, движущейся в свободном пространстве или в центрально-симметричном поле, интегралом движения является именно полный момент количества движе- движения. Для доказательства введем оператор поворота /?, учиты- учитывающий изменение как спиновых, так и пространственных коор- координат волновой функции. Рассмотрим поворот системы коорди- координат вокруг оси z на некоторый малый угол бср. Исходя из результатов, полученных в §§ 30 и 61, легко определить измене- изменение полной волновой функции при таком вращении: Аналогичное соотношение имеет место, конечно, и для пово- поворота вокруг любой другой оси. Мы видим, следовательно, что с оператором поворота связан именно оператор полного момента количества движения. Но операция поворота в силу изотропии пространства не должна изменять гамильтониана замкнутой си- системы (или системы в центрально-симметричном поле). Матема- Математически это проявляется в том, что оператор Rz, а следовательно, л оператор jz будут коммутировать с гамильтонианом частицы ЯФ
§ G2] ПОЛНЫЙ МОМЕНТ КОЛИЧЕСТВА ДВИЖЕНИЯ 249' Таким образом, закон сохранения полного момента количества движения есть следствие изотропии пространства. Для спино- спинового и орбитального моментов порознь законы сохранения имеют место лишь приближенно при пренебрежении спин-орбиталь- спин-орбитальным взаимодействием. Если мы имеем систему невзаимодействующих частиц, то пол- полный момент количества движения всей системы / складывается из моментов отдельных частиц Д по правилам сложения мо~ ментов в квантовой механике 7 = 2/*. F2,5) Можно ввести также оператор орбитального момента количества движения L: ? = 2/* F2,6) и оператор полного спина системы S: 5 = 2^. F2,7). к Так как jk = Tk + sk> то, очевидно, имеем / = ? + §. F2,8> Операторы, относящиеся к разным частицам, коммутируют между собой, так как они действуют на разные переменные. Поэтому для операторов проекций полных моментов /, L, S имеют место такие же коммутационные соотношения, как и для операторов, относящихся к отдельным частицам. Например, для операторов проекций 7Х, Jy полного момента имеем JxJy ~~ lyix = Д| tikxjiy — jiyjkx) = = 2 (jkxiky — Jkylkx) = *& 2 jkz = iuh - к к Аналогичный результат имеет место для остальных проекций оператора /, а также для операторов L и S. При заданных собственных значениях операторов, относя- относящихся к отдельным частицам, собственные значения операто- операторов, /2, L2, S2 и операторов проекций моментов определяются по правилу сложения моментов в квантовой механике. Сохра- Сохраняющейся величиной для системы частиц является полный мо- момент /.
350 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ [ГЛ. VIII § 63. Уравнение Паули. Вектор плотности потока вероятности В главе, посвященной релятивистской квантовой механике, будет установлено точное релятивистское уравнение квантовой механики и показано, что уравнение Шредингера получается из него при предельном переходе v/c-+0. При этом оказывается, что если учитывать члены различного порядка малости, то в гамильтониане будут возникать дополни- дополнительные слагаемые, описывающие ряд важных свойств кванто- квантовых систем. В частности, как самый факт существования спина, так и существования у электрона магнитного момента, вытекает из релятивистского волнового уравнения при разложении по сте- леням v/c и сохранения членов первого порядка малости. Откладывая доказательство этого утверждения до § 118, вве- введем оператор собственного магнитного момента, в соответствии <: E9,4), соотношением ? = as = ^3. F3,1) Тогда оператор Гамильтона для электрона в электромагнитном поле приобретает вид где Ж—напряженность магнитного поля. Поскольку гамильто- гамильтониан зависит от спина, волновая функция электрона также за- зависит от спиновой переменной, т. е. г|) = ^(л;, у, г, t, sz). Уравне- Уравнение для волновой функции г|)(л:, у, z, ty sz) в магнитном поле, впервые введенное Паули и носящее его имя, имеет вид ib Ж = -Ш (р - 7 ЛГ * - ^ ^ * + "¦• <63'3> 7 Найдем вектор плотности потока вероятности. Для этого вы- выпишем уравнение для функции г|)+ -'»т - - Умножим F3,3) на t|)+ слева, а F3,30 на 'Ф справа и вычтем одно из другого. Учитывая, что рА — Ар = — ЧА, после простых преобразова- преобразований получаем -^ V (Л^+ф) + -^ [ф+ (fa) ф - ((SH) i|>)+ Щ. F3,4)
§ 63) УРАВНЕНИЕ ПАУЛИ 251' Из правил действия с матрицами D5,20) следует, что (ШЪ)+ = Ъ+6+Ю F3,5). и, кроме того, s+ = s в силу эрмитовости оператора спина. Таким образом, слагаемое в квадратных скобках обращается в нуль и мы получаем выражение для вектора плотности по- потока вероятности. (Следует иметь в виду, что в него входят двухкомпонентные волновые функции.) Умножая его на заряде,, получаем вектор плотности электрического тока < (V*+) * *+V^ -Ш А^- F3'6) Выражение F3,4) определяет вектор плотности потока вероят- вероятности / с точностью до rot В, где В — произвольный вектор. Можно показать, что В = —i|)+si|), так что полное выражение для плотности электрического тока будет иметь вид 1) ^ - - -? ^ ^ - (v*+) ¦) ~ -ш А ^+^ + inrot (*+**) • F3>7> Рассмотрим случай, когда частица движется в постоянном магнитном поле %, а электрическое поле отсутствует. Вектор- Векторный потенциал А при этом можно выбрать в виде А = ±№Хг). F3,8) Преобразуем уравнение Паули F3,3), учитывая, что для век- вектора-потенциала F3,8) справедливо соотношение рА = Ар. Кроме того, предполагаем, что магнитное поле % достаточно- слабо и в соответствии с этим опускаем в уравнении Паули, члены, квадратичные по %. Тогда имеем: Так как (зехг)р где I — орбитальный момент количества движения, то 1) См. Л. Д. Ландау и Е. М. Л и ф ш и ц, Квантовая механика, Физ- матгиз, 1963, стр. 506.
252 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ [ГЛ Оператор ^ естественно назвать оператором орбитального магнитного мо- момента (в отличие от \is — оператора спинового магнитного мо- момента). Мы видим, что отношение орбитального магнитного мо- момента щ к механическому моменту I, как и в классической фи- е п зике, равняется -^—. Для спиновых моментов это отношение вдвое больше. Уравнения F3,3) и F3,9) естественным образом обобщаются на случай системы частиц. Так, для системы частиц (с заря- зарядом е, массой т), помещенных в слабое магнитное поле %, уравнение Паули F3,9) имеет вид где L= 2 ?*— оператор полного орбитального, a S = 2 ^ - k k полного спинового моментов системы (суммирование ведется по всем частицам системы), UB3 — потенциальная энергия взаимо- взаимодействия частиц между собой. Не представляет труда учесть и член квадратичный по маг- магнитному полю. Уравнение Паули в этом случае имеет вид W- F3,11) Мы увидим, что в некоторых случаях (см. § 75) квадратич- квадратичный член играет существенную роль. Если магнитное поле отсутствует и потенциальная энергия взаимодействия UB3 не зависит от спинов частиц, например при кулоновском взаимодействии заряженных частиц, то гамильто- гамильтониан системы не содержит спиновых переменных. В этом случае волновая функция может быть представлена в виде произведе- произведения соответственно координатной и спиновой волновых функ- функций. Частицы могут находиться в произвольном спиновом со- состоянии, координатная же функция удовлетворяет обычному уравнению Шредингера.
§ 64] ПРИНЦИП ТОЖДЕСТВЕННОСТИ ЧАСТИЦ 253 § 64. Тождественность частиц. Принцип тождественности частиц. Симметричные и антисимметричные состояния Мы перейдем теперь к построению волновой функции системы частиц одного рода, например системы электронов, протонов, фотонов и т. п. В таких системах проявляются новые важные особенности, не имеющие аналога в классической механике системы частиц. Эти особенности станут ясны из сравнения процесса соударения двух частиц — макроскопических и микроскопических. В классической механике свойства каждой частицы харак- характеризуются одной величиной — ее массой. Если массы обеих ча- частиц равны, то частицы можно считать совершенно одинако- одинаковыми. Состояние каждой из частиц в момент 7 = 0 задается на- начальными условиями. Двигаясь по определенным траекториям, частицы упруго сталкиваются в некоторой точке пространства и расходятся по соответствующим траекториям. Если заданы начальные условия, то траектории каждой ча- частицы полностью определены и за движением каждой частицы можно проследить. Поэтому в классической механике частицы, хотя бы и одинаковые, сохраняют свою индивидуальность. Все- Всегда можно определить, какая именно из сталкивающихся частиц попала в данную точку пространства. Совершенно иначе тот же процесс столкновения происходит с двумя микрочастицами. Пусть в момент соударения обе ча- частицы находились в определенных точках пространства. При этом, согласно соотношению неопределенности, их импульсы не имели определенного значения. После соударения мы можем за- зафиксировать «траектории» частиц, например два следа в ка- камере Вильсона. Ясно, однако, что если обе сталкивающиеся ча- частицы были одной природы, — например сталкивались два элек- электрона или два протона, — то какая именно из этих частиц связана с данным следом, установить принципиально невоз- невозможно. В качестве второго примера рассмотрим систему, состоящую из двух атомов водорода. Если атомы находятся на достаточно больших расстояниях друг от друга, так, что электронные облака не перекрываются, то каждый электрон практически локализован у своего ядра. По мере сближения атомов возникает перекрытие электронных облаков. Это означает, что в области перекрытия имеется неко- некоторая вероятность нахождения обоих электронов. Пусть в результате измерения в этой области обнаружен электрон. Ясно, что не существует никаких способов, которые
254 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ [ГЛ VIIF позволили бы установить, какой это электрон, принадлежащий ранее ядру № 1 или № 2. Приведенные примеры показывают, что одинаковость кван- квантовых частиц имеет гораздо более глубокую природу, чем «оди- «одинаковость» классических частиц. Квантовые частицы не проста одинаковы, но совершенно тождественны. Если мы захотели бы изменить начальное состояние системы, заменив один электрон на другой, в системе не произошло бы никаких физических изменений, никаким физическим опытом не- невозможно обнаружить эту замену. Необходимо подчеркнуть также, что в приведенных приме- примерах мы несколько схематизировали ситуацию. Если, например, обе сталкивающиеся частицы имеют определенные значения им- импульсов, они не имеют никаких определенных значений коор- координаты. Поэтому нельзя даже указать область столкновения. Таким образом, мы приходим к принципу тождественности частиц, который можло сформулировать следующим образом: в системе тождественных частиц осуществляются лишь такие состояния, которые не меняются при перестановке местами лю- любых двух тождественных частиц. Тождественность микрочастиц приводит к весьма важным и глубоким следствиям. Напомним, что мы столкнулись уже с этим свойством микрочастиц в статистической физике. Сейчас мы более последовательно разберем, как тождественность ча- частиц влияет на свойства их коллектива. Рассмотрим систему, состоящую из N тождественных частиц. Волновая функция такой системы г|) будет иметь вид ty&u h> •••> lit •••> Iky •••> In* 0- Здесь под li понимается вся совокупность координат и спино- спиновых переменных, характеризующих /-ю частицу. Если переставить между собой две частицы, т. е. заменить координаты и спин /-й частицы соответствующими величинами для k-й частицы и наоборот, то в силу принципа тождествен- тождественности состояние системы не может измениться. Следовательно* волновая функция системы может измениться лишь на несу- несущественный фазовый множитель. После перестановки двух частиц волновую функцию можно выразить через исходную соотношением = е|аФ(Еь Ег. ...> Ei, ..-> Е*. •••> Еаг, 0, F4,1) где а — некоторая вещественная величина. Если еще раз произ-
§ 64] ПРИНЦИП ТОЖДЕСТВЕННОСТИ ЧАСТИЦ 255 вести операцию перестановки /-й и k-и частиц, то система вер- вернется в исходное состояние. С другой стороны, производя повторно операцию F4,1), мы можем записать: 1\> Ы •••> 6ft > •••> h> ---» %n> 0е 6ft, ..., 6*. 0 = . ..., 6*. .... 6i. .... блг. 0. Отсюда следует, что е2/а = 1 и eia= ±1. Таким образом, при перестановке двух тождественных частиц волновая функция системы может или не измениться совсем, или изменить знак на обратный. Волновые функции первого типа называются симметричными, волновые функции второго типа — антисимметричными. Введем важный для дальнейшего опера- оператор перестановок или обменный оператор Рг&. По определению при воздействии оператора Pik на волновую функцию системы частиц фFь 62, .... 6ь .... 6л. •••» блг. 0 он переводит ее в но- новую функцию Рц$Aи .... 6*. ---. 6ft. .... 6*. 'Н = 4>Fi. ..., Ък9 ..., ?„ ..., ?„, 0. F4,2) Этой замене соответствует переход /-й частицы в состояние, ра- ранее занятое k-й частицей, а k-й частицы — в состояние i-й ча- частицы. Сравнивая F4,2) с F4,1), мы видим, что собственные значе- значения оператора Pik равны eia = ±1. При этом симметричные и антисимметричные функции являются собственными функциями оператора Р^, отвечающими собственным значениям соответ- соответственно + 1 и —1. С помощью оператора перестановки покажем, что свойства симметрии сохраняются во времени. Это означает, что если си- система в первоначальный момент времени находилась в симмет- симметричном или антисимметричном состоянии, то никакое последую- последующее воздействие не изменяет характера ее симметрии. Иными словами, система все время будет оставаться либо в симметрич- симметричном, либо в антисимметричном состоянии. Для доказательства этого утверждения необходимо показать, что оператор Pik ком- коммутирует с оператором Гамильтона. Перестановка местами двух тождественных частиц отвечает лишь перестановке членов в сум- сумме, образующей гамильтониан систеАмы. Это легко видеть на примере системы, состоящей из двух тождественных частиц.
256 спин и тождественность частиц [гл. viii В этом случае гамильтониан может быть записан в форме й — ^Ьх—шЬ + иНиЪ + и(Ь, t) + Ul2(glf &, t). F4,3) Здесь f/i2(Ei, ?2, 0 —энергия взаимодействия частиц, а ?/ от- отвечает взаимодействию с внешним полем и имеет, очевидно, для двух тождественных частиц одинаковый вид. При пере- перестановке частиц для нового гамильтониана имеем: Я = —tt**-?[bi + U(h, *) + и&> ') + ^12(Ь. Ei. 0.F4,4) Совершенно ясно, что это тот же гамильтониан, что и до перестановки. Полученный результат без труда переносится на случай системы из N частиц. Мы видим, что перестановка ча- частиц не изменяет гамильтониан. Поэтому получаем HPik-PikH = 0. F4,5) Следовательно, свойства симметрии системы являются инте- интегралом движения и сохраняются во времени. Таким образом, естественно думать, что симметрия опреде- определяется свойствами самих элементарных частиц, которые соста- составляют систему. Удалось показать, что частицы, обладающие целым спином, описываются симметричными функциями, а ча- частицы с полуцелым спином — антисимметричными функциями. Первые частицы называют частицами Бозе — Эйнштейна или бозонами, вторые — частицами Ферми — Дирака (или фер- мионами). К первой группе частиц относятся: кванты света (см. гл. XII), я-мезоны и др. Ко второй: нейтроны, протоны, позитроны, электроны, нейтрино, jLi-мезоны (у всех спин 1/2) и др. Для выяснения вопроса о свойствах симметрии системы, со- состоящей из тождественных сложных частиц, следует опреде- определить полный спин сложной частицы. Так же как и в случае элементарных частиц, волновая функция при целом спине слож- сложной частицы симметрична при перестановке местами сложных частиц и антисимметрична при полуцелом спине сложной ча- частицы. В виде примера рассмотрим систему, состоящую из сс-частиц. Для определения свойств симметрии волновой функции системы необходимо подсчитать полный спин ос-частицы, а-частица со- состоит из двух нейтронов и двух протонов. Так как спины входя- входящих в нее частиц равны й/2, а число частиц четно, то полный спин а-частицы равен лишь целому кратному Ь. Таким образом, волновая функция системы а-частиц является симметричной вол- волновой функцией.
§ 65] ПРИНЦИП ПАУЛИ 257 § 65. Волновые функции для системы фермионов и бозонов. Принцип Паули Рассмотрим систему, состоящую из N невзаимодействующих между собой тождественных частиц. Уравнение Шредингера для стационарных состояний такой системы имеет вид N [ii M ь и ы. F5,1) В § 14 было показано, что решением этого уравнения служит функция ¦ = ¦*, (БО Ф*. (Ь) — -Фллг (Ы- F5,2) Здесь k\, k2, ... — квантовые числа состояний, в которых мо- могут находиться частицы. Каждое k{ представляет собой полный набор квантовых чисел, характеризующих состояние отдельной частицы. Функции ф^ являются решением уравнения Шредин- Шредингера для одной частицы - -? Д,Ф*, (У + U (У % (Ь) = Еф. (У. Однако функция F5,2) не удовлетворяет требованиям сим- симметрии. В общем случае она не принадлежит ни к симметрич- симметричным, ни к антисимметричным функциям. Так как уравнение F5,1) линейно, то суперпозиция решений типа F5,2) будет так- также его решением. Для получения волновой функции, обладаю- обладающей требуемой симметрией, следует взять соответствующую су- суперпозицию волновых функций. Для простоты рассмотрим систему, состоящую всего из двух невзаимодействующих частиц. Несимметризованными волновы- волновыми функциями служат, очевидно, *i (Ei, У = *i (Ei) ф2 (У; ^2 (Ei, У = ^ (Ei) *i (У, где индексы 1 и 2 при волновых функциях tyi(?i), $ЛЪ) и яЫЫ, *ЫЫ обозначают два разных состояния частицы. Волновые функции ^i(Ei, У'» Фг(Еь h) отвечают одной и той же энергии системы. Из этих функций можно составить две симметризован- ные комбинации, соответствующие той же энергии: Ф, = Ci I*i (Ei) ^2 (Е2) + Ф2 (Ei) Ф1 (У1, ) - Ь (Ei) Ф1 (У]. Первая волновая функция является симметричной относи- относительно перестановки частиц, а вторая — антисимметричной. По- Постоянные С\ и Сг могут быть определены из условия норми- нормировки. Если функции if>i(?i) и \|J(Ы нормировать на единицу, 9 В. Г. Левич и др., том II
258 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ [ГЛ. VIII а фз (и фа) нормировать условием J | ф5 fdV{ dV2 = 1, то про- простое вычисление дает в обоих случаях г -г - * v> 1 — v>o — —г • Поэтому нормированные и симметризованные функции можно написать в виде ф, = ^L [ф, (?,) ф2 (У + ф2 F0 ф! (&)], F5,3) Ф1 Fi) ^2 (Ы - ф2 (li) *i (Ш F5,4) Не представляет теперь труда обобщить формулы F5,3) и F5,4) на случай произвольного числа невзаимодействующих частиц. Именно, для системы бозонов, описываемой симметрич- симметричными функциями, имеем '/2S Ф*. A0Ф*г(Ы • • • Ф*дг(Ы, F5,5) где суммирование ведется по всем возможным перестановкам раз- разных индексов ki .. .kN. Через я* обозначено число индексов, при- принимающих одно и то же i-e значение. Таким образом, числа п\ показывают, сколько частиц находится в данном фг-состоянии, причем 2 fti = N. Волновая функция F5,5) нормирована на еди- единицу. Действительно, из-за ортогональности функции ф*F) вклад в нормировочный интеграл дают лишь квадраты модуля каждо- каждого члена суммы. Число членов суммы равно ы ? . Анало- Аналогично, для системы фермионов получаем 1 *, (Б0 ...**, (In) ^2 (gi) ... Ъъ (In) F5,6) Симметризованные нормированные волновые функции ips и фа описывают состояние системы N невзаимодействующих бозо- бозонов и фермионов соответственно. Рассмотрим теперь, как изменится волновая функция си- системы, если между тождественными частицами существует взаимодействие. Предположим, что оно является зависящим от времени. Точная волновая функция может быть написана в виде
§ 05] ПРИНЦИП ПАУЛИ 259 одной из суперпозиций ¦ -2 МО (¦.),, ¦ = 2 МО (¦«)*. Коэффициенты Сг и Cfe представляют зависящие от времени амплитуды вероятности соответствующих i-x и k-x симметрич- симметричных и антисимметричных состояний. Взаимодействие вызывает переходы в системе. ?\ак это не- непосредственно следует из закона сохранения симметрии, изло- изложенного в предыдущем параграфе, при любых внешних воздей- воздействиях система будет переходить в состояния с той же сим- симметрией. Таким образом, зо'лновая функция, описывающая систему взаимодействующих частиц, выражается через волновые функ- функции системы невзаимодействующих частиц с определенной сим- симметрией. Найденные волновые функции F5,5) и F5,6) позволяют по- получить ряд важнейших результатов. Рассмотрим прежде всего систему ферми-частиц. Предполо- Предположим, что две частицы в системе находятся в одном и том же квантовом состоянии, т. е. k{ = k2. Это означает, что две частицы имеют одинаковый полный набор квантовых чисел, например одно и то же значение квантовых чисел /г, /, m, sz при движении в поле с центральной симметрией или рх, ру, pZi sz при свобод- свободном движении с определенным импульсом. Тогда в определителе F5,6) две строки оказываются одина- одинаковыми, и волновая функция обратится в нуль тождественно. Тем самым доказано следующее утверждение: при измерении в системе тождественных частиц Ферми не может быть одно- одновременно обнаружено две или более частиц в одном и том же квантовом состоянии. Это известный принцип Паули, устано- установленный им на основании анализа опытных данных еще д© по- появления квантовой механики. Часто принцип Паули удобно формулировать в терминах квазиклассического приближения: «в каждой ячейке фазового пространства объемом BnhK не может находиться более одной частицы с данной ориентацией спина». Принцип Паули, как мы видели в статистической физике, определяет статистическое поведение систем, построенных из тождественных частиц с полуцелым спином. Не меньшее значе- значение имеет принцип Паули для понимания закономерностей по- построения многоэлектронных атохмов и сложных ядер, разбору которых будет посвящена следующая глава. Для дальнейшего рассмотрим следующую задачу. Пусть си- система состоит из N тождественных частиц (бозонов). Каждый из бозонов находится в данный момент времени в одном и тога 9*
260 спин и тождественность частиц [гл. viii же состоянии с волновой функцией г|э(?), которая нормирована следующим образом: Определим среднюю энергию системы в этом состоянии. Гамиль- Гамильтониан такой системы частиц запишем в виде Н = 2 Ht (h) + {22 Wu (lif t}), F5,7) где Н{ — оператор энергии /-го бозона и W{j — оператор энер- энергии взаимодействия /-го и /-го бозонов. Волновая функция си- системы бозонов, нормированная на единицу, имеет в этот момент времени вид ¦ (& Ь Ы ^( Средняя энергия системы в этом состоянии равна Н = | г|>* (lu h, • • •, In) Я* Fi, Ь, ..., Ы dVxdV2 ... dVN. Учитывая тождественность бозонов и считая N ^> 1У получаем liMh)i + 4 J ¦• (It) V (Б/) ^i/ (Ь. Б/) ¦ (If) ¦ (If) dVt dVh F5,8) Если частицы не взаимодействуют, то W = 0, и среднее зна- значение энергии имеет вид H=jV(h)fiMlt)dVt. F5,9) Выражения F5,8) и F5,9) потребуются нам для дальней- дальнейшего. § 66. Волновая функция системы из двух тождественных частиц со спином 1/2 Имея в виду дальнейшие приложения, рассмотрим более под- подробно волновую функцию системы, состоящей из двух частиц со спином 7г, например двух электронов или протонов. Полная волновая функция \|)n(ri, s\z, r2, S2Z) зависит от про- пространственных и спиновых координат обеих частиц и антисим- антисимметрична в этих переменных. Предполагая, что внешнее магнит- магнитное поле отсутствует, а взаимодействие между частицами не за- зависит от их спинов, представим полную волновую j функцию в виде произведения волновых функций, зависящих только от пространственных и от спиновых переменных. Ъп(Ги Slz, Г2, S2z) = O(rif Г2)фE12, S22). F6,1)
§ 66] ВОЛНОВАЯ ФУНКЦИЯ 261 Полную спиновую функцию системы ф представим в виде произ- произведения собственных функций оператора квадрата спина и его проекции на ось z каждой из частиц, т.е. функций ср1/2A), <P_i/2(l)> Фу2B), Ф_1/2B), где индекс означает проекцию спина на ось z, а число в скобках — номер частицы. В самом общем виде функцию ф можно записать так: <р A, 2) - <yp1/f A) <pI/f B) + с2ф_1/2 A) Ф_1/2 B) + Р,/2 A) Фту2 B) + ?4Ф_1/2 A) ф1/я B), F6,2) где Си ^2, с3ис4 — произвольные амплитуды. Определим спиновые волновые функции, описывающие со- состояния с заданным полным спином системы и его проекцией на ось г. Так как спины складываются по общим правилам сложе- сложения моментов (см. § 52), то полный спин системы из двух ча- частиц принимает два значения 5=1 и 5 = 0. Его проекция на ось z соответственно имеет значения 1, 0 и —1 при 5 = 1 и Sz = 0 при S = 0 (в единицах Ь). Функции ф, описывающие состояние с заданными 5 и SZy удовлетворяют уравнениям *,-«(*+!)*} (ад 52ф = hS/p, J где S =Si + s2— оператор полного спина системы. Коэффициен- Коэффициенты си с2, Сг и Са в спиновой функции системы F6,2) должны быть подобраны так, чтобы оба уравнения F6,3) для ф были автоматически удовлетворены. Непосредственной проверкой нетрудно убедиться, что спино- спиновая функция системы, отвечающая всем указанным условиям, может быть написана в виде 1) , S-l, 5 =0, z F6,4) (C%\ С _ 1 Q 1 , \4), О = 1 , O2 = — 1 , Ф8=-^=-[Ф%A)Ф_1АB)-фв1АA)Ф%B)]| 5 = 0, 5,-0,F6,5) где верхний индекс указывает полный спин двух частиц, а ниж- нижний — его проекцию на ось z. 1) Выражения F6,4), F6,5) следуют из формулы E2,3) и таблицы коэф- коэффициентов С (стр. 209) при /i = 1/2.
262 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ [ГЛ. VHF Этот результат можно получить также, основываясь на со- соотношениях F1,18). Заметим, что спиновые функции F6,4) не- неизменяются при перестановке местами первой и второй частиц,, т.е. при замене 1 —>2, 2-*1. Следовательно, эти функции сим- симметричны в спинах частиц. Спиновая функция F6,5) изменяет знак при такой перестановке и является антисимметричной в спинах. Спиновые функции F6,4) образуют спиновый триплет. Со- Совокупность трех компонент триплета эквивалентна трехкомпо- нентной спиновой функции частицы со спином единица. Спино- Спиновая функция F6,5), описывающая состояние со спином, рав- равным нулю, образует спиновый синглет. Определим собственные значения скалярного произведения (s\ s2) в синглетном и триплетном состояниях. С этим произве- произведением нам придется иметь дело в дальнейшем. Поскольку ТО C132) = y(s2-^-5i). F6,6> Подставляя в правую часть собственные значения операторов. S2, s2{ и s\9 имеем: 6л) ф* = -- (s (s +1) - 4) q/. (бел Для триплетного состояния 5 = 1 и ^^i-tfy. F6,8) Соответственно для синглетного состояния S = О т F6,9) Рассмотрим теперь функцию от пространственных перемен- переменных Ф(гь г2). Так как полная волновая функция F6,1) анти- антисимметрична, то координатная волновая функция будет анти- антисимметричной в состоянии S = 1 и симметричной в состоянии 5=0. Если частицы не взаимодействуют и находятся в неко- некоторых состояниях i|)n и ij)m, то координатная функция имеет вид Фа (г„ г2) = ^L [% (г,) г|>т (г2) - г|)т (гг) г|)„ (г2)], 5 = 1, F6,10) Ф* (ги r2) = ^L- №я (Гх) ут (г2) + г|)т (гх) % (г2I 5 = 0. F6,11>
$ 67] ОБМЕННОЕ ВЗАИМОДЕЙСТВИЕ 263 В общем случае удобно перейти, как это показано в § 14, к координатам R = -^ (г{ + г2) и г = г{ — г2, описывающим со- ответственно движение центра тяжести системы и относитель- относительное движение частиц, . F6,12) Выясним, к каким следствиям приводит требование симметрии или антисимметрии волновой функции F6,12). Заметим пре- прежде всего, что если потенциал взаимодействия частиц зависит только от расстояния между ними, U(\rx — r2|), то в такой си- системе сохраняется орбитальный момент количества движения, связанный с относительным движением частиц (см. § 35). Про- Произведем теперь перестановку координат частиц ri-*r2, г2-*Г\. При такой перестановке радиус-вектор центра тяжести R не изменяется. Следовательно, не изменяется и волновая функция л|)о(#). Радиус-вектор относительного движения г меняет знак г->—г. Если орбитальный момент, связанный с относительным движением частиц, задан и определяется квантовым числом /, то закон преобразования функции ф(г) при замене г на —г, как мы выяснили в § 33, будет: Мы видим, что в этом случае координатная волновая функция F6,12) при перестановке частиц r{-+r2i г2-+гг преобразуется по закону Ф(ь г2)->{-\IФ{гь г2). F6,14) Из F6,14) сразу следует, что если частицы находятся в три- плетном состоянии 5=1, то квантовое число / может прини- принимать лишь нечетные значения. Наоборот, число / может прини- принимать лишь четные значения, если частицы находятся в синглет- ном состоянии 5 = 0. § 67. Обменное взаимодействие и понятие о химическом и сильном ядерном взаимодействиях Тождественность квантовых частиц приводит к фундамен- фундаментальному изменению представления о взаимодействии между частицами. Остановимся прежде всего на одном простом примере, по- позволяющем понять сущность этих изменений. Предположим, что две тождественные частицы с полуцелым спином не взаимодей- взаимодействуют друг с другом в классическом понимании этого слова. Это означает, что в гамильтониане системы нет членов, описы- описывающих взаимодействие между частицами.
264 спин и тождественность частиц [гл. viii Пусть одна из частиц находится в некоторой ячейке фазо- фазового пространства с линейным размером ячейки ~d. Имеет ме- место очевидное соотношение где Д#1 ~ d — неопределенность координаты частицы и h Ар{ ~ -J — неопределенность ее импульса. Согласно принципу Паули вторая частица не может попасть в ту же ячейку фазового пространства. Поэтому она должна либо находиться на расстоянии, большем d, от первой частицы, либо иметь импульс /?2> превышающий Ар\, т.е. импульс -7. Только при этом условии она может подойти к первой частице на расстояние, меньшее чем d, и попасть при этом в другую клетку фазового пространства. Мы видим, что частицы с параллельными спинами не могут подойти друг к другу, если только они не обладают достаточно большим импульсом относительного движения. Такое поведение частиц" эквивалентно появлению некоторых сил отталкивания между ними. Если спины частиц антипараллельны, предыдущее рассуждение теряет силу, поскольку принцип Паули не запре- запрещает таким частицам находиться в одной ячейке фазового про- пространства. Таким образом, из принципа Паули, налагающего ограниче- ограничения на состояния частиц, вытекает факт существования взаимо- взаимодействия между частицами, зависящего от ориентации их спинов. Взаимодействие между бозонами не может быть проиллю- проиллюстрировано на столь же наглядном примере. Тем не менее ясно, что требование симметризации волновой функции соответствует определенной зависимости энергии системы частиц от ее полного спина, т. е. приводит ко взаимодействию между частицами. Предположим теперь, что между двумя частицами со спином У2 имеется некоторое слабое взаимодействие, описываемое опе- оператором H'(ri2)y где г 12 — расстояние между частицами. Для наглядности, а также имея в виду дальнейшие приложения, до- допустим, что Н' представляет кулоновское отталкивание двух за- рядов #' (г12) = —. Тогда средняя энергия взаимодействия в первом приближении равна ^H'%dVxdV2. F7,1) Здесь гро — нормированная функция невозмущенного состояния,
<§ 67] ОБМЕННОЕ ВЗАИМОДЕЙСТВИЕ 265 а суммирование ведется по всем значениям спиновых пере- переменных. Так как, по предположению, в нулевом приближении частицы считаются невзаимодействующими, то спиновые и координатные волновые функции разделяются, причем последние записывают- записываются симметризованными или антисимметризованными произведе- произведениями F6,10) и F6,11). Подставляя значение оператора Hf и волновые функции в F7,1), имеем ?(° = у J ?l ¦«i(lL>-B) ± %Л2)%Л1) I2 dVx dV2 - ^ Г iwop^cop dV{dV2±e2f <oXe)W^-o) dVidV29 где цифры 1 и 2 обозначают координаты соответственно первого и второго электронов, а Г\2 — расстояние между ними. Знаки + и — относятся к состоянию частиц, соответственно симметрич- симметричному и антисимметричному относительно перестановки частиц. В этой формуле проведено суммирование по спиновым перемен- переменным, которое дало единицу. Мы воспользовались, кроме того, очевидным равенством В последнем равенстве один интеграл переходит в другой при замене индексов интегрирования 1 на 2. Вводя обозначения С - J I*., A) Р-? ИЬ, B) Р dVx dV2 = = J| г|>„,A) ?В' Ы \%2 B) р dVx dV2, F7,2) = J напишем энергию взаимодействия F7,1) в виде 4!| = С + Л, F7,4) Й С-Л. F7,5) Значок f| означает антипараллельные спины (спиновый син- глет), ft — параллельные спины (спиновый триплет).
266 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ [ГЛ. VIIF Из вывода ясно, что общий вид полученных формул F7,4) — F7,5) не является специфическим, относящимся только к слу- случаю кулоновского взаимодействия, а мог бы быть получен для любой энергии взаимодействия, зависящей от координат частиц. Интересно сравнить этот результат с аналогичным вычисле- вычислением для двух частиц различной природы. Тогда мы написали бы для несимметризованной волновой функции ЧГ = 1ф()B) и соответственно получили бы: J 121 %2 \2-^dVldV2. F7,6> Формула F7,6) имеет простой смысл — она представляет среднее значение энергии кулоновского отталкивания двух ча* стиц. Положение одной из частиц, находящейся в состоянии п\г характеризуется плотностью вероятности | %х A) |2, второй — \Л2)\2 В формулах F7,4) и F7,5) интеграл С имеет структуру, ана- аналогичную F7,6) и часто именуется кулоновским интегралом. Однако, строго говоря, он не допускает подобной интерпрета- интерпретации, так как нельзя указать, какая из тождественных частиц, находится в состоянии пи а какая — в состоянии п2. Интеграл Л, именуемый обычно обменным (нем. Austausch — обмен), не имеет каких-либо классических аналогов. Расчеты, проведенные для конкретных систем, показывают, что интегралы С и А всегда положительны. Из формул F7,4) и F7,5) непо- непосредственно следует, что поправка к средней энергии, обусло- обусловленная взаимодействием частиц, зависит от ориентации их спинов. Подчеркнем прежде всего, что было бы неправильным счи- считать взаимодействие складывающимся из двух частей — клас- классической и обменной, как это часто делают для наглядности. При этом классической частью взаимодействия называют вклад, в энергию, определяемый кулоновским интегралом С, а обмен- обменной — соответствующий вклад от обменного интеграла А. В дей- действительности разделить взаимодействие на две части невоз- невозможно, поскольку сама величина А не допускает классической интерпретации. Наиболее характерная часть обменного взаимодействия вы- выражается интегралом А F7,3). Этот интеграл можно тракто- трактовать как матричный элемент, соответствующий переходу пер- первой частицы из состояния П2 в состояние п\, а второй частицы из состояния п\ в состояние щ. Действительно, введем оператор Р\2, определенный формулой F4,2), переставляющий частицы местами, так что «2 B) = Ч>Я1 B) Ъ» A), Р12%2 A) фЯ1 B) = фЯ1 A) г|)„2 B).
<§ 67] ОБМЕННОЕ ВЗАИМОДЕЙСТВИЕ 267 Оператор Р\2 является, таким образом, обменным оператором лервой и второй частицы. С помощью этого оператора интеграл А можно представить как B)dVldV2. F7,7) Таким образом, обменное взаимодействие отвечает замене опе- оператора #12 на оператор #12^12. Полная энергия взаимодействия с помощью обменного оператора может быть записана в виде Е> = С ± А = J ¦; A) *; B) (Я12 ± Я12Р12) ^ A) %2 B) dVx dV2. F7,70 Мы видим, что тождественность квантовомеханических ча- частиц существенно изменяет их взаимодействие. Если различные по своей природе частицы обладают произвольным взаимодей- взаимодействием, характеризующимся оператором #12, то в случае тожде- тождественных частиц оператор этого взаимодействия должен быть заменен на #12 ± Н\2Р\2- Этот вывод не зависит от природы взаимодействия, т. е. от характера оператора Hi2. Так электри- электрическое взаимодействие двух тождественных частиц (например, двух позитронов) происходит иначе, чем такое же электрическое взаимодействие различных частиц (например, позитрона и про- протона). Таким образом, специфика тождественных частиц, состояние которых характеризуется симметризованными волновыми функ- функциями, приводит к важнейшему общему следствию: состояние системы оказывается зависящим от суммарного спина системы. Это обстоятельство является количественным выражением тех качественных соображений, которые были приведены в на- начале параграфа. Зависимость энергии системы частиц от полного спина экви- эквивалентна утверждению о существовании взаимодействия между частицами. Это взаимодействие получило название обменного. Обменное взаимодействие имеет специфически квантовый ха- характер. Формально это следует из того факта, что в классиче- классическом пределе спин системы обращается в нуль (ср. § 60). По- Поэтому при переходе к классическому пределу исчезает всякое различие между состояниями с разным спином и, в частности, различие в их энергиях. Следует подчеркнуть, что хотя до сих пор речь шла о части- частицах с полуцелым спином, качественный вывод в равной мере лрименим к частицам с целым спином — бозонам. В системе из
268 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ [ГЛ. VIII двух бозонов, имеющих спин нуль, реализуются не все состоя- ния, которые получаются в результате формального решения соответствующего уравнения Шредингера. Физическим состояниям системы и определенным значениям ее энергии отвечают только те из них, которым отвечает сим- симметричная в частицах волновая функция. В случае двух бозо- бозонов со спином 1 энергия системы также оказывается зависящей от полного спина. Результаты, полученные для системы, состоящей из двух ча- частиц — фермионов или бозонов, — непосредственно переносятся на общий случай систем с произвольным числом тождественных частиц. Возвращаясь к примеру с взаимодействием двух электронов, покажем, что обменные силы допускают следующую наглядную, хотя и не строгую интерпретацию: предположим, что в момент времени t = 0 первый электрон находился в состоянии п\, а вто- второй — в состоянии П2. Необходимо еще раз подчеркнуть, что в действительности такая формулировка относится к моменту ( = 0 и дальнейшие рассуждения служат лишь для придания наглядности эффекту обменного взаимодействия. Тогда началь- начальная волновая функция имеет вид Ф @). yL [i|>e (t = 0) + Ь (t = 0)] = ЧЧ A) *Я1 B). Состояния, описываемые симметричной г|>8 и антисимметричной г|)а волновой функцией, являются стационарными состояниями с энергиями соответственно Es = Е + С + Л, Еа = Е + С - Л. Поэтому зависимость волновых функций i|?s и г|)а от времени дается формулами Полная волновая функция Ф(^) при t> 0 является их суперпо- суперпозицией и, следовательно, не описывает стационарного состояния ( + [¦«. (О ** B) - Ф„, A) ф„, B)] e~* iE+C~A) * = { *,, (!)¦«. B) cos^- At - i%t A) %, B) sin 4 At )e~^iE+C)'. F7,8)
§ 67] ОБМЕННОЕ ВЗАИМОДЕЙСТВИЕ 269 Формула F7,8) показывает, что если в момент времени t = О электрон 1 находился в состоянии п\, а электрон 2 — в состоя- состоянии ti2, то по прошествии промежутка времени электроны обмениваются состояниями. Волновая функция отвечает нахождению первого электрона в состоянии п2у а вто- второго — в состоянии п\. По прошествии промежутка времени 2т они возвращаются в начальные состояния и т. д. Таким обра- образом, электроны обмениваются состояниями с периодом т. Часто такой обмен состояниями наглядно представляют сле- следующим образом: один из электронов системы вылетает, напри- например, из атома и поглощается другим атомом. Из последнего в свою очередь вылетает электрон, переходящий в первый атом. В процессе «вылета» и «захвата» электронов происходит изме- изменение импульса соответствующих атомов. Изменение импульса атомов означает, что между ними имеется некоторое взаимодей- взаимодействие. Это схематическое и наглядное рассмотрение обменного взаимодействия оправдывает термин «обмен». Однако его не следует понимать буквально. Это особенно ясно видно из следующего рассуждения: пусть состояния П\ и П2 отвечают связанным состояниям электронов в двух атомах. Если бы мы попытались понимать описанный выше процесс обмена буквально, в классическом смысле, то возникло бы противоречие. Действительно, электроны не смогли бы обмениваться состояниями или «вылетать» и «захватываться» атомами, так как для этого они должны были бы получать из- извне некоторую энергию, превышающую энергию их связи в ато- атомах. В действительности каждый из двух атомов, между кото- которыми имеет место обменное взаимодействие, не находится в со- состоянии с определенной энергией. Неопределенность энергии системы АЕ имеет порядок АЕ ~ А. Не имеет смысла говорить о постоянстве энергии в течение промежутка времени т — вре- времени обмена, равного по порядку величины Д? At ~ Ат ~ Ь. В течение времени т система не находится в состоянии с опреде- определенной энергией и импульсом. При этом оба электрона нахо- находятся б состоянии с волновой функцией Ф(/). В связи с этим ясно, что было бы недопустимым указывать направление вектора импульса отдачи атомов при «перебросе» электронов и пытаться, исходя из этого, определить знак
270 СПИН И ТОЖДЕСТВЕННОСТЬ ЧАСТИЦ [ГЛ. VIII энергии взаимодействия. Таким образом, говоря об обмене ча- частицами, следует помнить, что этот обмен имеет виртуальный, а не действительный характер. Слово виртуальный означает, что непосредственный смысл имеют только начальное и конеч- конечное состояния системы. Для того чтобы обменный интеграл А имел отличные от нуля значения, волновые функции частиц i|)rtl и i|)rt2 должны доста- достаточно сильно перекрываться, т. е. быть отличными от нуля в од- одной и гой же области пространства. Если, напротив, волновые функции i|)rtl и i|)rt2 отличны от нуля в различных областях про- пространства, то обменный интеграл обращается в нуль. Если, в частности, i|)rtl и i|)rt2 — волновые функции, описывающие свя- связанные состояния электронов в различных атомах, то обменное взаимодействие возможно лишь при непосредственном сближе- сближении атомов. Пусть, далее, волновые функции отвечают двум свя- связанным состояниям в атоме. Например, П\ — нормальное, а п2 — одн© из возбужденных состояний. Тогда величина обменного интеграла чрезвычайно быстро уменьшается с переходом к выс- высшим возбужденным состояниям, когда состояния п\ и ti2 обла- обладают существенно различными энергиями. Наконец, когда речь идет о взаимодействии свободных частиц, описываемых пло- плоскими волнами, то обменный интеграл отличен от нуля только для частиц, имеющих близкие по величине значения импульсов. Если, например, импульсы частиц заметно отличаются друг от друга, а энергия взаимодействия изменяется с координатами сравнительно медленно, то в Л под интегралом содержится произведение плавно изменяющейся и быстроосциллирующей функции. При этом весь интеграл мал. Таким образом, заметное обменное взаимодействие может иметь место лишь для тожде- тождественных частиц, находящихся в близких состояниях — локали- локализованных в малой области пространства или имеющих близкие значения энергии и импульса. Из этого свойства обменного взаимодействия вытекает важ- важнейшее следствие: обменное взаимодействие обладает свой- свойством насыщения, так что в системе из большого числа N тожде- тождественных частиц полная энергия обменного взаимодействия про- пропорциональна числу частиц N. Действительно, две частицы, связанные обменным взаимодействием, например два электрона с антипараллельными спинами, не могут присоединить к себе третьей частицы. Если обычная энергия парного взаимодействия пропорцио- N Ш — 1) нальна числу пар, т.е. ——^—L, то в обменное взаимодей- взаимодействие вступают не все пары, а лишь те, в которые входят ча- частицы, находящиеся в «близких» состояниях (в указанном выше смысле). Поэтому полное число частиц, связанных обменным
§67] ОБМЕННОЕ ВЗАИМОДЕЙСТВИЕ 271 взаимодействием, равно числу пар, построенных из частиц, на- находящихся в близких состояниях. Это число пар равно, оче- N ВИДНО, -J-. В заключение укажем на следующее обстоятельство: вывод формул для энергии взаимодействия был проведен в предполо- предположении, что оператор взаимодействия не содержит величин, за- зависящих от спина частиц. Однако к таким же результатам можно прийти и в том случае, когда оператор взаимодействия содержит операторы спинов. Обменное взаимодействие между тождественными частицами играет важнейшую роль в природе. Достаточно указать, что обменный характер имеют силы, обусловливающие существование гомеополярной химической связи, взаимодействие, ответственное за образование кристал- кристаллов, явление ферромагнетизма и, наконец, взаимодействие ме- между частицами в атомных ядрах — ядерные силы. К проблеме химической связи мы вернемся еще в § 79, а пока кратко оста- остановимся на проблеме ядерных сил. До настоящего времени не удалось создать последовательную теорию ядерных сил. Построение этой теории является одной из центральных задач современной теоретической физики. Пока теория ядерных сил имеет полуэмпирический характер и осно- основана на ряде опытных фактов. Совокупность имеющихся фак- фактов позволила установить следующие свойства ядерного взаимо- взаимодействия: 1. Опыты с рассеянием нейтронов на протонах показали, что на расстояниях от 1-Ю3 см до 2-Ю3 см между ядерными частицами действуют весьма мощные силы притяжения. Эти силы быстро спадают с расстоянием и не проявляются замет- заметным образом на расстояниях, больших 2-Ю3 см. На весьма малых расстояниях, меньших 1 • 103 см, притяжение, по-види- по-видимому, заменяется отталкиванием. 2. Ядерные силы оказываются не зависящими от заряда ча- частиц, т. е. ядерные силы, действующие между двумя протонами, нейтроном и протоном и двумя нейтронами, равны между со- собой. Зарядовая независимость ядерных сил вытекает как из пря- прямых опытов по рассеянию быстрых нейтронов и протонов на протонах, так и из анализа свойств так называемых зеркальных ядер. Под зеркальными ядрами понимают ядра, отличающиеся друг от друга заменой нейтронов на протоны (зеркальными являются ядра с атомным номером Z и А — Z, где А — массо- массовое число). Тождественность нейтронов и протонов при ядерных взаимо- взаимодействиях указывает на глубокую симметрию, существующую между этими частицами.
272 спин и тождественность частиц [гл. viir Неравенство масс и наличие электрического заряда у про- протона являются сравнительно второстепенными обстоятельствами. Поэтому, согласно современной точке зрения, протон и нейтрон следует рассматривать как разные зарядовые состоя- состояния одной частицы — нуклона. Нуклон имеет спин 1/2 и в данном зарядовом состоянии под- подчиняется принципу запрета Паули. Ядерное взаимодействие ме- между нуклонами получило название сильного взаимодействия (см. § 112). 3. Нуклон может находиться в двух различных зарядовых состояниях — протеином и нейтронном, между которыми воз- возможны переходы. При свободном движении протонное состояние с меньшей массой и энергией является более устойчивым. Поэтому проис- происходит распад свободного нейтрона по схеме где v — антинейтрино. В атомных ядрах, где имеет место ядерное взаимодействие между частицами, происходит взаимное превращение нейтронов и протонов (см. ниже). 4. Наличие у протонов заряда влечет за собой два след- следствия: 1) протонное и нейтронное состояния являются разными состояниями нуклона. 2) Между двумя протонами наряду с ядерным взаимодействием действуют силы кулоновского оттал- отталкивания. Они становятся существенными у тяжелых ядер, обу- обусловливая их нестабильность. 5. Ядерное взаимодействие зависит не только от расстояния, но и от взаимной ориентации спинов взаимодействующих ча- частиц, а также от ориентации спинов относительно оси, соединяю- соединяющей оба нуклона. Зависимость ядерного взаимодействия от ориентации спинов следует непосредственно из опытов по рассеянию весьма мед- медленных нейтронов на орто- и параводороде. Существование зависимости от ориентации спинов относи- относительно оси вытекает из анализа свойств дейтрона, в частности наличия у него квадрупольного момента. 6. Ядерное взаимодействие имеет обменный характер. Этот фундаментальный вывод следует, прежде всего, из самого факта стабильности ядер. Если бы нуклонное (сильное) взаимодействие зависело толь- только от расстояния между частицами, то потенциальная энергия системы с массовым числом А была бы пропорциональна А2 — числу притягивающихся пар. Между тем кинетическая энергия газа ферми-частиц, заключенных в данном объеме растет с чис- числом частиц, согласно (G9,4), ч. III), как А\
§ 67] ОБМЕННОЕ ВЗАИМОДЕЙСТВИЕ 273 Таким образом, при достаточно большом массовом числе по- потенциальная энергия оказалась бы больше кинетической и ядро должно было бы сжиматься, а частицы сливаться друг с дру- другом. Объем ядра был бы постоянной величиной, не зависящей от Л, а его энергия связи — пропорциональной А2. В действи- действительности данные по рассеянию показывают, что объем ядра растет пропорционально Л, а энергия связи — также пропор- пропорциональна А. Это значит, что ядерные силы обладают свой- свойством насыщения. Насыщение, как мы видели выше, является характерной особенностью обменных сил. Остановимся несколько подробнее на изложении современ- современных представлений о природе ядерных сил. Из допущения о том, что протон и нейтрон являются со- состояниями одной частицы, и из обменного характера нуклон- ного взаимодействия вытекает следующая наглядная картина ядерных сил: между двумя нуклонами, находящимися на весьма малых расстояниях, происходит виртуальный обмен некоторой частицей, являющейся «переносчиком» взаимодействия. Этот об- обмен частицей в принципе сходен с виртуальным обменом элек- электроном в подробно разобранном выше примере обменного взаимодействия. Оказалось (см. ниже), что частицей, ответственной за нук- лон-нуклонное взаимодействие, является я-мезон. Именно, возможны три типа обмена: n^tn + л0. В первых двух виртуальных процессах нуклон переходит из протонного в нейтронное состояние и обратно; в последнем за- зарядовое состояние нуклона не изменяется. Наглядно процесс об- обмена заряженным мезоном можно трактовать так же, как обмен электронами: часть времени каждый из нуклонов проводит в за- заряженном состоянии, часть времени — в нейтральном. Обмен виртуальными я-мезонами обусловливает притяжение между нуклонами. Мы подчеркивали виртуальный характер обмена, поскольку для образования реальных мезонов потребовалась бы энергия, не меньшая чем тлс2, где тл — масса я-мезона. Все я-мезоны — положительный, отрицательный и нейтраль- нейтральный— следует считать различными зарядовыми состояниями од- одной частицы. Далее, оказывается, что масса я-мезонов не может быть про- произвольной. Ее можно связать с радиусом действия ядерных
274 спин и тождественность частиц [гл viii сил. Поскольку ядерные силы не зависят от электрического за- заряда и имеют чисто квантовую природу, радиус действия сил может зависеть лишь от массы частиц — переносчиков тл и ми- мировых постоянных Ь и с. Из указанных трех величин можно составить только одну постоянную размерности длины — комптоновскую длину волны мезона ^ <67<10> Выражению F7,10) можно придать наглядный смысл на осно- основе следующих рассуждений: при виртуальном обмене мезоном энергия каждого из двух нуклонов должна обладать неопреде- неопределенностью Д? ~ тлс2. Время обмена т должно иметь порядок т~ —г • Если считать, что мезон движется со скоростью ~с> то за время т он проходит путь R ~ с% тпс Это расстояние и есть радиус действия ядерных сил. Задаваясь радиусом действия ядерных сил, можно найти массу частиц- переносчиков m*i~-JZ — 300/п9л, где тэл — масса электрона. Это по порядку величины совпадает со значением масс я-мезонов. Заметим, что я-мезоны были обнаружены экспериментально после введения их в теорию как гипотетических частиц, ответственных за сильное ядерное взаи- взаимодействие. Наиболее убедительным доказательством того, что именно я-мезоны являются переносчиками ядерных сил, служит установленный на опыте факт чрезвычайно сильного взаимодей- взаимодействия я-мезонов с нуклонами. При энергиях системы нуклонов, превышающих тлс2, воз- возможно реальное возникновение я-мезонов. Оно наблюдалось как при столкновении быстрых нуклонов, так и при воздействии на нуклоны у-лучей. Наблюдалась реакция представляющая элементарный акт ядерного фотоэффекта. В дальнейшем, в частности, в § 112, мы вернемся еще к про- проблеме ядерных сил.
ГЛАВА IX ПРИЛОЖЕНИЯ КВАНТОВОЙ МЕХАНИКИ К РАССМОТРЕНИЮ СВОЙСТВ АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ § 68. Атом гелия Детально рассмотренный в гл. IV атом водорода является простейшей одноэлектронной системой. Переходя к изучению многоэлектронных систем, естественно обратиться прежде всего к исследованию свойств атома гелия, в котором вокруг ядра движутся два электрона. Будем предполагать, что ядро имеет бесконечно большую массу. Поэтому, считая его неподвижным, запишем гамильтониан системы из двух электронов в виде 2е2 2е2 . — -—+7 Здесь Г\ и Гг — радиусы-векторы первого и второго электронов, Г\2 — расстояние между ними. Третий и четвертый члены в F8.1) выражают потенциальную энергию электронов в поле ядра, по- последний член — энергию кулоновского взаимодействия между электронами. Следует отметить, что представление гамильтониана в такой форме связано с рядом приближений. Электроны обладают маг- магнитными моментами и их взаимодействие имеет более сложный характер, чем кулоновское взаимодействие. Далее магнитные моменты (спиновый и орбитальный) также взаимодействуют друг с другом. Мы, однако, не будем исследовать подробно эти эффекты, имеющие характер малых поправок. Так как гамильтониан системы не содержит спиновых опе- операторов, то решение уравнения F8.1) следует искать в виде произведения функций, одна из которых зависит только от ко- координат, другая — от спина 1, sZ2). F8,2)
276 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX В § 66 было показано, что спиновая функция двух электро- электронов является симметричной относительно перестановки местами двух частиц, если полный спин системы равен единице, и анти- антисимметричной, если спин равен нулю. Таким образом, видно, что состояния атома гелия делятся на две группы. Состояния со спином, равным нулю, называются парасостояниями, а со спином, равным единице, — ортосостояниями. Если бы гамильто- гамильтониан F8.1) точно описывал систему, то три ортосостояния, раз- различающиеся проекцией спина на ось г, имели бы одинаковую энергию. Однако слабое взаимодействие между спиновым и ор- орбитальным магнитными моментами снимает вырождение и воз- возникают три близких подуровня. Таким образом, энергетический спектр гелия состоит из совокупности синглетных и триплетных уровней. Из общих соображений легко установить, к какой группе состояний относится основное состояние гелия, которое, как из- известно, описывается волновой функцией, не имеющей узлов (см. § 10). Очевидно, что этой функцией не может быть антисим- антисимметричная координатная функция, так как последняя при П = г2 обращается в нуль. Действительно, если Ф(гьг2)—антисимметричная функция двух переменных Г\ и г2, то она удовлетворяет соотношению Ф(гь г2Н-Ф(г2, гх). F8,3) При Г\ = г2 = г мы имеем Ф(г, г) = 0. Таким образом, мы видим, что в нормальном состоянии вол- волновая функция симметрична по координатам и, следовательно, антисимметрична по спинам. Нормальное состояние гелия яв- является парасосюянием. В уравнении F8,1) переменные не разделяются и его точное решение получить невозможно. Поэтому для его решения раз- разработан ряд приближенных методов. Применение теории воз- возмущений позволяет получить волновые функции и, в довольно грубом приближении, энергию основного состояния гелия. Именно будем считать, что взаимодействие между электро- электронами является в уравнении F8,1) возмущением. Тогда в нулевом приближении уравнение F8,1) можно напи- написать в виде Оно решается методом разделения переменных. Для нормаль- нормального состояния атома гелия имеем
§ 68] АТОМ ГЕЛИЯ 277* где через Е\ и г|?1 обозначены соответственно энергия и волно- волновая функция нормального состояния водородоподобного атома. с зарядом Z = 2. Функция Фо, как мы указывали ранее, сим- симметрична в координатах электронов. Уровень энергии нормального состояния в первом приближе- приближении теории возмущений дается формулой где величина ?<*), в соответствии с формулой E3,12), опреде- определяется матричным элементом ?(° = J \Ь (гх) I21 * (г2) I2 ¦? dVx dV2. F8f6> При вычислении высших уровней энергии атома гелия реше- решение невозмущенного волнового уравнения может быть записано в форме «b-*(ri)ih(r2) 1 I F8,6> Здесь фп и г|эт — волновые функции водородоподобного атома, находящегося соответственно в п-ж и m-м квантовом состоянии. (Для получения качественной картины мы не будем учитывать далее вырождения по орбитальному и магнитному квантовым числам.) Легко понять, что решением невозмущенного уравнения бу- будет также функция Р т. 1 I Таким образом, имеет место двукратное вырождение. Оба- решения F8,6) и F8,7) отличаются друг от друга переста- перестановкой электронов. Для дальнейших расчетов нам следует- обратиться к теории возмущения при наличии вырождения (см. §54). Поправка к энергии Ео в первом приближении определяет- определяется в этом случае из условия обращения в нуль определителя. (см. § 54) Н'п-Е" Я?*,
278 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX Величины #11, #12, #21 и #22 представляют собой матричные элементы 1 "и=J ¦;(',)¦;(',) ¦?¦¦. ('O 12= ^1 ; (r2) -? ¦„ Легко заметить, что #п = #22, #i2 = #2i. Действительно, если в выражении для матричного элемента #и заменить п на г2 и Гг на гь то получим в точности выражение #22. Аналогич- Аналогичное утверждение относится также к матричным элементам #[2 и #2ь Раскрывая определитель, получаем Отсюда находим два значения для поправки к энергии: (° ; F8,9) F8,10) Выражения F8,9) и F8,10) совпадают с общей формулой, найденной в § 67. Двум значениям энергии F8,9) и F8,10) соответствуют две волновые функции типа \|) = ai|)n(ri)'v|)m(r2) +J + &^n(^2)<tm(^i)- Коэффициенты а и Ь определяются из урав- уравнений (#п - ?A)) а + Н[2Ь = 0, Нпа + (#22 - ?A)) 6 = 0. Для значения Е\1) получаем а = 6, а в случае Е^ имеем а = —Ь. Таким образом, под влиянием возмущения вырождение снимается, и мы получаем два различных состояния: Ф^ = ai [фя (ri) фт (r2) + *я (r2) *m (ri)], | Ф[)а) = а2 [*» (ri) i|jm (r2) - ^rt (r2) ¦ (r)] J где ai и a2 — нормировочные константы. Состояния Фо5) и Фоа), как это видно из формул F8,11), являются соответственно симметричными и антисимметричными в координатах электронов. В соответствии с ранее сказанным, функция Фо^ описывает состояние атома гелия со спином, рав-
§ 69] ВАРИАЦИОННЫЙ ПРИНЦИП 279 ным нулю, а волновая функция Фоа) отвечает состоянию с пол- полным спином, равным единице. Волновая функция ф[>5) отвечает парасостоянию со спином нуль и большей энергией Е\1). Соответственно, Фоа) отвечает ортосостоянию со спином единица и меньшей энергией Е^. Матричные элементы Ни = Я22, как видно из их определе- определения, представляют кулоновский, а Н[2 = #21 "~ обменный инте- интеграл. К системе из двух электронов в гелии относится все ска- сказанное в § 67. Например, если электрон 1 находится в нормаль- нормальном, а электрон 2 в возбужденном состоянии, то по проше- прошествии промежутка времени т = ,я , . они обменяются состоя- 2)Я12| ниями. Соотношения F8,9) и F8,10) не дают еще полной картины уровней атома. Действительно, в расчете, приведенном выше, не учитывалось вырождение уровней водородоподобных атомов по квантовым числам L Взаимодействие между электронами снимает это вырождение, и уровни оказываются зависящими не только от главных квантовых чисел, но и от орбитальных мо- моментов. Отметим, что приведенный метод расчета не дает большой точности. Основной уровень энергии атома гелия, полученный по указанной теории, отличается примерно на 20% от экспери- экспериментально наблюдаемого значения. Такое сильное расхождение обусловлено выбором возмущения, которое не является доста- достаточно малым. § 69. Вариационный принцип Мы видели, что уже двухэлектронная задача — атом ге- гелия — не может быть решена точно и требует привлечения при- приближенных методов. В еще большей мере это относится к сложным атомам, содержащим много электронов. Несмотря на сложность много- многоэлектронных атомов, эффективные приближенные методы ре- решения позволяют составить весьма детальное представление об их свойствах. Эффективные приближенные методы в значитель- значительной мере связаны с экстремальными свойствами уравнения Шре- дингера. Именно, оказывается, что уравнение Шредингера мо- может быть получено из некоторого вариационного принципа. Введем в рассмотрение функционал F9,1)
?80 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX где на функцию ф накладывается ограничение *cpd7=l. F9,2) В остальном ср остается произвольной комплексной функцией, имеющей ту же размерность, что и собственные функции опе- оператора Я. Минимальное значение функционала / при условии F9,2) может быть найдено по методу Лагранжа. При варьиро- варьировании комплексной функции можно независимо варьировать Ф и ф*. Для конкретности можно варьировать ф*. Варьирование Ф приводит к тому же результату. Имеем, очевидно, где Ео— множитель Лагранжа. Отсюда имеем ?0)ф^ = 0, F9,3) или ввиду произвольности 6ф* (Я-?О)Ф = О. F9,4) Таким образом, если ф = ipo, где \|H — нормированное решение уравнения Шредингера, отвечающее собственному значению оператора Я, равному Ео, то функционал V = E0. F9,5) Покажем, что Ео — минимальное собственное значение Я, т. е. энергия нормального состояния. Пусть ф = i|H + 2 VlV Тогда для / находим +2<aK-*.+2 \сп\2еп>е0. F9,6) Волновые функции возбужденных стационарных состояний \|)n должны удовлетворять не только условию F9,2), но и условию ортогональности j*d*ndV = 0. F9,7) Они осуществляют экстремум, но не минимум /(\|)п)- Вариационные свойства уравнения Шредингера широко ис- используются для получения приближенных его решений. Зада- Задаваясь на основании физических соображений или опытных дан- данных видом пробной функции, ищут минимальное значение инте- интеграла /(ф).
§ 70] МЕТОД САМОСОГЛАСОВАННОГО ПОЛЯ 281 Рассмотрим, в виде примера, гармонический осциллятор. Вы- Выбирая в качестве пробной функции нормированную функцию^ Ф = {2а/п)Ч*е~ах\ имеем Условие минимума дает а= (тсо)/Bй), откуда т®х2 тсо — 4 / _ / тсо Удачный выбор пробной функции ф привел нас к точному зна- значению Ео и г|). Если бы мы выбрали другую пробную функцию, то было бы получено другое, хотя и близкое, значение Е'о и г|э,. Недостатком вариационного метода является то, что он дает не- неопределенную, заранее не предсказуемую погрешность. Дальнейшие примеры использования вариационного прин- принципа будут даны в следующем параграфе. § 70. Метод самосогласованного поля (метод Хартри — Фока) Для расчета многоэлектронных систем широкое применение получил метод самосогласованного поля, с которым мы уже сталкивались (см. ч. IV). Идея метода (часто именуемого мето- методом Хартри) заключается в следующем: в нулевом приближении все электроны считаются движущимися независимо друг от друга в поле ядра. С помощью волновых функций нулевого прибли- приближения находится плотность заряда и среднее электростатиче- электростатическое поле, создаваемое всеми электронами. В следующем приближении каждый из электронов считается движущимся в поле ядра и в поле, создаваемом всеми осталь- остальными электронами. Решение уравнения Шредингера в этом поле дает волновую функцию первого приближения. Вводя кор- коррекцию в распределение заряда и поля и решая уравнение Шредингера в новом поле, можно найти поправку второго при- приближения и т. д. Для получения уравнения Шредингера в самосогласованном поле воспользуемся вариационным принципом. Для сокраще- сокращения записи мы проведем выкладки на примере двухэлектронной системы (атома гелия) в предположении, что каждый из электро- электронов находится б 5-состоянии. Мы не будем также учитывать тре- требования симметризации волновой функции системы электронов. Это будет сделано несколько позднее. В нулевом приближении оба электрона описываются вещественными волновыми функ- функциями -ф, а волновая функция атома имеет вид г|I.'ф2. G0Д>
282 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX В приближении G0,1) в вариационном принципе функции \fi и г|J варьируются независимо друг от друга. Аналогично F9,3) получаем G0,2) J в*1 [ J J в«2 [ J to (Я - Ввиду произвольности вариаций Vi = 0, ]dV2 = 0. J ф! (Я - Подставляя значение Я из F8,1), приходим к уравнениям G0,3) G0,4) где обозначено Е{ = Е — Я22, Е2 = Е — Яи, Я„- J Ф,(- ¦? ¦ А, - ^)^^ (/=1, 2). Здесь, очевидно, ? — полная энергия системы из двух электро- электронов в поле ядра, ?i и Е% — энергии каждого из электронов. Уравнения G0,4) показывают, что в потенциальной энергии каждого из электронов появляются дополнительные слагаемые: G0,5) (г.) dVt соответственно, где р* = etyi—плотность заряда, создаваемого одним электроном в точке г*. Полная энергия системы равна G0,6)
§ 70] МЕТОД САМОСОГЛАСОВАННОГО ПОЛЯ 283 Величина & имеет простой смысл: это не что иное, как сред- средняя энергия электростатического взаимодействия между элек- электронами Поскольку в каждую из величин Е\ и Е2 входит взаимодей- взаимодействие между электронами (ср. G0,4)) и, следовательно, в сумме (Et + E2) оно учитывается дважды, энергия системы получается после вычитания из (?i + ?2) значения G. В случае системы из N электронов аналогичный вывод дает для /-го электрона в /г-м квантовом состоянии " -Ш А< + U ('<) A Структура общего уравнения не отличается от структуры урав- уравнений G0,4). Сложность уравнений Шредингера в приближении самосогласованного поля связана с тем, что в уравнение для \|зг- входят волновые функции всех остальных электронов. По- Поэтому, даже в простейшем случае двухэлектронной системы, уравнения G0,4) приходится решать численными либо прибли* женными методами, например, вариационным. В последнем случае в качестве пробных функций естественно выбрать во- дородоподобные функции для некоторого эффективного заряда ядра. Значение последнего находится из условия минимума ин- интегралов G0,2). Эти вычисления, а также сводка численных ре- решений, могут быть найдены в книге Г. Бете и Э. Солпитера1). До сих пор мы не учитывали симметрию волновой функции. Ясно, однако, что с принципиальной точки зрения симметриза- симметризация волновой функции должна быть проведена с самого качала вычислений. Например, без учета симметрии волновой функции не возни- возникало различия в энергии орто- и парагелия. Метод самосогласованного поля с учетом требований сим- симметрии волновой функции носит название метода Хартри — Фо- Фока. В простейшем случае двух электронов все предыдущие вы- выкладки могут без труда быть приведены для симметризованной волносой функции 1) Г. Бете и Э. Солпитер, Квантовая механика атомов с одним и двумя электронами, Физматгиз, 1960.
284 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX Подставляя это выражение в G0,2), мы должны варьировать независимо друг от друга волновые функции i|)i и i|J. Тогда вместо G0,3) получаем G0,8) При этом в G0,8) I = 1 при k = 2 и i = 2 при & = 1. Ввиду про- произвольности 6i|)i и 6г|J мы приходим к двум уравнениям. После подстановки полного оператора Н из F8,1) эти уравнения при- приобретают вид - -g- Л - Е - If + Я22 + 0^) 4>, (г) - [Я12 + G12] t2 (г) = 0, - -? А - Е - —¦ + Нп + G,,) Ч»2 (г) — [На + G12] ф, (г) - 0, где обозначено: С учетом симметрии волновой функции число неизвестных вол- волновых функций удваивается, уравнения для них образуют за- зацепляющую систему. Главное отличие уравнений Хартри — Фока от уравнений Хар- три заключается в появлении обменных интегралов, т. е. членов вида Gi2. В общем случае многоэлектронных атомов волновую функ- функцию системы электронов, которую следует подставить в урав- уравнение вариационного принципа, нужно представить в виде F5,6). Мы не будем приводить получающихся при этом гро- громоздких уравнений. Хотя при численном решении уравнений Хартри — Фока приходится производить весьма трудоемкие вычисления, удается с большой степенью точности энергии ос- основных и возбужденных состояний найти распределение заряда и поля как для гелия, так и целого ряда атомов и ионов. Естественно, что объем необходимых числовых расчетов при интегрировании уравнений Хартри — Фока быстро возрастает с увеличением числа электронов.
§ 71] СТАТИСТИЧЕСКАЯ МОДЕЛЬ АТОМА 285 § 71. Статистическая модель атома В случае тяжелых атомов, когда расчет многоэлектронной системы по методу Хартри — Фока становится весьма трудоем- трудоемким, широкое применение получил статистический метод То- Томаса— Ферми. Пусть в некотором сферически-симметричном поле ф(г) движется система из большого числа электронов. В силу принципа Паули большая часть этих электронов будет находиться в состояниях с большими квантовыми числами. Если потенциал ф(г) изменяется в пространстве достаточно медленно, то электроны можно рассматривать в квазиклассическом при- приближении. Если, кроме того, взаимодействие между электро- электронами является достаточно слабым, всю совокупность электро- электронов можно считать идеальным ферми-газом, находящимся при абсолютном нуле температуры. В вырожденном ферми-газе (ср. § 79 ч. III) электроны по- попарно заполняют квантовые состояния, так что на каждую пару приходится ячейка фазового пространства объемом BяйK. При этом в пространстве импульсов заполнены все клетки с импуль- импульсом, лежащим в интервале 0<</?</?тах- Значение /?тах легко выразить через плотность электронного газа п (т. е. среднее число электронов в единице объема). Число электронов в еди- единице объема с данным значением импульса равно, очевидно, Интегрируя от р = 0 до р = /Wx, имеем PLx = 1^B*fiK«- G1,1) Последняя формула позволяет выразить плотность заряда р = еп через импульс Р = 3 BяЙK Ртах- G1>2) С другой стороны, /?шах может быть связан с потенциалом ф(г) с помощью следующего простого рассуждения. Энергия элек- электрона, связанного в атоме ?, всегда не положительна, т. е. При этом мы считаем, что потенциал ф(г) вне атома обращается в нуль, откуда для максимального импульса, совместимого с тре- требованием Е = О, находим G1,3)
286 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX Поэтому плотность электронного заряда связана с потенциалом соотношением ё 8/[ф(г)]8/2. G1,4) В приближении самосогласованного поля для потенциала элек- электростатического поля ф(г) можно написать уравнение Пуассона Аф = — 4яр или, учитывая сферическую симметрию атома, ^^'*. G1,5) Полученное уравнение носит название уравнения Томаса — Фер- Ферми. Для получения распределения потенциала ф(г) необходимо дополнить это уравнение граничными условиями. Рассмотрим вначале случай нейтральных атомов. Тогда одним из граничных условий является ф->0 при г->оо. Второе условие вытекает из требования, чтобы вблизи ядра, когда его заряд не экранирован электронами, поле было бы числом кулоновским, т. е. Ф(г)->^ при г->0. G1,6) Для получения решения уравнения G1,5) с граничными усло- условиями G1,3) и G1,6) удобно перейти к безразмерным величи- величинам, определив их соотношениями г Z\e\ > л d' где d — постоянная величина с размерностью длины. Для % находим уравнение d\ = H3Bm)8/2zV/2 гк dx2 ЗяЙ3 VJ ' Полагая d равным , 1 /9я2\7з Й2 1 Пдй а п. 7Ч а— — [ —9*—гг ~ и,оо—п- > ('1>') 2 V 16 / те2 Z/s Z/з V ; где а — радиус боровской орбиты, приходим к уравнению dx2 При этом, очевидно, U при ,->0, при л;-> оо »
§71] СТАТИСТИЧЕСКАЯ МОДЕЛЬ АТОМА 287 Интегрирование уравнения G1,8) при граничных условиях G1,9) было проведено численно. Поскольку краевая задача не зависит от атомного номера, интегрирование этой системы по- позволяет найти универсальное распределение безразмерного по- потенциала в атоме. На рис. 18 пунктиром изображен1) ход функции %(х) для атома. Поскольку функция %{х) при х—>оо лишь асимптотиче- асимптотически обращается в нуль, потенциал, а с ним и электронная плотность, нигде не обращаются в нуль. Это значит, что в рас- рассмотренном приближении нельзя найти конечное значение ра- радиуса атома. На рис. 19 кривая радиальной электронной плот- плотности D = 4лг2р(г) для атома аргона по Томасу — Ферми (сплош- (сплошная кривая) сравнивается с данными, найденными по методу Хартри — Фока (пунктирная кривая). D 40 го w 5 2 1 О Рис. 18. 3 4 Рис. 19. 5 6 jr а Рис. 19 наглядно иллюстрирует достоинства и недостатки метода Томаса — Ферми. Он не передает всех деталей хода электронной плотности внутри атома, но позволяет достаточно точно установить общий ее ход. Во внешних частях атома, вдали от ядра, электронная плот- плотность, вычисленная по Томасу — Ферми, имеет завышенные зна- значения. То обстоятельство, что метод Томаса — Ферми дает плохие результаты для периферических областей атома, вытекает из условий его применимости (см. ниже). Числовой расчет хода электронной плотности с расстоянием от ядра показывает, что в сфере радиуса Rc^ l,33aZ-1/a заключена половина полного электронного заряда. *) Табулированные значения функции %(х) могут быть найдены в кни- книгах: Л. Д. Ландау и Е. М. Л и ф ш и ц, Квантовая механика, Физматгиз, 1963, стр. 291; П. Го м баш, Статистическая теория атома и ее применение, ИЛ, 1951.
288 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX Поэтому качественно можно считать величину R эффектив- эффективным радиусом атома. Он уменьшается с ростом Z. Полная энергия всех электронов в атоме по порядку вели- величины равна средней электростатической энергии одного элек- Ze2 Z4V трона —5— ~ , умноженной на их полное число Z, т. е. е2 по порядку величины равна —Z7/*. Эти средние значения, а также все величины, относящиеся к свойствам внутренних об- областей атомов, например структура рентгеновских уровней на- находятся в хорошем согласии с опытными данными. Наоборот, величины, зависящие от свойств периферийных электронов, например потенциалы ионизации атомов, не могут быть определены по методу Томаса — Ферми достаточно удов- удовлетворительным образом. На периферии атома электронная плотность недостаточно велика, для того чтобы электроны можно было считать выро- вырожденным электронным газом. Основным достоинством метода Томаса — Ферми является его простота. В виде примера можно привести важный резуль- результат, который вытекает также из расчетов по методу Хартри — Фока, но требует в этом случае весьма громоздких выкладок. Речь идет о нахождении таких значений атомного номера Z, при которых начинают заполняться состояния с данным значением орбитального момента. Если электрон движется с моментом / в самосогласованном поле ф(^), то его эффективную потен- потенциальную энергию можно представить формулой C5,18). В квазиклассическом приближении можно заменить /(/+1) на и + у) . Тогда имеем где под ф(г) подразумевается потенциал, найденный из уравне- уравнения Томаса — Ферми. Поскольку всегда полная энергия Е от- отрицательна, полная потенциальная энергия должна быть суще- существенно отрицательной Utu < О или Переходя к безразмерным величинам % и *, имеем вместо G1 ДО)
§ 711 СТАТИСТИЧЕСКАЯ МОДЕЛЬ АТОМА 289 Величина х%(х) ограничена и имеет пологий максимум. При больших х потенциал %(х) убывает быстрее, чем —, при л: —> О, х%(х) также равно нулю. Поэтому неравенство G1,11) при дан- данном / выполнено лишь при достаточно большом значении Z. Это значит, что кривая Uett целиком лежит выше оси абсцисс при достаточно малом Z и проходит ниже оси при достаточно боль- большом Z. Состояний с Uett > 0 быть не может. Поэтому граница реализуемых состояний определяется условием касания кривой оси абсцисс, т. е. выполнением условий dUell или ( Л Каждому значению I отвечает свое критическое значение за- заряда ядра ZKPr при котором выполняются условия G1,12). Из этих уравнений легко исключить %' и %, после чего нахо- находим связь между I и ZKp: ZKp = 0,155B/+lK. G1,13) Полагая в последней формуле /= 1,2, 3, ... и округляя резуль- результат до ближайших целых чисел, мы находим значения ZKp> при которых начинается заполнение состояний с указанными моментами. Эти значения соответственно: -кр = 5,21, 58,124. G1,14) В § 73 будет показано, что этот результат имеет важное зна- значение для понимания свойств сложных атомов. Другим важным приложением метода Томаса — Ферми является изучение свойств положительных ионов. В этом случае можно ожидать, что из-за преобладающего за- заряда ядра электронная оболочка будет сжата и электронная плотность будет спадать настолько быстро, что можно ввести конечный радиус электронной оболочки /?*. Вне иона при г > R* должно существовать электрическое поле с потенциалом ф^ \e\zq-o) ^ где величина or = j—^^—^^—*-именуется степенью ионизации, 10 В. Га Левич и др., том II
290 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ При г = R* потенциал равен [ГЛ. IX фо_ — , Соответственно, энергия электрона на поверхности иона равна ( Условие того, что электрон является связанным в ионе, при- приобретает вид вместо Е4^0 для нейтрального атома. Соответственно, макси- максимальный импульс рМакс= 1^2т^(ф0— фI/2, и уравнение G1,5) для иона приобретает вид d2(rq>) _ dr2 4е Bте)*12 (ф0 - Ф)8/г ЗяЙ3 Его интегрирование с учетом граничного условия на поверх- поверхности иона ф = ф0 и условия G1,6) произведено, как и для атома, численно. Кривая %(х) для иона изображена на рис. 18 сплошной линией. Кривая %(х) пересекает ось абсцисс в точке ** — ^7-» где R* определяется условием An pr2 dr = — Zee. о На рис. 20 приведено распре- распределение радиальной электрон- электронной плотности для иона RbV рассчитанное по методу Томаса — Ферми и по Хартри (пунктирная кривая). Мы видим, что в пе- периферической части иона совпадение между кривыми несколько лучшее, чем у атома. Границы применимости метода Томаса — Ферми существен- существенно связаны с границами применимости квазиклассического при- приближения. Формула C9,23) после подстановки в нее выраже- выражений U = <?ф = Ze2jr, p ^ Рмаксв 1^2/П?ф дает в качестве критерия применимости метода Томаса—Ферми условие г > h2/(Ze2m) - a/Z.
§ 72] КВАНТОВЫЕ ЧИСЛА 291 На больших расстояниях г ~ а квазиклассическое приближе- приближение снова становится неприменимым. Таким образом, метод То- Томаса— Ферми применим при г, лежащих в интервале a/Z<r<a. G1,15) § 72. Квантовые числа, характеризующие состояния электронов в атомах Перейдем теперь к обсуждению свойств миогоэлектронных атомов. Очевидно, в многоэлектронном атоме — системе, состоя- состоящей из ядра и нескольких электронов, — должны выполняться законы сохранения полной энергии, полного момента количе- количества движения и проекции момента количества движения на произвольную ось. По аналогии с теорией атома водорода мож- можно ввести квантовые числа, определяющие значения сохраняю- сохраняющихся величин. На первый взгляд кажется, что квантовые числа должны характеризовать всю систему в целом, так как ни энер- энергия, ни момент количества движения отдельного электрона, вообще говоря, не сохраняются. Однако метод самосогласован- самосогласованного поля позволяет рассматривать электроны как независимые частицы (волновая функция системы является произведением волновых функций отдельных частиц), находящиеся во внеш- внешнем поле. Каждый из электронов движется в самосогласован- самосогласованном сферически-симметричном поле ядра и остальных электро- электронов. Так как при движении в сферически-симметричном поле сохраняется энергия, момент количества движения и его проек- проекция, то не только атом как целое, но и отдельный электрон можег характеризоваться квантовыми числами /г, /, т. Самосо- Самосогласованное поле атома не является кулоновским полем, по- поэтому уровни энергии будут зависеть не только от /г, но и от /. Естественно, что энергия электрона не зависит от ориентации его механического момента в пространстве и, следовательно, не может зависеть от квантового числа т. Таким образом, мы видим, что для характеристики состояния атома нужно указать состояние каждого атомного электрона. Состояния с моментом / = 0, 1, 2, 3, ... обозначаются соответ- соответственно через s, /?, d, f и т.д. Главное квантовое число указы- указывается в виде цифры, стоящей впереди. Например, обозначение 5/ указывает, что в данном состоянии электрон характеризуется квантовым числом я = 5 и имеет орбитальный момент / = 3. Если несколько электронов находится в состоянии с одинако- одинаковыми числами п и /, то для простоты их число указывается в виде показателя степени. Например, нормальное состояние азо- азота характеризуется формулой Is2, 2s2, 2pz. Это означает, что два электрона имеют квантовые числа п = 1, / = 0; два других на- находятся в состоянии п = 2; / = 0 и, наконец, три электрона — 10*
292 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX в 2/?-состоянии. Однако таких сведений оказывается недоста- недостаточно для полного описания состояния атома, так как мы не знаем при этом, как складываются орбитальные и спино- спиновые моменты отдельных электронов и каков полный момент атома. Мы уже говорили о том, что полный момент атома сохра- сохраняется во времени и тем самым может служить характеристикой стационарных состояний. Кроме того, можно считать (отвле- (отвлекаясь от слабого спин-орбитального взаимодействия), что сохра- сохраняется полный спин системы и полный орбитальный момент в отдельности. Эти три величины и выбираются как характери- характеристики всей системы в целом. Обозначения для состояний атомов с различными полными моментами L вводятся по аналогии с обозначениями для от- отдельных электронов. Именно, при L = О состояние называется 5-состоянием, при L — \ — Р-состоянием, при L = 2 — D-состоя- нием, при L = 3 — ^-состоянием и т.д. Величина / полного мо- момента указывается в виде индекса справа снизу при символе орбитального момента. Например, Р*/2 обозначает, что атом на- находится в состоянии с орбитальным моментом L = 1, и полным моментом / = 3/2. Обычно для характеристики атома указы- указывается также величина, равная 25+ 1, где 5 — полный спин атома. Это значение 25 + 1 помещается в виде индекса слева сверху от L. Величина 25 + 1 при L > 5 указывает число близ- близко расположенных уровней атома, составляющих его тонкую структуру. Действительно, из правила сложения моментов сле- следует, что если L > 5, то при сложении орбитального момента и спинового момента в полный момент системы может возник- возникнуть всего 25 + 1 различных состояний. Оказывается, что эти B5 + 1) состояния имеют близкие, но различные энергии. Иными словами, B5 + 1) уровней обра- образуют так называемый мультиплет. Различие в энергиях компо- компонент мультиплета связано с так называемым спин-орбитальным взаимодействием. *Под спин-орбитальным взаимодействием по- понимают взаимодействие, зависящее от взаимной ориентации векторов орбитального и спинового моментов. В § 118 будет показано, что релятивистское уравнение для электрона (уравнение Дирака) позволяет вычислить спин-орби- спин-орбитальное взаимодействие. Если, однако, принять сам факт существования этого взаи- взаимодействия, т. е. допустить, что ориентация векторов орбиталь- орбитального и спинового моментов не являются независимыми, то из весьма общих соображений можно установить закон взаимо- взаимодействия. Оператор спин-орбитального взаимодействия должен быть скаляром, восставленным из векторов L и S. Таким ска- скаляром является величина LS. При этом для средней энергии
§ 72] КВАНТОВЫЕ ЧИСЛА 293 спин-орбитального взаимодействия получаем где коэффициент А может быть как положительным, так и от- отрицательным. Имеем откуда Для уровней, принадлежащих к данному мультиплету, вели- величины L имеют одно и то же значение. Если величина А/ > 0, то самым низким уровнем в мульти- плете является уровень с наименьшим возможным значением / (т.е. / = \L — 5|). Это так называемые нормальные мульти- плеты. Этот случай реализуется у тех атомов, у которых не- незаполненная оболочка заполнена больше, чем наполовину. В противном случае оказывается, что Аг < 0. Это так называе- называемые обращенные мультиплеты, у которых низший уровень имеет наибольший полный момент / (т. е. / = L + S). Абсолютная величина мультиплетного расщепления пропор- пропорциональна Z2 и быстро увеличивается по мере перехода к тя- тяжелым атомам. Таким образом, для полного описания состояния атома не- необходимо указать состояния отдельных электронов, а также числа S, L и /. Часто бывает важно знать полное число возможных состоя- состояний атома, если заданы квантовые числа п и / каждого элек- электрона. Для этой цели вначале удобно ввести понятие эквивалент- эквивалентных электронов, которое было впервые введено Паули. Эквивалентными электронами называются такие электроны, которые имеют одинаковые квантовые числа ми/. В случае, если электроны не эквивалентны, подсчет возмож- возможных термов чрезвычайно прост. Рассмотрим в качестве примера два электрона, находящихся в состоянии с м = 3, 1 = 2 и я = 2, 1=1. На основании пра- правила сложения моментов орбитальный момент этой системы может принимать значения L = 1, 2, 3, а полный спин системы — два значения 5 = 0, 1. Таким образом, мы имеем термы 1Р\ ЪР\ lD; SD; lF; ZF. Если электроны эквивалентны, то при подсчете возможных термов следует учитывать принцип Паули, и это несколько усложняет расчеты. Рассмотрим вначале следующий простой пример. Пусть два электрона находятся в состоянии П{ = п2 и 1\ = 0, U — 0. В этом случае проекции моментов на ось также равны нулю, т. е. т\ = 0, т,2 = 0. В соответствии
294 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX. с принципом Паули, s2l и s22 должны иметь разные знаки. Сле- Следовательно, можем иметь, например, sZi = у» sz2=—«Г- ^ со~ ответствии с принципом тождественности s = — -~", s = тг представляет то же самое состояние. Состояния sz==y и S22 = * запРе1Чены принципом Паули- Поэтому может реализоваться только терм lS. Терм 35 является запрещенным. Этот расчет показывает, что у Не, а также Ве„ Mg и Са и других аналогичных элементов не может быть ос- основного триплетного уровня. Мы заметим здесь, что исторически Паули пришел к своему принципу запрета, исследуя атомные спектры. Принцип запрета возник в результате необходимости: объяснить отсутствие ряда термов. Для дальнейшего нам потребуется еще один пример. Пусть система из двух электронов имеет следующие квантовые числа Ш = я2; l\ = h = 1. В этом случае каждый электрон может на- находиться в следующих состояниях: 1) m=i, 52 = у; 2) m = 0, sz = ±\ 3) m=-l, s2 = ^ 4)m=+l,52=-~; 5)m = 0, sz= ~\ 6) m= -1, s2= -\. При подсчете возможных состояний всей системы следует ком- комбинировать друг с другом только различные состояния отдель- отдельных электронов. Это нужно делать для того, чтобы не нару- нарушить принцип Паули. В соответствии с правилом сложения мо- моментов получаем следующие возможные состояния с Мг =* 1) М2 = 2, S2 = 0; 2) М2=1, S2=l; 3) M2=l, S2 = 0; 7) M2=l, S2 = 0; 8) M2 = 0, S2 = 0. Здесь не выписаны аналогичные состояния, имеющие отрица- отрицательные значения проекций Mz. При анализе результатов следует начинать с состояния с наибольшей проекцией Mz. В данном случае имеем состояние с Мг = 2, Sz = 0. Отсюда мы заключаем, что должен иметься !Z) терм (которому отвечают также состояния с Mz = 1, Sz = 0; Mz = 0, Sz = 0). После исключения из таблицы указанных состояний, идущих: под номерами 1, 3, 4, опять выбираем состояние с наибольшей проекцией Мг. В данном случае Mz = 1, S2= 1. Этому состоя- состоянию соответствует терм 3Р (которому отвечают также состояния,,
S 72] КВАНТОВЫЕ ЧИСЛА 295 отмеченные номерами 2, 6, 3, 4). Наконец, в таблице остается только состояние Mz = О, Sz = 0, соответствующее терму lS. Таким образом, мы видим, что система из двух эквивалент- эквивалентных электронов с 1\ = 1, /2 = 1 может находиться в состояниях lD, ZP и lS. При подсчете состояний в более сложных случаях следует поступать аналогично. Обсудим теперь общие закономерности расположения уров- уровней энергий атома. Если электроны находятся в состоянии с определенными числами п и I (говорят, что в таких случаях задана электронная конфигурация.), то такому распределению может соответствовать несколько различных энергетических уровней, различающихся как полным орбитальным моментом, так и полным спином системы. С учетом мультиплетного расщепления состояние атома ока- оказывается зависящим от величин /, L и S. Состояние атома как целого, именуемое атомным термом, определяется этими величинами. Символ терма представляют в виде 2s+lLj. Например, нормальный терм атома азота C 3 \ L = 0, S=-^y J^y) записывают как 4S3/2. Порядок расположения уровней при дайной электронной конфигурации был установлен из расчетов, проведенных по ме- методу Хартри — Фока (хотя исторически он был установлен зна- значительно раньше Хундом). Оказалось, что из всех термов данной конфигурации наи- наименьшей энергией обладает терм с наибольшим значением полного спина 5. При данном S наименьшую энергию имеет терм с наиболь- наибольшим значением L. В приведенном только что примере термов lD, lS и 3Р по- порядок расположения термов по возрастающим энергиям будет 3Р, lD и 1S. Что же касается порядка расположения уровней в пределах данного мультиплета, то оказывается, что если число эк- эквивалентных электронов в атоме или ионе меньше, чем половина от полного числа электронов, то в таком атоме мультиплеты имеют нормальную структуру. В атомах и ионах, у которых число эквивалентных электронов больше или равно половине от полного числа электронов, мультиплеты будут обращенными. Например, у атома кислорода из восьми атомов четыре находятся в 2р-со- •стоянии (структура 2р4) и являются эквивалентными. Поэтому у атома кислорода мультиплеты являются обращенными. У иона кислорода О"" имеется два электрона в 2р-состоянии (конфи- (конфигурация 2р2) и мультиплеты имеют нормальную структуру. Перейдем теперь к другому примеру. В атоме кислорода электроны находятся в состоянии 2рА. В соответствии со сфор- сформулированным правилом, спектр обращенный. У дважды
296 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ (ГЛ. IX ионизованного кислорода электронная структура имеет вид 2р2. В этом случае имеем нормальную структуру мультиплетов. Введем теперь понятие оболочки атома. Под оболочкой мы будем понимать совокупность всех электронных состояний с за- заданным значением квантовых чисел пи/. Если все состояния с квантовыми числами пи/ заняты, то соответствующая обо- оболочка заполнена. Известно, что при заданном п и / имеется всего B/+1) различных состояний, различающихся квантовы- квантовыми числами т. Если учесть также спин, то полное число элек- электронов, необходимое для того, чтобы заполнить оболочку, будет равно 2B/+ 1). Если оболочка заполнена, то полный спин си- системы, а также проекции орбитального момента должны рав- равняться нулю. В этом случае S = О, L = О, / = 0. Это можно показать, учитывая принцип Паули и помня, что в целиком за- заполненной оболочке заняты все возможные состояния как с по- положительными, так и отрицательными проекциями момента на ось z. Заполненной оболочке отвечает терм xSq. Подчеркнем, что наши предыдущие рассмотрения базирова- базировались на предположении, что орбитальные моменты электронов складывались в полный орбитальный момент системы, а спино- спиновые моменты электронов складывались в полный спиновый мо- момент системы. Такое предположение соответствует утвержде- утверждению, что взаимодействие между спином и орбитальным движе- движением электронов значительно слабее, чем взаимодействие меж- между спинами. При этом можно говорить о приближенном сохра- сохранении полного орбитального момента и полного спина системы. Такой вид взаимодействия носит название нормальной, L — Sr или рассел-саундеровской связи. На основе предположения о нормальном типе связи оказывается возможным провести си- систематику низших уровней энергии большинства атомов. Откло- Отклонения от нормального типа связи наблюдаются в седьмой и восьмой группах периодической системы элементов. Принципиально возможен также другой предельный вид связи, обычно именуемый / — / типом связи. При / — /-связи орбитальный момент и спиновый момент каждого электрона складываются в полный момент / отдельного электрона (орби- (орбитальный момент отдельного электрона в этом случае не сохра- сохраняется). В свою очередь полные моменты отдельных электронов складываются в полный момент атома /. В чистом виде такая связь в атомах не встречается. Приведем несколько примеров различных модификаций основных видов связи в атомах. Если один электрон находится в сильно возбужденном состоянии и, следовательно, расположен достаточно далеко от ядра и остальных электронов атома, то поведение такого электрона можно считать независимым от атомного остатка. В этом случае полный момент отдельного
$ 73] ПЕРИОДИЧЕСКАЯ СИСТЕМА ЭЛЕМЕНТОВ 297 электрона можно считать сохраняющимся независимо от пол- полного момента атомного остатка. Рассмотрим другой пример. При достаточно большом за- заряде Z атома внутренние электроны находятся под сильным влиянием заряда ядра и относительно слабо взаимодействуют с периферийными атомными электронами. Отсюда видно, что приближенно внутренние электроны можно считать не взаимо- взаимодействующими (полный момент такого электрона сохраняется). В этом случае можно говорить о / — /-связи. Заметим, что та- такие электроны следует характеризовать не квантовыми чис- числами п и /, а квантовыми числами п и /. Для дальнейшего покажем, что электрический дипольный момент атома N d e S I *Л I ¦ (ги г2, ..., ги ..., гп) |2 dVxdV2 ... dVn, G2,1) находящегося в стационарном состоянии с определенной четно- четностью равен нулю. Действительно, так как оператор четности коммутирует с гамильтонианом, то волновая функция \|) яв- является собственной функцией оператора четности. Иными сло- словами, она удовлетворяет соотношению ${rlfr2, ..., rn)=~i|)(-r1, -r2, ..., -гя) или r2, ..., rn) = ${-ru -r2, ..., -гл). В обоих случаях функция |<ф|2 является четной функцией. Оче- Очевидно теперь, что подынтегральная функция в G2,1) нечетна и, следовательно, дипольный момент атома равен нулю. § 73. Периодическая система элементов Одним из наиболее эффективных результатов, полученных с помощью квантовой теории, явилось в свое время теоретиче- теоретическое построение периодической системы элементов Менделеева, выполненное Бором в 1922 г. В основу построения периодической системы элементов по- положены три допущения: 1) структура атомов определяется атомным номером Z (за- (зарядом ядра). Изотопы данного элемента обладают одинаковой структурой; 2) по мере возрастания атомного номера и увеличения числа электронов в атоме электроны заполняют состояния с наимень- наименьшей возможной энергией;
298 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX: 3) заполнение энергетических состояний ограничено принци- пом Паули. В предыдущем параграфе мы ввели понятия оболочки атома, т. е. число состояний электрона в атоме с данными значениями главного и орбитального квантовых чисел п и I при произволь- произвольных значениях квантовых чисел т и sz. Именно, число электронов в оболочке оказалось равным 2B/+ 1). Поскольку энергия электрона в атоме зависит только от квантовых чисел п и / все 2B/ + 1) электрона в данной обо- оболочке имеют одну и ту же энергию (если отвлечься от спин- орбитального взаимодействия, которое обычно оказывается до- достаточно слабым). Совокупность оболочек с фиксированным главным квантовым числом п называется группой или слоем. Число электронов, за* полняющих слой, равно п-\ Каждый слой обозначается буквами, заимствованными из клас~ сификации, принятой в рентгеновской спектроскопии. Именно,, приняты обозначения: п 12 3 4 5 Символ слоя К L М N О Возможное число электронов в слое 2 8 18 32 50 В отличие от водородного атома в других атомных систе- системах, энергия состояний определяется как главным квантовым числом п, так и орбитальным числом /. Зависимость энергии от п является, вообще говоря, более резкой, чем от /. Это зна- значит, что состояния с данным значением п при всех значениях I лежат ниже, чем состояния с квантовым числом (п + 1). По* следовательность энергетических состояний имеет вид 15, 25, 2р, 35, 3/7, ... Однако при переходе к d- и особенно к /-состояниям ситуа- ция изменяется. При больших значениях момента зависимость энергии от орбитального квантового числа / оказывается суще- существенной. Эффективная потенциальная энергия электронов слагается из энергии в кулоновском поле ядра, экранированного электро- электронами, и центробежной энергии. Экранированный потенциал ядра убывает на больших расстояниях существенно быстрее*
<§ 73] ПЕРИОДИЧЕСКАЯ СИСТЕМА ЭЛЕМЕНТОВ 299 чем по закону Кулона, и даже быстрее, чем центробежный потенциал. Сравнение полной эффективной энергии электронов с ма- малым I (s- и р-состояния) и большим моментом {й- и /-состоя- /-состояния) показывает, что между ними имеется существенное раз- различие. Именно, кривая C/eff для / = 2 и 3 проходит левее, чем у состояний с / = 0 и 1. Благодаря этому минимум энергии d- и /-состояний лежит •ближе к ядру, чем 5- и р-состояний. Это означает, что в сред- среднем d- и особенно /-электроны движутся ближе к ядру, в бо- более глубоких частях оболочки, чем s- и р-электроны. Часто d- и /-электроны называют проникающими. Это общее свойство состояний с большими моментами приводит к тому, что З^-электроны движутся в среднем ближе к ядру, чем 4s- электроны. С другой стороны, энергия в экранированном поле растет с ростом момента. Опыт и расчеты по методу Хартри — Фока показывают, что энергия 4$-состояния лежит ниже энергии Зй-состояния. Поэтому порядок заполнения состояний, лежащих за Зр, оказывается таким: 45, 3d, 4р, 5s, 4d, 5p, 6s, 4/, 5d, 6p, 7s, 5/. Элементы, в которых заполняются 3d и особенно 4/ и 5/-обо- лочки, обладают особыми свойствами. Поскольку движение в состояниях с большими моментами в некулоновском поле про- происходит ближе к ядру, добавление электронов в d- и особенно в /-оболочку не изменяет те свойства атомов, которые зависят от периферических электронов. Разберем более подробно порядок заполнения состояний. Это позволит выяснить, какие свойства атомов должны обнару- обнаруживать периодический, а какие монотонный ход с увеличением .атомного номера Z. Первым элементом периодической системы является водо- водород. Его нормальный терм 2Sy2. У следующего элемента — гелия, имеющего два электрона, заполняется /(-слой. Легко найти, что в соответствии с прави- правилами, разобранными в предыдущем параграфе, нормальный терм гелия lSo. У следующего элемента, лития, начинается застройка L-слоя. Третий электрон лития попадает в 2$-состояние. При расчете нормального терма можно не учитывать элек- электронов заполненного слоя: их спиновый, орбитальный и полный моменты равны нулю. Основной терм лития определяется единственным электро- электроном L-слоя. Литий находится в состоянии 2Si/2.
300 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX У бериллия четвертый электрон заполняет 25-оболочку. Основной терм бериллия, как и у гелия, lS0. Пятый электрон бора попадает в 2р-состояние. Таким обра- образом, у атома бора имеется следующее распределение электро- электронов по состояниям: Is2, 2s2, 2р. Поскольку оболочки Is и 2s заполнены, легко найти основной терм атома бора. Он бу- будет 2Pi/2. В случае углерода шесть электронов распределены по со- состояниям так: Is2, 2s2, 2р2. Для того чтобы определить основной терм углерода, обратимся к разобранному в § 72 примеру опре- определения термов для двух эквивалентных р-электронов. Исполь- Используя правило Хунда, мы видим, что основным термом углерода будет гР, В этом случае атом содержит менее половины всех возможных эквивалентных р-электронов. Поэтому мультиплет- ная структура нижнего уровня будет соответствовать минималь- минимальному /, в данном случае / = 0. Таким образом, окончательно, для основного терма имеем выражение zPq. Дальнейший порядок заполнения термов нормальных состоя- состояний показан в таблице. Мы видим, что у неона застраивается L-слой и он, подобно гелию, не содержит электронов в незапол- незаполненных слоях и оболочках. Заполненные слои естественно отождествить с периодами системы элементов Менделеева. Каждый период начинает за- заполняться одним электроном в s-состоянии и заканчивается, когда образуется заполненный слой. Первый период периодической системы элементов содержит элементы, у которых заполняется /(-слой. В него входят два элемента (/г = 1, / = 0). Во второй период входят элементы с заполняющимся L-слоем. Он содержит 8 элементов {п = 2, / = 0, 1) от лития до неона. От натрия и до аргона заполняются 3s- и Зр-состояния Л4-слоя. При этом образуются периоды в периодической системе Менделеева, заканчивающиеся благород- благородными газами Не, Ne, Ar. В следующем периоде, начинающимся с калия и оканчивающимся криптоном, имеется отступление от простых правил последовательного заполнения. Именно, как мы видели в § 71, у элемента с Z = 21 должны возникать электроны с моментом / = 2, т. е. в ^-состоянии. Поэтому у Sc прибавляю-* щийся в двадцать первый электрон попадает не в 4р-, a 3d-co- стояние, застройка которого происходит от Sc до Ni. Интересно отметить, что у Сг тенденция к заполнению 3^-состояния так сильна, что один из электронов 4s- переходит в З^-состояние. После Ni вновь начинается заполнение 4s- и 4р-состояний. Чет» вертый период системы элементов заканчивается на криптоне. После криптона идет дальнейшая простая застройка ЛЛслоя, т. е. пятого периода, содержащего 18 элементов вплоть до Хе.
f 73] ПЕРИОДИЧЕСКАЯ СИСТЕМА ЭЛЕМЕНТОВ 301 Распределение ; Элемент Н 1 Не 2 Li 3 Be 4 В 5 С 6 N 7 О 8 F 9 Ne 10 Na 11 Mg 12 Al 13 Si 14 P 15 S 16 Ci 17 Ar 18 К 19 Ca 20 Sc 21 Ti 22 V 23 Cr 24 Mn 25 Fe 26 Co 27 Ni 28 Cu 29 Zn 30 Ga 31 Ge 32 As 33 Se 34 Br 35 Kr 36 К Is 1 2 2 2 2 2 2 2 2 2 2s - 1 2 2 2 2 2 2 2 электронов - - 1 2 3 4 5 6 Конфигурация неона Конфигурация в периодической м 3s - — — — - 1 2 2 2 2 2 2 2 Зр - — — — - — 1 2 3 4 5 6 аргона 3d - •- _ — — — — - — 1 2 3 5 5 6 7 8 10 10 10 10 10 10 10 10 4s _ - — — — - — — — — - 1 2 2 2 2 1 2 2 2 2 1 2 2 2 2 2 2 2 системе элементов 4р - - — — - — - — — — - — — 1 2 3 4 5 6 Основной терм 'So 2Ч 'So Зя2 JS0 *-А 'So VV, 3^о 4Ч 3^2 V% 'So 2S'/S 'So 2% Vi 'Ъ, 7s3 24 'So V* 8^o 4\ 24 'So Иониза- Ионизационный потенциал (в электрон- вольтах) 13,595 24,58 5,39 9,32 8,30 11,26 14,53 13,61 17,42 21,56 5,14 7,64 5,98 8,15 10,48 10,36 13,01 15,76 4,34 6,11 6,54 6,82 6,74 6,76 7,43 7,90 7,86 7,63 7,72 9,39 6,00 7,88 9,81 9,75 11,84 14,00
302 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX Продолжение Элемент Rb 37 Sr 38 Y 39 Zr 40 Nb 41 Mo 42 Tc 43 Ru 44 Rh 45 Pd 46 Ag 47 Cd 48 In 49 Sn 50 Sb 51 Те 52 J 53 Xe 54 Cs 55 Ba 56 La 57 Ce 58 Pr 59 Nd 60 Pm 61 Sm 62 Eu 63 Gd 64 Tb 65 Dy 66 Ho 67 Er 68 Tu 69 Yb 70 Lu 71 Конфигура- Конфигурация внутрен- внутренних слоев Конфигу- криптона N Ы _ 1 2 4 5 5 7 8 10 Конфигурация палладия Слои от Is до 4d содержат 46 элек- электронов _ — em — — __. 2 3 4 5 6 7 7 8 10 11 12 13 14 14 0 5s 1 2 2 2 1 1 2 1 1 — 1 2 2 2 2 2 2 2 ЬР — — — — 1 2 3 4 5 6 Слои 5s и Ър содержат 8 электронов 5d — — - — — — — 1 — 1 1 — — 1 Р 6s _ — — — — — — 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Основ- Основной терм гЧ *%, If;' :?{ 'So' *s1& 'So' 2 p з p 2 p 'So' ;s02 «я2 ?; Иониза- Ионизационный потенциал (в электрон- вольтах) 4,19 5,69 6,38 6,84 6,88 7,10 7,28 7,36 7,46 8,33 7r57 8.99 5,78 7,34 8,64 9,01 10,45 12,13 3,89 5,21 5,61 6,91 5,76 6,31 6,30 5,10 5,67 11,40 6,74 6,82 6,90 6,90 6,90 6,20 5,00
§73] ПЕРИОДИЧЕСКАЯ СИСТЕМА ЭЛЕМЕНТОВ 303 Продолжение Элемент Nf 72 Та 73 W 74 Re 75 Os 76 Ir 77 Pt 78 Au 79 Hg 80 Tl 81 Pb 82 Bi 83 Po 84 At 85 Rn 86 Fr 87 Ra 88 Ac 89 Th 90 Pa 91 U 92 Np 93 Pu 94 Am 95 Cm 96 Bk 97 Cf 98 Es 99 Fm 100 Md 101 No 102 Lw 103 Ku 104 Конфигура- Конфигурация внутрен- внутренних слоев Слои от Is до Ър содер- содержат 68 элек- электронов О ы 2 3 4 5 6 7 9 Слои от Is до Ы содержат 78 элек- электронов Слои от Is до Ы содержат 78 элек- электронов - - 2 3 4 6 7 7 8 10 11 12 13 14 14 14 Р 6s 2 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 6р — 1 2 3 4 5 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 — - 1 2 1 1 1 1 1 1 2 в 7s — 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Основ- Основной терм *Ч Is» 'So* Иониза- Ионизационный потенциал (в электрон- вольтах) 7,00 7,88 7,98 7,87 8,70 9,00 9,00 9,22 10,44 6,11 7,42 7,29 8,43 9,40 10,75 4,00 5,28 5,5 5,7 5,7 4,0
304 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX В следующем, шестом периоде, содержащем 32 элемента, про- происходит заполнение 6s-, 4/-, 6/?-состояний. Здесь вновь имеют место более сложный порядок заполнения. У Се (Z = 58) элек- электроны начинают заполнение 4/-состояния. Напомним, что со- согласно расчету в приближении Томаса — Ферми электроны с / = 3 должны появляться начиная с элемента Z = 55. Застройка седьмого периода у элементов, существующих в естественном состоянии, остается незавершенной. Начиная с Ра, происходит заполнение глубокого 5/-состояния. До на- настоящего времени искусственно созданы элементы от Np до Ки. Во всех этих элементах, именуемых актинидами, происходит заполнение 5[-состояния. По мере увеличения атомного номера Z все свойства атомов, определяющиеся внутренними электронами, обнаруживают мо- монотонные изменения. В виде примера можно указать характе- характеристические рентгеновские спектры. Характеристическое рент- рентгеновское излучение возникает при заполнении вакантного ме- места в одной из внутренних оболочек. Рентгеновский спектр имеет, очевидно, характер, сходный с водородным, но с постоян- постоянной Ридберга, умноженной на Z2. Частота испускаемых линий растет пропорционально Z2 (закон Мозли). Напротив, все свойства атомов, определяемые перифериче- периферическими электронами, с ростом Z имеют периодический ход. К ним принадлежит, например, ионизационный потенциал атома (см. табл.). Ионизационный потенциал имеет наименьшее значение у первого элемента периода и достигает наибольшего значения у последнего элемента. Другим свойством, обнаруживающим периодичность, яв- является атомный объем. Наибольшим объемом обладают атомы щелочных металлов, у которых имеется один электрон за пре- пределами заполненного слоя. С точки зрения химии наиболее важной характеристикой атома является его валентность. В химической связи участвуют только непарные электроны. Электроны, находящиеся в запол- заполненных состояниях и имеющие суммарный спин, равный нулю, в химическом взаимодействии не участвуют. Отсюда следует, что химическое взаимодействие и его каче- качественная характеристика — валентность — определяются исклю- исключительно числом неспаренных электронов, находящихся в неза- незаполненных состояниях. Числовое значение валентности атома в данном состоянии равно г = 2S, где S — спин атома в этом состоянии. Мы особенно подчеркиваем, что валентность атома связана с его состоянием по той причине, что атом, переходя из одного состояния" в другое, может изменять свою валентность.
§ 73] ПЕРИОДИЧЕСКАЯ СИСТЕМА ЭЛЕМЕНТОВ 305 В § 79 мы обсудим этот вопрос несколько подробнее, здесь же мы ограничимся одним замечанием: если первый возбужден- возбужденный терм лежит близко к основному, атом может вступать в хи- химическую связь в возбужденном состоянии. Из сказанного вы- вытекает, что элементы первой группы периодической системы, с которых начинаются все 7 периодов, находящиеся в ?St/2 со- состоянии, имеют валентность г = 1. Элементы второй группы, находящиеся в lS0 состоянии, имеют нулевую валентность. Они были бы химически неактив- неактивны, если бы у них близко к основному состоянию не был рас- расположен возбужденный терм. В возбужденном состоянии два внешних электрона имеют конфигурацию s и р, так что атом имеет полный спин 1 и валентность г = 2. У атомов третьей группы вне заполненных оболочек имеется три электрона. Их конфигурация s2p отвечает суммарному спину S = -<r и валент- валентности единица. Однако эти атомы с малой энергией возбужде- возбуждения могут переходить в состояние с конфигурацией sp2 и спином 5 = -у • В возбужденном состоянии их валентность г = 3. Эле- Элементы первых трех групп в химическом отношении являются металлами. Как известно, с химической точки зрения металлы характеризуются способностью отдавать электроны, вступая в химические соединения ионного типа. Элементы четвертой группы вступают в химическую связь в нормальном и возбужденном состояниях с конфигурациями s2p2 и sp3. Соответствующие значения спина и валентности рав- равны соответственно S = 1,г = 2и S = 2, г = 4. Возбужденное состояние отвечает конфигурации s2p2s и пе- переходу пятого электрона в s-состояние следующего слоя (т. е. переход с увеличением главного квантового числа на единицу). Спин и валентность в возбужденном состоянии равны соответ- соответственно S =у и г = 5. В шестой группе атомы находятся в нормальном состоянии с конфигурацией s2pA со спином 5 = 1. Их валентность г = 2. При возбуждении один из электронов переходит из р-состояния в s-состояние следующего слоя. В этом возбужденном состоя- состоянии г = 4. Наряду с этим типом возбуждения часто реализуются воз- возбуждения с переходом двух электронов в следующий слой, од- одного из s-, а второго из р-состояния. В этом возбужденном со- состоянии атом шестивалентен. У атомов седьмой группы нормальная конфигурация есть s2pb. Спин 5 = -д- и валентность г=1. Однако возможны
306 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX переходы одного, двух и трех электронов в следующий слой. Поэтому реализуются также валентности г = 3, г = 5 и г = 7. Элементы четвертой, пятой, шестой и седьмой групп, стоя- стоящие в начале группы, являются неметаллами. В соединениях ионного типа они приобретают электроны (являются окислителя- окислителями), имея тенденцию к образованию заполненного состояния.* Особыми химическими свойствами обладают элементы про- промежуточных групп — железа, палладия и платины, а также лантаниды (редкие земли) и актиниды. В атомах группы железа, лантанидов и актинидов происхо- происходит достройка глубоких d- и /-состояний, d- и /-электроны не участвуют обычно в валентных связях и валентность атомов определяется электронами внешних состояний. Однако это от- отнюдь не строгий закон, так как в некоторых случаях при образо- образовании химических соединений электроны из глубоких состояний переходят во внешние и начинают участвовать в валентности. Особенно отчетливо это проявляется у некоторых актинидов. Поэтому химические свойства элементов с особыми свойствами групп довольно сложны. Мы видим, таким образом, что возможно не только теоре- теоретическое обоснование расположения атомов в периодической системе элементов, но также и сравнительно детальное пред- предсказание их химических свойств. § 74. Эффект Зеемана Мы видели в § 31 ч. I, что полная теория эффекта Зеемана не могла быть построена на основе классической электродина- электродинамики. Анализируя обширный опытный материал, Ланде пра- правильно подобрал величину, количественно определяющую ха- характеристики эффекта Зеемана. Эта величина в настоящее время называется множителем Ланде. Квантовая теория эффекта Зеемана позволяет без каких- либо новых допущений найти значение множителя Ланде и ха- характер зеемановского расщепления. Рассмотрим, как изменяется положение уровней энергии атома, если его поместить во внеш- внешнее магнитное поле, постоянное во времени. Волновую функ- функцию г|) для стационарных состояний атома, как обычно, можно написать в виде G41) При подстановке G4,1) в уравнение Паули F3,11) последнее преобразуется к виду ^2^ = ^' <74>2>
$ 74] ЭФФЕКТ ЗЕЕМАНА 307 где U учитывает взаимодействие электронов между собой и электронов с ядрами. Предположим, что напряженность внеш- внешнего магнитного поля достаточно мала, так что в G4,2) можно опустить слагаемое, содержащее квадрат поля. Введем величину Н\ равную где / — оператор полного момента, Н' является малым возму- возмущением, действующим на атом. Гамильтониан Н тогда можно записать в виде f+tf. G4,4) В невозмущенном состоянии атом характеризуется опреде- определенным полным моментом системы / и определенной проекцией полного момента М2 на ось г. Очевидно, следует применить тео- теорию возмущений для вырожденных состояний. Действительно, энергия невозмущенного состояния не зависит от величины про- проекции полного момента Mz на ось z. Так как оператор возмуще- возмущения представляет собой проекцию некоторого вектора на ось z и приводится к диагональному виду одновременно с оператором проекции полного момента на эту же ось, то следует вычислить лишь диагональные элементы от оператора возмущений Диагональный матричный элемент берется по квантовым числам полного момента / и проекции момента MZ = M количе- количества движения на ось z. Диагональный матричный элемент оператора Tz равен Следовательно, нам надо определить выражение Обычно значение 5г находят из наглядных, но не вполне стро- строгих соображений, связанных с прецессией вектора S относитель- относительно вектора J1). Мы приведем более строгое, но громоздкое вы- вычисление матричного элемента. Оно может служить хорошим примером практического использования матричного метода. 1) См. Л. Д. Ландау и Е. М. Л и ф ш и ц, Квантовая механика, Физ- матгиз, 1963, стр. 497.
308 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX Заметим вначале, что в соответствии с определением опера- оператор / равен J = L + S. Операторы L и S коммутируют между собой, так как они действуют на разные переменные. Зная правила коммутации Lx, Lyj Lz\ SXJ Sy, SZi легко най- найдем следующие соотношения: {/*, Sx] = 0, {Jx, Sy} = ihSz, {JXi S2} = -ibSy. Другие правила коммутаций могут быть получены циклической перестановкой. Тогда получаем {Ту, Sy) = 0, От Sz) = ib$x, Qy> Sx) {/„ 5J = 0, {Jz,Sy}=-ihSX9 Qz,Sx} Из этих правил вытекает соотношение (/* + U у) (Sx + iSy) - (Sx + iSy) (Jx + U y) = 0. G4,8) Вычислим следующий матричный элемент от правой и левой частей найденного соотношения: у) (§х + isy\M+iiJtM^ = [(sx + rsy) (?x+uy\ M+u A M_r В соответствии с формулой E1,14) матричный элемент от оператора Jx + tJy отличен от нуля только в случае перехода /, М —» /, М — 1. Поэтому (Jx + iJyU; /Af-i = Ъ Y(j + M)(J-M+l). G4,9) Тогда, пользуясь правилом умножения для матриц D5,6), по- получаем - (Sx + iSy)M+UM(Jx + Uy)mM_x = 0. G4,10) В этих формулах мы всюду опустили индекс /. Пользуясь соот- соотношением G4,9), находим Аналогично можно получить )M+2M+\ = я ) Отсюда мы видим, что величина А не зависит от М, следова- следовательно, имеем -М+1). G4,11)
74] ЭФФЕКТ ЗЕЕМАНА Матричные элементы от нужного нам оператора S2, можно най- найти, используя следующую формулу: y yy-2bS,. G4,12) диагональный матричный элемент им в результате: {Jx — Uy)M;M+l Вычисляя диагональный матричный элемент от соотношения G4,12), получим в результате: — (Sx + iSy)M\M-\ (Jx — Ну)м-им = — 2fi (Sz)m- m . Используя G4,11), а также зная, что (h - Ну)мхм+1 = b VV + M+IW-M), легко определить диагональный элемент (Sz)m-,m, который равен -2(Sz)M;m = (J+M+1)(J-M)A-(J+M)(J-M+1)A=-2AM, \ (SZ)M;M = AM. J G4,13) Перейдем теперь к нахождению величины Л. Из соотношения Р = (L + Sf = V + 2 (LS) + S2 = I2 + 2 (/S) - S2 немедленно следует 2 Для рассел-саундеровского типа связи диагональный матрич- матричный элемент от скалярного произведения (JS) равен ; /Af С другой стороны, матричный элемент может быть найден, если скалярное выражение (JS) преобразовать к виду (fS)j = ±(SX + iSy) (Гх - //,) + у (§х - iSy) (Jx + U y) + /Д. G4,15)' Найдем диагональный матричный элемент от правой и ле- левой частей соотношения G4,15), тогда имеем: ± G4,16) Нам нужно найти теперь матричный элемент (Sx — iSy)M.M+l. Это легко сделать с помощью соотношения G4,11). Заметим
310 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX предварительно, что константа А действительна. Это видно из формулы G4,13), в которой все величины, определяющие вели- величину Л, действительны. Выполнив комплексное сопряжение правой и левой частей соотношения получим (SXYM+UM-1($,)м+им = Используя эрмитовость операторов, находим = (Sx - iSy)M. M+1 = A V(J + M+l)(J-M). G4,17) Подставляя в соотношение G4,16) значения (JS)m,m и (Sx + iSy)M;M-\ в соответствии с формулами G4,14) и G4,11), а также используя G4,17) и G4,13), находим величину А: Используя найденное значение для Л, а также^формулу G4,13), получаем диагональный матричный элемент (Sz)jm,jm> который имеет вид * V74»1У) Поправка к уровням энергии атома, обусловленная магнитным полем Ж, дается выражением кр_ \е\ЖЬМ Л /(/+1) + S(S+1)-L(L+1) \_ \е\ЖМ Д/:"" 2тс I1 + 2/(/+1) /~ 2тс S' G4,20) Множитель g называется множителем Ланде. Для синглетных уровней / = L, S = 0 имеем: Прежде чем перейти к обсуждению формул G4,20) и G4,21), установим границы применимости рассмотренного вы- вывода. Невозмущенное уравнение Паули
§75] ЭФФЕКТ ПАШЕНА-БАКА И ДИАМАГНЕТИЗМ АТОМОВ 311 определяет уровни энергии атома, включая также его мульти- плетную структуру. Таким образом, чтобы изложенная выше теория возмущении была применима, необходимо, чтобы матрич- матричный элемент от возмущения G4,3) был меньше, чем расстояние между уровнями соответствующей тонкой структуры атома. Также следует указать, что при расчетах предполагалось, что в атоме осуществляется рассел-саундеровский тип связи (т. е. что во времени сохраняется как величина /, так и L и S). Перейдем теперь к обсуждению полученных формул, опре- определяющих эффект Зеемана. Из формулы G4,20) видно, что каж- каждая компонента мультиплета расщепляется на 2/ + 1 уровней. Действительно, при заданном / проекция полного момента М может принимать 2/ + 1 различных значений. В соответствии со сказанным в § 54 возмущение, имеющее симметрию, отличную от невозмущенного гамильтониана, снимает вырождение. Отно- Относительно расположения вновь возникших термов можно сказать следующее. Если / — целое число, то на месте расщепившегося уровня в магнитном поле возникает уровень, соответствующий значе- значению М = 0. Оставшиеся 2/ уровней располагаются по / уровней вверху и / уровней внизу на равных расстояниях от основной линии с М = 0. Если / — полуцелое, то уровни также распола- располагаются симметрично относительно старого положения подверг-» шегося расщеплению уровня, причем ближайшие уровни распо- расположены от первоначального положения на расстоянии Атс 6 * Заметим еще, что если осуществляется / — /-связь, то харак- характер эффекта Зеемана сильно меняется. Эта связь встречается в чистое виде редко, и мы не будем проводить здесь соответ- соответствующие расчеты. § 75. Эффект Пашена —Бака и диамагнетизм атомов В сильных магнитных полях характер эффекта Зеемана из- изменяется. Именно, при возрастании напряженности магнитного поля расстояние между мультиплетами увеличивается. В очень сильных полях расщепление уровня так велико, что расстояния между компонентами возникшего в поле мультиплета оказы- оказываются большими по сравнению с расстояниями между компо- компонентами естественной мультиплетной структуры. Напомним, что последняя возникает вследствие спин-орбитального взаимодей- взаимодействия. В этом случае формула G4,20) уже более неприменима, а характер спектра изменяется. Это изменение спектра в силь- сильном магнитном поле носит название эффекта Пашена — Бака,
312 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX Мы проведем расчет в том случае, когда расщепление, обу- обусловленное магнитным полем, велико по сравнению с расстоя- расстоянием между уровнями естественного мультиплета. Это означает, что приобретаемая в магнитном поле энергия велика по срав- сравнению со спин-орбитальным взаимодействием. Тогда в невозму- невозмущенный гамильтониан Но в формуле G4,4) можно не включать член, учитывающий спин-орбитальное взаимодействие. Поэтому невозмущенные состояния атомов можно характеризовать как полным моментом /, так и проекциями орбитального момента Lz и спинового момента Sz на ось z. Оператор возмущения по-прежнему имеет вид #' = Щт" (? + S2) Ж = -$- (Lz + 2SZ) Ж. G5,1) Поправка к энергии равна среднему значению оператора #' по состояниям с определенными проекциями орбитального и спи- спинового моментов, т. е. •Формула G5,2) определяет тонкую структуру спектра в силь- сильных магнитных полях. Рассмотрим теперь влияние отброшенного квадратичного по магнитному полю члена в формуле G4,2). Учет этой величины особенно существен для термов с L ==¦ S =¦ 0. В этом случае рас- расщепления уровней за счет линейного члена по Ж не происходит. Это можно заметить из общей формулы G4,20). В этом случае поправкой, обусловленной квадратичным членом, пренебрегать нельзя. За оператор возмущения, в соответствии с формулой G4,2), следует взять Суммирование по i соответствует суммированию по всем элек- электронам атома. Поправка к уровням энергии, обусловленная оператором Н\ ¦опять определяется диагональным матричным элементом При вычислении [Жг]2 следует помнить, что волновая функция «системы L = 0, S = 0 сферически-симметрична, поэтому sin2e=l-cos29 = -|.
§ 76] ТЕОРИЯ ДЕЙТОНА Таким образом, для сдвига уровней получаем Так как магнитный момент атома можно вычислить с помощью- формулы М= —та- (СР- D1,1) ч. IV), то мы получаем Таким образом, атомы обладают диамагнитной восприимчи- восприимчивостью. Поскольку последняя определяется в основном средним квадратичным расстоянием всех электронов от ядра, то 2^? воз- возрастает, хотя г? с ростом Z уменьшается. Поэтому % особенна велико у многоэлектронных атомов. Для многоэлектронных ато- атомов хорошие результаты дает применение метода Томаса — Ферми. Поэтому диамагнитные восприимчивости часто рассчи- рассчитывают по этому методу. С другой стороны, измерения % представляют один из лучших способов нахождения эффективных размеров атомов. Подчерк- Подчеркнем, что все атомы и ионы имеют диамагнитную восприимчи- восприимчивость. Однако у некоторых ионов парамагнитная восприимчи- восприимчивость, связанная со спиновым магнитным моментом, превышает диамагнитную. § 76. Теория дейтона В теории ядра дейтон, состоящий из протона и нейтрона,, играет ту же роль, какую в теории атома играет водород. Ядерное взаимодействие между протоном и нейтроном может зависеть от расстояния между ними г и взаимной ориентации спинов обеих частиц 8\ и s2. Явный вид потенциальной энергии ядерного взаимодействия в настоящее время неизвестен. По- Поэтому приходится ограничиваться написанием самого общего- выражения для оператора потенциальной энергии, зависящего от г, Si и $2. Оператор взаимодействия не должен изменяться прет повороте системы координат. Кроме того, как показывает опыт, в ядерных силах имеет место закон сохранения четности (см. § 33). Это означает, что оператор взаимодействия не должен изменяться при отражении координат (оператор взаимодей- взаимодействия должен коммутировать с оператором четности). Таким образом, нам необходимо составить всевозможные скаляры из трех векторов г; Si и s2. Величинами, не меняющимися при по- повороте системы координат, являются следующие скаляры: () () И (SZr).
314 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX Произведения (^г) и (s2r) не могут входить в потенциаль- потенциальную энергию порознь, так как вектор спина является аксиальным вектором, а произведение (sr) — псевдоскаляром, изменяющим свой знак при отражении координат. Произведение far) (s2r) не изменяет знака при отражении и, следовательно, можно вхо- входить в потенциальную энергию. Спиновые операторы в высших степенях не входят в оператор энергии взаимодействия С/, так как высшие степени операторов спина с помощью формулы F0,17) сводятся к линейным комбинациям 5. Таким образом, выражение для потенциальной энергии будет иметь вид U = Uг (г) + U2 (r) (s{s2) + U3 (г) far) far), G6,1) где Uи ?^2, ^г — некоторые функции, зависящие от расстояния между частицами. Помимо оператора G6,1), представляющего потенциальную энергию обычного типа, взаимодействие между протоном и нейтроном может иметь характер обменных сил. Со- Согласно результатам § 67, последнюю можно записать с помощью оператора обмена Pi2 в виде Совм = Pi2 [Ut (r) + Ub (r) (slS2) + U6 (г) (в,г,) (ел)]. G6,2) Здесь ?Д, U* и U& — функции расстояния между частицами, не зависящие от их спинов. Для общности считается, что вид этих функций отличен от вида функций Uu U2i U3, входящих в по- потенциальную энергию обычного взаимодействия. Полная энер- энергия взаимодействия равна сумме выражений G6,1) и G6,2). Совокупность данных о стабильных состояниях дейтона, изуче- изучение рассеяния нейтронов протонами и др. не позволяют пока определить вид этих функций. Более того, нет оснований счи- считать какую-либо из этих функций малой по сравнению с дру- другими. Таким образом, даже простейшая ядерная система ока- оказывается неизмеримо более сложной, чем атомные системы. Опытные данные позволяют уже сейчас произвести класси- классификацию состояний дейтона. Гамильтониан систехмы из двух ну- нуклонов— протона и нейтрона — с написанной выше энергией взаимодействия, как легко видеть, приводит к двум законам со- сохранения: закону сохранения полного момента и закону сохра- сохранения четности. Состояния дейтона обозначаются такими же символами, как и состояния атомов. Состояния с орбитальным моментом L = О, 1, 2, ... обозначаются соответственно S, P, D и т. д. Мульти- плетность BS + 1)-терма обозначается индексом, стоящим в-ле- в-левом верхнем углу (S — полный спин дейтона). Индекс в пра- правом нижнем углу указывает полный момент / дейтона. Напри- Например, в состоянии 3Р0 полный спин равен единице, L = 1, и полный момент равен нулю.
§ 76] ТЕОРИЯ ДЕЙТОНА 315 Обсудим возможные состояния системы с учетом того, что спин нейтрона и протона равен 1/2. Формальное применение пра- правила сложения моментов приводит к следующим возможным состояниям системы: !50, 1Р„ lD2 (синглеты), 3Sb 3Р0, 3Л> 3^2, ZDU Юъ Ю3 (триплеты). S- и D-состояния являются четными, Р — нечетным состоя- состоянием. Состояний с L > 2 мы не выписываем. Какие именно из этих состояний реализуются в природе, можно установить толь- только из опытных данных. Опыт показывает, что основным со- состоянием дейтона является четное состояние с / = 1 *). Далее, пользуясь правилами сложения моментов, установим возможные состояния системы с полным моментом / = 1. Суммарный спин системы, состоящий из нейтрона и протона, может равняться нулю либо единице. Если спин равен нулю, то возможно только одно состояние L = 1, приводящее к полному моменту / = 1. При спине, равном единице, орбитальный момент может принимать три значения: L = О, 1, 2. Следовательно, всего возможны четыре состояния: lPu 3Sb 3ЯЬ ZD\\ состояния ХР\ и 3Р\ не могут реализоваться, поскольку они являются не- нечетными. Далее, легко заметить, что невозможны суперпозиции таких состояний, как ZS{ + 3Л или SS{ + {Ри так как S- и Р-состоя- ния имеют различные четности и волновая функция, отвечаю- отвечающая их суперпозиции, не является собственной функцией опера- оператора четности. Таким образом, дейтон может находиться либо в состоя- состоянии 3Sb либо в состоянии 3Db либо в состоянии, являющемся суперпозицией этих двух состояний. Состояние S сферически- симметрично. Если бы дейтон находился в этом состоянии, то его квадрупольный момент был бы равен нулю. Опыт показы- показывает, однако, что квадрупольный момент дейтона отличен от нуля, хотя и мал. Это означает, что нормальное состояние дей- дейтона представляет суперпозицию сферически-симметричного ^-состояния и асимметричного 3?>рсостояния. Зная экспериментальное значение квадрупольного момента дейтона, можно оценить вклад, который вносит 3?)гсостояние в волновую функцию дейтона. Этот вклад оказывается малым. Таким образом, можно считать, что дейтон является сферически- симметричной системой с небольшой примесью асимметрии, вно- вносимой D-состоянием. 1) См. Л. Д. Ландау и Я. А. Смородинский, Лекции по теории ядра, Гостехиздат, 1955; А. И. Ахиезер и И. Я. Померанчук, Неко- Некоторые вопросы теории ядра, Гостехиздат, 1950, §§ 2 и 5.
316 СВОЙСТВА. АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX Для дальнейших оценок рассмотрим грубую модель дейтона, в которой будем считать, что потенциальная энергия взаимодей- взаимодействия между нейтроном и протоном зависит только от расстоя- расстояния между ними. Иными словами, в формуле G6,1) оставим только первый член ?/i(r)= U(r). Асимметрией дейтона мы бу- будем при этом пренебрегать, считая, что он находится в основ- основном состоянии. Уравнение для относительного движения ней- нейтрона и протона в соответствии с формулой A4,11) можно на- написать в виде [^]>=е*о. G6,3) Приведенная масса системы в этом случае равна - = —+— V тр~тп> где тр — масса протона, тп — масса нейтрона. Так как тр ^ mn, то получаем: 1 _ 2 р. ~~ тр% Относительно потенциальной энергии U(r) мы ограничимся лишь общим допущением о ее быстром стремлении к 0 при г —* а*о, где г0 — радиус действия ядерных сил. При г < г0 конкретным видом U(г) мы задаваться не можем, так как не знаем закона взаимодействия ядерных сил. Если искать функцию -фо в виде ^, G6,4) то, используя формулу C5,16) с / = 0, мы получим уравнение для функции х (г) G6,5) При г > а*о уравнение G6,5) запишется в форме -¦?¦,&=** <76'6> Будем искать решение, убывающее на бесконечности в виде % = Се-°г. G6,7) Подставляя G6,7) в G6,6), получим соотношение для а G6,8) /тр\г\
i 76] ТЕОРИЯ ДЕЙТОНА 317 При этом для волновой функции имеем G6,9) За характеристику размеров дейтона можно выбрать вели- величину гх = —, т. е. такое расстояние, на котором волновая функ- функция % уменьшается в е раз. Расстояние г\ легко определить из соотношения G6,8), так как энергия связи дейтона хорошо из- известна из опытных данных. Она равна |е| = 2,19 Мэв. Подстав- Подставляя значение Ь и тр в формулу G6,8), получим Г\ = 4,3-10~13 см. Следовательно, волновая функция \|?о дейтона отлична от нуля в области значительно большей, чем область действия ядерных сил (г0 « 2-Ю3 см). Таким образом, мы видим, что нейтрон и протон с большой вероятностью могут быть обнаружены на та- таких расстояниях друг от друга, которые существенно превосхо- превосходят размеры области действия ядерных сил. В области /* < г0 нельзя определить зависимость волновой функции \|H от расстояния, так как потенциальная энергия в этой области неизвестна. Однако из общей теории движения в сферически-симметрич- сферически-симметричном поле следует, что при г —> 0 функция % пропорциональна rl+l (см. § 35) и, следовательно, в S-состоянии пропорциональ- на г. Таким образом, на ма- малых расстояниях функция % стремится к нулю. Постоянную С, входящую в ф-функцию, можно найти из условия нормировки. В каче- качестве волновой функции \|H при г < г0 возьмем ее значение в виде G6,9), которое будем считать справедливым во всем пространстве. При этом мы не вносим существенной ошибки, так как большая часть нормировочного интеграла относится к области г > г0. Подставляя G6,9) в условие нормировки, на- находим: /^. G6.10) Установим теперь общее соотношение между шириной ямы г0 и ее глубиной. Для этого проинтегрируем уравнение G6,5) в пре- пределах от нуля до г = г0. В результате интегрирования получим: Рис. 21. G6,11)
318 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ [ГЛ. IX Как видно из рис. 21, значение производной |х'|, взятой в точке г = г0, значительно меньше производной | %'г=01. Кроме того, можно пренебречь энергией связи по сравнению с потен- потенциальной энергией взаимодействия, т. е. считать |е|<|?/(г)| при г < г0. На малых расстояниях % = Nr% где N — некоторая константа. Тогда G6,11) преобразуется к виду -N^^-N J U{r)rdr G6,12) J или U(r)rdr = --?-. G6,13) uln О Заменяя интеграл в G6,13) на ?Vo, где Uo — некоторая сред* няя энергия взаимодействия, т. е. средняя глубина ямы, получим по порядку величины: U ^ ~ —40 Мэв. § 77. Теория ядерных оболочек В отличие от атомов, у которых взаимодействие между элек- электронами имеет второстепенный характер и происходит на фоне основного фактора — притяжения к ядру, в атомных ядрах нет выделенного центра взаимодействий. Наоборот, все ядерные частицы — нуклоны — интенсивно взаимодействуют между собой мощными ядерными силами. По- Поэтому долгое время казалось, что различать состояния индиви- индивидуальных частиц в ядре не имеет смысла, а можно говорить лишь о состоянии системы как целого. Оказалось, однако, что целый ряд наблюдавшихся свойств атомных ядер указывает на сохранение индивидуальности ну- нуклонов в ядрах. По-видимому, сохранение индивидуальности ча- частиц в ядрах связано с тем, что ядерные силы весьма быстро убывают с расстоянием, а кинетическая энергия нуклонов в яд- ядрах весьма велика. Исходя из предположения, что каждый из ядерных нукло- нуклонов движется в самосогласованном поле, образованном всеми остальными нуклонами, оказалось возможным объяснить целый ряд важных свойств ядер. Самосогласованное поле большинства ядер является сфери- сферически-симметричным. Разумеется, точный закон распределения потенциала внутри ядра неизвестен. Оказалось, однако, что ха- характер расположения уровней сравнительно мало зависит от
$ 77] ТЕОРИЯ ЯДЕРНЫХ ОБОЛОЧЕК 319 принимаемой модели потенциального поля, если только она правильно передает основную особенность поля ядра как це- целого — резкое возрастание потенциала на его поверхности, г = R. Самая простая модель ядра — это сферическая потен- потенциальная яма бесконечной глубины. В этой модели самосогла- самосогласованное потенциальное поле ?/, в котором движется отдельный нуклон, имеет вид оо, Уже эта весьма упрощенная модель позволяет получить общее представление о свойствах и расположении уровней. Волновая функция удовлетворяет уравнению l0' G7.0 где k2 = ^2 . Решением этого уравнения служит выражение C6,9). Граничное условие на поверхности ядра я|) = 0 при г = Я G7,2) приводит к условию 0. G7,3) При данном значении орбитального момента уровни энергии, являющиеся корнями трансцендентного уравнения G7,3), клас- классифицируются с помощью главного квантового числа п. Наи- Наименьшему корню этого трансцендентного уравнения отвечает волновая функция, не имеющая узлов при г < R. Этот уровень классифицируется как уровень с п = 1. Следующий корень G7,3) отвечает волновой функции, имеющей один узел при г < R. Соответствующее состояние обозначается как п = 2 и т. д. При данном п I может принимать любые значения. При этом энергия нуклона растет с ростом орбитального момента. Порядок расположения уровней дается последовательностью Is, lp, lrf, 25, 1/, 2р, lg, 2d ... Оказалось, что в атомных ядрах важную роль играет спин-ор- спин-орбитальное взаимодействие, которое до сих пор вовсе не учиты- учитывалось. Особая роль спин-орбитального взаимодействия связана с тем, что благодаря быстрому убыванию ядерных сил с рас- расстоянием между частицами энергия парного взаимодействия в среднем мала. Значительная величина спин-орбитального взаи- взаимодействия приводит к установлению в ядрах / — / связи. Спи- Спиновый и орбитальный моменты каждого нуклона складываются в полный момент /. Энергия нуклона оказывается зависящей от
320 СВОЙСТВА АТОМНЫХ И ЯДЕРНЫХ СИСТЕМ (ГЛ. IX его спина. В ядрах реализуется обращенная структура уровней, так что уровни с большими / лежат ниже уровней с мень- меньшими /. Состояния нуклонов обозначаются символом nlj, напри- например, lsi/a или 2ру2. Поскольку нуклоны подчиняются принципу Паули, в каждом состоянии с данными значениями п, I и / мо- может находиться B/ + 1) нейтрон и B/ + 1) протон. Благодаря этому в ядрах возникает ситуация, весьма сходная с той, ко- которая имеет место в атомах: состояния нуклонов можно раз- разбить на группы или оболочки. При заполнении каждой обо- оболочки возникает замкнутая конфигурация, обладающая наи- наибольшей устойчивостью — в данном случае наибольшей энергией связи нуклона в ядре. Расположение состояний по энергиям и число нуклонов в этих состояниях дается следующей таблицей: *Ч 2 20 22 2*/я» l&/* lh%> 2d*h' 3s4* 32 2/7/2, 1Л,,,, 2Ц, 2/,/f, 3pf/, 3Pl/i 44 Из этой таблицы видно, что в замкнутых оболочках помещается последовательно 2, 8, 28, 50, 82 и 126 нуклонов. Соответственно, особой устойчивостью обладают ядра с пол- полным числом нуклонов, даваемых этими числами, которые назы- называются магическими. Особой устойчивостью обладают ядра, у которых и число протонов и число нейтронов являются магическими. Такими яд- ядрами являются, например, Не! и Os6. Их часто называют дважды магическими. Эта простейшая схема позволяет объяс- объяснить не только особую устойчивость и распространенность в природе некоторых изотопов, но и ряд других свойств атом- атомных ядер, например, их магнитные моменты. Однако в ряде случаев она оказывается недостаточной. Так, например, ядра с незаполненными оболочками обнаруживают отклонения от сферической формы. Это проявляется в наличии вращения ядра как целого. Экспериментальным доказательством вращения ядра служит наличие в спектрах ядер структуры (идентично со структурой спектров двухатомных молекул). Мы не можем останавливаться на деталях, которые читатель найдет в специальной литературе 1). 1) См., например, П. Э. Н е м и р о в с к и и, Современные модели атом- атомного ядра, Атомиздат, 1960.
ГЛАВА X ТЕОРИЯ ДВУХАТОМНЫХ МОЛЕКУЛ § 78. Адиабатическое приближение и классификация электронных термов Мы перейдем теперь к изучению свойств более сложной си- системы — молекулы. При этом мы ограничимся рассмотрением простейших двухатомных молекул. На этом простом примере будут иллюстрированы основные свойства молекулярных си- систем. Мы видели в предыдущей главе, что расчет атомов произво- производится приближенными методами. Естественно, что в теории мо- молекул также широко используются приближенные способы рас- расчетов. Гамильтониан двухатомной молекулы имеет вид X г|)мол (гь Kt) = ?фмол (г* «,). G8,1) Здесь Ali и М2 — масса ядер, т — масса электронов, г& — коор- координаты электронов, Ri — координаты ядер. Потенциальная энер- энергия U(rh, Ri) включает взаимодействие электронов с ядрами, электронов между собой и ядер друг с другом. Суммирование по k ведется по всем электронам молекулы. Скорость ядер, имеющих массы в несколько тысяч раз большие, чем у элек- электронов, существенно меньше электронных. В соответствии с этим в теории молекул пользуются адиабатическим приближением. Волновая функция системы представляется в виде Используя формулы E7,7) и E7,8), мы можем написать урав- уравнения для функций аиф: ] Я G8,2) G8'3) В, Гд Левич и др., том И
322 ТЕОРИЯ ДВУХАТОМНЫХ МОЛЕКУЛ [ГЛ. X Уравнение G8,2) описывает движение электронов при неподвиж- неподвижных ядрах. Величина ?п(^) определяет уровни энергии си- системы при неподвижных ядрах, находящихся на фиксирован- фиксированном расстоянии друг от друга. Энергию Еп при заданном рас- расстоянии между ядрами называют электронным термом. Уравнение Шредингера G8,3) описывает движение ядер. Входящая в него величина En(Ri) имеет смысл потенциальной энергии ядер. Из уравнения G8,3) мы видим, что полная энер- энергия ядер Е зависит от состояния электронной части системы, от электронного терма. Число электронов в молекуле всегда больше единицы. По- Поэтому даже решение приближенного уравнения G8,2) сопря- сопряжено с большими, а для многоэлектронных молекул — с непре- непреодолимыми математическими трудностями 1). Мы вынуждены, не делая попыток решения уравнения G8,2), найти самые об- общие свойства системы электронов, движущихся в поле двух ядер. Найдем для этого, как всегда, величины, коммутирующие с оператором Гамильтона Яэл, иными словами, найдем вели- величины, которые одновременно имеют определенные значения в стационарных состояниях системы. В отличие от атомного поля, обладающего сферической симметрией, поле двухатомной молекулы обладает цилиндрической симметрией. Осью симме- симметрии служит прямая, соединяющая оба ядра, которую в даль- дальнейшем мы выберем за ось z. При повороте на угол ф относи- относительно оси z потенциальная энергия взаимодействия электронов с ядрами, а также взаимодействия электронов между собой не изменяется. Поэтому оператор Гамильтона системы электронов не зависит от цилиндрического угла ф. Таким образом, мы приходим к выводу, что сохраняется проекция полного момента электронов на ось молекулы. Пре- Пренебрегая слабым спин-орбитальным взаимодействием, можно считать, что сохраняется также проекция орбитального момента электронов на ось г. Состояния электронов классифицируются по собственным значениям оператора Lz. Собственные значения проекции орбитального момента электронов на ось молекулы обозначают буквой Л. Состояния с Л = О, 1,2 принято имено- именовать S-, П- и Д-состояниями (по аналогии с S-, Р- и D-состоя- ниями атомов). Второй величиной, сохраняющейся у системы электронов в молекуле, является полный спин электронов S. и ие *) Исключение составляет ион Н^для которого получено точное реше- уравнения Шредингера для электронной части волновой функции.
§ 78] КЛАССИФИКАЦИЯ ЭЛЕКТРОННЫХ ТЕРМОВ 323 Все рассуждения по поводу полного спина, приведенные в теории атома, полностью относятся и к молекуле. При классификации электронного терма молекулы мульти- плетность 25 + 1, как и у атома, указывают в виде индекса в верхнем левом углу при квантовом числе Л, т. е. в виде ^+1д* Покажем далее, что при отражении координат электронов в любой плоскости, проходящей через ядра молекулы (т. е. че- через ось z) гамильтониан Яэл не изменяется. Иными словами, по- покажем, что гамильтониан коммутирует с оператором отраже- отражения. В этом легко убедиться, если, например, плоскость, в кото- которой происходит отражение, выбрать так, чтобы она проходила через оси z и у. В этом случае отражение соответствует замене всех координат #г-->—х{. Но так как взаимодействие зависит только от расстояния между частицами (хх — #2J, то комму- коммутативность гамильтониана и оператора отражения становится очевидной. Отсюда следует, что оператор Яэл и оператор отра- отражения в плоскости, проходящей через ось молекулы, имеют об- общие собственные функции. Поэтому стационарные состояния мо- могут характеризоваться, кроме собственных чисел Л, собствен- собственными значениями /\- оператора отражения. Последние, как легко видеть, принимают два значения Рг = ± 1. Дело, однако, осложняется тем, что оператор проекции момента Lz не комму- коммутирует с оператором отражения. Действительно, оператор проек- проекции момента на ось z имеет вид При отражении в плоскости zy координата х будет изменять свой знак, в то время как у остается неизменным. Отсюда не- непосредственно следует, что операторы Яг- и Lz не коммутируют. Поэтому нельзя одновременно характеризовать молекулярные термы с помощью величины "Л и /\, за исключением термов, у которых проекция момента Lz = 0. В последнем случае воз- возможны состояния с четностью Pt = 1 и четностью Pi = — 1, ко- которые обозначаются как Е+ и 23". Волновые функции, отвечающие этим состояниям, соответ- соответственно изменяют и не изменяют знак при воздействии опера- оператора Pi отражения в плоскости, проходящей через ядра молекул. Рассмотрим теперь частный случай молекулы с одинаковыми ядрами. Если выбрать начало координат в точке, лежащей на оси z и делящей расстояние между ядрами пополам, то легко видеть, что оператор инверсии электронных координат (отве- (отвечающий замене всех координат электронов на обратные ti -* — ti) коммутирует с оператором гамильтона Яэл. Так как одновременно с Нъл коммутирует оператор Р* отражения 11*
324 ТЕОРИЯ ДВУХАТОМНЫХ МОЛЕКУЛ [ГЛ. X электронных координат в плоскости, проходящей через ядра мо- молекул, то состояние с L = 0 может характеризоваться тремя соб- собственными значениями Л = О, Р* = ± 1 и собственными значе- значениями оператора инверсии (см. § 33). Последние имеют два значения ±1, обозначаемые буквами g (четное состояние) и и (нечетное состояние). Эти индексы помещаются справа внизу. Например, !2g отвечает терму, волновая функция которого четна, не меняет знака при воздействии оператора отражения в плоскости, проходящей через ось г, проекция момента на ось г равна нулю, терм синглетный. Мы знаем далее, что оператор инверсии коммутирует с оператором Lz. Поэтому состояния с Л Ф О также могут быть как четными, так и нечетными. Иными словами, возможны состояния Пм, П#, Ди, Ag и т. д. Остановимся на вопросе о вырождении электронных термов. Если Л задано, то это означает, что определена абсолютная ве- величина проекции момента на ось z. Так как энергия системы не может зависеть от ориентации проекции момента относительно оси 2, т. е. одинакова при Lz = + Л и Lz = — Л, то мы прихо- приходим к выводу, что каждый терм с Lz Ф О двухкратно вырожден. Укажем, наконец, что энергия электронных термов молекулы того же порядка, что и энергия атомных термов. § 79. Молекула водорода, понятие о теории химической связи Единственной молекулой, для которой удается получить до- достаточно точное решение уравнения для электронного терма, является молекула водорода. Вычисление терма молекулы во- водорода имеет важное принципиальное значение. Если отсчитывать энергию от энергии неподвижных разве- разведенных атомов, то стабильной молекуле отвечают отрицатель- отрицательные значения электронных термов. Энергия (отрицательная) молекулы является мерой химической связи образующих ее ато- атомов. Таким образом, расчет электронных термов молекулы яв- является вместе с тем количественной теорией химической связи между атомами. Установление природы химической связи является одним из фундаментальных результатов квантовой механики. До появления квантовой механики не существовало каких- либо обоснованных представлений о природе химической связи, в особенности о природе гомеополярных молекул. Напомним, что под гомеополярными молекулами понимают молекулы, построен- построенные из нейтральных атомов. К таким молекулам относятся, на- например, молекулы, содержащие одинаковые атомы. Мы попы- попытаемся на примере молекулы водорода выяснить некоторые ха- характерные особенности теории химической связи*
$ 79] ПОНЯТИЕ О ТЕОРИИ ХИМИЧЕСКОЙ СВЯЗИ 325 Уравнение Шредингера для электронных термов молекулы водорода имеет вид Ъ2 А Ъ2 А , е2 в2 е2 в2 в2 , е2 2m 2m tf гв1 гп2 rbt гЬг Г12 Здесь R — расстояние между ядрами атомов водорода; вели- величины г , гДг, гь, г6а — соответственно расстояния между яд- ядром а и первым электроном, ядром а и вторым электроном, ядром Ъ и первым электроном, ядром Ъ и вторым электроном; /2 — расстояние между электронами. Если атомы, образующие молекулу, разведены на беско- бесконечно большое расстояние, можно утверждать, что один из элек- электронов, например Nu будет связан с ядром а, а другой (элек- (электрон Af2) — с ядром Ь. При сближении атомов, в силу тожде- тождественности электронов, такое утверждение теряет смысл. Точное решение уравнения Шредингера G9,1) представляет большие математические трудности, поэтому был проведен це- целый ряд приближенных расчетов. Мы воспользуемся теорией возмущений, позволяющей сравнительно просто выяснить основ- основные особенности системы. Вопрос о степени точности расчета будет обсужден позднее. В качестве волновой функции нулевого приближения выберем волновую функцию системы с бесконечно удаленными ядрами. При бесконечном удалении ядер друг от друга (/? —> оо) волновая функция системы из двух электронов и двух ядер имеет вид где tya(ra) и ф6(rb2) — волновые функции атома водорода, в ко- которых соответственно первый электрон находится при ядре а, второй электрон — при ядре Ь. Очевидно, что эти функции удовлетворяют уравнениям G9,3) Нас интересует нормальное состояние молекулы водорода. Поэтому под Eq следует понимать низший энергетический уро- уровень атома водорода. Состояние <р^ является вырожденным. Дей- Действительно, этой же энергией обладает состояние отличающееся от первого перестановкой электронов. Подчерк- Подчеркнем, что ф° и qp? являются собственными функциями различных операторов и не ортогональны друг к другу.
326 ТЕОРИЯ ДВУХАТОМНЫХ МОЛЕКУЛ [ГЛ. X Волновые функции нулевого приближения представим в виде симметрйзованных комбинаций функций <pj и ф°, т. е» в виде t = Л [% (га) Ь (г J + % (гJ % (гь)], | ^ - К [¦. ('«,) % Ы " 4>а ('*) % (ГЬ)]. j Постоянные А\ и Л2 определяются из условия нормировки Они равны А = 1 /2(l+s2) f где величина 5 представляет степень неортогональности функ- функций (pj и ф^ и равна ^V2. G9,6) При таком выборе невозмущенных функций, которые пред- хтавляют симметризованные волновые функции отдельных ато- атомов, оператор возмущения включает взаимодействие электронов и ядер между собой и электронов с «чужими» ядрами. Непо- Непосредственное применение теории возмущений недопустимо: вол- волновые функции нулевого приближения не ортогональны друг другу. Поэтому необходимо несколько модифицировать теорию- возмущений. Напище,м возмущенные волновые функции и энер- энергию возмущенной системы в виде G9,7) Тогда уравнение G9,1) для функции ф^ запишется в виде (д +"д) л [¦ Ы *ь К) + Ь К) % (гь)] + -?] А [¦. К) % Ы + *а К) % Е0 + га,
$ 79] ПОНЯТИЕ О ТЕОРИИ ХИМИЧЕСКОЙ СВЯЗИ 327 Используя уравнения G9,3) и опуская малые члены, содер- содержащие произведение оператора возмущения на возмущенную волновую функцию, получаем G9,8) Аналогичное выражение получается при подстановке г|)а. При дальнейших расчетах мы будем пользоваться следую- следующей общей теоремой. Для существования решения уравнения с правой частью необходимо, чтобы правая часть ф была ортогональна к функ- функции ф?, удовлетворяющей однородному уравнению1). Применяя эту теорему к G9,8), потребуем, чтобы правая часть G9,8) была ортогональна к решению однородного урав- уравнения, т. е. к невозмущенной собственной функции ф°. Умножая правую часть G9,8) на ф^ и интегрируя, находим 1) Доказательство особенно легко провести в случае невырожденного спектра. Запишем уравнение в виде (Я0-?«)ф = <р, A) где Но — линейный оператор, имеющий невырожденный спектр собственных значений Разложим функцию ф по функциям ф? ¦- Подставляя t|) в A), имеем 2 ak(El k фп Вычисляя интеграл Фдф^с» находим, что он равен нулю. Это и доказывает наше утверждение.
328 ТЕОРИЯ ДВУХАТОМНЫХ МОЛЕКУЛ [ГЛ. X где знак плюс относится к симметричной функции. Аналогичные выкладки приводят к формуле со знаком минус в случае анти- антисимметричной функции. Учитывая условие нормировки, имеем Разрешая последнее уравнение относительно е, находим по- поправку к энергии где J (г J ^ (г J X G9, Ю) В формуле G9,9) знак плюс соответствует симметричному состоянию, характеризуемому волновой функцией tyos, знак ми- минус— антисимметричному состоянию (волновая функция г|)?). Если ty°s и г|э° были бы взаимно ортогональны, то мы получили бы, что 5 = 0. При этом G9,9) совпала бы с обычной формулой теорий возмущений для поправки к энергии. Найденные выражения / и К аналогичны интегралам, полу- полученным в § 67. Интеграл / определяет кулоновское взаимодей- взаимодействие ядер и электронов друг с другом. Величина К представ- представляет обменную энергию. Полная волновая функция молекулы водорода представляет произведение координатной и спиновой функции. Так как полная функция системы должна быть анти- антисимметричной, то симметричную по координатам функцию сле- следует умножить на антисимметричную спиновую функцию и на- наоборот. Поэтому состояние (i|^) является состоянием со спином электронов, равным нулю (синглетное состояние). Аналогичные рассуждения показывают, что волновая функция ty°a описывает состояние молекулы со спином, равным единице. Для того чтобы выяснить, какое из этих двух состояний приводит к свя- связанному состоянию (молекуле), надо найти зависимость вели- величины е от радиуса R. Это можно сделать, если в интегралы G9,10) вместо -фа и -фь подставить волновые функции нормаль-
f 79] ПОНЯТИЕ О ТЕОРИИ ХИМИЧЕСКОЙ СВЯЗИ 329 E(Rl Рис. 22. лого состояния атома водорода. Результаты вычисления удобно представить на графике (рис. 22). Здесь Е\ и Е2— энергии мо- молекулы, отвечающие соответственно синглетному и триплетному состояниям. Мы видим, что два атома водорода с полным элек- электронным спином, равным единице, не могут образовать связан- связанного состояния, так как Е2 не имеет минимума. Связанное со- состояние может быть лишь синглетным состоянием. Зная вид E\(R), можно определить энер- энергию связи, а также эффективный размер молекулы. Минимум по- потенциальной энергии лежит при Ro = 0,79 А. Энергия связи не очень хорошо совпадает с экспе- экспериментальными значениями. Это обусловлено тем, что оператор, выбранный в качестве возмуще- возмущения, не содержит малого пара- параметра и не мал по сравнению с невозмущенным оператором. Поэтому количественное приме- применение теории возмущений необос- необоснованно. Несколько лучшие результаты дают другие приближен- приближенные методы. Однако общий качественный вывод о природе хи- химической связи с образованием устойчивой молекулы из двух атомов правилен. Устойчивость молекулы целиком определяется величиной и знаком обменного интеграла. Именно, для образо- образования устойчивого химического соединения необходимо (хотя и недостаточно), чтобы спины атомов были антипараллельны. Это обстоятельство часто подменяют не вполне точным утвержде- утверждением — «силы химической связи являются обменными силами». В § 67 мы подробно обсудили квантовомеханическую теорию об- обменных сил и смысл такого рода формулировок. Во всяком слу- случае, несомненно, что силы, ответственные за образование гомео- полярных химических соединений, имеют специфический кван- товомеханический характер. Часто говорят также, что «связы- «связываются антипараллельные спины». Предыдущий расчет ясно по- показывает большую степень условности такой терминологии. На примере молекулы водорода можно выявить не только кванто- квантовомеханическую природу сил химической связи, но и трудности, возникающие при расчетах образования молекулярных систем. Приведенный расчет позволяет сделать общий вывод о том, что каждой валентности в химическом соединении отвечает пара электронов с антипараллельными спинами, связанных между собой обменным взаимодействием. Отсюда следует, что ответственным за химические свойства атомов являются неспаренные внешние электроны, находящиеся
330 ТЕОРИЯ ДВУХАТОМНЫХ МОЛЕКУЛ [ГЛ. X в незаполненных оболочках. Валентность атома определяется числом таких неспаренных электронов. При образовании гомео- полярного химического соединения эти электроны «коллективи- «коллективизируются», т. е. не могут более считаться принадлежащими дан- данному атому. Вместе с тем конфигурация незаполненного состоя- состояния видоизменяется так, что оно приближается к заполненной структуре. Иными словами, электроны спариваются так, что спины всех электронов в молекуле стремятся взаимно компен- компенсироваться. Устойчивые гомеополярные молекулы имеют тен- тенденцию к спариванию всех электронов. В наиболее устойчивых молекулах все электроны спарены, полный спин молекулы S = О и мультиплетность равна единице. Эти качественные результаты хорошо согласуются с опыт- опытными данными для большинства молекул. Следует упомянуть еще о некоторых обстоятельствах, важных для понимания об- образования молекул. Первым из них является упомянутое в § 73 свойство атомов вступать в химическую связь не в нормальном, а в возбужденном состоянии. В свете разобранной только что теории это свойство становится понятным. При взаимодействии двух атомов возможен переход одного из них в возбужденное состояние под влиянием возмущения. Если энергия, выигрывае- выигрываемая при образовании соединения с атомом в возбужденном со- состоянии больше, чем в соединении с атомом в нормальном со- состоянии, то первое будет отвечать более устойчивой молекуляр- молекулярной конфигурации. Так, например, в § 73 мы видели, что устойчивый терм атома углерода есть 3Р0. Углерод имеет два неспаренных электрона в 2р-состоянии, и его валентность в нормальном состоянии равна двум. Однако у атома углерода имеется возбужденное состояние с конфигурацией Is2, 25, 2р3, в котором атом находится в со- состоянии 55. Это состояние лежит на 4, 2 электронвольта выше нормального. В ^-состоянии углерод имеет четыре неспаренных электрона и его валентность равна четырем. В соединениях, для которых выигрываемая энергия больше 4, 2 электронвольт, угле- углерод выступает как четырехвалентный. Вторым свойством молекул, следующим из общей теории, является их геометрическая форма. Образование химического- соединения связано с величиной кулоновского и обменного ин- интегралов, содержащих произведения волновых функций. Если среди этих волновых функций фигурируют волновые функции электронов в р-состоянии, обладающие анизотропией в про* странстве (см. § 38), то наибольшее перекрытие волновых функ- функций достигается в.избранных пространственных направлениях. В виде примера можно привести молекулу NH3. У атома азота, имеющего конфигурацию Is2, 2s2, 2р3 — 45, ответственными за
§ 80] ВЗАИМОДЕЙСТВИЕ АТОМОВ НА БОЛЬШИХ РАССТОЯНИЯХ 331 химическую связь являются три /7-электрона. Волновые функции этих электронов имеют наибольшее значение в трех взаимно перпендикулярных направлениях. В образовавшейся молекуле NH3 углы между связями N—Н близки (хотя и не равны строго) к 90°. Последним обстоятельством, важным для понимания строе- строения молекул является то, что волновая функция возбужденного состояния представляет линейную комбинацию волновых функ- функций электронов. Например, в упомянутом выше возбужденном состоянии атома углерода волновая.функция является линейной комбинацией волновых функций — одного 25- и трех 2/?-элек- тронов, 2s- и 2р-состояния могут входить с разными весами при образовании волновой функции. Это обстоятельство, именуемое гибридизацией состояний, позволяет, например, понять, почему все четыре валентности атома углерода совершенно идентичны между собой. Отсылая за подробностями к специальным руководствам1), подчеркнем, что при переходе к количественным расчетам сил химической связи и строения образующихся молекул возникают очень большие расчетные трудности. Эти трудности связаны с тем, что взаимодействие, ответственное за образование хими- химической связи, невзоможно считать малым возмущением. § 80. Взаимодействие атомов на больших расстояниях Помимо сил химического характера, связывающих в некото- некоторых случаях атомы в молекулы, между атомами, находящимися на сравнительно больших расстояниях друг от друга, происхо- происходит слабое взаимодействие. Рассмотрим два атома, находя- находящихся на большом расстоянии друг от друга. Благодаря сфери- сферической симметрии атомы не имеют средних дипольных моментов. Однако недиагональные матричные элементы дипольных момен- моментов отличны от нуля. Наглядно можно представлять себе дипольные моменты ато- атомов как результат квантовомеханического движения электронов, приводящего к появлению и исчезновению дипольного момента, который равен нулю только в среднем. В результате этого в обоих атомах индуцируются такие дипольные моменты. Часто в качестве наглядной иллюстрации разбирают взаимодействие двух осцилляторов, в которых индуцированные дипольные моменты непосредственно выражаются через их нулевые ко- колебания. ]) См., например, У. Козман, Введение в квантовую химию, ИЛ, 1960s Г. Эйринг, Д. Уолтер, Д. Кимбал, Квантовая химия, ИЛ, 1948.
332 ТЕОРИЯ ДВУХАТОМНЫХ МОЛЕКУЛ [ГЛ. X Энергия взаимодействия атомов может быть вычислена по теории возмущений. В качестве оператора возмущения следует взять энергию взаимодействия двух диполей, даваемую форму* лой A7,12) ч. 1. Поправка к энергии первого порядка равна в силу d\ = d2 = 0. Поправка второго порядка может быть на- написана в виде Е 1 у [dib-г {*&)(**)]*„ _ Л К т п " т К Величина согласно результатам § 53, всегда отрицательна. Поэтому окон- окончательно п с const U В-д-В = -С2 = ]^Г~ • Полученная формула выражает закон взаимодействия Ван-дер- Ваальса. Это взаимодействие не имеет специфического харак- характера в том смысле, что оно отвечает силам притяжения, убы- убывающим как -д7~ Для всех атомов, независимо от их природы. Величина постоянной может быть выражена через поляризуе- поляризуемость атомов и варьируется для разных атомов. Таким образом, ван-дер-ваальсово взаимодействие между атомами представ- представляет такой же характерный квантовомеханический эффект, как и химическое взаимодействие. Его нельзя понять на основе клас- классических представлений, поскольку атомы не имеют «готового» дипольного момента. Силы Ван-дер-Ваальса, в отличие от сил, приводящие к об* разованию химической связи, обладают аддитивностью. Если во взаимодействие вступают не два, а три и более атомов, то энер- энергия взаимодействия системы, как и всякое другое слабое воз- возмущение, получается сложением энергий попарных взаимо- взаимодействий. Полученный результат имеет вполне общий характер, по- поскольку мы не пользовались конкретным видом волновых функций.
§ 80] ВЗАИМОДЕЙСТВИЕ АТОМОВ НА БОЛЬШИХ РАССТОЯНИЯХ 333 Однако если атомы находятся не в S-состояниях, то они мо- могут иметь отличное от нуля среднее значение квадрупольного момента. В этом случае, кроме найденного ван-дер-ваальсова взаимодействия, между атомами будет иметь место квадруполь- квадрупольное взаимодействие ~ —. В отличие от атомов, молекулы могут обладать средним ди- польным моментом. Если, однако, его величина мала, а также мал квадрупольный момент, то формула для f/в-д-в относится и к молекулам. Своеобразная ситуация возникает при взаимодействии двух одинаковых атомов, находящихся в разных состояниях, скажем, при взаимодействии возбужденного и невозбужденного атомов одного и того же элемента. В этом случае в системе возникает дополнительное вырождение, связанное с возможностью обмена возбуждениями между атомами. Оператором возмущения и в этом случае является оператор диполь-дипольного взаимодействия. Однако энергия взаимо- взаимодействия определяется не средним значением этого оператора, а из решения соответствующего секулярного уравнения (см. § 54). Если данные атомы имеют отличные от нуля матричные элементы перехода между основным и рассматриваемым воз- возбужденным состоянием, то энергия взаимодействия оказывается отличной от нуля уже в первом приближении теории возмуще- возмущений. В этом случае между атомами осуществляется диполь-ди- польное взаимодействие с резонансной передачей возбуждения. Энергия этого взаимодействия, как легко видеть, убывает лишь обратно пропорционально кубу расстояния между атомами, Предположим, например, что один из атомов находится в основном ^о-состоянии, а другой — в возбужденном ^-со- ^-состоянии. Волновые функции, отвечающие этим состояниям, обо- обозначим через ф и грт соответственно (индекс т характеризует проекцию момента в состоянии lP\, т =—1, 0, 1). Таким обра- образом, система из двух невзаимодействующих атомов оказывается шестикратно вырожденной. Она описывается невозмущенными функциями вида фA)г|?тB) и фB)г|)тA) (т = —1, 0, 1). Мат- Матричные элементы от оператора взаимодействия Н' и/ did2 лл — D3 D5 по этим волновым функциям не равны нулю для переходов меж- между состояниями, отличающимися перебросом возбуждения. Вы- Вычисления удобно проводить в системе координат с осью г, на- направленной по вектору R. Решая секулярное уравнение вида
334 ТЕОРИЯ ДВУХАТОМНЫХ МОЛЕКУЛ [ГЛ. X E4,4), мы находим выражение для энергий взаимодействия [Л = ±-|-, ?/2= + ^> (80,1) где через g мы обозначили матричный элемент вида Верхние знаки в формулах (80,1) относятся к симметричным, а нижние — к антисимметричным, по возбуждениям, состояниям. Энергии U\ отвечают состояниям с Л=1, а энергии ?/2— с Л =0. В газовых системах, в которых имеется значительная концен- концентрация возбужденных атомов, диполь-дипольное взаимодействие с резонансной передачей возбуждения может играть более су- существенную роль, чем взаимодействие Ван-дер-Ваальса. Оно не исчезает при корректном усреднении по ориентациям диполь- ног© момента атома и при определенных условиях дает основ- основной вклад в термодинамические функции системы1). Резонанс- Резонансное диполь-дипольное взаимодействие не аддитивно. § 81. Сопоставление молекулярных термов с атомными Состояния молекулы, образовавшейся из двух атомов, можно связать с состояниями последних, если представить себе про- процесс образования молекулы как результат их бесконечно мед- медленного сближения. В хаде процесса сохраняется проекция момента на ось, сое- соединяющую оба ядра. С другой стороны, как мы видели выше, в молекуле будет сохраняться проекция момента Л на эту ось (см. § 78). Определим возможные значения Л, а также число энергетических состояний вновь образовавшейся молекулы. Пусть атомы характеризуются полными моментами, соответ- соответственно Li и L2. Для определенности будем предполагать, что L\ > L2. Проекции моментов атомов могут принимать соответ- соответственно следующие значения: Af,«Llf Li-1, Li-2, ... -Lt, M.2 = L>iy L>2 — 1, ь2 — 2, ... — L2. Согласно определению величины Л (см. § 78) ее максималь- максимальному значению Л = L\ + L2 соответствует единственное состоя- состояние, в котором проекции атомов равны М\ = Lb M2 = L2. Сле- Следующее возможное значение Л равно Л = L\ + ?2—1. Этому значению Л соответствуют два терма, возникших из двух со- 1) В. И. Мальнев, С. И. П е к а р, ЖЭТФ 51, 1811 A966); 58, 1113 A970); Ю. А. Вдовин, ЖЭТФ 54, 445 A968).
§ 81] СОПОСТАВЛЕНИЕ МОЛЕКУЛЯРНЫХ ТЕРМОВ С АТОМНЫМИ 335 стояний, в первом М\ = Lu M2 = L2—1 и во втором М\ = = L\ — 1, М2 = L2. Аналогично, значению Л= L\ + L2— 2 соот- соответствуют 3 терма, возникших из состояний Полученные результаты удобно свести в таблицу: при A = LX + L2 возможен 1 терм при A = L1 + L2—1 возможны 2 терма при A = L1 + L2 —2 возможны 3 терма при A = L1—L2 возможны 2L2+1 терм при A = L1 — L2— 1 возможны 2L2+1 терм при Л = 0 возможны 2L2+1 терм При определении всех возможных состояний системы следует учесть, что каждый уровень энергии сЛ^О является вырожден- вырожденным, так как энергия системы не может зависеть от ориентации момента в пространстве. Особого рассмотрения требует 2-терм. Молекула оказывается в 2-состоянии, если М\ = —М2. Это условие выполняется в L2 случаях, когда проекции моментов М\ > 0 и М2 < 0, и в L2 случаях при М\ < 0 и М2 > 0. Кроме того, М\ и М2 могут быть равны нулю. Следовательно, в S-co- стоянии молекула может образовываться из 2L2 + 1 энергети- энергетических состояний. В § 78 мы отмечали, что 2-термы разделяются на S+- и 2~- термы, в зависимости от свойств симметрии системы. Свойства симметрии системы не изменяются при разведении ат@мов на бесконечно большое расстояние. Поэтому волновые функции си- системы для состояний |Mi| = |Af2| могут быть записаны в виде симметричных или антисимметричных комбинаций ^> (81,1) 2-состояние, отвечающее значениям Mi = М2 = 0, определяется поведением функции я|) = ^4o2) ПРИ отражении в плосквсти, соединяющей ядра атомов. В зависимости от конкретных свойств волновых функций фМ и tyff\ возникают 2+- или 2~~- термы. Таким образом, в L2 случаях образуется молекула в 2+-состоянии и в L2 случаях в ^--состоянии. Еще один 2+- или 2~-терм возникает в зависимости от вида функции ^Чо2*»
336 ТЕОРИЯ ДВУХАТОМНЫХ МОЛЕКУЛ [ГЛ. X До сих пор рассматривали молекулы, образовавшиеся из двух различных атомов. Если молекула построена из одинаковых атомов, то подсчет ее возможных состояний несколько из- изменяется. Возможны два случая: когда разведенные атомы находятся в различных и когда они находятся в одинаковых состояниях. В первом случае число возможных термов следует удвоить по сравнению с числом термов молекулы, состоящей из различных атомов, так как состояние молекулы, построенной из одинаковых атомов, инвариантно относительно преобразо- преобразования инверсии и возможно образование четных и нечетных термов. Если атомы находятся в одинаковых состояниях, то общее число состояний остается тем же, что и у молекулы с раз- различными атомами. Вопрос о четности этих состояний довольно сложен *). § 82. Вращение и колебания молекул Мы можем теперь перейти к количественному рассмотрению движения ядер в двухатомных молекулах. Поступательное дви- движение молекулы как целого нас, естественно, интересовать не будет. Движение ядер в молекуле зависит только от расстояния между ядрами. В адиабатическом приближении, в соответствии с уравнением G8,3), волновая функция удовлетворяет уравне- уравнению Шредингера, которое в сферических координатах имеет вид {^l^^ K-^ (82Л) где En(R)—электронная энергия, а К — оператор момента ядер. Мы будем считать электронную энергию фиксированной и рассматривать ядра при заданном Еп. Тогда движение ядер сводится к вращению и колебаниям ядер около положения рав- равновесия. Оператор момента ядер необходимо выразить через оператор полного момента молекулы, который можно предста- представить для термов с равным нулю электронным спином в виде /=* + ?, где L—момент системы электронов. Очевидно, что молекула находится в состоянии с опреде- определенным значением полного момента. При этом момент ядер может пробегать ряд значений, отвечающих различным вращательным состояниям электронов. Поэтому нас будет ') Е. Wigner, E. Witmer, Zs. f. Phys. 51, 859 A928),
§ 82] ВРАЩЕНИЕ И КОЛЕБАНИЯ МОЛЕКУЛ 337 интересовать лишь среднее значение величины поскольку 72 имеет определенное значение и сохраняется. Согласно сказанному в § 78, сохраняется проекция момента электронов на ось молекулы n, Lz = Л. Две другие проекции в среднем равны нулю Lx = О, Ьу = 0. Кроме того, поскольку направление вектора п (ось молекулы) является единственным выделенным направлением, имеет ме- место равенство 1 Вектор момента ядер в двухатомной молекуле перпендикуля- перпендикулярен к л, т. е.1) откуда следует, что /л = 1л = Л. (82,2) Из (82,2) получаем /1 = Л2. Окончательно находим {КJ = /2 + L2 - 2Л2 = / (/ + 1) + L2 - 2Л2, (82,3) где квантовое число / пробегает ряд целых значений В формуле (82,3) два последних слагаемых зависят только от состояния системы электронов, тогда как первое слагаемое характеризует вращение молекулы как целого. Уравнение Шредингера приобретает вид i 2ц /р ад \к W)+ ^Л 1/<) + 2ц/?2 + 2| Г (82,4) Обозначив h*(%JA1) (82,6) мы видим, что U(R) играет роль эффективной потенциальной энергии. Мы будем рассматривать состояния ядер, при которых 1) Это утверждение непосредственно следует из известного в классиче- классической механике факта — вектор момента в системе двух тел перпендикулярен к соединяющей их оси.
338 ТЕОРИЯ ДВУХАТОМНЫХ МОЛЕКУЛ [ГЛ X расстояние между ядрами остается близким к равновесному расстоянию Ro. Тогда эффективную потенциальную энергию можно написать в виде где coo — частота колебаний. Уравнение (82,5) приобретает окончательно вид (82,6) Мы видим, что в используемом адиабатическом приближении, при заданном электронном состоянии, движение молекулы сво- сводится к вращению ее как целого и к гармоническим колебаниям. Полная энергия молекулы дается формулой (82,7) где v — вибрационное квантовое число. Оценим еще степень точности адиабатического приближения. Согласно E7,6) параметр неадиабатичности по порядку вели- величины равен Са~-у grad а J cp* grad ф dV. (82,8) Нас будет интересовать зависимость этого выражения от приве- приведенной массы \i. Оценим по порядку величины производную grad а в основном колебательном состоянии. Очевидно, что grad а ~ , а =-. V(R-RoJ Чтобы оценить среднее смещение V(R — R0J, заметим, что в ос- основном состоянии средняя потенциальная энергия равна поло- половине полной энергии, т. е. ЯJ К откуда V(R-RoJ Таким образом, grad a ~ Но по определению V
§ 821 ВРАЩЕНИЕ И КОЛЕБАНИЯ МОЛЕКУЛ 339 Последний интеграл в (82,8) зависит только от электронной ча- части системы и не зависит от \i. Поэтому окончательно С ~ l/|i4 Из соображений размерности следует, что С ~ (ет/ц)\ (82,9) Действительно, в полное уравнение Шредингера, описывающее движение всех частиц в молекуле, входят только две величины размерности массы — \х и массы электрона т. Никаких других величин размерности массы из величин, входящих в уравнение Шредингера, построить нельзя. Таким образом, параметр С весьма мал даже для молекулы водорода. Величина (m/\i)if* является основным малым параметром теории молекул. Расстояние между уровнями электронной энергии Д?е1 в мо- молекулах не зависят от массы ядер и имеют тот же порядок величины, что и у атомов (т. е. порядка одного или несколь- нескольких электрон-вольт). Расстояния между колебательными уровнями Они составляют несколько десятых электрон-вольта. Наконец, расстояние между ротационными уровнями где Д/ = /' — / = ±1. Поскольку A?rot ~ —, это расстояние гораздо меньше, чем расстояние между вибрационными уровнями, и составляет несколько милливольт. Зная расположение уровней, можно найти спектр излучения (или поглощения) молекул, который по своему характеру резко отличается от атомных линейчатых спектров. При этом, однако, необходимо учесть одно важное обстоятельство. В гл. XII, по- посвященной теории излучения, будет показано, что переходы ме- между уровнями ограничены так называемыми правилами запрета или отбора. Оказывается, что возможны переходы между уров- уровнями, при которых происходит изменение квантовых чисел, оп- определяемое условиями (кроме перехода /' = / = 0, который запрещен). В случае пере- переходов, при которых электронное состояние молекулы не
340 ТЕОРИЯ ДВУХАТОМНЫХ МОЛЕКУЛ [ГЛ. X изменяется, из (82,7) получаем J'+l)-J"(J"+l)]. (82,10) Учитывая правила отбора, для заданной разности v'— v" полу- получаем две ветви частот. При /" = /' + 1 имеем правую ветвь частот: bv>l = bu>n(v'-v")-2B{J'+l), У = 0, 1, 2, ... (82,11) При /" = У — 1 находим вторую ветвь частот: h<*2 = h(on(v'-v") + 2BJ', /'=1, 2, 3, 4, ... (82,12) Заметим, что /' не может равняться нулю, так как это соответ- соответствовало бы J" = — 1. Рассмотрим порядок и расположение этих частот при задан- заданной разности v'— v". Частота ooi уменьшается, начиная с coi = = о)п(^7 — v") —25, а частота сог увеличивается с низшего зна- значения, равного iOnW — v") + 2B. Расстояние между линиями в каждой ветви равно 25. Расстояние же между ветвями равно 45. Частота соп(у/ — и")» лежащая в середине, между полосами не наблюдается. Совокупность линий coi называют также Р-ветвью частот, а совокупность частот оJ составляет R-ветвъ, Эти частоты лежат в инфракрасной части спектра. Перейдем теперь к изучению частот, которые возникают при переходах, связанных с изменением электронного состояния. Характер такого спектра существенно отличается от разобран- разобранного нами инфракрасного спектра. Частоты излучения в этом случае определяются формулой - + Bn(J'+l)J'-BmJ"(J"+l). (82,13) Здесь следует подчеркнуть, что соп Ф cow, а ВпФВт. В самом деле, колебательные частоты со и величины 5 определяются электронным состоянием молекулы и, следовательно, при из- изменении этого состояния указанные величины существенно ме- меняются. Так как изменения энергии молекулы при переходах, связан- связанных с изменением электронного состояния, достаточно велики, то наблюдаемые в этом случае частоты лежат в области види- видимого спектра. Совокупность линий, соответствующих выбранной паре квантовых чисел v\ и у", называется полосой. Последняя в свою очередь составлена из трех ветвей. Эти ветви получаются следующим образом. В соответствии с правилом отбора кванто- квантовое число J" может быть равно J" = /'—1; /" = /'+1 и ]" = J\ Первому случаю соответствует 7?-ветвь, частоты кото- которой определяются соотношением ^ = A + BJ/2 + CJf9 (82,14)
§82] где ВРАЩЕНИЕ И КОЛЕБАНИЯ МОЛЕКУЛ 341 Переходы /" = У составляют Q-ветвь, а частоты в этом случав определяются формулой Л + 5//(//+1). (82,15) И, наконец, для Р-ветви получаем - 2Вт + BJ'2 (Вп - ЗВт) Г. (82,16) 15 W Ж ii'i Во всех трех случаях со является квадратичной функцией кван- квантового числа /. Для того чтобы разобраться в расположении ча« стот, удобно рассмотреть диа- диаграмму на рис. 23. Здесь изобра- изображена парабола, соответствующая уравнению (82,16) при В > 0. По вертикальной оси координат от- откладывается квантовое число /, по горизонтальной — частота со. Частоты, которые наблюдаются на опыте, могут быть легко по- получены с помощью этой диа- диаграммы. Если точки пересечения гори- горизонтальных линий, проведенных через целые значения /7, и пара- параболы проектировать на горизон- горизонтальную ось, то получим наблю- наблюдаемые значения частот. Эти частоты излучения расположены под горизонтальной осью. Мы видим, что частоты спектра расположены не на одинаковых расстояниях, как это имело место в инфракрасной части спектра, а сгущаются в некоторой его части; при увеличении со наблюдаемые частоты начинают раздвигаться. Место сгущения линий называется головой или кантом полосы. В данном случае голова полосы расположена со стороны малых частот. Если Вп < Вт, то парабола выги- выгибается в сторону. В этом случае кант полосы расположен в сто- стороне больших частот. Следует, однако, отметить, что наблю- наблюдается много исключений из указанного правила. Именно- в том случае, когда электронные термы вырождены, наблю- наблюдаются более чем три полосы, иногда, например, не наблю- наблюдается Q-ветвь и т. д. Рис. 23.
ГЛАВА XI ТЕОРИЯ РАССЕЯНИЯ § 83. Амплитуда и сечение рассеяния Процессом рассеяния мы будем называть отклонение частиц от первоначального направления движения, вызванное взаимо- взаимодействием с некоторой системой, которую мы будем именовать рассеивателем. Изучение процессов рассеяния заряженных и незаряженных частиц является одним из основных экспериментальных мето- методов исследования строения атомов, атомных ядер и элементар- элементарных частиц. Действительно, само существование атомного ядра было установлено в опытах Резерфорда по рассеянию а-час?гиц; Анализ результатов наблюдения над рассеиванием нейтронов ядрами позволил Н. Бору сформулировать современные пред- представления о строении ядра. Изучение законов рассеяния бы- быстрых частиц является основным источником сведений о ядер- ядерных силах и о свойствах элементарных частиц. Из приведенных, хотя и далеко не полных, примеров легко оценить значение теории рассеяния, которая является одним из важнейших разделов квантовой механики. Рассеяние потока частиц характеризуется дифференциаль- дифференциальным эффективным сечением рассеяния. Эта величина опреде- определяется как отношение числа частиц flWpacc> рассеянных в еди- единицу времени в телесный угол dQ> к плотности потока /цад па- падающих частиц, т. е. дифференциальное эффективное сечение определяется соотношением . , 'пад где углы 9 и ф определяют направление движения рассеянных частиц. Ось z направлена по движению падающих частиц. Для наших целей удобно представить dN^cc в виде , <t>)ds,
§ 83] АМПЛИТУДА И СЕЧЕНИЕ РАССЕЯНИЯ 343 где /расе — плотность потока рассеянных частиц на больших рас- расстояниях от рассеивающего центра, ds— элемент площади, пер- перпендикулярный радиусу-вектору, проведенному из рассеиваю- рассеивающего центра под углами Э, ф. Величина ds связана с элементом телесного угла dQ равенством Дифференциальное эффективное сечение, таким образом, опре- определено формулой ^s. (83,1) Это определение эффективного сечения совпадает с тем, ко- которое было введено в § 43 ч. I. В квантовой механике под плотностями потоков /расе, /пад под- подразумеваются соответствующие плотности потоков вероятности. При взаимном рассеянии двух квантовомеханических систем, например электрона атомом, нейтрона ядром, атома атомом и т. п., следует различать упругое и неупругое рассеяние. При упругом рассеянии внутреннее состояние как рассеивающей, так и рассеиваемой систем остается неизменным. Например, при упругом рассеянии электронов на атомах состояние последних остается неизменным. При неупругом рассеянии внутреннее со- состояние одной или обеих систем изменяется. Например, рассея- рассеяние электронов атомами является неупругим, если в процессе рассеяния атомы переходят в возбужденное состояние. При неупругом рассеянии часть кинетической энергии пере- переходит во внутреннюю энергию или, наоборот, внутренняя энер- энергия переходит в кинетическую энергию. Столкновения послед- последнего типа называют ударами второго рода. Мы начнем изложение теории рассеяния с более простого случая упругого рассеяния. При упругом рассеянии можно не интересоваться внутренним состоянием систем и кратко имено- именовать частицами любые взаимодействующие системы (хотя по- последние могут иметь сложное внутреннее строение, например являться атомами, молекулами или ядрами). В процессе рассеяния имеет место взаимодействие двух ча- частиц— рассеиваемой и рассеивающей. При этом очень часто энергия взаимодействия и зависит только от расстояния между частицами. В этом случае задача о движении двух взаимодей- взаимодействующих частиц всегда может быть сведена к изучению движе- движения одной частицы (с приведенной массой \i) в поле неподвиж- неподвижного центра сил и движению центра тяжести системы. На практике всегда необходимо знать, как происходит про- процесс в лабораторной системе координат. Поэтому если задача о движении одной частицы в поле внешних сил решена, то
344 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI в окончательных формулах следует перейти к лабораторной си- системе. Это можно сделать легко, зная закон преобразования углов (см. § 43 ч. I) п% sin 6 л л — 0 /ftO лч 9<83'2> Здесь 0 — угол рассеяния двух частиц в системе центра инерции. Oi и 92 — углы рассеяния первой и второй частиц в ла- лабораторной системе, в которой вторая частица до столкновения покоилась. Перейдем к написанию волновой функции частицы, рассеива- рассеивающейся на силовом центре. Мы не будем пока делать предполо- предположений о конкретном виде потенциальной энергии взаимодействия. Поместим неподвижный рассеивающий центр в начало ко- координат. Направление потока падающих частиц примем за ось z. Вдали от рассеивающего центра падающая частица дви- движется как свободная, и ее волновая функция имеет вид плоской волны eikz. Вблизи силового центра частица испытывает рассея- рассеяние и вид ее волновой функции изменяется. Однако после того, как рассеянная частица уйдет достаточно далеко от центра сил, она вновь будет двигаться как свобод- свободная. Так как поток рассеянных частиц на большом расстоянии всегда будет направлен от центра рассеяния, то движение рас- рассеянных частиц должно описываться расходящейся волной /(в, ф)-^1. Полную волновую функцию, описывающую движение па- падающей и рассеянной частиц на больших расстояниях от рас- рассеивающего центра, можно представить в виде лит ¦ -*'** +f (в, <р)-^, (83,3) где первый член описывает движение падающих частиц, а вто- второй — рассеянных. Амплитуда расходящейся волны /@, <р), именуемая амплиту- амплитудой рассеяния, зависит, вообще говоря, от углов 0 и ср. Соглас- Согласно (83,1) следует вычислить плотности потоков падающих и рассеянных частиц. Плотность потока в плоской волне eikz, падающей на рассеивающий центр, в соответствии с формулой G.6) равна — =и, где v — скорость частицы. Плотность потока в расходящейся волне дается выражением ^. (83,4) Определяя отношение падающего и рассеянного потоков, по- получаем в соответствии с формулой (83,1) дифференциальное
§ 83] АМПЛИТУДА И СЕЧЕНИЕ РАССЕЯНИЯ 345 эффективное сечение Лг-|/(е, <p)prfQ. (83,5> Мы видим, таким образом, что эффективное сечение пол* ностью определяется величиной амплитуды рассеяния. Вычис- Вычисление последней производится обычно следующим образом. На- Находится решение уравнения Шредингера для движения частицы в поле рассеивающего центра, которое на больших расстояниях от центра имеет вид (83,3). Тогда коэффициент при множителе eikr дает искомую амплитуду рассеяния. Представление волновой функции, описывающей движение частицы вдали от рассеивающего центра в виде (83,3), т. е. в виде суммы падающей и расходящейся волн, было произве- произведено на основании простых и наглядных физических сообра- соображений. Можно, однако, строго показать, что вдали от неподвижного рассеивающего центра U(r) решение уравнения Шредингера действительно может иметь вид (83,3). Для этого запишем урав- уравнение Шредингера в виде где k2 = ^2 , а т и Е — соответственно масса и энергия рас- рассеивающейся частицы. С помощью функции Грина решение можно (см. § 15) записать в форме ¦ = % + J О (г, г') §- U (г') * И dV, (83,6> где функция гро удовлетворяет уравнению Решение последнего уравнения, очевидно, имеет вид плоской волны eihz. Функция Грина удовлетворяет уравнению (A + k2) G(r, r') = 6(r-rO. Последнее уравнение формально идентично с уравнением B4,20) ч. I, если заменить в нем -^- на k2 и — -^L на б (г — г7). Не повторяя выкладок § 24 ч. I, воспользуемся фор- формулой B4,22) ч. I и напишем решение для в(гУ) в виде 1 Г 6(r"-V)g'*l'-'«W - 4^J F^l •
346 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI Выполняя интегрирование по dV", получаем 1 Jk\r-r'\ Подставляя в (83,6) значения ф и G, приходим к интеграль- интегральному уравнению ^ = е —53? J [7=7] ' <83'7> Рассмотрим далее интеграл, входящий в формулу (83,7), и оп- определим его значения на больших расстояниях г. Определим большие расстояния следующим образом. Пусть область значе- значений /, в которой подынтегральная функция заметно отлична от нуля и которая дает основной вклад в значение интеграла, имеет размеры R. Расстояния |г|, для которых выполнено не- неравенство |г|>«, (83,8) будем называть большими1). При вычислении интеграла (83,7) на больших расстояниях можно считать, что |г|»|г'|. Разлагая \г — г*\ в ряд, имеем |г-г'|=У(г-г'J =]/r2-2rr' =г--~^. Подставляя это разложение в (83,7), находим + -«'**—aWj U(r')e-""'1p(r')dV'. (83,9) Здесь обозначено Волновой вектор k направлен, очевидно, по радиусу-вектору. Он характеризует направление распространения расходящейся шаровой волны. Сравнение (83,9) с (83,3) убеждает нас в том, что последнее выражение имеет общий характер. Амплитуда рассеяния при этом равна lutfWWe-WdV' (83,10) Формулы (83,9) и (83,10) потребуются нам для дальнейшего. § 84. Формула Борна Хотя нам удалось найти асимптотическое выражение волно- волновой функции, задача о получении конкретного вида амплитуды 1) Такие расстояния всегда существуют при достаточно быстром убы- убывании U (г).
§ 84] ФОРМУЛА БОРНА 347 рассеяния еще далека от решения. Действительно, амплитуда рассеяния согласно формуле (83,10) выражается через неиз- неизвестную волновую функцию \|). Точное решение уравнения Шре- дингера и нахождение /(9, ф) в большинстве практически инте- интересных задач сопряжено с огромными математическими труд- трудностями. Поэтому в теории рассеяния широко применяются при- приближенные методы. Важнейшим из них является метод Борна. В основе этого метода лежит предположение о том, что по- потенциальная энергия взаимодействия рассеянной частицы с цент- центром сил мала, так что ее можно рассматривать как малое воз- возмущение. Если потенциальная энергия является малым возмущением, то можно считать, что первоначальное движение частицы срав- сравнительно мало изменяется. При этом интегральное уравнение (83,9) может быть без труда решено по ме- методу последовательных приближений. В ну- нулевом приближении малый член, содержа- содержащий потенциальную энергию, может быть опущен. Тогда % = е{ кг = eikor, (84,1) Jo ~ где ко — вектор, равный ko = kno; п0 — орт Рис.24, вдоль оси z. В первом приближении вместо волновой функции в правой части (83,9) должно быть подстав- подставлено значение ее нулевого приближения (84,1). Получаем J и (84,2) В этом приближении амплитуда рассеяния равна И *'*'' dV. (84,3) При этом мы ввели обозначение K = ko-k9 (84,4) где модуль вектора К в соответствии с рис. 24 определяется со- соотношением /C = *|n-no| = 2*sin-|=^sin-|. (84,5) Вектор К часто называют вектором столкновений. Соответствен- Соответственно вектор Р = ЬК носит название вектора передачи импульса. Если потенциальная энергия не зависит от углов U=U(\r\),
448 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI то в (84,3) можно выполнить интегрирование по углам: Я 2Я J dq> = о оо J (84,6) В первом приближении амплитуда рассеяния определяется по- потенциальной энергией в первой степени. Тогда, если подставить (84,3) в определение (83,5), найдем U{\r'\)e*«''dY' dQ- (84,7) Выражение (84,7) носит название формулы Борна. Она на- находит широкое применение в ядерной физике. Продолжая последовательные приближения, т. е. подстав- подставляя в (83,9) волновую функцию i|) из (84,2), можно было бы найти волновую функцию и амплитуду рассеяния во втором при* ближении. Добавка к амплитуде рассеяния во втором прибли- приближении определялась бы интегралом от квадрата потенциальной энергии взаимодействия. Аналогично могут быть найдены по- поправки следующих порядков. При малых значениях угла рассеяния имеем из (84,7) 2 da Am2 J dQ, т. е. сечение оказывается не зависящим от скорости частицы. В следующем параграфе будет дан пример конкретного расчета сечения по формуле Борна. Перейдем теперь к обсуждению применимости формулы Борна. Для быстрой сходимости ряда последовательных прибли- приближений нужно, чтобы поправка к волновой функции первого приближения \|)i была мала по сравнению с волновой функцией нулевого приближения -фо, т. е. должно выполняться условие *о I. (84,8) С помощью (83,7) можно найти значение функции г|зь справедливое при произвольных значениях г; тогда (84,8)
г 84] ФОРМУЛА БОРНА 349 запишется в виде т I Г eikz'eik\r-r'\U(r')dV г-г' < 1. (84,9) Поскольку i|)i(r) убывает с увеличением расстояния от рас- рассеивающего центра, то условие (84,9) будет выполнено, если оно выполняется в начале координат. Поэтому условие (84,9) можно заменить неравенством ^IJ2—/ I*1- <84'10> Дальнейшие оценки интеграла можно привести в двух предель- предельных случаях: 1. При выполнении соотношений kR «С 1, где R— эффектив- эффективный радиус взаимодействия. Это соответствует малым энергиям частиц *<¦&¦ 2. При выполнении обратного неравенства kRsS>l. Это соот- соответствует условию Е» » В первом случае при оценке интеграла можно положить в (84,10) e**(r'+*')« 1. Тогда (84,10) дает по порядку величины т Г \U(r')\dV _ т . J р Ж' Здесь С/о — некоторое среднее значение энергии взаимодействия в области R. Запишем последнее соотношение в виде Ь2 Согласно C7,9) выражение —^г по порядку величины равно минимальной глубине потенциальной ямы радиуса R, при ко- которой возникает уровень. Мы видим, что условия применимости формулы Борна для рассеяния медленных частиц имеет про- простой смысл. Именно, средняя энергия взаимодействия должна быть мала по сравнению с минимальной потенциальной энер- энергией частицы в яме, при которой образуется связанное со- состояние. В случае большой энергии частицы область применимости формулы Борна значительно расширяется. Экспоненциальный
350 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI множитель в формуле (84,10) весьма быстро осциллирует, что приводит к уменьшению общего значения интеграла. При вычислении интеграла можно вывести медленно изме- изменяющиеся множители за знак интеграла, написав R я J J eikr' «+cos 0> sin 9 dQr' dr' о о m\Uo\R 1. При этом мы опустили интеграл от быстро осциллирующей ве- ве2k' e2tkr личины е , как малый по сравнению с оставленным. Переписав последнее неравенство в виде Uh\R^ , (84,12) мы видим, что формула Борна справедлива для частиц, имею- имеющих тем более высокую энергию, чем больше произведение U0Ry определяющееся свойствами рассеивающегося центра. В важном случае кулоновского поля потенциал —^- спа- спадает так медленно, что нельзя ввести понятие об эффективном размере области взаимодействия R. Ze2 Однако заметим, что при Uo = —=- входящее в неравенство (84,12) произведение U0R от R не зависит. Поэтому в кулоновском поле неравенство (84,12) приобре- приобретает вид ТГ<1- (84>!3) Неравенство (84,13) имеет наглядный смысл: .если ввести скорость электрона на первой боровской орбите водородоподоб- ного атома с зарядом ядра Ze — величину t;fe=-j-, то фор- формула (84,13) приобретает вид ^Г<1, (84,14) т. е. скорость частицы должна быть велика по сравнению се ско- скоростью электрона на первой боровской орбите. Неравенство (84,13) требует для применимости формулы Борна тем больших энергий, чем больше заряд рассеивающего ядра.
§ 85] РАССЕЯНИЕ БЫСТРЫХ ЗАРЯЖЕННЫХ ЧАСТИЦ АТОМАМИ 351 § 85. Рассеяние быстрых заряженных частиц атомами Применим формулу Борна к вычислению эффективного сече- сечения рассеяния быстрых заряженных частиц атомами. Будем считать, что ядро атома с зарядом Ze находится в начале координат, заряд атомной оболочки распределен в пространстве с плотностью п(г). Размерами ядра будем пре- пренебрегать и считать его точечным. Дифференциальное эффективное сечение рассеяния дается формулой (84,6), которая при U = еф, где е — заряд, ф — по- потенциал электрического поля, действующего на рассеивающуюся частицу, приобретает вид I Г 2 dQ. (85,1) Интеграл в формуле (85,1) удобно выразить через распре- распределение плотности заряда в атоме. Для этого заметим, что J <p (r') eiKr' dV' представляет собой компоненту Фурье от потенциала. Она может быть выражена через компоненту Фурье от плотности заряда аналогично фор- формуле B4,25) ч. I, связывающей компоненту Фурье плотности тока с компонентой Фурье потенциала. Тогда имеем dQ. (85,2) Плотность заряда в атоме можно написать в виде р (г) = Zeb (г) - еп (г). (85,3) Для дифференциального сечения получаем окончательно: ' du = '- п{г')ег«г' dV' Лт2р2 аУ, (о5,4) где F (К) = J n (/) eiKr' dV'. (85,5) Величина F называется атомным формфактором. Ее значение определяется распределением плотности электронного заряда. Подставляя в (85,5) значение вектора столкновения К со- согласно (84,7), перепишем дифференциальное эффективное се- сечение в форме Ш2^Т- (85,6)
352 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI Рассмотрим вначале частный случай формулы (85,6). Если рассеяние происходит на точечном ядре, лишенном электронной оболочки п = О, то, следовательно, F = 0. Тогда получаем для дифференциального эффективного сечения: Мы приходим к известной формуле Резерфорда, которая получается также в классической механике. Формула Резер- Резерфорда в данном случае получена с помощью приближенного метода Борна. Интересно, однако, отметить, что при точном ре- решении задачи1) получается то же самое выражение. Так как эффективное сечение рассеяния при точном решении не содер- содержит постоянную Планка Ъ, то результаты, даваемые классиче- классической и квантовой физикой, естественно, должны совпадать. Обращение сечения в бесконечность при рассеянии на бес- конечномалые углы связано с медленным изменением кулонов- ского потенциала. Поэтому частицы рассеиваются, как бы далеко они ни пролетали от центра рассеяния. В действитель- действительности, однако, экранирующее действие электронной оболочки обеспечивает, как мы увидим дальше, конечное значение сече- сечения рассеяния. Рассмотрим теперь атомный формфактор (85,5). Эффектив- Эффективная область интегрирования в нем имеет размер порядка раз- размера атома а. Вне этой области п(г) обращается в нуль. По- Поэтому при малых углах 0, при которых /Са«С1, в интеграле (85,5) можно разложить экспоненту в ряд. Тогда имеем Z-F(K)~Z-Z-iK ln{r')r'dV'+\^n{r'){Kr'fdV. (85,8) В формуле (85,8) два первых члена взаимно сокращаются, так как заряд электронной оболочки атома равен заряду ядра. Третий член представляет дипольный момент атома, который, как мы видели (см. § 72), равен нулю. В последнем члене, ин- интегрируя по углам, получаем оо Дифференциальное эффективное сечение в предельном слу- случае Ка < 1 будет иметь вид *) См., например, Н. Мотт и Г. Месс и, Теория атомных столкнове* ний, «Мир», 1969, стр. 57.
§ 86] ФАЗОВАЯ ТЕОРИЯ РАССЕЯНИЯ 353 Таким образом, благодаря экранированию заряда электрон- электронной оболочкой дифференциальное эффективное сечение при ма- малых углах рассеяния оказывается конечной и постоянной (не зависящей от углов) величиной. Наоборот при больших углах рассеяния, когда выполнено обратное неравенство Ка^> 1, экс- экспонента в интеграле (85,5) начинает быстро осциллировать и формфактор оказывается малой величиной. Пренебрегая им по сравнению с Z, мы приходим к (85,7). Экранирование заряда ядра не проявляется при больших углах рассеяния. В качестве примера вычислим формфактор для атома во- водорода. Плотность заряда в атоме водорода в основном состоя- состоянии согласно (§ 38) равна Следовательно, формфактор определяется интегралом 1 Г -— F (К) = Аг J e a eiKrr2 dr sin 0 dQ d<p. (85,9) Направив ось z вдоль вектора /С, имеем sin Произведя интегрирование, находим окончательно: При этом дифференциальное эффективное сечение для атома водорода может быть написано в виде 12 dQ (_J1 \2mv*) L1 D + JWJ sin4L# Полное сечение получается интегрированием по всем значе- значениям угла рассеяния. Для других атомов периодической системы элементов плот* ность заряда и потенциал взаимодействия рассеиваемой ча- частицы с атомом могут быть вычислены с помощью приближен- приближенных методов Хартри или Томаса — Ферми. После этого можно производить расчет формфактора в соответствии с формулой (85,5). § 86. Фазовая теория рассеяния В предыдущих параграфах мы рассматривали один из ва- вариантов приближенной теории рассеяния. Наряду с приближенной теорией оказывается возможным развить точную теорию рассеяния, часто именуемую фазовой 12 В» Г* Левич и др., том II
354 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI теорией. В точной теории рассеяния не делается никаких упро- упрощающих предположений относительно характера взаимодей- взаимодействия частиц с рассеивающим центром. Поэтому эта теория применима при любых энергиях рассеивающихся частиц. Од- Однако, как мы увидим ниже, в точной теории эффективное сече- сечение выражается в виде бесконечных рядов, не всегда пригодных для практического использования. Общая схема фазовой теории рассеяния не отличается от принятой в § 83. Рассмотрим движение частицы в поле рассеи- рассеивающего центра. Будем считать рассеивающее поле сферически- симметричным и предположим, что вдали от центра падающая частица описывается плоской волной eikzy а рассеянная — рас- расходящейся шаровой волной. Пусть найдено общее решение уравнения Шредингера в поле с центральной симметрией. Вдали от рассеивающего центра найденное решение следует предста- представить в виде (83,3), т. е. в виде падающей плоской и расходя- расходящейся шаровой волны. Амплитуда последней, как мы знаем, определяет интересующее нас эффективное сечение рассеяния. Согласно C5,31) общее решение уравнения Шредингера в поле с центральной симметрией, не зависящее от угла ф может быть представлено разложением оо Ф = 2 AtRt (r) Pt (cos9). (86,1) Каждый из членов ряда (86,1) мы будем именовать 1-й пар- парциальной волной. Вдали от центра сил асимптотический вид радиальных функций Ri дается формулами C5,25)—35,27): (Ц) ;() _ e() Ri-Bt V kf 2)=Bt± ^ . (86,2) kf Напомним (ср. § 36), что если потенциальная энергия U(r) равна нулю во всем пространстве, то совокупность фаз б/ также обращается в нуль. Нужное нам асимптотическое выражение для г|э при движении частицы в потенциальном поле V(г) может быть записано в следующем виде: ¦ - 2 С A (cos 6) -2 -jL . (86,3) Выражение (83,3) следует теперь представить в виде (86,3). Это позволит связать коэффициенты С/ и фазы б/ с амплитудой рассеяния /(9). Проще всего привести (83,3) к виду (86,3), раз- разложив выражение (83,3) в ряд по полиномам Лежандра. При этом нам понадобится разложение плоской волны eihz только
§ 86] ФАЗОВАЯ ТЕОРИЯ РАССЕЯНИЯ 355 на больших расстояниях, которое можно найти очень просто. Запишем плоскую волну в виде ( )j Gt(r), (86,4) 1=0 где Gi(r)—неизвестная функция радиуса. Умножая последнее равенство на Pi< (cos 6) sin 9 и интегрируя по Э, найдем +i jp J eikrxPl(x)dx=Gl(r). (86,5) Мы использовали условия ортогональности и нормировки поли- полиномов Лежандра i J Pl{x)d> -1 Интегрируя левую часть (86,5) по частям, имеем .-/ х=\ Gi (г) = -—- eikTXPt (x) + члены порядка -^-. Используя, наконец, известное свойство полиномов Лежан- Лежандра ЛA)=1; Pi(—1) = (— l)z, получаем для функции Gi\r) на больших расстояниях: 2 } Таким образом, разложение плоской волны на больших рас- расстояниях представляется в виде smikr eikz = ^ .1 B/ + 1} p (cQS e) \ Разложим также /@) в*ряд по полиномам Лежандра f(e)= Зад (cose). (86,7) Подставляя в (83,3) ряды (86,6) и (86,7) и приравнивая найденное выражение и асимптотическое выражение (86,3), имеем V с, ^у (е'("-т-+\) _ е-' ik'-f*'d) _ L J [iifLti" (Л''-f) - е-(»-Щ + о, ?.] р,(cos е). ,86,8) 12*
356 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI Для выполнения равенства (86,8) при произвольных значе- значениях угла 6 необходимо, чтобы были равны между собой коэф- коэффициенты при каждом из полиномов Pt. Приравнивая эти ко- коэффициенты, находим (86,9) 2ikr Последнее соотношение должно выполняться при произволь- произвольном значении радиуса г. Это означает, что коэффициенты у экс- экспонент с одинаковыми показателями должны быть равны между собой. Отсюда находим следующее соотношение между коэф- коэффициентами: ш ) + 2ikDte 2 = Сге1\ (86,10) Находя отсюда Di и подставляя в разложение (86,7), по- получим для амплитуды рассеяния выражение /=о Дифференциальное эффективное сечение будет, следователь- следовательно, равно 2 1 4 k2 du. (86,12) Полное эффективное сечение найдем, интегрируя (86,12) и учитывая соотношения ортогональности для полиномов Ле- жандра. Простое вычисление дает: /. (86,13) Мы видим, что дифференциальное эффективное сечение и полное сечение рассеяния частицы в заданном поле сил выра- выражаются через совокупность фаз б/. Отсюда следует, что для вычисления сечений рассеяния необходимо найти решение урав- уравнения Шредингера C5,8) для частицы, движущейся в данном силовом поле. Определяя вид решения на больших расстоя- расстояниях и сравнивая его с (86,2), находим б/.
$ 86] ФАЗОВАЯ ТЕОРИЯ РАССЕЯНИЯ 357 Точное решение уравнения Шредингера позволяет найти все бесконечное множество фаз 6* и, следовательно, значение сече- сечения рассеяния. Точная или фазовая теория рассеяния была впервые развита Рэлеем, изучавшим рассеяние звуковых волн. Для решения задач квантовой механики метод Рзлея был впер- впервые использован Факсеном и Хольцмарком. Из (86,13) видно, что полное эффективное сечение можно представить в виде суммы так называемых парциальных се- сечений ° ®1 + ^ sin2 б /=0 Каждое из парциальных сечений отвечает учету одного из чле- членов ряда (86,2): s ад (cos 8) Ясно, что он описывает состояние частицы с определенным мо- моментом L2 = fi2/(/+l). По этой причине в теории рассеяния приняты обозначения, аналогичные обозначениям атомных тер- термов. Например, / = 0 отвечает 5-рассеяние, которое характе- характеризуется парциальным сечением Go; / =¦ 1 отвечает Р-рассеяние с парциальным сечением о\ и т. д. Полный поток частиц в состоянии с моментом L через про- произвольную поверхность, окружающую рассеивающий центр, ра- равен нулю. Его можно было бы вычислить по общей формуле G,3). Однако это видно и без проведения расчета, на основании общей теоремы, приведенной в § 7. Там было указано, что пол- полный поток всегда равен нулю в случае вещественной волновой функции. В нашем случае это именно так, поскольку волновая функция выражается формулой (86,2). Равенство нулю полного потока рассеиваемых частиц имеет очевидный смысл — оно означает закон сохранения числа ча- частиц в процессе рассеяния. Важно при этом заметить, что за- закон сохранения имеет место для частиц с каждым значением / порознь. К обсуждению этого обстоятельства мы вернемся еще в §91. Нахождение последовательности всех фаз б/ является, как правило, весьма сложной задачей. Кроме того, практическая ценность формул, представляемых в виде рядов, невелика, если только ряды не обладают достаточно быстрой сходимостью. Мы не можем здесь останавливаться на вопросах сходимости рядов (86,12) и (86,13) и приведем лишь окончательный результат1), !) Л. Д. Ландау и Е. М. Лифшиц, Квантовая механика, Физматгиз, 1963, стр. 547.
358 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI Для сходимости ряда (86,13) требуется, чтобы потенциаль- потенциальная энергия U(г) на бесконечности убывала быстрее, чем по закону -тг> гДе п > 2. Далее, ряд для дифференциального эф- эффективного сечения расходится при 0 = 0, если U(r) на больших расстояниях имеет вид -рг, где я<3. При r-*0 U(r) должна расти медленнее, чем 1/г2. Практическая ценность формул (86,12) и (86,13) для эффек- эффективного сечения рассеяния тем выше, чем меньше число чле- членов ряда играет существенную роль. Простое рассуждение по- показывает, что по мере увеличения энергии частицы растет число фаз бь которое необходимо учитывать в рядах (86,12) — (86,13). Действительно, пусть R— радиус области, в которой энергия взаимодействия существенно отлична от нуля. При достаточно быстром убывании U(r) введение такой величины всегда воз- возможно. Волновая функция Ri имеет первый максимум на рас- расстоянии г, определяемом из соотношения kr~l. В последующих максимумах Rt имеет значительно меньшую величину из-за убы- убывания множителя —. При малых значениях г волновая функция также мала. Та- Таким образом, волновая функция Ri имеет основное значение при г~-г* Если r~-?>Ry то в области взаимодействия волновая функция мала. Но в этом случае будет мала и амплитуда рас- рассеяния. Таким образом, испытывают эффективное рассеяние только те частицы, у которых ^-^Л. С ростом энергии частицы растет момент I эффективно рас* сеивающихся частиц. При малых энергиях число членов, кото- которые следует учитывать в разложениях • (86,12) — (86,13), срав- сравнительно невелико. Поэтому фазовая теория рассеяния особенно важна для изучения рассеяния медленных частиц. Это каче- качественное рассуждение можно заменить количественным прави- правилом, которое мы приведем без доказательства. Если классическая частица, имеющая импульс р и прицель- прицельное расстояние ьш±К штт1> (8614) при движении не проникает в область, где потенциальная энер- энергия взаимодействия частиц заметно отлична от нуля, то соот- соответствующая моменту ЬЧA + 1) фаза б/ мала1). !) Вывод этого утверждения дан в книге: Н. Мотт и Г. Me ее и, Тео- Теория атомных столкновений, «Мир», 1969, стр. 32.
§ 87] РАССЕЯНИЕ СФЕРИЧЕСКОЙ ПОТЕНЦИАЛЬНОЙ ЯМОЙ 359 Применим это правило к исследованию рассеяния медленной частицы. Пусть рассеивающий центр создает поле, эффективное действие которого простирается на область R. Под медленными мы будем понимать частицы с волновым числом k, для кото- которого kR < 1. В этом случае Pi>R, (86,15) для всех значений I > 0. Все фазы, кроме 6о< малы. Мы ви- видим, таким образом, что для рассеяния медленных частиц суще- существенную роль играет только S-рассеяние. Дифференциальное эффективное сечение при этом равно da = -^ | е™* - 1 I2 du = ^^- dQ, (86,16) поскольку Р0@)= 1. Эффективное сечение S-рассеяния не зависит от угла рас- рассеяния. Это означает, что рассеяние является сферически-сим- сферически-симметричным. С увеличением энергии частицы начинают играть роль фазы более высокого порядка и рассеяние постепенно приобретает все более асимметричный характер. При больших энергиях эффективное сечение становится су- существенно отличным от нуля только для очень малых углов в. Это лучше всего можно увидеть с помощью формулы Борна (84,3). При больших энергиях вектор К велик, интеграл быстро осциллирует, и поэтому эффективное сечение мало. При 0 = 0 вектор К равен нулю и осцилляция отсутствует, а эффективное сечение велико. Заметим, наконец, что фазовая теория рассея- рассеяния в том виде, как она изложена здесь, неприменима к рас- рассеянию в кулоновском поле. Волновая функция в этом случае не имеет асимптотического вида (83,3). Это обстоятельство свя- связано с очень медленным падением кулоновского потенциала как функции расстояния. Указанный случай требует особого рас- рассмотрения *). § 87. Рассеяние сферической потенциальной ямой (понятие о резонансном рассеянии) В качестве примера использования фазовой теории рассея- рассеяния рассмотрим рассеяние частицы в потенциальном поле, кото- которое определим следующим образом: U=-Uo при r<R, U = 0 при 1) Точное решение этой задачи см., например в книге Л. Д. Ландау и Е. М. Л и ф ш и ц, Квантовая механика, Физматгиз, 1963, стр. 597.
360 ТЕОРИЯ РАССЕЯНИЯ [ТЛ ХГ Для простоты мы ограничимся случаем, когда рассеиваемая частица имеет малую энергию, т. е. &/?<1, Е <С ?/0. В этом случае, как мы знаем, существенно S-рассеяние, и нам потре- потребуется определить только фазу 8о. В случае потенциального поля, заданного формулой (87,1), решение задачи не представ- представляет труда. С помощью найденных соотношений мы сможем проиллюстрировать также весьма интересное явление, возни- возникающее в процессе рассеяния, так называемое резонансное рас- рассеяние. Оно заключается в том, что эффективное сечение рас- рассеяния при известных условиях оказывается весьма большим. Этот эффект имеет место тогда, когда в потенциальном поле существует уровень энергии, близкий к нулю, а энергия рас- рассеиваемой частицы достаточно мала. Представим волновую функцию в виде -ф= A0RQ(r) = —- Функция %(г) удовлетворяет уравнению ^ = 0 при r>R, (87,2) 0 = О при г<#, (87,3) где Q2 _2m{E + Uo) Р - р • Вид функции х при г > R легко получается из решения уравне- уравнения (87,2): % = Csin(kr + 60). (87,4) В общем случае функция % имеет вид (87,4) только на больших расстояниях [ср. с формулой (86,2)]. Однако в нашем случае в силу резкой границы потенциальной энергии функция Rq имеет вид (86,2) на всех расстояниях r>R. При г < R получаем X = A sin рг + В cos pr, где А и В — постоянные. Функция /?0 должна оставаться конеч- конечной при г—>О. Поэтому коэффициент В следует положить рав- равным нулю. Таким образом, получаем X = i4sinPr при r<R. В точке г = R функция г|? и ее первая производная должны быть непрерывны. Эти два соотношения удобно заменить равен- равенством логарифмических производных. Тогда найдем pctgP* = *ctg(ft* + ^). (87,5) Мы, таким образом, получили трансцендентное уравнение для фазы бо- Предположим вначале, что фаза 6о мала. Тогда ctg(kR + 60) можно разложить в ряд по малому аргументу
§ 87] РАССЕЯНИЕ СФЕРИЧЕСКОЙ ПОТЕНЦИАЛЬНОЙ ЯМОЙ 361 kR + бо. Имеем в результате: откуда можно найти фазу бо, которая равна Из соотношения (87,6) мы видим, что фаза действительно будет значительно меньше единицы, если выполняется соотно- соотношение Дифференциальное эффективное сечение легко можно найти, используя формулу (86,16) и помня, что бо <С 1. Оно имеет вид Возможен, однако, такой вид потенциальной ямы, для которой Р ctg $R приближается к нулю. В этом случае неравенство (87,7) нарушается, а фаза бо велика. Для того чтобы выяснить условия, при которых фаза бо велика, установим связь между величиной pctgp#, входящей в формулу (87,5), и уровнем энер- энергии частицы, находящейся в связанном состоянии. В § 37 мы получили для уровней энергии частицы, находящейся в потен- потенциальной яме, формулу C7,6), 2/п(Е/0-е) , 2 п /*2m(t/o-e)/?2 _ 2me 52 Ctg у р ~~Wy где e — уровень энергии частицы в яме. Если уровень энергии частицы в яме близок к нулю, т. е. е <t, UOi то соотношение (87,8) переписывается в виде 2/nt/o (87,9) В рассматриваемом случае энергия рассеиваемой частицы также невелика (?<(/0), поэтому соотношение (87,9) можно записать в форме ^ (87,10) Мы видим, таким образом, что рост фазы б0 связан с наличием близко расположенного к нулю уровня энергии е. Перейдем теперь к вычислению фазы в том случае, когда соотношение (87,7) нарушается, а фаза бо велика. Обозначим это значение, фазы через б0. р- Найдем б0. р опять из соотношений
362 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI (87,5). Для этого clg(kR + б0.Р) разложим в ряд по малому параметру kR и ограничимся нулевым членом разложения. При этом получим: Возводя полученное соотношение в квадрат и используя фор- формулу (87,10), найдем ctg260.p = -J-. (87,11) Мы видим теперь, что фаза б0. Р не будет малой величиной, если е < Е. Эффективное сечение рассеяния найдем с помощью общей формулы (86,16). Имеем в этом случае 2 - <87'12> Последнее выражение носит название формулы Вигнера. Легко заметить, что эффективное сечение в случае резонанса значи- значительно больше сечения в случае отсутствия последнего. Отноше- Отношение сечений равно ар sin2 6Ot p Ц Так как 6о <С 1, a sin60. p, как это видно из формулы (87,1 при е ~ Е близок к единице, то очевидно, что Мы получили формулу (87,12) для частного вида потенци- потенциальной энергии. Необходимо отметить, однако, что зависимость эффективного сечения от е (87,12) является общей и не связана с конкретным видом потенциальной энергии *). Резонансное рассеяние имеет место и в том случае, когда система не имеет реального, близкого к нулю уровня, но кон- фигурация поля близка к той, при которой такой уровень по- появляется. Такой ситуации отвечает положительность функции ctg Р#, в то время как реальному уровню обязательно отвечает случай ctgp/?<0 (см. § 37). Соотношение (87,10) содержит ctg2 р/? и поэтому выполняется независимо от знака функции ctg р/?. В том случае, когда ctg pi? > 0, рассеяние происходит не на реальном, а на виртуальном уровне. 1) Более общий вывод формулы для резонансного рассеяния см. в книге Л. Д. Ландау и Е. М. Л и ф ш и ц, Квантовая механика, Физматгиз, 1963. стр. 584.
§ 88] УПРУГОЕ РАССЕЯНИЕ ТОЖДЕСТВЕННЫХ ЧАСТИЦ 363 С помощью полученных соотношений можно легко найти также дифференциальное эффективное рассеяние на потенциаль- потенциальном барьере, т. е. на потенциальном поле, имеющем следую- следующий вид: ?/ = 0 при r>R, U = \U0\ при r<R. Для этого достаточно провести замену р -> ф. Тогда для дифференциального эффективного сечения получим Формула (87,13) упрощается в случае бесконечно высокого по- потенциального барьера Uo —> сю. В этом случае для полного эф- эффективного сечения найдем следующее выражение: (87, К) Интересно заметить, что эффективное сечение рассеяния в этом случае в четыре раза больше геометрических размеров рассеивателя. § 88. Упругое рассеяние тождественных частиц До сих пор мы предполагали, что рассеиваемая частица и рассеиватель являются различными частицами. Перейдем теперь к рассмотрению случая, когда рассеивающая и рассеиваемая частицы являются тождественными. Тождественность частиц, как мы сейчас увидим, существенно сказывается на процессе рассея- рассеяния. Мы начнем с рассмотрения частиц со спином, равным нулю. Предположим сначала, что тождественные частицы движутся навстречу друг другу с равными скоростями. В этом случае центр инерции системы покоится и волновая функция системы будет в соответствии с A4,14) иметь вид Ч> = ^ (х, У у г) и зависеть только от относительных координат. Волновая функ- функция г|)о(#, У, z) удовлетворяет уравнению , у, г). (88,1) Приведенная масса двух одинаковых частиц равна \л = га/2. Мы не можем для нашего случая писать волновую функцию в виде фв+в, так как эта функция не удовлетворяет требованиям симметрии.
364 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI В самом деле, перестановке двух частиц местами, т. е. за- замене Х\->Х2\ У\->У2> Z\->Z2, соответствует согласно A4,6) пре- преобразование г —> — г. При этом модуль вектора г не изменяется, а угол 9 заменяется на я — 8. Учитывая последнее преобразо- преобразование, легко найти, что симметризованная волновая функция должна иметь вид ф, = eikz + e-ikz + ^~ [f (8) + / (я - 6)]. (88,2) Расходящаяся волна опять описывает рассеянные частицы. Дифференциальное эффективное сечение рассеяния дается те- теперь выражением dG = \f{Q) + f(n-Q)\2dQ = \f(Q) + f{n-Q)\2sinQdQdcp. (88,3) Таким образом, мы нашли дифференциальное эффективное се- сечение процесса, при котором одна из сталкивающихся тожде- тождественных частиц рассеивается на угол 8 по отношению к направ- направлению первоначального полета. Из формулы (88,3) следует, что число частиц, рассеянных на угол 8 и на угол я — 8, одинаково. Если одна из частиц до столкновения покоилась, то дифференциальное эффективное се- сечение в этой системе координат может быть найдено следующим образом. В системе координат, где центр инерции покоится, диф- дифференциальное эффективное сечение дается выражением (88,3). Переход к лабораторной системе совершается-с помощью фор- формул (83,2). В данном случае масса частиц одинакова, и мы по- получаем и соответственно Выражая дифференциальное эффективное сечение как функ- функцию угла fti, находим da = | / B#0 + f (я - 2ЪХ) |2 4 cos Ьх sin fy d®{ dcpt « + / (я - 2*0 |2 4 cos ¦&! duu (88,4) где dQ\ — элемент телесного угла в лабораторной системе. Выражение (88,4) дает дифференциальное эффективное се- сечение процесса, при котором одна из частиц рассеялась в эле- элемент телесного угла dQi. Поскольку обе частицы тождественны, вопрос о том, какая именно частица движется в элементе угла dQ\ первоначально двигавшаяся, или покоившаяся, лишен физического смысла.
§ 88] УПРУГОЕ РАССЕЯНИЕ ТОЖДЕСТВЕННЫХ ЧАСТИЦ 365 В качестве примера применения формулы (88,4) рассмотрим столкновение двух тождественных частиц, у которых энергия взаимодействия имеет простейший вид U=*U0 при r<R, ?/ = 0 при r>R. Будем считать, что до столкновения одна из частиц покои- покоилась, а другая — двигалась достаточно медленно, так, чтобы выполнялось соотношение kR <С 1. В этом случае bi <C 1 и ам- амплитуда рассеяния в соответствии .с (86,11) может быть запи- записана в виде /О)—Г* Для дифференциального эффективного сечения рассеяния в лабораторной системе получаем 1662 da = | / B*0 + / (я - 2ЪХ) |2 4 cos ^ йп{ = -^ cos Ьх dQx. Мы видим, таким образом, что если в системе центра инер- инерции рассеяние сферически-симметрично, то в лабораторной си- системе дифференциальное эффективное сечение пропорционально косинусу угла рассеяния. Теория рассеяния тождественных частиц со спином, отлич- отличным от нуля, строится по такой же схеме, как и для частиц без спина. Для конкретности мы будем считать, что обе сталкиваю- сталкивающиеся частицы имеют спин 1/2. Обобщение теории на случай произвольного спина не представляет труда. Рассмотрим столкновение двух тождественных частиц в си- системе координат центра инерции в случае, когда полный спин системы равен нулю (т. е. спины частиц ориентированы анти- параллельно). При этом спиновая часть волновой функции должна быть антисимметричной и, следовательно, координатная часть симметрична. Иными словами, координатную часть вол- волновой функции можно, как и в случае частиц без спина, пред- представить в виде ^ -Q)}. (88,5) Соответственно для дифференциального эффективного сечения рассеяния имеем (88,6) Если полный спин равен единице (т. е. спины ориентиро- ориентированы параллельно), то спиновая часть волновой функции сим- симметрична* а координатная антисимметрична. Поэтому для
366 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI последней можно написать асимптотическое выражение ikr Ъа = е1к*-е-Шг + ?т-тЪ)-!{п-Щ. (88,7) При этом для дифференциального эффективного сечения полу- получаем doa = \f(Q)-f(n-Q)\2cKl. (88,8) Выше мы рассмотрели процессы, в которых рассеиваемые частицы имели определенную ориентацию спина. Однако часто при рассеянии частицы находятся в состоянии с неопределенным спином. В этом случае обычно интересуются средним эффек- эффективным сечением, которое получается при усреднении по всем возможным спиновым состояниям. Среднее сечение для частиц со спином !/2 легко может быть найдено из следующих сообра- соображений. Сталкивающиеся частицы могут находиться в четырех состояниях: в одном состоянии со спином 0 и в трех состояниях со спином 1 (три возможные проекции на ось г). Поскольку все эти состояния равновероятны, то состояние со спином 0 имеет статистический вес, равный 74, а вес состояния со спином 1 равен 3Д. Поэтому среднее дифференциальное эффективное се- сечение можно представить в виде do=\des + ^dea. (88,9) В качестве примера рассмотрим рассеяние двух медленных тождественных частиц со спином 7г, У которых энергия взаимо- взаимодействия может быть записана в виде U = U0 при r<R, ?/ = 0 при r>R. В случае параллельных спинов сечение рассеяния, даваемое вы- выражением (88,8), оказывается равным нулю: Следовательно, рассеяние частиц с параллельными спинами свя- связано с эффектами старших порядков, т. е. Р-, F- и т. д. рассея- рассеянием. Сечение рассеяния частиц с антипараллельными спинами при малых энергиях то же, что и у частиц со спином, равным нулю, Среднее эффективное сечение в соответствии с формулой (88,9) дается выражением
§ 89] УЧЕТ ПОЛЯРИЗАЦИИ В ПРОЦЕССАХ РАССЕЯНИЯ 367 Мы видим, таким образом, что учет тождественности приво- приводит к появлению существенной зависимости эффективного сече- сечения рассеяния от взаимной ориентации их спинов. Переход от сечений, вычисленных в системе координат центра инерции, к сечениям в лабораторной системе координат произ- производится так же, как и у частиц без спина. § 89. Учет поляризации в процессах рассеяния Все результаты, которые были получены ранее, относились к рассеянию пучков, в которых все частицы находились в одном и том же состоянии, т. е. описывались одной и той же волновой функцией. Однако частицы пучка могут находиться в разных спиновых состояниях. Мы ограничимся далее рассмотрением пучков, составленных из частиц со спином У2, рассеиваемых на неполяризованных мишенях. Как известно, каждая из частиц пучка описывается двухкомпонентным спинором. В § 61 было показано, что произвольное состояние частицы является в то же время состоянием с определенной проекцией спина на некоторое направление в пространстве. Иными сло- словами, для состояния с неопределенной проекцией спина на ось z всегда найдется такая ось г\ по отношению к которой указан- указанное состояние будет состоянием с определенной проекцией спина. Мы видим, следовательно, что если пучок состоит из ча- частиц, находящихся в одинаковом состоянии, то он будет пол- полностью поляризован вдоль некоторого направления. Если пучок частично поляризован, то частицы описываются разными спи- спинорами. В этом случае пучок не может быть описан с помощью волновой функции, и мы имеем смесь состояний (см. § 23). Тем не менее для описания спиновых свойств частиц пучка можно ввести некоторую функцию ф, определяемую равенством 1) Ф = c^iBi + с2^2.г2 + ... Суммирование производится по спиновым состояниям частиц пучка. Через ф& мы обозначили спинор, описывающий группу частиц, находящихся в k-м спиновом состоянии. Коэффициент с;г определяет вес этого состояния. Он пропорционален числу ча- частиц в данной группе. Величины е* и е&, удовлетворяющие усло- условию ej=l и 8.е^ = 0, введены для того, чтобы в квадратичных выражениях, определяющих средние значения, исключить интер- интерференцию между волновыми функциями частиц, находящихся в различных спиновых состояниях. Определим вектор поляризации !) L. Wolfenstein, Phys. Rev. 75, 1664 A943). Имеется русский пере- перевод в сборнике «Проблемы современной физики», № 6, 1955, стр. 53.
368 ТЕОРИЯ РАССЕЯНИЯ как вектор спина, усредненный по пучку: ф+ф 2/ "•¦ / Ф« Фп ГГЛ. XI (89,1) Формула (89,1) имеет простой смысл: (ф^отф^) представляет среднее значение вектора спина в п-м состоянии, а отношение I 12 ¦ 'Сп' определяет вероятность реализации п-то состояния в пучке. Последняя вероятность равна -~, где Nn — число ча- частиц, находящихся в п-м состоянии, а N — полное число частиц в пучке. Запишем спфп в виде <VP« =("*). (89,2) Подставляя выражение (89,2) в (89,1), легко находим компо- компоненты вектора поляризации: 2 Re 2 u'vn у== п п 2 п ( 2 A '( «п Im «л Un I2+ п 12 + 1— Vn2) VnV) (89,3) Если половина частиц, составляющих пучок, поляризована в каком-нибудь направлении, например, в положительном на- направлении оси z, а другая половина — в обратном направлении, вектор поляризации пучка Р будет равен нулю. Действительно, одна группа частиц описывается спиновыми функциями тогда как другая группа обладает спиновыми функциями
§ 89] УЧЕТ ПОЛЯРИЗАЦИИ В ПРОЦЕССАХ РАССЕЯНИЯ 369 Подставляя эти значения в (89,3), находим, что вектор поляри- поляризации равен нулю. Перейдем теперь к случаю рассеяния частицы со спином по- половина на мишени со спином 0. При этом волновая функция г|), описывающая процесс упругого рассеивания, на больших рас- расстояниях имеет вид ikr г|) = ф^ + ±_^ (89,4) Здесь ф — спинор, характеризующий состояние падающей ча- частицы; / — некоторая двухрядная матрица, зависящая от углов рассеяния. Установим ее общий вид. Прежде всего заметим, что любая двухрядная матрица может быть выражена через еди- единичную матрицу и матрицы Паули oXi otJ, az, так как указанные матрицы составляют полную систему (см. § 60). Соответственно имеем (89,5) Дальнейший вид функций g и h может быть получен из следую- следующих соображений. Закон преобразования первого и второго чле- членов в формуле (89,4) при пространственных вращениях и отра- отражениях должен быть одинаков. Поскольку первый член преоб- преобразуется как спинор, второй член в этой формуле также должен иметь характер спинора. Отсюда следует, что функция g дол- должна быть скаляром. Поскольку оператор а преобразуется как псевдовектор, h тоже должен быть псевдовектором. С другой стороны, псевдовектор h зависит от величин, характеризующих процесс рассеяния, и может определяться только двумя векто- векторами, k0 и k\ (волновые векторы частицы до и после рассеяния). Из этих двух векторов можно построить единственный единич- единичный псевдовектор поэтому где /г@) скаляр. Окончательно получаем (89,6) Сечение упругого рассеяния, соответственно, имеет вид |?. = ф+/+/ф = | g f +1 h f + 2 Re {g*h) fin, (89,7) где fi = ф+<тф.
370 ТЕОРИЯ РАССЕЯНИЯ (ГЛ. XI Усредним выражение (89,7) по спиновым состояниям частиц падающего пучка. Тогда, пользуясь (89,1), найдем Ж = \8 I2 +1 h ? + 2 Re(g'h)Рпадп = где РПад — вектор поляризации падающего пучка. Если падающий пучок не поляризован (Люд = 0), то диф- дифференциальное эффективное сечение равно Js = \g? + Yhf. (89>9) Перейдем теперь к исследованию состояния рассеянного пучка. Подчеркнем, что после рассеяния может возникнуть по- поляризация пучка даже и в том случае, когда падающий пучок был не поляризован. Из общих соображений легко указать на- направление поляризации рассеянного пучка. Действительно, по- поляризация описывается псевдовектором Р, который может быть ориентирован только в направлении единственного псевдовек- псевдовектора п. Следовательно, для рассеянного пучка, который был да рассеяния не поляризован, имеем Ррасс = РрассЯ- (89,10) Определим величину поляризации рассеянного пучка. Основы- Основываясь на определении (89,1), имеем Ррасс = 2(/ф)+(/ф) = hvtrh' (89Л Поскольку, по предположению, падающий пучок не поляри- поляризован, его можно представить в виде двух пучков, состоящих из одинакового числа частиц, но с противоположно направленными спинами. Тогда суммирование по п сводится к суммированию по двум состояниям, характеризующимся противоположно на- направленными спинами. Следовательно, имеем 2 р _ isal * расе о • 2 Мы видим, что для вычисления поляризации нужно найти суммы диагональных элементов (шпуры) матриц некоторых one-
§ 89} УЧЕТ ПОЛЯРИЗАЦИИ В ПРОЦЕССАХ РАССЕЯНИЯ 371 раторов. В обозначениях § 45 последнюю формулу можно пере- переписать в виде Вычислим прежде Sp /+0/. Используя для этого выражение (89,6), имеем Sp f+af = Sp {[g*I + h* (no)] a[gl + h (no)]}. Легко заметить из формул F0,15), F0,16), что Sp Oi = 0 (i = 1, 2, 3). Из соотношений типа.сгхсгу = iaz следует, что Так как а] = /, то Spa] = 2 (/=1, 2, 3). Пользуясь этими соотношениями, получаем Sp f+of = Sp [g*ho (па) + h*g (па) а] = = Sp (g*h + h*g)(olnj + olnyj + a\nzk) = An С помощью аналогичных вычислений найдем Таким образом, вектор поляризации рассеянного пучка имеет вид р 2Re(gVQ _ feXfei ГЯО 1^\ расс~ I^ Л Л [ру1б) Используя (89,13) и (89,8), выразим эффективное сечение рас- рассеяния через вектор поляризации J*SL= (\ 0 12 i | U |2W1 1 р р \ /оп 1Д\ rfQ VI ь I * I rfc I / \1 ^ * пад* расе/» 1оу»*т7 где Ррасс — вектор поляризации пучка рассеянных частиц в том случае, когда пучок до рассеяния был не поляризован. Мы видим, таким образом, что эффективное сечение рассея- рассеяния зависит от поляризации падающего и рассеянного пучков. Экспериментально такие зависимости можно наблюдать в опы- опытах по двойному рассеянию. Неполяризованный пучок частиц (рис. 25) после рассеяния поляризуется. Затем поляризованный пучок частиц падает на второй рассеиватель. При этом эффек- эффективное сечение для рассеяния налево (вектор k2) и направо (вектор ki) оказываются различными. Для простоты предположим, что все векторы ft, ftb ft2 и кг лежат в одной плоскости. Вектор л, характеризующий поляри- поляризацию после первого рассеяния, направлен вверх перпендику- перпендикулярно к плоскости чертежа. Векторы Ррасс, входящие в фор- формулу (89,14), имеют противоположные направления для пучков,
372 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI рассеянных вторично налево и направо, из-за разных направ- направлений векторов fe и иг. Таким образом, эффективное сечение для пучка, рассеянного налево, равно ^ (89,15) (89,16) Соответственно для пучка, рассеянного направо, имеем da = A«ГР + |АР)[1- Pp.ee (90 Р: расс Мы видим, что отношение числа частиц, рассеянных налево и направо, определяется поляризацией РраСс. Имеем pacc (в2) # В качестве примера рассмотрим рассеяние нейтрона на ядре с учетом спин-орбитального взаимодействия между ними. Пред- Представление об этом взаимодействии впервые ввел Ферми для объяснения явления поляри- §г/Т~~Ч *г зации быстрых нейтронов. Оно имеет вид Н' = V (г) + W (г) а/. (89,18) Здесь V(r) и W{r) — функции, зависящие только от радиуса. I — оператор орбитального момента нейтрона. Из эксперимента следует, что при ядер- Рис. 25. ных взаимодействиях четность сохраняется. Оператор (89,18) построен так, чтобы он ав~ томатически удовлетворял этому закону сохранения. Для даль- дальнейшего удобно записать функцию W(r) в виде k Найдем функции g и h, используя борновское приближение. Как было показано в § 84, амплитуда f в этом приближении равна f = - -—¦ J е-м*гЙ' (г) е{*" dV = T3F dV где Vk-k' — компонента Фурье функции V. С помощью элемен- элементарных преобразований находим
§ 90] ПЕРЕХОД К КЛАССИЧЕСКОМУ ПРЕДЕЛУ 373 Интегрируя по частям, получим f = - -Ш {F*«-*' + ha[ko x J Y ™ - -Ш {K*»-*' -iba [fc° X kl] r*»-ftl)- (89> I9) Сравнивая (89,19) и (89,6), находим функции hug. Они имеют вид 171 Лг t iftlk Sill 9 тг /ПГ\ ГЫ\\ Отметим, что в рассматриваемом первом приближении тео- теории возмущений отсутствует поляризация рассеянных частиц. Действительно, подставляя соотношение (89,20) в формулу (89,13), получаем Ррасс = 0. Однако при более точном вычисле- вычислении Ррасс =? 0. Более общий формализм, пригодный для рассмотрения рас- рассеяния частиц на поляризованных мишенях, читатель найдет, на- например, в книге Давыдова *). § 90. Переход к классическому пределу в квантовых формулах рассеяния Преобразуем предварительно точную формулу для ампли- амплитуды рассеяния к виду, удобному для перехода к классическому пределу. Если мы используем разложение б-функции по полиномам Лежандра (III, 11), то амплитуда рассеяния (86,11) может быть записана в виде /=0 Для всех углов 0 =? 0 формула (90,1) принимает вид (90,2) В квазиклассическом приближении радиальная часть волновой функции имеет вид D3,2) TW 1 fi/ Ь2A+т) J-J У 2m[E-U{r)] V^ А. С. Давыдов, Теория атомного ядра, Физматгиз, 1958, стр. 350е~
374 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI Выражение для Rt нужно понимать как асимптотическое вы- выражение, т. е. считать в нем г->оо. Через а обозначена коорди- координата точки поворота, в которой полная энергия Е равна сумме потенциальной и центробежной энергии, т. е. ?-"(«> + \J . В § 40 в условие для определения точки поворота не была включена центробежная энергия, поскольку движение считалось одномерным. Сравнивая выражение для Ri с формулой (86,2), мы видим, что фаза рассеяния может быть представлена в виде В (90,3) нужно считать г--»оо, / ^> 1. При этом значения фаз di очень велики по абсолютной величине. Формула для ам- амплитуды рассеяния (90,2) может быть упрощена, если учесть, что в квазиклассическом приближении следует считать / ^> 1. Тогда для полиномов Лежандра P/(cos0) можно написать асим- асимптотическое выражение при / ^> 1. Оно имеет вид1) Тогда для амплитуды рассеяния получаем f ¦ ik S lpi (cos e>еЩ=т SB где Для получения /F) следует просуммировать ряды ') Н. Н. Лебедев, Специальные функции и их приложения, Физмат- гиз, 1953, стр. 256.
§ 90] ПЕРЕХОД К КЛАССИЧЕСКОМУ ПРЕДЕЛУ 375 Мы рассмотрим один из этих рядов, поскольку, как это будет ясно из дальнейшего, в заданном поле сил (отталкивания или притяжения) только один из рядов имеет сумму, отличную от нуля. Величины а(/), как видно из их определения, при боль- больших / велики. Поэтому члены ряда 2В(/)е/>а(/), содержащие быстро осциллирующие множители, взаимно погашаются. Исключение возможно в том случае, если при некотором значе- значении / = /о величина а (/о) имеет экстремум, т. е. =°- (90'5) I Вблизи экстремума функция аA) изменяется медленно и сумма ряда сводится к сумме членов со значениями /, близкими к /0. В этом случае для выполнения суммирования можно заме- заменить сумму на интеграл. В последнем подынтегральное выра- выражение существенно отлично от нуля только при / » /о, и инте- интеграл можно вычислить по методу перевала (см. § 20 ч. III). Итак, можно написать: где с = - iy. (90,6) Вычисление интеграла (90,6) производится непосредственно, и мы получаем " " .--"-V"- (90O) С помощью последнего соотношения амплитуда рассеяния может быть написана в виде (90,8) Величину а (/о) мы найдем в дальнейшем, а пока рассмотрим физический смысл уравнения (90,5). Для этого определим про- производную -тг . С помощью соотношений (90,4) имеем da dl = 2 dl = 0. (90,9) При дифференцировании следует помнить, что угол в за- задан, и мы определяем эффективное сечение для определенной величины угла. Если провести дифференцирование по / и
;37б ТЕОРИЯ РАССЕЯНИЯ [ГЛ XI использовать формулу (90,3), то мы получим: +4-W \ = _ Г 2m(E-U) I 1 \2 I +1Г] (da\ ,h da . da " а Г W/.+-V 2m(E-U) поскольку в точке поворота г = а подкоренное выражение обра- обращается в нуль. Условие (90,9) приобретает вид оо / 1 Ъ /0 + -S" 1 2tn(E-U) Г2 Если бы мы проводили соответствующие вычисления для вто- второй суммы, то экстремуму р(/) отвечал бы нижний знак в (90,10). Для краткости оба условия совмещены. Формула (90Д0) определяет значение /0. Величина Auo + yj = L представляет собой момент коли- количества движения. После введения момента L формулу (90,10) можно преобразовать к виду Ldf yt -Ц±. (90,11) В классической механике момент количества движения мо- может быть связан с параметром соударения р с помощью сле- следующего соотношения: L = три, тде v — скорость частицы на бесконечности. Подставляя это значение для момента количества движения в формулу (90,11), мы получаем выражение, в точности совпадающее с класси- классическим соотношением, связывающим параметр соударения с
§ 90] ПЕРЕХОД К КЛАССИЧЕСКОМУ ПРЕДЕЛУ 377 углом рассеяния 01), оо Г Jar* mvpdr =Л|1. (90,12) Значение прицельного параметра р определяется положи- положительным корнем уравнения (90,12). Из механики известно, что в поле сил отталкивания положительный корень этого уравне- уравнения существует только при отрицательном знаке при 6. Наобо- Наоборот, в поле сил притяжения этот, корень имеется при положи- положительном знаке при 0. Рассмотрим случай сил отталкивания. Тогда условие (90,9) может выполняться только для а(/), но не для jJ(/). Соответ- Соответственно, лишь первый из рядов в (90,4) имеет сумму, отличную от нуля. Перейдем теперь к вычислению сечения. Согласно формулам- (83,5) и (90,8) оно определяется выражением Величина у определяется выражением (90,6). С помощью (90,4) и (90,3) получим у 2m( 2m(E-U)-±r (90,13) Используя (90,11), преобразуем выражение для y к виду Y ~ * 2 dL • Если подставить значение В из (90,4) и использовать найден- найденное значение для у, то дифференциальное эффективное сечение приобретает вид ^ffl (90,14) Заменяя в (90,14) величину L на ее классическое значение, по- получим 1) См., например, Л. Д. Ландау и Е. М. Л и ф ш и ц, Механика, Физ- матгиз, 1958, стр. 64.
378 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI Выражение (90,15) представляет собой обычную формулу рассеяния, даваемую классической механикой. Перейдем теперь к выяснению границ применимости фор- формулы для сечения рассеяния (90,15). Они могут быть установ- установлены из следующих наглядных соображений. О движении частицы по траектории можно говорить тогда, когда соответствующая ей длина волны мала по сравнению с размерами системы. В данном случае длина волны должна быть мала по сравнению с размерами той области, в которой происходит заметное взаимодействие. Если размер этой области обозначить через /?, то указанное требование можно записать в виде Ж Я, (90,16) где К — длина волны де Бройля. Подставляя значение К в формулу (90,16), мы находим Для того чтобы поведение частицы можно было характеризо- характеризовать классическими понятиями, надо, чтобы квантовомеханиче- ские неопределенности были малы. Иными словами, надо, чтобы выполнялись соотношения -f«l, -^<1, (90,18) где р — классический параметр столкновения, а Д0 и Ар — соот- соответственно квантовомеханические неопределенности для угла рассеяния в и параметра столкновения р. Для величины Д0 можно написать выражение, справедливое по порядку величины Д9~-^, (90,19) где А/?— неопределенность поперечной составляющей импульса. Используя соотношение неопределенности для координаты и им- импульса Ар • Др~й и исключая из (90,19) величину А/?, а затем используя (90,18), получаем |»-|г- (90>2°) Последнее условие принимает значительно более простой вид, если углы рассеяния малы. В этом случае угол рассея- рассеяния в может быть найден простым способом. Именно он ра- равен отношению величины поперечного импульса, приобретенного
§ 91] ТЕОРИЯ НЕУПРУГОГО РАССЕЯНИЯ И ПОГЛОЩЕНИЯ 379 рассеянной частицей при прохождении через поле рассеивателя к продольному импульсу. Поперечный импульс равен силе, дей- действующей на частицу ?7'(р), помноженной на эффективное вре- время т, в течение которого эта сила действует: V Таким образом, угол рассеяния 0 по порядку величины равен е«|?/'(р)|-?. (90,21) Или подставляя (90,21) в (90,20), находим условие применимо- применимости теории Если же производную U'(p) заменить через ?/(р)/р, то условие применимости перепишется в виде 1*/(рI>-у. (90,22) Сравнивая (90,22) с условием применимости формулы Бор- на (85,12), мы видим, что условия противоположны друг другу. Таким образом, борновское и квазиклассическое приближения в значительной степени дополняют друг друга, § 91. Общая теория неупругого рассеяния и поглощения частиц До сих пор мы ограничивались рассмотрением процесса уп- упругого рассеяния. Перейдем теперь к более общему случаю, ко- когда возможно и неупругое рассеяние. Неупругими называются всякие процессы, при которых изме- изменяется внутреннее состояние частиц. Так, например, неупругими будут столкновения, сопровождающиеся возбуждением (напри- (например, возбуждением атома или ядра), распадом или образова- образованием новых частиц и т. д. Каждый из возможных процессов именуется соответствующим каналом реакции. Если процесс совместим с законами сохранения, канал называют открытым. В дальнейшем мы будем рассматривать процессы, для которых открыты неупругий и упругий каналы реакции. Мы начнем с не- некоторого обобщения фазовой теории рассеяния. Это позволит нам охватить одновременно процессы упругого и неупругого рассеяния и поглощения. Для формального описания любого процесса рассеяния окружим мысленно рассеивающий центр сферой достаточно большого радиуса Ro.
380 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI Рассмотрим характер 1-й парциальной волны при г > Ro в трех случаях: 1) в начале координат нет рассеивающего центра; 2) в начале координат помещается рассеивающий центр, причем частица испытывает только упругое рассеяние; 3) в начале координат находится рассеивающий центр, на котором частица претерпевает неупругое рассеяние. В первом случае радиальная функция 1-я парциальной вол- волны может быть написана [см. C6,10)] в виде суперпозиции двух волн J^-"' Шг "l 2ikr "l kr Второе слагаемое представляет сходящуюся волну, первое—• расходящуюся. При этом мы пользуемся асимптотическими вы- выражениями, поскольку, по предположению, Ro достаточно ве- велико. Амплитуды и фазы обеих волн одинаковы и волновая функция Ri является произведением вещественной функции на постоянный множитель. Поэтому поток через замкнутую поверх- поверхность равен нулю: где ih = Во втором случае радиальная функция /-й парциальной вол- волны, согласно (86,2), запишется в виде Амплитуды сходящейся и расходящейся волн отличаются друг от друга фазовым множителем ем*9 причем |e2t6/| = l. В этом случае полный парциальный поток "через поверхность сферы также равен нулю (парциальная волновая функция, зависящая от /, вещественна). Отсюда следует, что расходящийся и сходя- сходящийся потоки /-й парциальной волны равны между собой. Тот факт, что сходящаяся и расходящаяся волны имеют разные ко- коэффициенты, е2г 1 и единицу, не противоречит этому равенству, так как |е2'б'[= 1. В третьем случае, когда частицы испытывают неупругое рас- рассеяние, написать общее выражение для радиальной функции с учетом всех возможных неупругих процессов не представляет- представляется возможным. Мы можем, однако, упростить задачу, если рас- рассматривать отдельно упругое рассеяние и всевозможные виды леупругого рассеяния.
•§ 91] ТЕОРИЯ НЕУПРУГОГО РАССЕЯНИЯ И ПОГЛОЩЕНИЯ 381 Для радиальной функции 1-й парциальной волны, описываю- описывающей упругое рассеяние частицы, в этом случае можно написать следующее формальное выражение: Это выражение построено по тому же принципу, что и (91,1), однако оно учитывает специфику процесса, при котором совме- совместно с упругим рассеянием могут существовать неупругие про- процессы или поглощение. Введенный коэффициент Si по модулю меньше единицы. Это выражает тот факт, что при наличии по- поглощения или неупругого рассеяния сходящийся поток упруго- рассеянных частиц больше расходящегося. При этом волновая функция запишется в виде — /> / I Коэффициенты bi опять определяются из требования, чтобы вол-* новая функция я|э совпадала с (83,3). Проделывая вычисления, аналогичные тем, которые были приведены при расчете упру- упругого рассеяния, найдем волновую функцию в виде ^r). (91,20 Нетрудно показать, что поток упруго-рассеянных частиц с заданным моментом через сферу радиуса r\3> Ro отличен от нуля. Действительно, имеем При этом в выражении для -^- удержаны только члены, про- пропорциональные 1//*. Члены, пропорциональные I//*2, опущены, по- поскольку мы хотим найти поток через сферу большого радиуса. Вычислим далее полный поток частиц через сферу радиуса г » #о. Он равен Подставляя в выражение для потока функцию % и -^ и учитывая условия нормировки полиномов Лежандра P/(cos9)f
382 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI получаем h--^W+l)(l-\Slfl. (91,3) Так как \Si\< 1, то поток отрицателен. Это означает, что пол- ный поток направлен внутрь сферы. Легко понять смысл полученного результата: поток падаю- падающих на центр частиц с моментом / оказывается большим, чем поток упруго-рассеянных. Частицы испытывают неупругое рассея- рассеяние или поглощение, и интенсивность пучка упруго-рассеянных частиц снижается. Ясно, что, разделив поток jt на плотность по- потока падающих частиц, мы найдем в соответствии с определе- определением парциальное эффективное сечение неупругого рассеяния. При этом под неупругим рассеянием понимается совокупность всех процессов, снижающих интенсивность упругого рассеяния. Так как плотность потока падающих частиц равна и, то для /-го пар- парциального эффективного сечения неупругого рассеяния получаем cr/Heyn = ^-B/+l)(l-|S/|2). (91,4) Что же касается амплитуды упругого рассеяния, то для нее можно, не повторяя выкладок § 86, написать выражение так как формула (91,1) отличается от (91,2) заменой e2i6* на Si, Совокупность комплексных величин 5/ определяет эффектив- эффективное сечение как неупругого, так и упругого рассеяния. В част- частности, если Si = e2t61, где б/ вещественно, то эффективное сече- сечение неупругого рассеяния обращается в нуль, а амплитуда упру- упругого рассеяния совпадает с его выражением (86,11). Наряду с /-м парциальным эффективным сечением процес- процессов упругого и неупругого рассеяния можно написать и полные эффективные сечения процессов. Полное эффективное сечение процесса неупругого рассеяния равно, очевидно, 1=0 I а полное эффективное сечение для упругого процесса равно оо J I /F) ?du = ^r ? B/+ 1)| 1 -S,f. (91,7)
-§ 91] " ТЕОРИЯ НЕУПРУГОГО РАССЕЯНИЯ И ПОГЛОЩЕНИЯ 383 Перейдем теперь к рассмотрению формулы (91,6). Каждое эффективное сечение аь можно наглядно представить себе как характеристику процесса неупругого рассеяния или по- поглощения частиц с моментом /. Так как величина |S/|2< 1, то можно утверждать, что парциальное эффективное сечение а* имеет верхний предел <rimax = -r2-BZ+ 1). Структура формулы (91,6) и физический смысл коэффициен- коэффициента 1—\St\2 могут быть легко поняты с помощью следующих рассуждений, основанных на квазиклассическом приближении. Параметр соударения частицы может быть [см. (86,14)] за- записан в виде j. pi = jVW+T). (91,8) При больших / для параметра столкновений получаем Поверхность кольца, лежащего между двумя окружностями ра- радиуса р/ и ри-ь равна 1^ Число частиц, которые проходят через это кольцо, ориенти- ориентированное перпендикулярно к падающему потоку, может быть легко найдено. Если плотность потока падающих частиц равна единице, то число частиц, пересекающих кольцо, равно числен- но -р-B/+ 1). Введем так называемый коэффициент прилипания &» кото- который, по определению, представляет собой отношение числа по- поглощенных частиц, упавших на заданную поверхность, к пол- полному числу падающих частиц на ту же поверхность. Число частиц, поглощенных поверхностью кольца, ограниченного ра- радиусами pi и р/+ь определится выражением и соответственно эффективное сечение поглощения будет иметь вид* |гB/-М)^ (91,9) Сравнивая формулу (91,6) и (91,9), видим, что 1-IS/P-gi. (91,10) т. е. величина 1—\Si\2 имеет смысл коэффициента прилипания. Наконец, получим еще формулу, связывающую эффективное сечение упругого и неупругого рассеяния. Оказывается, что имеет
384 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI место равенство -f-Im/@) = aHeynp + crynp. (91,11) Для получения этого соотношения вычислим сумму упругого и неупругого эффективных сечений. С помощью соотношений (91,6) и (91,7) имеем оо 1=0 /=0 С другой стороны, так как полиномы Лежандра при 9 = 0 равны единице, то имеем для амплитуды рассеяния а мнимая часть амплитуды рассеяния равна Сравнивая полученные выражения, мы убеждаемся в справед- справедливости равенства (91,11). Мы показали, таким образом, что сумма эффективных сечений неупругого и упругого рассеяния пропорциональна мнимой части амплитуды рассеяния, взятой при значении угла 6 = 0. Формула (91,И) носит название опти- оптической теоремы. В заключение заметим, что поглощение частиц можно опи- описать, введя комплексный потенциал U = V\ — 1Т2, где V\ и V2 — действительные функции. Мнимая часть потенциала характери- характеризует поглощение или испускание частиц. Действительно, в этом случае уравнение Шредингера имеет вид Произведя вычисления, аналогичные тем, которые проведены в § 7, мы получим ^ 0, (91,14) где
§ 92] ДИФРАКЦИОННОЕ РАССЕЯНИЕ БЫСТРЫХ НЕЙТРОНОВ 385 В стационарном случае при V2, равном нулю, div / = 0, что соответствует отсутствию поглощения или испускания частиц. Если V2 Ф 0, то мы получаем В зависимости от знака V2 последняя формула описывает испу- испускание или поглощение частиц. § 92. Дифракционное рассеяние быстрых нейтронов ядрами Изучение взаимодействия быстрых нейтронов с ядрами по- показывает, что в области энергий нейтронов, лежащей выше нескольких десятков Мэв для легких ядер и нескольких сотен Мэв для тяжелых, происходит весьма энергичный захват ней- нейтронов. Энергичное поглощение нейтронов сопровождается также их упругим рассеянием. При описании сильного поглощения бы- быстрых нейтронов весьма полезной оказалась следующая опти- оптическая аналогия: ядро по отношению к нейтронам ведет себя как идеально поглощающая (черная) сфера, на которую па- падает световая волна. Поглощение световой волны черной сферой сопровождается ее возмущением в области пространства, рас- расположенной вблизи поглотителя. Это означает, что наряду с поглощением происходит рассеяние света. Аналогично это- этому поглощение нейтронов ядром будет возмущать их вол- волновую функцию и нейтроны будут испытывать упругое рас» сеяние. Для расчета эффективного сечения упругого рассеяния ней- нейтронов воспользуемся аналогией с оптическими явлениями. В § 36 ч. IV мы видели, что при длине световой волны, мень- меньшей радиуса рассеивающей сферы, позникают дифракционные явления. При этом интенсивность света, рассеянного черным шариком радиуса R в телесный угол dQ, дается выражением C6,13) ч. IV е 'dQ, (92,1) где 0 — угол рассеяния света, / — полная интенсивность падаю- падающего на экран света, J\ — функция Бесселя первого порядка. Простая оценка показывает, что длина волны нейтронов с энергией порядка 1 Мэв в несколько сотен раз меньше размеров ядра. Поэтому к рассеянию нейтронов поглощающим ядром можно применить оптическую формулу (92,1). Для того чтобы получить дифференциальное эффективное сечение рассеяния 13 В. Г. Лезич и др., том II
386 ТЕОРИЯ РАССЕЯНИЯ [ГЛ XI нейтронов, нужно поток нейтронов, рассеянных в угол dQ, раз- разделить на плотность потока падающих нейтронов I/nR2. Тогда имеем /f (Ш) '^ (92,2) Это выражение, конечно, может быть получено и из общей формулы (91,5). Из условия «черноты» ядра следует, что коэффициент при- прилипания li равен единице для тех /, при которых р/ < R, и ^ = 0, если pi> R. Так как р/~ — / (см. § 91), то fo, j причем kR У> 1. Подставляя эти значения Si в (91,5), находим амплитуду уп- упругого рассеяния kR 2 Основную роль в сумме играют члены с большим /. Поэто- Поэтому мы можем пренебречь единицей по сравнению с 2/, а для полинома Лежандра Л (cos В) использовать приближенное вы- выражение, справедливое при 8< I1), и перейти от суммирования по / к интегрированию kR j Отсюда сразу получаем для сечения выражение (92,2). Рассмотрим подробнее зависимость дифференциального эф- эффективного сечения (92,2) от угла рассеяния 0. От азимуталь- азимутального угла дифференциальное эффективное сечение не зависит. Имеем, очевидно: da = 2nR2 sin 9 dQ. (92,3) J) См., нарример, Л. Д. Л а н д а у, Е. М. Л и ф ш и ц, Квантовая меха- механика, Физматгиз, 1963, стр. 206.
§ 92] ДИФРАКЦИОННОЕ РАССЕЯНИЕ БЫСТРЫХ НЕЙТРОНОВ 387 При малых углах kRQ < 1, разлагая в ряд функцию Бесселя, находим Jx (kRQ) » —j- . Следовательно, при малых углах эф- эффективное сечение приобретает вид Оно оказывается не зависящим от угла рассеяния 0. При возрастании углов до значений, лежащих в интервале 1^>9^>-го"> для бесселевой функции можно написать асим- птотическое выражение В этой области углов эффективное сечение, осциллируя, быстро уменьшается с ростом 0. Величина эффективного сечения в мак- максимумах убывает пропорционально 1/03. Таким образом, эффективное сечение имеет резкий максимум для рассеяния под углом 0 « О, т. е. при рассеянии вперед, по направлениям, близким к направлению падающего пучка. Полное сечение рассеяния а можно найти, интегрируя (92,3) по всему телесному углу, J e2 Ввиду быстрой сходимости интеграла вклад, вносимый в его величину большими значениями 0, мал и можно приближенно считать верхний предел интеграла бесконечным. Тогда, восполь- воспользовавшись формулой находим окончательно: a = 7tR2. (92,5) Полное эффективное сечение рассеяния нейтронов с X <с R совпадает с геометрическим сечением ядра. Определим также полное сечение поглощения нейтронов яд- ядром. Используя выражения для Si и подставляя их в формулу (91,6), получаем kR Снеупр = |г 2 B/ + 1) = Я/?2. (92,6) Следовательно, сечение поглощения нейтронов черным ядром также совпадает с геометрическим сечением ядра, 13*
388 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI Из соотношений (92,5) и (92,6) следует, что полное взаимо- взаимодействие нейтронов с ядром равно удвоенному геометрическому сечению ядра 2#2 (92,7) С помощью аналогичных приемов можно также вычислить эффективные сечения рассеяния ядрами, лишь частично погло- поглощающими падающие на них нейтроны, а также дифракционное рассеяние заряженных частиц на ядрах 1). § 93. Рассеяние медленных частиц. Пороговое приближение Применим полученные формулы фазовой теории рассеяния к нахождению эффективных сечений упругого и неупругого рас- рассеяния медленных частиц. Под медленными, как и в § 86, мы будем понимать частицы, длина волны которых К велика по сравнению с размерами области взаимодействия. Мы ограни- ограничимся случаем, когда энергия взаимодействия убывает с рас- расстоянием достаточно быстро, так что можно ввести эффектив- эффективный размер области взаимодействия а. Как мы уже видели в § 86, при малых энергиях существенно лишь S-рассеяние. Радиальная часть волновой функции, соот- соответствующая моменту / = О, удовлетворяет уравнению C5,8) и и -mf2mE Вводя волновое число & = 1/ —р- , можно переписать по- последнее уравнение в виде Ro + yRo + k2R0 ~^U(r)R0 = 0. (93,1) При г > а, вне области взаимодействия, потенциальная энергия равна нулю и уравнение для функции Ro приобретает вид Ro' + yRo + k2Ro = O. (93,2) Ясно, что потенциальная энергия обращается в нуль не резко, на некоторой границе, а в переходной области, где потенциальная энергия изменяется по некоторому сложному и обычно не из- известному закону. Поэтому на первый взгляд нахождение функции во всем про- пространстве представляется задачей нереальной степени сложно- сложности. В действительности, однако, это не так. ') Подробнее см. А. И. Ахиезер и И. Я. Померанчук, Некоторые вопросы теории ядра, Гостехиздат, 1950.
§ 93] РАССЕЯНИЕ МЕДЛЕННЫХ ЧАСТИЦ 389 Оказывается, что можно воспользоваться большим значением X или, что то же самое, малым к для существенного упрощения задачи. Именно, в области г < а, т. е. в области эффективного взаимодействия, можно пренебречь слагаемым к2 как малым по сравнению с -р- U (г). Тогда имеем Ro+jrRo-^U (r) Ro = 0. (93,3) Решение уравнения (93,3) при заданной функции U(r) мож- можно написать в виде Ro{r, cu с2), где Сх и Сг — две произволь- произвольные постоянные. Поскольку в (93,3) не входит величина k, в об- области г < а волновую функцию будем предполагать не завися- зависящей от к. Решением уравнения (93,2) служит Здесь с3 и с4 — две постоянные интегрирования, не зависящие от /*, но являющиеся, вообще говоря, функциями к. В переходной области написать уравнение для волновой функции нельзя, поскольку здесь не известен ход потенциальной энергии. Однако ширина промежуточной области мала по срав- сравнению с размером области взаимодействия и весьма мала по сравнению с длиной волны X. Между тем существенное изменение волновой функции про- происходит на длине волны. Поэтому можно пренебречь изменением волновой функции в переходной области и заменить эту область резкой границей при г = а. На эт&й поверхности оба решения должны плавно смыкаться. Ясно, однако, что сомкнуть две функции, одна из которых зависит от к как от параметра, а другая вовсе от к не зависит, можно тогда, когда в окрестности границы области функция (93,4) также становится не зависящей от к. При г ~ а величина ка мала по условию. Поэтому, разлагая экспоненты (93,4) в ряд по степеням кг и ограничиваясь двумя первыми членами разложения, получаем Яо = 27?г ' (93,5) Это выражение не будет зависеть от к в том случае, когда вы- выполняются соотношения Сь{к) + съ{к)=Шаъ \ сЛк)-с,{к)=2аи J где п\ и а2 — постоянные, не зависящие от &, величины.
390 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XF Решая систему уравнений (97,6), находим для с3 и с4: с4 = — #i + ika2, (93,7> Сравнивая выражение (93,4) с (91,2), находим величину So. Она имеет вид So f . (93,8> и с4 tka2 — al v ' r Разлагая в ряд по малым значениям &, получаем Используя формулы (91,6) и (91,7), находим выражение для эффективных сечений упругого и неупругого процессов: (93,9> Из полученных формул следует, что эффективное сечение уп- упругого рассеяния в рассмотренном случае не зависит от энергии рассеиваемой частицы. Эффективное сечение неупругого рассея- рассеяния обратно пропорционально волновому числу &, т. е. обратна пропорционально скорости частицы v. Примененный нами прием пренебрежения шириной переход- переходной зоны и замена уравнения (93,1) на уравнение (93,3) во вну- внутренней области имеет весьма общий характер и носит название порогового приближения. Пороговое приближение с успехом применяется во всех случаях, когда длину волны можно считать, большой по сравнению с шириной переходной области. В дальнейшем мы встретимся еще с использованием порого- порогового приближения. § 94. Формула Брейта — Вигнера В предыдущих параграфах мы рассмотрели законы упругого рассеяния частиц, а также поглощения частиц. Теперь мы перей- перейдем к изучению некоторых явлений, происходящих при ядерных реакциях типа А + а->В + Ь. (94,1) Здесь А и В — начальное и конечное ядра, а — падающая ча- частица и Ъ — частица, вылетающая в результате реакции. Чтобы не учитывать усложнений, связанных с влиянием электрического*
§ 04] ФОРМУЛА БРЕЙТА-ВИГНЕРА 391 лоля ядра, мы ограничимся случаем, когда падающая и выле- вылетающая частицы являются нейтронами. Изучение реакций, вызванных нейтронами со сравнительно небольшими энергиями, показало, что эффективное сечение ре- реакции в зависимости от энергии падающих нейтронов обнару- обнаруживает максимумы при определенных значениях энергии. Явле- Явление имеет ярко выраженный резонансный характер — макси- максимумы отвечают весьма узким интервалам энергии нейтронов. Для объяснения резонансного характера ядерных реакций Н. Бором была предложена следующая общая схема протекания ядерных реакций: нейтрон а, проникающий в ядро, сильно взаи- взаимодействует с ядерными частицами и передает им свою избы- избыточную энергию. Последняя равна, очевидно, сумме его кинети- кинетической энергии и энергии связи частицы в ядре ?/0. Привнесен- Привнесенная нейтроном энергия быстро распределяется между всеми .ядерными нуклонами, поскольку они сильно взаимодействуют между собой. В результате из ядра А и нейтрона возникает но- новое, так называемое промежуточное ядро С. Промежуточное ядро не является стабильной системой, поскольку его энергия выше энергии нормального состояния на величину Е + Но. По прошествии некоторого времени жизни промежуточное ядро бу- будет переходить в невозбужденное состояние. Этот переход может происходить при малых энергиях возбуждений двумя путями: во-первых, в результате флуктуации на одной из ядерных ча- частиц может сконцентрироваться вся энергия возбуждения. Эта частица (для простоты рассуждений — нейтрон) получает воз- возможность вылететь из ядра, обладая при этом энергией Е. Оче- Очевидно, что этот путь реакции отвечает упругому рассеянию ней- нейтрона ядром; во-вторых, энергия возбуждения может уноситься вылетаю- вылетающим нейтроном не полностью, а лишь частично. Остаток энергии возбуждения излучается системой ядерных частиц в виде Y-кванта. В этом случае имеет место неупругое рассеяние ней- нейтрона. Частным случаем последней реакции служит реакция ра- радиационного захвата нейтрона, при которой вся энергия возбуж- возбуждения уносится у-квантом и нейтрон остается в ядре. Для эффективных сечений упругого и неупругого рассеяния можно воспользоваться формулами (91,6) и (91,7). Мы ограни- ограничимся при этом случаем медленных нейтронов, описываемых 5-волной. Ядро будем считать сферой радиуса R. Хотя ядро нельзя считать имеющим резкую геометрическую границу, его размытость весьма мала по сравнению с длиной волны падаю- падающего нейтрона К ^ R. Нейтрон внутри ядра должен находиться в состоянии, кото- которому отвечает длина волны Хвн. На поверхности г = R должно •иметь место смыкание волновых функций, описывающих нейтрон
392 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI вне и внутри ядра. Для этого должны выполняться условия Из второго условия следует, что по порядку величины ампли- амплитуды волновых функций внешнего и внутреннего движения от- относятся как ~ ——-. Это означает, что вероятность попадания частицы внутрь ядра ~ l-jr4 » т. е. весьма мала. Лишь при особо малых значениях внутренней производной • *fBH ~ 0, внутренняя амплитуда может оказаться порядка внешней. Это значит, что при определенных условиях, в част- частности при определенной энергии нейтрона, вероятность его про- проникновения внутрь ядра оказывается достаточно большой. Соответствующая энергия определяется значением нормаль- нормальной производной волновой функции на поверхности ядра. Обозначим через f(E) величину Величина f(E) непосредственно связана с нормальной произ- производной (-?•} и зависит от энергии нейтрона Е. Легко выра- выразить через / величину So, определяющую эффективное сечение упругого и неупругого рассеяния s-волны. Подставляя в (94,2) значение г|) из (91,2), находим Г = — / —г — . Отсюда следует, что R-if(E) Поскольку f(E) является, вообще говоря, комплексной вели- величиной, можно написать: f(E) = fl(E)-if2(EI (94,4) где f\(E) и /г(?)—вещественные функции. Поскольку всегда |So|-^> 1» функция /г(?) ^ 0. С учетом (98,4), для So имеем q -год kR-ifx (E)-f2 (Е) ,0А с\
94] ФОРМУЛА БРЕЙТА-ВИГНЕРА 393 Подставляя это значение So в (91,6), находим Аналогично из (91,7) следует = JL|i _so|2 = — 11 +* *L e k2 e _ ikf? kR cos kR - /i sin kR + i/2 sin fe/? I2 = 4л kR . (94,7) Обсудим прежде формулу для огНеупр. Поскольку /2 > 0, эф- эффективное сечение имеет максимум при f\ (Ео) = 0. При энергии нейтрона, равной ?0, он с относительно большой вероятностью проникает внутрь ядра. Соответственно этому энергия ?0 отве- отвечает резонансному значению энергии ядра. Вблизи резонансной энергии функцию f\ (E) можно разложить в ряд по степеням (Е — Ео) и ограничиться первым членом разложения Можно показать1), что величина /'(?0)<0. Введем обозна- обозначения: Г — — Г 1*~ f'(E0)> 1г~ Тогда находим В формуле (94,7) для ауПр при Е « ?0 обычно первое слагае- слагаемое велико по сравнению со вторым и можно написать (<У,)упр ^ 4" ' Г2" • (94> Ш) Формулы для сечений упругого и неупругого рассеяния медлен- медленных нейтронов носят названия формул Брейта — Вигнера. Для выяснения физического смысла введенных величин Ге, Гг и Г полезно сравнить формулы Брейта — Вигнера с дисперсионными формулами теории рассеяния света (§ 109). Мы видим, что об- общая структура формул совпадает. Это вполне естественно, так как формулы Брейта — Вигнера можно было бы получить, 1) См. А. И. Ахиезер и И. Я. Померанчук, Некоторые вопросы теории ядра, Гостехиздат, 1950, стр. 239.
394 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XF рассматривая реакцию как переход системы (ядро + нейтрон) иа начального в конечное состояние через некоторое промежуточ- промежуточное состояние — промежуточное ядро (т. е. по той же схеме, что и при рассеянии фотонов). Непосредственное применение теории возмущений приводит к формулам Брейта — Вигнера. Однако такой способ получения формул Брейта — Вигнера нельзя счи- считать обоснованным, поскольку возмущение состояния нейтрона нельзя считать слабым. Тем не менее такое наглядное, но нестрогое вычисление пока- показывает, что величины Те и Гг характеризуют вероятности пере- переходов. Именно, Те пропорциональна матричному элементу пере- перехода системы из промежуточного состояния (ядро С) в конечное (ядро А и нейтрон с энергией Е). Поэтому величина Ге, которую называют частичной шириной резонансного уровня ?, отвечаю- отвечающей упругому рассеянию, определяет вероятность распада ядра. С с упругим рассеянием нейтрона. Гг называется частичной ши- шириной резонансного уровня по отношению к реакции. Она опре- определяет вероятность распада ядра с неупругим рассеянием и за- захватом нейтрона. В случае медленных нейтронов вероятность неупругого рассеяния мала а реакция сводится к захвату нейтрона. Наконец, Г опреде- определяет полную вероятность рас- распада ядра С. Она равна энер- энергетической полуширине резо- резонансного максимума сечения.. На рис. 26 приведена зави- зависимость эффективных сечений .. ^^ процессов упругого рассеяния а ^^«^ а (я, я) и радиационного за- ^— ^ хвата медленных нейтронов о(п,у). Формулы Брейта — Рис. 26. Вигнера были выведены нами в частном случае, когда энер- энергия нейтрона близка к одному из резонансных уровней ядра Ео. Они могут быть обобщены на случай многих уровней. В них мо- могут быть учтены также спиновые состояния ядра и легких ча- частиц. Наконец, формулы Брейта — Вигнера могут быть обоб- обобщены на случай заряженных частиц и частиц с моментом. Обсу- Обсудим некоторые свойства ширин резонансного уровня ядра. Ширина реакции Гг для медленных нейтронов сводится к ши- ширине радиационного захвата Гу, поскольку неупругое рассеяние- при малых энергиях не происходит. Величина Гу составляет около 10"*1 эв и не зависит от скорости нейтрона. Ширина Ге ~ k ~ v, где v — скорость нейтрона и при малых энергиях у тяжелых и средних ядер Ге <С Гг. Это означает, что захьаг
$ 95] МАТРИЦА РАССЕЯНИЯ (S-МАТРИЦА) 395 нейтронов преобладает над упругим рассеянием. У легких ядер наблюдается обратная картина — резонансное рассеяние пре- преобладает над захватом. Представления Бора об образовании промежуточного ядра справедливы для ядерных реакций, происходящих при не слиш- слишком больших энергиях. С ростом энергии падающих частиц их сечение рассеяния на отдельных ядерных нуклонах резко умень- уменьшается. Поэтому при энергиях Е > 50—100 Мэв взаимодействие частиц с ядром сводится к взаимодействию с отдельным ядер- ядерным нуклоном. Формулы Брейта — Вигнера оказываются более неприменимыми. § 95. Матрица рассеяния (S-матрица) Изложенный выше расчетный аппарат теории рассеяния свя- связан с заданием явного вида распределения потенциала взаи- взаимодействия во всем пространстве. Между тем в ряде важных случаев потенциальная энергия (не зависящая от скорости) не существует. Поэтому в современной теории рассеяния важную роль играет более общая постановка задачи. Именно, пусть задана волновая функция системы частиц феЛ^—>—°°) в на- начальном состоянии до взаимодействия. Общая задача теории рассеяния заключается в нахождении волновой функции си- системы по прошествии большого времени после взаимодействия я|э(/—>-оо). Волновая функция i|)(/-*oo) может быть выражена через начальную функцию фа(^—v—°°) с помощью оператора V(t, to), введенного в § 49 и описывающего эволюцию волновой функции во времени. Назовем матрицей рассеяния S предельное выражение оператора V(tJ0), описывающего развитие про- десса во времени (см. § 49) 5= lim V(t, tQ). (95,1) t->oo Таким образом, матрица рассеяния S осуществляет преобразова- преобразование начального состояния \|)a(—оо) в конечное состояние \|)(оо): Ф(оо) = §яЫ-«>). (95,2) Индексом а мы обозначили совокупность квантовых чисел (пол- (полный набор), определяющих состояние системы до рассеяния. Предполагается, что как в начальном, так и в конечном состоя- состоянии частицы разведены на достаточно большие расстояния друг от друга, так что можно не учитывать взаимодействия между ними (так называемая адиабатическая гипотеза). Разложим функцию \f> в ряд по некоторой полной системе функций грб, где через b мы обозначим соответствующий набор
396 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. ХГ квантовых чисел ~Ф = Знак 2 означает суммирование по квантовым числам, про- ь бегающим дискретный ряд значений и интегрирование по кван- квантовым числам, изменяющимся непрерывным образом. Коэффициенты разложения съ выражаются, как это следует из (95,2), через матричные элементы оператора S: сь = (¦* Ю = (Ъ, S^a) = (b 151 a) = Sba. (95,3) Квадрат модуля амплитуды съ дает полную вероятность пере- перехода системы при рассеянии из состояния а в состояние Ь W'ba = \Sba\2. (95,4> Таким образом, матричные элементы оператора S непосред- непосредственно связаны с соответствующими вероятностями перехода. Поскольку оператор V(t,to) унитарен (см. § 49), унитарно- и его предельное значение, т. е. для оператора S можно на- написать SS+ = S+S=T, (95,5> где через / обозначен единичный оператор. Беря диагональные матричные элементы одного из соотно- соотношений (95,5), получаем очевидный результат 2S?S*e = 2|SftaP=l, (95,6) ь ъ т. е. сумма вероятностей всех возможных переходов равна еди- единице. Основываясь на соотношении (95,4), можно выразить эффективное сечение процесса через матричные элементы опе- оператора 5. Однако предварительно необходимо получить выра- выражение для вероятности перехода в единицу времени. Предположим, что начальное состояние i|>a характеризуется определенным значением энергии Еа. Полная энергия системы сохраняется во времени. Поэтому матрицу Sba можно предста- представить в виде ba Sba == Sba О матрице Sba говорят, что она задана на энергетической по- поверхности. Тогда полная вероятность перехода (95,4) запи- запишется в виде W'ta = \S$a\2b2{Ea-Eb). (95,7)
§ 95] МАТРИЦА РАССЕЯНИЯ (S-МАТРИЦА) 397 Эта вероятность пропорциональна квадрату б функции. Одну из б функций представим в виде (см. приложение III, т. I) J Подставляя это выражение в (95,7) и интегрируя вероят- вероятность перехода по энергии конечного состояния, получим ве- вероятность перехода за время Т: J E |2 SEab |2 Т. (95,8) Отсюда находим для вероятности перехода в единицу времени W = 1^|sfa|2. (95,9) Для нахождения сечения процесса мы должны разделить вероятность перехода на плотность потока падающих частиц. В начальном состоянии имеются две частицы. Процесс рас- рассеяния рассматриваем, как обычно, в системе центра тяжести. Волновая функция начального состояния i|)a описывает состоя- состояния с заданной энергией относительного движения Еа и направ- направлением импульса относительного движения па = — и норми- нормирована условием Vv dV = б (Е° ~ ^ Ь (•• - «Я - Й-Й- * (Ра ~ К)- (95, Ю) Тогда ¦V = I ?a- «> = Ра /Ж %a = y=- \РаУ (95.1 D При этом плотность потока падающих частиц равна Как всегда, когда мы имеем дело с непрерывно изменяю- изменяющейся величиной, мы должны ввести дифференциальную ве- вероятность перехода dWta и, следовательно, дифференциальное эффективное сечение doba- Обозначая через d&b интервал те- телесного угла, в котором лежит вектор пь, получаем из (95,9) и (95,12) d<yba = ^f\(b, Е% nb\SE\a, Е, па) \2 dQb, (95,13), I где ka = -г- ра.
398 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI Рассмотрим теперь случай, когда в результате взаимодей- взаимодействия двух частиц может происходить упругое и различные виды неупругого рассеяния, т. е. А + В А + В- C + D C + D Каждый вид превращения мы будем называть каналом реак- реакции. Формула (95,13) при Ь ф а отвечает неупругому каналу реакции. Сечение с учетом упругого и неупругого каналов можно представить в виде doba = ^\{b, E, nb\SE-I\a, Е, na)?dQbJ (95,14) где / — единичная матрица. Поскольку у матрицы / отличны от нуля только диагональные элементы, при b Ф а сечение (95,14) совпадаете (95,13). Выражения (95,13) и (95,14) можно представить в виде, аналогичном (86,12), если разложить начальное состояние |а, Я, па) по парциальным волнам \а, ?, па) = \а, Е, /, т)A, т\па). (95,15) Функции преобразования (/, т\па) были найдены в § 48: (U|«a) = CW- (95,16) Выбирая ось z вдоль направления вектора па, получаем Уш (»«) = У1т @) = Y^~- Ьт> (95,17) При подстановке выражений (95,16), (95,17) в (95,13) и (95,14) возникнут матричные элементы вида (b, E, nb\SE\a, E, I, 0). При движении в центральном поле момент количества дви- движения сохраняется. Поэтому S-матрица диагональна по кван- квантовым числам /, т и можно написать {b, E, nb\se\a, Е, I, 0) = (пь\1, 0)F, Е, /, 0|5?|а, Е, I, 0> = E,l, 0\SE\a, Е, I, 0> = =р, (cos в») Y^ir s*a- (95> 18)
§ 95] МАТРИЦА РАССЕЯНИЯ (S-МАТРИЦА) 399 Соответственно для дифференциального сечения рассеяния в телесный угол dQb получаем 1 dat ba' Akl B1 + 1) (Slba - бba) Pi (cos 9) |2 dQb. (95,19) Интегрируя это выражение по всем направлениям вектора пь, получим эффективное сечение рассеяния а —> b °ьа = 4" 2 B/ + 1) ISL - Ььа I2. (95,20) Из последней формулы следует, что полное сечение упругого рассеяния имеет вид °™ в 7Г S B/ + 1) I Saa - 112. (95,21) а 1 Напишем выражение также для полного сечения всех не- неупругих процессов Онеупр, которое получается суммированием оьа по всем каналам Ъ Ф а ^неупр == Это выражение можно преобразовать, воспользовавшись уни- унитарностью S-матрицы. Именно, имеем, очевидно, 2 |SL|2=1-|SU2. (95,22) Ьфа Соответственно для анеупр получаем Формулы (95,23) и (95,21) совпадают с формулами (91,6) и (91,7) фазовой теории рассеяния. Мы видим, что введенные в § 91 величины S1 являются диагональными матричными эле- элементами матрицы рассеяния S. Если неупругие процессы невоз- невозможны, т. е. Sba = 0 при Ь ф а, то из соотношения унитарности (95,22) следует, что | «Saa |2 = 1, т. е. SL-Л (95,24) При этом выражения (95,19) — (95,21) совпадают с выражения- выражениями для сечения упругого рассеяния, полученного в § 86. Из соотношений (95,19), (95,21) и (95,22) следует, что эффективное сечение процесса определяется матричными эле- элементами оператора F, iF = S — I (множитель i введен для
400 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI удобства). Унитарность 5-матрицы приводит к следующему со- соотношению: S+S = G - iF+) (Г+ if) = 7 или Беря матричные элементы от левой и правой частей этого соотношения по волновым функциям (95,11), получим Fba-Fba = lIiFicFeb; (95,25) с 2 означает суммирование по дискретным и интегрирование с по непрерывным состояниям системы двух частиц после столк- столкновения. Фактически система (95,25) является системой ин- интегральных уравнений, выражающих свойство унитарности 5-матрицы. Система уравнений (95,25) существенно упрощается, если возможно только упругое рассеяние. В этом случае матричные элементы оператора Р, как это видно из сравнения (95,19), (86,11) и (86,12), совпадают с точностью до множителя с ам- амплитудой упругого рассеяния f(n\n): ^Fn>.n = f(n'y я), (95,26) где я и п' — единичные векторы, характеризующие направление вектора импульса относительного движения падающих и рас- рассеянных частиц. Из (95,25) получаем f (я', я) - Г (я, *') = -Ц-- J f* (""> "') / (""> ")dQ"- <95>27) Соотношение (95,27) выражает условие унитарности для упругого рассеяния. При рассеянии в центральном поле ампли- амплитуда f зависит только от угла О между векторами п и п' и со- соотношение (95,27) может быть переписано в виде Im / (и', п) = -^ J Г (п", п') f (я", п) dQ". (95,28) При п = п' мы получаем соотношение, связывающее мнимую часть амплитуды рассеяния на угол нуль с полным сечением (оптическая теорема; см. § 91). Отметим, что уравнение (95,28) дает возможность, в прин- принципе, найти фазу амплитуды рассеяния, если известен ее мо- модуль, который определяется законом рассеяния. Полагая
§ 96] S-МАТРИЦА И ТЕОРИЯ ВОЗМУЩЕНИЙ 401 и подставляя это выражение в (95,28), мы получаем интеграль- интегральное уравнение для фазы а(Ф). Таким образом, зная сечение рассеяния do/dQ, мы можем, в принципе, определить и ампли- амплитуду рассеяния /(О). Отметим, однако, что уравнение (95,28) не изменяется при замене а -* я — а, т. е. оно определяет ам- амплитуду рассеяния с точностью до преобразования /(О)—> ->—f*(®)' Рассмотрим теперь влияние этой неопределенности на величину фазы рассеяния. Для этого вычислим интеграл |/ @) | eia® Pi' (cos 6) sin 0 dQ = = Ш АЛ J B/ + !) (^ - 0 pipi'sin Э rf9 /=о Используя свойства ортогональности полиномов Лежандра, получаем j\f(Q)\eiamPr(cosQ)sinQdQ=±(emt' - l). (95,29) Приравнивая действительные части соотношения (95,29), на- находим " | f (9) | cos a (9) Pt (cos 9) d cos 9 = -^|^-. (95,30) Из формулы (95,30) ясно, что замена а на я — а приводит к изменению знака левой части. Для сохранения равенства не- необходимо изменить знак всех фаз б/ на обратный. Итак, неоп- неопределенность в величине а приводит к неопределенности в зна- знаке всех фаз. Если определить независимым образом знак хотя бы у од- одной из фаз, то связь 6/ со всеми остальными фазами стано- становится однозначной. Знак одной (а именно нулевой) фазы может быть установлен, например, из изучения рассеяния и интерференции медленных частиц. Следует указать, что хотя приведенные расчеты убеждают нас в возможности определения амплитуды рассеяния, решение интегрального уравнения (95,28) является трудной задачей. § 96. S-матрица и теория возмущений Если полный гамильтониан можно представить в виде суммы где #о описывает поведение невзаимодействующих частиц, и Н' — их взаимодействие, то для нахождения явного вида S-ма- трицы удобно воспользоваться представлением взаимодействия.
402 ТЕОРИЯ РАССЕЯНИЯ [ГЛ, XI Волновая функция в этом представлении определена уравне- уравнением D9,21). Оператор V(tyto)y даваемый формулой D9,1), ко- который по определению, переводит волновую функцию, заданную в момент времени t0, в волновую функцию в момент времени t, можно написать и в представлении взаимодействия. Именно, t, 'о)ф('о); (96,1) подставляя в D9,21), находим » dV{td\U) = Him(t)V(t, /о), (96,2) V(t0, to)=l. (96,3) Системе (96,2) и (96,3) можно сопоставить интегральное урав- уравнение t V (/, to) = 1 - \ \ dt'H'mt (П V (t'9 to). (96,4) и Интегральное уравнение (96,4) может быть решено по методу последовательных приближений: V(t, -оо)- t t tt = 1 E" rf^l^int(^l)+ *" ^?Л dt2 Hint \tl) //jnt U2) + •• Л J \ и J J J — 00 —00 —00 (96,5) Общий член ряда имеет вид * 1 П— 1 - т)" J dtl J dk • • • J ^'n \ и / — 00 —00 —00 (96,6) Очевидно, что области интегрирования по переменным tu h, ... ..., tn располагаются в порядке tx>t2>...>tn. (96,7) Для того чтобы упростить запись и получить возможность не следить за порядком выполнения интегрирования, удобно сим- метризовать формулу (96,6). В случае функции, симметричной относительно своих переменных, можно воспользоваться извест- известной формулой Ъ *i *п-\ Ь Ъ Ь *2...J dtj(tu .... tn) = ±jdti$dt2...jdtj(tl,...,tn). а а а а (96,8)
§ 96] S-МАТРИЦА И ТЕОРИЯ ВОЗМУЩЕНИЙ 403 С указанной целью введем так называемый хронологический оператор Я, который, по определению, располагает зависящие от времени операторы в хронологической последовательности, т. е. в порядке убывания времени (96,7): L (tx) M (*2) при t{ > t2, \i j ;>1 (96.9) Представлением этого оператора может служить, например, вы- выражение 2 "*" 2 » где е(^) —так называемая знаковая функция 1 при — 1 при С помощью хронологического оператора можно написать d/i rf/2 •.. dtnffini (ti) ... #int (tn) = J J J — oo —oo —oo / t = -i- jdti jdt2... jdtnP{H'int(tx)...U'M(tn)}. (96,10) — oo —oo —oo Поэтому для V (t, — oo) находим "T J^int — w —OO В соответствии с определением 5-матрицы {-~- ^ H[ni(t)dt\. t->co t->oo (96,11) Полученная формула, именуемая формулой Даисона, позволяет связать S-матрицу с энергией взаимодействия Й' (если послед- последняя существует). Она является точной в том смысле, что в ней выполнено суммирование всего ряда теории возмущений.
404 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI Нетрудно убедиться, что первые члены разложения общей формулы для S-матрицы приводят к обычной теории возму- возмущений. Для простоты выкладок ограничимся первым порядком тео- теории возмущений, написав Оператор Р в этом случае тождественно равен единице. Беря матричный элемент по состояниям аф 6, которые являются соб- собственными состояниями гамильтониана Яо, имеем оо ^ jf J Переходя к представлению Шредингера и пользуясь определе- определением D9,19), получаем Sil)a = - ? J dt(b\exp D- Яо*) Н' exp (--J- hJ) |а), = — оо оо = - -L(Ь | Я'|а) J ехр [^ (?6 - ?а) /] Л = 2niH'ba6 (Eb - Еа). Мы видим, что SL совпадает с амплитудой перехода в пер- первом приближении теории возмущений. Аналогичные, хотя и более громоздкие вычисления, позво- позволяют отождествить S*U с амплитудой перехода во втором по- порядке теории возмущений. Несмотря на удобство записи формулы Дайсона, которой ча- часто пользуются в промежуточных выкладках, для фактического вычисления S-матрицы приходится проводить разложение в ряд и выполнять почленное интегрирование. Важной особенностью формулы Дайсона является то, что она легко может быть преобразована к релятивистски-инвари- релятивистски-инвариантному виду. Поэтому она имеет особенно большое значение при расчете релятивистских эффектов. § 97. Аналитические свойства S-матрицы Как мы уже подчеркивали, с помощью аппарата S-матрицы может быть получен ряд важных результатов теории рассеяния» не связанных с использованием конкретного вида потенциала взаимодействия. Это связано, в частности, с изучением аналити-
§ 97] АНАЛИТИЧЕСКИЕ СВОЙСТВА 5-МАТРИЦЫ 405 ческих свойств 5-матрицы1). В дальнейшем для простоты вы- выкладок мы ограничимся случаем упругого рассеяния. При этом элементы S-матрицы даются формулой (95,24). Как было показано в § 35, асимптотическое выражение для регулярной в нуле радиальной составляющей волновой функ- b2k2 или частицы с энергией Е = —~— и моментом / имеют вид Хы = rRkl = at (k) exp [/ (kr - f-)] + bt (k) exp [ - / (kr - Щ. (97,1) При выводе (97,1) предполагалось, что потенциал спадает на больших расстояниях быстрее, чем но закону—. Сравнивая выражение (97,1) с (86,2) и учитывая (95,24), можно выразить матричные элементы Slaa = Si через постоян- постоянные di(k) и bi(k): 8^--тж- (97'2> Будем теперь формально считать волновую функцию %ki и со- соответственно функцию Si(k) функциями комплексного перемен- переменного k. Покажем прежде всего, что функцию комплексного пере- переменного Si(k) следует задать лишь в одном квадранте, а не на всей плоскости комплексного переменного k. Действительно, по- поскольку уравнение Шредингера не изменяется при замене k на —fe, функция %-ki, в силу единственности решения, описывает то же состояние, что и функция %ы- Обе эти функции могут раз- различаться лишь постоянным множителем. Заменяя в (97,1) k на —&, получаем at(k) = М-АО bt(k) at(-k) ' Отсюда следует, что 5/(й) = 5Г1(-^). (97,3) Отметим далее, что так как уравнение Шредингера вещественно, функция %li также должна совпадать, с точностью до постоян- постоянной, с функцией %ы- Отсюда снова легко получить, что Si(k) = (S*i(k))~l (97,4) Формула (97,4) получена для вещественных k. Совершая ана- аналитическое продолжение на всю плоскость комплексных k> х) Более подробное рассмотрение затронутых в этом параграфе вопросов, и библиографию см. в книге А. И. Б а з ь, Я. Б. Зельдович, А. М. Пере- Переломов, Рассеяние, реакции и распады в нерелятивистской квантовой меха- механике, изд. 2-е, «Наука», 1971.
406 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI имеем \ (97,5) Соотношения (97,3), (97,5) связывают значения функции Si(k), заданных в одном из квадрантов плоскости комплексного переменного i с ее значениями в соответствующих точках остальных трех квадрантов. Из соотношения (97,4) следует, что при вещественном к |S/(&)|2=1, т. е фаза 6/ вещественна (S/ = ?2'6/). Наоборот, на мнимой оси, как видно из (97,5) и (97,3), функция Si(k) вещественна, так что фаза 8i является мнимой. Рассмотрим расположение особенностей функции Si(k). Предположим, потенциалу U(r) отвечает связанное состояние частицы с энергией —?0. Связанное состояние описывается вол- волновой функцией %kuu регулярной в нуле и затухающей на боль- ших расстояниях как e^k^r, где kQ = i Y2m\E0\/h2. Следова- Следовательно, функция %hi, аналитически продолженная на комплекс- комплексную плоскость, должна затухать при k = k0 как e-l*elr. По- Поэтому в точке k = k0 должно выполняться соотношение bi(k0) = = 0. В соответствии с формулой (97,2) функция Si(k) имеет в точке k = k0 полюс. В симметричной точке, расположенной в нижней полуплоскости, т. е. при k — —k0, функция Si(k), как это следует из (97,3), обращается в нуль. Таким образом, мы приходим к выводу, что каждому связанному состоянию отве- отвечает полюс функции Si(k), расположенный в соответствующей точке верхней мнимой полуоси на плоскости комплексного пере- переменного k. Следует отметить, что на мнимой полуоси могут воз- возникать и так называемые «ложные» полюсы, не отвечающие никакому стационарному состоянию. Можно показать (см. снос- сноску на стр. 405), что «ложные» полюсы не возникают при вве- введении так называемого радиуса обрезания R, т. е. при введении условия U (г) = 0 при г > /?, где радиус R может быть сколь угодно большим. Отметим, что функция Si(k) не может иметь полюсов в верх- верхней полуплоскости, расположенных где-либо вне мнимой полу- полуоси. Действительно, такому полюсу отвечало бы комплексное значение энергии связанного состояния, что невозможно. Функция Si(k) может иметь полюсы и в нижней полуплоско- полуплоскости, причем здесь они могут располагаться и не на мнимой по- полуоси. Как это сразу следует из соотношений (97,3), (97,5), эти полюсы должны располагаться парами, симметрично относи- относительно мнимой полуоси. В верхней полуплоскости этим полюсам отвечают нули функции St(k). Легко видеть, что полюсам, рас- расположенным в нижней полуплоскости, отвечает волновая функ- функция, экспоненциально возрастающая на больших расстояниях. Такая волновая функция, конечно, не может отвечать связан-
§ 97] АНАЛИТИЧЕСКИЕ СВОЙСТВА S-МАТРИЦЫ 407* ному состоянию. Можно показать, что полюсам в нижней полу- полуплоскости отвечают квазистационарные состояния системы, т. е. состояния, распадающиеся в течение некоторого конечного вре~ мени Т. Найдем вычет функции Si(k) относительно полюса, кото- которому отвечает связанное состояние с энергией Ё = —Ео или зна- значение k = ko = i Y2tn\EQ\/h2. Обозначая этот вычет через си представим функцию S\(k) в окрестности точки k = ko в виде Si-XT*- (97,6) Величина ci связана простым соотношением с амплитудой волновой функции, отвечающей стационарному состоянию с энергией Е = —Ео. Чтобы установить это соотношение, напи- напишем уравнения, которым удовлетворяет функция %hi и ее про- производная по энергии: у" | 2т (Е U 2тг2 ) Ж Функцию %ы будем считать нормированной условием J Умножая первое уравнение на д^ , а второе на хаь вычитая одно из другого и интегрируя по dr> получим у2 dr (Q7 7) о Мы применим это соотношение при ? = —?0 и г—>оо. Функ- Функции cti(k) и bi(k) разложим вблизи точки k = k0 в ряд и пере- переобозначим постоянную а, (Л) = а, (*„) = Л^Г', bt (k) = р, (Л - Ао)- (97,8) Используя эти разложения и соотношения (97,7), (97,1), полу- получаем Подставляя выражение (97,9) в (97,2), находим вычет ct в точ- точке k = ko\ A2(y (97,10)
408 ТЕОРИЯ РАССЕЯНИЯ [ГЛ XI Таким образом, мы связали величину вычета Ci с амплитудой At в асимптотическом выражении волновой функции %hu %м = = Л/в~1*ок связанного состояния. Исследование поведения фаз рассеяния б/(А), а следова- следовательно, и функции St(k) =e2t6l(k) и экстраполяция этих ре- результатов в комплексную область дает возможность на основа- основании (97,10) сделать определенные заключения и о волновой функции связанного состояния. Аналитические свойства величин Si(k) позволяют получить важные соотношения, которым должна удовлетворять ампли- амплитуда рассеяния. Эти соотношения носят название дисперсион- дисперсионных соотношений. Наиболее простыми и вместе с тем наиболее существенными являются дисперсионные соотношения для ам- амплитуды рассеяния на угол нуль, f(O,k). Дисперсионные соотношения устанавливают связь между действительной и мнимой частями амплитуды рассеяния /(§,&) /(#, ft) = Re/(O, k) + ilmf{&, k) и основаны на использовании формулы Коши в теории анали- аналитических функций. Предположим, что F(k)—некоторая функция, аналитиче- аналитическая в верхней полуплоскости комплексного переменного ky имеющая простые полюсы на верхней мнимой полуоси. Рас- Рассмотрим интеграл " F (kf) dk' j k'-k взятый по контуру, изображенному на рис. 27. Данный интеграл определяется суммой вычетов подынтег- подынтегральной функции. Эти вычеты берутся в точке W = k и в точ- точках kr = ku k%y ... , где расположены полюса функции F(k). Если функция F(k) достаточно быстро стремится к нулю при | /г | —> оо, то интеграл по верхней полу- полуокружности равен нулю. Тогда имеем Рис. 27. (97,11) Здесь через ResF(?n) обозначен вычет функции F в точке & == kn. Пусть теперь мнимая часть k стремится к нулю, так что k стремится к точке k0, расположенной на действительной оси.
97] АНАЛИТИЧЕСКИЕ СВОЙСТВА S-МАТРИЦЫ 40$ В этом случае Здесь Я означает, что интеграл понимается в смысле главного- значения F{k')dk' Г f %(feW , Ff(y)dy1 I оо &о+8 J а второй член в правой части (97,12) возник из-за интегриро- интегрирования, по малой полуокружности около точки k = k0. Основываясь на результатах (97,11), (97,12), получим дис- дисперсионное соотношение для амплитуды рассеяния на угол нуль f@, &). Амплитуда f(Ofk) связана с матричными элемен- элементами 5/ (95,24) соотношением (86,11) 1)- (97,13) Из этого выражения следует, что полюсы функции Si(k) яв- являются полюсами и функции f(O,k), а других полюсов функция f(O,k) не имеет. Точка /г = 0 вообще не является полюсом, так как при ?—>0, 6-*0, Si—>1 (см. § 86). Таким образом, функция f(Qyk) аналитична в верхней полуплоскости комплексного пе- переменного k и имеет полюсы на верхней мнимой полуоси. Дис- Дисперсионные соотношения для этой функции легко получить, если подставить в соотношения (97,11), (97,12) функцию F(k) в виде- F{k) = f{0, ft)-/@, оо). (97,14) Из амплитуды f@, k) вычитается ее значение при k—>oo для того, чтобы обратился в нуль интеграл по большой полуокруж- полуокружности (см. рис. 27). При k—> оо в уравнении Шредингера можно пренебречь членом с потенциалом U(r). Решение такого урав- уравнения имеет вид плоской волны. Подставляя такое решение- в (83,10), получаем 1у- <97>15> Выражение (97,15) представляет собой амплитуду рассея- рассеяния в борновском приближении (см. § 84), т. е. f@, оо) = fB. Подставляя (97,14) в соотношения (97,11), (97,12) и учитывая,, что интеграл с борновской амплитудой обращается в нуль,»
410 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI лолучаем П, I В этом соотношении k считается действительным, а индекс нуль jvibi опустили. Точки k = kni лежат на верхней мнимой полуоси и отвечают полюсам функций Si(k). Суммирование в (97,16) проводится по всем связанным состояниям. Выражение для вы- вычета функции 5/ через амплитуду соответствующего связанного состояния дается формулой (97,10). Учитывая (97,13), имеем Res/@, ^) = ^гЛ'/(-1)/+1B/+1). (97,17) Соотношение (97,16) можно переписать в несколько ином виде, если учесть, что согласно (97,3) и (97,4) при действительном k Si{-k) = S](k)iA соответственно [см. (97,13)] /@, — k) = f*(O,k). Поэтому интегрирование в (97,16) может быть проведено только ло имеющим физический смысл положительным значениям k. Приравнивая в (97,16) слева и справа действительные части, окончательно имеем J (97,18) Входящая в правую часть равенства мнимая часть амплитуды Im/@, k) может быть выражена согласно оптической теореме [см. (91,11)] через физически наблюдаемую величину — полное сечение рассеяния o(k). Поэтому и действительная часть Ref(O, k) согласно (97,18) может быть выражена через физиче- физически наблюдаемые величины. Дисперсионные соотношения на- находят в настоящее время широкую область применения. В част- частности, с их помощью можно сразу устранить отмеченную в § 95 неоднозначность выбора фаз при известном законе рассеяния, т. е. при известном эффективном сечении. Подчеркнем, что дис- дисперсионные соотношения основаны на таком общем свойстве матрицы рассеяния, как ее аналитичность, вытекающем из прин- принципа причинности. § 98. Обращение времени и принцип детального равновесия Рассмотрим свойства S-матрицы, связанные с симметрией уравнения Шредингера по отношению к обращению времени. Мы уже касались этого вопроса в § 6 и сейчас рассмотрим его более подробно.
§98] ПРИНЦИП ДЕТАЛЬНОГО РАВНОВЕСИЯ 411 Симметрия по отношению к обращению времени означает, что существует решение ^Обр(*, /) «обращенного» уравнения Шредингера, выражающееся через функцию \|?(#,—t). Если оператор Н не зависит от времени явно, то При Н* = Н уравнение (98,1) совпадает с исходным уравне- уравнением B7,7), а функция г|)*(л:,—t) описывает процесс, обращен- обращенный во времени [см. F.9)]. В более общем случае (например, заряженная частица в магнитном поле) мы должны положить ¦обр(*, 0 = ?¦*(*, -О, (98,2) где V — некоторый оператор. Действуя на уравнение (98,1) слева оператором V> получим уравнение для функции г|)Обр -^оъ (х, t). (98,3) Это уравнение совпадает с исходным уравнением Шредингера B7,7) при условии VH* = Й9. (98,4) Из эрмитовости оператора Н следует, что оператор V дол- должен быть унитарным, т. е. V~l = V+. Закону преобразования волновых функций (98,2) отвечает определенный закон преоб- преобразования и произвольных операторов F. Этот закон может быть найден обычными методами (см. § 46, 48, 49). Некоторая специфика в данном случае возникает лишь в связи с тем, что оператор^ V действует не на функцию if, а на функцию г|)*. Оператор Foqv (обращенный во времени) мы найдем, исходя из требования, что матричный элемент опера- оператора F, взятый по функциям г|)Обр, должен совпадать с матрич- матричным элементом оператора F06p, взятым по функциям г|)(л:,—t): (¦обр! F I ¦обр) = <¦ (- 01 ^обр I ¦ (- 0>. (98,5> Используя соотношение (98,2), получаем Отсюда следует [см. A7,3)] Д>бР = V+FV, (98,6> где через Fo6p обозначен оператор, транспонированный к опера- оператору Foe?. Как легко видеть из (98,4) и (98,6), оператор Н
ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI инвариантен по отношению к обращению времени, т. е. При этом мы использовали условие эрмитовости гамильтониана Н = Н*. Соотношение (98,6) может служить основой для на- нахождения оператора V. Действительно, естественно потребовать, чтобы квантовые операторы при обращении времени преобра- преобразовывались бы так же, как и соответствующие классические ве- величины. Такие величины, как энергия, координата, напряжен- напряженность электрического поля и т. д. инвариантны по отношению к обращению времени. Инвариантны должны быть и соответ- соответствующие операторы. Скорость, импульс, момент количества движения, напряженность магнитного поля и т. д. изменяют знак при обращении времени. Таким же свойством должны об- обладать и соответствующие операторы. Например, должны вы- выполняться соотношения *"обр = г, Робр = ~ Р> ^обр = — L. (98,7) Спин преобразуется как момент количества движения, т. е. должно выполняться соотношение «обр = - s. (98,8) Рассмотрим, например, частицу со спином 1/2. Исходя из со- соотношений (98,8), легко найти оператор VS9 воздействующий на спиновые переменные при обращении времени. Используя вы- выражения (98,6) и учитывая вид операторов спина F0,15), F0,16), имеем vtsxvs=*-sX9 VfsyVs = Sy, (98,9) VfszVs=-sz. Из этих соотношений с помощью F0,12) легко находим Vs = loy. (98.10) (Мы выбрали фазовый множитель так, чтобы оператор Vs Сыл действителен.) При движении частицы в магнитном поле опе- оператор V должен включать в себя оператор, изменяющий на- направление магнитного поля (или векторного потенциала А) на обратное. С учетом этого обстоятельства соотношение (98,4) имеет вид у. (98,11) Легко проверить, что гамильтониан Н [см. F3,3)] удовлетво- удовлетворяет этому соотношению. Инвариантность уравнения Шредин- гера по отношению к обращению времени означает, что всегда
$ 98] ПРИНЦИП ДЕТАЛЬНОГО РАВНОВЕСИЯ 413 можно найти оператор V, удовлетворяющий условию (98,4) Jcm. подробнее1)]. Однако открытые в 1964 г. аномалии при рас- распаде /(-мезонов показывают, что, по-видимому, при определен- определенных условиях принцип обратимости времени может нарушаться. Из инвариантности гамильтониана Н по отношению к замене /->—/ следует инвариантность S-матрицы, т. е. [см. (98,6)] выполняется соотношением V+SV = S. (98.12) Справедливость этого соотношения легко проверяется, с уче- учетом (98,4), для оператора V(t,t0) [см. (96,5)], Так как опера- оператор S определяется как предел оператора V(t,U) [см. (96,11)], то он также удовлетворяет соотношению (98,12). Основываясь на соотношении (98,12), не представляет труда установить связь непосредственно между матричными элемен- элементами S-матрицы для прямых и обратных реакций. Обозначим через г|)а и г|)ь волновые функции начального и конечного со- состояния системы. Тогда, учитывая A7,3), (98,2) и (98,12), имеем = (Ы ! S | Hi) = <¦«• | S | V>> (98,13) тде через i|)a* и г^* обозначены «обращенные» волновые функ- функции состояний а и Ъ. Таким образом, выполняется равенство Sba = Sa*b*. (98,14) Соотношение (98,14) устанавливает связь между матрич- матричными элементами S-матрицы прямого и «обращенного» про- процесса. Состояния ^а^ г^* отличаются от состояний фа, ^ь зна- знаком таких величин, как скорости, импульсы, проекции момента количества движения, спина и т. д. Соотношение (98,14), или эквивалентное ему соотношение (98,13) носит название теоремы взаимности. На основании этой теоремы может быть установ- установлена связь между сечениями прямых и обратных реакций (прин- (принцип детального равновесия). Рассмотрим реакцию а + А^Ь + В. Обозначим через /а, гаа, /А, тА, /ь, тъ, /в, тв полные мо- моменты и их проекции частиц, участвующих в реакции. Сечения прямой и обратной реакции, выраженные через матричные !) А. М. Балдин, В. И. Гольданский, И. Л. Розенталь, Кине- Кинетика ядерных реакций, Физматгиз, 1959.
414 ТЕОРИЯ РАССЕЯНИЯ [ГЛ. XI элементы 5-матрицы, согласно (95,14) имеют вид do. 4зх2 —**- = -тг I Оа» "г&> Ь» "V, -nb\S\ /a, mfl, /л, тА; па) |2, (98,15) -^— = -4-1 </а, ™а> /л> ^л; -*а| 3 I/*, mft> /B, mfi; nb) ?. (98,16) Так как вектор импульса относительного движения частиц в конечном состоянии направлен от центра тяжести, ему при- приписан знак минус. Непосредственно написать связь между этими сечениями нельзя, так как теорема взаимности связывает сечение прямого процесса и «обращенного», отличающегося от (98,16) измене- изменением знаков проекций моментов та, гпа, гпь, тв на обратные. Можно, однако, написать связь между усредненными сечениями, т. е. сечениями, просуммированными по проекциям моментов конечных состояний и усредненными по проекциям моментов начальных состояний. Такие сечения уже не зависят от проек- проекций моментов и для них теорема взаимности (98,14) дает ^ ^ )-^-, (98,17) Щ) d®b ka dQ>a где _ dGba _ * V ^t /go im * d®b { ' ' ttlД dQa B/ft + 1)B/B + 1) A dQa ' K ' ' ma, mA mb, niQ Соотношение, аналогичное (98,17), можно написать и для полных сечений __ _ К B/а + О B/д + 1) оьа = k\ B1 b + 1) B/в + 1) оаъ. (98,20) Отметим, что в рамках применимости теории возмущений можно установить связь и между неусредненными сечениями прямых и обратных реакций 1 do. I da . ba_ qb_ /no о i \ k\ dab - kl daa ¦ (98>21) Действительно, в этом случае вероятность перехода, а сле- следовательно, и эффективное сечение процесса определяются квад- квадратом модуля матричного элемента гамильтониана возмущения Ньа> для которого в силу эрмитовости выполняется соотношение | НЬа |2 = I Н'аь |2. Из этого равенства следует соотношение (98,21).
ГЛАВА XII МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ И ТЕОРИЯ ИЗЛУЧЕНИЯ § 99. Вторичное квантование для систем бозе- и ферми-частиц1) Одним из важных формальных расчетных методов, часто применяющихся в квантовой механике системы многих частиц, является так называемый метод вторичного квантования. В методе вторичного квантования совершается переход от координатного представления волновой функции к новым пере- переменным. В качестве новых переменных выбираются числа ча- частиц, находящихся в данном квантовом состоянии. Таким обра- образом, характеристика системы частиц заключается теперь не в задании волновой функции i|)(?i, |г> . ••> ?jv, t), а в задании новой функции с(пи п2, ..., t), где пи пг, ... — числа частиц в 1-м, 2-м и т. д. состояниях. Величины щ, п<ь, ... мы будем именовать числами заполнения. Величина \с(пи па, ..., nh9 ..., t)\2 (99,1) дает вероятность того, что в момент времени t в первом состоя- состоянии находится fti частиц, во втором состоянии — п2 частиц и т. д. Метод вторичного квантования оказывается весьма удобным для таких систем, в которых изменяется число частиц в дан- данном состоянии, а также происходит рождение и исчезновение частиц данного сорта (как например, при излучении и погло- поглощении фотонов, при р-распаде ядер и т. д.). Переход от обыч- обычного описания ко вторичному квантованию является одним из примеров преобразования от одного представления к другому. Рассмотрим формально систему невзаимодействующих то- тождественных частиц. Будем сперва предполагать, что частицы подчиняются статистике Бозе. Обозначим через tyi(g), *MS), >.., *M?)» ••• совокупность ортогональных и нормированных волновых функций отдельной 1) В изложении этого параграфа мы следуем книге Л. Д. Ландау и Е. М. Л и ф ш и ц а, Квантовая механика, Физматгиз, 1963.
416 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XII частицы, образующих некоторую произвольным образом вы- выбранную полную систему функций. Индекс k обозначает номер состояния, характеризуемого выбранной совокупностью четырех квантовых чисел. Перейдем к представлению, в котором за неза- независимые переменные выбираются не координаты частиц \и а числа заполнения пк. В новом представлении базисными функциями (см. § 65) служат симметризованные и нормированные произведения вол- волновых функций отдельных частиц фь(?{). Формула F5,5) для общего случая, когда в состоянии \|)i находится пх частиц, в со- состоянии г|J — п2 частиц и т. д., приобретает вид {, я2, я3, Суммирование ведется только по всем перестановкам разных индексов ku k2y ... Введем операторы а? и йк, действующие на новые перемен- переменные— числа заполнения в состоянии k. Определим эти опера- операторы формулами «А, Як. ... nk-U пк. (99,4) Оператор й^ уменьшает число частиц в состоянии k на единицу, т. е. заменяет пн на п*,— 1. Оператор й? увеличивает это число на единицу, т. е. заменяет пд— 1 на я&. Очевидно, что последо- последовательное применение операторов йк и й? не изменяет числа частиц в k-м состоянии, т. е. Матричные элементы операторов йк и й? имеют вид («,, «г, ..., пк- 1, ... \йк\щ, щ, nk, ...) = , (99,6) («1. «2 Пк+1> • (99>8)
§ 99] СИСТЕМЫ БОЗЕ- И ФЕРМИ-ЧАСТИЦ 417 В соответствии с их смыслом, операторы йк и а? называются соответственно операторами уничтожения и рождения частицы в &-м состоянии. Оператор a?ak называют оператором числа частиц я/*, находящихся в состоянии k. С операторами, сходными с операторами а+ и ak> мы уже встречались в § 50 при рассмотрении задачи об осцилляторе. Нетрудно видеть, что операторы dk и а? удовлетворяют пере- перестановочным соотношениям (99,9) л + л+ П+П+ =0 Покажем, как можно выразить обычные операторы, действую- действующие на волновую функцию в координатном представлении, че- через операторы рождения и уничтожения частиц, т. е. в пред- представлении вторичного квантования. Рассмотрим оператор L(gi), действующий на координаты од- одной 1-й частицы. Под координатами подразумевается также и спиновая координата. Поскольку все частицы равноправны, вве- N дем оператор Lx = 2 ?(!*). Найдем выражение для него в пред- представлении вторичного квантования. Матричные элементы Li получим с помощью базисных функций (99,2). Имеем по определению (n'[t ..., п'к, ...\Ьг\п19 ..., пк, ...) = h) п., ..., п., ...). (99,10) = К,..., n;f S Рассмотрим один член суммы по частицам , ..., п'к, ...|1(|()|п,, ..., пк> ...)== J(99,10 (По спиновым переменным имеется в виду суммирование.) Опе- Оператор L(li) действует только на переменные /-й частицы. По- Поэтому можно написать ?&)¦«, «,....= -уs( (i09,12) 14 В. Г. Левин и др., том II
418 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XII Умножая (99,12) на функцию я|>*'ввв и интегрируя, мы за- замечаем прежде всего, что интегралы по всем переменным, кроме 1и содержат только произведения волновых функций. В силу ортогональности последних обратятся в нуль все ин- интегралы, в которые входят множители вида Ч^Г (&i) ^2 (&i)> T- e* содержащие произведения волновых функций частиц (кроме t-й), относящихся к различным состояниям. В двойной сумме по перестановкам (99,11) отличны от нуля лишь те слагаемые, которые содержат произведения волновых функций частиц (кроме t-й), относящихся к одинаковым состоя- состояниям. Интеграл по переменным & имеет вид Это означает, что при / Ф k, имеет место переход частицы из k-го состояния в /-е. Следовательно, число частиц в k-м состоя- состоянии уменьшается на единицу, а в /-м — увеличивается на еди- единицу. Соответствующий матричный элемент обозначим через (nk-l, nt\L(h)\nk,n,-l) (99,13) (по остальным числам заполнения оператор диагоналей и мы их не выписываем). Входящие в матричный элемент функции имеют вид , ifc,)!* ,)Arf) X n{\ ... nk\ ... (/tj-1)! ..\V (iV1)! ¦. „,- Интегрирование по координатам всех частиц в силу ортогональ- ортогональности волновых функций дает (учитывая перестановки N — 1 частицы, кроме t-й) Л ... (п.- 1)! X Поскольку операторы ?(|i), ?(^2), ... отличаются друг от друга только номером частиц, на координаты которых они действуют, все матричные элементы, отличающиеся номером частицы, рав- равны между собой. Поэтому для матричного элемента (99,10) (j) ?\ / nx\ ...(ял-1)! ...(n^-1)! ... (L (It))Ik
§ 99] СИСТЕМЫ БОЗЕ- И ФЕРМИ-ЧАСТИЦ 419 оператора L\ можно написать окончательно: 2I (i i -1, щ\Ьх\пк9 Л|«-1)=лЛ-1, я* - = N(nk - 1, л,| Z (W \пк, щ - 1) = VV/ (^ (?))/*• (99,14) В том случае, когда рассматривается диагональный матричный элемент, т. е. когда распределение числа частиц по состояниям не изменяется, мы имеем аналогичным образом: (пь пъ ... \1х\пь п2, ...) = 2 "л (^ (?))**• (99,15) Введем теперь в формулы (99,14) и (99,15) операторы а+ и й. Тогда оператор L\ можно записать в виде ?i = 2(M?)W<V (99,16) Действительно, матричные элементы последнего оператора в силу (99,6), (99,7) и (99,8) совпадают с матричными элемен- элементами (99,14) и (99,15). Аналогичный результат можно тем же способом получить для операторов, действующих на координаты двух частиц |* и ?,-. Оператор в представлении вторичного квантования выражается формулой Is- 2 (lm\l(l,l')\kp)a+a+aka (99,17) k, p, I, т и где матричные элементы равны ?/)*Л(Б)*р(Б/)^^/. (99,18) С помощью общих формул (99,16) и (99,17) можно записать оператор Гамильтона системы частиц в представлении вторич- вторичного квантования. В случае системы невзаимодействующих ча- частиц, находящихся в заданном внешнем поле, имеем N N N где (/(|i)—потенциальная энергия 1-й частицы во внешнем поле и Т{ — оператор ее кинетической энергии. Оператор (99,19) является, очевидно, частным случаем оператора L\. Соот- Соответственно этому, можем сразу написать оператор (99,19) 14*
420 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XII в представлении вторичного квантования («),,А* (99,20) Выбирая за tyk собственные функции оператора Гамильтона Йг отдельной частицы, имеем: где Ek — энергии частицы в k-м состоянии. Поэтому окончательно %kk (99,21) Энергия системы частиц в силу (99,8) равна Е = ЪЕкпк. (99,22) Если за tyk выбрать собственные функции оператора fu от- отвечающие собственным значениям е&, то (99,20) перепишется в виде # = 2 BbAt*k + 2 Ч*н J W (Б) ¦* 4- (99,23) k k, i В случае системы частиц, между которыми существует попар- попарное взаимодействие, оператор энергии взаимодействия имеет вид Напишем, используя (99,17), оператор Гамильтона в представ- представлении вторичного квантования ^^p, (99,24) /г, / k, p, U т или, беря за функции фл собственные функции оператора Яг-, р. (99,25) Заметим, что попарное взаимодействие (последний член в фор- формуле (99,24)) допускает наглядную интерпретацию. Взаимодей- Взаимодействие можно трактовать как столкновение двух частиц, находя- находящихся в р-м и k-u состояниях. После взаимодействия они переходят в 1-е и т-е состояния. Полезно заметить, что формула (99,20) может быть полу- получена с помощью следующего формального приема: заменим в выражении для средней энергии F5,9) волновую функцию на
$ 99] СИСТЕМЫ БОЗЕ- И ФЕРМИ-ЧАСТИЦ 421 оператор в пространстве чисел заполнения, определяемый как (99,26) ,+¦; F). (99,260 2 и соответственно Тогда в празой части F5,9) имеем 2 2 J Л. / k, I (99,27) Сравнивая (99,27) с (99,20), мы видим, что при замене обыч- обычной волновой функции на оператор, правая часть F5,9) совпа- совпадает с (99,20). Это означает, что при этом можно формально заменить Н на оператор Н в представлении вторичного кван- квантования. С заменой волновой функции г|э оператором "ф связано и на- название метода вторичного квантования. При вторичном кванто- квантовании не только все механические величины заменяются кван- квантовыми операторами (обычное квантование), но и квантуется, т. е. заменяется на оператор сама волновая функция. Хотя вто- вторичное квантование является формальным приемом, оно оказы- оказывается весьма полезным в целом ряде случаев. Аналогичным образом легко получить и гамильтониан си- системы попарно взаимодействующих частиц. Для этого в формуле F5,8) снова заменим функции ty и г|э* на операторы (99,26). При этом, в соответствии со сказанным выше, заменяем #—>#, где Н — оператор Гамильтона в представлении вторичного кван- квантования. После замены получаем формулу (99,24). Все полученные результаты относились к бозе-частицам. Можно показать1), что формулы (99,20) и (99,24) остаются справедливыми и для системы фермионов. Однако операторы ak и а+ при этом уже не могут удовлетворять соотношениям (99,9). Действительно, для операторов dk и dj, определенных формулами (99,9), собственные значения произведения й+й^, равны произвольным положительным целым числам п^. Для системы фермионов числа заполнения могут равняться лишь нулю и единице в соответствии с принципом Паули. Операторы &k ') См. Л. Д. Ландау и Е. М. Лифшиц, Квантовая механика, Физ- матгиз, 1963, стр. 273.
422 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XIГ и й? должны теперь быть определены так, чтобы собственные значения оператора a+ak равнялись нулю либо единице, т. е. Покажем, что условия (99,28) выполняются, если операторы ak и й+ удовлетворяют следующим правилам антикоммутации: (99,29) kl lk +u+ + a+d+ = O. (99,30) Для этого убедимся, что Действительно, раскрываем левую часть и, пользуясь (99,29),. получаем: (*t*kY = ЧКЧЧ = ЧК A - КЧ) = ЧК - ЧККЧ = Ч&» так как а\ = 0, что следует' из (99,30). Взяв диагональные матричные элементы от соотношения: (99,31), находим: Это равенство может выполняться лишь при пк = 0 и nk = L Основываясь на соотношениях (99,30), можно найти явный вид матриц йк. Поскольку числа nk принимают только два значения О и 1, то операторы ak и й+ по этим переменным являются двух- двухрядными матрицами. Приведем соответствующие матричные эле- элементы без вывода. Они равны K)o, = KIO =ПA-2«/). (99,32) Все остальные матричные элементы равны нулю. В резуль- результате перемножения величин A—2пг), где /= 1, 2, ..., k—lt получается либо ( + 1) либо (—1) в зависимости от значения чисел заполнения состояний, предшествующих данному. Ясно поэтому, что нумерация состояний 1, 2, ..., к, будучи: первоначально выбранной, не должна изменяться. Уравнение Шредингера в представлении чисел заполнения,, когда гамильтониан дается формулой (99,24), содержит в себе закон сохранения полного числа частиц (см. § 7). Однако вве- введение операторов й+ и dky описывающих поглощение и рожде- рождение частиц, позволяет при соответствующем обобщении иссле- исследовать и процессы, в которых число частиц данного сорта не сохраняется.
§ 100] КВАНТОВАЯ МЕХАНИКА ФОТОНА 423 § 100. Квантовая механика фотона Опытное установление квантовой, или, как часто говорят, корпускулярной природы света послужило толчком к созданию квантовой теории в целом. С другой стороны, построение последовательной квантовой теории электромагнитного поля явилось одним из наиболее вы- выдающихся успехов квантовой теории. Кванты света или фотоны являются элементарными части- частицами, отличительной особенностью которых служит то, что их масса покоя равна нулю. Поэтому они всегда движутся со ско- скоростью с в пустоте. Это обстоятельство приводит к некоторым важным особенностям в методе описания их поведения. Именно, связь между энергией и импульсом фотона дается общей фор- формулой й A00,1) Если заменить импульс фотона оператором, то оператор энергии в импульсном представлении имеет вид H=,cp = bck. A00,2) Соответственно можно написать уравнение Шредингера в им- лульсном представлении ih^- = H%, A00,3) где грр — волновая функция фотона в импульсном представле- представлении. Оператор Н связан с энергией фотона общей формулой б = J 1fpH%dp = Ьс\ ф;бфр dp. A00,4) С другой стороны, можно считать, что фотону адекватно элек- электромагнитное поле, существующее во всем пространстве. Его энергия JiiJ <I00'5> Естественно отождествить энергию фотона с энергией электро- электромагнитного поля. Оба вектора поля удовлетворяют уравнениям Максвелла, которые приводятся к виду и аналогично для вектора Н.
424 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ XIГ Разлагая Е в интеграл Фурье E{r,t)=[E{k,t)e*'dk, имеем *^*«+*»?(*, 0-0, ИЛИ [^^ ][M&A ]0. (Ю0,6> В силу вещественности поля должно выполняться условие E(-k). A00,7) Введем вместо компоненты Фурье 2? (ft, t) новую функцию- /(ft, t), определенную соотношениями E(k,t)=-ikN(k)\f(k,t)-r(-k9t)]9 ' A00>8) где N — множитель пропорциональности. Точкой обозначена дифференцирование по времени. Нетрудно видеть, что при таком представлении ?(ft, t) уело* вие A00,7) выполняется автоматически. Подставляя значения ?(ft, t) и E(k, t) в A00,6), приходим к двум уравнениям* . аг _ . } A00>9> 01 Подчеркнем, что уравнения A00,9) представляют собой не что иное, как другую форму записи уравнений Максвелла. Умножая A00,9) на й, получаем Мы видим, что функция f (ft, t) удовлетворяет уравнению, кото- которое по форме является тождественным с уравнением Шредин- гера. Если заменить р оператором Я, то функцию /(ft, t) следует отождествить с волновой функцией фотона в ^-представлении. Множитель пропорциональности N, остававшийся до сих пор произвольным, можно определить из сопоставления A00,4) и A00,5),
¦§ 100] КВАНТОВАЯ МЕХАНИКА ФОТОНА 425 Подставляя в A00,5) разложение A00,8), имеем в--L-J ?(*,*)?(*, t)exp[i(k + k')r)dkdk'dV = = ^ J E (k, t) E (kf, t) dk dk' J exp [i (ft + k') r] dV = , t)E{kr, При N= l/^г энергия электромагнитного поля и энергия фо- фотона оказываются тождественными. Итак, в ^-представлении фо- фотон описывается волновой функцией t|> (k, t) = f(k, t), причем выполнено условие При этом уравнения Максвелла для электромагнитного поля монохроматической волны оказываются тождественными с урав- лениями Шредингера для отдельного фототока. Вводя явную зависимость от времени, можно написать Ф {К t) = /о (к) ехр (- /о/) = /о (к) ехр [ - ^ Амплитуда в ^-пространстве в силу уравнения Максвелла удовлетворяет условию Мы не будем останавливаться на вопросах нормировки волно- волновой функции и на расчете других квантовомеханических вели- величин фототока, например, момента, спина, четности и т. д., отсылая интересующихся к монографии А. И. Ахиезера и В. Б. Берестецкого 1). Ограничимся лишь несколькими принципиально важными за- замечаниями. Подчеркнем прежде всего, что поскольку уравнения Максвелла являются релятивистски-инвариантными, уравнение Шредингера для фотона также релятивистски-инвариантно. !) А. И. Ахиезер, В. Б. Берестецкий, Квантовая электродина- электродинамика, «Наука», 1969.
426 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XIF Это и естественно, поскольку фотон всегда движется со ско- скоростью света. Мы нашли волновую функцию фотона в ^-представлении (или, что то же самое, в ^-представлении). Эта волновая функ- функция имеет обычный вероятностный смысл. Однако волновой функции фотона в ^-представлении, позволяющей установить ве- вероятность локализации фотона в данной точке пространства, не существует. Для свободных частиц с массой покоя т0, отличной от нуля,, волновая функция в ^-представлении получается из волновой функции в /^-представлении путем преобразования Фурье. В случае фотонов обратное фурье-преобразование дает f(r, t) = 1/BяK J f (ft, t) exp (Oar) dk. Однако, и в этом существенное отличие фотонов от частиц, с то Ф О, положение фотона может быть определено толька в результате взаимодействия с заряженными частицами, напри- например, электронами. Это взаимодействие определяется значением векторов поля Е и Я в той точке, в которой находится электрон. Напряженность поля в некоторой точке определяется обратным преобразова- преобразованием Фурье, т. е. Е (г, t) - 1/BяK J E (ft, t) exp Aкг) dk = = 1/Bя4) J (chkt [f (ft, t).+ f (- К t)] exp (ikr) dk. Последняя формула показывает, что напряженность поля не вы- выражается через /(г, t), т. е. не определяется значением какой- либо волновой функции в той же точке пространства. Наоборот^ E(r91) определяется распределением /(г, /) во всем пространстве. Фотоны обладают спином, равным единице. Однако опреде- определение спина как собственного момента покоящейся частицы в случае фотонов теряет смысл. Поэтому разделение полного мо- момента фотона на орбитальную и спиновую части является до из- известной степени условным. Последнее важное замечание связано с описанием системы фотонов. Фотоны непосредственно не взаимодействуют друг с другом. Поэтому волновая функция системы фотонов является волновой функцией системы невзаимодействующих частиц. Фотоны как: частицы с целым спином подчиняются статистике Бозе — Эйн- Эйнштейна. При взаимодействии фотонов с другими частицами число фо- фотонов изменяется в процессах излучения и поглощения. Фотоны
S 101] КВАНТОВАНИЕ ПОЛЯ ИЗЛУЧЕНИЯ 427 поглощаются и излучаются поодиночке. Взаимодействие фото- фотонов с зарядами может быть описано с помощью их волновой функции (см. цитированную монографию А. И. Ахиезера и В. Б. Берестецкого). Однако гораздо эффективнее и проще это взаимодействие описывается с помощью представления вторич- вторичного квантования. Заметим, что самый метод вторичного кван- квантования был разработан Дираком именно для этой цели. § 101. Квантование поля излучения Квантовая теория электромагнитного поля, начатая рабо- работами Дирака, основана на особых приемах, в частности на ме- методе вторичного квантования 1). Напомним, что в классической теории электромагнитного поля в пустоте было показано, что свободному от зарядов элек- электромагнитному полю можно формально сопоставить некоторую механическую систему с бесконечно большим числом степеней свободы. Разлагая вектор-потенциал электромагнитного поля А на плоские волны и принимая бесконечный набор амплитуд разло- разложения <7г за обобщенные координаты, можно было сопоставить электромагнитному полю некоторую механическую систему — набор осцилляторов поля (см. § 38 ч. I). Каждой фурье-компо- ненте разложения А отвечал один из осцилляторов. Поэтому полный набор осцилляторов поля включает бесконечно большое их число и, следовательно, электромагнитному полю можно было сопоставить механическую систему с бесконечно большим чис- числом степеней свободы. Гамильтониан этой системы запишем так: где Я*, — гамильтониан Х-го осциллятора, р% — обобщенный им- импульс, отвечающий координате q%, оз^ — соответствующая ча- частота. Суммирование ведется по всем значениям частот и поля- поляризаций. В основе квантовой теории электромагнитного поля лежит до- допущение, что этой аналогии можно придать непосредственное физическое содержание. Именно, предполагается, что реальное электромагнитное поле представляет квантовую систему, подчи- подчиняющуюся обычным законам квантовой механики. Оператор га- мильтона И получается из классического гамильтониана A01,1) путем обычной замены механических величин, обобщенных 1) Более подробное изложение квантовой теории излучения может быть найдено в книге В. Г а й т л е р, Квантовая теория излучения, ИЛ, 1956.
428 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XIP координат и импульсов, соответствующими квантовыми операто- операторами. Именно, заменим <7х и рх операторами, удовлетворяющими соотношениям коммутации: Поскольку различные осцилляторы поля являются независи- независимыми, то операторы /)я и <7ц, относящиеся ^различным осцилля- осцилляторам, коммутируют между собой. Тогда Н будет представлять оператор Гамильтона квантовой системы. Целесообразно, од- однако, сделать каноническое преобразование к новым перемен- переменным (ср. с формулами E0,11)). Именно, напишем: A0! 2) В новом представлении так что Операторам а% и aj отвечают перестановочные соотно- соотношения что сразу следует из определения и.перестановочных соотноше- соотношений для рк и qK. С помощью A01,3) гамильтониан можно преобразовать, на- написав Тогда Сравнивая выражение A01,4) для Я и перестановочные соот- соотношения A01,3) для операторов й и а+ с соответствующими вы- выражениями (99,9) и (99,21), мы убеждаемся в их полной анало- аналогии. Это означает, что свободное электромагнитное поле пред-
§ 101] КВАНТОВАНИЕ ПОЛЯ ИЗЛУЧЕНИЯ 429 ставляет систему бозонов, именуемых обычно фотонами или све- световыми квантами. Каждой плоской волне в разложении (C8,19) ч. I) отвечает один фотон. Энергия каждого фотона, согласно формуле A01,4), равна йсох. Полная энергия электромагнитного поля соответ- соответственно имеет вид где Е\ = йо)Ъ а Пх — число фотонов с энергией Ек. Второе влагаемое в формуле A01,5), обозначенное через Ео, носит название энергии нулевых колебаний электромагнитного поля. Формула A01,5) показывает, что если все п% = 0, т. е. в поле нет фотонов, то энергия электромагнитного поля равна Ео. Более того, сама величина Ео бесконечно велика, так как в сумму для Ео входит бесконечно большое число положитель- положительных слагаемых fiov Наличие в энергии электромагнитного поля бесконечно боль- большого постоянного слагаемого не сказывается на процессах взаи- взаимодействия поля с веществом — излучением, поглощением и рас- рассеянием света, которые будут рассмотрены в этой главе. При этих процессах имеет место такое изменение состояния электро- электромагнитного поля, при котором имеет значение лишь разность энергий двух состояний. При образовании разности энергий нулевая энергия сокра- сокращается. Поэтому до сравнительно недавнего времени считалось, что нулевая энергия может быть принята за начало отсчета энергии и формально опущена во всех выражениях. Однако раз- развитие квантовой электродинамики показало, что это не так и появление в формуле для энергии электромагнитного поля сла- слагаемого Ео имеет глубокий смысл. С точки зрения современной электродинамики «пустота» — отсутствие частиц и фотонов — не есть «ничто», но есть опреде- определенное состояние поля, именуемое вакуумом. Существование ва- вакуума и нулевых колебаний с частотами сох сказывается на не- некоторых взаимодействиях между электромагнитным полем и электронами и приводит при этом к ряду наблюдавшихся эффектов. Кратко мы коснемся вопроса о вакууме в § 116. Пока же мы не будем рассматривать нулевую энергию. Найдем теперь импульс электромагнитного поля, свободного от зарядов. Согласно C8,25) ч. I, для импульса плоской волны имеем 4 где ftx и Е%—соответственно волновой вектор и энергия волны.
430 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XII Если перейти к квантованным выражениям и заменить Ек ее собственным значением, то легко получаем Рк = **я- Подобно тому как йсох представляет энергию отдельного фо- фотона, так и Ьк% является его импульсом. Мы видим, что между энергией и импульсом фотона существует соотношение, найден- найденное из анализа опытных данных еще до создания квантовой ме- механики: Из A01,6) вытекает, в частности, что масса покоя фотона равна нулю (см. § 14 ч. II). Полный импульс электромагнитного поля равен 2 Он определяется числами заполнения п^ Перейдем теперь к формулировке уравнения Шредингера для электромагнитного поля. Оно имеет обычный вид Волновая функция электромагнитного поля именуется обыч- обычно амплитудой состояния поля. Если воспользоваться гамиль- гамильтонианом в представлении чисел заполнения, то амплитуда со- состояния электромагнитного поля также будет функцией чисел заполнения nh г|) = <ф(яь пъ ... пъ ... t). Операторы й? и av согласно выводам § 99, представляют собой операторы рождения и поглощения фотонов. При действии их на волновую функцию они соответственно увеличивают и уменьшают на единицу число фотонов с частотой сох- Матричные элементы этих операторов даются формулами (99,6), (99,7). § 102. Взаимодействие электрона с излучением Проведя квантование свободного электромагнитного поля, мы можем перейти к рассмотрению системы, состоящей из элек- электромагнитного поля и частиц. Будем считать, что в поле излу- излучения находится один электрон и найдем взаимодействие между электроном и электромагнитным полем. В этой главе мы будем предполагать, что электрон имеет скорость малую по сравнению со скоростью света и описывается нерелятивистским гамильто- гамильтонианом, Напишем гамильтониан системы (поле излучения -Ь
102] ВЗАИМОДЕЙСТВИЕ ЭЛЕКТРОНА С ИЗЛУЧЕНИЕМ 431 электрон) в виде Мы предполагаем, что скалярный потенциал ср выбран равным нулю, а условие калибровки (см. A0,5) ч. 1) векторного потен- потенциала А имеет вид divA = 0. Из этого соотношения следует, что оператор импульса р комму- коммутирует с вектором Л, и поэтому гамильтониан Н может быть пе- переписан как Й ^^А2 + "из, A02,1) Первое слагаемое в A02,1) представляет гамильтониан свобод- свободной частицы, последнее — гамильтониан свободного поля излу- излучения. Гамильтониан взаимодействия электрона с полем излу- излучения, ответственный за все процессы испускания и поглощения фотонов электроном, имеет вид Мы будем формально считать заряд электрона малым пара- параметром, по которому проводится разложение теории возмуще- возмущений. В дальнейшем мы увидим, что фактически разложение ве- е1 ( е2 1 \ дется по степеням малой величины "^г I "J7 = ТзН' К0т0Рая фигурирует в соответствующих матричных элементах и име- именуется константой взаимодействия. Мы ограничимся рассмотре- рассмотрением некоторых простейших процессов в первом неисчезающем приближении теории возмущений. Общие выражения для ве- вероятностей различных процессов были получены нами в § 56, и наша задача сводится к вычислению матричных элементов опе- оператора взаимодействия Н', рассматриваемого как оператор воз- возмущения. Разложение вектора-потенциала удобно представить в виде C8,19) ч. I: где А^У^Г1^'. A02,3) Переходим к квантовым операторам: А = 2 (ЬьАх + BtAl). A02,3')
432 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ XII Используя соотношения C8,20) ч. I, выражаем операторы Ъ\ и б? через операторы qk и ря: Ъ ( 25 (^ ^ ^Г А. А. Используя формулы A01,2), введем операторы йк и d+- Тогда получим / +/+ A02>4) /а5Г л л Сравнивая с (99,6), (99,7), находим, что операторы Вк и Ъ% имеют следующие отличные от нуля матричные элементы: 1), A02,5) (л,, ... |?| / Таким образом, матричные элементы вектора-потенциала от- отличны от нуля только для процессов излучения и поглощения одного фотона. Для оператора (ЛJ, входящего в A02,2), имеем (ЛJ = S [ЬкЪк(АхАк> A02,6) Из этого выражения видно, что матричные элементы опера- оператора (ЛJ отличны от нуля для двухфотонных переходов, т. е. при испускании или поглощении двух фотонов или испускании одного фотона и поглощения другого. В процессы, идущие с участием двух фотонов, дает вклад как оператор, содержащий Л2, так и оператор —-j~(pA), но j уже во втором приближении теории возмущений. Вероятность двухфотонных переходов мала по сравнению с вероятностью однофотоиных переходов. Последняя определяется оператором возмущения (рА). Вектор-потенциал A02,3) описывает состояние фотона с за- заданным импульсом. С таким же успехом можно ввести понятие о состоянии фотона с заданным моментом количества движения. Чтобы найти выражение для вектора-потенциала, описывающего состояние фотона с заданным полным моментом количества дви- движения и его проекций на ось г, мы должны были бы произвести разложение вектора-потенциала Л не по плоским, а по сфериче- сферическим волнам. Амплитуды разложения должны рассматриваться как операторы в пространстве чисел заполнения, удовлетворяю-
$ 103] ПОГЛОЩЕНИЕ И ИЗЛУЧЕНИЕ СВЕТА 433 щие коммутационным соотношениям такого же типа, что и A01,3). В состоянии с заданным импульсом момент количества движения фотона не имеет определенного значения. Это соот- соответствует тому, что плоская волна может быть представлена в виде разложения по бесконечному ряду сферических волн. Фотон обладает определенными «внутренними» степенями свободы, так как при описании его состояния необходимо учесть различные возможные поляризации. Обычно «внутреннее» состояние системы связывается с ее спином. Однако определение спина системы, как ее «собствен- «собственного» момента количества движения, т. е. момента количества движения в состоянии покоя, к фотону неприменимо. Фотон в любой системе отсчета движется со скоростью с. Тем не менее и для фотона иногда оказывается удобным ввести понятие спина, представив оператор полного момента ко- количества движения в виде суперпозиции оператора орбиталь- орбитального момента и оператора спина. При этом, как оказывается, спин фотона следует считать равным единице. В соответствии с тремя возможными проекциями спина sz = 0, ± 1, казалось бы фотон может находиться в трех различных состояниях с разной поляризацией. Однако условие поперечности электромагнитных волн приводит к тому, что фактически возможны лишь две про- проекции спина, которые и соответствуют двум независимым состоя- состояниям поляризации фотона. Подробное рассмотрение затронутых здесь вопросов читатель, найдет в монографии А. И. Ахиезера и В. Б. Берестецкого 1). § 103. Поглощение и излучение света Рассмотрим вероятность однофотонного перехода — процесс поглощения и излучения. Выпишем прежде всего матричные эле- элементы, отвечающие поглощению и излучению фотона с часто- частотой сох- Предположим, что электрон находился в начальном со- состоянии i|)i до поглощения и в состоянии \|?2 после поглощения. Переход 1—»2 идет с поглощением, а 2-*1 с излучением фо- фотона частоты сох. Матричный элемент оператора возмущения A02,2) для перехода с поглощением фотона имеет вид , пх-\\Н'\\, %) = - X ^dV= - ?j/*gb J<,;fo) e'V*lrfK. A03,1) ]) А. И. Ахиезер и В. Б. Берестецкий, Квантовая электродина- электродинамика, «Наука», 1969.
434 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XII Аналогично для процесса излучения фотона имеем (l,*fr+l|fl42,*d--?/^ A03,2) Вероятность перехода в единицу времени с поглощением фо- фотона дается формулой (см. § 56) dW =•%-№, /ь-1|Я'|1,/ix)pp(<D)dQ. A03,3) Здесь dQ — элемент телесного угла, отвечающий направлению распространения фотона до поглощения. Будем считать, что со- состояния 1 и 2 электрона принадлежат дискретному спектру. В этом случае конечное состояние системы с энергией Е2 при- принадлежит дискретному спектру, а начальное — с энергией ?"i + + йсо — непрерывному спектру (поскольку частота со изменяется непрерывным образом). При этом поглощаемый фотон может принадлежать любому из осцилляторов, находящихся в интер- интервале состояний dco dQ в объеме V. Число таких осцилляторов при данной поляризации на единицу объема дается формулой C8,23) ч. I. Переходя к непрерывному распределению частот, мы будем опускать индекс К там, где это не может повести к не- недоразумениям или заменять его на индекс ft. Под р (со) в выражении A03,3) нужно понимать число осцил- осцилляторов в объеме V, приходящихся на единичный энергетиче- энергетический и угловой интервал при данной поляризации: - <103>4> Для вероятности перехода в единицу времени с учетом A03,1) получаем d W = ИШ^ I < <Р*) *"r>2i I2 пи dQ. A03,5) Вероятность поглощения равна нулю для всех энергий, кроме тех, которые удовлетворяют закону сохранения ?2 = ?1 + йсо. A03,6) Определим интенсивность /о(со) падающего излучения, приходя- приходящегося на интервал частот dco и угловой интервал dQ. Так как на один осциллятор приходится пи фотонов с данной поляриза- поляризацией, то имеем /0 (со) dco dQ = п^йсосрй dco dQ = rikh °l2 ?з I • Полная вероятность пропорциональна интенсивности падаю- падающего излучения. Вероятность излучения фотона электроном легко подсчитать совершенно аналогичным образом.
§ 103] ПОГЛОЩЕНИЕ И ИЗЛУЧЕНИЕ СВЕТА 435 Вероятность перехода в единицу времени с излучением фо- фотона с импульсом bk и поляризацией е дается опять формулой типа A03,3) A03,7) Вероятность излучения отлична от нуля, если частота испу- испущенного кванта равна Ь® = Е2-Е{. A03,8) Мы видим далее, что вероятность перехода 2 —> 1 с излуче- излучением фотона, даваемая формулой A03,7), состоит из двух чле« бов Один из них пропорционален интенсивности излучения (числу фотонов tik), имевшейся до акта излучения. Первона- Первоначально имевшееся электромагнитное поле воздействует на элек- электрон, способствуя его переходу в новое состояние с излучением дополнительного фотона. Это излучение именуется индуцирован- индуцированным или вынужденным. На существование индуцированного из- излучения впервые указал Эйнштейн еще до возникновения со- современной квантовой теории излучения. Второй член в формуле A03,7) не зависит от интенсивности первоначального излучения и обеспечивает возможность излучения и в том случае, когда до акта излучения электромагнитное поле не было возбуждено (число фотонов пь=0). Излучение этого типа называется спон- спонтанным или самопроизвольным излучением. Из сравнения формул A03,5) и A03,7) следует с учетом эр- митовости матричных элементов, что для отношения вероятно- вероятностей излучения и поглощения фотона можно написать: A03,9) dW.norjl nk В дальнейшем (см. § 12 ч. VI) будет показано, что из A03,9) непосредственно следует формула Планка для распределения интенсивности в излучении черного тела. Покажем теперь, что поглощать и излучать фотоны могут только электроны, находящиеся в связанном состоянии. Для этого вычислим интегралы, входящие в матричные элементы для вероятностей перехода, считая электрон свободным. Волновые функции \|)i и \|J запишутся в виде плоских волн if>j = Ceilh'p^ry ty2 = Cei/hp2r. С — постоянная нормировки. Подставляя эти волновые функции в A03,2), мы без труда находим: Г ^ J_| у*) e-ikr^2 dV = | С |2 J *-'/*•*' (^ ev) *"* <*.-**>' dV - ~b{p2-hk-Pl). A03,10)
436 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XII Формула A03,10) выражает закон сохранения импульса при взаимодействии фотона со свободным электроном. Кроме того, при переходе имеет место закон сохранения энергии. Таким образом, должны одновременно выполняться равенства p2 = Pl+**, A03,П) E2 = E{ + hco. A03,12) Нетрудно видеть, что уравнения A03,11) и A03,12) несов- несовместны. Аналогичное заключение относится, конечно, и к слу- случаю поглощения. Для того чтобы законы сохранения энергии и импульса могли выполняться одновременно, необходимо участие третьего тела, которому и передается избыток импульса. В случае атом- атомных электронов таким телом может служить ядро атома. § 104. Дипольные переходы в атомных системах Матричный элемент для процесса излучения фотона A03,2) в большинстве случаев может быть существенно упрощен. Обычно длина волны испускаемого фотона значительно больше линейных размеров той области пространства, в которой волно- волновые функции электрона ipi и \|?2 заметно отличны от нуля. Пусть, например, электрон движется в атоме, эффективный радиус которого равен а. Тогда волновые функции начального и конечного состояний весьма малы вне области радиуса а. Энергия электрона в поле я^дра с эффективным зарядохМ Z* по порядку величины равна . Того же порядка и изменение энергии атома Д? при переходе, а следовательно, и энергия из- излучаемого фотона. Тогда длина излучаемой волны А, « — « ж -т~ я* ™2-. Отношение размеров атома к длине волны по порядку величины равно А ~ he ~ 137 # Для внешних электронов Z*« 1 и длина волны существенно больше размеров атома. В случае рентгеновского излучения, воз- возникающего при переходах в /(-оболочке тяжелых атомов, это приближение оказывается уже недостаточным. При X » а пока- показатель экспоненциальной функции, стоящей под знаком инте- интеграла в A03,2), очень мал в пределах эффективной области ин- интегрирования и поэтому множитель eikr можно заменить на еди- единицу.
§ 104] ДИПОЛЬНЫЕ ПЕРЕХОДЫ В АТОМНЫХ СИСТЕМАХ 437* Вероятность перехода с излучением A03,7) перепишется при этом в виде 1)с1п. A04,1) Здесь ре — оператор проекции импульса частицы на направле- направление поляризации испущенного кванта. Матричный элемент оператора импульса можно выразить че- через матричный элемент координаты. Согласно C1,7) и D9,5), имеем (рI2 = т (*I2 = т (rI2 = -f- (Ех - Я2) (гI2 = - -f- со (dI2, A04,2) где d— дипольный момент частицы. Подставляя A04,2) в^ A04,1), получаем d W = rfe — проекция вектора дипольного момента частицы на направ- направление поляризации. Мы видим, что вероятность перехода A04,3) зависит от матричного элемента дипольного момента частицы и поэтому такие переходы называются дипольными, а излучение — дипольным излучением. Если обозначить угол между (d)\2 и на- направлением поляризации излучения через 9, то выражение A04,3) можно переписать как ^I (d)i212cos2 9(nk + 1)dQ. A04,4) Просуммируем последнее выражение по поляризациям кванта. За независимые направления поляризации выбираем поляриза- поляризацию в плоскости d, k и поляризацию в направлении, перпенди- перпендикулярном этой плоскости. Выражение A04,4) при этом приво- приводится к виду ^ A04,5) где Ф — угол между вектором d\2 и направлением распростра- распространения излучения k. Интенсивность излучения в единицу времени в элемент телес- телесного угла dQ получится при умножении A04,5) на энергию фо- фотона Ы. Для спонтанного излучения имеем Проинтегрировав по углам, найдем полное спонтанное излуче- излучение в единицу времени 4r = Slrfi2l2- A04,7).
438 ч метод вторичного квантования [гл. хн Найденное выражение весьма сходно с классической формулой для интенсивности дипольного излучения (см. B7,9) ч. I). Раз- Различие между классической и квантовой формулами заключается лишь в том, что усредненный квадрат дипольного момента d2, входящий в классическое выражение, нужно заменить на соот- соответствующий матричный элемент (удвоенный) 2|di2|2. Аналогичным образом можно рассмотреть дипольные пере- переходы при поглощении света. Полагая в A03,1) eikr = 1 и учи- учитывая A04,2), получаем для вероятности перехода в единицу времени ^Q. A04,8) Усредняя это выражение по всем ориентациям вектора d по от- отношению к направлению падающего излучения, находим cos2 6 = -^ I cos2 9 dQ = у. A04,9) Выражая пь через интенсивность падающего излучения /о (со) и умножая A04,8) на йсо, найдем энергию, поглощаемую за еди- единицу времени A04,10) До сих пор мы рассматривали поглощение и излучение фо- фотона одним электроном. Если поглощающая или излучающая система содержит несколько электронов, то, пренебрегая взаи- взаимодействием между ними, можно считать, что формулы A04,10), A04,5) останутся справедливыми, если только заменить в них дипольный момент электрона суммой дипольных моментов всех электронов. § 105. Квадрупольное и магнитное дипольное излучения Матричные элементы дипольного перехода получаются из об- общего выражения A03,2) при замене экспоненциальной функ- функции e~ikr единицей. Может оказаться, однако, что матричный элемент дипольного перехода обращается в нуль, тогда как точный матричный элемент A03,2) отличен от нуля. В этом случае следует разложить экспоненту e~ikr в ряд, выписав стар- старшие члены разложения. При этом вероятность излучения будет отлична от нуля, хотя и существенно меньше вероятности ди- дипольного излучения. По этой причине такие переходы назы- называются запрещенными. Вероятность излучения, обусловленная следующим членом разложения, будет иметь вид 3^ A05,1)
§ 106] ПРАВИЛА ОТБОРА 439 Интенсивность спонтанного излучения при таком переходе ана- аналогично A04,6) будет равна / du = -gj" I (r (*') Ji I2 sin2 * dQ. A05,2) Сравнивая последнюю формулу с классическим выражением § 31 ч. I, мы видим, что A05,2) представляет совокупность маг- магнитного дипольного и квадрупольного излучений. Вероятность запрещенного излучения (магнитного дипольного и квадруполь- квадрупольного) относится к вероятности разрешенного дипольного излу- излучения, как -jy[k ^ -^ , г ^ ал. Если почему-либо равны нулю матричные элементы A05,1), то аналогично можно найти вероят- вероятность излучения высшего порядка. § 106. Правила отбора Мы видим, что характер излучения атомных и ядерных си- систем определяется матричным элементом ^2i = ег2\. Установим теперь, когда этот матричный элемент может быть отличен от нуля, т. е. между какими состояниями системы возможны пере- переходы, сопровождающиеся дипольным излучением. Совокупность требований, которым должны удовлетворять волновые функции начального и конечного состояний системы, для того чтобы ма- матричный элемент дипольного перехода т^\ не обращался в нуль, называются правилами отбора для дипольного излучения. Пра- Правила отбора могут быть легко сформулированы в общем виде, если волновые функции i|)i и г|J описывают состояние частицы, движущейся в центрально-симметричном поле. В этом случае зависимость ipi и г|J от углов характеризуется сферическими функциями (см. § 35). Для того чтобы в системе были воз- возможны дипольные переходы, должен быть отличен от нуля ма- матричный элемент проекции радиуса-вектора на направление по- поляризации кванта е. Рассмотрим сперва квант, поляризованный по оси z. В этом случае re = z = r cos ft. Матричный элемент ди- дипольного перехода будет пропорционален интегралу П 2Я | j^UcosdK^sindrf*^. A06,1) о о Здесь /ь ^1 и /г, Шч— квантовые числа состояний системы до и после излучения кванта. Учитывая определение сферических функций C0,16), интеграл A06,1) можно переписать в виде Я 271 J P?22 (cos «•) Р/71 (cos ft) cos ft sin ft rfft J el Hi-*») * dq>. A06,2) о о
440 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XII Интеграл по углу ср отличен от нуля только при тх = т2. Ин- Интеграл по углу О имеет при этом вид f \Pt(x)xPTAx)dx. A06,3) -1 Можно показать, что для присоединенных полиномов Лежандра справедливо следующее соотношение 1): Подставляя это выражение в A06,3) и учитывая условия орто- ортогональности присоединенных полиномов Лежандра, получаем, что интеграл A06,3) отличен от нуля только при l2 = h ± 1. Мы видим, таким образом, что если излучение поляризовано по оси 2, матричный элемент дипольного перехода отличен от нуля лишь для переходов с т2 = т\\ l2 = h ± 1. Определим теперь аналогичные правила отбора для кванто- квантовых чисел /, т в том случае, когда квант испущен в направле- направлении оси z и, следовательно, поляризован в плоскости х, у. Рас- Рассмотрим случай круговой поляризации со сдвигом фаз, рав- равным у • Тогда вероятность перехода определяется матричным элементом от величины х ± iy (x±iyJl = (rsin$e±*Ji. A06,5) Выделяя интеграл по углу <р, получим еП«г-т,±1>Ф^ф# A06,6) 0 Последний интеграл отличен от нуля при условии m2 = m1±l. A06,7) Соответствующий интеграл по углу # отличен от нуля, если l2 = l\ ± 1. Таким образом, полученные правила отОрра по кван- квантовым числам / и т для дипольного перехода мог/t быть окон- окончательно сформулированы в виде Дт = 0, ±1; Д/-±1. A06,8) Нетрудно сообразить, что правила отбора, даваемые соотноше- соотношениями A06,8), выражают закон сохранения момента количества движения. То обстоятельство, что / может изменяться на еди- единицу, показывает, что при дипольном переходе излучаемый 1) См., например, Н. Н. Л ебе цев, Специальные функции и их приложе- приложения, Физматгиз, 1953, стр. 261.
§ 106] ПРАВИЛА ОТБОРА 441 квант уносит с собой момент количества движения, равный еди- единице. На первый взгляд этот вывод может показаться странным. Действительно, мы рассматривали (формула A03,7)) переходы с излучением фотона заданного импульса. Но в состоянии с за- заданным импульсом и поляризацией момент количества движе- движения фотона не имеет определенного значения. Если, однако, длина волны фотона велика по сравнению с размерами системы, то возможно разложение функции eikr в ряд. Производя это раз- разложение и оставляя первый неисчезающий член, т. е. главный член, определяющий величину матричного элемента, мы тем са- самым фактически выделяем фотоны с заданным полным момен- моментом количества движения. Дипольному излучению отвечают фо- фотоны с моментом единица, квадрупольному — с моментом два и т. д. Прямой расчет, на котором мы останавливаться не мо- можем, подтверждает этот вывод. Правила отбора A06,8) автоматически удовлетворяют тре- требованиям закона сохранения четности. Поскольку оператор г яв- является нечетным, функции г|>2 и ipi должны иметь различную чет- четность. Тогда при замене г—> (—г) весь матричный элемент остается неизменным. При выводе соотношений A06,1) не учитывались спиновые состояния электрона, т. е. предполагалось, что спиновое состоя- состояние не связано с орбитальным движением. В этом случае усло- условия A06,8) должны быть дополнены соотношением As = 0, ко- которое выражает сохранение спина при дипольном переходе. Од- Однако, если спин-орбитальным взаимодействием пренебрегать нельзя, как это имеет место, например, у тяжелых атомов и у ядер, необходимо сформулировать правила отбора для пол- полного момента /. Учитывая, что при дипольном переходе квант уносит момент, равный единице, по правилу сложения моментов в квантовой механике, получаем Ду = О, ±1 (исключая 0->0 переходы) A06,9) В этом случае переходы с А/ = 0 не запрещены, так как пол- полный момент не связан непосредственно с четностью состояния. Переход из состояния /i = 0 в состояние /г = 0 запрещен, так как при этом невозможно удовлетворить закону сохранения пол- полного момента. При магнитном дипольном излучении квант также уносит мо- момент, равный единице. Однако магнитный дипольный квант имеет четность, противоположную четности электрического ди- польного кванта. Это связано с тем, что оператор магнитного момента не меняет знака при инверсии системы координат, так как магнитный момент — псевдовектор. Следовательно, матрич- матричные элементы оператора магнитного момента отличны от нуля лишь для переходов между состояниями одинаковой четности.
442 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. Х!1 Электрический квадрупольный кваит уносит момент, равный двум. В соответствии с этим правила отбора по полному мо- моменту имеют вид Д/ = 0, ±1, ±2. A06,10) Запрещены переходы с моментами 0->0; \-»\\ 0«М. Изменение момента при излучении, даваемое соотношениями A06,9), A06,10), относится или к одной частице, если изме- изменяется только ее состояние, или ко всей системе в целом, на- например к атому или ядру. Если система находится в некотором возбужденном состоя- состоянии, и дипольный переход в низшее энергетическое состояние запрещен, то время жизни системы в этом возбужденном со- состоянии может быть достаточно велико. Состояния такого типа называются метастабильными. В не очень сильно разреженных газах метастабильный атом обычно отдает свою энергию возбу- возбуждения при столкновениях с другими атомами без излучения. Переходы, связанные с изменением момента Д/ « 4,5 и за- запрещенные в высокой степени, наблюдаются у ядер. Время жизни ядра по отношению к такому переходу при малых энер- энергиях возбуждения может достигать нескольких месяцев. Такие ядра называются изомерными. Впервые они наблюдались И. В. Курчатовым и Л. И. Русиновым. § 107. Фотоэффект Фотоэффектом называется процесс поглощения фотона свя- связанной частицей, когда энергия фотона превышает ее энергию связи. В частности, при фотоэффекте на атоме электрон, нахо- находящийся в состоянии, принадлежащем дискретному спектру, по- поглощает фотон и переходит в непрерывный спектр. Кинетиче- Кинетическая энергия Т электрона, вырванного из атома, определяется соотношением Эйнштейна Г = ?©-/, A07,1) где / — энергия ионизации атома. Избыток импульса, возникающий при поглощении фотона, передается ядру. Чем сильнее связан электрон в атоме, тем легче происходит передача импульса ядру. Поэтому следует ожидать, что вероятность фотоэффекта будет иметь максималь- максимальное значение для наиболее связанных электронов, электронов /(-оболочки. В дальнейшем мы ограничимся рассмотрением этого случая. Матричный элемент перехода с поглощением одного кванта
§ 107] ФОТОЭФФЕКТ 443 имеет вид A03,1). В матричном элементе волновые функции xpi и г|J отвечают соответственно основному состоянию электрона в атоме и состоянию, принадлежащему сплошному спектру. Так как мы не учитываем релятивистских эффектов, то очевидно, что энергия фотона, во всяком случае, должна быть мала по срав- сравнению с энергией покоя электрона //со <С тс2. С другой стороны, мы исключим область, близкую к порогу фотоэффекта, и будем считать, что энергия фотона велика по сравнению с энергией ионизации атома. Эти требования с уче- учетом A07,1) и C8,17) приводят к неравенству Согласно результатам § 84, выполнение неравенства A07,2) означает, что кулоновское поле, действующее на электрон, можно рассматривать как малое возмущение. Следовательно, в качестве волновой функции \|J свободной частицы в нулевом приближении можно взять плоскую волну (пренебрегая влия- влиянием кулоновского поля на свободный электрон). Волновая функция электрона на /(-оболочке может быть представлена в виде водородной функции с эффективным зарядом ядра Z (влияние остальных электронов на /(-электроны мало). Тогда имеем /5^ ?^4" A07'3) Волновую функцию конечного состояния \|J, принадлежащую к сплошному спектру, мы нормируем на б-функцию в простран- пространстве импулъсов. Вероятность перехода в единицу времени со- согласно E6,80 равна A07,4) Здесь du — элемент телесного угла, характеризующего направ- направление импульса р испущенного фотоэлектрона, Ех = —/, Е2 = у-. Интегрируем A07,4) по энергиям конечного состояния: A07,5) Величина импульса р определяется соотношением A07,1). Интеграл в матричном элементе A07,5) после подстановки ука- указанных выше волновых функций легко вычисляется. Для этого представим его в виде ГJI/ i (qr) _Zr J - где е — вектор поляризации фотона.
444 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XII Здесь мы ввели вектор q = bk— р, представляющий им- импульс, переданный ядру, и воспользовались свойством попереч- лости электромагнитных волн (ek) = 0. Интегрируя по частям, получаем Переходя к сферическим координатам с полярной осью, направ- направленной по вектору <7, находим е а ен dV = —.— J # л —? ft j e a rdr = Матричный элемент #2i, следовательно, имеет вид 1 A07,6) Дифференциальное эффективное сечение фотоэффекта мы по- получим, если разделим вероятность перехода в единицу времени A07,5) на плотность потока падающих фотонов. Так как погло- поглощается один квант и процесс нормируется так, что в объеме V имеется один фотон, то плотность потока падающих фотонов равна -~. В соответствии с этим имеем , __ 32-137* p(peYc* ( е> \2 ао ~ Z3 (тс2JЫ \тс2) , д2а2 H2Z2) Константа го = -^ ^ 10"3 см, как известно, носит название классического радиуса электрона. Выражение A07,7) можно упростить. Обозначим прежде всего через Ф угол между направ- направлениями импульса падающего кванта и испущенного фотоэлек- фотоэлектрона, т. е. угол между векторами k и р, а через ф—-угол ме- между плоскостями (pfe) и (ek). Тогда, обозначая bk = x, имеем (ре) = р sin * cos ф, q2 = p2 + и2 - 2рк cos ft. A07,8) Выражение ^+^^т> входящее в A07,7), также можно перепи- переписать в более простом виде л ч (fa2 а2 [12Ь2 . 2\ а2 (Z2m2e* l^W' = ~?z^\aT~ + q ) = Т^Г~Р Из соотношения A07,1), учитывая, что/ = —g Ьр
§ 108] РАССЕЯНИЕ СВЕТА АТОМАМИ 445 Тогда предыдущее соотношение перепишется как 1 + Ш = Ш Й ~ Р cos #), A07,9) где Р = |. Здесь мы использовали условие кс = йш «С тс2. Абсолютную величину импульса /?, входящего в A07,5), можно заменить, со- согласно A07,1) и A07,2), на величину |/2тйсо. Учитывая соот- соотношения A07,9) A07,8), получаем для дифференциального эф- эффективного сечения A07,7) следующее выражение: /1Л7 im A07,10) Поскольку выражение A07,10) получено в нерелятивистском приближении, оно имеет смысл лишь с точностью до членов пер- первого порядка по р. Поэтому окончательно имеем: . A07,11) Из выражения A07,11) следует, что фотоэлектроны испу- испускаются в основном в направлении поляризации фотона •&= ~-; Ф = 0. В направлении распространения кванта (Ф = 0) фото- фотоэлектроны не вылетают. С увеличением энергии кванта макси- максимум сильно смещается в направлении вперед. Чтобы получить полное эффективное сечение фотоэффекта на /(-оболочке, нужно проинтегрировать A07,11) по всем углам О, ф и кроме того, ввести коэффициент 2, так как на /(-оболочке имеются два элек- электрона: 32 V2 Z5 Мы видим, что полное сечение быстро растет с увеличением за- заряда ядра (как Z5) и уменьшается с увеличением частоты кванта (как утг § 108. Рассеяние света атомами В качестве важного примера процесса, идущего с участием двух фотонов, рассмотрим квантовую теорию рассеяния света атомами. Пусть на атом падает фотон с волновым вектором ku а испускается фотон с волновым вектором k2. Соответствующие частоты обозначим через coi и Ш2, а векторы поляризации —
446 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XII через ех и е2. Если частота падающего кванта и частота уходя- уходящего равны между собой, т. е. ooi = 02, то атом после рассеяния возвращается в исходное состояние. Такое рассеяние без изме- изменения частоты называется когерентным. Мы видели в ч. I, что с точки зрения классической теории излучения когерентное рас- рассеяние является единственно возможным. С квантовомеханиче- ской точки зрения столь же естественным процессом является рассеяние с изменением частоты, экспериментально обнаружен- обнаруженное Раманом и независимо от него Л. И. Мандельштамом и Г. С. Ландсбергом и получившее название комбинационного рассеяния. Для общности мы будем считать, что состояние атома в акте рассеяния изменяется. Будем считать, что энергия падающего фотона меньше энергии связи электрона в атоме, что отвечает области спектра видимого света. При энергиях фотона, больших по сравнению с этой величиной, электрон можно считать сво- свободным. Однако рассмотрение рассеяния фотона на свободном электроне (эффекта Комптона) мы отложим до § 127. Если энергия атома в начальном состоянии Еи а в конеч- конечном — Е2, то закон сохранения энергии дает: Ь(ъ2 = Ь®1+Е1-Е2. A08,1) Выпишем матричные элементы оператора взаимодействия Й' A02,2) для процесса рассеяния. Так как в процессе прини- принимают участие два фотона, то нужно учитывать вклад в матрич- матричный элемент оператора Л2. Обозначим оператор —~(рЛ) через trie 2 trie Ни а оператор 2/^g2 А2 через Н2. Тогда полный оператор воз- возмущения равен Н' = Н[ + Н'2. A08,2) Из A02,4) с учетом A02,5) следует, что оператор А2 дает вклад в исследуемый процесс в первом приближении теории возму- возмущения (Я?J1 = Щ- -tL= \ ^у <*«-*»> г (e{e2) $i dV. A08,3) mV V cdiCd2 J При рассматриваемых частотах длина волны света значительно больше размеров атома. В соответствии с этим экспоненциаль- экспоненциальную функцию в A08,3) можно положить равной единице. Учи- Учитывая также ортогональность функции i|?i и г|?2, имеем Оператор Й[ имеет отличные от нуля матричные элементы только для процессов, идущих с участием одного фотона. В слу-
108] РАССЕЯНИЕ СВЕТА АТОМАМИ 447 чае рассеяния оператор Й[ может давать вклад в вероятность перехода лишь во втором приближении теории возмущений. В § 56 было показано, что для определения вероятности про- процесса во втором приближении нужно найти матричные элементы оператора Ни соответствующие переходам в промежуточные со- состояния. В процессе рассеяния возможны два типа промежуточных состояний, по которым надо произвести суммирование. 1) При переходе из начального в промежуточное состояние первого типа происходит поглощение фотона к\ и атом переходит в не- некоторое состояние, которое мы будем характеризовать ин- индексом i (энергия Ei). При последующем переходе из промежу- промежуточного состояния в конечное испускается фотон k2. Матричные элементы для перехода из начального состояния в промежу- промежуточное и из промежуточного состояния в конечное, согласно A03,1), и A03,2) имеют вид J Ъ A085) 2) При переходе в промежуточное состояние второго типа сперва происходит излучение фотона к2. Затем фотон k\ погло- поглощается, а атом переходит из промежуточного состояния в ко- конечное. Напомним, что закон сохранения энергии имеет место только для начального и конечного состояний. Матричные эле- элементы перехода через второе промежуточное состояние запи- запишутся как Aоед Составной матричный элемент Л дается формулой E6,19) Энергия начального состояния складывается из энергии атома Ех и энергии падающего кванта /zcoi, т. е. ?<Ha4 = ?l+^CD1. A08,8) Энергия промежуточного состояния второго типа включает в себя, помимо энергии атома, также суммарную энергию двух фотонов.
448 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XII Подставляем выражения A08,5) и A08,6) в A08,7), полу- получаем A _ е22пЬ у ( (e2phi (*ip)n . (e\phi (e2p)n 21~ mWV^^E^Ei + b^ ЕХ-Е1-Ы2 При этом мы заменили экспоненциальные выражения eik^r и e-ik2r на единицы. В суммирование по энергетическим состоя- состояниям атома должно быть включено и интегрирование по состоя- состояниям, принадлежащим сплошному спектру. Полный матричный элемент для рассматриваемого процесса получится прибавле- прибавлением к A08,9) матричного элемента A08,4) A08,10) Вероятность перехода в единицу времени дается, как всегда, формулой dW=^\M2x\29(<>>2)dQ. A08,11) Здесь р((Ог), как и в § 103, означает число осцилляторов поля в объеме V, приходящихся на единичный энергетический интер- интервал [см. A03,4)]. Элемент телесного угла dQ характеризует на- направление импульса рассеянного фотона. Разделив вероятность перехода в единицу времени A08,11) на плотность потока падающих квантов, равную, как и в пре- предыдущем параграфе -р-, получим выражение для дифференци- дифференциального эффективного сечения процесса 2du. A08,12) Ясно, что в случае точного резонанса ficoi = Ех — Ег формула A08,12) неприменима. Формула A08,12) характеризует рассеивающую способность атома как функцию частоты падающего света, и поэтому назы- называется, как и в классической электродинамике, дисперсионной формулой. Последний член в A08,12) отличен от нуля только для когерентного рассеяния coi = 002, при котором начальное и конечное состояния атома совпадают. Если начальное и конеч- конечное состояния атома не идентичны, то частота рассеянного из- излучения сдвинута по отношению к частоте падающего на вели- величину, соответствующую разности энергетических состояний [1 V I (*2рЬ* (ехр)ц . (ejphi (е2р)п \ . д (оо\\
§ 108] РАССЕЯНИЕ СВЕТА АТОМАМИ 449 атома A08,1). Рассеяние такого типа называется комбинацион- комбинационным или раман-эффектом. Формулу A08,12) можно переписать в несколько ином виде, если выразить матричные элементы импульса через матричные элементы координаты электрона. Прежде всего удобно предста- представить последний член в квадратных скобках в A08,12) в той же форме, что и два предыдущих. Для этого заметим !), что скалярное произведение (в\е2) мо- может быть выражено как результат коммутации соответствую- соответствующих проекций операторов риг (*i«2) = т K«iP) (**) ~ ^r) (*iP)]. (Ю8,13) То обстоятельство, что скалярное произведение {exe2) входи г в A08,12) только для когерентного рассеяния, мы учтем, если возьмехМ от A08,13) матричный элемент перехода из начального состояния в конечное. Этот матричный элемент в силу ортого- ортогональности соответствующих волновых функций будет отличен от нуля только при условии, что начальное состояние атома сов- совпадает с конечным 621 (ехе2) = \ \{ехр) {е2г) - {e2r) {ехр)]2Х = = Т S ((*iP)« (еЛх - Ш2г (ехр)п). A08,14) Полученное выражение подставим в A08,12). Матричные эле- элементы импульса, согласно D9,5), выражаются через матричные элементы координаты ym(?2-?l)(rJl. A08,15) Складывая в A08,12) соответствующие матричные элементы в квадратных скобках и учитывая закон сохранения энергии A08,1), получаем следующее выражение для квадратной скобки, входящей в A08,12): Г 1 — — V (®2 (Ei~Ei) (e2rJi(eir)n , (u2(^2~^t) (e\rJi (е2г)ц \ 1' ' *J ~~ Ъ Li \ Et-Ei + Ъщ ~^ Ex-Ei-Ьщ )' A08,16) Это выражение можно упростить, если прибавить к нему сле- следующее, равное нулю, слагаемое: («!»¦) (е2г) - (е2г) (в1г)Ь, = ^ 2 ((e2rJ{ (e,r)n - (e,rJi (e2r)n). i !) См. цитированную монографию А. И. Ахиезера и В. Б. Берестецкого, стр. 385. 15 В. Г. Левич и др., том II
450 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XII Тогда получаем: \ ( () (егг)ц , far)»/ (е2г)ц \ ППЯ 17\ + ) A08>17) Подставляя A08,17) в A08,12), находим окончательное выра- выражение для дифференциального эффективного сечения рассеяния ?4 1 2 id \ ?j — ?j + ЙСй! ' Ь\— Ei — ЙСй2/ V 7 Замечательной особенностью полученных формул является то, что при когерентном рассеянии они совпадают с классиче- классической формулой § 36 ч. I. Формула A08,18) широко применяется на практике, поскольку изучение комбинационного рассеяния оказалось весьма эффективным методом исследования уровней энергии и других свойств сложных молекул. Отметим также, что из полученных соотношений можно вы- выразить матричные элементы атомного дипольного момента, ин- индуцируемого светом. В свою очередь, как это было показано в § 34 ч. IV, в разреженном газе легко найти связь между ди- диэлектрической проницаемостью и индуцируемым дипольным мо- моментом. Поэтому форхмула A08,18) является основной для кван- товомеханического расчета диэлектрической проницаемости е и соответственно показателя преломления п = |/е. В частности, при когерентном рассеянии для величины п2 получается следую- следующее выражение: ^ 2^-2 > A08,19) где величина f,- = —g^-l хп г носит название силы осциллятора, Ъ(йП = Ei — Еи N — число атомов в единице объема. За ось х мы выбрали направление поляризации фотонов. Для сил осцил- осцилляторов fi справедливо соотношение !) Как отмечалось выше, полученные выражения теряют смысл вблизи резонанса. Исследование этого явления, носящего назва- название резонансной флуоресценции, невозможно без введения по- понятия ширины линии, которому будет посвящен следующий параграф. Там же будут приведены формулы теории рассеяния с учетом ширины линии. 1) См., например, Г. Бете и Э. Солпитер, Квантовая механика ато- атомов с одним и двумя электронами, Физматгиз, I960, стр. 401.
§ 109] ТЕОРИЯ ЕСТЕСТВЕННОЙ ШИРИНЫ ЛИНИЙ 45! § 109. Теория естественной ширины линий В § 103—105 была найдена полная вероятность излучения фотона атомной системой. Более точное исследование соответ- соответствующих уравнений дает возможность найти и распределение интенсивности излучения по частоте, т. е. определить форму спектральной линии излучения. Напомним, что подобная задача была решена и в рамках классических представлений (см. ч. I). При этом для получения естественной формы линии нужно было учесть затухание амплитуды радиационного осциллятора. Хотя взаимодействие заряженных частиц с электромагнит- электромагнитным полем является слабым, мы не можем при рассмотрении формы линии ограничиться обычным приближением теории воз- возмущений. Действительно, получение формы линии связано с не- необходимостью учесть затухание начального состояния атомной системы. Такое затухание проявляется за достаточно большое время t и, естественно, не может быть учтено методами теории возмущений (см. § 56). • Будем исходить из общей системы уравнений E5,5) для ам- амплитуд ст невозмущенных состояний (атом и поле излучения). Амплитуду начального состояния системы обозначим через q/(tf). В этом состоянии фотонов нет, а атом находится в возбужден- возбужденном состоянии с энергией Е2. В системе уравнений E5,5) доста- достаточно учесть лишь такие состояния, энергия которых прибли- приближенно совпадает с энергией исходного состояния. Именно эти состояния играют основную роль. Будем считать для простоты, что состояние с энергией Е2 является первым возбужденным со- состоянием атома, а энергия основного состояния равна Е\\ При излучении испускается фотон с частотой со, близкой к ча- частоте «о. Амплитуду состояния, возникающего при переходе 2 -* 1 (атом переходит в основное состояние и испускается фо- фотон с волновым вектором kKi частотой о)*, поляризацией е%), обо- обозначим через fiit). Система уравнений E5,5) в данном елуч-ае будет иметь вид Из начальных условий следует 15*
452 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ (ГЛ. XII Введем обозначения /©х*), (l,ljtf'|2, о) = Щ2, шО <20|Я'|1 h) = H'2l = H\l (Ш'2) Гамильтониан взаимодействия Н' заряженных частиц с элек- электромагнитным полем дается выражением A02,2). Форма линии определяется величиной | f{ {t) |2 = | fK (t) |2 при t —> оо. Подставляя выражение A09,2) в A09,1), получаем систему уравнений для амплитуд fx(t) иф(?): Цяй/х(<). A09>3) л Систему уравнений A09,3) удобно решать с помощью преоб- преобразования Лапласа. Амплитуды в представлении Лапласа обо- обозначим через fx(p): оо joo-f 6 h(p)=jh(t)exp(-pt)dt, h(t) = -±r J h(p)exp(pt)dp. 0 —too+6 A09,4) С учетом начальных условий, имеем ipk (P) = \ н 12Ф (Р) + ®xfx (Р)э ip<P (Р) = * + «оФ (р) 4 A09,5) Исключая из этой системы амплитуду ф(р), получим урав- уравнение для функции 1к(р): ( ) (/ ) / () Умножая левую и правую части уравнения на функцию Н\*2 и суммируя по Я, находим выражение для суммы -g- J^ Hlhi) (Ю9,7) где y определяется соотношением Переходим от дискретного к непрерывному распределению частот и заменяем суммирование интегрированием. Знаменатель левой части выражения A09,8) содержит бесконечно малую
•§ 109] ТЕОРИЯ ЕСТЕСТВЕННОЙ ШИРИНЫ ЛИНИЙ 453 мнимую положительную добавку. Интегрирование по частоте со сводится к взятию интеграла в смысле главного значения и по- полувычету в точке сох = //?, где F — произвольная функция. Интегралом, взятым в смысле главного значения, мы прене- пренебрегаем. (Он дает малый действительный сдвиг спектра частот излучения.) Так как при интегрировании по переменной Ла- Лапласа р основной вклад вносит область, где ip « ооо, мы можем при нахождении величины у брать вычет сразу в этой точке. Окончательно имеем Y - "F 2 J dQ I Я12 Г <V/Bncf. A09,10) В правой части проводится суммирование по поляризациям и интегрирование по направлениям вектора k испущенного фо- фотона. Из сравнения A09,10) с выражениями, полученными в § 103, следует, что величина у является полной вероятностью излучения в единицу времени фотона атомом. Подставляя выражение A09,7) в ^A09,6), находим ампли- амплитуду Мр): Лр-»*- {тп) По изображению A09,11) находим оригинал, функцию fx(t) [см. A09,4)]. Замыкая контур интегрирования в левой полупло- полуплоскости комплексного переменного р и определяя вычеты, нахо- находим Выражение |Ы0|2» взят°е п0 истечении достаточно большого времени t ^> 1/у, определяет вероятность испускания атомом фо- фотона с данной поляризацией и данным волновым вектором kXi т. е. определяет форму линии излучения Интенсивность излучения атомом фотона данной частоты со, /(со) получается из A09,13) умножением |М°°)|2 на Йсор(со) {см. A03,4)] и суммированием и интегрированием по поляриза- поляризациям и направлениям испущенного фотона, Учитывая A09,10),
454 МЕТОД ВТОРИЧНОГО КВАНТОВАНИЯ [ГЛ. XII имеем A09,14) Распределение интенсивности излучения имеет дисперсион- дисперсионный характер, причем ширина распределения у равна полной вероятности излучения в единицу времени. Полученная связь ширины распределения с вероятностью перехода находится в со- соответствии с общим соотношением неопределенности Гейзен- берга для времени и энергии АЕ At^b (см. § 34). Здесь АЕ — неопределенность энергии возбужденного состояния, АЕ ~ ЗДсо,. Лео — ширина распределения и At — среднее время жизни атома в возбужденном состоянии, причем At ~ 1/у, так как излучение происходит за время порядка 1/у. Отсюда следует, что Дсо ~ уу в соответствии с полученным результатом. В том случае, когда переход происходит не между первым и основным уровнем, а между произвольными t-м и k-м уровнями, ширина линии перехода у*ь равна сумме ширин у* и уъ. уровней Y* = Yi + Y*. A09,15) Каждая из ширин уровней Yi и Yft равна сумме вероятностей пе- перехода с данного уровня на все ниже лежащие уровни. Рассмотренная ширина носит название «естественной», по- поскольку она обусловлена самим процессом излучения, реакцией излучения. Помимо этого существуют и другие механизмы уши- рения спектральных линий, приводящие обычно к более замет- заметным эффектам. Так, например, в газовой системе существенным является ударное и доплеровское уширение1). Ударное ушире- ние обусловлено столкновениями между молекулами. Действи- Действительно, столкновение прерывает процесс излучения. Поэтому* если т — время жизни атома по отношению к столкновениям (среднее время между столкновениями), то, как следует из со- соотношения неопределенности для времени и энергии, ширина линии порядка — • При учете ширины линии результаты, полученные в предыду- предыдущем параграфе, могут быть распространены на области вблизи резонанса, когда где Еп — энергия одного из атомных уровней. В этом случае основной вклад при суммировании вносят лишь состояния с «резонансной» энергией Еп. Так, для дифференциального эф- эффективного сечения когерентного рассеяния вместо A08,18) *) Подробно этот вопрос рассмотрен, например, в книге И. И. С о бель* м а н а, Введение в теорию атомных спектров, Физматгиз, 1963.
•§ 109J ТЕОРИЯ ЕСТЕСТВЕННОЙ ШИРИНЫ ЛИНИЙ 455 имеем 2 -сШ, A09,16) где Тп — полная ширина п-го уровня. Суммирование ведется по всем состояниям с энергией Еп. Выполняя суммирование и усредняя по начальным состоя- состояниям системы и суммируя по конечным, получаем где уп — естественная ширина я-го уровня, X = с/со, /ь In — пол- полные моменты начального и п-го — атомных состояний. Сечение достигает максимальной величины, равной 4яХ2 . при точ- точном резонансе и ^п = Гп.
ГЛАВА XIII РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА §110. Релятивистское волновое уравнение для частицы со спином нуль До сих пор мы ограничивались изучением свойств микроча- микрочастиц, движущихся со скоростями, малыми по сравнению со ско- скоростью света. Действительно, при получении уравнения Шредингера мы писали нерелятивистскую функцию Гамильтона частицы во внешнем потенциальном поле и заменяли в ней соответствующие величины на операторы. Для получения релятивистской теории следует пользоваться той же схемой, которая была развита в § 27. Именно, для построения волнового уравнения следует использовать релятивистское вы- выражение для функции Гамильтона. Для общности мы сразу будем считать, что частица движется во внешнем электромаг- электромагнитном поле. Тогда ее функция Гамильтона имеет вид B3,17) ч. II. Производя в ней замену соответствующих величин на операторы, т. е. Я~>/й-^-, р-> —/W, получаем уравнение (tt -^ - есрJ * = с2 (- ihV - у А Уравнение A10,1) носит название уравнения Клейна — Гордо- Гордона — Фока. Релятивистская инвариантность этого уравнения очевидна. Уравнение Клейна — Гордона — Фока представляет собой волновое уравнение .второго порядка. Поскольку релятивистская .функция Гамильтона в пределе переходит в функцию Гамильтона классической механики, то естественно предположить, что при с —»оо уравнение Клейна — Гордона — Фока перейдет в уравнение Шредингера. Покажем это.
1 110] УРАВНЕНИЕ ДЛЯ ЧАСТИЦЫ СО СПИНОМ НУЛЬ 457 Начала отсчетов для эиер(ии в нерелятивистской теории и теории относительности различаются на тс2, поэтому удобно ввести преобразование волновой функции \|э с помощью следую- следующего соотношения: imcH o|)(*, *) = ¦'(*. t)e h . Подставляя в A10,1) и вычисляя производные по времени, получаем = с2 (р - ~ ЛJф'. A10,2) Оставляя в этом уравнении только члены, пропорциональ- пропорциональные с2, приходим, после деления обеих частей уравнения на 2тс2 к обычному уравнению Шредингера A10,3) Мы показали, таким образом, что уравнение Клейна — Гор- Гордона—Фока в нерелятивистском пределе переходит в уравне- уравнение Шредингера. Уравнение A10,1), как и уравнение Шредингера, определяет развитие процесса во времени. Состояние частицы по-прежнему характеризуется волновой функцией -ф (#, у, z, t). Эта функция зависит от координат х> у, z, t и не содержит спиновых перемен- переменных. Поэтому заведомо ясно, что уравнение Клейна — Гордо- Гордона — Фока определяет поведение частиц со спином нуль. Для описания частиц со спином, отличным от нуля, оно должно быть как-то видоизменено. Поскольку уравнение Клейна — Гордона — Фока является релятивистски-инвариантным, то при преобразованиях Лоренца волновая функция может умножаться только на некоторый по- постоянный фазовый множитель. Из соображений нормировки следует, что этот множитель должен равняться +1 (но не —1, так как преобразование Лоренца является непрерывным). При пространственном отражении координат волновая функция г|) может умножаться на +1 или —1. Иными словами, при воз- воздействии оператора четности волновая функция может преобра- преобразовываться двумя способами: Н(х, у, z, /)= + *ф(—л:, -у, -z, 0, у9г, *)«-¦(-*, -у, -z,f).
458 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. ХШ Таким образом, волновая функция ф может быть или скаля- скаляром или псевдоскаляром. По этой причине уравнение Клейна — Гордона — Фока часто называют скалярным уравнением. В качестве примера интегрирования уравнения A10,1) рас- рассмотрим случай свободной частицы. При этом уравнение Клей- Клейна — Гордона — Фока может быть записано в форме - tf ?*- = - c2h2 Дф + т2с% A10,4) Решение уравнения A10,4) будем искать в виде iEt yjp^e" h ih(x, j/, z). Тогда для функции ^i находим ?2^= - c2h2 Дф,+ m2c%. Переписав последнее уравнение в виде ?224i = 0, A10,5) легко найдем, что решением его служит плоская волна вида ф,= ае h . Подставляя найденное значение для \J)i в A10,5), приходим к релятивистскому соотношению между энергией Е и импуль- импульсом р свободной частицы Это соотношение совпадает с обычной формулой для энер- энергии в теории относительности. § 111. Плотность заряда и поток вероятности для частиц со спином нуль Мы перейдем теперь к нахождению плотности заряда и по- потока вероятности для частиц, описываемых скалярным волно- волновым уравнением A10,1). Вывод выражений для этих величин производится по той же схеме, что и для уравнения Шредин- гера. Именно, уравнение Клейна — Гордона — Фока = 0 A11,1) умножаем на сопряженную волновую функцию -ф*. Волновое уравнение, сопряженное к уравнению A11,1), ум- умножим на волновую функцию if. Из первого уравнения вычтем
$ Ш] ПЛОТНОСТЬ ЗАРЯДА И ПОТОК ВЕРОЯТНОСТИ 459 второе. В результате найдем: - h2c2 [У Лг|з* -1|>* Ai|)] - ibec W (VA + AV) я|> + ij> (VA + AW) i|>*] = 0. (П1.2) Первое выражение, стоящее в скобках, легко преобразуется к виду Вторая скобка есть просто производная по времени от про- произведения ф*ф. С помощью векторного соотношения ф Дф* = ф div grad ф* = div (ф grad ф*) — grad ф grad г|)* находим, что г|> Дф* — -ф* А-ф = div ["ф grad ф* — ф* grad ф]. Наконец, последнее выражение в скобках формулы A11,2) с помощью соотношения «Ф* (VA) ф = ф* div (фЛ) = div (ф*фЛ) - фА grad ф* приводится к виду ф* (VA + AV) ф + ф (VA + AV) ф* = 2 div (ФФ*А). Если умножить все члены уравнения A11,2) на величину ^ 2 и использовать указанные преобразования, то уравне- уравнение A11,2) запишется в виде где плотность заряда р равна Для плотности тока имеем при этом выражение ' = -ШГ№ grad ¦* ~ ^*grad ¦!"" -&^ Остановимся на смысле полученных результатов. В нереля- нерелятивистской теории плотность заряда р можно записать в виде Р (х, у у г, 0 = eW (x, у, г, t), где W(x, у, г, 0 — есть плотность вероятности. Последняя по своему существу является положительной величиной. Соотноше- Соотношение A11,3), очевидно, не может быть истолковано подобным об- образом. Выражение для р может быть сделано отрицательным
460 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XIII соответствующим подбором функции гр в начальный момент времени. Действительно, поскольку уравнение Клейна — Гордона — Фока является уравнением второго порядка по времени, в на- начальный момент времени могут быть заданы произвольные зна- значения самой гр-функции и ее производной по времени. Выбирая различные гр и -^г, можно прийти как к положительным, так и отрицательным значениям величины р. Покажем теперь, что величина р/е действительно имеет своим нерелятивистским пределом произведение г|)*г|э. Пусть для производной волновой функции -ф по времени выполняется соот- соотношение В таком случае выражение для плотности заряда р может быть записано в виде »- Если из энергии Е выделить энергию покоя, т. е. положить Е = тс2 + Е\ то в этом случае легко получаем тс2 Если величина Е' — еу «С me2, то мы имеем правильное вы- ражение для нерелятивистского предела величины р/е. Мы ви- видим, что в случае уравнения Клейна — Гордона — Фока нельзя ввести положительно определенную плотность вероятности. Это обстоятельство послужило причиной того, что в течение дли- длительного времени уравнение Клейна — Гордона — Фока не при- применялось к реальным объектам. § 112. Понятие о поле ядерных сил Позднее уравнению Клейна — Гордона — Фока была при- придана новая, совершенно иная физическая трактовка. Мы знаем уже, что помимо электрических взаимодействий в природе реализуются и другие виды взаимодействий. В част- частности, такими взаимодействиями, не зависящими от электри- электрического заряда е, являются сильные ядерные взаимодействия. Казалось естественным допустить, что ядерное взаимодействие можно связать с наличием у нуклонов особого нуклонного за- заряда g. При этом ядерное взаимодействие можно попытаться описать по аналогии с взаимодействием электрических зарядов, введя представление о поле ядерных сил. Это поле должно опи»
§ 112] ПОНЯТИЕ О ПОЛЕ ЯДЕРНЫХ СИЛ 461 сываться некоторым потенциалом, подобным потенциалу ф элек- электрического поля. Была сделана попытка отказаться от трактов- трактовки уравнения Клейна — Гордона — Фока как уравнения для волновой функции одной частицы. Вместо этого функцию г|) было предложено рассматривать как потенциал ядерного поля, создаваемого нуклонами. Подобно тому как фотоны являются квантовыми частицами, отвечающими электромагнитному полю» так и ядерному полю отвечают я-мезоны. В § 67 мы останавливались уже на наглядной трактовке об- обмена я-мезонами и фотонами как источника соответственно сильного нуклонного и электрического взаимодействия. Проводя эту аналогию дальше, мы можем перейти к написа- написанию уравнения для потенциала ядерного поля. В качестве та- такого уравнения возьмем уравнение Клейна — Гордона — Фока в виде ^f?K**-0, A12,1) ,.2 _ «'С где m — масса я — мезона. Мы не будем рассматривать квантовой теории ядерных сил> в которой мезоны являются элементарными возбуждениями не- некоторого поля, подобно фотонам в квантовой теории электро- электромагнитного поля. Поскольку нас интересует лишь качественная сторона дела, мы проведем рассуждения по аналогии с классической теорией электростатического поля. Считая ядерное поле не зависящим от времени, напишем для его потенциала \|) уравнение Aib — v2ib — О П 19 9\ Это уравнение является некоторым аналогом уравнения элек- электростатического поля и переходит в последнее при т-*0 (см. ниже). При наличии точечных зарядов, как известно, уравнение электростатического поля имеет вид Дф = — 4лед (г). Поэтому при наличии нуклона в точке г = 0 естественно при- придать уравнению A12,2) вид (r). A12,3) Найдем решение этого уравнения, удовлетворяющее условию 0 >0 при Будем пытаться искать \|) в виде
462 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. ХШ Тогда, используя разложение дельта-функции в интеграл Фурье (см. приложение III т. I) и уравнение A12,3), находим для у$>ь. значение ™ *~ 2д2 k2 + и2 Для поля г|) получаем выражение, которое удобно записать в виде е rcos k2dh.sinQdQdq>. Интегрирование по углам ф и 8 дает: При интегрировании этого выражения удобно ввести пределы интегрирования по k от (—оо) до ( + оо). Имеем в этом случае а Г keikr Y mr J k2 + n2 Последний интеграл легко вычисляется при помощи теории вы- вычетов, оо Г kPikr J АЧ-х' rf* = 2Ш< ReS (* откуда получаем выражение для потенциала ядерного поля ¦ -fs-"f A12,5) именуемое потенциалом Юкавы. Формула A12,5) показывает, что потенциал ядерных сил экспоненциально спадает с расстоянием. Эффективная область, в которой г|) отлична от нуля, имеет размер Размер этой области по порядку величины совпадает с радиу- радиусом действия ядерных сил, определенным из опыта. Для т = 0 потенциал if переходит в потенциал электростати- электростатического поля ¦-*.
§ 112] ПОНЯТИЕ О ПОЛЕ ЯДЕРНЫХ СИЛ 463 Таким образом, величина g действительно играет в потен- потенциале Юкавы такую же роль, как заряд е в электростатическом потенциале, и с полным правом может быть названа нуклонным зарядом. Следует подчеркнуть, что проведенный расчет отнюдь не может претендовать на количественную характеристику поля ядерных сил. В действительности взаимодействие между нуклонами не носит статического характера. Для корректного рассмотрения процессов виртуального обмена я-мезонами необходимо про- квантовать я-мезонное поле ф, определяемое уравнением Клей- Клейна — Гордона — Фока. Это значит, что функцию г|) и сопряжен- сопряженную ей функцию \|)+ нужно рассматривать как квантовомехани- ческие операторы в пространстве чисел заполнения. Эти опера- операторы имеют отличные от нуля матричные элементы для про- процессов поглощения и испускания я-мезонов. Взаимодействие между нуклонами должно рассчитываться приемами, аналогич- аналогичными тем, которые применяются в теории излучения. Мы ви- видели в гл. XII, что расчетный аппарат теории излучения осно- основан на применении теории возмущений. В качестве малого параметра фигурирует безразмерная константа взаимодействия е2/Ьс, составленная из заряда частицы и мировых постоянных h и с. Сильное ядерное взаимодействие также можно характе- характеризовать константой взаимодействия g2lbc. Однако и в зтом су- существенное отличие от электромагнитного взаимодействия, ве- величина g2/bc имеет порядок десяти. Таким образом, эффектив- эффективность ядерного взаимодействия в тысячу с лишним раз выше электромагнитного. С этим связано наименование «сильное ядерное взаимодействие». Большая величина константы взаимо- взаимодействия g2jbc, делает невозможным применение к расчету ядерных взаимодействий аппарата теории возмущений. Это обстоятельство отражает изменение физической при- природы взаимодействия при переходе от заряженных частиц к ну- нуклонам. Малость константы электромагнитного взаимодействия означала, что вероятность излучения в одном акте М частиц (е2 \N -g—) «С 1. Иными словами, вероят- вероятность испускания одного (актуального или виртуального) фо- фотона существенно больше, чем вероятность одновременного ис- испускания двух трех и т. д. фотонов. Иначе дело обстоит в случае сильного ядернрго взаимодей- взаимодействия. Вероятность одновременного испускания большого числа мезонов имеет тот же порядок величины, что и вероятность испускания одного мезона. Поэтому каждый нуклон должен рассматриваться как ча- частица, окруженная облаком виртуальных я-мезЪнов.
464 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XIII Правильность такой картины подтверждается явлениями множественного образования я-мезонов при столкновениях нуклонов большой энергии. Таким образом, картина я-мезонного взаимодействия нукло- нуклонов оказывается гораздо более сложной, чем фотонного взаимо- взаимодействия зарядов. Взаимодействие между двумя нуклонами не- непременно включает в себя множество я-мезонов и его рассмот- рассмотрение должно быть основано на решении задачи многих тел. Последовательная количественная теория сильного ядерного взаимодействия до настоящего времени не разработана. § 113. Уравнение Дирака В предыдущих параграфах было рассмотрено релятивист- релятивистски инвариантное волновое уравнение, справедливое для частиц со спином 0. Мы видели при этом, что величина р/е, которую следовало бы трактовать как плотность вероятности, принимает как положительные, так и отрицательные значения. Это обстоятельство, как видно из формулы A11,3), связано с тем, что значение р/е определяется не только начальным зна- значением ф-функции, но и начальным значением производной -—-, задаваемым по произволу. Ясно, что для устранения этой труд- трудности необходимо устранить возможность произвольного выбора производной -—• . Иными словами, необходимо, чтобы искомое релятивистское обобщение уравнения Шредингера содержало лишь первую производную по времени, как и само уравнение Шредингера. Поскольку, однако, во все релятивистские инва- инвариантные выражения координаты и время должны входить оди- одинаковым образом, то в релятивистское обобщение уравнения Шредингера должны входить первые производные по коорди- координатам. Принцип суперпозиции требует, чтобы релятивистское вол- волновое уравнение было линейным. На основе этих соображений для описания движения свободной частицы Дираком было сфор- сформулировано следующее уравнение: Выражение A13,1) представляет наиболее общую линейную форму, содержащую только первые производные от искомой функции. Это уравнение удобно переписать в несколько другой форме, переопределив величины р'. Именно, напишем его в форме ih Ж = (М* + ЬуРу + крг + Ро) У,
§ 113] УРАВНЕНИЕ ДИРАКА 465 где операторы рх, ру, pz— обычные операторы проекций им- импульса на оси координат, а операторы Рд., ру, р2, р0 не содер- содержат координат. Свойства этих операторов определим из даль- дальнейших рассуждений. Вводя обозначение И = ЬхРх + ЬуРу + ЬгРг + Ро> молено записать уравнение A13,1) в форме 1йЁ± = щ, A13,2) имеющей полное, хотя пока формальное, сходство с уравнением Шредингера. Если предположить, что оператор Н действительно пред- представляет оператор Гамильтона, то между Н и операторами им- импульса должна существовать такая же связь, как между энер- энергией и импульсом в теории относительности, т. е. Я2 = с2 (fil + pl + /J) + т2с\ A13,3) Последнее требование позволяет определить операторы рХ1 р^, р2, р0. Действительно, возводя оператор Н в квадрат, мы получим: Я2 = Ь\Р1 + Ь\Р\ + Ь\Р\ + Ы + (У М Ы ЬЛ + (Р Jo + Ш РХ + (М« + ЬгЬу) РгРу + (Р А + РоРй) Ру + Фк Шрг- A13,4) Оператор Я2 будет иметь вид A13,3), если выполняются соот- соотношения i = 0, 1Ф k, p<po + РоР/ = 0. Здесь / принимает значения х, у, z. Обычно вместо операторов рг- вводят операторы аг-, которые отличаются от них постоянными множителями: для операторов аир имеют место очевидные равенства = 0 при i^k. A13,5)
466 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XIII С помощью введенных операторов уравнение A13,1) может быть записано в виде ih -§?" = [€? (ахрх + ауру + агрг) + тсЩ ф. Последнее уравнение называется уравнением Дирака. Если ввести векторный оператор равенством A13,6) а = axi + ау] то уравнение Дирака запишется в еще более компактном виде -mc2p. A13,7) Перейдем теперь к нахождению явного вида операторов ctjc, ay, obz, P- Заметим прежде всего, что действия этих операто- операторов не могут сводиться к умножению волновой функции на не- некоторые постоянные числа. С помощью операторов, сводящихся к постоянным числам, невозможно было бы удовлетворить соот- соотношениям A13,5). Попробуем искать операторы ах, ау, аг, р в виде совокуп- совокупности постоянных, вообще говоря комплексных чисел, т. е. в виде квадратных матриц вида аи а\2 • • • аь CL2\ CL22 • . • Ct2i Определим прежде всего число п, которое будем считать одина- одинаковым для матриц аир. Для этого сопоставим матрицам аир детерминанты ап а12 ... а1п det cu = а22 <*2п Прежде чем перейти к дальнейшему исследованию матриц, за* метим, что для детерминанта от произведения матриц должно выполняться следующее соотношение: A13,8)
113] УРАВНЕНИЕ ДИРАКА Из правил коммутаций следует далее 467 Здесь / — единичная матрица. Используя затем соотношение A13,8), находим: det а*р = det ax det p = det(— /) det p det а*. Поскольку детерминанты являются обычными числами, от- отсюда получаем, что det(— /)= 1 и, следовательно, (-1)Л»1. A13,9) Таким образом, число п должно быть четным. Если бы число п было равно двум, то искомые матрицы были бы двух- двухрядными. С двухрядными матрицами мы встречались уже в § 59. Там было показано, что существуют четыре линейно не- независимые двухрядные числовые матрицы: три матрицы Паули и единичная матрица. Последняя коммутирует со всеми матри- матрицами Паули и, следовательно, не удовлетворяет условиям анти- антикоммутации A13,5). Наоборот, в случае четырехрядных матриц оказывается возможным построить матрицы с требуемыми свой- свойствами. Именно, простой проверкой можно убедиться, что матрицы A13,10) удовлетворяют всем сформулированным требованиям. Матри- Матрицы A13,10) можно записать в более сокращенном виде, исполь- используя матрицы Паули. Действительно, из определения F0,14), F0,15) и A13,10) ясны соотношения / 0 сгЛ /0 a*"U or a*=U 0 аЛ /1 (ПЗ,П)
468 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. ХШ Матрицы а, р являются эрмитовыми матрицами. Это можно установить простой проверкой. Если мы транспонируем матри- матрицы и проведем комплексное сопряжение, то полученные мат- матрицы совпадут с первоначальными. Поэтому для этих матриц можно написать at = а*; а^ = а^; at = az\ Р+ = р. Если бы вместо четырехрядных матриц мы ввели матрицы более высокого ранга, то формальная схема теории не была бы нарушена. Однако, как будет ясно из дальнейшего, именно при введении четырехрядных матриц общее уравнение Дирака описывает свойства частиц со спином 1/2. Приняв для ах, <ху, az, р матричное выражение A13,10) в виде четырехрядных матриц, мы должны приписать волновой функции г|э четыре компоненты. Действительно, только в этом случае четыре уравнения, на которые распадается общее выра- выражение A13,7) при подстановке в него четырехрядных матриц,, содержит четыре неизвестные функции. Четырехкомпонентнук> функцию ф (именуемую биспинором Дирака) можно записать в виде матрицы Выпишем эти уравнения в явном виде, пользуясь правилом умножения матриц (см. D5,6)): = с (рх _ tpy) ^А + с 2 =c (рх + ipy) to - c =c (рх - ipy) г|>2 + c =c(рх + ipy)^ -c Не представляет труда обобщить уравнение Дирака на слу- случай движения заряженной частицы во внешнем электромагнит- электромагнитном поле. Именно, заменяя по обычной схеме оператор импуль- импульса р на оператор р А и прибавляя к оператору Н опера- оператор ecp, где А и ф—векторный и скалярный потенциалы элек- электромагнитного поля, получим уравнение Дирака . A13,12)
§ 114] ПЛОТНОСТЬ ВЕРОЯТНОСТИ И ПОТОК ВЕРОЯТНОСТИ 469" Преобразуем еще уравнение Дирака к другой более простой и симметричной форме. Умножим уравнение Дирака A13,7) слева на оператор р йр -^ = (срар + тс2р2) г|> A13,13) и введем следующую систему матриц: A13,14): Непосредственной проверкой легко убедиться в том, что мат- матрицы уг удовлетворяют тем же правилам коммутации, что и матрицы а и р, т. e.Y*Yfc + YfeY* = 26^. С помощью матриц у{ мож- можно записать уравнение Дирака в виде Введем четвертую координату, Х\ — ict, и запишем оконча- окончательно уравнение Дирака в весьма симметричной форме: Yu'lr + ir^0' A13,16) где по [х производится суммирование. Вводя оператор рц = -г--э— и 4-потенциал А^ (см. § 19 ч. III), можно представить A13,12) в виде = 0. A13,17) § 114. Плотность вероятности и поток вероятности в теории Дирака Покажем прежде всего, что трудность с интерпретацией плотности вероятности р/е, с которой мы столкнулись при обсу- обсуждении уравнения Клейна — Гордона — Фока, отсутствует в уравнении Дирака. Следуя обычной схеме, напишем, кроме уравнения Дирака ih —^- = (— ihcaV+ mc2p)ib, A14,1) сопряженное ему уравнение - ih -^- = ihc V\|)+a+ + mc2ty+$+. (П4,2>
470 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XIII При этом мы воспользовались правилом сопряжения произве- произведения матриц (аЬ)+ = 6+а+. Так как операторы аир эрмитовы, то а+ = а, р+ = р, и мы по- получаем ^ + + mcVp. 014,3) Уравнение A14,1) умножим на -ф+ слева, а уравнение A14,3) на г|> справа и вычтем из первого уравнения второе. Имеем: Круглая скобка в правой части уравнения A14,4) означает, что градиент действует только на функцию t|)+. Выражение, стоящее в квадратных скобках, может быть легко преобразо- преобразовано с помощью формулы •ф+ (aV) t|) + (Vty+a) <ф = i|)+ div a-ф + (Vi|>+a)i|)« div i|)+aa|). Тогда уравнение A14,4) запишется в виде at|>. A14,5) Сравнивая полученное выражение с общей формулой G,5), мы видим, что существенно положительная величина i|d+\|) = = ф*^ + г|)*г|52 + 'фз'Фз + ^1^4 представляет собой плотность вероят- вероятности. Вектор, определяемый равенством / = сф+аг|?, дает плот- плотность потока вероятности для частицы с волновой функцией г|?. Таким образом, как и в теории Шредингера, волновая функ- функция допускает обычную вероятностную интерпретацию. Из ли- линейности уравнения Дирака и вероятностной интерпретации функции г|) вытекает, что остаются в силе основные положения квантовой механики: 1) интерпретация величины |cw(/)|2, где {t) — коэффициент разложения и \|)т — собственная функция некоторого оператора, как вероят- вероятности измерения собственного значения, 2) определение сред- среднего значения Следовательно, остается справедливой и вся схема построения квантовой механики.
§ 115] УРАВНЕНИЕ ДИРАКА ДЛЯ СВОБОДНОЙ ЧАСТИЦЫ 47! § 115. Решение уравнения Дирака для свободной частицы В качестве простейшего примера решения уравнения Дирака рассмотрим движение свободной частицы. Решение уравнения Дирака для свободно движущейся частицы будем пытаться искать обычным путем. Подставляя волновую iEt функцию о|э = %е h в A15,1), получаем уравнение для вол- волновой функции -фо, не зависящей от времени: = (cap + mc2p) ifo. A15,2) Будем далее рассматривать состояния с определенным импуль- импульсом и пытаться искать решение уравнения A15,2) в виде пло- плоской волны 1IL Тогда для функции и получим уравнение Ей = (cap + mc2p) и. Подставим и в виде [*4 J w ¦¦ A15,3) A15,4) Подставляя A15,4) в A15,3) и учитывая представления матриц аир A13,11), находим Ew = сорт' + mc2w, Ewr = copw — mc2w'. A15,5) A15,6) Каждая из функций w и w' имеет две компоненты. Для того чтобы полученная система линейных уравнений имела решение, необходимо, чтобы ее детерминант обращался в нуль: Е — тс2 — сор — сор Е + тс2 Раскрывая определитель, получаем = 0. (U5,7)
472 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XIII Выражение (арJ легко может быть преобразовано с помощью известных свойств матриц Паули. Согласно F0,17) имеем (арJ = р2. A15,8) Как и следовало ожидать, мы приходим к известному соот- лошению между энергией и импульсом частицы ?2 = A15,9) ЭнерРйя частицы может принимать как положительное, так и отрицательное значение. В теории относительности мы обсуж- обсуждали уже этот вопрос и видели, что в рамках классической ме- механики это обстоятельство не создавало никаких трудностей, поскольку область энергий шириной 2тс2 является запрещенной. Действительно, в классической механике все переменные изме- изменяются непрерывно и частица имеет положительную либо от- отрицательную энергию. Непрерывный переход из одной области в другую невозможен. В релятивистской квантовой механике нет каких-либо осно- оснований отбросить отрицательный знак. Несколько ниже мы по- подробно обсудим смысл отрицательного знака энергии. Выбирая в выражении для энергии знак плюс или знак ми- минус, мы можем разрешить систему уравнений A15,5) и A15,6). При этом ввиду однородности системы уравнений одна из вели- величин, либо w, либо т\ остается произвольной. Пусть w — величина произвольная. Тогда w = свр Е + тс2 W. A15,10) Если, наоборот, произвольной принимается величина w\ то имеем: сор —- Е-тс2 w A15,11) Соответствующие волновые функции имеют вид (при этом на- лравление вектора импульса принято для простоты за ось г) з А В cpzA Е + тс2 cpzB ЕЛ-тс2 j cpzD i Е — тс2 cpzF Е-тс2 D F A15,12) Здесь Л, Bt Д F — произвольные постоянные. Характер най- найденных выражений становится более ясным, если перейти к не- нерелятивистскому пределу, положив Е ~ тс2 или Е ~.—тс2
§ 115] УРАВНЕНИЕ ДИРАКА ДЛЯ СВОБОДНОЙ ЧАСТИЦЫ соответственно. Тогда из A15,10) видно, что в первом случае , сор v Спинор w' меньше w в отношении v/c, так что А В 0 о При отрицательном значении энергии A15,11) дает Таким образом, при переходе к нерелятивистскому приближе- приближению две компоненты волновой функции оказываются малыми по сравнению с двумя другими компонентами. При этом для положительных энергий w велико по сравнению с w\ при отри- отрицательных— наоборот. Общее решение уравнения Дирака для движения свободной частицы можно написать в виде суперпо- суперпозиции волновых функций типа A15,12), т. е. в виде интеграла Фурье вида iEt ipr 1 i\E\t ipr Ф(*» У, г, 0= J и (А, В)е h е н dp+ J v(D, F)e h e H dp, где dp = dpxdpydp2. Если в начальный момент t = 0 задана волновая функция /<Pi(p)\ ¦ (х, у, z, 0)= J<p(p)e * dp; Ф(р) = ( ™ I. \ф1(р)/ то через четыре произвольных коэффициента, входящих в и~ и v, можно однозначно определить заданную совокупность ве- величин ф1, ф2, фЗ И ф4. Таким образом, совокупность двух волн, одна из которых отвечает положительной энергии, а вторая — отрицательной,.
474 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XIII образуют полное решение уравнения Дирака. Совершенно ясно, что если бы частное решение, отвечающее отрицательной энер- энергии, было отброшено и удержано только решение с положитель- положительной энергией, то найденная при этом система функций была неполной. Начальные условия содержат четыре заданные величины, то- тогда как в и входят только две неопределенные постоянные А и В. Таким образом, независимо от других соображений необ- необходимость учета решений с отрицательной энергией вытекает из общих основ квантовой механики. В следующем параграфе мы вернемся к обсуждению тех фундаментальных выводов, которые были сделаны из сущест- существования решений уравнения Дирака, отвечающих отрицательной энергии частиц. § 116. Понятие о позитроне Мы перейдем теперь к обсуждению формулы ?= ± Vp2c2 + m2c*. A16,1) Как указывалось выше, отрицательная энергия свободной частицы с точки зрения классической механики не имеет физи- физического смысла. В квантовой механике ситуация изменяется. Именно в кван- квантовой механике возможны скачкообразные переходы из состоя- состояния с положительной энергией в состояние с отрицательной энергией. Иными словами, оба класса состояний уже не раз- разделены непроходимым барьером. Мы уже видели, что исклю- исключение состояний с отрицательной энергией противоречит общим положениям квантовой механики, так как волновые функции состояний с положительной энергией не образуют полную си- систему функций. С другой стороны, невозможно допустить существование ча- частиц с отрицательной энергией. Подобные частицы обладали бы такими свойствами, которые принципиально отличаются от свойств всех наблюдавшихся в природе частиц. В виде примера можно указать на следующее: частица с отрицательной энергией — |?i| могла бы переходить в состояние с меньшей отрицатель- отрицательной энергией —|?г|, |?|>|?i|. При этом разность |?2|— \Е\\ могла бы превращаться в полезную работу. Такой переход мог бы совершаться непрерывно, поскольку \Е2\ ничем не ограни- ограничено и частица с отрицательной энергией могла бы служить бесконечно большим источником работы. Чтобы избежать трудностей, связанных с введением в тео- теорию наблюдаемых частиц с отрицательной энергией, Дирак ввел понятие вакуума как такого состояния пространства, в котором
§ 116] ПОНЯТИЕ О ПОЗИТРОНЕ 475 все состояния с отрицательной энергией заняты электронами, а все состояния с положительной энергией свободны. В каждом состоянии с отрицательной энергией, согласно принципу Паулиг находится один электрон. Предположим далее, что под влиянием внешних воздействий один из электронов удален из состояния с отрицательной энер- энергией. Освободившееся состояние с отрицательной энергией про- проявляется как «нечто» с положительной энергией, так как для уничтожения такого состояния, т. е. для его заполнения необхо- необходимо добавить к нему электрон с отрицательной энергией. Та- Таким образом, незаполненное состояние с отрицательной энергией следует трактовать как частицу, имеющую положительную энергию. Следует заметить, что Дирак вначале ошибочно сопоставлял это состояние с протоном. Позднее было теоретически показано, что частица, соответствующая незаполненному состоянию с от- отрицательной энергией, должна иметь массу, равную массе электрона и, следовательно, она не может быть протоном. Рассмотрим соображения Дирака о заполненном фоне отри- отрицательных энергий более подробно. Пусть N^ip) и AfL+)(p) означают числа электронов, находящихся соответственно в со- состояниях с отрицательной и положительной энергией и имею- имеющих импульс р. Индекс а может принимать два значения в со- соответствии с направлением спина. Эти числа, в согласии с прин- принципом Паули, могут принимать значения только 0 или 1. В со- состоянии вакуума (индекс v) мы имеем при всех значениях импульса. Действительно, все состояния с отрицательной энергией при этом заняты, а все состояния с положительной — свободны. При этом энергия Ev и заряд qv в вакууме определяется соотноше- соотношениями Ev=- %E(p)Ntt(p), A16,2) OL,p ^«-мИМ^Чр). (пб,з) а, р Здесь е — заряд электрона. Так как импульс и энергия свободных частиц ничем не огра- ограничены, значения Ev и qv бесконечно велики. Однако согласно Дираку эти величины принципиально не наблюдаемы. Наблю- Наблюдаемыми являются лишь такие величины, которые характери- характеризуют отклонение от состояния вакуума. Напишем, далее, полную энергию Е системы и заряд q си- системы в том случае, когда в пространстве находятся электроны
476 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XIII в состояниях с положительной энергией, а в состояниях с отри- отрицательной энергией имеются свободные места Е = 2 [Ni (р) - МГ> (р)] Е (р), A16,4) а, р я = - Si e \[Ni(p)+N{a-\P)l A16,5) В соответствии со сказанным выше наблюдаемы лишь следую- следующие разности: Е - Еv = 2 [Ni (р) + W (р) - МГ} (р))] Е (р), A16,6) а, р q - q0 = - | е \ 2 [ЛГ„+ (р) + МГ} (р) - ^Т) (р)]. A16,7) а, р Из формул A16,6) и A16,7) мы видим, что если некоторое состояние с отрицательной энергией свободно, т. е. МГ} (р) = О, то оно соответствует положительному вкладу в наблюдаемые значения энергии и заряда. Действительно, в формулы A16,6) и A16,7) входят выражения N^ (p) — N^ (р). Если состояние с отрицательной энергией свободно МГ} (р) = 0, то {Л^Чр) — — МГ} (р)} = 1. При этом возникает положительный вклад в энергию и заряд системы, равный соответственно Ер и \е\. Таким образом, мы видим, что отсутствие электрона с импуль- импульсом р в сплошном фоне заполненных отрицательных состояний эквивалентно появлению наблюдаемой частицы с положитель- положительным зарядом, положительной энергией и импульсом р. Такая частица, с зарядом (+|е|) и массой, равной массе электрона, была названа позитроном. Она была обнаружена Андерсеном в космических лучах через несколько лет после появления тео- теории Дирака. На основе представлений Дирака оказалось возможным дать объяснение ряду известных в настоящее время физических эф- эффектов. Например, очевидно, что электромагнитное поле может образовать пару электрон — позитрон,*если энергия фотона йо> больше, чем 2тс2. Последняя энергия необходима для того, чтобы перевести электрон из состояния с отрицательной энер- энергией в состояние с положительной энергией. Законы сохранения энергии и импульса ограничивают воз- возможность реакции образования пары фотоном. Фактически эта реакция может происходить только вблизи третьего тела — на- например ядра, принимающего на себя часть импульса. Наряду с образованием пары электрон — позитрон возможна обратная реакция — аннигиляция позитронов. При аннигиляции электрон <с положительной энергией переходит в незаполненное состояние
*§ 116] ПОНЯТИЕ О ПОЗИТРОНЕ 477 с отрицательной энергией. Разность энергии излучается в виде у-квантов. Теория Дирака позволила не только предсказать эти явле- явления, но и вычислить эффективное сечение обоих процессов. От- Отличное согласие результатов расчетов с опытными данными яви- явилось хорошим подтверждением правильности представлений Дирака. Однако последнее десятилетие ознаменовалось важней- важнейшими теоретическими и экспериментальными достижениями, которые частично будут освещены в дальнейшем. Эти успехи позволили, с одной стороны, выявить реальность существования вакуума в смысле Дирака, а с другой стороны, расширить об- области применимости релятивистской квантовой механики. Как уже указывалось, вакуум представляет систему заряженных частиц, заполняющих все возможные состояния. При внесении в вакуум внешнего электрического заряда или при возникнове- возникновении электромагнитного поля вакуум начинает взаимодейство- взаимодействовать с внешними полями. Например, Лэмбом в 1953 г. было обнаружено, что уровни 2Si/2 и 2А/2 атома водорода имеют не- несколько различные энергии (лэмбовское смещение). Этот эф- эффект может быть объяснен только взаимодействием с вакуумом (см. §§ 119 и 128). Таким образом, развитые Дираком представления о вакууме подтверждаются рядом разнообразных экспериментов. Симметрия теории по отношению к электронам и позитро- позитронам находит свое выражение в том, что существует унитарный оператор С, именуемый оператором зарядового сопряжения, который преобразует частицу в античастицу. Иными словами, действие оператора С меняет местами электрон и позитрон (с тем же самым спином и энергией). Если обозначить через \ре и грр волновые функции электрона и позитрона соответственно, то по определению для них можно написать (см. A13,17)): , - f A^-imc }tfc = 0, A16,8) (р» + у Ар) - imc ]% = 0. A16,9) Комплексно сопряженная к tye функция ф* удовлетворяет при этом уравнению или, поскольку Р\=-Ро A>Ai (/=1,2,3), p\~pv At=-A4i >0- A16,10)
478 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. Kill На основании сравнения A16,9) и A16,10) естественно поло» жить ¦p~?*J. % = c~\. (пб,п> Подставляя A16,11) в A16,9), имеем Умножая теперь слева на С  f ^) + Y4 ИЛИ >0. A16,12) Для того чтобы A16,12) было тождественно A16,10), необходи- необходимо выполнение равенств C~"]YfC = yL C"~ly4C = — Y4 = — Y4- Если Yi и Y4 определены формулами A13,14), то 00 0 1 00-10 0 1 00 -10 0 0 Из определения A16,11) непосредственно видно, что оператор С коммутирует с оператором Гамильтона. Таким образом, можно ввести две волновые функции -фе и \|)p, совершенно равноправные и связанные между собой сохраняющимися во времени соотно- соотношениями Обе волновые функции описывают частицы с одинаковой (по- (положительной) энергией, массой и спином, но разными знаками заряда и магнитного момента. Введение зарядово-сопряженных волновых функций для равноправных частиц до известной сте- степени снимает логические трудности, связанные с упрощенной трактовкой вакуума как фона, заполненного частицами с отри- отрицательной энергией.
3 117] СПИН ЧАСТИЦ, ОПИСЫВАЕМЫХ УРАВНЕНИЕМ ДИРАКА 479 § 117. Спин частиц, описываемых уравнением Дирака Хотя до сих пор мы широко пользовались представлениями о спине частиц, оператор спина был введен чисто формальным образом, как необходимый прием для описания опытных фак- фактов. Сейчас мы покажем, что существование спина непосред- непосредственно вытекает из уравнения Дирака. Для этого рассмотрим законы сохранения, следующие из уравнения Дирака. Поскольку в теории Дирака сохраняются все общие поло- положения квантовой механики, для отыскания законов сохранения необходимо составить коммутатор с оператором Гамильтона. Отличие от теории Шредингера заключается в том, что опера- оператор Гамильтона имеет теперь вид A13,7). Если оператор Гамильтона не зависит от времени (а для этого необходимо, чтобы не зависели от времени потенциалы внешнего поля), то имеет место закон сохранения энергии. В этом вопросе нет никакого различия между теорией Шредин- Шредингера и теорией Дирака. Для частицы, двигающейся в пустом пространстве, должен также сохраниться полный момент. Поэтому должен существо- существовать оператор полного момента, коммутирующий с гамильто- гамильтонианом. Интересный результат получается при составлении комму- коммутатора для оператора -момента количества движения и гамильтониана. Для наших целей следует ограничиться случаем свободной частицы. Выбирая произвольно ориентированную ось 2, имеем: HLZ - ЪгН = (cap + mc2p) 1г - Lz (cap + Так как оператор Lz = ~Г\У~дх~~х1г) коммУтиРУет с операто- операторами р и <xzpz, то получаем: HLZ - 1ZH = cax(PxU - LzPx) + c*y{pyLz - Lzpy). A17,1) Используя свойства коммутаций проекций импульса с проекция- проекциями момента количества движения, находим: HLZ - LZH = the (aypx - ахру). A17,2) Аналогичные результаты получаем для других проекций им- импульса. Таким образом, момент количества движения не является интегралом движения и не сохраняется. Для того чтобы найти величину, играющую роль полного момента количества движе- движения, введем оператор J = L + s, где 5 — неизвестный оператор.
430 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XIII Будем требовать, чтобы оператор J коммутировал с операто- оператором Н: Я?,-/;Я = 0 или Подставляя i = z и используя значение коммутатора A17,2), имеем Hsz - szH = ihc (ахру - аурх). A17,3) Попытаемся удовлетворить этому равенству, положив $г=*Аахау, A17,4) где А — неизвестная константа. Вычислим далее коммутатор Hs2-s2H. Используя A13,5), получаем АНахау — АахауН = = Ас (ахрх + ауру) а^ - Асахау (ахрх + ауру) = 2Ас (аурх - ахру). Сравнивая последнее выражение с формулой A17,3), находим значение Таким образом, оператор sz равен /аг/ 2 V 0 aj"" 2 I 0 0 1 0 I" 0 0 0 -1 Две другие проекции вектора §х и sy получается из аналогичных расчетов: л ib ih sx= — Найдем теперь оператор s2 = s2x + s2y + s2z. Используя свойства операторов ах, ayt az, найдем: |(|O A17,6) Перейдем далее к обсуждению полученных результатов. Сохра- Сохраняющуюся во времени величину / следует, очевидно, считать полным моментом частицы. В свою очередь полный момент
§ 118] УРАВНЕНИЕ ДИРАКА И УРАВНЕНИЕ ПАУЛИ 481 является суммой орбитального и собственного, спинового мо- момента частицы. Операторы sz и s2 в формулах A17,5) и A17,6) приведены к диагональному виду. При этом проекция спина на ось z может принимать два значения ±й/2. Собственные значения оператора s2 имеют вид b2s(s+l), где s== у. От- Отсюда очевидно, что частица обладает спином, равным й/2. § 118. Переход от уравнения Дирака к уравнению Паули и магнитный момент частицы Посмотрим теперь, как преобразуется уравнение Дирака, если совершить в нем переход к нерелятивистскому приближе- приближению. Рассмотрим общий случай, когда частица движется во внешнем электромагнитном поле, так что уравнение Дирака имеет вид A13,12). Так же как при предельном переходе в ска- скалярном релятивистском уравнении, выделим прежде всего энер- энергию покоя, т. е. произведем преобразование вида imc* h Тогда для функции г|/ получим уравнение ф'. A18,1) (w Если волновую функцию записать в виде г|/ = I ,), то совер- совершенно так же, как для свободной частицы, получаем уравнения для до и до': ih-jf- = ce \p - ^-Aj до' ih dwr ~- = c<r (p — ~ AJ до — 2mc2w' + eqw'. A18,2) Как всегда, предельный переход к нерелятивистскому прибли- приближению соответствует формальному разложению по степеням с. Предположим вначале, что в общем случае движения частицы в поле, так же как и для свободной частицы, w' ~ —w. Тогда во втором из уравнений A18,2) можно пренебречь членами ¦^j- и есрдо' как малыми по сравнению с величинами св(р — ~ Л] до и mc2w', 16 В. Г. Левич и др., том II
482 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XIII пропорциональными с. Тогда получаем для спинора w' выраже- выражение находящееся в согласии с нашим допущением. Подставляя A18,3) в первое из уравнений A18,2), находим а Раскроем квадрат оператора в явном виде При перемножении следует помнить, что операторы р и А не коммутируют между собой. Выполняя умножение, находим [а (р - f*)f- ,« (рх -± -± Ах) + охаг (рх - ± Ах) [рж - f A,) + (рг -± А,) (рх-^Ах)+оуаг (py--jAy) [p, - ^Аг) + + огоу (рг - ± Az) (py --jAy). A18,5) Согласно F0,16) имеем для матриц Паули Мы видим, что сумма первых трех членов приводится к виду Дальнейшее преобразование будем производить только с чле- членами A18,6) так как оставшиеся выражения преобразуются аналогичным A18,6) образом. Матрицы ах и оу антикоммутируют и, следова- следовательно, выражение A18,6) можно переписать в виде ,]. A18,7)
§ 118] УРАВНЕНИЕ ДИРАКА И УРАВНЕНИЕ ПАУЛИ 483 Используя свойства коммутаций операторов рх и ру с операто- операторами, зависящими от координат B6,10), имеем •* дА* I •* дАу 1 иь Г дАу дА Так как согласно F0,16) ахау = ш2, то имеем окончательно Совершая аналогичные преобразования с оставшимися членами из A18,5), получаем ^ A18,8) Подставляя A18,8) в A18,4), находим Мы видим, что при последовательном переходе к нереля- нерелятивистскому приближению уравнение Дирака автоматически переходит в уравнение Паули. Отсюда видно, что из теории Дирака следует не только существование спина частиц (рав- (равного fi/2), но и наличие у частиц собственного магнитного мо- момента »*-§?¦• <118'10> Теперь мы можем уточнить вопрос о том, к каким части- частицам, имеющим спин Ъ/2, можно применять уравнение Дирака. Если под т понимать массу электрона, то получается хорошее согласие между вычисленным и измеренным значением магнит- магнитного момента. Таким образом, уравнение Дирака описывает поведение электронов с большой степенью точности. Уравнение Дирака позволяет, по-видимому, успешно описать свойства нейтрино—¦ частицы с массой покоя т = 0 (см. § 123). Однако попытки применить уравнение Дирака к тяжелым частицам со спином 1/2 — протону и нейтрону — не привели к вполне удовлетворительным результатам. С другой стороны, некоторые общие и весьма важные выводы из уравнения Ди- Дирака удалось перенести и на тяжелые частицы. Оказалось, что качественно описанное поведение быстрых протонов и нейтронов также укладывается в рамки уравнения Дирака. Особенно важно то обстоятельство, что основная идея 16*
484 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XIII теории Дирака — существование античастиц — получила непо- непосредственное подтверждение как для мезонов, так и для ну- нуклонов. В 1955 г. на ускорителе в реакции р + р->р + (р + р) + р был обнаружен антипротон р — частица с отрицательным эле- элементарным зарядом и с массой, равной массе протона. Несколь- Несколько позднее наблюдалась реакция с образованием антинейтронов. Последние отличаются от ней- нейтрона знаком магнитного момента и четностью. Античастицы аннигилируют с образованием других частиц. Например, про- протоны и антипротоны аннигилируют с образованием я- и /(-ме- /(-мезонов. Несмотря на все эти факты, количественные расчеты и, в частности, расчеты магнитного момента не согласуются с опытными данными. Если под т в формуле A18,10) понимать массу протона, то для его магнитного момента получается зна- значение, отличающееся от опытного в 2,7 раза. Это расхождение теории с опытом связано, по-видимому, с тем, что тяжелые частицы — протоны и нейтроны — сильно взаимодействуют с полем мезонов. В этом их отличие от элек- электронов, которые сравнительно слабо взаимодействуют с элек- электромагнитным полем1). § 119. Атом водорода в теории Дирака Хотя движение электрона в атоме водорода отвечает нереля- нерелятивистским скоростям, нахождение релятивистских поправок к уровням энергии водорода представляло большой интерес, поскольку теория Шредингера не могла объяснить появление тонкой структуры в спектре водорода. В § 38 было найдено, что уровни энергии атомов водорода зависят только от главного квантового числа. Между тем опыт показывает, что главное квантовое число характеризует уровни энергии лишь приближенно. В действительности имеет место расщепление возбужденных уровней на близкие подуровни. В результате в спектре водорода наблюдалось расщепление спектральных линий, ясно заметное в обычном спектрометре и особенно точно измеренное с помощью современных методов радиоспектроскопии. Оказалось, что это расщепление уровней связано со спин-орбитальным взаимодействием и вытекает из теории Дирака. 1) Соображения о возможности применения уравнения Дирака к нукло- нуклонам подробнее см. в книге: А. И. АхиезериВ. Б. Берестецкий, Квантовая электродинамика, «Наука», 1969, стр 129.
§ 119] АТОМ ВОДОРОДА В ТЕОРИИ ДИРАКА 485 Уравнение Дирака для стационарного движения в кулонов- ском поле имеет вид [cap + тс2ф] г|) = IE H Уравнение Дирака как и уравнение Шредингера, в кулонов- ском поле допускает точное решение. Однако в отличие от урав- уравнения Шредингера уравнение Дирака не приводит к раздельным законам сохранения полного и спинового моментов (см. § 117), Вычисления показывают, что только в нерелятивистском прибли- приближении можно говорить о постоянных значениях орбитального и спинового моментов. В последнем случае оказывается, что гамильтониан приобретает вид1) где первые два члена совпадают с гамильтонианом уравнения Шредингера, а второе слагаемое представляет энергию спин- орбитального взаимодействия. Невыписанные члены порядка 1/с2 содержат релятивистские поправки к кинетической и потен- потенциальной энергии, не имеющие наглядной интерпретации. Решение уравнения Дирака приводит к следующему выра- выражению для энергии электрона2): Е = тс2 - где j = l + у — собственное значение оператора полного мо- момента; остальные величины имеют тот же смысл, что и в фор- формуле C8,17). Уровни энергии зависят теперь не только от п, но также и от /. Случайное вырождение (см. § 38) снимается, и уровни энер- энергии с одним и тем же значением п, но разными / имеют раз- различное значение. Однако это расщепление уровней весьма мало по сравнению с расстоянием между соседними уровнями с раз- различными п. Сохраняется вырождение состояний с одинаковыми значе- значениями /. Например, при п = 2 имеются следующие три состоя- состояния: 2Si/2, 2Pi/2 и 2Рз/2. Первые два состояния являются выро- вырожденными, поскольку они отвечают п = 2 и / = У2. До сравнительно недавнего времени считалось, что теория Дирака передает тонкую структуру уровней водорода с огромной 1) См. Л. Ш и ф ф, Квантовая механика, ИЛ, 1957, стр. 379. 2) Для удобства сравнения с нерелятивистскими результатами фор- формула A19,2) получена из точной формулы разложением по степеням Ze2/hc.
486 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. ХШ степенью точности. Точно совпадали с опытными данными расположение термов, правила отбора и интенсивности линий. Лишь в 1953 г. Лэмбом, применившим радиоспектроскопические методы измерения, было обнаружено, что уровни 2Si/2 и 2Р^ имеют несколько различные энергии. Это расхождение между формулой A19,2), полученной иа теории Дирака, и опытом связано с фундаментальными свой- свойствами материи — реальностью вакуума — и в конечном счете не только не противоречит теории Дирака, но является одним из самых блестящих ее подтверждений. Новые расчетные ме~ тоды, с помощью которых из теории Дирака было найдено лэм- бовское смещение, будут изложены в гл. XIV. § 120. Инвариантность уравнения Дирака по отношению к отражению, повороту и лоренцеву преобразованию координат В § ИЗ мы рассмотрели некоторые свойства уравнения Ди- Дирака. Покажем теперь, что это уравнение удовлетворяет усло- условиям инвариантности по отношению к отражению, повороту и преобразованию Лоренца. Поворот пространственной системы координат и преобразование Лоренца являются линейными и ортогональными преобразованиями. Мы можем записать их в виде Найдем преобразование волновой функции i|/ = S^, A20,2) которое оставляет инвариантным уравнение Дирака при линей* ных преобразованиях A20,1). Преобразованная волновая функ- функция по условию удовлетворяет уравнению Дирака y*i^+Jf*'=0- A20'3> Производные —— можно преобразовать с помощью соотношения ц A20,4) дХц dxv дХр и dxv Используя A20,4), преобразуем уравнение A20,3) к виду |^+1Г^ = 0. A20,5)
$ 120] ИНВАРИАНТНОСТЬ УРАВНЕНИЯ ДИРАКА 487 Если существует такая матрица S~!, для которой выполняются условия S~4vYnS = Yv или S"\S = S SvYv» S^S-l, A20,6) то, умножая уравнение A20,3) на матрицу S-1, мы приходим к уравнению A13,13). Найдем теперь явный вид матрицы линейного преобразова- преобразования при повороте пространственной системы координат и пре- преобразованиях Лоренца. В случае поворота системы координат в плоскости Х\Х2 коэффициенты ajjtv определяются из соотно- соотношений \ = хх cos ф + х9 sin ф, ) , . 1 A20,7) Покажем теперь, что если матрицу S выбрать в виде <р S = eT™\ A20,8) то соотношения A20,6) выполняются. Для этого разложим экс- экспоненту в ряд !^(YiY2J+^^^ ... Используя далее выражения (Y1Y2J = Y1Y2Y1Y2 = ~ Y1Y1Y2Y2 - - 1, (Y1Y2K = (Y1Y2J Y1Y2 = - Y1Y2, (Y1Y2L = (Y1Y2J (Y1Y2J = 1, найдем f-&+&- •••)• <120'9> Легко заметить, что матрица S равна f A20,10) Проверим теперь соотношения A20,6). Равенство S-1S = 1 яв- является очевидным. Найдем, например, выражение S"lyxS = (cos Л. - YlY2 sin I-) Yi (cos -J-+Y1Y2 sin -f-).
488 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА (ГЛ. ХПГ Пользуясь свойствами матриц у и элементарными тригономет- тригонометрическими формулами, найдем S~lyxS = Yi cos ф + y2 sin ф = апу{ + al2y2 = alvyv, что находится в полном согласии с A20,6). Перейдем теперь к преобразованиям Лоренца. Согласно § 10 ч. II преобразования Лоренца можно трактовать как поворот на мнимый угол ф = i% в плоскости х\ = хх ch % - х0 sh х, th % ¦/-*¦ Матрицу S можно найти по аналогии с A20,8), заменив угол Ф -> i%. Тогда S приобретает такой вид: ~YlY4 f|A20,11) Помимо преобразования поворота и преобразования Лоренца необходимо рассмотреть преобразование инверсии в начале ко- координат. При инверсии координат пространственные координаты изменяются по формулам — xr A20,12) Мы должны потребовать, чтобы уравнение оставалось инвариантным при замене A20,12), а волновая функция подверглась преобразованию Легко убедиться, что требование инвариантности будет выпол- выполняться, если оператор 7 имеет вид / = аР, A20,13) где а — некоторое число. Действительно, используя A20,12)
§ 121] ПРЕОБРАЗОВАНИЕ БИЛИНЕЙНЫХ КОМБИНАЦИЙ 489 и A20,13), получаем Умножив последнее уравнение слева на р и разделив на а, по- получаем уравнение A13,13). Двойное преобразование инверсии либо возвращает систему в первоначальное состояние, либо отвечает повороту на 2я. В по- последнем случае г|) изменяет свой знак (см. A20,10)). Отсюда получаем условие а2=± 1. A20,14) Для дальнейшего нам потребуются законы преобразования функции __ ф = ф+у4. A20,15) Их можно вывести, если заметить, что функция г|)+ удовлетво- удовлетворяет уравнению з дф+ тс ,+ dib+ л Требования инвариантности этого уравнения по отношению к по- повороту пространственной системы координат и преобразованию Лоренца приводят к условию U'-^S. A20,17) При преобразовании инверсии находим 'ф/ = § 121. Законы преобразования билинейных комбинаций, составленных из волновых функций В дальнейшем при обсуждении одной из основных проблем современной физики — проблемы взаимодействия между элемен- элементарными частицами — нам придется воспользоваться некото- некоторыми свойствами билинейных комбинаций, составленных из вол- волновой функции г|) и сопряженной с ней функции -ф. Именно, как мы увидим в дальнейшем, для релятивистски- инвариантной формулировки закона взаимодействия ядерных частиц необходимо знать законы изменения билинейных комби- комбинаций из указанных величин при преобразованиях Лоренца, про- пространственных поворотах и инверсии. Простой подсчет показы- показывает, что из компонент волновой функции и матриц у можно
490 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XII* построить некоторые билинейные комбинации, которые обладают следующими трансформационными свойствами: -ф-ф — одна компонента (скаляр), ) — четыре компоненты D-вектор), четыре компоненты (псевдовектор), — шесть компонент 1Ф k D-тензор второго ранга), — °дна компонента (псевдоскаляр). Здесь введено обозначение A21,1) 0 0 1 0 0 0 0 1 1 0 0 0 0 1 0 0 \ Величина ys обладает следующими свойствами: Yl=l, YsY^ + Y^Ys^0. й=1, 2, 3, 4. В правильности последних соотношений легко убедиться" непосредственной проверкой. Перейдем к доказательству ука- указанных трансформационных свойств. При преобразованиях Ло- ренца и пространственного поворота в силу A20,2) и A20,17) можно написать ij>'t|/ = <ф5~15'ф = 'ф'ф. При отражении системы координат величина фф также остается неизменной в силу •ф'\|/ = a*^Y4^Y4^ = "Фф. Таким образом, мы видим, что величи- величина ф-ф является инвариантом по отношению к ортогональному преобразованию. Покажем далее, что четыре величины -фуг-ф преобразуются как компоненты четырехмерного вектора. При повороте системы координат и преобразовании Лоренца можем написать так: В соответствии с формулой A20,6) находим ¦W = a«v*Yv*- A21,2) При инверсии координат получаем ^ 4)- A21,3) Таким образом, величина фуг^ ПРИ инверсии изменяет свой знак. Формулы A21,2) и A21,3) показывают, что четыре ком* поненты действительно образуют четырехмерный вектор. Покажем теперь, что величина груб'Ф представляет псевдоска» ляр. При инверсии координат имеем
$ 122] ПОНЯТИЕ О СЛАБЫХ ВЗАИМОДЕЙСТВИЯХ 491 Используя вид матрицы vs и свойство коммутаций матриц + yuyi = Эй**, легко находим что и доказывает высказанное ранее утверждение. Величины -jf>YiY5* ПРИ отражении не меняют знак, а при преобразованиях поворота и лоренцевых преобразованиях преобразуются как компоненты вектора. Следовательно, мы можем утверждать, что эти величины являются компонентами четырехмерного аксиаль- аксиального вектора или псевдовектора. В тензорном характере величин фугу** можно убедиться ана- аналогичным образом: что совпадает с определением тензора. § 122. Понятие о слабых взаимодействиях. Несохранение четности Мы видели уже, что, кроме электромагнитного взаимодей- взаимодействия, в природе имеется и другой вид взаимодействия — силь- сильное взаимодействисГмежду нуклонами. Оказалось, что между частицами, помимо сильного взаимо- взаимодействия, существует еще один вид взаимодействия, также не электромагнитного характера, получивший название слабого взаимодействия (см. § 130). Слабые взаимодействия, не могущие связать воедино ядер- ядерные нуклоны, играют большую роль в физике элементарных и ядерных частиц. Они являются ответственными за радиоак- радиоактивный распад ядер с испусканием легких частиц — электронов и нейтрино. Иными словами, слабое взаимодействие между эле- элементарными частицами приводит к р-распаду. Теория слабых взаимодействий достигла в последнее время существенных успехов. Однако последовательное рассмотрение относящихся сюда вопросов возможно лишь в рамках квантовой теории поля и поэтому мы ограничимся лишь некоторыми заме- замечаниями. Прежде всего заметим, что уравнение Дирака A13,7) можно рассматривать как уравнение для некоторого электронно- позитронного поля \|). О таком полевом подходе мы уже упоми- упоминали в § 112, когда рассматривали уравнение Клейна — Гордо- Гордона — Фока. Частицы при полевом описании рассматриваются как кванты возбуждения соответствующего поля (например, фотоны — кванты возбуждения электромагнитного поля [см. §§ 101 и 102]). Тогда функцию \f следует рассматривать как оператор в пространстве чисел заполнения (ср. формулу (99,26)
492 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. ХИГ теории вторичного квантования). Конечно, переходя к «поле- «полевому» описанию, мы отказываемся от одночастичной трактовки уравнения Дирака. Оператор г|) имеет отличные от нуля мат- матричные элементы, соответствующие поглощению электрона и рождению позитрона, оператор г|)+, наоборот, — рождению элек* fpOHa и поглощению позитрона. Подобного рода соображения являются общими и относятся также к другим частицам (ji-ме- зонам, нейтрино, нуклонам и т. д.). Рассмотрим теперь какой-либо процесс, например, распад |л-мезона с испусканием нейтрино и антинейтрино: \i->e + v + v. Напомним, что, по определению, нейтрино называют частицу, испускаемую при позитрониом распаде протона р->е+ + n + v, а антинейтрино — частицу, испускаемую при р-распаде нейтрона Имеющиеся в настоящее время экспериментальные данные показывают, что эти частицы не тождественны. В процессе распада jn-мезона участвуют четыре частицы со спином 7г» четыре фермиона. Для описания ц-мезона, электрона и нейтрино вводим опера- операторы соответственно ty^, tye и i|)v, каждый из которых удовлетво- удовлетворяет соответствующему уравнению Дирака. Основная задача теперь заключается в выборе взаимодействия, приводящего к распаду. Для этого нужно сформулировать гамильтониан взаимодействия H' = JH'dV, A22,1) где Н' — плотность гамильтониана взаимодействия. Так как г|э — операторы в пространстве чисел заполнения, то плотность гамильтониана взаимодействия должна содержать эти сшераторы, аналогично тому, как это имеет место в нере- нерелятивистской физике (§ 99). Из структуры выражения A22,1) видно, что плотность га- гамильтониана взаимодействия Н' (слово «плотность» мы будем иногда опускать) должна быть релятивистским скаляром (ин- (инвариантом по отношению к повороту и преобразованию Ло- Лоренца), До последнего времени не возникали сомнения в суще- существовании симметрии по отношению к «правому» и «левому», т. е. предполагалось, что при любых взаимодействиях выпол- выполняется закон сохранения четности. Поэтому считалось, что плот- плотность Н' должна быть инвариантом и по отношению к преобра- преобразованиям инверсии. Требование релятивистской инвариантности
§ 122] ПОНЯТИЕ О СЛАБЫХ ВЗАИМОДЕЙСТВИЯХ 493 резко ограничивает класс возможных выражений для Н'. Имен- Именно, поскольку в теории относительности всякое взаимодействие имеет характер близкодействия, значения характеристик всех частиц — операторов я|э, следует брать в одной точке простран- пространства и в один момент времени. Для процесса р-распада с участием четырех фермионов A22,2) Ферми был предложен наиболее простой закон взаимодействия в виде #' ~ (фсГфл)(№д) + э. с, A22,3) где э. с. обозначает эрмитово сопряженное выражение, а значе- значение всех операторов % берется в одной точке. Величина Г мо- может иметь следующие значения: Г\ = 1 — скалярный вариант, Г2 = Yp, — векторный вариант, Г3 = а^ —тензорный вариант, Г4 = Ym,Y5 *"~ псевдовекторный вариант, ^5= Y5 "~ псевдоскалярный вариант, где cr^v = — y (y^Yv - YvYn); ц, v = 1,2, 3,4, а по повторяющимся векторным индексам в A22,3) производится суммирование от единицы до четырех. В плотность гамильтониана A22,3) не включены производ- производные от операторов -ф и ф. Эта форма гамильтониана взаимо- взаимодействия получила название «связь без производных». Ниже мы вернемся к вопросу об отсутствии производных в законе взаимодействия. Трансформационные свойства билинейных комбинаций типа (ФсГ^а) были нами установлены в § 121. Поскольку оператор #' содержит произведения, в которые величины Г входят дваж- дважды, он является скаляром при всех Г. Так, например, для век- векторного варианта взаимодействия имеем: Н' = g2 $сУ»$а) (УйУ^в) + э. с, где постоянная #2 носит название константы связи или постоян- постоянной взаимодействия векторного варианта. Векторный вариант строится как скалярное произведение двух четырехмерных век- векторов (по ja производится суммирование от 1 до 4). Добавление эрмитово сопряженных членов делает оператор эрмитовым. В общем случае плотность гамильтониана представляет сум- сумму всех пяти типов взаимодействия. Написанное выражение
494 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА 1ГЛ. XIII удовлетворяет требованиям теории относительности и, помимо характеристик частиц — операторов \|?, содержит лишь постоян- постоянную взаимодействия и матрицы, входящие в уравнение Дирака. Вернемся теперь к процессу распада (ы-мезона с испуска- испусканием нейтрино и антинейтрино. Поскольку оператор \|pv описы- описывает как испускание антинейтрино, так и поглощение нейтрино, процесс распада fx-мезона эквивалентен процессу с поглоще- поглощением нейтрино + + v. Соответственно Н' имеет вид 5 #' = 2 gk (+ЛЧО (№k%) + э. с. A22,4) Использование гамильтониана A22,3) привело к определен- определенным успехам в построении теории C-распада. Как будет ясно из последующего, использование гамильтониана A22,4) подго- подготовило почву к разработке современной теории р-распада. Дальнейшее существенное развитие теории было связано с открытием несохранения четности в слабых взаимодействиях. Предположение о несохранении четности в слабых взаимодей- взаимодействиях было сделано Ли и Янгом 1) на основании существова- существования данных о двух типах распада /(-мезонов. /(-мезоны — это группа элементарных частиц (положитель- (положительная, отрицательная и две нейтральных) со спином, равным нулю, и массой около 966 электронных масс. Все /(-мезоны не- неустойчивы и распадаются с временем жизни 1,2 • 10~8 сек у за- заряженных и 10~10 сек и 6«10~8 у нейтральных. Оказалось, что, помимо распада на (и-мезон и нейтрино, /(-мезоны могут распа- распадаться по схеме /(+ -> я+ + я0, (8-распад), + + я~ + я+, + + яо+яо (т-распад). Возможность распада /(-мезона на два или на три я-мезона не- непосредственно противоречит закону сохранения четности. Дей- Действительно, анализ свойств я-мезонов и их углового распреде- распределения показывает, что четность систем из двух и трех мезонов отличаются друг от друга. Еще более определенные указания на несохранение четности были получены позднее при изучении р-распада поляризованных ядер Со60. Ядра Со60 обладают отличным от нуля спином а. Это ]) Ли Цзун-дао и Янг Чжень-нин, Статья в сборнике «Новые свойства симметрии элементарных частиц», ИЛ, 1957.
§ 122] ПОНЯТИЕ О СЛАБЫХ ВЗАИМОДЕЙСТВИЯХ 495 обстоятельство налагает известные требования на угловое рас- распределение вылетающих из них р-электронов. Именно, из закона сохранения четности вытекает, что распределение электронов должно обладать симметрией относительно направления век- вектора а. Число электронов, вылетающих под углом 6 и 180° — 0 к направлению 0, должно быть одинаковым. Действительно, если представить число электронов, вылетающих в телесном угле dQy в виде где F — некоторая функция угла .8 между векторами р и 0, то это соотношение не должно нарушаться при преобразовании ин- инверсии. При преобразовании инверсии 0, как аксиальный вектор, не изменяется, а полярный вектор р меняет знак. Поэтому при инверсии угол 8 преобразуется: 6—>180° — 0. Таким образом, закон сохранения четности требует инвариантности функции распределения Прямые измерения показали, что угловое распределение р-элек- р-электронов, вылетающих из поляризованных ядер Со60, не обладает указанной симметрией. Напротив, электроны вылетают преиму- преимущественно в направлении, противоположном ориентации спина ядра. Таким образом, р-распад поляризованных ядер непосред- непосредственно демонстрирует нарушение закона сохранения четности. Закон сохранения четности, как мы видели в § 33, связан со свойствами симметрии пространства. Нарушение четности озна- означало бы, что пространство не обладает симметрией и в нем по- понятие «право» и «лево» имеет абсолютный характер. Такая трактовка создала бы исключительно серьезные трудности в ис- истолковании всех законов физики. Казалось совершенно непо- непонятным, как пространство, оставаясь однородным и изотроп- изотропным, может быть асимметричным. Выход из этой трудности был предложен Л. Д. Ландау. Он заключается в том, что, согласно гипотезе Ландау, асимметрич- асимметричным является не пространство, а сами частицы. Ландау1) был предложен принцип комбинированной четности. Согласно этому принципу, все физические законы должны оставаться инвариантными при комбинированной инверсии — пространст- пространственной, инверсии и одновременной замене частиц на античастицы (так называемое зарядовое сопряжение). Примерами послед- последнего может служить замена электронов позитронами, протонов антипротонами и т. д. Л. Д. Ландау, ЖЭТФ 32, 405 A957),
496 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XIII Сохранение комбинированной четности было проверено на довольно большом экспериментальном материале. Поэтому тем более неожиданным оказалось слабое нарушение этого закона сохранения, обнаруженное в опытах по распаду нейтральных К-мезонов. Несохранение четности при слабых взаимодействиях приво- приводит к тому, что гамильтониан Н' уже не обязательно должен быть скаляром по отношению к отражениям. В общем случае, следовательно, гамильтониан A22,3) следует дополнить, введя в него члены, которые меняют знак при отражении координат 5 A22,5) Второе слагаемое в каждом члене суммы является псевдо- псевдоскаляром. Постоянные g'k> вообще говоря, не совпадают с по- постоянными gk. Увеличение числа постоянных, казалось бы, за- затрудняет интерпретацию имеющихся экспериментальных дан- данных и сравнение их с выводами теории. Однако на самом деле несохранение четности открыло новые возможности и привело к формулировке универсального закона четырехфермионных взаимодействий. § 123. Теория двухкомпонентного нейтрино. Универсальное четырехфермионное взаимодействие Открытие несохранения четности в слабых взаимодействиях позволило сформулировать теорию продольного или двухком- двухкомпонентного нейтрино1). Теория двухкомпонентного нейтрино основана на предположении, что масса нейтрино не просто ма- мала, но точно равна нулю. Поскольку нейтрино имеет спин, рав- равный половине, оно описывается уравнением Дирака, которое при т = О для состояния с заданным импульсом р имеет вид2) [см. A15,3)] Еи = (ар)и, ?=±|р|. A23,1) От уравнения A23,1) для четырехкомпонентной функции и мож- можно перейти к уравнению для двухкомпонентных функций. По- ! / w \ /0 о\ лагая и = -~г=-[ ,1 и учитывая, что а = 1 I, перепишем 1) Л. Д. Ландау, ЖЭТФ 32, 407 A957); Nuclear Phys. 3, 127 A957); A. S а 1 a m, Nuovo Cimento 5, 299 A957). См. перевод в сборнике «Новые свойства симметрии элементарных частиц», ИЛ, 1957. 2) В этом параграфе и далее мы пользуемся системой единиц, в кото- которой h = 1, с == 1.
§ №3] ТЕОРИЯ ДВУХКОМПОНЕНТНОГО НЕЙТРИНО 497 уравнение A23,1) в виде Ew = (op) w', 1 Ew' = (op)w. J A23>2) Складывая и вычитая уравнения A23,2), получим '-|р|} A23'4) где Ф+ = тт— (до + до')> ф- Мы видим, что двухкомпонентные функции ф+ и ф- удовлет- удовлетворяют уравнениям первого порядка. Конечно, если бы четность сохранялась, мы не могли бы пользоваться суперпозицией функ- функций w и w\ так как эти функции по-разному преобразуются при инверсии системы координат. Действительно, поскольку а— аксиальный вектор, а р — полярный вектор, то произведение (ар) является псевдоскаляром. Тогда из A23,2) видим, что если w преобразуется при отражении как полярный спинор, то w' образуется как псевдоспинор, и наоборот. Выбирая направление вектора р за ось z, получаем из < 123,3): <Х2ф+ = ф+ ПрИ Е : ог2ф^_ = — ф^_ при Е: и <г2ф- = — ф- при Е = | р |, агФ- = Ф_ при Е = -\Р\. 1 A23'5> Мы видим, что функции ф+ и ф_ описывают состояния, по- поляризация (проекция спина на ось z) которых однозначно свя- связана со знаком энергии. Так, функция ф_ описывает состояние, поляризованное против направления импульса при Я = |р| и по направлению импульса при Е = —|р|, а функция ф+, наобо- наоборот,— состояние, поляризованное по импульсу при Я=|р| и против импульса при Е = —|р|. В теории продольного нейтрино предполагается, что нейтри- нейтрино (Е = \р\) и антинейтрино (Е = —|р|) описываются функ- функцией ф_, т. е. нейтрино всегда поляризовано против направления импульса, а антинейтрино — всегда по направлению импульса. Конечно, с равным успехом можно было бы предположить, что нейтрино и антинейтрино описываются функцией ф+, однако это приводит к выводам, не согласующимся с данными экспери- эксперимента. Если энергию антинейтрино также считать положительной
498 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XIII Е = |р|, то антинейтрино будет описываться функцией ф+ [ср, первое уравнение A23,4) и второе уравнение A23,5)]. При инверсии системы координат аксиальный вектор а не изменяется, а полярный вектор р изменяет направление на про- противоположное. Следовательно, при этом нейтрино переходит в антинейтрино и наоборот, в согласии с идеями, выдвинутыми Л. Д. Ландау (сохранение комбинированной четности). Весь приведенный вывод существенно основывался на пред- предположении, что масса нейтрино строго равна нулю. Это сразу следует и из следующих наглядных соображений. Если бы мас- масса нейтрино не была бы равна нулю, то оно двигалось бы со скоростью, меньшей скорости света. Тогда нашлась бы такая инерциальная система координат, двигающаяся относительно лабораторной со скоростью, большей скорости нейтрино, в ко- которой направление импульса нейтрино изменилось бы на обрат- обратное. Так как направление спина при таком преобразовании не изменяется, мы имели бы в одной инерциальной системе коор- координат нейтрино, а в другой антинейтрино, т. е. пришли бы к противоречию, поскольку нейтрино и антинейтрино, по пред- предположению, не тождественны. Не представляет труда сформулировать теорию продольного нейтрино в рамках обычного аппарата, т. е. с помощью четырех- компонентных функций. Именно, легко видеть [см. A13,16)], что если биспинор г|) является решением уравнения Дирака с мас- массой покоя, равной нулю, то решением этого уравнения будут и функции г|)+ и г|х-; A23,6) или соответственно для состояний с определенным импульсом ^ ^1+Уб)и, A23,7) где и удовлетворяет уравнению A23,1). Легко видеть, что функции и+ и w_ выражаются через ф+ 1 (w\ и ф_. Действительно, полагая и = —т=1 Л и учитывая, /on Y5 = — li п/» что Y5 = — li п/» гДе четырехрядная матрица записана череа
-§123] ТЕОРИЯ ДВУХКОМПОНЕНТНОГО НЕЙТРИНО 499 двухрядные, получаем: <р+ •функция 2 ^_(ю- 7 4 V-Ф-Л A23,8) A23,9) описывает нейтрино при ? = |р|. Она является собственной (°г 0\ функцией оператора проекции спина §Z9 3* = (n 1, соответ- соответствующей собственному значению —1, szii- = —w_ при Е = \р\ (нейтрино). Антинейтрино (? = |р|) описывается функцией «+ и яр+ соответственно. При действии оператора ?z имеем ?zh+ = и+ при ? = |р| (антинейтрино). Заметим также, что функции \|э+ и г|>_ являются собствен- собственными функциями оператора у^ Действительно, так как yl=l, то из A23,6) следует, что ;у } A23,10) Оператор у$ получил название оператора спиральности. Соб- Собственному значению \ь= +1 отвечает левая спиральность, соб- собственному значению Y5 = —1—правая спиральность. В терми- терминах оператора спиральности предыдущим результатам может быть придано наглядное толкование: у частицы между направлением вектора импульса и направлением вектора спина имеется строгая корреляция. У нейтрино спин а антипараллелен р (ys = 1); у ан- антинейтрино параллелен (ys = —1). Если наглядно представлять спин как враще- ( ние частицы, то нейтрино вращается как левый винт вокруг оси р (рис. 28). При пространственной инверсии направ- направление р изменяется на противоположное, а вектор а остается неизменным. Ней- Рис. 28. трино со спином, имеющим «неправиль- «неправильную» ориентацию, не существует. Поэтому при отражении про- пространственных координат необходимо допустить превращение нейтрино в антинейтрино, в соответствии с принципом комби- комбинированной четности.
500 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. ХПГ Гелл-Манн и Фейнман1) высказали гипотезу, что свойства спиральности имеет общий характер и является характеристи- характеристикой всех фермионов, а не только нейтрино. Согласно этой ги- гипотезе преобразование A23,6) должно иметь место для всех четырех фермионов, участвующих в процессе слабого взаимо- взаимодействия A22,2). Это означает, что в общем выражении A22,5) операторы фс, "фя, ^>л и г|)В должны быть заменены соответствен- соответственно на операторы Ye) ^>d> %в = y=(l + Ys) Поясним это предположение. Отметим прежде всего, что операторы % фактически являются двухкомпонентными. Через спиноры w и w'y входящие в -ф, они выражаются аналогично A23,8), w —; Л 2 V— {w-w')J* Так как %= -тт=(\ + Ys)^> то» действуя на обе части равенства оператором г |у^ I мАЛ — т\ и учитывая уравнение Дирака получим К^) ] A23'П) Подставляя в уравнение Дирака <ф в виде A23,11), получим уравнение второго порядка, которому удовлетворяет оператор % [(Д^)^^] = 0, A23,12) где Фейнман и Гелл-Манн предположили, что оператор % яв- является более фундаментальным, чем оператор г|?, и поэтому Ч R. Feynman, H. Gell-Mann, Phys. Rev. 109, 193 A958). [См. русский перевод ПСФ, вып. 4, стр. 3 A958).]
§ 123] ТЕОРИЯ ДВУХКОМПОНЕНТНОГО НЕЙТРИНО 501 гамильтониан взаимодействия A22,3) не должен содержать про- производных именно оператора %. Поэтому ввиду A23,11) в га- гамильтониан взаимодействия должен входить оператор %, а не г|п Такое предположение сразу приводит к тому, что из всех вариантов взаимодействия оказываются возможными лишь век- векторный и аксиально-векторный (с одинаковыми константами), а все остальные дают нуль. Покажем, например, что обращается в нуль псевдоскаляр- псевдоскалярный вариант а, 1 но 1 Следовательно, оба члена идентичны. Далее, Следовательно, в скобках появляются члены Нуль дает также скалярный и тензорный варианты. Учитывая, что имеем для векторного и аксиально-векторного вариантов - Y5)YVY5A +Y5) VI X A + Ys) *a) »dYv 0 + Ye) *в) + э. с A23,13) Точно к такому же виду для гамильтониана четырехфер- ментного взаимодействия пришли Сударшан и Маршак1), осно- основываясь на тщательном анализе экспериментальных данных. Гамильтониан взаимодействия A23,13) дает универсальный закон четырехфермионного взаимодействия с единой константой *) Русский перевод работы см. ПСФ, вып. 2, стр. 3 A959).
502 РЕЛЯТИВИСТСКАЯ КВАНТОВАЯ МЕХАНИКА [ГЛ. XIII связи /. При анализе конкретных процессов с помощью гамиль- гамильтониана A23,13) нужно учитывать также и так называемый закон сохранения лептонного заряда. Лептонами называются легкие частицы, принимающие участие в процессах со слабым взаимодействием, а именно: электроны ег, рг-мезоны, нейтри- нейтрино v. Частицы е+, \х+ и v+ называются антилептонами. Лептонам приписывается лептонный заряд +1, антилептонам —1. Для остальных частиц, например, нуклонов, лептонный заряд пола- полагается равным нулю. Полный лептонный заряд (алгебраическая сумма лептонных зарядов) должен в реакции сохраняться. Под- Подробнее этот вопрос будет рассмотрен в гл. XV. Рассмотрим, например, распад |иг"-мезона li~->e- + v + v. A23,14) Распад с испусканием двух нейтрино (или антинейтрино), оче- очевидно, запрещен законом сохранения лептонного заряда. Гамильтониан взаимодействия A23,14) в соответствии с A23,13) имеет вид +Y5)V) + 3' c' <123>15> Для процесса р-распада нейтрона соответственно имеем: ^ + ^c A23,16) Зная гамильтониан взаимодействия, не представляет труда обычными методами теории возмущений определить вероятность соответствующего процесса. Универсальный закон четырехфер- мионного взаимодействия, предложенный Гелл-Манном — Фейн- маном и Сударшаном —Маршаком, количественно подтверж- подтвержден большим экспериментальным материалом.
ГЛАВАХ1У НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ § 124. Функция Грина уравнения Дирака Развитая в гл. XIII теория взаимодействия нерелятивистских заряженных частиц с электромагнитным полем без труда обоб- обобщается на случай релятивистских частиц. Однако вычисления высших приближений теории возмущений (разложений по сте- степеням е2/Ьс) приводили к расходящимся выражениям, физиче- физический смысл которых был неясен. Так, например, собственная энергия электрона, как и в классической электродинамике, ока- оказывалась бесконечной. Поправки к эффективному сечению рас- рассеяния, вычисленные во втором приближении теории возмуще- возмущений, также оказывались не малыми, а бесконечно большими и т. д. Все это указывало на ограниченную область применимо- применимости расчетного аппарата квантовой электродинамики. Вместе с тем хорошее согласие с опытными данными эффективных се- сечений различных процессов, рассчитанных в первом неисчезаю- щем приближении теории возмущений, указывало на правиль- правильность общих идей и методов теории. Повышение точности экспериментальных методов исследова- исследования привело в последние годы к установлению новых фактов, не находивших объяснения в квантовой электродинамике. Имен- Именно, в 1947 г., кроме упомянутого открытия Лэмбом смещения уровней 22Si/2 и 22Pi/2 атома водорода, которые по теории Ди- Дирака должны были бы совпадать, Раби установил, что величина магнитного момента электрона несколько отличается от магне- магнетона Бора. Открытие этих явлений привело к дальнейшему интенсивному развитию квантовой электродинамики. Сущест- Существенную роль в развитии теории сыграли работы Бете, Фейн- мана, Дайсона, Швингера, Томонага и др. О- В частности, 1) Подробная библиография приведена в книге: С. Швебер, Г. Бете, Ф. Гофман, Мезоны и поля, г. I, И/L 1957. Подробное изложение кванто- квантовой электродинамики см. также в книге: А. И. А х и е з е р, В. Б. Б е р е- стецкий, Квантовая электродинамика, «Наука», 1969. С. Швебер, Введе- Введение в релятивистскую квантовую теорию поля, ИЛ, 1963. В. Б. Б е р е с т е ц- кий, Е. М. Л и ф ш и ц, Л. П. П и т а е в с к и й, Релятивистская квантовая тео- теория, ч. I, «Наука», 1968.
3504 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ [ГЛ. XIV Фейнманом был предложен новый расчетный метод, позволяю- позволяющий существенно упростить все вычисления, а также придать им наглядный физический смысл1). В рамках этой книги мы можем изложить лишь самые общие основы метода Фейнмана. Детальное его изложение, а также многочисленные примеры применения метода Фейнмана к конкретным задачам могут быть найдены в указанных статьях и монографиях. Основу расчетного аппарата теории Фейнмана составляет метод функции Грина. Мы перейдем теперь непосредственно к изложению методики, предложенной Фейнманом. Прежде всего запишем уравнения Дирака в более компактной и удоб- удобной для этих расчетов форме. Для этого введем оператор тде хА = ixQ = it. В этих обозначениях уравнение Дирака имеет вид2) (V + m)t|)=0. A24,1) Аналогично тому, как это делалось в нерелятивистской тео- теории для уравнения Шредингера (см. § 29), введем функцию Грина /СB, 1) уравнения Дирака A24,1). Функция Грина КB,1) по определению удовлетворяет уравнению (V2 + m)/CB,l) = y64B,l). A24,2) Здесь и в дальнейшем цифры 1 и 2 означают совокупность че- четырех координат #р., Уг — оператор, действующий на перемен- переменные #2^. Символ б4 B, 1) обозначает четырехмерную б-функцию, равную 64Bl) 64fe) 6(N(//1). A24,3) Будем искать решение уравнения A24,1) в импульсном пред- представлении. Иными словами, разложим функцию /С B, 1) в инте« грал Фурье 1)= JS(p)e*M*^-Vd4p, A24,4) *) R. P. Feynman, Phys. Rev. 76 749 A949). Русский перевод см. в сборнике «Новейшее развитие квантовой электродинамики», ИЛ, 1954. См. также цитированные монографии. 2) Мы используем обозначения, несколько отличающиеся от введенных Фейнманом. Подобные обозначения приняты, например, в книге А. И. А х и е- зера и В. Б. Берестецкого. Напомним также (см. сноску на стр. 496), ^что мы считаем в этой главе h = 1, с = 1.
§ 1241 ФУНКЦИЯ ГРИНА УРАВНЕНИЯ ДИРАКА 505* где d4p = d*p dpQ = dpx dpy dp2 dpQ = dpx dp2 dp3 dpQ. p^ — четырехмерный вектор импульса р4 = ip0. По индексу jjt. производится суммирование от 1 до 4. Чтобы не загромождать формулы индексами, мы в дальнейшем будем опускать индекс ц, если это не может повести к недоразумениям. Разлагая также- в интеграл Фурье б4 B,1) по формуле (см. приложение III) оо 64B,1) = -Jgr J e'p<*-*.) d*p A24,5) — оо и подставляя в A24,2) выражения A24,4) и A24,5), находим (V2 + т) j S (р) е1Р <*-*> tf 4p = -^W J eiP iX2~Xl) d4P- A24'6^ Действие оператора (V2 + m) дает (V2 + m) elPto-** = (ip + m) е^^'^\ A24,7)- где1) P = РЛ- Приравнивая в A24,6) компоненты Фурье и учитывая A24,7) можно написать формальное решение для S(p) •*IPJ- BяL / /p + m "" BяL (ip + m)(ip-m) BяL p2 + m2 ' A24,8)> где Мы воспользовались антикоммутативностью матриц у. Для КB, 1) соответственно имеем *B> 1} = BSF J ^ e'P<JtJ-^dV, A24,9) Последнее выражение удобно записать в виде К Р, 0 = /(V2-m)/B, 1), A24,10) где /B,1)—интеграл, зависящий только от обычных перемен- переменных, но не от матриц Дирака, и равный V* A24'П> l) Подчеркнем, что в этой главе знак Л имеет другой смысл, чем в пре- предыдущих главах книги.
506 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ [ГЛ. XIV Произведем интегрирование по переменной р0: где Если рассматривать ро как некоторую комплексную перемен- переменную, то интегрирование в плоскости этой комплексной перемен- переменной производится по всей вещественной оси. Однако подынтег- подынтегральная функция имеет на этой оси полюса в точках ро = Ер и ро = —Ер. Следовательно, для того чтобы интеграл A24,11) имел определенный смысл, необходимо задать правило обхода этих полюсов. Фейнманом было предложено следующее правило обхода: левый полюс обходится снизу, а правый сверху. Для выполнения такого обхода следует прибавить к массе т беско- бесконечно малую отрицательную .мнимую часть, которую в оконча- окончательном результате следует устремить к нулю: /п -> /п — /6, 6 > 0. Действительно, при этом Ер так- - у^ , , же получает бесконечно малую отри- Е Ро цательную мнимую добавку, и соот- соответственно полюсы подынтегральной Рис. 29. функции располагаются, как показано на рис. 29. Мы можем теперь произве- произвести интегрирование, замыкая контур интегрирования бесконеч- бесконечно большой полуокружностью и вычисляя вычеты в соответ- соответствующих полюсах. Поскольку под знаком интеграла стоит экспоненциальная функция, контур интегрирования замыкается снизу при t2 > t\ и сверху при t2<t\. Соответственно при t2 > t\ вычет берется в точке ро = Еру а при t2 < t\ — в точке ро = —Ер. Таким образом, получаем: ^11^ *>'i- <124>12> t*~tl)(?P> *2<'i- A24'13) Мы видим, что поскольку Ер > 0, то при t2 > t\ вклад дают лишь состояния с положительной энергией, а при t2 < t\ — соот- соответственно лишь состояния с отрицательной энергией. Отметим, что полученный результат существенно отличается от имевшего место в нерелятивистской теории. Действительно, там функция Грина полагалась [ср. с B9,3)] равной нулю при t2 < t\. Анало- Аналогичное выражение мы получили бы и в релятивистском случае,
§ 124] ФУНКЦИЯ ГРИНА УРАВНЕНИЯ ДИРАКА 607 если бы оба полюса обходились сверху, что соответствует за- замене ро-+ро + *6 в подынтегральной функции. Вычисление, аналогичное только что произведенному, пока- показывает, что при такой замене времени h > t\ отвечало бы сум- суммирование как по положительным, так и по отрицательным энергиям, а при ^ < t\ мы получили бы / = 0. Однако из даль- дальнейшего будет видно, что использование функции Грина, пред- предложенной Фейнманом и определяемой формулами A24,12), A24,13), является значительно более удобным. С помощью введенной функции Грина можно построить ре- решение уравнения Дирака, т. е. получить формулу, аналогичную нерелятивистскому соотношению B9,2). Проще всего для этой цели воспользоваться теоремой Гаусса в 4-пространстве (dAx = dzx dt) $^^$ A24,130 где F — произвольный 4-вектор, S — поверхность, охватывающая данный четырехмерный объем, а п(х) — внешняя нормаль к этой поверхности в точке х. Полагая получим: дх\1 Из A24,10) следует, что **(*-*0v =v a«(*-*')-у к(х-х') Воспользовавшись соотношениями A24,1), A24,2), получим 2%Р - фх + т) К (х - х') * (х') - /б4 (х - Подставляя это выражение в выписанный выше четырехмер- четырехмерный интеграл и воспользовавшись A24,137), получим
508 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ [ГЛ. XIV Обозначая точку х через точку 2, а точку xf через точку 1, мы можем переписать полученное соотношение в виде <фB) = Г /СB, 1)уЖ1)<*3*1- f /СB, 1')уЖ1'№!'. A24,14) Здесь в качестве поверхности интегрирования выбраны две бес- бесконечные пространственноподобные плоскости t = t\ и t = t{'y причем t{<t2<t{\ Интегрирование по времениподобным по- поверхностям можно опустить, так как они пространственно уда- удалены от точки 2 сколь угодно далеко, а функция К B, 1), как можно показать, в пространственноподобных направлениях экс- экспоненциально убывает до нуля при неограниченном возраста- возрастании пространственных расстояний1). Функция К B, 1) содержит суммирование только по состоя- состояниям с положительной энергией, а функция КB, Г), при t2<t\ — лишь по состояниям с отрицательной энергией. Поэтому первый интеграл в A24,14) отличен от нуля для компонент \|эA), отве- отвечающих частицам с положительной энергией, а второй интеграл соответственно не равен нулю для компонент г|?(Г), отвечающих частицам с отрицательной энергией. Мы видим, что волновая функция частицы в точке 2 четырех- четырехмерного пространства определяется функцией Грина и значе- значениями \|)A) и г|?(Г). Аналогичным образом, полагая Flx= = §(х')У1хК(х' — х), легко найти выражения для функции грB): <фB)= f <фA')у4#A'> 2)d*xX'~ f ^(l)y4K(l92)(Pxl9 A24,15) li >l2 где функция яр (лг) = г|)+(д:)у4 и удовлетворяет уравнению ИЛИ При такой форме записи оператор V действует на функции, стоящие слева от него. Компоненты волновой функции, отвечающие отрицательным энергиям Еу трактуются в теории Фейнмана как амплитуды вероятности нахождения частицы в позитронном состоянии, т. е. в состоянии с положительной энергией +? и зарядом +е. Та- Таким образом, функция \f>B) является заданной, если известна амплитуда электронного сотояния яр A) в момент t\ < h и ам- амплитуда позитронного состояния г|;(Г) в момент t^>t2» 1) См. работу Фейнмана (ссылка на стр. 504).
.§ 125] ФУНКЦИЯ ГРИНА ДЛЯ СИСТЕМЫ ИЗ ДВУХ ЧАСТИЦ 509 Фазовый множитель, входящий в функцию /С B, 1), при t2 < t\ зависит от времени по закону etEp^2"f^ = e~iEp\'2~tl\ [см. A24,13)]. Иными словами, временной множитель у функции К{2, У) зависит от (t2 — ty) так же, как фазовый множитель волновой функции, отвечающей частицам с положительной энергией. В соответствии с этим позитронные состояния можно рассматривать как состояния частицы с положительной энер- энергией, но распространяющейся в обратном направлении по оси времени. Этому соответствует то обстоятельство, что состояние позитрона должно быть задано в момент времени t^>t2 [вто- [второй интеграл в формуле A24,14)]. Предположим теперь, что имеется внешнее электромагнит- электромагнитное поле. В наших обозначениях уравнение Дирака в этом слу- случае запишется в виде (У-/еЛ + тИ = 0, A24,16) где А = Ацуу, А\ = щ (ф— скалярный потенциал). Функция Грина, как обычно, определяется уравнением (V* - ieA + т) КА (х - х') = - 16 (х - х'). Функция /САB, 1), так же как и функция КB, 1), содержит в своем разложении только компоненты, отвечающие положи- положительным энергиям при t2>t\ и отрицательным энергиям при t2<t\. Соотношения A24,14) и A24,15) остаются в силе, если только заменить в них К B,1) на /САB, 1). Так же как и в нерелятивистском случае, можно сформули- сформулировать интегральное уравнение, которому удовлетворяет функ- функция /(лB,1). Именно, КлB, 1) = /СB, l)-e J /СB, 3)ЛC)/СЛC, l)d%. A24,17) Вывод интегрального уравнения A24,17) не отличается от вы- вывода интегрального уравнения B9,17). Как мы уже выяснили в § 58, уравнение такого типа удобно решать методом после- последовательных приближений [см. E8,5)]. § 125. Функция Грина для системы из двух частиц Найденное выше выражение для волновой функции одной частицы необходимо обобщить на случай системы взаимодей- взаимодействующих частиц. Простейшим примером такой системы яв- является система, состоящая из двух частиц, связанных между собой взаимодействием электромагнитного характера. Заметим прежде всего, что функция Грина системы двух невзаимодей- невзаимодействующих частиц равна произведению функции Грина каждой
510 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ [ГЛ. XIV из частиц: /СC, 4; 1, 2) = /СаC, 1)/С,D, 2). A25,1) Здесь /Са C,1) — функция Грина свободной частицы а, рас- распространяющейся из точки 1 в точку 3. Аналогичный смысл имеет величина /Сь D,2) для частицы Ь. В случае системы двух взаимодействующих частиц функция Грина, даваемая формулой A25,1), может рассматриваться как нулевое приближение по взаимодействию. Найдем теперь функ- функцию Грина /С<1)C,4; 1,2) в первом приближении по взаимодей- взаимодействию. Именно, будем рассматривать две заряженные частицы, которые описываются уравнением Дирака. Для того чтобы написать оператор взаимодействия, удобно, следуя Фейнману, сначала рассмотреть нерелятивистское приближение, а затем провести соответствующее обобщение на случай релятивистских частиц. В нерелятивистском приближении взаимодействие меж- между частицами описывается законом Кулона, а функция /(О) C,4; 1,2) по аналогии с формулой E8,3) определяется со- соотношением КA)C 4; 1,2) = - - te8 J Ка C, 5) Кь D, 6) -^ б (Q Ка E, 1) Кь F, 2) dx\ dx\t A25,2) где г5б = |гб — г6|. Смысл выражения для /С<!>C,4; 1,2) легко по- понять, если сопоставить ему некоторую диаграмму (рис. 30), которая трактуется следующим обра- зом. Частица а распространяется из точки / в точку 3, проходя через про- промежуточную точку 5. Линия 2 — 6— 4 описывает распространение частицы &. Линии 1 — 5 на диаграмме соответ- соответствует функция распространения Ка E,1), а линия 2 — 6 — соответствен- соответственно функциям /СьF,2). В, точках 5 и 6 осуществляется взаимодействие между частицами. Пунктир соответствует выражению — 6 (/и), гдег56= ==5|Г5_Гб|_ пространственное расстояние между точками 5 и 6% а /бб = *5 — *б, где h и /в — моменты времени, в которые ча- частицы а и Ь попадают в точки 5 и 6. Дельта-функция времен- временного аргумента означает, что в нерелятивистском приближении следует пренебрегать запаздыванием и рассматривать частицы, находящиеся в точке 5 и 6 в один и тот же момент времени /в/5в te. Линии 5 — 3 и 6 — 4 соответствуют движению свободных частиц после взаимодействия (функции /(аC,5), Кб D,6) в A25,2)).
§ 125] ФУНКЦИЯ ГРИНА ДЛЯ СИСТЕМЫ ИЗ ДВУХ ЧАСТИЦ 511 Обобщение выражения A25,2) на релятивистский случай включает прежде всего учет запаздывания взаимодействия. На первый взгляд может показаться, что для этого следует заме- заменить 6(*5б) на 6(*5б —>5бЬ гДе Г56 определяет время запаздыва- запаздывания (в наших обозначениях — скорость распространения взаи- взаимодействия с=\). Однако подобная замена была бы непра- неправильной. Действительно, электромагнитное взаимодействие представляет обмен фотонами, обладающими положительной энергией. Между тем разложение б-функции в интеграл Фурье содержит как положительные, так и отрицательные частоты. Поэтому для перехода от кулоновского взаимодействия к реля- релятивистскому обобщению с учетом запаздывания следует заме- заменить б-функцию на функцию б+, определенную соотношением 8->0 J \ е-'т(*-и)^г = Пт^=п-Щ-- A25'3) J п е->0 х 1Ъ ш Определенный таким образом аналог б-функции содержит разложение лишь по положительным частотам. Так как /бб при- принимает как положительные, так и отрицательные значения, то берется симметризованная комбинация Приведенное равенство сразу находится с помощью фор- формулы A25,3). Кроме того, нужно учесть, что если частицы движутся, то существует, помимо кулоновского, электромагнитное взаимо- взаимодействие [см. B5,27), ч. II]. Это приводит к тому, что взаимо- взаимодействие определяется выражением Оператор взаимодействия мы получим, если заменим век- векторы скорости г;5, Vq на операторы аа, аь, причем каждый из операторов действует соответственно на переменные а-й и 6-й частиц1). Тогда для оператора взаимодействия в релятивист- релятивистском случае можно в силу A13,14) написать: Нам осталось для получения окончательного выражения функции /СA)C,4; 1,2) установить связь между релятивистскими 1) Действительно оператор скорости легко может быть найден по фор- формуле а=:[Я,г]. Но Н [см. A13,7)] равен Я^-т-aV + Pw и коммутируя, мы получаем [Я, г] =» а.
512 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ [ГЛ. XIV и нерелятивистскими функциями Грина. Для этого сравним формулы B9,3) и A24,14). Мы видим, что имеет место соот- соответствие Анерелят —*" АрелятР* Таким образом, для частиц, описываемых уравнением Дирака, имеем: К<"C, 4; 1,2)РА = -ie* J tfeC, 5)К6D, 6)Ye|1Y»A(-*fe) X X КаE, \)КьF, 2)рврй<ftcB<*«*,. A25,4) Умножая A25,4) справа на раРь, находим окончательно: ЯA>C, 4; 1, 2)- - U? \ КаC, 5)КЬD, 6)улМ~4>) X = е2 J *аC, A25,5) Функцию D (— л:|б) = — /б+ (— л:^6) обычно называют функ- функцией распространения виртуального фотона. Итак, мы видим, что с учетом релятивистских эффектов диаграмму рис. 30 мож- можно трактовать следующим образом. Функции К отвечают сплошным (электронным) линиям, функция D — пунктирной линии, а вершинам отвечают матрицы eyall1 еуьц. Все расчеты в теории Фейнмана существенно упрощаются, если их проводить в импульсном представлении. Вид функции К в р-представлении дается формулой A24,8). Таким образом, остается определить компоненту Фурье функции 6+. Покажем, что имеет место следующее соотношение: A25,6) где е — бесконечно малая величина. Она определяет правило обхода полюсов. В правильности соотношения A25,6) убе- убедимся, непосредственно вычисляя интеграл, стоящий справа: Предположим, например, что х0 > 0. Замыкая контур интегри- интегрирования снизу и находя вычеты, получаем Представляя dzk в виде k2dkdQ и интегрируя по углам, по- получаем с учетом A25,3) искомое соотношение.
§ 126J ДИАГРАхММЫ ФЕЙНМАНА 513 § 126. Диаграммы Фейнмана Мы рассмотрим теперь правила вычисления вероятностей перехода из одного состояния в другое с помощью расчетного аппарата, приведенного в предыдущих параграфах. Для про- простоты рассмотрим сначала одну частицу (например, электрон, которая переходит из одного состояния в другое под действием внешнего электромагнитного поля. Пусть электрон в начальный момент времени t = t\ находится в состоянии ty(ru t\) = ^A), а в момент времени t = t2— в состоянии -ф (r2, t2) = г|э B), отве- отвечающем положительной энергии. Вероятность перехода в неко- некоторое состояние \|)п (r2, t2), как всегда; определяется квадратом модуля соответствующей амплитуды разложения функции i|?(r2, t2) по функциям i|?n(r2, t2): = J ¦» (Г2> У ¦ (Г2> У &*Г ( 126> Выражая функцию г|)(г2, ^) через функцию Грина по фор- формуле A24,14), получаем Вместо функции Грина КА можно написать ее разложение в ряд последовательных приближений. При этом получим выражение для амплитуды перехода М в виде ряда теории возмущений. Так, например, амплитуда перехода в первом приближении тео- теории возмущений равна М{1) = -в J <B)/СB, 3) А C)/СC, 1)№A)<Р*1(Рх2<Рхг. A26,2) Это выражение можно представить в более компактном виде, используя соотношения ¦ C)= J *C, 1)№A)<*3*1, ¦»C)- J фЛ Тогда для амплитуды перехода имеем AfA) = ~e J *яC) ЛC)фC)^3. A26,3) Аналогичным образом легко получить второе приближение амплитуды перехода М{2) = (- ef J Ъп C) А C) /С C, 4) Л D) ф D) rf4x3 d%. A26,4) Если начальное и конечное состояния описываются плоскими волнами, то формулы A26,3) и A26,4) удобно переписать 17 В. Г. Левич и др., том II
514 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКГРОДИНАМИКИ [ГЛ. XIV в импульсном представлении. Полагая *я C) = й (ft) <г'**, ф C) = и (р{) е»* и используя фурье-представление оператора А AC)=ju(k)eik**d% A26,5) получаем для амплитуды перехода первого порядка A26,3): М{1) = - е J dAx3 J е-*"**+1кх*+*Р1Хщ (ft) й (й) и (ft) d4k = = - е BяL J й (р2) й (й) б4 (k + р{ - р2) и Ы d4^ = = - в BяL б (р2) й (р2 - Pl)«(p{). A26,6) Для амплитуды перехода второго порядка соответственно имеем: = (- ef J п (р2) Й (feO S (р) й (й) м (Pl) rf4/? d4^ rf4^i X e-iP2X3+iklx3+ip {Xs-x М® X dV a4^ d4^ = ,2 Bя^ J б (ft) d (ft - Pl - *) /B3T)M/(;i + ,) + m] X Xu{k)u{p{)d*k. A26,7) Формулами A26,6) и A26,7) можно сопоставить наглядные схе- схемы, получившие название диаграмм Фейнмана. Как будет по- пояснено ниже, каждой линии и каждому пере- | сечению линий (именуемому вершиной) на J диаграмме Фейнмана отвечает определенный i множитель в амплитуде перехода. В случае \a>(P2-Pi) сложных процессов подобные диаграммы по- позволяют упростить построение выражений для амплитуд переходов. Будем изображать на диаграмме Фейн- мана состояния электронов и позитронов Рис. 31. сплошными линиями, состояния электромаг- электромагнитного поля — пунктирными линиями. Стрел- Стрелки на линиях показывают последовательность написания членов в амплитуде перехода. Возрастанию времени отвечает движе-- ние частицы по линии справа налево. Рассмотрим простейшую диаграмму Фейнмана (рис. 31), от- отвечающую следующему процессу: электрон с импульсом pi рас- рассеялся на внешнем электромагнитном поле и перешел в новое
§ 126] ДИАГРАММЫ ФЕЙНМАНА 515 состояние с импульсом р2. Амплитуда вероятности этого пере- перехода дается формулой A26,6). На рис. 31 свободный электрон с импульсом р\ изображен сплошной прямой АВ. Этой прямой в амплитуде перехода ММ отвечает первый множитель (множи- (множители нумеруются справа налево) — биспинор и (pi). В точке В электрон рассеивается на электромагнитном поле, изображен- изображенном пунктирной линией. Пересечению сплошной и пунктирной линии (вершине) на диаграмме Фейнмана в амплитуде пере- перехода ММ отвечает оператор —ea(k), умноженный на б-функцию от импульсов всех трех частиц. Электрон с импульсом р2 изо- изображен прямой BD. В амплитуде ЛК1) ему отвечает биспинор и(р2). Мы видим, что порядок процесса по заряду е определяется числом вершин на диаграмме Фейнмана. Это особенно ясно видно из рассмотрения диаграммы Фейнмана для процесса второго по- порядка (рис. 32). Эта диаграмма отве- отвечает процессу рассеяния электрона во втором приближении теории возмуще- возмущений. Линия АВ (именуемая внешней линией) изображает движение свобод- свободного электрона. Ей соответствует би- биспинор и(р\) в амплитуде перехода jW2). В вершине В происходит рассея- ^ ние электрона. В амплитуде перехода Рис. 32. М<2) вершине В отвечает множитель —ea(k) и б-функция от импульсов ЬА(р\ + k — p). Линия ВС, соединяющая две вершины, называется внутренней линией. Ей в М2) соответствует множитель 5 — фурье-компонента функции Грина, определенная формулой A24,8). В вершине С действует внешнее поле. Вершине С соответствует в Af<2> оператор —ea(k\) и б-функция bA(k\ + p— Р2). Внешняя линия CD изо- изображает движение электрона с импульсом р2. Линии CD в М& отвечает биспинор и(р2). Поскольку закон сохранения 4-импуль- са при переходе из состояния р\ в состояние р2 выполняется при произвольном значении волнового вектора fe, то по вектору k (или k\) производится интегрирование. Величина числового множителя в выражении для амплитуды определяется числом входящих в нее 6-функций, равным числу вершин. Каждая вер- вершина вносит в М2> множитель BяL. Совершенно таким же образом может быть построена диа- диаграмма Фейнмана для процессов, происходящих с участием по- позитронов. Например, диаграмма рис. 32 описывает также рас- рассеяние позитрона во втором приближении теории возмущений. Так как в теории Фейнмана позитрон рассматривается как электрон, движущийся обратно во времени, то эта диаграмма 17*
516 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ [ГЛ. XIV определяет амплитуду перехода позитрона из состояния с им- импульсом —р2 в состояние с импульсом —р\. Для вершины М<2> в этом случае имеем М{2) = \е2 BяL J v (р2) й (р2 -Pl-k) i(px + k) + m d {k) v (px) A26,8) Здесь v — биспинор Дирака, отвечающий состоянию с отрица- отрицательной энергией. Помимо процессов рассеяния во внешнем электромагнитном поле, выведенные соотношения дают возможность рассмотреть процессы, связанные с излучением и поглощением свободных фотонов. Для этого в общих формулах A26,3) и A26,4) опера- оператор А должен соответствовать полю одного излученного или одного поглощенного фотона. В согласии с формулами A02,3) A02,5) полю излученного фотона отвечает вектор-потенциал Le~ikx, A26,9) а поглощенному фотону соответственно A» = Yl!re»eikX- A26,10) Здесь е^ — вектор поляризации, a k означает четырехмерный волновой вектор. Так как поглощается или излучается только один фотон, то матричные элементы операторов а и й+ равны единице. Диаграммы, изображенные на рис. 33, описывают процессы с уча- участием двух свободных фото- фотонов. Так, например, эти диа- диаграммы описывают процесс комптоновского рассеяния, т. е. рассеяния фотона на Рис. 33. свободном электроне. В этом процессе фотон до рас- рассеяния имел волновой вектор ки а после рассеяния —k2. На диаграмме рис. 33, а соответствует тому, что фо- фотон сначала поглощается, а затем испускается электроном. Этому же процессу отвечает и диаграмма рис. 33,6, когда сна- сначала испускается фотон fe2, а затем поглощается фотон kx. Разу- Разумеется, слова «сначала» и «затем» относятся лишь к порядку написания множителей в амплитуде перехода и не имеют ка- какого-либо другого физического смысла. Диаграммы Фейнмана, изображенные на рис. 33, позволяют сразу написать амплитуду перехода, не делая каждый раз спе-
126] ДИАГРАММЫ ФЕЙНМАНА 517 циальных вычислений такого типа, какие делались при выводе формул A26,6) и A26,7). Полная амплитуда перехода опреде- определяется суммой амплитуд, отвечающих диаграммам 33, а и 33,6. Она имеет вид М - -f /f /f A26,11) — векторы поляризации к? где ё\ = ^iixYm-» ^2 = ^2p,Yp.» a е1& и фотона до и после рассеяния. Появление б-функции легко понять, если учесть, что в дан- данном случае в выражении типа A26,4) вместо оператора внеш- внешнего поля вида A26,5) подставляются выражения типа A26,9) и A26,10), не содержащие интегрирования по k. Таким обра- образом, в выражении типа A26,7) будет отсутствовать интегриро- интегрирование по k и k\. После инте- f грирования по р остается од- | на б-функция,- выражающая за- i кон сохранения энергии и им- |Л> пульса при комптон-процессе. Диаграммы такого же типа описывают, например, процесс аннигиляции электрона с им- импульсом р\ и позитрона с им- импульсом —р2. При аннигиля- рис. 34. ции образуется два фотона с импульсами к\ и k2 (рис. 34). Амплитуда двухфотонной анни- аннигиляции пары по тем же правилам запишется в виде Н2 i i i гп г* а) У {-р2-к{-к2). A26,12) В качестве другого примера рассмотрим тормозное излуче- излучение электрона, т. е. излучение, возникающее при пролете быст- быстрого электрона в поле ядра. Диаграмма, отвечающая этому процессу, представлена на рис. 35. Электрон с импульсом р\, рассеиваясь на внешнем поле а, излучает фотон импульса k и поляризации е и переходит в со- состояние с импульсом р2- При этом возможны два процесса, изо- изображенные на диаграммах рис. 35, а и б%
518 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ [ГЛ. XJV Полная амплитуда перехода, в соответствии с изложенными правилами, имеет вид \ - A26>13> Рассмотрим теперь процессы, связанные с взаимодействием двух частиц, например, рассеяние электрона на (и-мезоне. Ам- Амплитуда перехода вычисляется опять разложением волновой р;~к Рг а) Pi Рг Рис. 35. a(p2+fc-pj) р2+к Ю Pi функции системы по произведениям волновых функций свобод- свободных частиц. Волновая функция системы двух частиц опреде- определяется функцией Грина A25,5). Эти вычисления приводят к графикам* которые строятся по тем же принци- принципам, что и для случая одной частицы. В первом приближении теории возму- возмущений процессу рассеяния соответ- соответствует диаграмма Фейнмана, изобра- изображенная на рис. 36. Здесь сплошные линии АВ и CD соответствуют движению свободных частиц с импульсами pi и р2. Электро- Электромагнитное взаимодействие между ча- частицами сводится к обмену фотонами. В вершине В происхо- происходит излучение виртуального фотона, который поглощается второй частицей (вершина D). Линии BE и DF отвечают движе- движению частиц после взаимодействия с импульсами рз и р4- Амплитуда перехода составляется по тем же правилам yl имеет вид М = ё> Bл)8 па (рз) йь (р4) ya»Df (р{ - рз) X X уь»иа (рк) ub (ft) б4 (р3 + р4 ~ Pi ~ ft). A26,14) Рис. 36.
§127] КОМПТОН-ЭФФЕКТ 19 Здесь Df — компонента Фурье функции распространения вир- виртуального фотона D, которая согласно A25,5) и A25,6) дается формулой Остановимся кратко на поправках, которые возникают в выс- высших приближениях теории возмущений. Диаграммы, отвечаю- отвечающие этим поправкам, естественно, должны содержать большее число вершин по сравнению с соответствующей основной диаграммой (каждой верши- вершине отвечает параметр мало- малости е). Именно числом вершин и определяется порядок мало- малости рассматриваемой по- лравки. Рассмотрим, например, диа- диаграммы, отвечающие следую- следующему приближению к теории комптон-эффекта. Как легко понять,, диаграмме рис. 33, а соответствуют поправки на рис. 37. Аналогично и для диа- диаграммы рис. 33,6. Все эти диаграммы отличаются от исходной диаграммы (см. рис. 33) наличием внутренней фотонной линии. Эта линия отве- отвечает, как мы уже видели, излучению и поглощению виртуаль- виртуального кванта. Поэтому эти поправки обычно называются радиа- радиационными. Вычисление этих поправок связано с определенными трудностями и потребовало разработки так называемого метода перенормировок. Мы не будем останавливаться на этих во- вопросах !). § 127. Комптон-эффект Для иллюстрации техники расчета • эффективных сечений в теории Фейнмана рассмотрим подробнее теорию комптон-эф- комптон-эффекта. Амплитуда перехода для этого процесса была уже полу- получена с помощью диаграммы Фейнмана (см. рис. 33) и имела вид A26,11). Выделяя б-функцию, напишем амплитуду перехода в виде М = М2164 (Л + *i - Р2 - Ы A27,1) 1) См., например, А. И. Ахиезер и В. Б. Берестецкий, Квантовая электродинамика, «Наука», 1969.
520 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ [ГЛ. XIV Y (Px + hY + m2 iPi-hY + m2 J Вероятность комптон-эффекта дается формулой Pii -1 Af2i I2 (б4 (р, + *! - Л - fea) J. A27,2> Для того чтобы исключить квадрат б-функции, удобно вос- воспользоваться определением четырехмерной 6-функции е1?* d4x. В точке р = 0, которая только и играет существенную роль,, как видно из A27,2), четырехмерный интеграл равен B .4 VT, где V — нормировочный объем, а Г — время процесса. Выби- Выбирая V за единицу, для вероятности Р21 перехода в единицу вре- времени имеем Р21 =-jrPii =-^1 М21 |2б4(р, + *i - А- Аа). A27,3> Конечное состояние системы определяется импульсами элек- электрона р2 и рассеянного фотона k2. Число конечных состояний в интервале импульсов dp2 и dk2 дается обычным соотношением р2 2 . Вероятность перехода в интервал конечных состоя- ний dp2dk2 напишется в виде dW2i =-щт\М21 |264(Pi + k{ ~p2- k2)^0-. A27,4). Четырехмерная б-функция выражает закон сохранения энер- энергии и импульса k k2. A27,5) Из этого соотношения легко определить частоту рассеянного» фотона как функцию угла рассеяния О, т. е. угла между век- векторами k\ И ft2, но р2вр2_?2в _m2ep? ?2 = ?2-CD2 = fe2 = 0 и следовательно, pik\ = p2k2. Пользуясь A27,5), имеем Предположим для простоты, что электрон первоначально по» коился: pi = О F, = т После простых выкладок [ср. A7,11)>
<§ 127] КОМПТОН-ЭФФЕКТ 521 ч. II] находим ^A27,6) ^-0- cos О) т Интегрируя A27,4) по трем компонентам импульса, получаем Q. A27,7) Проинтегрируем это выражение по частоте сог. При этом нужно помнить, что энергия Е2 также является функцией сог: Е2 = Ут? + р\ = 1\fm2 + {kl-k2J = Vm2 +0J +со^-гсо,^ cos О. Введем новую переменную у = Е2 + оог: Интегрируя по у, имеем 1 A27,9) д<й2 НО ду д (Е2 4- 002) i , 1 / л „ л\ /ют ш\ = — = 1 -J—=— ^002 — OOj COS ХГ). (lZ/, iU) Так как берется значение оог, удовлетворяющее закону со- сохранения энергии, то, подставляя A27,6) в A27,10), для ве- вероятности перехода A27,9) находим Сечение процесса мы получим, деля вероятность перехода на плотность потока падающих фотонов. При нормировке 1 фотон в объеме V = 1 плотность потока численно равна скоро- скорости света с. В выбранной нами системе единиц с = I и эффек- эффективное сечение получается численно равным" dW2\. Полагаем также [см. A26,11)] где Выражение для оператора Q можно несколько упростить, если учесть, что (pi + hf + m>^p\ + k\ + 2piki + m2 = 2piki = М2Х = /е2 (g!>!_ (а (р2) Qu (р{)), 2т у Ш\Щ
522 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ [ГЛ. XIV Аналогично для знаменателя второй дроби можно написать: (pi — feJ + т2 = pi + kl — 2p\k2 + т" = — 2/?i&2 = 2со2т. Тогда для Q имеем i(P{~lf~m е2-е2 ЧР*+Ы~т g,], A27,12> Соответственно дифференциальное эффективное сечение равно- е2 где г0 = классический радиус электрона. Полученное выражение описывает процесс, в котором элек- электрон и фотон в начальном и конечном состояниях имеют вполне определенную поляризацию. Если электроны в начальном со- состоянии не поляризованы, а поляризацией конечного состояния мы не интересуемся, то эффективное сечение должно быть усреднено по спиновым состояниям электрона в начальном со- состоянии и просуммировано по конечным спиновым состояниям. Следовательно мы должны определить величину <Г2 (У, "iWl = _ r2 ^LL 2j {uo2$Quo) iuofi+$uo) > A27,14) 8 m(Oi alta» где uffl9 tia9 — состояния с определенной поляризацией. Напри- Например, (sp2) Uo2 = а21 р21 tiav т. е. (Тг — проекция спина на направле- направление движения, а2 = ±1/2. Оператор s определен в § 117. Сумму по сгь входящую в A27,14), удобно переписать в виде |Q+p|<т2). A27,15) Суммирование ведется по двум спиновым состояниям о\ с положительной энергией. Если бы суммирование проводилось и по состояниям с отрицательной энергией, т. е. по всем воз- возможным состояниям (при данном импульсе), то выражение A27,15) существенно бы упростилось и представляло бы собой матричный элемент ((T2|PQQ+P|ci2) [в соответствии с прави- правилом перемножения матриц D5,6)]. Для того чтобы распространить суммирование на все че- четыре промежуточные состояния, в расчетах подобного типа при- применяется следующий вычислительный прием: вводится вспомо- вспомогательный оператор /?, получивший название проекционного^
$ 127] КОМПТОН-ЭФФЕКТ 523 оператора *~ 2|?| "" Действие этого оператора на функции и и v, отвечающие положительным и отрицательным энергиям, определяется ра- равенствами JL±liLu-u. Заменяя в формуле A27,15) функцию uGl на функцию UPl 2 Г? I Ц(Т>> мы можем Ф°Рм^льно распространить сум- суммирование и на состояния с отрицательной энергией, так как при наличии проекционного оператора последние, в соответ- соответствии с A27,17), не вносят никакого вклада в результат. Вместо матриц а*, Р введем матрицы у^: (?= 1, 2, 3), Подставляя матрицы у^ в A27,16), получим R = — 4e ('ViiPi* - m) y4 e - ^(Ф - w) Y4• A27,18) Сумму A27,15) можно переписать в виде Вычислим далее сумму по проекциям спина в конечном со- состоянии электрона с^. Здесь также удобно перейти к суммиро- рованию по всем четырем состояниям, введя проекционный опе- оператор /?2 2 (+МА+Л) A27,20) Суммирование ведется как по состояниям с положительной, так и по состояниям с отрицательной энергией. Мы видим, что выражение A27,20) представляет собой сумму диагональных матричных элементов, т. е. 5 = Sp (y4Q?iQ+Y4&2) = Sp №{Я+уЛу4)> A27,21) так как под знаком Sp можно производить циклическую пере- перестановку матриц, что легко непосредственно проверить. Под- Подставляя это выражение в A27,14) и учитывая, что у%= 1, pj = O, ?{ = m, получаем - 9 +Y4 (/j92 - m)\. A27,22) = ^Г r o -? m со,
524 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ [ГЛ. XIV Для любого оператора вида Л, у которого четвертая ком- компонента является мнимой, а три — вещественными, выполняется следующее равенство: А+уА = -А. A27,23) Для произведения операторов соответственно имеем у4А + В >С+у4 = у4А+у4у4В+у4у4С+у4 = (- А) (- В) (- С). A27,24> Тогда выражение Y4<3+Y4 перепишется в виде . A27,25) Просуммируем теперь эффективное сечение по конечным со- состояниям фотона и усредним по начальным состояниям. Чтобы вычислить эффективное сечение для случая, когда падающий фотон поляризован по оси 1, а рассеянный — по оси 2, в выра- выражение A27,12) для Q следует подставить значения ё\ — у\ и ё2 = Y2- Поскольку, однако, падающие фотоны не поляризованы, а поляризацией рассеянных фотонов мы не интересуемся, та следует вместо ё\ подставить yv> a вместо ё2 подставить у^ и просуммировать по всем значениям индексов v и \х. Тогда имеем /72 —-^-Ym, (i (Pi + h) - m) yv] (ip{ - m) [-^ y^ (i (p{ - k2) - m) yv - A27,26) причем по дважды повторяющимся индексам ц и v проводится суммирование. Хотя свободный фотон может быть поляризован по двум на- направлениям, перпендикулярным к направлению движения, сум- суммирование по \1 и v фактически можно проводить по всем четы- четырем значениям. Это связано с тем, что не существует реальных фотонов, поляризованных по направлению движения и по вре- временной оси и их формальный учет не изменяет окончательного результата J). ]) См., например, А. И. Ахиезер, В. Б. Берестецкий, Квантовая электродинамика, «Наука», 1969.
§ 127] КОМПТОН-ЭФФЕКТ 525 Соотношение A27,26) удобно переписать в виде da = — rg _^- (Sp F{ + Sp F2\ A27,27) где Fl = [~k Yv (/^2 — m> Yn — "^7 Y^x (tyi - m) Yv] (Ф1 - m) X X [yu— (^2 — ^)Yv](^2 — m)> A27,28) Выражение для F^ получается из Fi заменой Для дальнейших расчетов удобно пользоваться формулами Фейнмана, которые легко проверяются непосредственным вы- вычислением: YvYv = 4, 2Л A27,29) = - 2А3А2А{. Используя эти выражения, легко провести суммирование по \х и v в A27,27). Так, полагая F\=F'i + F", найдем: = 4 SP 0& - го) (^! + 2т) (Ц2 - т) (ф2 + 2т)}, A27,30) @2 Sp {[2/ (q{q2) p{ + mq2p{ - /т^2 (/^ - т) - - /т^! (ifa -m) + m2 {iqx + 2т)] {ip2 - т)}. A27,31) При вычислении шпуров нужно пользоваться следующими правилами: 1) шпур от произведения нечетного числа векторов Л равен нулю;
526 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ [ГЛ. XIV 2) шпур от скалярной величины равен ее учетверенному зна- значению; 3) SpAlA2 = 4(AlA2)\ 4) SpАХА2А3АА = 4{(Л1Л2)(А3АА) + (АХАА)(А2А3) -(А{А3)(А2АА)}. A27,32) Первые два правила тривиальны. Правило 3) и 4) легко доказать, используя тождество Л, Л2 + А2АХ = 2 (Л, Л2). A27,33) Если от левой и правой частей взять шпур и провести под знаком шпура циклическую перестановку векторов Ах и Л2, то сразу получим правило 3). Найдем шпур А{А2А3АА. Поль- Пользуясь приведенным тождеством A27,33), имеем Sp АХА2А3АА = - Sp А{А2ААА3 + 2 Sp АхА2 (А3АА) = = Sp Ах ААА2А3 - 2 Sp (Л2Л4) АХА3 + 8 (Л {А2) (А3АА) = с=-5рЛ4Л1Л2Л3+25рЛ2Л3(Л1Л4)-8(Л2Л4)(Л1Лз)+8(Л1Л2)(Л3Л4) = - - Sp А{А2А3А4 + 8 (А2А3) {А,АА)^{А2АА) (ЛИз) + 8 (А{А2) (А3АА). Из этого равенства получаем правило 4). С помощью сформулированных правил находим: Sp F[ - i| {2 (q2Pl) (q2p2) - (^ + 4m2 (q2p2) A27,34) Производя указанную выше замену, получаем из этих вы- выражений Sp F2. Выполняя необходимые преобразования, после нескольких длинных, но простых вычислений приходим к известной фор- формуле Клейна — Нишины: Ш B-+¦? -sin2 которая играет важную роль в приложениях. При малых энергиях фотона coi <С га, сог = coi [см. A27,6)] и формула A27,35) в пределе сводится к классической формуле Томсона полученной в § 36, ч. I.
§ 128] ЛЭМБОВСКОЕ СМЕЩЕНИЕ 527 § 128. Смещение термов атома водорода под влиянием поля вакуума (лэмбовское смещение) Важность расчетной методики Фейнмана не сводится, разу- разумеется, к упрощению и стандартизации вычислений. Как мы указывали уже в § 124, формализм Фейнмана позво- позволил в наглядной форме получить решение ряда важных задач квантовой электродинамики. К ним относится, в частности, упо- упомянутое выше лэмбовское смещение атомных термов. Явление лэмбовского смещения дает весьма наглядную ил- иллюстрацию правильности тех представлений, которые были по- положены в основу квантовой теории излучения и теории пози- позитрона. В квантовой теории излучения принималось, что в пустом пространстве, вакууме, имеется электромагнитное поле. Это то поле, которое отвечает нулевым колебаниям осцилляторов поля. Часто говорят, что совокупность осцилляторов электромагнит- электромагнитного поля, находящихся в состояниях с нулевой энергией, пред- представляет «электромагнитный вакуум». В электромагнитном ва- вакууме, отвечающем состоянию поля с наименьшей энергией, имеется некоторая, отличная от нуля напряженность поля. Точ- Точнее говоря, средние (по времени) значения квадратов напряжен- напряженности полей {&J и (ЖJ отличны от нуля. Существование поля вакуума не сказывалось на явлениях излучения, поглощения и рассеяния, которые были рассмотрены в гл. XIII. Все эти явления были связаны с переходами осцил- осцилляторов поля из невозбужденных (нулевых) состояний в воз- возбужденные и обратно. Поэтому в течение ряда лет свойства электромагнитного вакуума не были связаны с непосредственно наблюдавшимися явлениями. В теории позитронов предполагается, что наряду с электро- электромагнитным вакуумом существует электронно-позитронный ва- вакуум, или фон заполненных состояний с отрицательными энер- энергиями, о котором подробно было сказано в § 116. Оказывается, что существование электромагнитного и электронно-позитрон- ного вакуума непосредственно проявляется не только в процес- процессах, происходящих при больших энергиях (например, в комптон- эффекте или в процессе образования пар), но и в особенностях поведения микрочастиц при малых энергиях, в частности в яв- явлении лэмбовского смещения. Явление лэмбовского смещения может быть исследовано строго с помощью формализма Фейн- Фейнмана. Оказывается, однако, что этот эффект можно обсудить и без привлечения сравнительно сложного расчетного аппарата, на основе простых и наглядных соображений1). 1) См. статью Т. Велтона, Phys. Rev. 74, 1157 A948); русский пеое- вод см. в сборнике «Вопросы причинности в квантовой механике», ИЛ, 1955,
528 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ [ГЛ. XIV Для этого прежде всего обсудим вопрос о том, какое зна- значение может иметь среднеквадратичное значение напряженно- напряженности поля в произвольной точке вакуума. Для вычисления среднеквадратичной напряженности поля в вакууме рассмотрим нормировочный объем Vo. Нулевое коле- колебание с частотой со имеет энергию -у-. Можно написать оче- очевидное равенство где <Уосй и <5#оо> — амплитуды напряженностей поля в вакууме, отвечающего нулевым колебаниям с частотой со; черта означает усреднение по периоду колебания. Равенство A28,1) позволяет найти среднеквадратичную амплитуду нулевых колебаний поля с частотой со: ^ ' A28,2) Рассмотрим электрон в атоме водорода. На этот электрон действует кулоновское поле ядра и флуктуации нулевого поля вакуума. Поэтому на орбитальное движение электрона будет налагаться хаотическое движение под действием поля вакуума. Пусть U (г) означает потенциальную энергию электрона, на- находящегося в точке г. Предположим теперь, что координату электрона можно написать как г = Го + г\ где Го — обычное значение координаты электрона, плавно изменяющееся при его орбитальном движении, и г' — его малое смещение под дейст- действием случайной силы — флуктуирующего поля. Тогда изменение средней потенциальной энергии электрона, испытывающего слу- случайные смещения, может быть представлено в виде (MJ) = (U (го + г') - U (ro)> ~ (х>Ж+±{хЮ -М = 1V2:/ ((xtf) = | (V2f7) ((/-О2). A28,3) Здесь скобки ( ) означают среднее по всевозможным значениям случайной величины г/. При усреднении мы учли, что (xfi = О, а в силу пространственной изотропии случайных смещений <^> Значение потенциальной энергии в множителе V2 берется, оче- очевидно, при значении г = г0. Потенциальная энергия электрона в атоме без возмущения со стороны поля вакуума не зависит от состояния последнего и знак в ней опущен.
128] ЛЭМБОВСКОЕ СМЕЩЕНИЕ 529 В кулоновском поле протона для V2U(r0) можно написать так что <?/> = U (г0) + 2*. 6 (г0) <г'2>. A28,4) Для получения смещения атомного терма мы должны взять среднее значение от A28,4) по состоянию электрона в атоме. Тогда имеем = <?/>-?/ (го) = = -f- е> J б (г0) | Ъп (го) I2 (r'>) dVOi A28,5) где г|)п — волновая функция электрона в атоме. Пользуясь свой- свойством 6-функции, находим ДЯлэмб = ЩГ) = -х е> | фя @) р V2). A28,6) Вычисление (г/2) среднего квадратичного смещения электрона под действием нулевых колебаний поля может быть выполнено сравнительно просто, если учитывать лишь относительно низкие частоты колебаний поля. Будем считать, что смещение электрона под действием поля происходит независимо от орбитального движения. Не учитывая релятивистских эффектов, можно написать уравнения движения в виде d2/ т -~ = е&ьъ sin {kr - Ы), откуда и соответственно (КУ) = 'ШМ9** = ~riWV^> A28,7) где черта означает усреднение по времени. Здесь г© означает смещение под действием нулевых колебаний поля с частотой со. Так как нулевые колебания с разными частотами являются независимыми, их вклад в полное среднеквадратичное смеще- смещение электрона находится простым суммированием. Мы можем, следовательно, написать для полного среднеквадратичного сме- смещения выражение "min
530 НЕКОТОРЫЕ ВОПРОСЫ КВАНТОВОЙ ЭЛЕКТРОДИНАМИКИ [ГЛ. XIV где интегрирование ведется по всевозможным частотам нуле- нулевых колебаний. Если бы не существовало электронно-позитронного вакуума, то частоты нулевых колебаний поля могли бы принимать как угодно большие значения и полученная формула не имела бы никакого смысла. Оказывается, однако, что при частотах больших, чем мини- 2тс2 мальная частота рождения пар ©i = —g—> возникает взаимо- взаимодействие между нулевыми колебаниями поля и заполненным фоном отрицательных энергий (электромагнитным и электрон- но-позитронным вакуумом). Это взаимодействие наглядно можно представить себе как взаимодействие между флуктуа- циями «тока», связанного со случайным смещением электрона с положительной энергией и флуктуациями «токов», связанных со случайными смещениями электронов фона заполненных со- состояний, вызванных действием нулевых колебаний электромаг- электромагнитного вакуума. Поскольку в силу принципа Паули все элек- электроны стремятся находиться в удалении друг от друга (ср. § 67), оказывается, что флуктуации электронов фона находятся в про- противоположной фазе по отношению к флуктуациям электрона с положительной энергией. В результате происходит их взаим- взаимное погашение, и среднеквадратичное смещение электрона ока- оказывается значительно меньшим, чем даваемое формулой A28,7). Упрощая истинное положение вещей, можно сказать, что при частотах больших coi среднеквадратичное смещение электрона обращается в нуль. Поэтому в качестве верхнего предела интегрирования в A28,7') по частотам поля следует выбрать величину <отах = а>1- При определении минимальной частоты o)min нужно учесть, что рассматриваемый нами электрон не является свободным, но связан в атоме. Частота а)т\п по порядку величины равна ридберговской ча- частоте электрона в водородном атоме, т. е. где R — постоянная Ридберга, равная -т^др» ?"о — энергия основного состояния атома. Пользуясь этими выражениями для COmin И СОтах» НаХОДИМ /,2ч 2е2П. 2тс* 2 е2 ( П \2. 2тс2 /iOqq\ и для сдвига терма находим ^J-и. A28,9)
§ 128] ЛЭМБОВСКОЕ СМЕЩЕНИЕ 531 Формула A28,9) показывает, что сдвиг уровней электрона в атоме водорода, связанный с воздействием на него вакуума, имеет место только в s-состоянии. Действительно, только в s-co- стоянии величина | 'фп @) |2 отлична от нуля. Это сдвиг всегда положителен — уровень в s-состоянии должен лежать выше, чем определенный по формуле A19,2). Вычисление Д?Лэмб имеет абсолютный характер, и его чис- числовое значение (с некоторыми дополнительными поправками, -не учтенными в приведенном упрощенном выводе) оказывается равным 1057,19 Мгц. Опытное значение этой величины оказа- оказалось равным 1057,77 ±0,1 Мгц. Идеальное совпадение рассчи- рассчитанного и измеренного значения лэмбовского смещения является наглядным подтверждением развитых общих представлений о реальности «вакуума». Совершенно аналогичные расчеты, на которых мы не оста- останавливаемся, позволили найти упомянутую выше поправку к магнитному моменту электрона (см. цитированную статью Велтона). Особенно важным было решение в квантовой элек- электродинамике ряда принципиальных проблем. Удалось построить количественную теорию, позволяющую с любой степенью точ- точности рассчитывать вероятности всевозможных процессов свя- связанных с взаимодействием электронов между собой и с элек- электромагнитным полем. Принципиальные трудности теории, связанные с расходя- расходящимися выражениями, например часто упоминавшаяся труд- трудность обращения в бесконечность собственной массы (или энер- энергии) электрона, удалось до известной степени устранить. В вы- выражениях для собственной энергии частицы и сходных с ним соотношений удалось выделить конечные наблюдаемые вели- величины, тогда как расходящимися выражениями описываются лишь принципиально не наблюдаемые величины. Эта процедура, получившая название перенормировки, не может быть здесь проведена, и мы отсылаем читателя к спе- специальной литературе, например неоднократно цитированным монографиям С. Швебера, Г. Бете, Ф. Гофмана или А. И. Ахие- зера и В. Б. Берестецкого.
ГЛАВА XV ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ § 129. Элементарные частицы и их свойства В настоящее время открыто большое число (порядка двух- двухсот) элементарных частиц, которые способны превращаться друг в друга, но не состоят, в обычном смысле этого слова, из более мелких элементов. Все их можно разделить на две боль- большие группы — стабильные и короткоживущие (резонансы). Пер- Первый термин является весьма условным, так как в группу ста- стабильных частиц наряду, например, с электроном, который жи- живет бесконечно долго, входит и я°-мезон, время жизни которого порядка 106 сек. Стабильность понимается лишь в том смысле, что соответствующие частицы живут гораздо дольше характер- характерного времени 104—10~23 сек, за которое световой сигнал про- проходит типичное для «размеров» элементарных частиц расстоя- расстояние 103 см. Стабильные частицы разбиваются на следующие четыре класса: 1) класс фотонов, включающий кванты классических полей; сюда относится сам фотон — квант электромагнитного поля, и иногда гравитон — квант гравитационного поля; 2) класс лептонов (легких частиц) содержит электрон, мюон, который раньше неудачно называли [л-мезоном, два нейтрино (электронное и мюонное) и четыре соответствующие антича- античастицы; электронное нейтрино образуется при распаде нейтрона, а мюонное нейтрино — мюона: п -> р + е~ + ve; \i~ -> е~ + ve + v^ (тильда отличает античастицы от соответствующих им частиц),* 3) в класс мезонов (частиц средней массы) входят Зя-мезона (я~ является античастицей к я+, а частицы и античастица для я0 тождественны), 4/С-мезона (две частицы и две античастицы) и 1т]-мезон (являющийся сам себе античастицей); 4) класс барионов (тяжелых частиц) содержит два нуклона (протон и нейтрон), 1Л-гиперон, 32-гиперона, 25-гиперона, lQ-гиперон и соответствующие им античастицы (см. табл. на стр. 594—595).
§ 129] ЭЛЕМЕНТАРНЫЕ ЧАСТИЦЫ И ИХ СВОЙСТВА 533' Само название «резонанс» возникло в связи с тем, что све- сведения о короткоживущих частицах первоначально были по- получены из опытов с рассеянием. Наблюдались характерные резонансные максимумы в полном сечении при определенных значениях энергии рассеивающихся частиц. Так, например, в опытах с рассеянием я-мезонов было обнаружено существование- р-мезона. В группу короткоживущих частиц входят только барионные и мезонные резонансы — всего более 150 частиц. Среди них наиболее важными являются мезоны соA), срA), рC), К* D), и барионные резонансы Д12звD), 2i38sC), Hi53oB) со своими ан- античастицами. Кроме того, интересен /-мезон, теоретически пред- предсказанный И. Я. Померанчуком и впоследствии обнаруженный экспериментально. Совокупность всех мезонов и барионов и их резонансов об- образует большую группу частиц, которые в настоящее время на- называются адронами. Начинает входить в научный обиход и тер- термин аденоны, относящийся к лептонам и фотону. Перечислим кратко основные свойства элементарных ча- частиц. 1. Каждая частица обладает массой покоя, которая изме- измеряется в мэвах. Диапазон значений масс различных частиц весьма широк —от 0 (фотон и нейтрино) до 3000 мэв и выше (Аз2зо)- Первоначальная классификация частиц (разбиение на четыре указанных класса) была основана именно на значениях их масс. Но оказалось, что этот признак, как и масса атомов в периодической системе элементов, является достаточно слу- случайным. Особенно ясно это видно на примере резонансных со- состояний. 2. Важной характеристикой частицы является значение ее спина о. Фотон имеет спин 1 (с некоторыми оговорками, так как его масса покоя равна нулю). Лептоны обладают спином 1/2, стабильные мезоны — спином 0, барионы (кроме Q) — спи- спином 1/2, Q-гиперон — спином 3/2. Среди резонансов имеются частицы со значениями спина от 0 до 19/2. Спин выписанных выше мезонных резонансов (кроме /) равен 1, барионных резо- резонансов— 3/2, спин /-мезона равен 2. Согласно теореме Паули — Людерса, которая доказана на основе самых общих принципов, не зависящих от конкретной динамики, спин частицы однозначно определяет тип статистики: частицы с полуцелым спином (леп- (лептоны, барионы и барионные резонансы) подчиняются статистике Ферми — Дирака, а частицы с целым спином (фотон, мезоны и мезонные резонансы) — статистике Бозе — Эйнштейна. Кроме того, спин частицы определяет трансформационные свойства ее волновой функции по отношению к собственным преобразова- преобразованиям Лоренца. Частицы со спином 0 описываются (псевдо)
534 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV скалярной волновой функцией, со спином 1/2 — спинорной вол- волновой функцией, со спином 1—(псевдо) векторной волновой функцией и т. д. 3. Четность Я-частицы определяет трансформационные свой- свойства волновой функции относительно преобразования простран- пространственной инверсии. Все стабильные мезоны имеют отрицатель- отрицательную четность, и обладая спином 0, описываются псевдоскаляр- псевдоскалярной волновой функцией. Мезонные резонансы спина 1 (со, ср, р, К*) также имеют отрицательную четность; так как при про- пространственной инверсии компоненты вектора меняют знак, то волновая функция этих частиц является векторной. Четность /-мезона положительна. Бариоиам и их резонансам можно при- приписать только относительную четность. Если по определению принять, что четности протона, нейтрона и Л-гиперона положи- положительны, то четности всех перечисленных выше барионов и их резонансов будут также положительными, а четности антиба- рионов — отрицательными. 4. Каждая частица характеризуется величиной электриче- электрического заряда, который (заряд электрона принимается равным —1) может принимать лишь целочисленные значения. В на- настоящее время известно множество нейтральных частиц и ча- частиц с зарядом, равным по абсолютной величине единице. За- Заряд шести частиц (Д-резонансов) равен +2. 5. Для характеристики элементарных частиц вводятся леп- тонное число L и барионное число В. По определению, для леп- тонов L=+l, 6 = 0, для антилептонов L = — 1, В = 0, для барионов L = 0, В = +1, для антибарионов L = 0, В = —1, для мезонов и фотона L = В = 0. Во всех реакциях с участием эле- элементарных частиц эти квантовые числа сохраняются, что и обусловливает их важность. 6. Все адроны разбиваются на небольшие семейства, члены которого обозначаются одним символом (например, п). Эти семейства называются изомультиплетами. Частицы, входящие в их состав, обладают примерно одинаковыми массами, но имеют разные заряды. Каждому изомультиплету приписывается определенное значение изоспина 7\ который определяет число членов мультиплета Таким образом, изоспин нуклона и К-мезона равен 1/2, изо- спин 2-гиперона и я-мезона равен 1, изоспин Д-резонанса ра- равен 3/2 и т. д. 7. Различные частицы, входящие в состав одного изомульти- плета, отличаются друг от друга значениями проекции Г3 изо- спина на воображаемую третью ось фиктивного изопростран- ства. В зависимости от значения изоспина Г, его проекция Г3
§ ВО] ТИПЫ ВЗАИМОДЕЙСТВИЯ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ 535 может принимать целые или полуцелые значения. Понятие изо- спина первоначально было введено лишь для нуклона и пиона. В этом случае Г3 следующим образом связано с величиной электрического заряда частицы: Q = r3+1/2(S). A29,1) 8. После открытия К-мезонов и гиперонов (так называемых странных частиц) возникла необходимость в модификации пре- предыдущей формулы: Qrl/2(fi S) A29,2) (соотношение Гелл-Манна — Нишиджимы). Новое квантовое число S получило название странности. В широком круге явле- явлений, например, в реакциях рождения адронов, странность со- сохраняется, что сразу же позволило объяснить некоторые непо- непонятные особенности этих процессов (скажем, то, что странные частицы всегда рождаются парами). В последние годы вместо странности физики предпочитают использовать другое кванто- квантовое число — гиперзаряд У, тесно связанный с 5: Y = B + S. A29,3) На некоторых других квантовых числах, которые вводятся для характеристики элементарных частиц (временная и за- зарядовая четности, G-четность, мюонный заряд и т. д.), мы оста- останавливаться не будем. § 130. Типы взаимодействий элементарных частиц Элементарные частицы могут участвовать в самых различ- различных взаимодействиях: частица аннигилирует с античастицей, при столкновении быстрых частиц происходит их рассеяние и рождаются новые частицы, многие частицы нестабильны и рас- распадаются и т. д. В настоящее время известно четыре типа взаи- взаимодействия элементарных частиц, резко различающихся друг от друга интенсивностью и другими свойствами. 1. Электромагнитное взаимодействие — взаимодействие за- заряженных частиц с фотонами, а через их посредство и друг с другом. За счет виртуальных процессов в электромагнитном взаимодействии могут принимать участие и нейтральные части- частицы. Примерами реакций, которые вызывают электромагнитное взаимодействие, являются превращения: е" + е+ —> 2y; Y + е~ ~^ Y + е~ (комптон-эффект) я°->2у; 2°->Л + у и т- Д- Электромагнитное взаимодействие имеет бесконечный радиус действия; для реакций, которые оно вызывает, характерны.
536 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV времена 10~16—104 сек. Интенсивность электромагнитного взаи- взаимодействия определяется зарядом частицы или безразмерной константой связи, в качестве которой в данном случае высту- выступает постоянная тонкой структуры Ее малость позволяет рассматривать электромагнитное взаимо- взаимодействие как возмущение, чем и объясняются успехи квантовой электродинамики (см. гл. XIV). 2. Сильное взаимодействие — взаимодействие адронов, от- ответственное за их рассеяние, за реакции образования и за рас- распады резонансов. Типичные примеры: я + N -* я + N; я~ + р -> S" + К+; Л —> N + я; р —> 2я. Сильное взаимодействие является короткодействующим — ра- радиус действия порядка 10~13 см; для него характерны времена 10-24—ю-23 сек. Интенсивность сильного взаимодействия харак- характеризуется определенной величиной g, являющейся аналогом электрического заряда. Для взаимодействия я-мезонов с нукло- нуклонами безразмерная константа связи равна g2/hC с* 14, так что сильное взаимодействие на три порядка интенсивнее электромагнитного. Поэтому при его анализе теория возмуще- возмущений непригодна. Законченной теории сильных взаимодействий до сих пор не существует. 3. Слабое взаимодействие ответственно за медленные рас- распады элементарных частиц, например, р -> п + е~ + ve; \i~ -> e~ + ve + v^; К+ -> я+ + я0 (9-распад); К+ -> я+ + лг + я+ (т-распад). Оно же в принципе может вызывать и другие реакции (напри- (например, рассеяние нейтрино на электроне), но подобные процессы имеют чрезвычайно малые сечения и экспериментально не на- наблюдались. Слабое взаимодействие еще более короткодействую- короткодействующее, чем сильное (возможно, что радиус его действия имеет порядок 10~17 см); характерные времена равны-Ю0—10~6 сек. Для характеристики интенсивности слабого взаимодействия нельзя ввести столь же естественную безразмерную комбина- комбинацию, как это было в предыдущих случаях. Это связано с тем, что аналог электрического заряда, так называемая фермиевская константа G, имеет размерность, отличную от размерности е.
§ 130] ТИПЫ ВЗАИМОДЕЙСТВИЙ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ 537" В безразмерную константу слабого взаимодействия обязатель- обязательно должна входить некоторая масса. Если взять массу я-ме- я-мезона, то 4 т. е. слабое взаимодействие примерно на 11 порядков менее интенсивно, чем электромагнитное. Тем не менее, строго го- говоря, теорию возмущений в этом случае применять нельзя, так как слабое взаимодействие неперенормируемо. 4. Гравитационное взаимодействие характеризуется чрезвы- чрезвычайно малой безразмерной константой связи кМ2/Ьс = 2 . КГ39 (и — гравитационная постоянная, М — масса нуклона), что по- позволяет не учитывать его на современном этапе развития тео- теории элементарных частиц. Перечисленные взаимодействия различаются не только ин- интенсивностью, но и свойственными им законами сохранения, что по-видимому, является даже более существенным. Во всех взаи- взаимодействиях сохраняется энергия — импульс, угловой момент, электрический заряд и бариоиное и лептонное числа. Однако для изоспина Г, его проекции Г3, странности S (или гиперза- гиперзаряда У) и четности Р универсальных законов сохранения не существует. 1. Сильное взаимодействие наиболее симметрично — в обус- обусловленных им реакциях сохраняются все указанные квантовые числа. В частности, закон сохранения изоспина является вы- выражением зарядовой независимости: все члены одного изомуль- типлета по отношению к сильным взаимодействиям ведут себя одинаковым образом. 2. Включение электромагнитного взаимодействия нарушает эквивалентность частиц, входящих в один изомультиплет, так. как они обладают разными зарядами. По-видимому, именно она ответственно за существование небольшого различия в массах этих частиц. Так как включение электромагнитного взаимодей- взаимодействия выделяет определенное направление в изопространстве, то полный изоспин Т уже не будет сохраняться, но его проек- проекция Г3 еще сохраняется. Выполняются также законы сохране- сохранения странности S и четности Р. 3. Слабое взаимодействие наименее симметрично. В соот- соответствующих ему реакциях не сохраняется ни одно из четырех указанных квантовых чисел. В частности, больше не справед- справедлив закон сохранения четности. Мало того, слабое взаимодей- взаимодействие, по-видимому, не инвариантно и относительно обращения времени (см. § 122).
533 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV § 131. Группы симметрии в квантовой механике Мы уже подчеркивали, что сколько-нибудь последователь- Бая и законченная теория сильных взаимодействий до сих пор ле разработана. В частности, не сформулированы динамические уравнения, описывающие поведение частиц при сильном взаи- взаимодействии. Поэтому особую роль приобретает изучение общих свойств симметрии сильных взаимодействий, что позволяет дать удовлетворительную классификацию адронов и получить ряд количественных соотношений. В § 129 указывалось, что все адроны распадаются на не- небольшие семейства, изомультиплеты, которым можно приписать определенные значения изоспина Г. Члены данного мульти- плета различаются проекцией Г3 изоспина, определяющей ве- величину электрического заряда, и при «выключенном» электро- электромагнитном взаимодействии имеют строго одинаковые массы. В сильных взаимодействиях квантовые числа Т и Г3 сохра- сохраняются. С аналогичной ситуацией мы уже неоднократно встречались. Например, при движении нерелятивистской частицы в централь- центральном поле ее возможные состояния также группируются в опре- определенные семейства, которые характеризуются различными зна- значениями углового момента У. Волновые функции, принадлежа- принадлежащие одному семейству, различаются проекцией момента /з и соответствуют одной и той же энергии, т. е. образуют вырожден- вырожденный энергетический уровень. При движении частицы квантовые числа / и /з сохраняются. Для всех подобных случаев характерна инвариантность тео- теории относительно определенного класса преобразований в ре- реальном или в некотором фиктивном пространстве (в нашем квантовомеханическом примере — относительно пространствен- пространственных вращений). Их совокупность является замкнутой, т. е. по- последовательное применение допустимых преобразований приво- приводит снова к допустимому преобразованию. Кроме того, имеется единичное преобразование и каждому преобразованию соответ- соответствует обратное. Таким образом, преобразования инвариантно- инвариантности (симметрии) образуют группу. Ее элементы будут обозна- обозначаться через g\ а последовательное применение двух преобра- преобразований gi и #2 будет записываться в виде произведения g2g\ (именно в таком порядке). Легко видеть, что все пространствен- пространственные вращения образуют группу — трехмерную группу враще- вращений, обозначаемую как SOC). Другим примером группы мо- может служить совокупность преобразований Лоренца. Понятие инвариантности теории относительно данной груп- группы преобразований включает два аспекта: определенные транс-
§ 131] ГРУППЫ СИММЕТРИИ В КВАНТОВОЙ МЕХАНИКЕ 539 формационные свойства волновых функций ф и определенные трансформационные свойства гамильтониана Н. Относительно групповых преобразований g все гильбертово пространство волновых функций разбивается на инвариантные подпространства, т. е. существуют семейства волновых функций, которые по определенному закону преобразуются только друг через друга: Требуется, чтобы произведению g2gi элементов группы соответ- соответствовало произведение операторов u(g): A31,2) В этом случае говорят, что совокупность операторов u(g) обра- образует представление данной группы. Размерность подпростран- подпространства (максимальное число линейно независимых волновых функций), в котором действуют эти операторы, называется раз- размерностью данного представления. Если инвариантное подпро- подпространство не содержит инвариантных подпространств меньшей размерности, то говорят о неприводимом представлении. В про- противном случае представление называется приводимым. Сово- Совокупность волновых функций, преобразующихся по неприводи- неприводимому представлению группы симметрии, в дальнейшем мы будем называть мультиплетом. Из теории момента количества движения известно, что при пространственных вращениях сферические функции К/3@, ср),. соответствующие заданному моменту / и всевозможным его проекциям /з, преобразуются только друг через друга. Им со- соответствует неприводимое представление размерности 2/ + 1 группы SOC), т. е. все сферические функции, соответствующие моменту /, образуют 2/ + 1-мерный мультиплет группы вра- вращений. Рассмотрим требования, которые в инвариантной теории на- накладываются на трансформационные свойства гамильтониана. Подействуем на уравнение Шредингера оператором u(g) представления, по которому преобразуется волновая функция -ф. Предполагая, что u(g) коммутирует с опе- оператором d/dt (анализ более общего случая нам не потребуется) получим или ^ у. A31,4»
540 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV Инвариантность теории означает тождественность формы урав- уравнения Шредингера для исходной г|> и преобразованной я|/ волно- волновых функций, откуда или [Htu(g)] = 0. A31,5) Таким образом, требование инвариантности теории относитель- относительно преобразований из некоторой группы приводит к коммута- коммутативности гамильтониана со всеми операторами представлений этой группы. Ниже будут рассматриваться лишь так называеАмые группы Ли, элементы которых являются однозначными дифференцируе- дифференцируемыми функциями конечного числа действительных параметров. Последние выбираются так, чтобы их нулевым значениям соот- соответствовал единичный элемент. Таким образом, для группы Ли g = g(<*i> ..., ая); ?@, ..., 0) = /. A31,6) Число п всех независимых действительных параметров группы Ли называется ее размерностью. Если преобразование g беско- бесконечно мало отличается от единичного, т. е. является инфините- зимальным, то ему соответствуют бесконечно малые значения параметров а*. В этом случае, учитывая A31,6), можно на- написать так: k=\ = а =0 A31,7) Величины / • dg (cii,..., ctn) A31,8) (множитель —/ вводится для удобства), называемые генерато- генераторами группы, представляют собой квадратные матрицы, поря- порядок которых равен размерности пространства, в котором дей- действуют групповые преобразования. Генераторами группы вра- вращений являются 3-рядные матрицы Jx, Jy, /2, приведенные в E1,17). Чтобы в этом убедиться, достаточно взять матрицы ко- конечных поворотов вокруг соответствующих осей координат и воспользоваться определением A31,8). Операторы u(g) представления группы Ли зависят, очевид- очевидно, от тех же параметров а&. Учитывая, что единичному эле- элементу группы соответствует единичный оператор представления, можно записать u(g) = u(ai9 ..., ая); «@, ..., 0) = /. A31,9)
§ 131] ГРУППЫ СИММЕТРИИ В КВАНТОВОЙ МЕХАНИКЕ 541 Операторы представления размерности N, соответствующие ин- финитезимальным преобразованиям, имеют вид u(g)^I+%k duiai'-'an) dak а,-...-в„-0 При этом величины ,,a..,«n)| ^ k lai-...-an-0 называемые генераторами представления, являются N-рядными квадратными матрицами. Для группы вращений таковыми с точ- точностью до множителя й/2 являются операторы ?ХУ Jyy Г2 про- проекций момента. В частности, генераторы спинорного представ- представления совпадают с матрицами Паули [см. F1,13)]. Можно по- показать, что операторы u(g) данного представления, соответст- соответствующие конечным преобразованиям, имеют вид A31,12) [ср., например, формулы F1,13) и F1,12)]. В § 46 мы видели, что физическое содержание теории не изменяется лишь при унитарных преобразованиях волновых функций, что выделяет из множества всех представлений очень важный класс унитарных представлений, для которых и+и = ии+ = 1. A31,13) Из A31,13) и A31,10) имеем откуда Lt = Lk, A31,14) т. е. генераторы унитарного представления являются эрмито- эрмитовыми матрицами. Поэтому для инфинитезимальных преобразо- преобразований u(g)&I + i%akLk\ u+{g) = u-l{g)^I-iJZakLk. A31,15) Отметим еще, что для групп Ли соотношение A31,5), справед- справедливое в инвариантной теории, эквивалентно, очевидно, условию [Я,^] = 0. A31,16) Важность изучения групп симметрии в квантовой механике обусловлена тем, что при их наличии справедливы следующие результаты.
542 основы тнории элементарных частиц [гл xv 1. Существуют эрмитовы взаимно коммутирующие комбина- комбинации генераторов представления, которые коммутируют и с ними. Они называются инвариантными операторами, и их основным свойством является то, что на данном мультиплете эти опера- операторы кратны единичному (лемма Шура). Это означает, что все волновые функции одного мультиплета являются собственными функциями любого инвариантного оператора с одним и тем же собственным значением. Таким образом, возникает естественный набор квантовых чисел, число которых равно числу инвариант- инвариантных операторов, характеризующих мультиплет в целом. В груп- группе вращений имеется один инвариантный оператор /2 = = 1\ + Т2у + 71, так что в этом случае каждый мультиплет ха- характеризуется значением момента /. 2. Среди генераторов представления может быть несколько взаимно коммутирующих. Их число определяется свойствами группы и называется ее рангом. Базисные функции мультиплета можно выбрать так, чтобы они были собственными функциями этих генераторов. Соответствующие собственные значения яв- являются квантовыми числами, классифицирующими волновые функции, принадлежащие данному мультиплету. В группе вра- вращений нет взаимно коммутирующих генераторов, т. е. ее ранг равен 1. Поэтому волновым функциям с данным моментом мож- можно приписать еще лишь одно квантовое число, например, значе- значение проекции /3. 3. Описанные генераторы и инвариантные операторы обра- образуют набор эрмитовых операторов, которые коммутируют друг с другом и с гамильтонианом [см. A31,16)]. Поэтому им соот- соответствуют сохраняющиеся и одновременно измеримые физиче- физические величины. Следствием инвариантности теории относительно пространственных вращений является сохранение момента / и его проекции /3. 4. Из сказанного следует, что если волновая функция на- начального состояния системы принадлежит некоторому мульти- мультиплету, то в результате реакции (рассеяния или распада) си- система перейдет в новое состояние, волновая функция которого будет принадлежать тому же мультиплету. Это устанавливает определенные правила отбора для реакций. 5. Из A31,16) и леммы Шура следует, что собственные зна- значения гамильтониана (значения энергии или массы элементар- элементарных частиц) для волновых функций одного мультиплета одина- одинаковы. Это объясняет наличие вырождения и позволяет устано- установить его кратность, которая равна размерности мультиплета. В теории, инвариантной относительно группы вращений, имеет место вырождение по /з, причем его кратность равна 2/+1.
§ 132] ИЗОГРУППА SUB) И ЕЕ ПРЕДСТАВЛЕНИЯ 543 § 132. Изогруппа SUB) и ее представления Существование адронных мультиплетов с описанными выше свойствами наводит на мысль, что сильное взаимодействие эле- элементарных частиц инвариантно относительно некоторой группы преобразований. Оказалось, что ею является группа Sf/B), ко- которая в дальнейшем будет называться изогруппой. С математи- математической точки зрения она тесно связана (почти эквивалентна) с группой вращений S0C). Группой SUB) называется совокупность всех унитарных и унимодулярных (детерминант разен 1) матриц второго по- порядка: g+g = gg+=I\ detg=l. A32,1) Унитарные матрицы второго порядка допускают полезную гео- геометрическую интерпретацию. Возьмем 2-мерное комплексное пространство векторов х, которые будем записывать в виде столбцов, и введем эрмитово сопряженные векторы х+: Рассмотрим в этом пространстве линейное преобразование x' = gx или xfi = g{xj A32,3) (верхний индекс нумерует столбец, нижний — строку, они про- пробегают значения 1, 2, причем по дважды повторяющимся индек- индексам подразумевается суммирование). Унитарные матрицы вто- второго порядка соответствуют матрицам преобразований A32,3), которые не изменяют квадратичную форму х+х = х1х. = х\х{ + х*2х2. A32,4) Согласно § 3 инфинитезимальную матрицу g можно записать как g^I + isaxa. A32,5) Здесь ха — генераторы группы SUB), а га — ее параметры, число п которых (размерность группы) подлежит определению. Требование унитарности матриц g приводит к эрмитовости ее генераторов та. Замечая, что с точностью до членов второго порядка малости по еа, для инфинитезимальной матрицы A32,5) 1 dts I +/eoSpTo> приходим к выводу, что след генераторов та равен нулю. Та- Таким образом, они являются 2-рядными квадратными матрицами
544 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV со свойствами т+ = та; SPTa = 0. A32,6) На восемь действительных параметров комплексной 2-рядной матрицы эти ограничения накладывают пять D плюс 1) усло- условий. Поэтому существуют три независимые матрицы со свой- свойствами A32,6), что и определяет размерность группы SUB). В качестве ее генераторов можно взять матрицы Паули, кото- которые эрмитовы и обладают нулевым следом: О 1\ /О -А /1 0\ j H op rHo -ij- A32'7) Среди них нет взаимно коммутирующих, так что ранг SUB) равен 1. Сумма квадратов матриц Паули коммутирует с каж- каждой из них: Ь2, та] = 0, где т2 = т* + х\ + т|. A32,8) Перейдем теперь к построению представлений группы SUB). 1. Простейшим является тривиальное представление. Его мультиплеты одномерны, т. е. содержат по одной волновой функции ф, которая не меняется при преобразовании A32,3): Ф' = Ф. A32,9) Размерность этого представления равна 1, а его генераторами служат числа 0. Такое представление называется скалярным, а ф — скаляром. 2. Рассмотрим 2-мерное пространство векторов фг-, которые преобразуются по тому же закону, что и векторы х: или Ч^^ + ^а^Ф/- A32,10) В результате возникают мультиплеты разномерности 2, члены которых преобразуются по представлению той же размерности. Из A32,10) следует, что его генераторами являются сами мат- матрицы та: (L){ (xa){. A32,11) Это представление называется спинорным, а величины ф^ — спи- спинором (ср. с формализмом, изложенным в гл. VIII). 3. Возьмем две величины ф2', которые преобразуются так же, как компоненты вектора х+: У«(Я+)}Ф' или У^(/-/еата)'ф>. A32,12) В результате получим 2-мерное представление, которое назы- называется сопряженным к спинорному. Его генераторами служат
§ 132J ИЗОГРУППА SUB) И ЕЕ ПРЕДСТАВЛЕНИЯ 545 матрицы Мв-М. A32,13) В действительности это представление эквивалентно спинор- ному, т. е. из величин фг можно образовать линейные комбина- комбинации, преобразующиеся по закону A32,10). Но его введение весьма удобно с формальной точки зрения. 4. Все остальные представления можно построить из спинор- ного и сопряженного ему. Рассмотрим совокупность 2(р + q) величин ф/ Д которые преобразуются как произведение р спиноров и q сопряженных спиноров, т. е. по закону P 71 Для инфинитезимального преобразования имеем '*': ¦¦'¦':ж{'+v-.)J ¦ • ¦ с+ с Я так что генераторы этого представления имеют вид V ;;... б)-<тв#а)+1... б'/. 71 75~1 7S 7S + 1 7^ Полученное таким способом представление называется прямым произведением р спинорных и q сопряженных ему представле- представлений. Символически A, 0)® ... ®A,0)® @, 1)® ... 0@, 1) (обозначения очевидны). Если функция ф/ tq симметрична по какой-то паре ниж- нижних (или верхних) индексов, то при преобразовании A32,13) это свойство сохраняется. Кроме того, неизменность квадратич- квадратичной формы A32,4) приводит к сохранению свертки по любой паре верхнего и нижнего индекса, т. е. величины типа ф;;;*";. Поэтому набор всех функций ф^.1 tQ распадается на отдельные 18 В. Г. Левич и др., том II
546 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV мультиплеты, члены которых преобразуются только друг через друга, т. е. построенное представление является приводимым. В данном случае условие неприводимости сводится к тому, что *fi'"[q Должны быть симметричными отдельно по всем м ••• 1р нижним и верхним индексам, причем свертка по любой паре нижнего и верхнего индекса обязана обращаться в нуль. Легко /..../. подсчитать число независимых величин ф/...* такого типа, т. е. определить размерность соответствующего неприводимого представления. Общее число нижних (верхних) индексов, рав- равных 1, может меняться от 0 до р (до q), при этом остальные индексы равны 2. При условии симметрии порядок следования индексов безразличен, так что число различных полностью сим- симметричных величин ф/...V равно (p+\)(q+\). Равенство нулю сверток накладывает на них pq условий, так что всего имеется независимых компонент. Описанное неприводимое представле- представление будет обозначаться символом (р, q), а его размерность — N(p> q). Имеем N(q) = p + q+l. A32,17) Подчеркнем еще раз, что верхние и нижние индексы эквива- эквивалентны, так что неприводимое представление определяется, по существу, полным числом индексов, которое равно р + q. Рассмотрим важный для дальнейшего пример прямого про- произведения спинорного произведения на сопряженное ему, т. е. представление A,0)® @, 1). Функции, преобразующиеся по этому представлению, образуют квадратную матрицу 2-го по- порядка. В соответствии с A32,13) 'ф? = ?Г(?+)И:. A32,18) Для инфинитезимальных преобразований A32,14) дает 'Ф>«(/+/еата);' (/ - VfOJ, фР = {W + К [ЮГ Ц - Ы\ A32,19) так что генераторы этого представления имеют вид Для его разложения на неприводимые представления достаточ- достаточно выделить из матрицы ф( ненулевой след, т. е. переписать ее
§ 132] ИЗОГРУППА SUB) И ЕЕ ПРЕДСТАВЛЕНИЯ 547 в виде }* • A32'21> Последнее слагаемое инвариантно относительно преобразований из группы 5(/B), т. е. является скаляром. След матрицы, стоя- стоящей в скобках, равен нулю. Она содержит три независимые компоненты, преобразующиеся по неприводимому представле- представлению размерности 3, которое называется векторным. Символиче- Символически разложение A32,21) записывается в форме A,0)® @, 1) = A, 1H@, 0). A32,22) Из A32,16) и A32,8) следует, что для группы SUB) инва- инвариантными операторами являются величины L2: [ZA La] = 0, где L2 = L\ + L\ + L\. A32,23) Используя A32,16) и A32,7) можно показать, что любая мат- матрица ф^.1 [ tq мультиплет цией оператора L2, причем у ( рица ф^.1 [ tq мультиплета (р> q) является собственной функ- функьЧ\:..* \\ - (р+?) (р+?+2) %\:;: \\. Собственные значения оператора L2 зависят только от типа мультиплета (точнее, лишь от его размерности) и служат его характеристикой. Для классификации базисных элементов мультиплета, в ка- качестве которых можно выбрать комбинации матриц ф/ .q лишь с одним ненулевым элементом, можно использовать соб- собственные значения диагонального оператора L$. Так как ранг группы SUB) равен 1, этого квантового числа достаточно. Из A32,16) и A32,7) заключаем, что если среди р нижних индек- индексов имеется р^, а среди q верхних индексов q2 индексов, рав- равных 2, то Соседние собственные значения генератора L%, соответствующие базисным элементам данного мультиплета, отличаются на 2. Из A32,25) видно, что минимальное из них равно —(p + q)> а максимальное +(/? + ^), так что всего имеется /? + g + 1 независимых членов мультиплета, и мы снова приходим к фор- формуле A32,17) для размерности неприводимого представления. 18*
548 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ XV § 133. Изомультиплеты элементарных частиц Предположим теперь, что сильное взаимодействие элемен- элементарных частиц инвариантно относительно группы SUB). Это означает прежде всего, что волновые функции адронов преоб- преобразуются по некоторым ее неприводимым представлениям, т. е. являются произведениями обычной волновой функции, завися- зависящей от пространственных координат и проекции спина, на изо- матрицу При этом отдельному адрону удобно сопоставлять такую волно- волновую функцию, в которой матрица ср.1 '"* является одним из 1 ••• р базисных элементов. Таким образом, все адроны оказываются размещенными по изомультиплетам, которые характеризуются собственными значениями инвариантного оператора L2. Внутри изомультиплета отдельные адроны классифицируются собствен- собственными значениями генератора L3. Вследствие предполагаемой инвариантности сильного взаимодействия относительно изогруп- пы во всех обусловленных им реакциях эти два квантовых числа будут сохраняться. Кроме того, должно иметь место кван- товомеханическое вырождение, т. е. массы частиц, принадлежа- принадлежащих одному изомультиплету, будут строго одинаковыми. При включении электромагнитного взаимодействия, которое считается неинвариантным относительно изогруппы, это вырождение сни- снимается и изомультиплеты расщепляются на отдельные частицы с несколько различными массами. Аналогом этому является, например, эффект Зеемана (§ 74), при котором наложение внеш- внешнего магнитного поля, нарушающего инвариантность относитель- относительно группы вращений, снимает имевшееся ранее вырождение уровней по проекции момента /z. Отметим, что для адронов, входящих в один изомультиплет, все квантовые числа (спин а, четность Р, барионное число В и странность S или гиперзаряд У), отличные от собственных значений L3, должны быть одинаковыми. Это следует из того, что соответствующие им операторы коммутируют с генерато- генераторами La, т. е. являются инвариантными операторами, и из лем- леммы Шура. Вместо генераторов La удобно ввести операторы которые называются операторами проекций изоспина. Тогда в качестве инвариантного оператора естественно взять оператор
<§ 133] ИЗОМУЛЬТИПЛЕТЫ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ 549 квадрата изоспина Г2 = Т\ + fi+fi = \L\ A33,3) Формулы A32,24) A32,25) теперь принимают вид такой: ::: \\= Квантовое число A33,6), классифицирует мультиплеты адронов и называется изоспином, а величина Гз—^-О*-*) A33,7) классифицирует базисные элементы изомультиплета, т. е. от- отдельные принадлежащие ему адроны. Она может принимать значения от —Т до +Т и называется третьей проекцией изо- изоспина. Формула A32,17) для размерности неприводимого пред- представления, т. е. для числа различных частиц, входящих в изо- мультиплет, принимает вид . A33,8) Для волновых функций, являющихся собственными функциями операторов Г иГ3 с собственными значениями Т и Г3, в даль- дальнейшем иногда будут использоваться дираковские обозначения |Г, 7з). Наконец, в соответствии с эмпирическим соотношением Гелл-Манна — Нишиджимы (§ 129), положим по определению, что оператором заряда служит Q = r3+^-/ = r3 + |/, A33,9) где /— единичный оператор в пространстве функций ф^1 \" (q . Выписанные соотношения указывают на тесную связь груп- группы SUB) с группой вращений SOC), при этом изоспин Т яв- является полным аналогом момента /. Эта связь позволяет исполь- использовать весь аппарат теории углового момента, изложенный в § 51—52. В частности, для фактического разложения прямого произведения представлений на неприводимые применим фор- формализм коэффициентов Клебша — Гордана (§ 52). Рассмотрим теперь конкретные изомультиплеты адронов. Протон и нейтрон обладают примерно одинаковыми массами я тождественны по отношению к сильным взаимодействиям. Они
550 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV образуют изодублет, т. е. их волновые функции имеют вид A33,10> Волновая функция нуклона записывается как При условии нормировки A33'П> A33,12> два слагаемых этого выражения, соответствующие протону и нейтрону, интерпретируются как вероятности обнаружения нуклона в протонном и в нейтронном состояниях. Спинорное представление имеет размерность 2, так что нуклонному изо- дублету следует приписать изоспин 1/2. Генераторами представ- представления являются матрицы та, так что проекции изоспина Г3 яв- являются собственными значениями оператора 1/2 (та). Для их нахождения можно воспользоваться формулой A33,7), но в дан- данном случае они легко определяются и непосредственно: l n 0 -1 1 О 2 V0 -1 так что для протона Т3 = +1/2, для нейтрона Т3 = —1/2. В соот- соответствии с A33,9), учитывая, что для нуклона В = \, S = 0, получим A33,14) так что Таким образом, заряды протона и нейтрона равны соответ- соответственно + 1 и 0, как это и должно быть. Изодублетами являются также В-гиперон, резонанс S1530» /С-мезон и мезонный резонанс /С*. Выписанные соотношения
§ 1331 ИЗОМУЛЬТИПЛЕТЫ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ 551 справедливы и для них, с тем лишь отличием, что для S-гипе- рона и его резонанса гиперзаряд У = —1(B=1,S =—2), так что для этих частиц оператор заряда равен /0 Таким образом, имеются следующие изодублеты адронов: Естественно считать, что волновые функции антипротона л антинейтрона преобразуются по представлению, сопряженному к нуклонному, т. е. |>„ 0)^05,0); *-)-«), Я). п/ Поэтому волновая функция антинуклона записывается в виде jV' = (p, ft). A33,19) Изоспин антинуклоиа также равен 1/2, но так как все генера- генераторы теперь изменили знак, Т3 = —1/2(тз), и поэтому для анти- антипротона Г3 = —1/2, для антинейтрона Г3=+1/2 (следует за- заметить, что, согласно правилам матричного умножения, на вол- волновую функцию, имеющую вид строки, операторы, являющиеся квадратными матрицами, действуют не слева, а справа). Оче- Очевидно, что оператор Q# заряда антинуклона равен —QN, так что антипротон имеет Q = —1, антинейтрон Q = 0. Все эти утверждения очевидным образом переносятся и на изодублеты других античастиц. Существует три я-мезона я+, я0 и я~ с примерно одинако- одинаковыми массами, тождественных по отношению к сильному взаи- взаимодействию. Естественно считать, что они образуют изотриплет, т. е. их волновые функции преобразуются по векторному пред- представлению, образуя некоторую матрицу второго порядка с ну- нулевым следом: я{ я2\ я1 я2 Г A33,20) Условие я] = 0 требует, чтобы я!=-4 A33,21)
552 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV Изотриплету соответствует изоспин Г=1. Воспользовавшись формулой A33,7), получим, что компоненте я} и я| соответ- соответствует Гз = 0, компоненте я~ — Г3=+1 и компоненте я^ — Г3= — 1. Так как для я-мезонов 5 = 5 = 0, то Q«-r8f A33,22) т. е. их заряды совпадают со значениями проекций Тъ. Поэтому я|=-я2~я°; я*~я+; я* ~ я~. A33,23) Потребовав, чтобы изоматрицы, входящие в состав волновой функции каждого я-мезона, были нормированы на единицу, т. е. образовывали ортонормированный базис изотриплета, и учиты- учитывая A33,20) и A33,23), для полной волновой функции я-мезона окончательно получим «- - Учитывая, что компоненты я{ преобразуются друг через друга по закону A32,18) и пользуясь свойствами унитарных унимо- дулярных матриц, нетрудно показать, что волновые функции Я+==Я2. яо = ^(я1_я2); Я- = Я1 A33,25) преобразуются как обычные компоненты трехмерного вектора, чем и объясняется название представления A,1). Поэтому вол- волновую функцию я-мезона можно записывать и в виде (п+\ я = 1 я0 I. A33,26) В таком формализме генераторами векторного представления и операторами проекций изоспина Г3 будут эрмитовы 3-рядные квадратные матрицы с нулевым следом. Используя E1,17), сра- сразу можно записать: 0 -/ 0
•§ 133] ИЗОМУЛЬТИПЛЕТЫ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ 553 Непосредственной проверкой убеждаемся, что, действительно, A33,28) Полученные результаты автоматически переносятся и на другие изотриплеты адронов: 2, 2i385, p. Так как в этих случаях У = О, то оператор заряда также имеет вид A33,22). Так как представление, сопряженное к A,1), совпадает с ним самим, а значит, совпадают и их* генераторы, то структура изотриплетов античастиц тождественна структуре матрицы A33,24). Например, /°// 2 (заметим, что заряд 2~ положителен, а 2+ отрицателен). Для я-мезонов не существует квантовых чисел, кроме проекции Г3, которые отличали бы частицы от античастиц (для 2-гиперона такими квантовыми числами являются барионное число и стран- странность). Поэтому античастицей по отношению к я+ является я~, и наоборот, а в случае я0 частица тождественна с античастицей. Именно этим объясняется, что для я-мезонов частицы и анти- античастицы входят в один изомультиплет, а скажем, 2 и 2 обра- образуют два разных изомультиплета. Аналогичная ситуация имеет место и в случае р-мезонов: ¦71/2" р+ \ . , причем р+ = р~; р~ = р+; р° = р°. р- -p7l/2/ A33,30) Четыре нуклонных резонанса Д++, Д+, Д° и Д~ образуют изо- квартет, т. е. их волновые функции преобразуются по непри- неприводимому представлению размерности 4, образуя матрицу Д^, симметричную по любой паре индексов. Изоквартету соответ- соответствует изоспин Т = 3/2. Из A33,7) следует, что для компоненты Дш проекция изоспина Г3 = 3/2, для компонент Дц2 = Дш = = Дгп — Tz = 1/2, для компонент Д122 = Д212 = Д221 — Т3 = —1/2 и для компоненты Д222 — ^з = —3/2. Так как для Д-резонансов У= 1 E = 0), то QA = r3+i/, A33,31) так что Al22 = ^212 = ^221 ~ Д 5 ^222 ~ Д о Л2Т?; A33,32)
554 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV Из условий нормировки следует, что в первом и последнем со- соотношениях коэффициент пропорциональности равен 1, а во втором и третьем случаях он равен 1/]/3\ Изоквартет Д за- заполняется очевидным образом. Существуют адроны, например, Л- и Q-гипероны и т]-, со- и ф-мезоны, которые являются изосинглетами, т. е. их волновые функции преобразуются по изоскалярному представлению. Так как его генераторы равны нулю, то для изосинглета Т = Г3 = О и Q= 1/2(У). Античастицы fj, ю, ф совпадают с соответствую- соответствующими им частицами. § 134. Волновые функции системы нуклонов и я-мезонов Рассмотрим теперь три простейшие составные системы: N — N, N — N и зт — Л/, которые представляют значительный интерес. 1. Разложим волновую функцию системы нуклон — антину- антинуклон ф[ = #% A34,1) на неприводимые части (§ 132): ф/ = (#W. -16{NkNk) +y &>NkNk = %{ + 6{%. A34,2) Последнее слагаемое является изоскалярным, а выражение, стоящее в скобках — изовектором. Вспоминая анализ матрицы A33,20) получим = bX\ = b±(рр-Нп); A34,3) ) где а, 6, с, d — нормировочные коэффициенты. Считая, что про- пространственно-спиновые части всех волновых функций N* и iV* нормированы на единицу, из условия ортонормированности ба* зисных состояний A34,3) будем иметь Таким образом, окончательно |1 +1) Яр; | 1 0) -пп); \ 1, -1) = ря; A34,4) ) Если система Л^ — ./^находится в lS0 — состоянии (спины ан- типараллельны), то ее полный спин равен 0, а четность отрица-
-§ 134] СИСТЕМЫ НУКЛОНОВ И rt-МЕЗОНОВ 555 тельна (относительные четности частицы и античастицы проти- противоположны). Таким образом, из нуклона и антинуклона можно построить псевдоскалярные изотриплет и изосинглет, т. е. я-ме- зон и Yj-мезон. Этот результат лежит в основе составной модели я-мезона, предложенной в 1949 г. Ферми и Янгом. Изотриплет- •ное состояние 35i пары N — N можно сопоставить р-мезону. 2. Рассматривая волновую функцию системы двух нуклонов %, = ЩЫ';, A34,5) выделим из нее симметричную и антисимметричную по индек- индексам части: оN'N" дат+NmH wN" N'N") A34,6) Второе слагаемое содержит одну отличную от нуля независимую компоненту (/= 1, j — 2), т. е. является изоскаляром; первое ¦слагаемое — изовектор. Используя формулу A33,7), получим 11, + 1) = аХп - ар'р"; | 1, 0) = Ь%т = Ь ± {р'п" + п'р"); A34,7) \{' 1,-1) = ^ = сп'п"; | 0, 0> = d%(t2) = d\{p'n" - п'р"). овочные коэффициенты определяются как | 1, + 1) = //р"; 11,0) = -^ (рГпГ + п'р"); Нормировочные коэффициенты определяются как и раньше. Имеем 1 A34,8) | 1, - 1) = п'п''\ | 0, 0) = у=г(р'п" - п'р") Jcp. с соотношениями F6,4) — F6,5)]. Первые три функции, соот- соответствующие изоспину 1, симметричны, а последняя функция, отвечающая изоскалярному состоянию системы р — п, антисим- антисимметрична в изопеременных. В данном формализме протон и нейтрон рассматриваются как два состояния одной частицы — нуклона. Поэтому полная волновая функция системы двух нуклонов, рассматриваемых в качестве тождественных частиц, должна обладать определен- определенными свойствами симметрии относительно их перестановки. Так как тип симметрии не зависит от того, какая именно пара частиц переставляется, поменяем местами два протона. Они подчиняются статистике Ферми — Дирака, т. е. при перестанов- перестановке их координат и спинов волновая функция изменяет знак. С другой стороны, из A34,8) видно, что при перестановке изо- леременных двух протонов волновая функция не изменяется. Таким образом, нуклоны подчиняются обобщенному принципу
556 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ XV Паули, согласно которому полная волновая функция системы нуклонов антисимметрична относительно перестановки любой их пары. Отсюда следует, в частности, что волновая функция системы N — N с Г=1 описывает состояние, угловой момент которого отличается от момента изоскалярного (Т = 0) со- состояния. 3. Из волновой функции системы я-мезона и нуклона Ф?/ = ^ A34,9) выделим симметричную и антисимметричную по нижним индек- индексам части: Ф?/ = Т(М + *W)+T (М ~ */»?)- ФЙя + «?«• A34>10> Второе слагаемое содержит две отличные от нуля независимые компоненты ф?2}, т. е. является изоспинором (Т = 1/2). Первая же матрица все еще приводима, так как ее свертки не равны нулю. Выделяя их, мы получим (Nini + М ~ Т 6* W - Т Второе слагаемое представляет изоспинор, причем легко прове- проверить, что его компоненты совпадают с двумя компонентами <р* Из A33,6) заключаем, что первое слагаемое отвечает изоспину Т = 3/2, т. е. содержит четыре независимые компоненты. Ис- Используя A33,7), будем иметь | 3/2, +3/2) ~ Х?Г, I 3/2, 1/2) ~ х\х; I 3/2, - 1/2) ~ Х|2; |3/2, -3/2) - х22; I 1/2, + 1/2) - %х; \ 1/2, -1/2) ~ /2. A34>12> Расписывая компоненты явно и определяя коэффициенты про- пропорциональности из условий нормировки, окончательно получим: | 3/2, +3/2)=/ж+; | 3/2, + l/2)=f/J- ря°--|/у пп+; \ 3/2, - 1/2) = 5nJt°; |3/2, -3/2) = /гя-, |1/2, +1/2) = A34,13) К этому результату можно прийти и с помощью форма- формализма, развитого в §§ 51—52. По правилам сложения моментов
§ 134] СИСТЕМЫ НУКЛОНОВ И Я-МЕЗОНОВ 557 изоспин системы, состоящей из я-мезона (Г=1) и нуклона (Т = 1/2), может принимать значения 3/2 и 1/2. Для построе- построения волновых функций системы, соответствующих определенным значениям Т и Г3, можно воспользоваться общей формулой E2,3), которая в наших обозначениях записывается так: | Т, Т3)= 2 С?,-,,./, i I, T3-t3) Ц/2, *з>. A34,14) <>-*¦/« Взяв коэффициенты Клебша — Гордана из таблицы § 52, будем иметь: | 3/2, +3/2) = С'Ы I 1, +1I 1/2, +1/2) = ря+; | 3/2, + 1/2) = С'1:-,,, | 1, + 1) | 1/2, - 1/2) + Ci\ I 1. 0) I 1/2, + 1/2) = C/2, -1/2) = С2:-Ч2\ 1. 0I 1/2, -\/2) + С\Уг\ 1,-1)| 1/2, +1/2) |3/2, -3/2) = с\_,/2|1, -1I1/2, -1/2)=/от-; | 1/2, +1/2) = С'/?-1/2| 1, +1)| 1/2, -1/2) + С#./,| 1, 0)| 1/2, +1/2) 1/2, -l/2) = C^-v,l 1,0>| 1/2, -1/2) + С\,/2| 1, -1I 1/2, +1/2) = У -|рЯ--у -д-ЛЯ». Таким образом, снова приходим к соотношениям A34,13). Их можно легко обратить и выразить волновую функцию системы, состоящей из одного я-мезона и одного нуклона, че- через функции | Т, Т3): /ж+ = |3/2, +3/2), рл~ = iZ-i-l 3/2, - 1/2) +1/|| 1/2, - 1/2); A34,15) яя+ = - У -J-I 3/2,+ 1/2) + у f| 1/2, + 1/2), | | 3/2, - 1/2) - j/i-1 1/2, - 1/2), ля-= | 3/2, -3/2).
558 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ XV § 135. Изотопически инвариантное взаимодействие В § 67 отмечалось, что ядерные силы, т. е. силы, действую- действующие между двумя нуклонами атомного ядра, обладают свой- свойством зарядовой независимости. Это свойство наиболее просто описывается в рамках формализма изоспина. Гипотеза зарядо- зарядовой независимости ядерных сил утверждает, что взаимодействие двух протонов, двух нейтронов и протона с нейтроном, находя- находящихся в одинаковых пространственно-спиновых состояниях, яв- является идентичным. Из обобщенного принципа Паули следует, что если два нуклона находятся в изотриплетном состоянии (симметричном относительно переменных изоспина), то их ко- координатная волновая функция антисимметрична. Для протона и нейтрона, находящихся в изосинглетном состоянии, спин-коор- спин-координатная часть волновой функции симметрична. Это означает, что взаимодействие двух нуклонов в состояниях |1,+1), |1,0) и |1,—1) при прочих равных условиях будет одинаковым, в то время как взаимодействие в состоянии |0, 0) является, вообще говоря, существенно иным. В качестве примера рассмотрим дейтрон, состоящий из од- одного протона и одного нейтрона. Координатная волновая функ- функция его основного состояния (/ = 0) симметрична, спиновая волновая функция также симметрична (полный момент дей- дейтрона равен 1, т. е. он находится в триплетном спиновом состоя- состоянии 3Si1); поэтому изоспиновая часть волновой функции долж- должна быть антисимметричной и образовывать изосинглет. Из экспе- эксперимента известно, что энергия связи дейтрона равна 2,23 Мэв. С другой стороны, если бы дейтрон находился в основном со- состоянии !So, то его изоспиновая волновая функция была бы сим- симметричной, т. :е. являлась бы изовектором. В этом случае свя« занных состояний не существует. Таким образом, в предположении зарядовой независимости ядерные силы определяются изоспином Т, но не его проекцией Г3. Следовательно, в феноменологической теории ядерных сил, в которой взаимодействие между нуклонами описывается неко- некоторым потенциалом, гамильтониан может содержать лишь инва- инвариантный оператор Г2 квадрата полного изоспина системы ну- нуклонов, который можно записать в виде Т2 = (Г + f"J = j (т' + т"J = ~ т'2 + -} т + i- (т'т"). A35,1) Здесь т' = {тр Tg, T3} и т" = {т", т", т%] — матрицы Паули, действующие на изоспиновые индексы первого и второго нукло- нуклонов соотбетственно. Так как операторы т'2 и т кратны единич- ]) С небольшой примесью состояния bD\ (см. § 76).
* 13Ь] ИЗОТОПИЧЕСКИ ИНВАРИАНТНОЕ ВЗАИМОДЕЙСТВИЕ 559 ному, то зависимость гамильтониана взаимодействия от пере- переменных изоспина определяется лишь скалярным произведением (т'т"): Hint = u{ + u2(T'T"). A35,2) При этом щ и U2 зависят лишь от координат и обычного спина; они расписаны в § 76. Легко проверить, что гамильтониан A35,2) коммутирует с операторами проекций изоспина fa, а значит, и с операто- оператором Г2: [Him, Ta] = [Hlnu П = 0. A35,3) Следовательно, если не учитывать кулоновского взаимодействия протонов и небольшого различия в массах протона и нейтрона, то в системе взаимодействующих нуклонов имеет место не толь- только закон сохранения проекции изоспина, выражающий тривиаль- тривиальный факт сохранения заряда, но и закон сохранения полного изоспина, который может служить формулировкой зарядовой независимости. Обратимся теперь к взаимодействию нуклонов с я-мезонами; как мы знаем из § 67, именно оно ответственно за существова- существование ядерных сил, т. е. за взаимодействие нуклонов, которое выше рассматривалось чисто феноменологически. Последова- Последовательное обсуждение соответствующих вопросов возможно лишь в рамках квантовой теории поля, поэтому ограничимся некото- некоторыми замечаниями. Аналогично тому, как это делалось в § 122 при описании слабого взаимодействия, будем рассматривать нуклонные и я-мезонные функции Л^ и nk, как операторы в про- пространстве чисел заполнения. Оператор N{ соответствует погло- поглощению нуклона и рождению антинуклона, оператор (Л/+)ь на- наоборот, рождает нуклон и поглощает антинуклон. Оператор я* рождает и поглощает я-мезоны. Основными процессами, обусловленными рассматриваемым взаимодействием, являются процессы виртуального рождения и поглощения нуклонами я-мезонов (см. § 67). Поэтому плот- плотность гамильтониана взаимодействия должна иметь следующую общую структуру: N+Nn. Так как я-мезонный оператор является псевдоскаляром, то ре- релятивистская инвариантность и сохранение четности требуют, чтобы он умножался на псевдоскалярную комбинацию N+ и N. Вспоминая результаты § 121, приходим к выражению
560 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV Вследствие зарядовой независимости я — Л:-взаимодействия плотность гамильтониана должна быть изоскаляром. Из мат- матриц Nl, Nj и п[ можно образовать лишь одн> комбинацию та- такого типа: Таким образом, окончательно ^int=V2^Y5^y^ . A35,4) где g — константа сильного пион-нуклонного взаимодействия (аналог электрического заряда), а множитель У 2 введен по причинам исторического порядка (см. ниже). _ Используя явный вид нуклонных и я-мезонных матриц JV% Nj и п{ [см. A33,17), A33,18) и A33,24) и A35,4)], получим #mt = 8 I V2PV5™+ + }/2 пу5рл~ + (ру5р - пуъп) я0]. A35,5) Следовательно, в предположении зарядовой независимости имеет место следующее соотношение между константами я — ЛЛвзаимодействия: SpnTl^ &Dtl7l брОЯ °Я Учитывая явный вид матриц Паули и переходя к векторной мезонной функции я A33,26), легко проверить, что плотность гамильтониана A35,4) можно переписать как Hint = gNy5rNn, A35,7) где подразумевается, что изовекторы т и я скалярно перемно- перемножаются. В старых работах только эта форма записи и исполь- использовалась, чем объясняется появление множителя У2 в выра- выражении A35,4). Аналогично описывается взаимодействие других барионов с мезонами; например, для системы я, 2, 2 легко по- получить, что /<4 A35,8) В заключение еще раз подчеркнем, что электромагнитное взаимодействие нуклонов нарушает инвариантность относитель- относительно преобразований из изогруппы 5f/B), и сформулированные выше результаты перестают быть справедливыми. Для него плотность гамильтониана можно написать из тех же сообра- соображений, которые использовались при получении A35,4). Учиты- бая, что оператором рождения и уничтожения фотонов является вектор-потенциал А^, будем иметь fi A35,9)
§ 136] РАССЕЯНИЕ НУКЛОНОВ И Jt-МЕЗОНОВ 561 где Q — оператор заряда нуклона, который дается формулой A33,14). Поэтому ^ l A35,10) т. е. плотность гамильтониана наряду с изоскалярной содержит и изовекторную часть (слагаемое с тз). Наличие последней на- нарушает сохранение полного изоспина Г, хотя его проекция Г3 сохраняется. Но интенсивность электромагнитного взаимодейст- взаимодействия гораздо меньше интенсивности сильного взаимодействия, так что электромагнитными поправками часто можно прене- пренебречь, рассматривая их в лучшем случае в качестве малого возмущения. Некоторые количественные следствия гипотезы зарядовой независимости сильного взаимодействия, эквивалентной сохра- сохранению полного спина, приводятся в следующем параграфе. § 136. Рассеяние нуклонов и л-мезонов Применим формализм изоспина к анализу процессов рас- рассеяния нуклонов на нуклонах и я-мезонов на нуклонах. Обоб- Обобщение на случай любых других адронов не составляет никакого труда. Пусть рассматривается несколько реакций: ai + bi-^Ci + di, A36,1) причем все частицы типа а (а также 6, с и d) принадлежат одному и тому же изомультиплету. Для волновых функций на- начального и конечного состояний будем использовать дираков- ские обозначения \агЬ{) и \Cidi). Амплитуда рассеяния /<*> про- пропорциональна матричному элементу М@ = <^|яА>, A36,2) квадрат модуля которого определяет дифференциальное и пол- полное (после интегрирования по углам) сечения процесса. Предположим сначала, что состояние частиц до рассеяния имеет определенные значения изоспина Т и его проекции Г3, т. е. его волновой функцией является |Г,Г3). Если выделить часть матричного элемента, соответствующую кулоновскому рассея- рассеянию, то из зарядовой независимости будет следовать, что в про- процессе реакции изоспин не меняется: (Г, Т31 Г, Г3> = 0 при Г Ф Г, A36,3) т. е. волновой функцией конечного состояния является также функция типа |7\ Г3). Кроме того, матричный элемент, отвечаю- отвечающий рассеянию за счет сильного взаимодействия, не может
562 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV зависеть от значения проекции Гз, а определяется изоспином Г (и другими квантовыми числами — импульсами, спинами и т. д.); обозначим (Г, Г3|7\ ТЪ)^М(Т\ A36,4) Ценность формализма изоспина применительно к рассмат- рассматриваемому классу задач заключается в том, что матричный элемент любого реального процесса из их совокупности A36,1) можно выразить через небольшое число (в большинстве слу- случаев через два) матричных элементов М^т\ соответствующих рассеянию в определенном изоспиновом состоянии. Для этого волновые функции \аф{) и \Cfdi) достаточно разложить по вол- волновым функциям |7\ Гз/, подставить эти разложения в A36,2) и воспользоваться формулами A36,3) — A36,4). Таким способом удается установить ряд соотношений между сечениями различ- различных процессов, отвечающих одинаковым начальным и одинако- одинаковым конечным пространственно-спиновым состояниям частиц» участвующих в рассеянии. 1. В качестве первого примера рассмотрим рассеяние про- протонов на протонах и нейтронов на протонах. Прежде всего иа A34,8) выразим волновые функции начального и конечного со- состояний, т. е. систем р— р и п — р через базисные функции изо- триплета и изосинглета: |р'р">=П, +1>; |Ai'p"> = y~(|l, 0>-1°>0»- ' A36,5) |р'п'0 = ^(|1, 0> + |0,0». Тогда для процесса рассеяния р' + р"->// + /?" получим, что М(рр) = (р>//1р/р//) = <1, +И1, +1> = MA). A36,6) При рассеянии нейтронов на протонах возможны два процесса: обычное упругое рассеяние и рассеяние с перезарядкой п' + р" -> р' + п". Для первого из них |[ (М{]) + М{0I A36,7)
<§ 136] РАССЕЯНИЕ НУКЛОНОВ И я-МЕЗОНОВ 563 г для второго ¦ (р'п" | П'р") + "о" К( 1 у О = 1[Л*A)-М@)]. A36,8) Угловые сечения пропорциональны квадратам модулей матрич- матричных элементов, откуда (ynp) I I w(i) , M@) 12 и Суммируя два последних выражения, получим полное сечение рассеяния нейтронов на протонах, которое экспериментально определяется общим числом протонов и нейтронов, рассеянных на данный угол. Окончательно, ДО) Так как угловая зависимость матричных элементов и Л4<°> может быть существенно различной, го, несмотря на за- зарядовую независимость, поведение сечений рассеяния протонов на протонах и нейтронов на протонах как функций угловой пе- переменной может быть неодинаковым. Эксперимент показывает, что это действительно так. В энергетической области 300— 500 Мэв в системе центра инерции первое сечение почти не за- зависит от угла рассеяния, в то время как второе имеет минимум при 0 = я/2, сильно возрастая в направлении назад и в меньшей степени—-в направлении вперед. 2. Несколько более интересным является пример реакций рождения я-мезонов с образованием дейтона при столкновении нуклонов: р + р-> d + я+, п + р -> d + я0. Так как изоспин дейтона равен нулю (см. начало § 135), то I Jt+rf> = [1, +1>; |я°й) = |1, 0). A36,11) Поэтому 1, о>—1 о,
564 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ XV откуда вытекает соотношение между сечениями -2. U36,13) подтвержденное экспериментально. 3. Еще более интересный случай представляет рассеяние за- заряженных я-мезонов на протонах: я+ + р->я+ + р, я~ + р -> я0 + п. Отмечая матричные элементы и сечения, относящиеся к этим процессам, знаком я-мезона в конечном состоянии и воспользо- воспользовавшись формулами A34,15), получим: , +3/2|3/2, 4(l/2, -1/2 |) X X ()/| | 3/2, -1/2) + ]/|| 1/2, - 1/2))] = ~ М^ + | ММ; [(/|C/2, ~l/2|~]/i-(l/2, - 1/2 |) X X ()/"| I 3/2, -1/2) + j/f | 1/2, -1/2))] откуда V2 V2 fm = _L?_ ^(з/2) — у z fD2)t о о Исключая амплитуды /C/2) и /A/г), будем иметь соотношение /(+)_/(->= }/2/@), A35,15) из которого следуют так называемые соотношения треуголь- треугольника: \Y^ - V^\<V^ <\/Го(Г) + V^. A36,16) При некоторых дополнительных предположениях относительно свойств амплитуд можно получить более содержательные соот- соотношения между сечениями. Так, в случае /с1/*) ^= О т<->:а<0) = 9:1:2. A36,17)
§ 136] РАССЕЯНИЕ НУКЛОНОВ И rt-МЕЗОНОВ 565 Если предположить, что /М ^ f&2\ то а(+): а(->: а(о> = 1 : 1:о A36,18) Наконец, когда fC/2) = 0, то а(+): а<->; а@) = о : 2 : 1. A36,19) Эксперимент показывает, что при энергии налетающего я-ме- зона, равной 120 Мэв, полные сечения относятся как 93: 11 : 22^ё ^9:1:2, т. е. в этой энергетической области доминирует рас- рассеяние в состоянии с изоспином Т = 3/2. При энергиях выше 200 Мэв начинает давать заметный вклад и амплитуда /W. Существует и другой, более простой метод получения соотно- соотношений между сечениями, который не требует знания коэффи- коэффициентов Клебша — Гордана и особенно полезен в тех случаях,, когда их вычисление по каким-то причинам является затруд- затруднительным. Он называется методом инвариантных амплитуд и будет продемонстрирован на примере рассеяния заряженных я-мезонов на нуклонах. В предположении зарядовой независимости изоспин Т при рассеянии не меняется; это означает, что полная амплитуда рассеяния одного изомультиплета на другом должна быть изо- скаляром. В нашем случае она строится из волновых функций Nt и п[ начального состояния и волновых функций N1 и п{ конечного состояния, которые преобразуются по сопряженным представлениям (чертой мы отмечаем функции, описывающие конечное состояние; одновременно она служит символом сопря- сопряженного представления). Матрицы этих волновых функций имеют вид A36,20) Из них можно образовать два независимых изоскаляра так что амплитуда записывается в виде линейной комбинации ('fa)) (FJ#*). A36,21), 1 1 _ MV2 Nl = 05, n+ n); v _ /ft0 i 1 //2 n;+ я~
.'566 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ XV Из A36,20) для изоспиновой части волновых функций частиц начального и конечного состояния имеем: -ДЛЯ .для .для .ДЛЯ для протона: нейтрона: я+-мезона: я~-мезона: я°-мезона: n-+N2 я»->< -1, = 1, -1, = 1, 1 Р-* п—. я+- я-- ->ftj. = 1, = 1 = 1 > > 1 /2" ffO _> jr' — _J ft2=s — 1 Я; (все остальные компоненты равны нулю). Подставляя эти волновые функции в амплитуду A36,21), по- .лучим fW = /i; f(-> = f x + /2; /@) = - > /2f A36,22) где /i и /2 — неизвестные, но одинаковые для всех пион-нуклон- ных процессов функции пространственно-спиновых переменных. Из A36,22) следует, в частности, соотношение A36,15), а зна- значит, и неравенство треугольника. Из эксперимента известно, что в области высоких энергий и малых углов сечение процесса перезарядки я- + р—>я° + я мало по сравнению с упругими -сечениями. Полагая поэтому /2 ^ 0, получим приблизительно ра- равенство дифференциальных сечений в направлении вперед для упругого рассеяния я+- и я~-мезонов на протонах: -Пйг| ' A36,23) Амплитуды fi можно выразить через амплитуды /W и наоборот; для этого достаточно сравнить соотношения A36,22) и A36,14), откуда f 1 = f(8/2); f2 = ~ Т /C/2) + 4 /(Vi)- A36,24) В заключение этого параграфа укажем простой способ опре- определения числа независимых инвариантных амплитуд. По пра- правилу сложения моментов находим возможные значения изо- спина Т начального и конечного состояний. В силу зарядовой независимости возможны лишь переходы с сохранением изо- спина Г, поэтому число независимых амплитуд определяется числом одинаковых значений изоспина в начальном и конечном состояниях. В нашем примере изоспины и начального и конеч- конечного состояний равны 3/2 и 1/2, благодаря чему имеются две амплитуды: /№ и f(f/«) или f\ и f2.
§ 137] УНИТАРНАЯ ГРУППА SU(Z) 567 § 137. Унитарная группа SUC) и ее представления В предыдущих параграфах изучены некоторые следствия изоспиновой инвариантности сильного взаимодействия, основан- основанной на группе SUB) и наиболее приспособленной к описанию свойств симметрии нуклонов и я-мезонов. Однако с открытием странных частиц рамки этой группы оказались слишком узкими, так как ее ранг равен 1 и она дает лишь одно сохраняющееся аддитивное1) квантовое число — проекцию изоспина Гз, с по- помощью которого классифицируются члены данного изомульти- плета. В то же время имеется еще по крайней мере одна ха- характеристика такого типа — гиперзаряд Y (или странность), так что естественно попытаться сгруппировать несколько изомуль- типлетов с разными гиперзарядами в один супер мул ьтип лет. Для этого необходима группа ранга 2, взаимно коммутирующие генераторы которой дают два одновременно измеримых сохра- сохраняющихся квантовых числа, служащих характеристикой членов супермультиплета, так что их можно отождествить с 7'з и У. С другой стороны, из требования, чтобы новая теория содер- содержала результаты старой, следует, что изогруппа должна яв- являться частью (подгруппой) более широкой новой группы сим- симметрии. Сформулированным требованиям наиболее просто и естественно можно удовлетворить, если постулировать прибли- приближенную инвариантность сильного взаимодействия относитель- относительно группы SUC)y которая в дальнейшем будет именоваться унитарной (в узком смысле словаJ). Соответствующий ма- математический аппарат весьма близок формализму, изложен- изложенному в § 132, на результаты которого мы часто будем ссы- ссылаться. Группой SUC) называется совокупность всех унитарных и унимодулярных матриц третьего порядка, которые отвечают линейным преобразованиям в 3-мерном комплексном про- пространстве, сохраняющим квадратичную формуя4"* = х1х. = х\х{ + + *2*2+*з*з(индексы *'»/ и т*д- тепеРь пробегают значения 1,2,3). Генераторами этой группы являются эрмитовы квадратные мат- матрицы Ка третьего порядка с равным нулю следом: Л+ = ла; Spua = 0. A37,1) *) Под аддитивным квантовым числом понимается величина, значение которой для некоторой системы равно сумме ее значений для подсистем. В этом смысле полный изоспин Т — не аддитивная характеристика. 2) Следует отметить, что в 1961—1964 г. ситуация не была вполне ясной, так как не представлялось возможности сделать однозначный выбор между SUC) и так называемой группой G2; некоторое предпочтение отдавалось даже последней. Окончательно вопрос решился в 1964 г., вместе с откры- открытием Q'-гиперона (см. § 138).
tjgg ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ XV На 18 действительных параметров комплексных 2-рядных мат- матриц накладывается девять условий эрмитовости и одно условие равенства нулю следа, так что существует восемь независимых матриц со свойствами A37,1), что и определяет размерность группы SUC). Среди матриц А,а имеются две взаимно коммути- коммутирующие (ранг группы SUC) равен 2), которые можно одновре- одновременно диагонализировать. Выберем представление, в котором диагональны А,з и A,s: я,= Я4= 0 0 0; Я5= 00 0 ; Яб= 001 ; A37,2) Отсюда следует, что если все параметры соа группы SUC), кро- кроме первых трех, положить равными нулю, то мы получим изо- группу SUB). Представления группы SUC) строятся совершенно анало- аналогично тому, как это было сделано в § 132. Однако взаимно со- сопряженные представления теперь уже не будут эквивалентны, так что данное неприводимое представление (/?, q) определяется двумя (а не одним р + q) числами — р и q. Определения и соот- соотношения A32,13) — A32,16) по-прежнему сохраняют силу, если в них та заменить на А,а и считать, что латинские индексы про- пробегают значения от 1 до 3, а греческие — от 1 до 8. Найдем число независимых компонент матрицы ср/ • 1 *•* р симметричной отдельно по всем нижним и верхним индексам и с равными нулю следами по любой паре верхнего и нижнего индекса, т. е. определим размерность N(p,q) неприводимого представления (p,q). В силу симметрии различны лишь компо- компоненты, отличающиеся одним из чисел ри Ръ Рг (числа единиц, двоек и троек среди нижних индексов). Так как р\ + р2 + Рз= р, то при данном Pi число /?2 может меняться от 0 до р — /?ь что дает р — pi + 1 разных компонент. Меняя теперь р{ от 0 до р, получим общее число различных компонент при фиксированных
§ 137] УНИТАРНАЯ ГРУППА SUC) 569^' верхних индексах: Аналогично, число различных компонент при фиксированных нижних индексах равно N(q) =¦• l/2(q + I) (q + 2), т. е. всего имеется N(p)N(q) компонент. Но они еще не являются неза- независимыми, так как связаны условиями равенства нулю следов. В силу симметрии достаточно, чтобы в нуль обращался след по одной из пар верхнего и нижнего индексов, который будет мат- матрицей с р—1 нижними и q—1 верхними индексами, имея тем самым N(р—l)N(q—1) компонент. Таким образом, N(p,q) = = N (p)N(q) — N (р — 1) X N (q — 1) и окончательно N(p,q)-±(p+l)(q+l)(p + q + 2). A37,3) Перечислим наиболее важные представления группы SUC): 1. ф — @, 0)= 1 —унитарный скаляр или синглет (N = 1); 2. ф^ и ф/-A,0) = 3 и @, 1) = 3 — унитарные спиноры или триплеты (N = 3); 3. (ft/ и ф'7-B, 0) = 6 и @, 2) = 6-секступлеты (N = 6); 4. ф{ — A, 1)^8 —унитарный вектор или октуплет (iV = 8);„ 5. <vifk и <р'/л-C, 0)гз 10 и @, 3)=Т0-декуплеты G^= 10); 6. ф*. и <р/*-B, 1)зэ15 и A,2)=~1б-15-плеты (#=15); 7. ф«-B, 2) = 27-27-плет и т. д. (здесь указаны также очень удобные обозначения, которые сразу говорят о размерности неприводимого представления). Следует обратить внимание, например, на представления B,0) и A,1); соответствующие им волновые функции имеют одина- одинаковое число (а именно 2) индексов, но размерности мультипле- тов различны F и 8 соответственно). Такая ситуация не может встретиться в группе SUB) в силу эквивалентности ее взаимно сопряженных представлений. Выпишем теперь важные для дальнейшего разложения неко- некоторых прямых произведений представлений на неприводимые: A,0) ®@, 1) = @, 0)©A, 1) или 3 0 3=108, A37,4а> A,0)®A,0)®A,0) = @,0)©A, 1HA, 1HC,0) или 3®3®3=1©808/01O, A37,4б>
570 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV A, 0) ® A, 0) ® @, 1) = A, 0)©A, 0H@, 2HB, 1) или 3®3®3 = 3®3®6®15, A37,4в) A, 1)®A, 1) = @,0HA, 1HA, 1HC,0H@,3HB,2) или 8®8=1ф8ф8/ф10фК)ф27, A37,4г) A, 1)®C,0) = A, 1)©C,0)фB,2)фC, 1) или 8® 10 = 8ф10ф27ф35. A37,4д) Докажем, например, разложения A37,4а) и A37,4г). В первом случае функция фг-%;* содержит ненулевой след фг%\ являющийся скаляром [представление @,0)]; оставшаяся после его выделе- выделения функция срд' — у 6(фд* преобразуется по неприводимому представлению A,1). Доказательство формулы A37,4г) несколь- несколько сложнее. Прежде всего, если функцию <ррС? симметризовать по нижним и по верхним индексам и выделить ненулевые следы, то получим представление B,2). Далее, два различных следа .лишь по одной из пар индексов (напомним, что ф| = %\ = 0) по- после выделения ненулевых следов по оставшейся паре индексов, т. е. две функции 6Мх и преобразуются по двум представлениям A,1) и A,1). Полный след ф^Х/ является унитарным скаляром, так что мы имеем представление @,0). Наконец, при выделении симметричных частей возникают две функции типа содержащие по 10 независимых компонент каждая. Можно по- показать, что нижняя пара {ik} эквивалентна одному верхнему ин- индексу и наоборот, поэтому получаем представления C,0) и @,3). В правильности приведенного разложения можно убе- убедиться, если сравнить размерности в левой и правой частях формулы A37,4г) :8Х8= 1+8+8+10+10 + 27 = 64. Остальные формулы A37,4) доказываются аналогично. Группа SUC) имеет два инвариантных оператора, собствен- собственные значения которых могут служить для классификации не- неприводимых представлений. Но у нас представления уже одно- однозначно охарактеризованы также двумя числами — р и q. По- Поэтому выписывать и анализировать инвариантные операторы мы не будем; в дальнейшем они не потребуются. Для классификации базисных элементов заданного мульти- ллета, в качестве которых можно выбрать определенные линей-
§ 137] УНИТАРНАЯ ГРУППА SU(Z) 571' ные комбинации матриц <р.! .q лишь с одним ненулевым эле- I ••• р ментом, будем использовать собственные значения диагональ- диагональных генераторов Л3 и Л8. Из явных выражений типа A32,15) для генераторов Ла следует, что на функции ф/ ' tq с одним, отличным от нуля элементом они действуют так: Пусть среди нижних p индексов содержится рг индексов 3 и р — ръ индексов 1 и 2, а среди верхних q индексов имеется q$ троек и q — q$ единиц и двоек. Так как матрица А,8 дает l/|/3 в применении к каждому верхнему и нижнему индексу 1, 2 и —2/l/3 в применении к любому индексу 3, то согласно A37,5) собственные значения генератора Лв равны Л8 = УЗ [ ^ - Рз + <7з ] • A37,6) Совершенно аналогично, для собственных значений генератора Лз имеем A37,7) Если бы среди индексов вообще не было троек, т. е. если бы рассматривалась группа Sf/B), то мы получили бы соотноше- соотношения р\ + р2 = Р и q\ + #2 = q- В этом случае формула A37,7) превратилась бы в A32,25). Однако двух указанных квантовых чисел (собственных зна- значений операторов Лз и Лв) для однозначной классификации базисных элементов мультипле1а недостаточно. К ним можно добавить, например, собственное значение оператора Л2 = 2. Из A37,2) следует, что ~~ 0 A37,8) и поэтому матрица К2 не коммутирует со всеми матрицами А,а. В силу того, что выражения для генераторов Ла полностью ана- аналогичны приведенным в § 132 [см. A32,15)], это утверждение: справедливо и для Л2.
572 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ XV Поэтому ситуация с собственными значениями оператора Л2 оказывается несколько более сложной, чем в двух предыдущих случаях: некоторым компонентам ф,1 "'q может отвечать не- 1 ••• р сколько собственных значений этого оператора, т. е. будет иметь место своеобразное вырождение. У мультиплетов, с которыми мы будем иметь дело, это происходит в случае Лз = Лв = 0. Если хотя бы одно из этих квантовых чисел не равно нулю, то, как легко показать, А2%\'.'.'. \\ = (Pi + Р2 + <7i + <72) (Р, + p2 + ql + q2 + 2) Ф|| []] («. A37,9) Если же Лз = Лз = 0, то стоящий справа множитель опреде- определяет максимальное собственное значение оператора Л2. § 138. Восьмеричный формализм и унитарные мультиплеты Предположим, что в природе имеется некоторое сверхсиль- сверхсильное взаимодействие элементарных частиц, которое инвариантно относительно группы SUC). Тогда волновые функции адронов должны преобразовываться по некоторым ее неприводимым представлениям, т. е. они являются произведениями обычных пространственно-спиновых волновых функций на унитарные мат- матрицы ф.1'" *q. В результате все адроны будут размещены по 1 ••• р унитарным мультиплетам, которые характеризуются парой чи- чисел р и q, спином, четностью, барионным числом и прочими ве- величинами, не связанными с группой SUC) (ср. с § 133). Внутри мультиплета отдельные адроны классифицируются собственными значениями генераторов Л3 и Лз и оператора Л2, которые ниже будут отождествлены с Г3, Y и Т. Если считать, что имеется только сверхсильное взаимодей- взаимодействие, то эти квантовые числа должны сохраняться, причем переходы в результате реакций возможны только внутри одного унитарного мультиплета, как это было и в случае изоспиновой инвариантности. Кроме того, должно иметь место квантовоме- ханическое вырождение, и массы частиц, входящих в один уни- унитарный мультиплет, обязаны быть строго одинаковыми. С дру- другой стороны, эксперимент показывает, что массы частиц, обла- обладающих разными гиперзарядами (при одинаковых спине, чет- четности и барионном числе) резко различаются, например, раз- разность масс нуклона и S-гиперона составляет примерно 30% от массы последнего. Это означает, что уже обычное сильное вза- взаимодействие должно существенно нарушать SVC) -инвариант- -инвариантность в гораздо большей степени, чем это делает электромаг- электромагнитное взаимодействие в отношении изоспиновой симметрии. Но
$ 138] ВОСЬМЕРИЧНЫЙ ФОРМАЛИЗМ 573 в сильном взаимодействии Г, Т3 и У все же сохраняются, что позволяет выявить трансформационные свойства гамильтониана взаимодействия, нарушающего симметрию, по отношению к уни- унитарным преобразованиям из группы SUC). А это в свою оче- очередь дает возможность получить определенные соотношения между массами частиц, входящих в один унитарный мультиплет. Вместо генераторов Ль Лг, Лз и Л8 удобно ввести операторы ?1-ТА" ^-Т^' ?з = уЛ3 A38,1) K A38,2) Операторы Ти Тъ Т3 естественно отождествить с операторами проекций изоспина, а оператор Г = Т\ + П+П = \К2 A38,3) — с оператором квадрата изоспина. Из A37,7) и A37,9) сле- следует, что собственные значения f3 и Р равны1) Т* = \{Р\-Р2-Ч\ + Я2) A38,4) и T(T+l) = ±-(pl + p2 + ql + q2)(Pi + p2 + ql + q2 + 2). A38,5) Оператор Y = —т=-Л8 отождествим с оператором гиперзаряда, У 3 так что [см. A37,6)]: ?^L 3. A38,6) Такое отождествление не является однозначным и соответствует так называемому восьмеричному формализму или восьмерич- восьмеричному пути, предложенному в 1961 г. Гелл-Манном и независимо Нееманом. Его целесообразность оправдывается апостериори, так как в рамках восьмеричного формализма реальные элемен- элементарные частицы описываются наилучшим из всех возможных способов. Другой выбор оператора У рассматривается в § 141. Из A36,6) и из требуемой целочисленности гиперзаряда сле- следует, что нужно рассматривать лишь такие представления груп- группы Sf/C), для которых разность р — q кратна трем: р-<7 = 3л, A38,7) т. е. представления @,0)=1, A,1) = 8, C,0) =10, @,3) =Т0, B, 2) = 27 A38,8) *) С точностью до замечания, сделанного в конце § 137,
574 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ {ГЛ. XV и так далее. Ввиду важности в рассматриваемом подходе пред- представления A, 1) = 8 он получил название восьмеричного форма- формализма. Наконец, отметим, что в соответствии с соотношением Гелл-Манна— Нишиджимы (§§ 129, 133) положим по опре- определению, что оператором заряда служит A38,9) 2/3 Рассмотрим теперь конкретные унитарные мультиплеты адро- нов. Обратимся прежде всего к октуплету с волновой функцией ср? и исследуем его содержание по изоспину, его проекции 7\ гиперзаряду Y и электрическому заряду Q. Пользуясь соотноше- соотношениями A38,3) — A38,6) и A38,9), можно сразу составить сле- следующую таблицу: Компонента ф! ф^ ф? . ф^ ф? фЗ Фз Фз Фз ]) См. : Г1) 1,0 1,0 1 1 1/2 1/2 1/2 1/2 0 замечание г, 0 0 + 1 -1 + 1/2 -1/2 -1/2 + 1/2 0 j в конце Y 0 0 0 0 +1 +1 -1 —1 0 § 137. <? 0 0 + 1 -1 + 1 0 1 0 0 Мезон 0 Jl°, Т1 я+ зх~ к+ к° к+ к? п Мезон 1 р°, ю. ф р°. <». ф р+ 9" г6 ©, ф Барион 2°, Л 2°, Л S+ 2~ Р п 2- S° Л В последних трех колонках выписаны частицы — псевдоска- псевдоскалярные и векторные мезоны и барионы со спином 1/2, которые имеют соответствующие квантовые числа. Замечательным обра- образом сюда вошли все стабильные псевдоскалярные мезоны, кото- которых существует ровно 8, и все 8 стабильных барионов (кроме Q-\ спин которого равен 3/2). Поэтому естественно считать, что эти две группы частиц образуют как раз унитарные октуплеты.
§ 138] ВОСЬМЕРИЧНЫЙ ФОРМАЛИЗМ Матрицы их волновых функций имеют следующий вид: 575 а Р п - 2А//6 К+ IS" + LT® Д А A38,10) Выбор именно таких коэффициентов диктуется требованием ра- равенства нулю следа матрицы и соображениями нормировки (см. § 133). В мезонный октуплет вошли наряду с частицами и античастицы. Это объясняется тем, что теперь не осталось кван- квантовых чисел, не входящих в группу 5(/C), с помощью которых можно было бы отличить, скажем, /С+ и К+ (ср. с § 133). Для барионов же такое число существует — это барионное число В, так что соответствующие им античастицы образуют самостоя- самостоятельный октуплет: 27/2 +А//6 s~ s+ -27/6 в я -2Л/]/б, A38,11) Унитарные мультиплеты удобно изображать на диаграммах, называемых весовыми; при этом выбирается прямоугольная си- система, по одной оси которой откладывается гиперзаряд, а по другой — проекция изоспина. Так, например, для барионного октуплета имеем: Ситуация с векторными мезонами несколько сложнее, так как на место, аналогичное тому, которое занимает rj-мезон или А-гиперон, имеются два претендента — со и ср. Эту ситуацию мы обсудим в конце параграфа.
576 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV Составим теперь таблицу квантовых чисел частиц, которые могут входить в состав декуплета, волновая функция которого есть Компонента Фш Ф112 Ф122 Ф222 Физ Фш Ф223 Ф133 Ф233 Фззз Т 3/2 3/2 3/2 3/2 1 1 1 1/2 1/2 0 +3/2 + 1/2 -1/2 -3/2 + 1 0 -1 + 1/2 -1/2 0 У + 1 + 1 + 1 + 1 0 0 0 -1 -2 Q +2 + 1 0 -1 + 1 0 -1 0 -1 -1 Барион 3/2+ Д,+23+6 Д1236 Д1236 ДГ236 ^1385 vO ^1385 S1385 530 21530 ? В тот момент, когда была составлена аналогичная таблица A961—1962 гг.), место, в котором стоит знак вопроса, остава- оставалось незанятым, так как не было известно ни одной частицы с гиперзарядом —2. Таким образом, восьмеричный формализм предсказал существование нового гиперона со спином 3/2+ и с указанными в таблице квантовыми числами. Мало того, при- приблизительно была известна и масса этой частицы (см. § 140) — примерно 1680 Мэв. И в начале 1964 г. такая частица была действительно открыта — это довольно стабильный Q-гиперон (см. таблицу элементарных частиц, приведенную в § 142). Это обстоятельство уничтожило все сомнения в истинности восьме- восьмеричного формализма и вообще унитарной симметрии, которая ныне является столь же классической, как и изоспиновая. Ве- Весовая диаграмма для декуплета имеет такой вид: Формулой A38,7) допускается и существование унитарных синглетов. Так как в этом случае все генераторы обращаются
§ 139] СЛЕДСТВИЯ СТРОГОЙ УНИТАРНОЙ СИММЕТРИИ 67? в нуль, то для унитарно скалярной частицы T = Tz=Y~Q = 0. Однако среди множества резонансных состояний нет пока ни одного, волновую функцию которого можно было бы с пол- полной достоверностью рассматривать в качестве унитарного скаляра. Зато унитарные синглеты играют решающую роль в разре- разрешении упомянутой выше трудности с векторными мезонами. Можно считать, что реальные со- и ф-мезоны представляют раз- различные суперпозиции унитарно синглетного состояния q/ и окту- плетного состояния со', аналогичного т|-мезону. В случае стро- строгой унитарной симметрии такое смешивание компонент из мультиплетов разной природы запрещено, но в результате на- нарушения 5?/C) -симметрии реальным сильным взаимодействием оно уже не является невозможным. Таким образом, векторные мезоны образуют не октуплет, а нонуплет. По этому поводу мы ограничимся лишь сделанными замечаниями общего характера, отсылая читателя к литературе. Перечислим теперь без каких-бы то ни было комментариев некоторые унитарные мультиплеты, по которым размещаются резонансы. Оказывается, что существует семейство из девяти мезонов 2+ (в него входит, в частности, упоминавшийся в § 129 /°-мезон), которые также образуют нонуплет. Несколько более сомнительными являются нонуплет мезонов 1+, октуплет ба- рионных резонансов 3/2- и октуплеты барионных резонансов 5/2+ и 7/2+. Для окончательного решения вопроса пока не хва- хватает данных. § 139. Некоторые следствия строгой унитарной симметрии В этом параграфе кратко описываются некоторые физиче- физические следствия гипотезы строгой унитарной симметрии адронов. Следует сразу же подчеркнуть, что они не могут претендовать на хорошее согласие с экспериментальными данными, так как уже реальное сильное взаимодействие в значительной степени нарушает SUC) -инвариантность теории. Более реалистическая схема в общих чертах описывается в следующем параграфе. Рассмотрим прежде всего взаимодействие стабильных ба- рионов спина 1/2+ (октуплет ?0 с псевдоскалярными мезонами (октуплет Mi). В квантовой теории поля барионные и мезонные функции считаются операторами в пространстве чисел заполне- заполнения. Аналогично тому, как это делалось в § 135, плотность га- гамильтониана взаимодействия следует строить в виде инвариант- инвариантной комбинации функций в{, В[ и С. Прежде всего образуем из этих функций унитарные скаляры. Замечая, что из в{ и В\ 19 В. Г. Левин и др., том II
578 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV можно сконструировать два октуплета вТ и свернем эти матрицы с мезонной функцией М{* Учитывая, что 6kiM{ = М\ = О, приходим к двум унитарным скалярам в{в)м{ и в)вШ1 которыми и исчерпываются возможные инварианты. Обычно вы- выбирают их сумму и разность, так что барион-мезонное взаимо- взаимодействие описывается следующей плотностью гамильтониана: ] К (матрица ys введена из тех же соображений, что в § 135), со- содержащей две независимые константы связи gW и g(JD)). По определенным причинам первый член гамильтониана A39,1) называется F-связью, второй D-связью. Используя A38,10) — A38,11), запишем компоненты барион- ной и мезонной матрицы через волновые функции изомульти- плетов: (а, 6 = 1,2 — изоспиновые индексы). Подставляя их в A39,1), получим: = (giD) + g{F f (§(D) - giF)) t'AvsS" + ^ giD)nca [A /f - wr{3giF)+gW) ф°У5Еа ~ VI
§ 139] СЛЕДСТВИЯ СТРОГОЙ УНИТАРНОЙ СИММЕТРИИ 579 - SiF)) KJPyfii + ^ig™ - g(F)) KaAy5Na. A39,2) Таким образом, 12 констант 22я, NNn, 2Ля, SSji, 22г], ] SSt|, ЛЛг], 2S/C, Л/S/C, Л2/С, NAK — связи выражаются всего через два параметра gW и g(D\ Кал<дое слагаемое, входящее в A39,2), инвариантно относительно изоспиновых преобразований, и его можно расписать в явном виде (см. § 135), в результате чего возникает 64 члена, каждый из которых отвечает взаимо- взаимодействию конкретных барионов с мезоном. Рассмотрим теперь, как в унитарно-инвариантной теории по- получаются соотношения между сечениями различных процессов. Пусть имеется несколько реакций причем частицы а*, Ьг, С{ и di принадлежат унитарным мульти- плетам (р^а\ q(a)), (/?(Ь\ <7(Ь))» (Р(с)> Фс)) и (/?К qW) соответствен- соответственно. В соответствии с общей схемой, описанной в § 136, для по- получения соотношений между амплитудами указанных реакций нужно действовать следующим образом. 1. Разлагаем прямые произведения представлений (р(а), <7(а))® ® (p{b\ Q{b)) и (р(с)> q{c)) ® (p{d)> Q{d)) на неприводимые представ- представления. 2. Выписываем независимые амплитуды, соответствующие переходу из некоторого мультиплета первого разложения в та- такой же мультиплет второго разложения. 3. Разлагаем, пользуясь таблицей коэффициентов Клебша — Гордана группы SUC), волновые функции \aibi) и \cidi) на- начального и конечного состояний по базисным функциям мульти- плетов, входящих в соответствующие разложения. Эти функции определяются типом представления и собственными значениями операторов изоспина и его проекции и оператора гиперзаряда, так что их следует записывать в виде ]р, q; Г, Г3, К). 4. Подставляем разложения волновых функций в матричный элемент перехода (cidi\aibi), в результате чего он оказывается выраженным через сравнительно небольшое число выписанных в п. 2 матричных элементов переходов между однотипными мультиплетами. 19*
530 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV В качестве примера рассмотрим рассеяние псевдоскалярных мезонов на стабильных барионах спина 1/2 (легко сосчитать, что всего имеется 27 таких процессов). В этом случае все ча- частицы и начального и конечного состояния принадлежат окту- плетам. Пользуясь разложением A37,4г), заключаем, что имеется восемь независимых амплитуд, соответствующих пере- переходам !^1э Ю->10, fO->T6, 27-*27, 8'->8', 8->8, 8->8', 8'->8. Однако, используя инвариантность теории относительно обра- обращения времени, можно показать, что две последние амплитуды выражаются друг через друга, так что независимых имеется семь амплитуд, через которые и выражаются 27 амплитуд ре- реальных процессов. В случае рассеяния псевдоскалярных мезонов на барионах 1/2+ с образованием псевдоскалярного мезона и барионного ре- резонанса 3/2+, например, для начального состояния имеем разложение A37,4г), а для конечного—A37,4д), так что амплитуды реальных процессов выражаются всего через четыре независимые амплитуды пере- переходов: 8-*8, 8'->8, 10->10, 27->27. Однако таблицы коэффициентов Клебша — Гордана группы SUC) весьма громоздки и в каждом конкретном случае го- гораздо удобнее пользоваться методом инвариантных амплитуд, описанным в конце § 136. Рассмотрим опять рассеяние псевдо- псевдоскалярных мезонов на барионах 1/2+. Полная амплитуда рас- рассеяния, которая в нашем случае должна строиться из волновых функций В[ и Mk начального состояния из волновых функций В[ и м[ конечного состояния, является унитарным инвариан- инвариантом наиболее общего вида. Ее можно записать в виде следую- следующей комбинации из девяти скалярных слагаемых: / = fx (ВВ) (ММ) + f2 (BM) (MB) + /3 (ВМ) (ВМ) + + /5 (ВВММ) + /5 (ВВММ) + /6 (ВММВ) + + f7 (ВММВ) + /8 (ВМВМ) + /9 (ВМВМ). A39,3) Для краткости взятие следа от произведения матриц типа В и М обозначено здесь круглыми скобками, так что, например, (ВМВМ)= BJAf/flUf/ и т. д.
§ 139] СЛЕДСТВИЯ СТРОГОЙ УНИТАРНОЙ СИММЕТРИИ 581 Входящие в амплитуду A39,3) величины fa являются неизвест- неизвестными, но одинаковыми для всех мезон-барионных процессов, функциями пространственно-спиновых переменных. Мы уже знаем, что рассматриваемые процессы описываются восемью независимыми амплитудами (без учета инвариантно- инвариантности относительно обращения времени). Поэтому между девятью инвариантами, входящими в A39,3), должно существовать одно соотношение. Оно действительно есть: {ВВ) (ММ) + (ВМ) (MB) + (ВМ) (ВМ) = = {ВВММ) + (ВВММ) + (ВММВ) + (ВММВ) + + (ВМВМ) + (ВМВМ\ A39,4) в чем нетрудно убедиться непосредственным расчетом. Вообще говоря, установление соотношений типа A39,4) практически оказывается затруднительным, но это и несущественно, так как если считать все девять слагаемых формально независимыми, в окончательные результаты функции fa автоматически войдут в виде ровно восьми независимых комбинаций. Как известно, при операции обращения времени всякая вол- волновая функция переходит в комплексно сопряженную, причем начальное и конечное состояния переставляются1); в нашем случае Bl Щ>, М{, Ш-»В?9 Bl Mi, Mlk. A39,5) При такой замене первые семь членов в A39,3) не изменяются, а два последних переходят друг в друга, так что из инвариант- инвариантности относительно обращения времени следует f8 = /9, причем с учетом соотношения A39,4) их можно положить равными нулю и работать лишь с семью первыми инвариантными ампли- амплитудами. Теперь с помощью процедуры, полностью аналогичной той, которая описана в конце § 136, амплитуды всех 27-ми реаль- реальных процессов можно выразить через семь независимых функ- функций /а, например, A39,6) и т. д. 1) См., например, Л. Д. Ландау, Е. М. Лифшиц, Квантовая меха- механика, Физматгиз, 1963,
gg2 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV Исключая функции /а, будем иметь соотношения между ампли- амплитудами различных процессов.' Так, из A39,6) следует: f (я-р -> /С+2Г) = / (R°p -> /С+3°), A39,7) р->К-р)-!(л-р->71-р) = {(К-р-±л-?+) A39,8) откуда для сечений получается, что а (я"р -> К+2Г) = а (* °р -> /С+2°) A39,9) Уа(я"р->я"р) - Vo(K~~p^K~p)<Vo(lCp-+ii-2+). A39,10) Сечение, стоящее в левой части равенства A39,9), имеет большое значение, а сечение справа является малым, так что при анализе этих процессов нужно существенно учитывать на- нарушение унитарной симметрии сильными взаимодействиями. С другой стороны, неравенство A39,10) во всей энергетической области выполняется. Мало того, при высоких энергиях, когда сечение о(К~р—»я~2+) весьма мало, A39,10) переходит в ра- равенство а (л~р -> п~р) ?ё а {К~р -> /С"р), A39,10а) которое хорошо согласуется с экспериментальными данными. Следует заметить, что интерпретация теоретических предска- предсказаний строгой унитарной симметрии и их сравнение с экспери- экспериментом является достаточно сложным делом, так как предва- предварительно нужно выяснить, в какой энергетической области можно пренебречь нарушением SUC)-инвариантности. Кроме того, в сечения различных процессов входят кинематические множители, которые различны, так как содержат массы частиц, участвующих в реакциях. С другой стороны, выписанные выше соотношения предполагают равенство масс частиц, входящих в один мультйплет. Поэтому из соотношений между амплиту- амплитудами фактически получаются соотношения не между сечениями, а между их отношениями к кинематическим факторам, так что из эксперимента следует брать некоторые «исправЛенные» зна- значения сечений. § 140. Понятие о нарушенной унитарной симметрии Выше неоднократно подчеркивалось, что реальное сильное взаимодействие нарушает строгую унитарную симметрию, но в пренебрежении электромагнетизмом изоспин Т и гиперзаряд У еще сохраняются. Поэтому плотность гамильтониана взаимо- взаимодействия не может быть унитарным скаляром, но должна быть
§ 140] ПОНЯТИЕ О НАРУШЕННОЙ УНИТАРНОЙ СИММЕТРИИ 583 изоскаляром (Т — 0) и отвечать нулевому гиперзаряду (У = 0). Таким образом, среди компонент унитарных мультиплетов сле- следует отыскать такие, для которых Т = Y = 0. Из формулы A38.5) для максимального значения изоспина видно, что все индексы этих компонент должны быть тройками, так что вы- выполняются равенства р3 = Р и q% = q. Но тогда из выражения A38.6) для гиперзаряда сразу приходим к условию р — q = 0. Так, нулевыми изоспином и гиперзарядом обладают только ком- компоненты симметричных мультиплетов типа (/?,/?), т. е. мульти- плетов A,1) = 8, B,2) = 27 и т. д., каждый индекс которых ра- равен 3. Поэтому плотность гамильтониана сильного взаимодей- взаимодействия должна иметь следующую общую структуру; ^int = ?о#о + ёМ + иМ + ¦ ¦ • A40,1) Как только введены нарушающие унитарную симметрию чле- члены, существовавшее ранее квантовомеханическое вырождение должно сняться, т. е. массы частиц, принадлежащих одному мультиплету, расщепятся. Для вывода массовых формул вве- введем оператор М, собственные значения которого равны массам изомультиплетов с определенным гиперзарядом (вследствие изоспиновой инвариантности от проекции Г3 они не зависят): M\p,q; T,Y) = m\p,q; T9Y). A40,2) В предположении строгой унитарной симметрии массовый опе- оператор будет инвариантом группы S(/C), и его собственные зна- значения в данном мультиплете будут одинаковыми. Естественно считать, что при нарушении унитарной симметрии М приобре- приобретает структуру, аналогичную A40,1), причем будет считаться, что g2 < gu откуда M = Mo + Ml A40,3/ Удобно ввести матрицу М массового оператора М = (р, q; Г, Y' \ M \ p, q\ Г, Г), A40,4) которая вследствие A40,2) диагональна, причем ее элементы определяют массы членов мультиплета. Эта матрица представ- представляет некоторую билинейную комбинацию волновой функции q/1'"/7 данного мультиплета (/?,#) и волновой функции 1\ -•• 1р Ф Г" ? сопряженного мультиплета (q,p). Из A40,3) следует, что она должна содержать инвариантную часть и слагаемое, соответствующее 3 — 3-компоненте октуплета. Из указанных
534 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ (ГЛ. XV волновых функций можно построить один скаляр и два октуплета поэтому "!;-,.»ф!;"'!г8* A40'5) где ао = т3— ai 3 **2 , а /п0, аь Я2— некоторые параметры. Та- Таким образом, в общем случае массовая формула содержит мак- максимум три параметра (для мультиплетов типа (Зп, 0) и @, Зп) только два, так как в этих случаях имеются лишь верхние или нижние индексы), из которых т0 отвечает массе членов муль- типлета в предположении строгой унитарной симметрии. Заме- Заметим, что согласно Фейнману для бозонных мультиплетов вместо матрицы М нужно рассматривать матрицу М2, так как бозоны, в отличие от фермионов, подчиняются уравнению второго по- порядка. Для октуплета барионов спина 1/2+ формула A40,5) перехо- переходит в такую: М = <ъВ)в[ + а\Ъ)в[ + а2Шв1 A40,6) Используя A38,10) и вычисляя матричные элементы, соответ- соответствующие каждому бариону, получим mN — а0 + п2> ms = a0 + ai, ms = аОу ша = по + -j (a{ + а2). Отсюда следует массовая формула Гелл-Манна ms = 2 (mN + ma), A40,7) которая хорошо согласуется с опытом: справа 4518 Мае, слева 4535 Мэв, т. е. точность примерно 0,4%. Учитывая, что в окту- плете псевдоскалярных мезонов на месте нуклона стоит /(-ме- /(-мезон, а на месте 3-гиперона ?-мсзон, причем массы К и К
§ 140] ПОНЯТИЕ О НАРУШЕННОЙ УНИТАРНОЙ СИММЕТРИИ 585 равны, из аналога A40,7) имеем Зт\ + т1 = 4т*к. A40,70 Это соотношение согласуется с опытом с точностью 5%. В слу- случае векторных мезонов ситуация осложняется наличием со — ф- смешивания (см. § 138), и мы ее обсуждать не будем. Для декуплета частиц спина 3/2+ формула A40,5) перехо- переходит в __ М = b0BUkBiJk + bxB^BHh A40,8) откуда, используя результаты § 138, получим ttlQ= { Из этих формул следует правило интервалов mz* ~ тд = та* ~ mz* = mQ~ ^s- A40,9) Для первого равенства имеем 147 и 145 Мэв (точность поряд- порядка 1 %), а из второго можно предсказать массу ?2~-гиперона — 1676 Мэв, что было блестяще подтверждено экспериментом: то, = 1675 Мэв. Окубо вывел общую массовую формулу, справедливую для всех унитарных мультиплетов: b(p, q)BY + c(p, д)[т(Т+ 1)- ly*]. A40,10) В случае нарушенной SUC)-симметрии амплитуды рассея- рассеяния одного унитарного мультиплета на другом уже не будут инвариантными; наряду со скалярной частью они будут содер- содержать 3-3 компоненты октуплета. Для примера распишем пер- первый член в формуле A39,3), который теперь принимает вид u 0 (ВВ) (ММ) + fu ^fi' (AfAf) + fu ( A40,11) Ввиду огромного количества независимых произвольных пара- параметров, возникающих в такой схеме, ее эвристическая ценность резко падает, так как доставляемая ею физическая информа- информация становится весьма малой. Однако если принять правдоподобную и оправданную экс- экспериментально гипотезу Л. Б. Окуня и И. Я. Померанчука, что
536 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV асимптотически ори очель высоких энергиях сечения неупругих процессов, идущих с перезарядкой, пренебрежимо малы по сравнению с сечениями обычного упругого рассеяния, то в этой энергетической области в A39,3) останется лишь первый член. Тогда, в предположении строгой унитарной симметрии, получим асимптотическое равенство амплитуд упругого рассеяния я-, г)-, К- и ^-мезонов на барионах: ?-?-?-/?• A40,12) В случае нарушенной симметрии нужно использовать формулу A40,11), откуда следует соотношение между амплитудами, ана- аналогичное массовому: = 2 (/~ + /|). A40,13) В заключение этого параграфа заметим, что примерно таким же способом можно исследовать изоспиновую симметрию, на- нарушенную электромагнитным взаимодействием с плотностью гамильтониана A35,10). Предоставляем читателю в качестве полезного упражнения самостоятельно получить, например, сле- следующие формулы для изомультиплета 2 и изоквартета Д: + ms-) A40,14) тд++ - mA- = 3 (тд+ - тдо). A40,15) § 141. Составные модели в схеме унитарной симметрии. Кварки В начале § 134 упоминалось, что я-мезон (вообще говоря, и все прочие нестранные адроны) можно мыслить как частицу, состоящую из нуклона и антинуклона. Естественно попытаться сформулировать аналогичную «минимальную» модель, в кото; рой все адроны конструируются из небольшого числа каких-то частиц, объявляемых в известном смысле фундаментальными. Для этого к нуклону, носителю барионного числа и изоспина (а значит, и электрического заряда), необходимо добавить еще по крайней мере одну частицу, которая обладала бы странно- странностью. Наиболее экономную модель такого типа предложил в 1956 г. Саката, который в качестве фундаментальных частиц выбрал р, п, А и р, Я, Л и предположил, что между любым фун- фундаментальным барионом и антибарионом существует притяже- притяжение, а между двумя барионами или антибарионами — оттал- отталкивание. Волновые функции известных в то время адронов
§ 141] СОСТАВНЫЕ МОДЕЛИ. КВАРКИ 587 строились следующим образом: я+ рЯ п- рп n° К+ = рК К° = пА, К~ = рЛ, K° = nA; A41,1) 2+ = рпА = я+Л, S" = р/гЛ = лГЛ, 2° = yL (pp - яЯ) Л = я°Л; S" = рЛЛ = /СЛ, S0 = ЯЛЛ = ^°Л. Эта модель развивалась Марковым, Окунем и другими учеными, и с ее помощью удалось получить большое количество интерес- интересных физических результатов. Оказалось, что модель Сакаты очень хорошо укладывается в схему унитарной симметрии, если пренебречь различием в мас- массах нуклона и Л-гиперона. Для этого достаточно считать, что эти частицы образуют триплет A,0), а соответствующие анти- античастицы— сопряженный триплет @,1): S'-(j5, Я, А). A41,2) Оператор проекции изоспина A38,1) для р, п и Л дает правиль- правильные значения +1/2, —1/2 и 0, но оператор гиперзаряда A38,2) нужно модифицировать так, чтобы вместо дробных значений он приводил к У=+1, +1, 0 соответственно. Положим, по-опре- по-определению, 1 А ' 2-ВГ, A41,3) так что вместо A38,6) теперь будем иметь ^ ^B. A41,4) Из требования целочисленности гиперзаряда, учитывая, что для мезонов В = 0, приходим к старому соотношению р — q = Зя, т. е. эти частицы и в модели Сакаты должны заполнять унитар- унитарные синглеты, октуплеты и т. д. Для барионов же В = 1 и вме- вместо A38,7) получим p-q = 3n-~2f A41,5) т. е. барионы должны заполнять унитарные триплеты A,0) = 3, секступлеты @,2) = 6, 15-плеты B,1)= 15 и т. д. Пользуясь
588 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТ \РНЫХ ЧАСТИЦ 1ГЛ XV формулами A38,5) и A41,4), сразу находим значения изоспина и гиперзаряда для компонент этих мультиплетов: Компоненты Фа Фз Ф33 Ф°а Ф«> (а, Y 1 0 2 1 0 *-1,2) Г 1/2 0 0 1/2 1 Компоненты ФаЬ Фза CD u - тт* !О Шок "г* 0 tCDo I • по q |_ а • «30 с? • oaj Фзз ъ +16ь з ФЗз У 2 1 1 0 0 -1 г 1 1/2 3/2 0 1 1/2 Заполнение адронов по указанным мультиплетам соответ- соответствует их волновым функциям A41,1). Действительно, мезоны строятся из «сакатона» Si и антисакатона 3\ и их волновые функции преобразуются по прямому произведению 3 ® 3, кото- которое в своем разложении A37,4а) содержит как раз представле- представления 1 и 8. Барионы строятся из двух сакатонов и одного анти- сакатона_, а разложение A37,4в) прямого произведения 3 ® 3 ® 3 включает именно нужные представления 3, 6 и 15. Из таблицы видно, что 2-гиперон следует поместить по край- крайней мере в секступлет, который включает нуклоноподобную ча- частицу и частицу с У= +2, Т = О, которые должны иметь спин 1/2+. Эти частицы до сих пор не обнаружены, хотя запретов на их существование не имеется. S-гиперон должен входить в 15-плет, в котором остается большое количество незанятых мест, а Q-гиперон вообще нельзя включить ни в один из низших муль- мультиплетов. Таким образом, классификация адронов, основанная на модели Сакаты, гораздо менее удовлетворительна, чем в вось- восьмеричном формализме. Кроме того, она привела к ряду выво- выводов, прямо противоречащих эксперименту: например, в модели Сакаты запрещен наблюдавшийся процесс р + р->к1 + K°s- Желая сохранить все преимущества составных моделей, с одной стороны, и восьмеричного формализма, с другой, Гелл- Манн, и независимо Цвейг, в 1964 г. предложили отказаться от модификации оператора гиперзаряда A38,2) и в то же время считать, что имеется унитарный триплет Я\ <7з/
141] СОСТАВНЫЕ МОДЕЛИ. КВАРКИ 589 частиц, обладающих весьма непривычными свойствами. Из A38,4) — A38,6) и A38,9) следует, что они имеют такие кван- квантовые числа (барионное число равно 1/3 по определению): Частица й\ Яг из Q +2/3 -1/3 -1/3 т 1/2 1/2 0 Гз + 1/2 -1/2 0 s 0 0 в 1/3 1/3 1/3 У + 1/3 + 1/3 -2/3 (квантовые числа античастиц, все, кроме 7\ имеют противопо- противоположный знак), т. е. электрический заряд, барионное число и гиперзаряд этих частиц являются дробными. Этими свойствами они и обязаны своему названию — кварки (нечто непонятное и мистическое из одного из романов английского писателя Д. Джойса). Мезоны строятся из одного кварка и одного антикварка и вследствие A37,4а) размещаются по унитарным синглетам и октуплетам. Если пара q — q находится в ^о-состоянии, то ее полный спин равен нулю, а четность отрицательна, и мы полу- получаем псевдоскалярные мезоны с волновыми функциями К = y=r {q{q{ + q2q2 - 2qsq3); X° = -~ {qxqx A41,7) где Х° — резонанс в системе яят] с массой 960 Мэв и с Т = = У = 0, являющийся унитарным синглетом. Если пара q — g на- находится в ^-состоянии, то ее спин равен 1~, и мы приходим к векторным мезонам р, /С*, а/ и q/, волновые функции которых строятся аналогично A41,7). Так как для кварка В= 1/3, то система из трех таких частиц будет иметь барионное число, равное 1, и поэтому ее естественно отождествить с барионом (напомним, что в модели Сакаты барионы строятся из двух частиц и одной античастицы). Волновая функция системы q — q — q преобразуется по представлению 3 ® 3 ® 3 и поэтому из разложения A37,46) следует, что в модели кварков, как и в восьмеричном формализме, барионы заполняют унитарные синглеты, октуплеты и декуплеты. Если спины двух кварков параллельны, то существует девять состояний 1/2+, из которых одно является унитарным синглетом, а восемь остальных при- принадлежат унитарному октуплету. Если спины всех трех кварков
590 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ [ГЛ. XV параллельны, то получаем 10 состояний 3/2+, образующих де- куплет. Мы не будем рассматривать динамические следствия модели кварков и некоторые присущие ей трудности, отсылая читателя к соответствующей литературе1). Остановимся коротко лишь на проблеме реальности существования этих необычных частиц. Если кварки действительно существуют, то их мир должен быть почти не зависимым от обычного: из дробности заряда выте- вытекает, что самый легкий из кварков должен быть абсолютно ста- стабильным, причем рождаться они могут только в виде пары кварк — антикварк, например, в результате бомбардировки обычной материи космическими лучами. Поэтому с течением времени общее количество кварков, содержащихся в земной коре и в водах океана должно постепенно увеличиваться. Од- Однако многочисленные попытки найти эти «реликтовые» кварки с помощью прецезионной аппаратуру пока успехом не увенча- увенчались. Не удалось открыть их и в экспериментах на ускорите- ускорителях— установлена лишь нижняя граница для их массы: тд > 5 Гэв E-Ю3 Мэв). Это говорит о том, что если адроны действительно построены из кварков, то их энергия связи дол- должна быть колоссальной. В такой ситуации все большее число физиков (в том числе и сам Гелл-Манн) начинает склоняться к мысли, что если кварки и существуют, то они не могут нахо- находиться в свободном состоянии, а подобны квазичастицам, напри- например, фононам, в твердом теле. Некоторые крупные ученые (Гейзенберг, Чью и др.) относятся к гипотезе кварков резко отрицательно. Но, несмотря ни на что, модель кварков является весьма привлекательной и даже в самом худшем случае она является очень удобным математическим инструментом для формули- формулировки унитарной симметрии. Ближайшее будущее должно дать ответ на один из кардинальных вопросов современной физики элементарных частиц: реальны ли кварки, и если да, то в ка- каком смысле, или они являются чисто математической фик- фикцией? § 142. Общая оценка унитарной симметрии Из содержания предшествующих параграфов видно, что в последние годы физика элементарных частиц благодаря ги- гипотезе о приближенной инвариантности сильного взаимодействия относительно группы SUC) весьма значительно продвинулась *) См., например, обзор Е. М. Левина и Л. Л. Франкфурта в УФН 94, 243 A968) и достаточно популярный обзор Я. Б. Зельдовича в УФН 86, 203 A965).
§ 142] ОБЩАЯ ОЦЕНКА УНИТАРНОЙ СИММЕТРИИ 591 вперед. Успехи унитарной симметрии многочисленны и впечат- впечатляющи. 1. Все стабильные адроны и низко лежащие резонансы раз- размещены по унитарным мультиплетам, члены которых обладают одним и тем же спином, четностью и барионным числом: окту- плет мезонов 0", октуплет барионов 1/2+, декуплет 3/2+, нону- плеты мезонных резонансов 1" и 2+ и некоторые другие. Не об- обнаружено ни одной частицы, которую в принципе нельзя было бы поместить в один из унитарных мультиплетов не очень вы- высокой размерности. 2. Весьма привлекательной является модель кварков, кото- которая позволяет построить все адроны из трех фундаментальных частиц и их античастиц. 3. Получены отличные массовые формулы для изомульти- плетов, лежащих внутри одного унитарного мультиплета, кото- которые очень хорошо согласуются с эмпирическими данными. 4. Удалось установить целый ряд соотношений между кон- константами связи барионов с мезонами, которые в большей части еще требуют экспериментальной проверки. 5. Выведены соотношения между сечениями различных про- процессов; при аккуратном учете некоторых дополнительных об- обстоятельств ни одно из них не находится в резком несогласии с экспериментом. 6. При учете электромагнитного взаимодействия получены массовые формулы для отдельных членов изомультиплетов, вхо- входящих в унитарный мультиплет. Например, из теоретического соотношения (тп — тР) ~ (mz° "" твг) = Щг - mz+ A42,1) был предсказан знак разности масс S0- и 5"-гиперонов. Впо- Впоследствии это предсказание было подтверждено эксперимен- экспериментально. 7. Выведены соотношения между магнитными моментами барионов, принадлежащих одному унитарному мультиплету. В частности, показано, что для членов октуплета 1/2+ имеют ме- место равенства ^3 = ^2-» К = 2^лв - 2*V- A42,2) 8. Наконец, Каббибо в схему унитарной симметрии удалось включить и слабое взаимодействие, благодаря чему эта теория приобрела известную стройность и законченность. Первые пять пунктов обсуждались в § 138—141, а на осталь- остальных мы не останавливаемся, отсылая читателя к литературе1). 1) См., например, монографию Нгуен Ван Хьеу, Лекции по теории унитарной симметрии элементарных частиц, Дтомиздат, 1967.
592 основы теории элементарных частиц [гл. xv С другой стороны, гипотеза унитарной симметрии обладает рядом существенных недостатков. 1. Прежде всего, теоретико-групповая схема не содержит элементов динамики, и она должна быть лишь частью некото- некоторой будущей теории элементарных частиц. 2. Совершенно открытым остается вопрос о природе унитар- унитарной симметрии и ее нарушения. По этому поводу высказы- высказываются различные точки зрения: а) унитарная симметрия является фундаментальным свой- свойством сильного взаимодействия, которое присуще ему так же, как, скажем, инвариантность относительно преобразований из группы Лоренца; в этом случае она нарушается или умеренно сильным взаимодействием, константа связи которого имеет по- порядок 0,1 (напомним, что константа связи сильного взаимодей- взаимодействия равна примерно 14) или благодаря взаимодействию с ва- вакуумным состоянием, которое может обладать сложной струк- структурой (так называемое спонтанное нарушение симметрии); б) унитарная симметрия является приближенной по самой своей природе, «следствием сложной игры различных факто- факторов»1); в этом случае ставить вопрос о природе нарушения St/C) -инвариантности не приходится, и требование, чтобы обя- обязательно существовал унитарный триплет частиц — кварки, яв- является бессмысленным; в) существует строго унитарно-симметричное сверхсильное взаимодействие, a SUC)-инвариантность нарушается в резуль- результате включения реального сильного взаимодействия; такая си- ситуация аналогична тому, что имеет место в случае изоспиновой симметрии. 3. Модель кварков в своем первоначальном варианте, опи- описанном в § 141, содержит ряд логических трудностей. Одна из них состоит в том, что при попытке построения адронов из трех кварков пространственно-спиновая часть волновой функции оказывается антисимметричной по отношению к перестановке кварков, что является необычным для низшего состояния. При попытке преодолеть эту трудность кварку приписывалось новое квантовое число, что эвивалентно рассмотрению не трех, а де- девяти кварков, благодаря чему стройность и изящество построе- построения теряются. Были даже предложения считать, что кварки удовлетворяют не статистике Ферми — Дирака, а некоторой но- новой, так называемой парастатистике, в которой числа заполне- заполнения могут принимать, скажем, значения 0,1 и 2. 4. Унитарно-симметричная схема обладает целых рядом дру- других, не столь принципиальных, но все же существенных недо- недостатков, которые мы просто перечислим: 1) Дж. Чью, Аналитическая теория 5-матриц. «Мир», 1968,
§ 142] ОБЩАЯ ОЦЕНКА УНИТАРНОЙ СИММЕТРИИ 593 а) не вполне ясна ситуация с размещением по мультиплетам высших резонансных состояний, например, не выяснен вопрос, куда следует помещать частицу Лио5> имеющую спин 1/2—, б) нет окончательного решения проблемы ю — ср-смешивания; в) остается вопрос, почему же все-таки в массовую формулу для барионов входит сама масса, а в массовую формулу для мезонов — ее квадрат; г) существует явное противоречие между огромной точно- точностью массовой формулы для декуплета 3/2+ и плохими соотно- соотношениями для вероятностей распада этих резонансов и т. д. Следует отметить также, что по целому ряду причин рамки группы SUC) оказываются слишком узкими: Г) она не включает барионное число; 2) параметры со — ф-смешивания не предсказываются, а вво- вводятся в теорию извне; 3) имеется ряд межмультиплетных соотношений, указываю- указывающих на корреляцию унитарных квантовых чисел с обычным спи- спином; так, например, параметры, входящие в формулу Окубо A40,10) для октуплета и декуплета барионов, оказывается по- почти равными, имеет место массовая формула т\,-т\ = т\-т\% и т. д.; A42,3) 4) некоторых физиков не удовлетворяет дробность зарядов кварков, что требует исправления соотношения Гелл-Манна — Нишиджимы путем введения в него нового квантового числа, а значит, и повышения ранга основной группы симметрии. При попытке частичного преодоления указанных недостат- недостатков была сформулирована теоретическая схема, инвариантная относительно группы SUF), которая описывает и унитарную симметрию и спиновые свойства частиц одновременно. Псевдо- Псевдоскалярные и векторные мезоны заполняют мультиплет размер- размерности 35 этой группы (у каждого мезона 0~ одно спиновое со- состояние, а у мезона 1~ — три спиновых состояния, так что если включить еще унитарно-скалярную частицу 1~, то всего полу- получим 8-1 +8-3+ 1-3 = 35 членов мультиплета), а барионы 1/2+ и 3/2+ — 56-плет (8-2+10-4 = 56). Наиболее впечатляющим результатом группы SUF) является формула для отношения магнитных моментов протона и нейтрона: щ/|1р~-2/3 A42,4) (при экспериментальном значении — 0,68). Но группа SUF) является существенно нерелятивистской и непригодна, напри- например, для описания процессов рассеяния частиц. При попытке же ее релятивизации возникли неопреодолимые трудности. Пути дальнейшего развития теории должен по-видимому под- подсказать эксперимент.
594 ОСНОВЫ ТЕОРИИ ЭЛЕМЕНТАРНЫХ ЧАСТИЦ Таблица стабильных элементарных частиц [ГЛ. XV Класс Фотон L-0 2 II §^ Bf t? II О я II So- о ш Частица Y р п А S" 2° S0 2" Q Масса, Мае 0 0 0 0,511 105,66 139,58 134,98 139,58 493,8 497,9 548 938,25 939,55 1115,6 1189,5 1192,6 1197,4 1314,7 1321,2 1674 Спин и чет- четность г 1/2 1/2 1/2 1/2 0~ 0~ (Г }.«¦ ] 1/2+? 3/2+? Время жизни, сек со оо со со 2,2-10-6 2,6- 10""8 0,89- 10~16 2,6-10"8 1,24- 10"8 0,87- 10"0 5,73- 10~8 -.0"» со -103 2,54-10~10 0,8- КГ10 < 1 • ю-14 1,65- Ю-10 з.ю-10 1,74- 10"0 ~1.1<Г" Основные распады — - YY лече\ я|хг^; pe~~V(> рл \ пл лГ- Sic; ЛК+ 5 - - - - - 0 + 1 0 }° -1 -1 )-2 -3 т - - - —• - 1 1/2 0 Jl/2 0 1 М/2 0 г. - - - - - -fl 0 -1 + 1/2 -1/2 0 + 1/2 -1/2 0 + 1 0 -1 + 1/2 -1/2 0
§ 142] ОБЩАЯ ОЦЕНКА УНИТАРНОЙ СИММЕТРИИ Таблица наиболее важных резонансов 595 Класс Я о 03 ? II со О) ? Частица СО ф / р* р° 4 ^1236 ^1385 ^1530 Масса, Мэв 783 1019 1250 774 780 892 1236 1382 1530 Спин и четность 1" 1" 2+ } ¦- 1" 3/2+ 3/2+ 3/2+ Ширина '), Мэв 12 4 НО | 128 50 120 40 7 Основные распады я+я~я°; п°у А А , ArAoJ ЯЯ ЯЯ Кп Nn Ля; 2я 2я 0 0 0 } ° + 1 0 1 -2 т 0 0 0 }¦ 1/2 3/2 1 1/2 *) Время жизни т связано с шириной Г соотношением неопределенно- неопределенности АЕ А/ ~ h, т. е. т — Й/Г.
ЧАСТЬ VI КВАНТОВАЯ СТАТИСТИКА И ФИЗИЧЕСКАЯ КИНЕТИКА ГЛАВА i КВАНТОВАЯ СТАТИСТИКА § 1. Статистическая матрица и статистический оператор В первой главе этой части будут рассмотрены некоторые вопросы статистической физики, существенно связанные с ис- использованием представлений квантовой механики. В квантовой механике под системой частиц мы подразуме- подразумевали сравнительно ограниченное их собрание. Однако, как и в классической физике, необходимо совершить переход к си- системам с весьма большим числом частиц. Иначе говоря, необ- необходимо найти способ перехода от квантовой механики к кван- квантовой статистике. При изложении статистической физики в ч. III с самого на- начала были учтены те глубокие изменения, которые вносят в нее квантовые явления. Именно, при вычислении функции состоя- состояний проводилось суммирование по уровням энергии системы; статистический вес состояний определялся на основе допуще- допущения о том, что каждому состоянию отвечает ячейка в фазовом пространстве объемом BяйK. Иными словами, с самого начала статистическая физика строилась в квазиклассическом прибли- приближении. Кроме того, мы видели, что тождественность квантовых частиц приводит к фундаментальному изменению свойств их статистических ансамблей. В квантовой механике было дано обоснование квазикласси- квазиклассического приближения и, тем самым, до известной степени по- получили свое оправдание те основные положения, на которых строилось наше изложение статистической физики. Сейчас мы перейдем к более последовательному построению квантовой статистической физики. Рассмотрим некоторую подсистему, взаимодействующую со средой. Среда и подсистема вместе образуют замкнутую си- систему, поведение которой описывается волновой функцией Ч?. Это волновая функция зависит как от состояния частиц под- подсистемы, так и от состояния частиц среды. Поскольку подси-
§ 1] МАТРИЦА И ОПЕРАТОР 597 стема взаимодействует со средой, нельзя найти волновую функцию подсистемы, которая зависела бы только от коорди- координат частиц системы, но не зависела от координат частиц среды. Поэтому незамкнутой подсистеме нельзя приписать собственную волновую функцию. Иными словами, состояния незамкнутой подсистемы образуют совокупность смешанных состояний. Ча- Часто кратко это формулируют словами «незамкнутая подсистема находится в смешанном состоянии». Нас, как всегда в статистической физике, будут интересо- интересовать средние по времени (или по ансамблю) значения вели- величин L. Чтобы не смешивать это среднее с обычным кантово- механическим усреднением, мы будем обозначать статистиче- статистическое среднее символом (L). Сопоставим величине L оператор L. Его квантовомеханическое среднее есть A,1) Здесь L и L относятся к квазизамкнутой подсистеме и за- зависят только от величины ее описывающих, тогда как интегри- интегрирование ведется по всей замкнутой системе. Рассмотрим теперь нашу квазизамкнутую подсистему. Пол- Полностью отключим ее взаимодействие с внешней средой. Тогда наша подсистема из квазизамкнутой превратится в замкнутую. Гамильтониан квазизамкнутой подсистемы /? + #шь где #int описывает ее взаимодействие со средой, перейдет в гамильто- гамильтониан Н. Для ясности, мы будем такую малую замкнутую си- систему именовать замкнутой подсистемой. Очевидно, что замк- замкнутая подсистема обладает свойствами, совершенно отличными от квазизамкнутой подсистемы. Ее состояния не зависят от со- состояния внешней среды и, следовательно, являются чистыми состояниями. Замкнутая подсистема может описываться неко- некоторой волновой функцией. Если через п обозначить совокуп- совокупность квантовых чисел, характеризующих состояние замкнутой подсистемы, то совокупность волновых функций г|эп этой под- подсистемы образует полный набор ортонормированных функций. Поэтому можно написать разложение Т-2М>Л. A,2) Коэффициенты сп зависят от переменных, характеризующих со- состояние частиц внешней среды и времени. При этом, однако, их всегда можно считать удовлетворяющими условию норми- нормировки SlcJ2=l. A,3)
598 КВАНТОВАЯ СТАТИСТИКА [ГЛ. I Подставляя разложение A,2) в определение квантовомехаии- ческого среднего, мы получаем L— V4 * Г .*"?, 1 Х.ч * г /1 л\ —— т р Р I in / ill /It — т р р I I I /ll ^^1 П tn J ¦ rt ' /71 ,4щ4 rt /71 /1/71 \ г / n, m n, m Формула A,4) дает полное квантовомеханическое описание ве- величины L. Ее неопределенность, т. е. тот факт, что L может принимать^ любые значения и мы можем найти лишь среднее значение L, связана с существом квантовомеханического описа- описания. Если бы подсистема была замкнутой, то коэффициенты сп не зависели бы от времени и |сп|2 давало бы вероятность найти замкнутую подсистему в п-м состоянии. В незамкнутой под- подсистеме коэффициенты сп таким свойством не обладают. Перейдем теперь к статистическому среднему для квазизам- квазизамкнутой подсистемы = S<c Lnm. A,5) Усреднение по времени проводится за время, большое по срав- сравнению с микроскопическими временами. Введем теперь матрицу, определяемую совокупностью эле- элементов с*пст . Элементы этой матрицы равны j. Тогда A,5) можно представить в виде (L)=2iSmnLnm. A,7) п, т Введем, далее, оператор р, матричные элементы которого суть pnm. Матрица рпт носит название статистической матрицы или матрицы плотности, а оператор р — статистического опера- оператора. Тогда, очевидно, последнюю формулу можно представить в виде (L) = S (S smnLnm) = 2 (pl)nn = Sp pL A,8) п \ т ) п Мы видим, что для нахождения статистического среднего некоторого оператора L нужно знать матрицу плотности (или статистический оператор), заменяющую функцию распределения классической статистики. В статистическом среднем сделан дальнейший шаг по срав- сравнению с квантовомеханическим средним: учтено взаимодействие со средой, имеющее весьма сложный характер. Поэтому точный учет этого взаимодействия заменен усреднением по времени всей совокупности коэффициентов с*пст~>с*пст. Ясно, что по
§ 1] МАТРИЦА И ОПЕРАТОР 599 сравнению^ с квантовомеханическим описанием (т. е. заданием величин L) статистическое описание (задание величин (L)) является неполным. При описании системы с помощью волновой функции можно, например, указать точные возможные значения различных ве- величин, характеризующих систему как целое, даже единственное возможное их значение. При описании с помощью статистиче- статистической матрицы подобные предсказания невозможны и мы вы- вынуждены ограничиться вычислением статистических средних. При образовании статистического среднего автоматически учте- учтены особенности квантовомеханичёского описания. Ситуация здесь в точности такая же, как в классической механике и ста- статистике. При переходе к системе с весьма большим числом частиц динамическое описание заменяется статистическим. И именно последнее адекватно физическим свойствам системы. Мы хотели бы предостеречь от неправильного понимания статистического усреднения в квантовой механике как простой последовательности двух усреднений — квантовомеханичёского и статистического. Выполнение квантовомеханичёского усредне- усреднения согласно общей формуле требует задания волновой функ- функции. Незамкнутая подсистема находится в смешанном состоя- состоянии и не обладает никакой волновой функцией. Усреднение в формуле A,1) производится по существующей, но неизвестной волновой функции замкнутой системы (подсистема + среда). Ясно, что нахождение волновой функции ^? представляет за- задачу нереальной сложности. Смысл формулы A,7) заключается в том, что для нахожде- нахождения статистических средних не требуется ни отыскание волно- волновой функции Ч? замкнутой системы, ни детальное описание по- поведения квазизамкнутой подсистемы. Для нахождения среднего (L) нужно знать лишь матрицу плотности р (или эквивалентный ей статистический оператор) и матричные элементы L. Последние вычисляются с помощью волновых функций замкнутой подсистемы и определяются толь- только свойством последней. Ситуация оказывается весьма сходной с классической ста- статистикой. Для вычисления средних нужно задать функцию рас- распределения и свойства (кратность вырождения состояний) под- подсистемы без учета ее взаимодействия со средой. Подчеркнем, что до сих пор мы никак не специализировали свойства квазизамкнутой подсистемы. Она может содержать как большое, так и малое число частиц. Существенно лишь то обстоятельство, что подсистема находится в смешанном состоя- состоянии. Для любой системы, находящейся в смешанном состоянии, матрица плотности играет роль волновой функции у системы в чистом состоянии.
600 КВАНТОВАЯ СТАТИСТИКА [ГЛ. I § 2. Статистическое распределение в квантовой статистике Найдем зависимость статистического оператора от времени. Для этого рассмотрим среднее значение оператора L, предпо- предполагая, что оператор (L) не зависит от времени явно. Из A,8) следует, что <Z> = Sp(-f-l). B,1) С другой стороны, согласно C1,2) ч. V можно написать l = i [Щ, B,2) где Н — оператор Гамильтона замкнутой подсистемы, к кото- которой отнесен оператор L. Подставляя B,2) в A,8), получаем {Ь - з Sp p [Hi] = ^-{Sp (pHl) - Sp (fLH)} = Для того чтобы оба выражения для {L) совпадали, необходимо принять соотношение ^ = -^[АЯ] = |(рЯ-Яр). B,3) Производная по времени от статистического оператора отли- отличается знаком от производной по времени обычных операторов. В матричном виде формулу B,3) можно представить в виде Формула B,3) (или эквивалентная ей формула B,4)) опреде- определяет эволюцию во времени системы, описываемой матрицей плот- плотности. Она выражает один из самых общих законов природы. Однако явный вид оператора р (или матрицы ртп) неизве- неизвестен и не может быть определен только из уравнения B,3) без использования дополнительных сведений о свойствах подси- подсистемы. Мы ограничимся пока случаем стационарных состоя- состояний, когда матрица плотности не изменяется во времени. Ниже, в кинетике, будут обсуждаться законы изменения состояний во времени. В стационарных условиях формула B,4) дает
§ 21 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ 601 ИЛИ %(PmkHkn-HmkPkn) = 0. B,5) Мы видим, что статистический оператор коммутирует с опера- оператором Гамильтона и является интегралом движения. Перейдем теперь к энергетическому представлению, когда базисные функции фп в разложении A,2) являются собствен- собственными функциями оператора Гамильтона изолированной под- подсистемы В этом случае отличны от нуля только диагональные матрич- матричные элементы Из формулы B,5) следует при этом 2 (pmkbknEn - VkrfikmEm) = 0. B,6) Последнее соотношение показывает, что могут быть отличными от нуля только диагональные элементы статистической мат- матрицы. Если вернуться к определению A,6), то это означает, что <2>7> Последнее равенство еще раз подчеркивает особенности описа- описания с помощью статистической матрицы. Имеющееся взаимо- взаимодействие всегда приводит подсистему в смешанное состояние и нарушает интерференцию между состояниями, характерную для систем в чистом состоянии. Часто соотношение B,7) именуют условием случайных фаз. Действительно, если коэффициенты сп, ст зависят от времени, то фазы отдельных коэффициентов совершенно не коррели- рованы. Усреднение их дает B,7). Удобно обозначить отличные от нуля диагональные элементы статистической матрицы как При этом формула для статистического среднего приобретает знакомый вид (L)=%wnLnn. B,9) п Формула B,9) показывает, что величины тп представляют рас- распределение вероятностей того, что рассматриваемая подсистема попадает в п-е энергетическое состояние.
602 КВАНТОВАЯ СТАТИСТИКА [ГЛ I Нашей дальнейшей задачей является нахождение распреде- распределения вероятностей wn. Рассмотрим прежде всего случай замкнутой системы. В квантовой механике не существует замкнутых систем в пря- прямом смысле этого слова. Всякая реальная система, состоящая из атомов, испытывает взаимодействие с окружающим миром. Это может быть, например, взаимодействие с электромагнит- электромагнитным полем. Более того, в § 34 ч. V мы видели, что полная энер- энергия замкнутой системы не может иметь определенного, постоян- постоянного во времени значения. Поэтому состояния замкнутой системы, содержащей большое число частиц, можно считать смешанными. Имеющиеся взаимодействия, не изменяющие су- существенно энергии системы, приводят к нарушению интерферен- интерференции между состояниями и случайному распределению фаз. Энергию замкнутой системы можно считать заключенной в ин-. тервал 6ег- «С ег«, но постоянно изменяющейся в этом интервале. Гипотеза о том, что макроскопическая система находится в смешанном состоянии, лежит в основе статистической физики. Однако для нахождения явного вида wn необходимо высказать вторую гипотезу. Именно, следует принять, что все состояния замкнутой системы являются равновероятными. Отсюда сле- следует, что wn можно представить в виде микроканонического распределения wn = Q(et). B,Ю) Мы не будем повторять здесь рассуждений § 15 и 16 ч. III, где достаточно подробно обсуждалась гипотеза о равных вероят- вероятностях состояний замкнутой системы. Вывод канонического распределения из микроканонического, данный в § 16 ч. III, имеет вполне общий характер. В этом выводе предполагалось лишь, что квазизамкнутая подсистема является малой частью замкнутой системы, описы- описывающейся микроканоническим распределением. Дискретный ха- характер энергетических условий был уже учтен в приведенном в ч. III выражении для канонического распределения. В квантовой статистике удобнее представить нормированное каноническое распределение в виде is. _i«- ~ kT kT Ч1 \e kT где суммирование ведется по всем состояниям. Функция состоя- ний (статистическая сумма) имеет вид Z=S^=Spren=Se-'Sr. B,12)
§ 21 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ 603 Каждое вырожденное состояние вносит в Z число слагаемых, равное кратности вырождения. Для статистического оператора, отвечающего распределению вероятностей B,11), получаем вы- выражение я P = Ye kT- <2>13) Действительно, если г|)п — собственная функция оператора Я, то можно написать равенство н Средние значения и функция состояний (статистическая сумма) с помощью оператора р могут быть представлены как B,15) Spe kT Z = Spe kT. B,16) При вычислении шпура суммирование ведется по всем состоя- состояниям подсистемы. Заметим, что операторная форма записи B,13) — B,15) не зависит от выбора представления. Точно так же, не повторяя вывода § 59 ч. III, можно рас- рассмотреть системы с переменным числом частиц. Статистический оператор в большом каноническом распре- распределении имеет вид kT где ft — оператор числа частиц и \i — парциальный потенциал. Большая статистическая сумма kT B,18)
604 КВАНТОВАЯ СТАТИСТИКА [ГЛ. I или, в матричной форме, Z (V, Т, ц) = 2 е~ = Ц 2%, B,20) /г, где п — числа заполнения, a z — активность (ср. § 59 ч. III), Zn — функция состояний B,12) для подсистемы из п частиц, т.е. У, С помощью большого канонического распределения могут быть найдены средние значения по формуле A,8). В частности, среднее значение числа частиц в подсистеме =kT^lnZ B,21) Spe kT Уравнение состояния согласно E9,14) ч. III имеет вид pV = kTlnZ. B,22) Мы рассмотрим сначала случай идеального газа, заключен- заключенного в сосуде V. В идеальном газе оператор Н сводится к оператору кине- кинетической энергии ? # S?-. B,23) Соответственно, нормированные волновые функции свободных частиц имеют вид 1 ^ ^(г)==7Те" • B'24) Импульсы частиц в большом объеме можно считать изменяю- изменяющимися практически непрерывно.
§ 2] СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ 605 Полная симметризованная волновая функция газа (ср. F5,6') ч. V) дается общей формулой ? = ~ 2j ( + \)Р №р (*")••• *IV#(r) I- B,25) Очевидно, что Ч1* является собственной функцией оператора Яо, т. е. о * — п * » ^>^w где ? — энергия всего газа. Суммирование ведется по всем .перестановкам, знак ( + ) относится к бозе- и знак (—) к ферми-частицам. Статистическая сумма согласно B,15) и B,23) приобретает вид — о\) с? — ^j х а х. [ZyZ/) Поскольку УР является собственной функцией оператора Яо, мо- можно написать, аналогично B,14), tl о С p~~~kT \If р kf Ш (О 9ЯЛ Так что Z= 2^""^!^ I2. B,29) Суммирование ведется по всем состояниям, т. е. по всем возможным значениям импульсов частиц газа. Поскольку им- импульсы изменяются практически непрерывно, суммирование можно заменить интегрированием, налисав Z=\e *T|Wp- dV B'30> Для вычисления интеграла проще всего написать W для си- системы из двух частиц. Обобщение на N частиц можно получить без труда.
606 КВАНТОВАЯ СТАТИСТИКА [ГЛ. I Итак, вычислим вспомогательный интеграл: г ^2 = -о" в 2mfer I *Pi (Г0 ^Р' (Г2) + ^ (Г0 'Фр! (Г2) Р ^Pl dp2 = Л2-4-О2 -w4' ip2 {r2-rx) ipx (Г2--Г1) X Г 2 = -зрг [2 BnmkTf =F J ^ 2^^ e k dp{X 2 2 r p2 iPi (r2""ri) г Р{ ^LPjJrizLu X J б 2mkT e~ h dp2+ J e 2mkT e h dp{X 2  J б 2mkT e H dp2j =y-2BЯ/П&ГK[l+e 2h2 J = _ (TnmkT)* L 4 — у2 L1 + в J, B,01) где хт = l/ "—W ~~ длина волны частицы с энергией («тепло- вая длина волны» частицы с массой т) и Г\2 = \г2 — г\\. Если обозначить через /^ выражение /^ = ^ ^ , B,32) то B,31) можно представить в виде B,зз) По аналогии с B,31), пользуясь B,32) и подставляя в B,29) значение XF из B,25), легко написать общее выражение для функции состояний: [S2«ft*± ¦¦¦]*'-
§ 2) СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ GO? Интегрирование ведется по координатам всех частиц. Мы видим прежде всего, что выражение для функции состояний идеального газа не сводится к квазиклассическому выражению *dTp dTv • B>35) J которым мы пользовались в ч. III. Если, однако, плотность газа так мала, что имеет место неравенство %т < г, B,36) то из B,32) видно, что величины fa оказываются весьма ма- малыми по сравнению с единицей. Пренебрегая величинами /^ в B,34), мы приходим к ра- равенству Z^ZKB,KJl. B,37) Нетрудно видеть, что для атомных или молекулярных газов неравенство B,36) является гораздо более мягким, чем усло- условие пренебрежения взаимодействием между частицами. Таким образом, в не слишком плотных атомных газах всегда можно пренебречь квантовыми поправками. В плотных газах эти поправки малы по сравнению с поправками на неидеаль- неидеальность газа. Тем не менее характер квантовых поправок к квазикласси- квазиклассическому выражению для функции состояние имеет большой принципиальный интерес. Считая величины fa малыми, мы можем, очевидно, напи- написать и (rik, т) П кТ • B>38) Kk По определению . B,39) Подставляя выражение B,38) в функцию состояний, находим Л Мы видим, что квантовая поправка сводится в нашем прибли- приближении к появлению эффективного взаимодействия между ча- частицами. Это взаимодействие характеризуется потенциальной энергией U(rih,T), зависящей от расстояния между парами ча- частиц i и k, а также от температуры. Последнее обстоятельство сразу показывает, что функцию U(rih,T) можно рассматривать
608 RBAHtOBAfl СТАТИСТИКА [ГЛ. ! лишь как эффективную, но не истинную потенциальную энергию. Необходимо далее подчеркнуть, что эффективное взаимо- взаимодействие является чисто квантовым эффектом, исчезающим при й—>(). Существование эффективного взаимодействия обсужда- обсуждалось нами в § 67 части V. Это эффективное взаимодействие не связано с появлением новых сил, но обусловлено исключительно симметрией волновой функции. В случае бозе-частиц 1){г^Т) отрицательно при всех значениях г^, т. е. эффективное взаимо- взаимодействие имеет характер притяжения. У ферми-частиц эффек- эффективное взаимодействие представляет отталкивание, в соответ- соответствии со сказанным в § 67 ч. V. Обратимся теперь к обсуждению условия B,36). Если подставить в него значение тепловой длины волны Яг» мы можем переписать его в виде Сравнивая это с формулой G2,16) ч. III, мы видим, что уело-., вие B,36) представляет не что иное, как условие того, что идеальный газ можно считать невырожденным. Таким образом, критерию вырождения можно придать наглядный смысл: иде- идеальный газ можно считать невырожденным, если тепловая дли- длина волны частиц мала по сравнению со средним расстоянием между ними. Выполнение обратного условия соответствует силь- сильному вырождению. В этом случае величины fik оказываются порядка единицы и квантовые эффекты имеют уже не характер поправок, но приобретают основное значение. В частности, эф- эффективное квантовое взаимодействие между частицами в зна- значительной мере определяет свойства системы как целого. Это мы видели в ч. III на примере вырожденного ферми-газа. Во избежание недоразумений подчеркнем, что при этом формулой B,39) пользоваться уже нельзя, поскольку она была получена на основе неравенства B,36). Можно показать, что аналогичная ситуация имеет место в системах взаимодействующих частиц1). Однако критерий применимости соотношения B,36), т. е. кри- критерий применимости квазиклассического приближения в стати- статистической физике, имеет вид Яг < d> B,41) где d — некоторое эффективное расстояние взаимодействия между частицами. Этот критерий выполняется в газах и в кон- конденсированных системах, построенных из атомных и молекуляр- молекулярных частиц (за исключением жидкого гелия II, см. ниже). ') К. Хуанг, Статистическая механика, «Мир», 1966.
§ 3] РАСПРЕДЕЛЕНИЕ В ИДЕАЛЬНОМ ГАЗЕ 609 § 3. Статистическое распределение в идеальном газе В части III мы получили уже статистические распределения в идеальном газе. Для дальнейшего, однако, нам понадобится несколько другой их вывод, основанный на большом канониче- каноническом распределении. В случае идеального газа для большой ста- статистической суммы можно написать z<y, 2sS"~er"SSII^"^ /1=0 /t=0 nk /1=0 nk поскольку в идеальном газе энергия системы е равна е = 2 вкпк\ где nh — число частиц в k-м состоянии. Очевидно, что число частиц nh подчиняется условию я =2 я*. Двойное суммирование — по числу частиц в системе и по числу частиц в данном состоянии п*. — эквивалентно однократ- однократному суммированию по всем независимым значениям пк. Проще всего это видно на примере частиц ферми-газа, для которых пи = 0,1. Имеем, очевидно, в этом случае /1=0 rtfr i i «?-=0 Аналогично, для бозе-частиц я, пг I e? / ^j \ге / ... — Пг =П—^=П—хт=н-C>2) В случае ферми-газа 20 в- Г. Левич и др., том II
610 КВАНТОВАЯ СТАТИСТИКА [ГЛ. 1 В бозе-газе пи = 0, 1, 2, ..., N, так что Большую статистическую сумму (или ее логарифм, который фактически требуется для вычислений) можно записать в сим- симметричном виде / iil?*\ Г +для ферми-, lnZ=±SlnU ±e kT /, где *F C,3) к [ -для бозе-. v ' ' Все средние могут быть выражены через большую статисти- статистическую сумму 2. Последняя зависит от переменных (л, V и Т. Вместо парциального потенциала всегда можно ввести полное число частиц. Действительно, средние числа заполнения даются формулой B,22) nk - kT *±lL = —L_, где ( + ДЛЯ Ферми-, C>4) р -~- I -для бозе-. в kT ±1 Парциальный потенциал ц определен соотношением 7^Г—> C,5) ^zjf ekT ±1 позволяющей, в принципе, найти зависимость ц от Г, V и IV. В случае бозе-газа условие C,5) требует, чтобы парциаль- парциальный потенциал |х был отрицательным. Для газа Ферми никаких ограничений на значение [х не существует. Наиболее наглядной термодинамической характеристикой является уравнение состояния газа. Согласно § 59 гл. III урав- уравнение состояния газа можно выразить через Z в виде / H^lh] \ + для ферми, pV-*kT2ln(l?e"). где { _ для ^ ' C,6) Мы выписали все соотношения без обсуждения, поскольку это обсуждение было сделано в ч. III. Напомним лишь, что при фактическом использовании приведенных соотношений в макро- макроскопическом газе можно перейти от суммирования к интегриро- интегрированию, написав Г J J BяйK ' Ek "" 2т у к где g = B5+l), s — спин частиц. Переход к больцмановской статистике отвечает выполнению условия 1. C,7)
§3] РАСПРЕДЕЛЕНИЕ В ИДЕАЛЬНОМ ГАЗЕ 611 Подставляя в C,7) парциальный потенциал идеального газа, можно представить C,7) в виде B,36') или в виде G2,16) ч. III. В части III мы подробно остановились на поведении идеаль- идеального ферми-газа при низких температурах. Сейчас, во избежа- избежание повторений, мы рассмотрим только некоторые общие воп- вопросы. Написав C,6) в виде V О ~2 Е J j 0 ekT ± 1 мы видим, что между давлением и энергией в ферми- и бозе- газе имеет место такая же связь, как и в классическом идеаль- идеальном газе. При высоких температурах, когда выполнено условие C,7), можно разложить подынтегральное выражение в ряд и напи- написать так: хе г< аг- BяйK е yi± В последней формуле парциальный потенциал \i относится к больцмановскому газу [см. F0,9) ч. III]. Поэтому C,9) мож- можно переписать в виде где знак минус относится к ферми- и знак плюс к бозе-газу. Найденные поправки к давлению, как было уже подчерк- подчеркнуто выше, малы по сравнению с поправками, связанными с взаимодействием между частицами. В случае ферми-частиц, как мы видели в ч. III, эффект от- отталкивания, связанный с проявлением приципа запрета, приоб- приобретает определяющее значение в вырожденном газе. В следующем параграфе мы обсудим проявление эффекта притяжения в вырожденном бозе-газе, 20*
612 КВАНТОВАЯ СТАТИСТИКА [ГЛ. I § 4. Вырожденный идеальный бозе-газ *) Свойства вырожденного бозе-газа коренным образом отли- отличаются от свойств ферми-газа. Это различие связано с отсут- отсутствием каких-либо ограничений на накопление частиц в состоя- состоянии с нулевой энергией в бозе-газе. Среднее число частиц в состоянии с нулевой энергией со- согласно C,4) можно написать в виде -—^ • DД) е — 1 Мы видим, что значение п@) определяется ходом \х(Т) при Г-~>0. Как мы видели в предыдущем параграфе, парциальный потенциал в бозе-газе всегда меньше нуля. При высоких тем- температурах он убывает по абсолютной величине с понижением температуры. Парциальный потенциал определяется формулой C,5) для полного числа частиц. Эту формулу можно представить в виде ^1^ е kT - 1 ekT -I Первый член представляет среднее число частиц в состоя- состоянии с нулевой энергией, второй — число частиц во всех осталь- остальных состояниях. Статистический вес состояния с нулевой энер- энергией равен единице (см. § 35 ч. III). Второе слагаемое можно представить в виде -5== • D.3) kT о ekT -I Поэтому число частиц в состоянии с нулевой энергией JV-/(n, V, Т). Формула D,2) позволяет выразить парциальный потенциал через температуру и плотность, тогда как формула D,3) свя- связывает число частиц в состоянии с нулевой энергией и в вы- вырожденных состояниях с е ф О с полным числом частиц. *) Мы следуем изложению в книге К. Хуанга «Статистическая меха- механика»» Мир, 1966, где читатель может найти ряд дополнительных сведений.
§ 4] ВЫРОЖДЕННЫЙ ИДЕАЛЬНЫЙ БОЗЕ-ГАЗ 613 Мы видим прежде всего, что если значение интеграла / в правой части ограничено некоторой величиной Nmax, то число частиц в состоянии с нулевой энергией оказывается конечным и составляющим некоторую долю от пол- полного числа частиц. Рассмотрим величину I(\x, F, Г). Очевидно, что ее можно написать в таком виде: kT -- /=1 О Х> -~ -^). D,4, Таким образом, значение / определяется в основном суммой Т Эта сумма сходится при всех значениях р,^0. Значение F[—г^г) представляет монотонно убывающую функцию своего аргумента, причем Соответственно, Поэтому °*IT7/O~~""8/2. D,7) Если имеет место равенство N = NmaX = 2,61
614 КВАНТОВАЯ СТАТИСТИКА [ГЛ. I ИЛИ Bnm) W \v) ' D,9) то n@) = 0. При Г > To в состоянии с нулевой энергией нет частиц. Точ- Точнее говоря, число частиц в этом состоянии лг @) — 1 и прене- пренебрежимо мало по сравнению с числом частиц, находящихся в возбужденных состояниях (N' ~ N). При достижении темпе- температуры более низкой, чем Го, в состоянии с нулевой энергией возникает конечное число частиц п@), составляющее некото- некоторую долю от полного числа частиц. Распределение частиц по состояниям приобретает качественно новый вид: конечное число частиц находится на одном (нулевом) уровне энергии, а остальные частицы практически непрерывно распределе- распределены по всем возбужденным состоя- состояниям. Это явление получило название конденсации Бозе — Эйнштейна, а тем- температура Го — температуры конден- конденсации. Явная зависимость п@) от Г и N/V может быть найдена, если уста- новлена зависимость от этих величин парциального потенциала. Последняя, как мы видели, определяется уравне- нием D,2). Его решение (например, графическое), показывает, что при Т = Го, парциальный потенциал обращается в нуль. Кривая за- зависимости (—ц/кТ) = /(Г/Го) приведена на рис. 38. При температурах, лежащих ниже температуры конденса- конденсации Го, в уравнении D,2) можно положить р, равными нулю. Тогда находим 2 s Рис- 38- = iV-/(ji = O, Г, 1/) = #- Формула D,10) определяет распределение частиц по со- состояниям при Г < Го. Мы видим, что доля N(T/ToK/> всех частиц находится в воз- возбужденных состояниях, а остальные сконденсированы в обла- области фазового пространства, отвечающего нулевой энергии (или р = 0). Аналогия с конденсацией становится еще нагляднее, если найти выражение для давления.
§ 4] ВЫРОЖДЕННЫЙ ИДЕАЛЬНЫЙ БОЗЕ-ГАЗ 615 Согласно § 59 ч. III имеем . D'n) Штрих означает, что из суммы исключено слагаемое с е = 0. В этой формуле мы можем положить V—>оо, поскольку объем макроскопической системы всегда велик. Рассмотрим области Т^>То и Т<Т0. При Т !3> То и V-*oo первое слагае- слагаемое обращается в нуль. Во втором слагаемом для \х можно написать выражение G2,14) ч. III для больцмановского газа и мы придем к уравнению C,10). При Т < Го, как показывает анализ уравнения D,2) для парциального потенциала, первое слагаемое при V —>оо и \х—>0 также обращается в нуль. Поэтому, интегрируя по частям, находим 4я Bт)' J _?. BяЙK ' V*»1*/ и е*г-1 Давление при Т <Т0 оказывается не зависящим от плотности. Вклад в давление дают только частицы, находящиеся в состоя- состояниях с еФО. Поскольку их число ~Г3/2, полное давление ока- оказывается пропорциональным Тъ<2. Изотермы бозе-газа имеют вид, представленный на рис. 39, где изображена зависимость давления от удельного объема. В точке Л, определяемой услови- условием D,8), удельный объем равен Р 2,61 Bят*Г)'/> § D'13) Как видно из рис. 39, при v < v0 давление постоянно, а при и° ' v v>Vo оно падает с ростом удель- Рис. 39. ного объема. Аналогия между кривой на рис. 39 и изотермой для системы жидкость — пар очевидна. Точка v = 0 отвечает конденсирован- конденсированной, область v > v0 — паровой фазе, а 0 < v < v0 — области раз- разделения фаз. Аналогия фазовым переходом дополняется тем фактом, что в точке конденсации Т = То или v = vQ происходит
616 КВАНТОВАЯ СТАТИСТИКА [ГЛ. I выделение скрытой теплоты перехода (т. е. фазовый переход I рода). Мы не будем останавливаться на ее вычислении, но ограни- ограничимся двумя замечаниями. Во-первых, наряду со сходством не- необходимо подчеркнуть различие между процессами конденса- конденсации обычного пара и явлением бозе-конденсации. Обычная конденсация и переход в жидкое состояние обусловлены взаи- взаимодействием между молекулами. Бозе-конденсация — процесс, происходящий в идеальном газе. Природа его совершенно иная и он связан исключитель- исключительно с квантовым эффектом накопления бозе-частиц в состоянии с нулевой энергией. Второе замечание касается вопроса о реальности явления бозе-конденсации. Совершенно ясно, что поскольку это явление может иметь место только при низких температурах или боль- больших плотностях, при его реализации должно играть важную роль взаимодействие между частицами, которым мы пренеб- пренебрегли. Жидкий гелий Не II, единственная жидкость не кристалли- кристаллизующаяся при низких температурах, обнаруживает фазовый пе- переход II рода (см. § 77 ч. III). Частицы Не4 имеют спин равный нулю и подчиняются статистике Бозе — Эйнштейна. Однако имеет ли этот фазовый переход в жидкости отношение к явлению бозе- эйнштейновской конденсации в идеальном газе — не установлено. Как мы увидим в следующем параграфе, взаимодействие меж- между частицами в неидеальном бозе-газе имеет весьма существен- существенное значение. Оказывается, что с этим взаимодействием свя- связано принципиальное различие в поведении идеального и не- идеального газа бозе-частиц. Это делает несколько сомнитель- сомнительным попытки интерпретации фазового перехода в жидком ге- гелии как проявление бозе-конденсации. Поэтому, несмотря на принципиальный интерес, который представляет явление бозе- конденсации, нет уверенности в том, что оно осуществляется в гелии. В заключение подчеркнем, что все сказанное относилось исключительно к бозе-системам с фиксированным числом ча- частиц. Однако стационарное состояние бозе-конденсации не мо- может возникать в бозе-системах, у которых число частиц является переменным. Поскольку число частиц в таких системах не имеет опре- определенного значения, к ним нельзя применять формулу D,2), которая была положена в основу всей теории бозе-конден- бозе-конденсации (см., однако, § 70). Мы ограничимся в этой главе рассмотрением бозе-частиц В главе, посвященной теории твердого тела, будут более под- подробно рассмотрены свойства ферми-систем.
§ 5] НЕИДЕАЛЬНЫЙ БОЗЕ-ГАЗ. СВЕРХТЕКУЧЕСТЬ 617 § 5. Неидеальный бозе-газ. Сверхтекучесть Перейдем теперь к рассмотрению неидеального газа бозе- частиц. Будем считать, что между частицами бозе-газа существует некоторое достаточно слабое взаимодействие. Оно может иметь характер как сил притяжения, так и сил отталкивания. Гамильтониан системы частиц в ^-представлении имеет вид N где N — полное число частиц в системе и U(\ra — г$\) — энер- энергия взаимодействия между частицами а и р. В разреженном газе можно учитывать только парные взаимодействия. Для дальнейшего удобно считать газ заключенным в куб с ребром L. Тогда оператор Гамильтона свободной частицы и — _-?_л а~~ 2т а будет иметь дискретный спектр. Импульс свободной частицы будет иметь проекции, пробегающие дискретный ряд значений _ 2пЬ __ 2пЪ _ 2пЬ Рх ~~ i пх> Ру ~ПУ> Рг~ ? пг > где пх, Пу, nz — произвольные целые числа, включая и нуль. Собственные функции оператора Яа, нормированные на объ- объем V = L3, имеют вид Применим теперь к рассмотрению системы взаимодействующих частиц метод вторичного квантования. Гамильтониан системы с парным взаимодействием дается формулой (99,25) ч. V. Н = 2 Е Ы a+Upk + i- S (/mI U ffiJpkPi i, k, I, m E,1) Суммирование ведется по всем возможным дискретным значе- значениям импульсов (как положительным, так и отрицательным). Энергия E(pk) представляет энергию свободной частицы Входящая в матричный элемент гамильтониана энергия взаимо- взаимодействия U в силу сказанного зависит только от координат двух частиц.
618 КВАНТОВАЯ СТАТИСТИКА [ГЛ. I Для вычисления матричного элемента можно воспользо- воспользоваться волновыми функциями свободной частицы. Это дает (lm\U\ik) = 1 I "~""~" \Р 1^ Л ~^~Р ''о) "^t" [Р1^'\ "^"Pb^QI v Вводя новые переменные д = гх—г2 и R = (rl+ r2)/2 и интегрируя, с учетом того, что у к J при получаем "тг V (О/ — 0/) ПОИ E,2) О при где Интегрирование по всем углам можно выполнить непосредствен- непосредственно, поскольку U зависит только от абсолютной величины век- вектора ц. Это дает: v(p) = J U(\ q \)q2 dq Je-'w«»e sinGrfO J с?ф = Мы видим, что функция v(p) является вещественной и для нее выполнено равенство v(p) = v(—р). Оператор полной энергии системы частиц в соответствии с формулой (99,25) ч. V можно представить в виде 4 4гл+т St v (р* - р*) W«V"» • EK) Во втором члене формулы E,3) сумма берется только по таким значениям импульсов р*, рь, р/, рт, для которых выпол- выполняется соотношение Дальнейшая задача заключается в определении собственных значений гамильтониана E,3), т. е. в приведении матрицы энер- энергии к диагональному виду. При исследовании низших энергетических состояний теория возмущений неприменима. Наглядно это видно из того, что
§ 5] НЕИДЕАЛЬНЫЙ БОЗЕ-ГАЗ. СВЕРХТЕКУЧЕСТЬ 619 в нижних энергетических состояниях, т. е. при малых значе- значениях импульса, кинетическая энергия системы стремится к нулю. Наоборот, энергия взаимодействия имеет конечное значение и велика по сравнению с кинетической энергией. Поэтому для исследования слабо возбужденных состояний Н. Н. Боголюбо- Боголюбовым был развит особый приближенный метод. Рассмотрим сна- сначала систему, в которой взаимодействие отсутствует. В основ- основном энергетическом состоянии такой системы импульсы всех частиц равны нулю, т. е. при рфО, 1 = 0, J E'4) np = N при р где пр—число частиц с импульсом р. Естественно думать, что и при наличии слабого взаимодействия в низшем состоянии системы большинство частиц будет находиться с импульсами, равными нулю. В соответствии со сказанным примем, что Операторы й? и й0 удовлетворяют перестановочному соотно- соотношению (99,9) ч. V Поскольку й?йо = по велико по сравнению с единицей, в даль- дальнейшем будем пренебрегать некоммутативностью этих опера- операторов, т. е. будем заменять операторы й0 и d+ обычными чис- числами. Предположения E,4), E,5) существенно упрощают выраже- выражение для гамильтониана взаимодействия. Именно, в сумме по всем импульсам следует оставить только большие слагаемые, в которых множители й? или й0 входят попарно или четырех- четырехкратно. Такими слагаемыми являются и т. п. Наоборот, слагаемые типа u$u+jLpfiPk, где рт Ф 0, р? и ркф0, малы и могут быть опущены.
620 КВАНТОВАЯ СТАТИСТИКА [ГЛ. I Таким образом, для W находим: Pl+Pm-Pt+Pk V ' PI Pm PI Ря ^Д v (p) [d+d+dpd0 + d+d+dodp + d+d+dpdp + d±pd±pdodo) + + v @) A+U+A& с* v @) д2 + JQv(p) {2d+dpn0+d+d;nQ+d_pd_pn0}. Поскольку полное число частиц в системе W равно где второе слагаемое мало по сравнению с первым, в том же приближении имеем ^ v @) N* + 2N Д v (р) [й+йр + й±рй_р) + (p) (й+й_р + й±рйр). E,6) Опущенные слагаемые имеют порядок YN. Полный гамиль- гамильтониан Н с точностью до величины порядка N приобретает вид S v W й di+w Введем новые операторы Ър и 5р, которые определим следую- следующим образом: Определенные таким образом операторы Ър и бр удовлетво- удовлетворяют тем же перестановочным соотношениям, что и опера- операторы ар и й+, поскольку а0 и а+ мы считаем обычными числами. Кроме того, как легко видеть, b^bp = dpdp = nP9 E,9)
§ 5] НЕИДЕАЛЬНЫЙ БОЗЁ-ГАЗ. СВЕРХТЕКУЧЕСТЬ 621 так как аоао=>по. С помощью операторов Ър и Ър гамильто- гамильтониан E,7) можно записать в виде y?[ bpP]. E,10) рфо Для приведения гамильтониана E,10) к диагональному виду совершим линейное преобразование к новым операторам |р и §р по формулам 1 E'П) где Если ир и vp — вещественные функции импульса р, то новые бозе-операторы \р и 1Р удовлетворяют коммутационным со- соотношениям (99,9) ч. V. Подставляя E,11) в E,10) и требуя, чтобы коэффициенты при операторах т#па iPiP и iPlP обра- обращались в нуль, найдем функции ир и vp. Простое, но несколько длинное вычисление дает 8(р) = При этом в операторе Я сохраняются только диагональные члены и он приводится к виду Sp)Ut. E,13) Собственные значения оператора Гамильтона E,13) равны Е = Е0+ 2е(р)л'(р), E,14) где S 2[|^] E,15) а п7(р)—произвольные целые числа.
622 КВАНТОВАЯ СТАТИСТИКА [ГЛ. I Можно найти также полный импульс системы частиц. Он оказывается равным РФО Если в последнем равенстве от операторов Ьр и Ър перейти к операторам |р и |р, то получим Формулы F,14) и E,16) допускают простую корпускулярную трактовку. Мы видим, что энергия системы представлена в виде суммы двух членов. Первый член ?0 представляет собой энер- энергию основного (низшего) состояния. Второй член можно тракто- трактовать как энергию квазичастиц, представляющих коллективные возбуждения системы, п'р — число элементарных возбуждений в состоянии с импульсом р. Энергия каждого элементарного возбуждения равна е(р) E,12). При малых импульсах энергия возбуждения представляется в виде v v Здесь Vo = —«-Т7- представляет объем, приходящийся на одну частицу. Из формулы E,17) следует, что должно выпол- выполняться неравенство v@)=jU(q)dq>0, E,18) что отвечает преобладанию сил отталкивания. Если, наоборот, v@)<0, то энергия оказывается мнимой, что соответствует не- неустойчивому состоянию системы. При больших импульсах энергия имеет вид Следует заметить, что существование элементарных возбужде- возбуждений представляет собой коллективный эффект всей системы. Каждое возбуждение связано с состоянием системы в целом, а не с состоянием отдельной частицы. Идеальный газ возбу- возбуждений, характеризуемый гамильтонианом E,13), подчиняется статистике Бозе, так как операторы |р и |р удовлетворяют перестановочным соотношениям (99,9) ч. V. Легко показать, что рассматриваемая система обладает свойством сверхтекучести. Предположим, что всей совокупно-
§ 5] НЕИДЕАЛЬНЫЙ БОЗЕ-ГАЗ. СВЕРХТЕКУЧЕСТЬ 623 сти частиц сообщена какая-то дополнительная скорость v по отношению к некоторой неподвижной системе, например, по отношению к стенкам трубки или сосуда, содержащего не- неидеальный бозе-газ. Тогда можно считать, что все полученные результаты будут справедливы в системе, движущейся со ско- скоростью и, по отношению к некоторой неподвижной. Если энер- энергия в движущейся системе равна ?, а в неподвижной Ev, то между ними существует соотношение E,20) где Р — полный импульс бозе-газа в подвижной системе. Используя выражение E,14) и E,16), получаем (е (Р) + vp}. E,21) Для того чтобы совокупность частиц затормозилась, надо чтобы появились возбуждения с импульсами, направленными против скорости v. Приращение энергии при появлении одного такого возбуждения равно Де = е(р)-М1р|. E,22) Если приращение энергии системы Де > 0, то появление воз- возбуждений энергетически невыгодно. Это означает, что система будет неопределенно долго двигаться со скоростью v без появ- появления таких возбуждений. Торможение в системе отсутствует и она обладает свойством сверхтекучести. Сформулируем теперь условие сверхтекучести. Для того чтобы величина Де была по- положительной, необходимо выполнение неравенства при произвольных р. Обозначим минимальную величину отно- отношения г(р)/\р\ через v*. Тогда при движении со скоростью v < v* имеет место сверхтекучесть. Следовательно, сверхтеку- сверхтекучесть в системе возможна, если выполняется неравенство E,23) Из выражения E,12) для е(р) следует, что I Р2 "г ) , Vm "г 4/n2 /p^0~ V mV
624 КВАНТОВАЯ СТАТИСТИКА [ГЛ. I Если v@)>0, то v* вещественна и положительна. Таким обра- образом, в случае преобладания сил отталкивания в неидеальном бозе-газе существует вещественное и положительное значе- значение v* и бозе-газ обладает свойством сверхтекучести. В случае, если взаимодействие между частицами отсутствует (идеальный бозе-газ), то U{q) = 0, v(p) = 0 и энергия возбужде- возбуждений дается формулой При этом v* = 0, так что идеальный бозе-газ не обладает сверх- сверхтекучестью. Таким образом, мы видим, что свойство сверхтекучести про- проявляется в неидеальном и отсутствует в идеальном бозе-газе. Сверхтекучесть не связана со спецификой системы бозе-частиц. Для ее* существования требуется особая формула энергетиче- энергетического спектра коллективных возбуждений системы. Именно, со- согласно E,23), для этого нужно, чтобы отношение минимальной энергии возбуждения системы как целого к импульсу этого воз- возбуждения имело конечное значение. Спектр возбуждений газа невзаимодействующих бозе-частиц при малых возбуждениях имеет вид E,24) и не удовлетворяет E,23). Спектр возбуждений газа взаимодействующих бозе-частиц удовлетворяет условию E,23) только в случае наличия сил от- отталкивания между частицами. Силы притяжения не приводят к сверхтекучести системы взаимодействующих бозе-частиц. Не- Необходимо, однако, подчеркнуть, что при получении этого ре- результата было существенно использовано свойство бозе-частиц: мы полагали, что основная масса взаимодействующих частиц находится в состоянии с- импульсом равным нулю, т. е. образует конденсат в пространстве импульсов. Это служит необходимым условием для появления сверхтекучести бозе-газа; однако ука- указанное условие не является достаточным, поскольку в идеаль- идеальном бозе-газе также образуется конденсат, но нет сверхтеку- сверхтекучести. Различие между конденсатом идеального и неидеального бозе-газа видно из следующего рассуждения: пусть идеальный бозе-газ как целое движется с некоторой скоростью v относи- относительно стенок сосуда. Если одна из частиц в результате взаи- взаимодействия со стенкой остановится, то остальная масса газа будет продолжать движение с меньшей кинетической энергией. Последовательное повторение этого процесса в конечном счете затормозит газ. Иначе обстоит дело в случае газа, частицы которого свя- связаны между собой силами отталкивания. Остановка отдельных
§ 5] НЕИДЕАЛЬНЫЙ БОЗЕ-ГАЗ. СВЕРХТЕКУЧЕСТЬ 625 частиц здесь невозможна. Взаимодействие со стенкой должно тормозить.или, что то же самое, возбуждать всю систему как це« лое. При скорости движения v <v* это оказывается невоз- невозможным. Представлялось естественным перенести этот вывод, полу- полученный для неидеального бозе-газа, на бозе-жидкость. Хотя формально предположение о парном характере взаимодействия в жидкости не выполнено, качественные рассуждения о спектре малых возбуждений коллективного движения относятся и к бо- зе-жидкости *). 1) См. К. Brueckner, К. Sawada, Phys. Rev. 106, 1117, 1128 A957). О сверхтекучести см. И. М. Халатников, Введение в теорию сверхтеку- сверхтекучести, «Наука», 1965.
ГЛАВА II ФИЗИЧЕСКАЯ КИНЕТИКА § 6. Постановка проблемы Наряду с рассмотрением равновесных состояний макроско- макроскопических систем, не меньший интерес для современной физики представляет изучение поведения макроскопических систем, не находящихся в состоянии полного термодинамического равно- равновесия. Процессы, происходящие в системах, не находящихся в состоянии термодинамического равновесия, являются необрати- необратимыми. Изучение необратимых процессов представляет цель и со- содержание физической кинетики. Совершенно очевидно, что свойства неравновесных макро- макросистем, подвергающихся внешним воздействиям и эволюциони- эволюционирующим во времени, неизмеримо сложнее, чем свойства равно- равновесных систем. Это видно хотя бы из бесконечного разнообра- разнообразия внешних воздействий, которые могут нарушать равновесие в системе. Поэтому не удивительно, что в настоящее время физическая кинетика не достигла в своем развитии той степени полноты и универсальности, которая характерна для статистической фи- физики. Мы должны прежде всего сформулировать некоторые общие законы изменения состояний макроскопических систем, не на- находящихся в состоянии равновесия. При этом возможны два подхода к решению задачи — ква- квазимакроскопический и кинетический. При квазимакроскопическом рассмотрении состояние си- системы задается некоторыми макроскопическими параметрами — температурой, концентрацией и т. п. Ищется закон изменения этих параметров в пространстве и во времени, если система не находится в состоянии равновесия, но подвержена действию внешних сил. При этом предполагается, что изменения состоя- состояний макроскопической системы можно характеризовать вероят- вероятностью перехода из одного макроскопического состояния в дру- другое. Иначе говоря, предполагается, что можно ввести понятие
§ 6] ПОСТАНОВКА ПРОБЛЕМЫ 627 в вероятном изменении макроскопических параметров, характе- характеризующих систему. При кинетическом подходе к решению задач физической кинетики предполагается, что система может описываться не- некоторой функцией распределения, зависящей в общем случае от обобщенных координат и импульсов частиц. Считая задан- заданными вероятности переходов из одних микросостояний в другие (т. е. перехода изобразительной точки из одной клетки фазо- фазового пространства в другую), составляют закон изменения функции распределения, так называемое кинетическое урав- уравнение. Решение последнего позволяет найти функцию распре- распределения неравновесной системы. Ясно, что кинетический под- подход является более детальным. Он, в частности, позволяет рас- рассчитывать такие величины, как кинетические коэффициенты — теплопроводность, коэффициент диффузии и т. п. Откладывая обсуждение второго подхода к изучению нерав- неравновесных систем, обсудим сначала квазимакроскопический ме- метод. Ясно, что он имеет ограниченную область применимости: если некоторая система не находится в равновесии, то ее со- состояние в общем случае невозможно охарактеризовать при помощи макроскопических параметров; например, в общем слу- случае нельзя говорить о температуре или давлении в теле, не находящемся в состоянии равновесия. Эти понятия, как мы видели ранее, имеют определенный смысл лишь в системе, по- помещенной в термостат. Тем не менее важная особенность мак- макроскопических систем, которая уже обсуждалась нами в § 24 и § 25 ч. III, позволяет в ряде случаев пользоваться макроскопи- макроскопическими величинами для описания состояния неравновесных систем. Именно, мы видели, что в системе,, не находящейся в со- состоянии равновесия и предоставленной самой себе, возникает явление релаксации. По прошествии времени релаксации си- система переходит в равновесное состояние. В реальной макро- макроскопической системе очень часто приближение к состоянию рав- равновесия сопровождается протеканием целого ряда процессов. Поясним это на простом примере. Пусть в сосуд впускается два газа, молекулы которых име- имеют существенно различные массы, например, газы ионов и электронов. Переходу системы в состояние равновесия отве- отвечает последовательность процессов: 1) газы, перемешиваясь, равномерно заполняют сосуд; 2) в газах устанавливается ста- статистическое равновесие; при этом благодаря различию в мас- массах, затрудняющему обмен импульсами частиц разных газов при столкновениях, эффективны только столкновения между одинаковыми частицами, в результате которых по прошествии времен релаксации х\ и Т2 в каждом из газов установится свое
628 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. И максвелловское распределение; 3) в результате обмена им- импульсами при столкновениях между частицами с разной мас- массой по прошествии значительно большего времени релаксации тз установится общее максвелловское распределение в смеси га- газов; 4) захват электронов ионами, сопровождающийся излуче- излучением соответствующей энергии, в известных условиях приведет к переходу газа в нейтральное равновесное состояние (время Т4). Таким образом, приближение газа к полному равновесию происходит в несколько стадий, имеющих существенно отли- отличающиеся друг от друга времена релаксации. Указанными свойствами обладает очень широкий класс фи- физических систем, в частности, любые системы, состоящие из малых частей. Поскольку время релаксации быстро растет с увеличением размеров системы, равновесие внутри частей устанавливается быстрее, чем между частицами (ср. § 25 ч. III). Часто на практике большой интерес представляет изучение систем, у которых успело установиться равновесие за время релаксации Тбыстр по отношению к быстрым процессам, но не успело установиться равновесие для медленно изменяющихся параметров. Такие системы называются находящимися в со- состоянии неполного равновесия, или квазиравновесными систе- системами. Рассмотренная нами смесь находится в неполном равнове- равновесии. Если время ty прошедшее с момента смешения, удовлетво- удовлетворяет неравенству хи %2 < t < т3, каждая из равновесных частей, газ электронов и газ ионов, может характеризоваться обычными макроскопическими пара- параметрами. Однако, в отличие от равновесных систем, эти пара- параметры будут медленно, изменяться во времени. Если та же смесь газов не изолирована, но находится в поле внешних сил, например, в электрическом поле, то ее состояние будет изменяться под влиянием поля. В поле, постоянном во времени, обе системы при /й?ть тг также можно считать не зависящими от времени, но не равновесными. Действительно, в рассматриваемой системе возникает систематическое движе- движение (поток) зарядов в направлении поля. Неравновесное состояние системы, не зависящее от времени, называют стационарным состоянием. В стационарном состоя- состоянии, как и в состоянии неполного равновесия, система может характеризоваться значениями макроскопических параметров. Из сказанного выше следует, что квазимакроскопическое рассмотрение неравновесных систем возможно в том случае, когда в последних происходят быстрые и медленные процессы.
§ 7] ЗАКОН СОХРАНЕНИЯ МАССЫ И ДИФФУЗИОННЫЙ ПОТОК 629 Недостатком приведенных рассуждений является условность понятий быстрого и медленного процесса. Для конкретных си- систем часто удается провести это разбиение достаточно четко. Ясно, что необходимым условием такого разбиения является требование тМедл.'3> тбыстР.. Если система находится в состоянии неполного равновесия, то к ней или к ее макроскопическим частям применимы термо- термодинамические понятия, такие, как температура, термодинамиче- термодинамические потенциалы и т. п. Можно, например, говорить о системе с давлением или тем- температурой, изменяющимися от точки к точке или изменяющейся во времени. Часто в макроскопической системе, не находящейся в рав- равновесии, происходит перемещение частей и возникает перенос массы. При этом, однако, можно характеризовать эти части термодинамическими параметрами — плотностью, давлением и температурой. В дальнейшем мы сформулируем эмпирические законы пере- переноса в таких неравновесных системах, а затем перейдем к вы- выводу теоретических соотношений, характеризующих поведение неравновесных систем. § 7. Закон сохранения массы и диффузионный поток Как мы указывали уже в § 6, нарушение равновесия в си- системе часто связано с макроскопическим движением ее частей. Разобьем макроскопическую систему на малые, но все еще макроскопические элементы и примем, что эти элементы нахо- находятся в состоянии локального равновесия. Это означает, что каждому элементу можно приписать обычные термодинамиче- термодинамические характеристики — определенную температуру, среднюю плотность и термодинамические потенциалы. Ниже, на примере простейшей системы — идеального газа, мы увидим, что такое локальное равновесие для малых эле- элементов устанавливается чрезвычайно быстро. Отклонение от со- состояния равновесия системы как целого и, в частности, меха- механическое движение ее частей, не нарушает локального равно- равновесия в малых элементах. Приняв допущение о локальном рав- равновесии в малых элементах и отсутствии равновесия для си- системы в целом, т. е. считая систему находящейся в неполном равновесии, можно сформулировать общие законы изменения состояния такой системы. При этом необходимо учесть про- происходящее в ней внутреннее движение. Мы будем отвлекаться от молекулярной структуры системы и считать ее сплошной средой. Это означает, что в каждой точ- точке системы считается заданной скорость перемещения V(r,/),
630 ФИЗИЧЕСКАЯ КИНЕТИКА tI\Jt. II являющаяся непрерывной функцией координат г и вре- времени L Сплошная среда может быть капельной жидкостью, газом или твердым телом, части которых перемещаются друг относи- относительно друга под действием приложенных внешних сил. Плот- Плотность, давление, температура и другие термодинамические харак- характеристики среды будут считаться непрерывными функциями координат и времени. Чтобы не возникло недоразумения, под- подчеркнем, что зависимость термодинамических величин от коор- координат и времени следует понимать как изменение локальных равновесных характеристик. Например, энергия Е некоторого малого (но макроскопического) элемента системы изменяется при перемещении его из места с давлением р\ и температурой Т\ в другое место со значениями этих величин /?2 и Г2. Однако в каждом месте связь между ?, р и Т имеет равновесный термо- термодинамический характер. Приближение сплошной среды соответствует термодинамиче- термодинамическому описанию равновесных систем. В этом приближении мы сформулируем общие законы, определяющие движение среды и перенос в ней вещества и энергии. При этом, естественно, мы будем вынуждены пользоваться некоторыми эмпирическими соотношениями. Эти последние не будут иметь той общности, которой обладают эмпирические законы (первое и второе на- начало) термодинамики, поскольку, как мы уже подчеркивали, неравновесные системы обнаруживают большое разнообразие свойств, зависящих от их конкретной структуры и характере процессов. Одной из важнейших задач макроскопической кинетики яв- является вывод уравнений переноса в сплошной среде и нахожде- нахождение фигурирующих в этих уравнениях постоянных, именуемых кинетическими коэффициентами. Такими общими уравнениями переноса являются уравнения переноса массы, импульса, энергии и энтропии. Прежде всего сформулируем закон переноса массы. В системе из /г-компонент имеет место закон сохранения массы каждого из компонент. Если обозначить через va среднюю макроскопическую скорость а-ой компоненты, а через ра — ее массу в единицу объема, то закон сохранения массы можно написать в виде ^ = 0. G,1) При этом предполагается, что между компонентами не про- происходит химической реакции. В более общем случае в правой части G,1) следовало бы написать скорость возникновения или исчезновения частиц a-го компонента, отнесенную к единице
§ 7] ЗАКОН СОХРАНЕНИЯ МАССЫ И ДИФФУЗИОННЫЙ ПОТОК 631 объема. Уравнение B,1) и является уравнением переноса массы. Движение в системе удобнее характеризовать скоростью центра масс, а не скоростями компонент. По определению, ско- скорость центра масс v равна где р — полная плотность в системе. Суммируя G,1) по всем компонентам, легко найдем связь между р и v: -|E + divpi> = 0. G,3) Это так называемое гидродинамическое уравнение непрерыв- непрерывности, выражающее закон сохранения массы всей системы. Если полная плотность среды постоянная, то dpfdt = 0 и вместо G,3) можно написать divi> = 0. G,4) Среды с постоянной плотностью именуются несжимаемыми. В гидродинамике показывается, что если скорость движения сплошной среды (жидкости или газа) мала по сравнению со скоростью звука, то такую среду можно считать несжимаемой. Перепишем G,1) в виде или ^f- =» - ра div v - div /а, G,5) где через /а обозначен так называемый диффузионный поток a-го компонента ja == ра (^а — v)t G,6) Формула G,5) выражает закон сохранения массы a-го компо- компонента. Вектор /а показывает, в какой мере движение частиц a-го компонента отличается от средней скорости движения си- системы как целого. Обычно закон сохранения массы для а-го компонента переписывают, вводя массовую концентрацию Са=^. G,7) При этом вместо G,5), с учетом G,3), получаем An. 1 G,8)
632 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II Очевидно, что в системе из n-компонент независимыми яв- являются (/г—1) концентрация и (п—1) диффузионный поток, поскольку S*e-1; 2/а = 0. G,9) а а Разумеется, в однокомпонентной жидкости диффузионный по- поток отсутствует. При этом закон сохранения массы выражается формулой G,3). Для краткости записи рассмотрим двухкомпонентную си- систему, в которой независимыми являются одна концентрация и один диффузионный поток. В отсутствии внешних полей условиями равновесия служат постоянство парциального потенциала и температуры в системе (ср. § 36 ч. III). Диффузионный поток в равновесии равен нулю. Перейдем теперь к системе, находящейся в неравновесном состоянии. При достаточно малых отклонениях системы от со- состояния равновесия естественно принять, что возникающий диф- диффузионный поток пропорционален градиенту парциального по- потенциала [д,(р, с, Т): /V G,10) Примем, что y > 0- При этом знак минус показывает, что воз- возникающий поток будет направлен к месту с меньшим пар- парциальным потенциалом. Это соответствует требованию мини- минимальности парциального потенциала в состоянии равновесия. Формула G,10) представляет, по существу, первый член разло- разложения в ряд по степеням величины Vji и теряет смысл при боль- больших отклонениях от состояния равновесия. Мы ограничимся в этом параграфе случаем изотермической системы. В изотермической системе можно написать .e^--P^^.-?-VA G,11) где введены два новых коэффициента: коэффициент молекулярной диффузии D в?(-2йЛ G 12) а 9\дса)р.т (i ] и коэффициент бародиффузии Р pDa • (/>16> Обычно коэффициент бародиффузии весьма мал и вторым сла- слагаемым в G,11) можно пренебречь. Тогда диффузионный поток
§ 8] ЗАКОН СОХРАНЕНИЯ ИМПУЛЬСА 633 приобретает вид /a--pA»V*a. G,14) Часто вместо массовой концентрации са пользуются числом частиц в единице объема, а диффузионный поток относят не к массе, а к числу частиц. При этом /a=-AzVca. G,15) Формулы G,11) G,14), G,15) представляют известный эмпи- эмпирический закон диффузии (закон Фика). Ниже мы увидим, что в неизотермических системах закон диффузии должен быть несколько обобщен. В дальнейшем мы убедимся также, что закон диффузии может быть выведен тео- теоретически для случая идеального газа из общих законов фи- физической кинетики. С учетом G,11) закон сохранения массы запишется в виде jj tiding G,16) или, пренебрегая бародиффузией, ^ Dabca. G,17) Последнее выражение носит название уравнения конвектив- конвективной диффузии. Оно описывает как конвективный перенос веще- вещества в движущейся среде, так и молекулярную диффузию. § 8. Закон сохранения импульса и уравнения движения сплошной среды В предыдущем параграфе мы считали движение сплошной среды заданным. Сейчас мы перейдем к получению уравнений движения сплошной среды под действием приложенных к си- системе внешних сил. Для этого напишем уравнения движения некоторого малого (но конечного) элемента объема V в среде в виде ± (8,1) где F— объемная сила, отнесенная к единице объема и /W — поверхностная сила, действующая на 1 см2 поверхности, ограни- ограничивающий данный объем со стороны окружающей среды. Век- ток F(n) носит название напряжения. Для задания напряжения требуется указать направление вектора нормали к поверхности л. Введем элементарный параллелепипед, ограниченный пло- плоскостями п\ = *', /12 = /, пъ = k. Вектор Р№ имеет, очевидно, компоненты Fxx, Fyx, Fzx, каждая из которых представляет
531 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II компонент силы, действующей на площадку 1 см2 с нормалью i. Аналогичный смысл имеют проекции векторов F{*] и JPW. Мы можем ввести тензор напряжений а^, определив его равенством Очевидно, что компоненты тензора аг-& совпадают с компонен- компонентами F(/I). Преобразуем поверхностный интеграл в объемный по формуле Гаусса — Остроградского k j Ц dV. Тогда окончательно, имеем *) !№«. (8,3) Поскольку объем V является произвольным, из (8,3) следует или, если внешние объемные силы являются консервативными, то где U — потенциальная энергия единицы объема. Уравнения (8,4) или (8,5) выражают закон движения сплошной среды. Уравнение (8,5) можно переписать в другой форме, несколь- несколько преобразовав его левую часть. Именно, пользуясь уравнением непрерывности, можем на- написать dvt d(Qvt) dp д д Поэтому имеем р* В левой части (8,6) стоит изменение импульса единицы объема. Первый член слева представляет плотность потока импульса jih — p^i^h — Oik. Таким образом, (8,6) выражает закон сохра- сохранения импульса. Тензор напряжений oih может быть связан со скоростями Vi и Vk на основе опытных данных. ¦) Очевидно, что v( -тг р dV - 0.
§ 8] ЗАКОН СОХРАНЕНИЯ ИМПУЛЬСА 635 В состоянии равновесия, когда скорость движения среды обращается в нуль, можно написать условие термодинамиче- термодинамического (механического) равновесия: Сравнивая (8,4) и (8,7), приходим к выводу, что в неподвиж- неподвижной жидкости (8,8) В движущихся сплошных средах, как показывает опыт, воз- возникают необратимые процессы. Написать выражение для OiXy справедливое для всех подвижных сред — жидкостей, газов и твердых тел, — при любых режимах течения не представляется возможным. Мы ограничимся наиболее изученным (хотя и не самым рас- распространенным) случаем так называемых ньютоновских жидко- жидкостей. В ньютоновских жидкостях тензор напряжений является линейной функцией градиента скорости. При плоском течении между двумя твердыми стенками, одна из которых покоится, а другая движется со скоростью v, на по- поверхность твердого тела действует напряжение где L — расстояние между стенками. Нетрудно заметить, что в этих условиях оху = const. Следовательно, такое же напря- напряжение действует на 1 см2 воображаемой плоскости, проведен- проведенной в жидкости. При произвольном законе движения для аш можно написать общее выражение, иеходя из двух требо- требований: 1) ош является линейной функцией производных dvi/dxk или dVk/dXi (*', k = 1, 2, 3); 2) при равномерном вращении жидкости как целого сг^ сво- сводится к его статистическому выражению, поскольку взаимного смещения слоев жидкости при этом не происходит. Комбинациями производных, удовлетворяющими этому усло- условию, являются (dvj , dvk\ dv. Непосредственной проверкой можно убедиться, что при v = [юг], где ю — угловая скорость, эти комбинации производ- производных обращаются в нуль. Поэтому в самом общем случае можно написать
dvk 2 636 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II Обычно это выражение записывают в тождественном виде (dvt где обозначено Ч-о, (8,Ю) Кинетические коэффициенты т] и ^ носят названия первого и второго коэффициентов вязкости. дх>з В несжимаемой жидкости "^— — О и тензор напряжений приобретает вид (dvt дх>и\ Ньютоновский закон вязкости имеет место у газов и некоторых капельных жидкостей (прежде всего у воды). Вязкость является функцией температуры YY у газов, _?. (8,13) е т у капельных жидкостей. Ниже будет показано, что как выражение для тензора напря- напряжений (8,12), так и температурная зависимость вязкости в слу- случае газов могут быть найдены теоретически. Пользуясь выражением для а^, можно представить урав- уравнение движения несжимаемой жидкости в виде или dvt dvA dp i Последнее уравнение носит название уравнения Навье— Стокса. Уравнение Навье — Стокса может быть переписано в виде или
§ 9] ЗАКОН СОХРАНЕНИЯ ЭНЕРГИИ 637 где (dv, dvk\ Интегрируя обе части (8,15) по объему и преобразуя интеграл к поверхностному, имеем ± (8,16) Последняя формула выражает, очевидно, закон сохранения импульса: изменение импульса в данном объеме жидкости рав- равно потоку импульса, выражающемуся через окружающую его поверхность. Тензор Пгь представляет собой тензор плотности потока импульса в несжимаемой жидкости. § 9. Закон сохранения энергии и перенос энтропии в движущейся сплошной среде Энергия движущейся сплошной среды складывается из ее внутренней энергии Е и кинетической энергии pi>2/2. При этом мы относим соответствующие величины к единице массы жид- жидкости и не учитываем потенциальной энергии во внешем поле сил*). Закон сохранения энергии может быть написан в интеграль- интегральной или дифференциальной форме (9,D (9,2) где je — плотность потока энергии. д v^ Найдем прежде всего производную ^"Р-^» воспользовав- воспользовавшись уравнением (8,6). Умножая его на Vu имеем д v2 д v\ д v2vb \ dv? Полученное уравнение допускает наглядную интерпретацию: первый член в первой части представляет плотность потока ки- кинетической энергии. Он состоит из непосредственно переносимой *) См. книгу С. де Гроот и П. Мазур, Неравновесная термодина- термодинамика, «Мир», 1964.
638 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II кинетической энергии р-трЯ и потока, связанного с механиче- механической работой OihVu совершаемой над средой. Последнее слагае- слагаемое, как видно из дальнейшего, включает диссипацию энергии, обусловленную вязкостью. Именно, в несжимаемой жидкости согласно (8,12) можно написать dv. dv. (dv. dvb\ dv. В несжимаемой жидкости уравнение (9,3) приобретает вид д х?___ dt р 2 ~" (dvt dvk\] t\(dv. dvk\* /ле. Мы видим, что изменение кинетической энергии в данном объеме связано с вытекающим из этого объема потоком энер- энергии и величиной, не имеющей характера потока и пропорцио- пропорциональной вязкости. Ясно, что эта последняя представляет дис- диссипацию энергии. Поскольку диссипация связана с уменьше- уменьшением кинетической энергии, всегда т) > 0. Возвращаясь к уравнению сохранения полной энергии (9,2), преобразуем его так, чтобы получить закон изменения внутрен- внутренней энергии. Вычитая (9,3) из (9,2), находим ^+4~"- (9'6) Плотность потока полной энергии ]Е в изотермической жидкости, по определению, слагается из потока полной энергии, переноси- переносимого жидкостью, и потока энегии, обусловленного механической работой: При v = 0, т. е. в неподвижной среде, тготок энергии отсутствует. Если, однако, жидкость не изотермична, то в ней возникает поток энергии даже в состоянии покоя. Поскольку условием термодинамического равновесия служит условие постоянства температуры, при достаточно малых отклонениях от равновесия естественно положить этот поток энергии равным (9,8)
§ 9] ЗАКОН СОХРАНЕНИЯ ЭНЕРГИИ 639 где и— кинетический коэффициент, именуемый теплопровод- теплопроводностью. Вектор /т называют плотностью потока тепла. Посколь- Поскольку вектор ]т направлен в сторону уменьшения температуры, все- всегда к > 0. Разумеется, закон переноса (9,7) является эмпириче- эмпирическим и выполняется лишь при малых отклонениях от теплового равновесия. Вектор плотности полного потока энергии в общем случае неизотермической среды можно написать в виде <9>9> Подставляя jf из (9,9) в (9,6) получаем dt dxk Так же как и кинетическая энергия, внутренняя энергия жид- жидкости не сохраняется. Закон сохранения выполняется только для их суммы, т. е. для полной энергии. Последнюю формулу удобно представить в другом виде. Именно, можно написать Р ~jf = ~$f (Р^) + °"v P^v# (9, И) Кроме того, определим количество тепла в единице объема соот- соотношением Р-^ dlv/r. (9,12) Выделяя в тензоре напряжений dk член с давлением, написав Oik = G'ik ~" pbiky (9,13) имеем dE dQ dvb , dv. Разделив все уравнения на р, получаем dE__dQ_ pdvk alkdvt dt ~ dt 713^+ p dxk Уравнение непрерывности дает dp до dv. dvb Поэтому окончательно dt ~ dt
640 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II Как мы подчеркивали в § 1, мы приняли допущение о суще- существовании локального равновесия в движущейся среде. Поэтому связь между термодинамическими функциями, в частности, между внутренней энергией и энтропией, дается формулами тер- термодинамики. Запишем основное термодинамическое равенство в виде и исключим из (9,17) и (9,16) внутреннюю энергию. Тогда мы приходим к уравнению для баланса энтропии: dS dQ Otu dv} vi dcn *тг __. I lit *_ ___ m .. ** или, пользуясь G,8) и (9,12) и расписывая полную производную энтропии, находим Это уравнение удобно записать в виде ^) + >^ (9,20) a k или, введя вектор плотности потока энтропии /s, определенный равенством /* = т(^-1!/д,л) (9,21) и обозначив через S величину представим (9,20) в виде Р Dг + v grad S) = " div Is + S (9,23) или в виде •^f = - div (9Sv + /s) + 2 • 0,24) Уравнение (9,20) показывает, что энтропия не сохраняется: изменение энтропии в данном объеме в единицу времени свя- связано не только с ее уходом вместе с движущейся средой, путем
§ 9] ЗАКОН СОХРАНЕНИЯ ЭНЕРГИЙ 641 теплопроводности и молекулярной диффузии, но так же возник- возникновением со скоростью, определяемой величиной 2. Эта вели- величина носит название производства энтропии. В несжимаемой жидкости последний член в производстве энтропии согласно (9,4) связан с вязкой диссипацией. В сжи- сжимаемых жидкостях он имеет тот же смысл, но связан как с пер- первой, так и со второй вязкостью1). В однокомпонентной системе диффузионный поток отсут- отсутствует, /я = 0 и соответствующие слагаемые в (9,21) и (9,22) обращаются в нуль. В однокомпонентной несжимаемой жидко- жидкости (9,23) можно представить в виде уравнения для температуры. Здесь уместно напомнить, что под несжимаемой жидкостью мы понимаем жидкость, совершающую медленное (по сравнению со скоростью звука) движение. При таком движении плотность среды не зависит от координат и времени явно. В неизотермиче- неизотермических условиях она может, однако, зависеть от температуры и, следовательно, изменяться во времени и в пространстве. Тем не менее уравнение непрерывности в неизотермической несжи- несжимаемой жидкости определяется формулой G,4). Энтропию жидкости можно представить как функцию тем- температуры и давления. Выразим производные от энтропии по координатам и времени через производные температуры. Для этого напишем основные равенства OS fdS\ дТ fdS\ 1 дТ Ср дТ dS -ldS) дТ _Ср дТ 1т = - * grad Г, jD = О, <*'ik[dvt , доЛ2 Л /dvt dv Т [dx^dxj 2T\dxk^d Подставляя эти равенства в (9,20), без труда получаем Это уравнение представляет уравнение теплопроводности в движущейся среде. Часто в уравнении теплопроводности можно сделать даль- дальнейшие упрощения. Хотя кинетические коэффициенты х и tj являются функциями температуры, при малых изменениях температуры этой зависимостью можно пренебречь. При этом 1) См. Л. Д. Ландау и Е. М. Лифшиц, Механика сплошных сред, Гостехиздат, 1953, стр. 229. 21 В. Г. Левич и др., том II
642 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II кинетические коэффициенты в однородной системе оказываются постоянными во всех ее точках и их можно вынести за знак производной. Кроме того, при малых скоростях движения по- последнее слагаемое обычно (хотя и не всегда!) мало и его мож- можно опустить. Уравнение теплопроводности приобретает вид -§f + i>gradr = xA7\ (9,26) где % = х/рСр именуется температуропроводностью. Мы получили систему уравнений переноса в движущихся сплошных средах. Совокупность уравнений переноса массы, уравнений движения и уравнения энергии (или энтропии) обра- образуют полную систему, описывающую движение среды. Действи- Действительно, уравнения движения содержат пять переменных величин (v, р, р) в однокомпонентной жидкости. Уравнение энтропии вводит еще две неизвестные функции — S и Т. Для определения семи функций имеются три уравнения, уравнение непрерывности, уравнение энтропии и термодинамические соотношения § = = SG\ р) и уравнение состояния р «= /?(Т, р). Вся совокупность уравнений содержит три кинетических коэффициента — г), ? и и. Мы не будем останавливаться ни на граничных условиях, которыми должны быть дополнены эти уравнения, чтобы их решения стали однозначными, ни на проведении этих решений даже в самых простых случаях. Все эти вопросы излагаются в курсах механики сплошных сред (или гидроаэродинамики). Наша цель заключалась лишь в том, чтобы сформулировать в известных допущениях макроскопические (феноменологиче- (феноменологические) уравнения неравновесной сплошной среды. Ниже будет показано, что как сами макроскопические уравнения, так и вхо- входящие в них кинетические коэффициенты могут быть получены из кинетических соображений, на основе молекулярных пред- представлений, по крайней мере для простейших систем. § 10. Уравнение Фоккера — Планка Мы можем теперь перейти к кинетическому описанию макро- макроскопических систем. Прежде всего сформулируем теорию медленных процессов, имеющую весьма общий, но несколько формальный характер. Рассмотрим произвольную макроскопическую систему, на- находящуюся в состоянии неполного равновесия. Мы будем сле- следить за изменениями ее состояний в течение промежутка вре- времени Го, удовлетворяющего неравенству т^<Г0<т5, A0,1) где Тд и ts — времена релаксации для быстрых и медленных про- процессов в системе.
§ 10] УРАВНЕНИЕ ФОККЕРА-ПЛАНКА 643 Состояниям неполного равновесия отвечают возможность за- задания различных микроскопически определенных характеристик системы. Микроскопическое состояние системы будет характе- характеризоваться некоторыми параметрами, всю совокупность которых мы будем обозначать через А,. Величина А, будет считаться про- пробегающей непрерывный ряд значений. Статистическое описание поведения системы будет осуществляться заданием функции распределения вероятностей р(А,, t)dk, характеризующей вероят- вероятность того, что система находится в момент времени t в состоя- состоянии в интервале Я, А, + d%. Функцию распределения будем счи- считать нормированной на единицу J p(X,t)dX= I. Пусть в некото- некоторый момент времени ^о система с вероятностью р(Яо, t^dK находится в состоянии А,о. За время Д^ «С То состояние системы изменится и она в момент времени V = t0 + At с вероятностью pCKJo + At)dX будет находиться в состоянии А,. В основу дальнейших рассуждений будет положено следую- следующее допущение: вероятность попадания в состояние А, за время At полностью определена заданием состояния А, и не зависит от того, каким образом система попала в состояние А,о, т. е. не зависит от предыстории процесса. Таким образом, вероятность перехода из одного произвольного состояния в другое зависит только от этой пары состояний. Такие состояния в теории вероят- вероятностей названы состояниями, образующими цепь Маркова. По- Поэтому кратко наше допущение можно сформулировать как до- допущение о том, что переходы между состояниями системы за время At образуют цепь Маркова. Вероятность перехода w в этом случае можно записать в виде до(А,о, А,, Д^). Если бы пере- переходы не имели характер цепей Маркова, то w зависело бы от состояний системы А,&, в которой она находилась при t'y и пере- переходов, в результате которых система попала в состояние Аю. Вероятность до(А,о, А,,ДО будем считать нормированной на единицу j w(X0, К At)dX=l. A0,2) Допустим, наконец, что вероятность перехода Аю->А, быстро убывает с ростом разности |А, — Аю|. Это означает, что переходы с существенны^ изменением состояния системы являются мало вероятными. С заметной вероятностью происходят переходы, при которых состояние системы изменяется сравнительно мало. Иными словами, мы предполагаем, что в системе происходят медленные процессы. Количественные ограничения, накладывае- накладываемые этим допущением на свойства до(А,о, А,, Д?), будут даны ниже. На основе этих допущений можно найти весьма общее урав- уравнение, определяющее зависимость функции распределения от 21*
644 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II параметров Я и времени. Заметим прежде всего, что вероятность р(Я, to + kt)dK можно представить как р (Я, t0 + АО dK = dK J р (Яо, t0) w (Яо, Я, АО dK0, A0,3) где интегрирование ведется по всем возможным значениям пе- переменной Яо. Действительно, p(KoJo)w(Xo,K, kt)d\odX предста- представляет вероятность того, что система, находившаяся в состоянии Ко за время А* перейдет в состояние К. Полная вероятность того, что система будет в момент t0 + А* в состоянии К, получается суммированием по всем возможным состояниям Ко. Интегральное уравнение A0,3) носит название уравнения Смолуховского. При его выводе мы использовали только допу- допущение, что состояния системы образуют цепь Маркова. Теперь мы воспользуемся допущением о медленности процесса. Умно- Умножим обе части A0,3) на произвольную функцию ф(Я)/Д?, отно- относительно которой предполагается лишь, что она непрерывна и ср->0 при |Я| ->оо, и проинтегрируем по всем К. Тогда ^ } 9 (К t0 + АО Ф (Я) dK = -ir J р (Ао, 0 dK0 J w (Яо, Я, АО Ф (Я) dK. A0,4) Разложим, далее, функцию ф(Я) в ряд по степеням (Я-Яо): Подставим это разложение в правую часть A0,4). Тогда J 9 (К 0 dK0 • J [ф (Яо) + Ф7 (Яо) (Я - Яо) + + ^sL (я - Я0J ] w (Яо, Я, АО dK = = J Р (Яо, 0 Ф (Яо) dKo J w (Яо, Я, АО dK + + J Р (Яо, 0 Ф7 (Яо) dK0 J (Я - Яо) w (Яо, Я, ДО dK + + Y J Р (Яо, 0 Ф" (Яо) dK0 J (Я - Я0J w (Яо, Я, АО dK + ... Рассмотрим внутренние интегралы по переменной Я. Первый из них согласно A0,2) равен единице. В силу быстрого спадания w при увеличении (Я — Яо), интег- интегралы существуют и хорошо сходятся. При этом ясно, что при таком поведении w последовательные значения интегралов In= j (K-Ko)nwdK быстро уменьшаются с увеличением п. Мы ограничимся членами
§ 10] УРАВНЕНИЕ ФОККЕРА—ПЛАНКА 645 второго порядка малости. Тогда найдем J р (Ко, t) dX0 J Ф (Я) w (Ко, К, At) dK с*. J р (Яо, t) ф (Яо) dKo + +\ J Р (К t) Ф" (Яо) /2 (Я0) At) • dKo, откуда -^Г J P (А., / + АОф(Я)^Я = -^-|р(ЯО + if / Р (Яо, О Ф' (Яо) /, (Яо, + ^ { Р (Яо, t) ф" (Яо) /2 (Яо, At) dK. A0,5) Переобозначив в первом интеграле справа переменную инте- интегрирования Яо-»-Я, перенеся его в левую часть и переходя к пределу Д?-*0, находим lim f = J р (Яо, о ф' (Яо) (днт /1(ЛД°;А<)) ^я0 + у f Р (Яо, t) Ф" (Яо) ( lim />(У}) или, вводя обозначения ^( )o(J, A0,7) Д<->0 J А* имеем, заменяя Яо->Я в правой части: J д<> (dt ° * ^)dA = \а ^ <Р' <Я) Р <Я> О ^Я + J D (Я) ф" (Я) р (Я, t) dK. A0,8) Интегрируя по частям оба слагаемых в правой части и пользуясь свойствами функции ф(Я), получаем J а (К) Ф' (Я) р (Я, t) dK = ф (Я) р (Я) а (К) |ГТО - J q> (Я) -§% (ар) dK = = -{ф(Я)- J D (Я) ф" (Я) р (Я, t) dK = J Ф (Я) -J^ (Dp) dK.
646 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II Подставляя эти выражения в A0,8) и перенося все слагае- слагаемые в левую сторону, находим Ввиду произвольности ф(Я) окончательно получаем Уравнение A0,9) носит название уравнения Фоккера — План- Планка. Оно определяет зависимость плотности вероятности от вре- времени и совокупности параметров К в случае произвольного мед- медленного процесса. Для краткости записи мы не учитывали, что величин Я может быть произвольное множество. В этом случае, не повторяя выкладок, можно написать где суммирование ведется по всем значениям i и k. При этом коэффициенты а{ и Dik имеют вид а в Г Dik= lim f (b-botH АУ->0 J a* Уравнению Фоккера — Планка можно придать наглядный смысл, если рассмотреть множество изобразительных точек, отвечающее некоторому ансамблю тождественных неравновесных систем. Величину р(к, t) можно считать при этом плотностью изобра- изобразительных точек. Тогда вектор ji=,ai9--^(Dik9) A0,11) можно интерпретировать как поток изобразительных точек в фазовом пространстве. При этом уравнение Фоккера — Планка выражает закон сохранения числа изобразительных точек. Умножая A0,10) на Я и интегрируя, находим J *ч~дГ<1*ч*=1п*'г ~~ J ^ отсюда, полагая, что р->0 при А,-> ±оо, имеем
§ 10] УРАВНЕНИЕ ФОККЕРА-ПЛАНКА 647 Вектор йг носит название подвижности. Он представляет со- собой среднюю скорость движения изобразительных точек в фазо- фазовом пространстве. Второе слагаемое в /< не дает вклада в среднюю скорость и представляет диффузионный поток. Тензор Dik представляет тен- тензор обобщенных коэффициентов диффузии. Часто Д- предста- представляют в виде 'Хе-^ЖГ <10>12) Тогда уравнение Фоккера — Планка' приобретает вид *(<p-D«lt)- A0ЛЗ> Это — так называемая вторая форма уравнения Фоккера — Планка. В частности, если тензор Dik коэффициентов диффузии и вектор подвижности не зависят от переменных к, выражение для потока представляет непосредственное обобщение эмпири- эмпирических законов G,10) и (9,8): где D — обобщенный коэффициент диффузии. При этом уравне- уравнение Фоккера — Планка переходит в более простое уравнение В стационарном состоянии в одномерном случае уравнение Фоккера — Планка легко интегрируется: Если поток частиц на бесконечности отсутствует, то интегри- интегрирование дает откуда const Рассмотрим теперь случай броуновской диффузии частицы, происходящей во внешнем поле сил. Благодаря действию внеш- внешней силы вероятность перехода w (x0, х, Д/) уже не симметрична относительно смещений частицы по направлению силы и в про- противоположном направлении. Поэтому средняя скорость v Ф0 и уравнение Фоккера — Планка можно написать в виде
648 ФИЗИЧЕСКАЯ KHHEfHKA [ГЛ. tt Поток вероятности / слагается из диффузионного потока и пото- потока, обусловленного действием силы f. Обычно средняя скорость, приобретаемая частицей, может быть написана в виде v = bf (ср. § 56 ч. III). Тогда получаем обобщенное уравнение диф- диффузии: В равновесном состоянии A0,14) дает 6fp — D-^- = 0.B поле потенциальных сил Ь 4^- р 4- D -|~ = 0, или ьи р = const e D \ A0,15) Для того чтобы A0,15) совпадало с распределением Больцмана, должно выполняться соотношение Эйнштейна для связи между коэффициентом диффузии и подвижностью Ь 1 D кТ ' Поэтому A0,14) можйо представить в виде др _ D д (dU , т ф \ dj dt kT дх \ дх P^K1 дх) дх ' где В стационарном, но неравновесном состоянии / Ф 0. Заметим, что в § 56 ч. III мы пришли уже фактически к фор- формуле A0,14), исходя из наглядного рассмотрения процесса сме- смещения броуновской частицы. Интегрирование A0,130 дает для распределения вероятно- вероятностей т. е. распределение Гаусса, центр которого смещается со ско- скоростью V. В качестве другого примера рассмотрим термическое про- прохождение частиц через потенциальный барьер. Пусть система невзаимодействующих частиц находится в области минимума потенциальной энергии (в потенциальной яме). Выберем за начало отсчета дно ямы и положим вблизи дна ямы
§ 10] УРАВНЕНИЕ ФОККЕРА-ПЛАНКА 649 Частицы в потенциальной яме находятся в состоянии статисти- статистического равновесия, так что и_ ndx = w{0)e kT dx. Вблизи точки минимума можно написать и_ м2 ndx = w@)e kT dx~ w{0)e 2kT dx, где w@) — вероятность найти частицу в точке х = 0. Полное число частиц в яме оо I e 2kT Мы распространили пределы интегрирования на интервал (—оо, оо) ввиду быстрого спадания подынтегральной функции. Пусть в области х ~ 1 потенциальная яма граничит с по- потенциальным барьером, вершина которого находится в точке х = 1. Будем считать, что высота барьера Uo удовлетворяет не- неравенству U0^>kT. A0,16) За потенциальным барьером частицы вновь попадают в потен- потенциальную яму. Если высота барьера удовлетворяет неравенству A0,16), то число частиц, протекающих через барьер, весьма мало. Тепловая диффузия через барьер является при этом на- настолько медленным процессом, что его можно считать стацио- стационарным. Пользуясь A0,14'), находим для потока / kT w @) D JL С kT dx __ kT w@) ( Au\ ll - e" kT ) D и f ~W где (—Af/) — разность энергий между двумя ямами. Вблизи максимума потенциальную энергию можно предста- представить в виде Ввиду быстрого убывания подынтегрального выражения, можно распространить интегрирование на всю ось х-в. Тогда находим \ekT dx = ek* Je 2kT dx
650 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II Соответственно, j=kT^Y^ е-&{\- еЩ. A0,17) Разделив / на полное число частиц в точке х = 0, находим вероятность того, что частица, находившаяся первоначально в одной потенциальной яме, пройдет через барьер и попадет в другую яму: 1/тт- -i A0,18) Формула A0,18) применяется для расчета скоростей химиче- химических реакций. В этом случае Д(/ представляет разность между энергиями исходных и конечных продуктов. Мы в дальнейшем будем неоднократно иметь дело с медлен- медленными процессами и увидим, что их поведение описывается урав- уравнениями типа Фоккера — Планка. Вследствие своей общности, уравнение Фоккера — Планка не дает детальных сведений о поведении систем частиц. Оно имеет квазимакроскопический характер и содержит неизвестные коэффициенты, значение которых должно определяться на опыте или находиться на основе кинетического описания макроскопи- макроскопических систем. §11. Основное кинетическое уравнение Эволюция произвольной квазизамкнутой подсистемы опреде- определяется уравнением B,3) для матрицы плотности. Получить его точное решение невозможно. Поэтому вместо точного уравнения для матрицы плотности в физической кинетике широко исполь- используется так называемое основное кинетическое уравнение, к вы- выводу которого мы перейдем. Рассмотрим замкнутую систему, состоящую из большого числа N взаимодействующих частиц. Будем считать, что взаимо- взаимодействие между частицами во время —©о < t-^0 отсутствовало и включено в момент t = 0. Волновая функция системы при t = 0 может быть предста- представлена разложением *о-2 *«(<>)*., где г|эт — система собственных функций некоторых операторов, описывающих систему частиц. Взаимодействие между частицами приводит к изменению состояния системы и ее волновая функция изменяется во вре- времени Чго->ЧГ(/). Волновая функция 4?(t) снова может быть
§ 11] ОСНОВНОЕ КИНЕТИЧЕСКОЕ УРАВНЕНИЕ 651 разложена по функциям Будем считать взаимодействием слабым и воспользуемся тео- теорией нестационарных возмущений. Вероятность того, что в момент времени / система окажется в некотором t-м состоянии, дается величиной |@|2 Согласно E5,10) ч. V где ЦП (8fc-8?) t с@) = с (Q). I Ml) (Л I АО) a H'ik— матричный элемент оператора взаимодействия Н' по волновым функциям г|э*. Перейдем теперь от квантовомеханического описания систе- системы к статистическому. Для этого, как это было пояснено в § 2, заменим значения |с*@|2 их средним по времени значением |с*(/)|2. При этом мы примем гипотезу случайных фаз B,7). При усреднении суммы A1,1) все произведения cf*cf? и ctycfj) обратятся в нуль. Тогда мы получим |"^(^2=|40)|2 + 2|я;,|2|40)|2^@, (п,2) где (е, — e.)t l-cosV l bk) l Формула A1,2) определяет вероятность перехода частиц из &-го состояния в /-е за время t. Число частиц в k-м состоянии пропорционально |с&|2, поэтому Здесь AJV* — изменение числа частиц в i-м состоянии, связан- связанное с приходом в него частиц из k-x состояний. Баланс частиц в i-м состоянии можно написать в виде S | H'ik |2 Nk @) D (t) - - 21 HU |2 Nt @) D (t) = S | H'ik |2 (Nk @) - Ni @)) D (t). A1,4) Первое слагаемое представляет число частиц, приходящих в /-е состояние за время t, второе — число частиц, уходящих из него за это же время. Множитель D(t), как мы видели в § 56 ч. V,
652 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II при t-+oo является одним из представлений б-функции: я@-*^й(в,-вл). (н,Б) Полагая, что время t достаточно велико для того, чтобы можно было воспользоваться формулой A1,5) и весьма мало с макроскопической точки зрения, мы можем написать: или, поскольку Ni — микроскопически определенная величина, можно заменить ANi/t на производную и написать окончатель- окончательно так: ^^Nt), A1,7) где через Wik обозначена вероятность перехода из &-го в i-e состояние ^*-Я-|я«Рв(в.-в*)- <П'8) Уравнение A1,7) носит название основного кинетического уравнения. Оно играет важнейшую роль в физической кинетике. Его можно переписать в эквивалентной форме, введя вместо числа частиц вероятность заполнения данного состояния W{. Тогда имеем ^Jtwd. A1,9) Подчеркнем, прежде всего, в чем состоит отличие кинети- кинетического уравнения A1,7) от точного уравнения для матрицы плотности B,4). Кинетическое уравнение содержит только ве- вероятность заполнения wu но не амплитуды вероятности. Иными словами, оно содержит только диагональные элементы матрицы плотности рпп. Мы привели этот вывод, в значительной мере повторяющий вывод формулы E6,11) ч. V, для того, чтобы были ясны сделан- сделанные предположения и границы применимости основного кинети- кинетического уравнения. Мы начнем с обсуждения области применимости формулы A1,5). Переход к б-функции осуществим, если интервал значений Ае = ег — eft при всех i и k удовлетворяет условию В макросистеме Де < kT, так что t>4r- (НЛО)
§ 111 ОСНОВНОЕ КИНЕТИЧЕСКОЕ УРАВНЕНИЕ 653 Как мы уже подчеркивали в квантовой механике, законы квантовой механики обратимы и не изменяются при замене t-+(—/). Это находит свое отражение в симметрии вероятно- вероятностей переходов или принципе детального равновесия: Мы видели в квантовой механике (см. § 98 ч. V), что прин- принцип детального равновесия не связан с применением теории возмущений и конкретным видом #' в формуле A1,9), но имеет совершенно общий характер. Необратимость процессов в кинетике возникает при выпол- выполнении усреднения коэффициентов |сг-(/)|2 по времени. Это усреднение основывается на гипотезе случайных фаз, которая лежит в основе приведенного вывода кинетического уравнения. Гипотеза случайных фаз использована не только для на- начального состояния системы, но и для всех остальных состоя- состояний. По существу, картина эволюции, описываемая кинетиче- кинетическим уравнением A1,7), сводится к следующему: из начального состояния 1, представляющего смешанное со- состояние, взаимодействие переводит систему за некоторое время в состояние 2. Затем происходит перемешивание фаз, после чего система из смешанного состояния 2 переходит в состоя- состояние 3 и так далее. Применение теории возмущений ограничивает время /, для которого можно пользоваться формулой A1,8). Допустим, что взаимодействие имеет характер столкновений и характеризуется некоторым временем т. Тогда вероятность перехода должна удовлетворять условию Wx<L Последнее неравенство можно представить в виде W<^—Ъ Г' A1,12) Следует подчеркнуть, что, несмотря на широкую область применимости основного кинетического уравнения, положенные в его основу рассуждения и допущения представлялись не вполне убедительными. Картина перемешивания фаз казалась недостаточно обосно- обоснованной и даже противоречивой. Действительно, если система после перехода «забывает» о своей предыстории, то непонятно, как в ней происходит односторонняя эволюция во времени. В работах последних лет удалось получить гораздо более убедительный вывод основного кинетического уравнения, по- позволивший не только отказаться от гипотезы перемешивания
654 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II фаз, но дать ответ на общий вопрос о природе необратимых процессов. Мы не можем в рамках этой книги изложить современную теорию и дать вывод кинетического уравнения. Можно лишь привести некоторые важнейшие идеи этой теории1). Мы подчеркивали, что эволюция во времени макроскопиче- макроскопических систем, обладающих весьма большим числом степеней свободы, принципиально отличается от соответствующих про- процессов в микроскопических системах, обладающих непрерывным спектром. Система, испытывающая рассеяние в непрерывном спектре имеет бесконечно большую плотность уровней, иными словами, обладает бесконечно большим числом степеней свободы. Од- Однако характер процессов рассеяния и процессов в макроско- макроскопических системах принципиально различен. Процессы рассея- рассеяния строго обратимы во времени, тогда как процессы в нерав- неравновесных макроскопических системах всегда обратимы. Таким образом, само по себе наличие в системе большого числа сте- степеней свободы не означает еще необратимости. Оказалось, что различие между макроскопическими и микроскопическими си- системами с большим числом степеней свободы связано с особен- особенностями вида гамильтониана. Рассмотрим замкнутую макроскопическую систему, находя- находящуюся в начальный момент времени в чистом состоянии. Га- Гамильтониан системы частиц может быть представлен в виде H = H0 + W, A1,13) где #о — гамильтониан в отсутствии взаимодействия. U пред- представляет энергию взаимодействия, а А,— малый параметр. В то время как в процессах рассеяния энергия взаимодей- взаимодействия имеет сингулярность в некоторых точках пространства, в макроскопических системах U распределено в пространстве во всем объеме системы и нигде не имеет особенностей. Это первая отличительная особенность макросистем. В представлении Гейзенберга статистический оператор * , A1,14) так что ¦%@)}. A1,15) !) См., например, G. Chester, The theory of irreversible processes, Rep. Progr., Phys. XXVI, 411 A963), Г. Честер, Теория необратимых процессов, «Наука», 1966.
§ 11] ОСНОВНОЕ КИНЕТИЧЕСКОЕ УРАВНЕНИЕ 655 Для гамильтониана вида A1,13) можно написать разложение: е н = <Г *я°'+(-1)П« j dtx\dt2... J dtnx 0 0 О XU(tx)U{t2)... U(tn)9 A1,16) где обозначено U(t) = eh U@)e h . Если подставить разло- i fit L. fjt жения A1,16) для екь и е h* в формулу A1,15), то она будет содержать слагаемые вида ULU \Ъ)Ш ULU |%>, A1,17) k где tyk — система базисных функций гамильтониана Яо без взаимодействия. Аналогичный вид будут иметь слагаемые, пропорциональ- пропорциональные более высоким степеням X. Исследование выражений типа A1,17) показало, что при известных ограничениях на вид оператора U, они обнаружи- обнаруживают характерное поведение: благодаря тому, что энергия взаимодействия распределена по всему объему, занимаемому системой частиц, число слагаемых в сумме A1,17) по воз- возбужденным состояниям при i = / в N раз больше, чем при В системе с очень большим числом частиц N-*oo (при N/V — конечном) это поведение суммы A1,17) приводит к по- появлению в ней множителя 6(г|^ — %). Это позволяет оставить в полном выражении для среднего (L), представляющем беско- бесконечный ряд, последовательность главных членов. Суммирова- Суммирование этих главных членов приводит автоматически к кинетиче- кинетическому уравнению A1,7). Такое поведение матричных элементов в A1,17) характерно только для систем с указанным свой- свойством U. Оно не имеет места в соответствующих процессах рассеяния микросистем. При этом выводе было показано, что применение гипотезы случайных фаз к промежуточным состояниям не требуется. Статистическое описание начального состояния предполагает случайное распределение фаз только этого состояния. Наконец, был выяснен смысл понятия «слабого взаимодействия». Именно слабость взаимодействия означает, что длительность процесса взаимодействия («столкновения») должна быть мала по срав- сравнению с временем между двумя последовательными взаимо- взаимодействиями.
656 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II Работы этого направления позволили не только подтвердить обоснованность и широкую область применимости основного кинетического уравнения, но также позволили установить и его связь с временным уравнением для матрицы плотности. К этому вопросу мы вернемся еще в дальнейшем. § 12. Обсуждение основного кинетического уравнения Основной проблемой, стоящей перед статистической теорией необратимых процессов, является решение принципиального вопроса: каким образом возникает необратимость макроскопи- макроскопических процессов, если движение частиц, из которых состоит макроскопическая система, является обратимым. Наряду с этой основной принципиальной проблемой перед статистической теорией необратимых процессов стоит более практическая и не менее важная задача получения кинетиче- кинетических законов и входящих в них кинетических коэффициентов. Последнее десятилетие ознаменовалось большим прогрессом в обоих направлениях. В нашем изложении кинетической тео- теории газов мы увидим, как решается проблема необратимости в простейшем случае идеального газа. Именно, движение частиц совершается по законам классической механики, которые ин- инвариантны относительно замены t на (—/). Необратимость воз- возникала при рассмотрении системы за промежутки времени, весьма большие по сравнению со временем столкновения. В предыдущем параграфе мы указали, что лишь в послед- последнее время было найдено более или менее удовлетворительное решение принципиального вопроса — как возникает необрати- необратимость в поведении макроскопических систем и в чем заклю- заключается различие в описании процесса рассеяния в системе из малого числа частиц от взаимодействия в системах, содержа- содержащих очень большое число частиц. Иными словами, удалось сде- сделать достаточно убедительно вывод основного кинетического уравнения. В последующем изложении кинетической теории газов мы снова вернемся к вопросу о необратимости и разберем его на примере этой, сравнительно более простой системы. Пока же мы обсудим свойства основного кинетического урав- уравнения на некоторых элементарных примерах. Простота основ- основного кинетического уравнения является обычно кажущейся. Вероятности перехода Wik зависят от чисел Nt и Nh. Это осо- особенно наглядно будет видно в последующих параграфах, где будет показано, что в идеальном газе изменение состояния ча- частиц происходит при столкновениях, прежде всего попарных. В последнем случае вероятность перехода пропорциональна числу сталкивающихся частиц в обоих состояниях. Если пе-
§ 12] ОБСУЖДЕНИЕ КИНЕТИЧЕСКОГО УРАВНЕНИЯ 657 рейти от суммирования к интегрированию, то кинетическое уравнение A1,9) превратится в нелинейное интегро-дифферен- циальное уравнение. Поэтому имеется лишь весьма ограничен- ограниченное число случаев, для которых удается получить хотя бы при- приближенные решения кинетического уравнения. Некоторые из них будут найдены ниже. Рассмотрим прежде всего простейшую совокупность атомов, могущих находиться в двух состояниях, 1 и 2. Пусть энергии этих состояний равны ei и е2. Если эта система находится в со- состоянии статистического равновесия и является замкнутой, то имеют место равенства: A2,1) fit «1**2 «21W1> A^>^) для разности ei — 82, меньшей, чем естественная размытость полной энергии системы бе, о которой шла речь в § 15 ч. III. Принцип детального равновесия можно непосредственно при- применить к замкнутой системе и получить в соответствии с ре- результатами § 98 ч. V равенство N\ = N2. Рассмотрим теперь систему атомов, находящуюся в состоя- состоянии статистического равновесия с термостатом. К такой системе принцип детального равновесия непосредственно неприменим. Он применим лишь к замкнутой системе «совокупность ато- моз + термостат». Для числа атомов, находящихся на уровнях 1 и 2, можно написать те же самые выражения A2,1) и A2,2). Однако в них ^12 Ф w2\. Действительно, теперь ад12 означает вероятность из- изменения состояния замкнутой системы, отвечающего переходу: атом в состоянии 1 \ ( атом в состоянии 2 термостат в одном | -> I термостат в любом из из состояний J I состояний с энергией Соответственно, w2\ представляет вероятность перехода: атом в состоянии 2 1 ( атом в состоянии 1 термостат в любом из [ -> ] термостат в одном из состояний с энергией ) I состояний с энергией ?*0. Ясно, что поскольку состояния термостата при переходе 1->2, 2-*1 могут быть различны, к этим переходам нельзя приме- применять принцип детального равновесия.
658 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II К вероятностям W\2 и W2\ можно применить каноническое распределение, написав W\2 __ Q(?o) / да\. _ et—e2 ра (?0—(82—еО)—а (Ео) ^^ о \дЕуг *' гГ kT Отсюда находим wl2 = w2l • е"*"^". A2,3) При этом A2,1) и A2,2) приводят к распределению Гиббса: Рассмотрим теперь ту л<е систему в термостате, находя- находящуюся в момент времени t в неравновесном состоянии. Тогда A2,5) Положим, что отклонение от неравновесного состояния мало, так что Ni = N?* + N'u A2,6) Л/2 = М0) + Л4 A2,7) При этом находим "r = A/>i2-^^2=-rff- A2,8) В правой части кинетических уравнений A2,8) можно для и W2\ написать равновесное соотношение A2,3). Тогда = 2 (iV>2I - iV>12) ~ 2w2l (N'a - N\e » j . При высоких температурах в2~81 < 1 и, следовательно, откуда Число систем в неравновесном состоянии экспоненциально уменьшается с временем релаксации т, равным
§ 12] ОБСУЖДЕНИЕ КИНЕТИЧЕСКОГО УРАВНЕНИЯ 659 Перейдем к обсуждению более сложной системы, когда в термостат заключена система атомов и излучение. Атомы, находящиеся в состоянии 1 с энергией еь могут по- поглощать фотоны с энергией hv = 82 — еь Вероятность такого поглощения ^12=#12P(V, T)9 где p(v, T) — плотность энергии, приходящаяся на единичный интервал частот (ср. § 74 ч. III), а В\2— коэффициент пропор- пропорциональности. Убыль числа атомов в состоянии 1 дается вы- выражением Атомы, находящиеся в состоянии 2, переходят в состояние 1 в результате двух процессов: самопроизвольного и вынужден- вынужденного излучений. Самопроизвольное излучение имеет место как в отсутствие излучения, так и в его присутствии. Обозначим вероятность самопроизвольного (спонтанного) излучения с пе- переходом 2-* 1 через A2i- В системе атомов, взаимодействующих с излучением на основании принципа детального равновесия, должен происхо- происходить процесс излучения, обратный процессу поглощения. Это излучение называется вынужденным. Вероятность вынужден- вынужденного излучения равна где В2[ = В12. Поэтому изменение числа атомов в состоянии 2 дается фор- формулой -^ = A2lN2 + B2l9(v9 T)N2. A2,11) Если система (атомы + излучение) находится в равновесии, то dNx dN2 dt ~~ dt И Wi?i2p(v, T) = A2lN2 + B2[9{v, T)N2y или С другой стороны, в состоянии равновесия N2/N\ выражается формулой Больцмана. Поэтому для равновесной плотности
660 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. И энергии излучения находим ^>T^t^E^=tl^' A2ЛЗ) е kT — 1 Мы приходим, таким образом, к формуле Планка. Отношение Л21/В12 может быть найдено путем перехода к формуле Рэлея — Джинса (т. е. перехода к малому значению (ft/WXl) (X) Приведенный вывод формулы Планка был дан Эйнштейном. Обобщение его на случай атомов с произвольным числом уров- уровней не представляет труда. § 13. Неравновесные системы с отрицательной температурой и усиление ими электромагнитных волн Статистические системы, обладающие конечным числом уровней, обладают некоторыми замечательными особенностями. Подчеркнем прежде всего, что если все энергетические уровни системы лежат в ограниченном интервале энергий, то приведен- приведенная в § 17 ч. III аргументация по поводу существенно поло- положительного значения температуры теряет силу. Действительно, в § 17 ч. III утверждалось, что если бы температура 6 была меньше нуля, распределение Гиббса нельзя было бы подчинить условию нормировки и оно потеряло бы всякий смысл. Однако, если энергия пробегает лишь конечный ряд значений, норми- нормировка распределения Гиббса может быть проведена при любом значении 6. Рассмотрим систему из N атомов с конечным числом п уров- уровней энергии, находящуюся в термостате. Хотя в действитель- действительности у атомов не бывает конечного числа уровней, для после- последующих рассуждений достаточно, чтобы группа близких уровней была отделена от остальных уровней широким энергетическим интервалом. Как мы видели в § 40 ч. III, при Т = 0 все атомы находятся на нижнем уровне энергии, а при Т S> Гс, где Тс= en~Bl , рас- распределение по уровням становится равномерным. При промежу- промежуточных значениях температуры число атомов на уровне с данной энергией, часто называемое заселенностью уровня, определяется формулой A2,4). Представим себе теперь, что атомы не предоставлены са- самим себе, но к ним извне подводится энергия. Ниже мы разбе- разберем один из способов, которым можно практически подводить
§ 13] НЕРАВНОВЕСНЫЕ СИСТЕМЫ 661 энергию к системе атомов. Если в системе атомов имеется так- также некоторый механизм потери энергии, то в известных усло- условиях система придет в неравновесное, но стационарное состоя- состояние. Количества подводимой и теряемой энергии будут равны между собой и в системе установится не зависящее от времени распределение атомов по уровням энергии. Это распределение будет отлично от равновесного. Заселенность уровней в системе будет отлична от A2,4). Именно, в известных условиях, в част- частности, при достаточно большом значении энергии, подводимой к системе, заселенность верхних уровней станет выше, чем нижних. Если бы мы захотели описать состояние нашей неравновес- неравновесной системы в терминах распределения Гиббса A2,4), то мы сказали бы, что система обладает отрицательной температурой для описания стационарных состояний. Такая терминология яв- является весьма целесообразной. Ход шкалы температур определится, очевидно, следующим рассуждением, которое для простоты мы проведем на примере системы с двумя уровнями. Из формул D0,4) и D0,7) ч. III следует, что при Т = 0 все атомы находятся на нижнем уровне, так что энтропия си- системы равна нулю. При Г —>оо (фактически при Т^>ТС) оба уровня заполнены равномерно, а энтропия максимальна. Ясно, однако, что при Т—>—оо получается тот же результат: заселе- заселение верхнего и нижнего уровней одинаково. При уменьшении |Г| в области отрицательных температур частицы постепенно переходят на верхний уровень и при Г—>—0 на этом уровне оказываются все частицы, тогда как нижний уровень совершен- совершенно не заселен. Энтропия системы снова равна нулю. Рассмотрим теперь количественно один из возможных ме- методов получения систем с отрицательной температурой. Пусть, например, имеется плазма, в которой электроны и атомы (или ионы) имеют различные температуры (т. е. разные средние кинетические энергии). Пусть атомы имеют три уровня с энергиями 8ь 82 и 8з- Напишем кинетическое уравнение для чисел атомов, находящихся на этих уровнях. При столкновении с электронами атомы с вероятностями №& (k > i) переходят на верхний уровень. Таким столкновениям отвечает переход кинетической энергии электронов во внут- внутреннюю энергию атомов (удары первого рода). Кроме того, на основании принципа детального равновесия, с вероятностью хющ (&>/), происходят удары второго рода, при которых внутрен- внутренняя энергия атомов передается электронам. Наконец, атомы, находящиеся в возбужденных состояниях, могут высвечивать энергию с вероятностью шизл.
662 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II Учитывая эти процессы, можем написать для числа воз- возбужденных частиц: В случае, когда возбуждение электронами компенсируется дезактивацией ударами второго рода и излучением, возникает стационарное состояние, при котором все производные по вре- времени обращаются в нуль. Считая вероятность перехода со вто- второго на третий уровень W2z = ^32 равной нулю, а также равной нулю ш^ (так называемый запрещенный переход), получаем из второго уравнения Если, кроме того, вероятность высвечивания w^3Jl больше, чем вероятность удара второго рода t^2i, то Третье уравнение дает при условии w®^ > w 3l: Чзл Чзл »12 Для отношения вероятностей W\z/w\2 можно написать фор- формулу, аналогичную A2,3), в которую входит температура того термостата, с которым происходит обмен энергией, в данном случае электронного газа с температурой Гэл: kT эл W{3 =
§ 13] НЕРАВНОВЕСНЫЕ СИСТЕМЫ 663 Поэтому окончательно: ¦5$Г» №-tfu A3,0 W2 A3,2) В окончательную формулу вошли отношения вероятностей двух возможных видов перехода с уровней 2 и 3 — путем из- излучения и с помощью ударов второго рода. По предположе- предположению, первая вероятность много больше второй. Поскольку 82 > 8ь из A3,1) следует N2<^N\. Наоборот, хотя ез>ег, при достаточно большом значении предэкспоненциального множи- множителя, в A3,2) эта формула приводит к значениям N$> N2. Это означает, что благодаря запрету перехода с третьего уровня на второй столкновения с электронами переходят большее чис- число атомов на уровень 3, чем на уровень 2. Уровень 3 имеет, таким образом, отрицательную темпера- температуру по отношению к уровню 2. Подчеркнем, что разобранный способ получения отрицательных температур не является са- самым важным и распространенным на практике. Однако он наиболее простым образом позволяет выявить необходимые для этого физические условия *). Мы можем теперь перейти к упомянутым выше свойствам систем с отрицательной температурой. Если рассмотреть взаимодействие системы при Т < 0 с из- излучением, то сразу ясно, что это взаимодействие принципиаль- принципиально отличается от взаимодействия с системой при температуре Т > 0. Предположим, что на систему действует монохроматиче- монохроматическое излучение с частотой Де 83 — е2 Это излучение будет поглощаться, причем поглощенная интен- интенсивность /~ пропорциональна числу атомов в состоянии 2 и плотности излучения: ГВ23Ы2р. 1) Более подробно о методах получения отрицательных температур см. обзор: Н. Г. Басов, О. Н. Крохин, Ю. М. Попов, Генерация, усиление и индикация излучения с помощью квантовых систем, УФН, т. 72, вып. 2, 1960; А. Вейлстеке, Основы теории квантовых усилителей и генераторов, ИЛ, 1963; Н. В. Карлов, А. А. Маненков, Квантовые усилители, «Итоги науки», ВИНИТИ, М., 1966.
664 ФИЗИЧЕСКАЯ КИНЕТИКА [ГЛ. II Наряду с поглощением будет иметь место излучение ато- атомов, находящихся в состоянии 3, вынужденное и спонтанное. Излучаемая интенсивность равна (ср. A2,11)): /+ = B32N3p + A32N3. Разность интенсивностей Если N$— Л^2>0, т. е. если уровень 3 имеет отрицательную температуру по отношению к уровню 2, то, проходя через си- систему, излучение будет не ослабляться поглощением, а усили- усиливаться благодаря вынужденной эмиссии. На использовании этого эффекта основана работа мазеров и лазеров — квантовомеханических усилителей и генераторов. Они находят все более широкое применение в современной ра- радиотехнике. Лазеры являются наиболее эффективными совре- современными генераторами в области инфракрасного и оптического диапазонов волн.
ГЛАВА III КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ И ГАЗОПОДОБНЫХ СИСТЕМ § 14. Кинетическое уравнение Больцмана Мы подчеркивали выше, что решение основного кинетиче- кинетического уравнения сталкивается с очень значительными трудно- трудностями. Поэтому основные практические результаты получены при рассмотрении таких физических систем, для которых основ- основное кинетическое уравнение может быть заменено более про- простым кинетическим уравнением. Основное кинетическое уравнение определяет числа Ni или распределение частиц по состояниям с учетом всех связей и взаимодействий, существующих между частицами системы. Однако ясно, что в ряде случаев такое описание макроси- макросистем является слишком детальным. Это прежде всего относится к идеальному газу. В классическом приближении, которым мы будем в дальнейшем ограничиваться, вместо числа частиц в дан- данном состоянии можно описывать состояние системы непрерывной функцией распределения. Последняя, в силу отсутствия взаимо- взаимодействия между частицами, распадается на произведение функ- функций распределения отдельных частиц. Задание функции распре- распределения отдельной частицы позволяет полностью описать свой- свойства идеального газа как целого. Рассмотрим функцию распределения для молекулы нерав- неравновесного идеального газа. Мы знаем, что в идеальном газе каждую молекулу можно считать квазизамкнутой подсистемой. В отличие от равновесного газа, функция распределения за- зависит, вообще говоря, от координат х, у, г, компонент импуль- импульса рХу Ру, Рг и времени t. В дальнейшем удобно ввести следую- следующие обозначения: пусть dn — число молекул, изобразительные точки которых лежат в элементе фазового пространства dy = dx dy dz dpx dpy dp2 = dp dV в момент времени t. Тогда dn = f(r, p, t)dyy
666 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III где f(r,p,t) является искомой функцией распределения. Изме- Изменение величины dn во времени (т. е. изменение числа изобрази- изобразительных точек, находящихся в элементе объема dy) обусловлено соударениями между молекулами газа. Если в результате столкновения двух молекул, имеющих импульсы pi и р2, одна из них получает импульс р, то при этом ее изобразительная точка попадает в элемент пространства dy. Если, наоборот, молекула, имевшая импульс р, сталкивается с другой молекулой и приобретает новый импульс, ее изобра- изобразительная точка выходит из объема dy. Очевидно, что чем боль- больше объем dy, тем больше (при прочих равных условиях) число молекул, изобразительные точки которых входят и выходят из этого объема в единицу времени. Изменение числа частиц в эле- элементе фазового объема в единицу времени. Изменение числа частиц в элементе фазового объема в единицу времени можно написать в виде d(dn) df(r9p, t)dy _(h dt dt KU где (ady) — число молекул, изобразительные точки которых по- покидают элемент объема dy в результате столкновений типа (р, pi)->(p2, рз), и (bdy), аналогичным образом, число моле- молекул, изобразительные точки которых входят в элемент объема dy вследствие столкновений типа (р2, рз)~>(р, pi). Таким образом, имеем Полную производную и?' можно, очевидно, представить в виде df в а/ + df dPx + df dPy ^ df dPz dt dt dpx dt dpy dt dpz dt , K^La. М-*а+ df dz = df dP df dr df + dx dt + dy dt + dz dt dt dt dp + dt dr ' или df (r, P, 0 _df , df p ^djp di dt + dr m "*" dpr' где — = v — скорость молекулы, a -~- = F—сила, действую- действующая на молекулу, имеющую импульс и координаты, лежащие в элементе фазового объема dy в момент времени t.
§ 14] КИНЕТИЧЕСКОЕ УРАВНЕНИЕ БОЛЬЦМАНА 667 Окончательно находим где I = Ь — а. Дальнейшая задача заключается в нахождении величины / = Ь — а, именуемой обычно интегралом столкновений. Интег- Интеграл столкновений может быть найден для достаточно разрежен- разреженного газа, в котором столкновения происходят только попарно. Мы будем предполагать, что при столкновениях не происходит перехода кинетической энергии в энергию, отвечающую другим степеням свободы, т. е. что столкновения молекул происходят по законам упругих столкновений твердых шаров. При попарных упругих столкновениях одинаковых частиц выполняются законы сохранения импульса и энергии, которые можно записать в таком виде: Pi+P = p3 + p2> A4,2) Pl + fP-Pl + Pl A4>3) Процесс упругого столкновения молекул можно охарактеризо- охарактеризовать дифференциальным эффективным сечением рассеяния в элемент телесного угла dQ\. При этом эффективное сечение за- зависит от абсолютной величины относительной скорости сталки- сталкивающихся частиц УОтн = |^ — ^i | и угла рассеяния а = a(v,V\). Поэтому дифференциальное сечение рассеяния частицы, имею- имеющей скорость v, в телесный угол йп\ можно написать в виде A4,4) Каждая из f(p,r,t)dpdV частиц, имеющих импульс р, испы- испытывает за 1 секунду столкновения с частицами, имеющими им- импульс р\ и находящимися в цилиндре с высотою а0Тн и площа- площадью основания da. Число последних равно v0l:Bdof{p\,r,t)dp\. Поэтому полное число попарных столкновений, испытываемых за 1 секунду частицами, находящимися в элементе фазового объема dy, равно , r, t)dpdVf(pi9 r, t)dp{. Для нахождения интересующей нас величины ady мы дол- должны учесть, что любое столкновение, испытываемое частицей с импульсом р, приводит к изменению р и выводу ее изобрази- изобразительной точки из объема dy. Поэтому ady = dpdV J J v0THe{v0TH, a)f(p, r, t)f(pu r, f)dpxdQ{ или > г, t)f(pu r, OdpidQi- A4,5)
668 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Интегрирование производится по всему телесному углу Q\ и всем значениям импульса рь Аналогично может быть найдено число соударений, в результате которых в объеме dy появляются изобразительные точки, т. е. число столкновений типа (Р2, Рз)->(Р, Pi)- Можно написать, очевидно, что число столкновений молекул с импульсами р2 и р2 за 1 секунду равно *> r> t)dVdp2dp3, где t?TH = |tF2-tF3|. Интересующая нас величина b dy получится интегрирова- интегрированием последнего выражения по всем значениям импульсов р2 и рз, удовлетворяющих условиям A4,2) и A4,3): = dV J J J4THa«TH, a)f(p2, r, t)f(p3, r, t)dp2dp3dQv A4,6) Законы упругого удара позволяют выразить v'0TH через v0TK и dp2dps через dpdp{. Именно, относительная скорость после Щ — ^з| равна относительной скорости до v — v\\. Для перехода от интегрирования столкновения vOTli = столкновения v0TH = по dp2dpz к dp dp\ можно написать Модуль якобиана преобразования р2, рз—>р, pi удобно вычис- вычислить, направив вектор р по оси х. Простое вычисление дает д (р2> Рз) I 1 р, Pi) поэтому dp2 йрз = dpi dp. Подставляя последнее равенство в A4,6), находим Ь= J J vOTHa(vom a)f(p2, r, 0/(рз. ^ O^Pi dQ{. A4,7) В функциях f(p2,r,t) и f(p2,r,t) для выполнения интегрирова- интегрирования векторы р2 и рз должны быть выражены через р и рь С помощью найденных значений b и а интеграл столкнове- столкновений можно написать в симметричном виде: I = b-a= J J v0THa (иотн, a) [/ (р2, г, t) f (p3, r, t) - ~f(p,r, t)f(Pi,r, t)}dPld&x. A4,8)
§ 14] КИНЕТИЧЕСКОЕ УРАВНЕНИЕ БОЛЬЦМАНА 669 Подставляя значение интеграла столкновений в A4,1), прихо- приходим к уравнению: -Ji+ir§+F^= J ЬоТн*Ктн, а)[/(р2, г, 0/(Рз, г, 0- r, t)f(p{,r, t)]dp{du{. A4,9) В дальнейшем для краткости мы будем писать вместо f(p,r,t), f{p\,r,t), f(p2,rj) и f(p*,r,t) соответственно f, fu h и h и вместо а(г;Отн, а) просто а. В этих обозначениях имеем Найденное интегро-дифференциальное уравнение A4,9) (или, в краткой записи, A4,10)) для функции распределения носит название кинетического уравнения Больцмана. Значение уравнения Больцмана далеко выходит за рамки физической кинетики идеального газа. Как будет видно из ряда примеров, которые будут рассмотрены в дальнейшем в этой и других главах книги, целый ряд физических систем, очень дале- далеких, по существу, от идеального газа, по формальным признакам удовлетворяет требованиям, положенным в основу вывода кине- кинетического уравнения Больцмана, и описываются этим уравнением. С математической точки зрения уравнение Больцмана пред- представляет нелинейное интегро-дифференциальное уравнение с частными производными. Для того чтобы уравнение Больц- Больцмана приобрело конкретный смысл, необходимо знать зависи- зависимость эффективного сечения от относительной скорости и угла рассеяния, а также поле сил, действующих на частицы газа. Однако даже при простейших предположениях о виде функции g(Voth^) и ° характере поля сил провести его интегрирование весьма трудно. Ниже будут изложены методы решения уравнения Больц- Больцмана. Пока заметим, что наряду с импульсами часто удобно пользоваться в качестве переменных скоростями молекулы. В переменных (у, г, t) уравнение Больцмана приобретает вид <>™^3-f/i]*rIda. A4,11) В дальнейшем мы будем переходить от переменных р к пере- переменным v или от A4,9) к A4,11), не делая специальных ого- оговорок. Мы не будем также оговаривать переход от векторных к тензорным обозначениям, в которых A4,11) приобретает вид ^«t^3-//I]^1rfQ. A4,12)
670 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Иногда уравнение Больцмана записывают в более симметрич- симметричном представлении, при котором в интеграле столкновений про- проводится интегрирование по всем значениям импульсов сталки- сталкивающихся частиц. Именно в силу законов сохранения импульса и энергии можно написать Ь - а = J avm [f2f3 - ffx] dpx dQ = = J avm [Уз - ff\] б (рз + й - Pi - P) dpi dp2 X X 6 (e2 + e3 - e - ex) de3 duy A4,13) где дельта-функция векторного аргумента 6(р) означает Вместо интегрирования по энергии вз можно ввести инте- интегрирование по импульсу р3, поскольку Поэтому можно переписать A4,8) в виде Ъ - а = J av0TH [f2f3 - fj] б (р2 + рз - pi - р) X 2 При этом мы вместо — написали симметричное выражение ( 1 ), воспользовавшись полным равноправием импуль- \Р2 Ръ I сов рз и р2. § 15. Основное кинетическое уравнение для коррелятивной функции Приведенный выше вывод уравнения Больцмана, весьма простой и наглядный, страдает, однако, рядом недостатков, как принципиальных, так и практических. Действительно, в этом выводе рассмотрены только попарные соударения молекул. При этом парный характер соударений является весьма существен- существенным, и совершенно не видно, каким образом можно обобщить вывод на случай тройных, четверных и т. д. столкновений. Вся область применимости общей теории суживается до случая весьма разреженных газов. С другой стороны, в приведенном выводе совершенно не видно важного принципиального мо-
§ 15] ОСНОВНОЕ КИНЕТИЧЕСКОЕ УРАВНЕНИЕ 671 мента: с одной стороны, в его сторону положены обратимые во времени уравнения классической механики. Движение частиц и их соударения совершаются по строго детерминизированным законам. С другой стороны, из уравнения Больцмана вытекает, что в результате соударений в газе устанавливается молеку- молекулярный хаос и энтропия газа монотонно возрастает, стремясь к некоторому пределу (см. § 19). При этом не ясно, в каком именно месте в ход выкладок вносится статистический, вероят- вероятностный момент. Многие критики работ Больцмана усматри- усматривали в этом парадоксальный и необоснованный результат. По- Поэтому весьма существенно получить, более последовательный и прозрачный вывод уравнения Больцмана. Мы приведем вариант такого вывода, основанный на исполь- использовании коррелятивных функций1). В части III были определены коррелятивные функции рт, для которых получена система зацепляющихся уравнений, в ко- которой коррелятивные функции младшего порядка выражаются через функции старшего порядка. При этом, однако, мы ограничивались коррелятивными функ- функциями, зависящими от координат частиц. Сейчас нам необхо- необходимо обобщить определение коррелятивных функций на слу- случай, когда они зависят также от импульсов и времени. Чтобы избежать громоздких обозначений, всю совокупность переменных (рь /?2, ..., Pzn\ Яи ?2, .., ?3/v, t) мы запишем как (xN, t). Функция распределения системы, содержащей N частиц p(xNjt)y должна удовлетворять общему уравнению выражающему закон сохранения числа изобразительных точек в фазовом пространстве. Распишем полную производную в виде dg^ _ dp ар dpt д$^ dqt __ ~Ш~~~~дТ + ~др~. ~dt *~ ~dq^HT~7~ -f-|;f+^f-l-№ri = o- ОМ) Уравнение A5,2) носит название уравнения Лиувилля. В рассматриваемом нами случае системы взаимодействую- взаимодействующих частиц функция Гамильтона имеет вид 1) См. Н. Н. Боголюбов, Проблемы динамической теории в статисти- статистической физике, Гостехиздат, 1946.
672 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. Ill и скобка Пуассона {Я; р} определена равенством ^^ A5,3) Взаимодействие между частицами считается парным. Введем коррелятивную функцию ps, определив ее так же, как и в § 48 ч. III: 9s (*i, х2,..., xSi t) = Vs J р (дс„ дг2, ..., л://) dxs+l ... йл:^. A5,4) В дальнейшем нас будет интересовать только ординарная функция Pi(*i, O-Pi('i, Pi, t) = (V/ff)f(ruP» t), A5,5) представляющая (с точностью до множителя V/N) функцию распределения частиц в газе, и бинарная функция p12(*i, x2, t) = 9[2(ru pl9 r2, p2, t) = V2/N2fi2(ru r2, pi, p2, 0- Пользуясь определениями A5,2) и A5,3), находим дЬ dq dpj 2 * Имеем очевидно п дг{ —* ;v m V dri Далее, поскольку все частицы одинаковы, N N — 1 f
§ 15] ОСНОВНОЕ КИНЕТИЧЕСКОЕ УРАВНЕНИЕ 673 Наконец, члены оставшейся суммы можно написать в виде = jdx3... dxt-x dxl+l ... </Ц J -^ dpt J -gj- dr, - При всех разумных предположениях о виде функции распреде- распределения можно считать, что jjPi->0 A5,9) при неограниченном возрастании области интегрирования. Та- Таким образом, все слагаемые третьей суммы в A5,6) равны нулю; пользуясь A5,7) и A5,8) получаем вместо A5,6) Поскольку U\2 не зависит от импульсов, можно написать dUl2 dpi2 dUl2 dpl2 __ д д d d l2' Pl2'' drx dPl дгх дрг dpx drx так что A5,10) можно представить в виде (опуская индекс /) A5,11) Переходя к пределу бесконечно большой системы (N—>оо; I/—>оо), имеющей большой, но конечный удельный объем 0 = -^г? имеем Уравнение A5,12) определяет закон изменения ординарной функции f(r,p,t) от координат, импульсов и времени. Мы будем именовать его основным кинетическим уравнением для одинар- одинарной функции распределения f. Как и в равновесном газе, pi выражается через pi2. В свою очередь, повторяя предыдущие выкладки, можно получить ана- аналогичное уравнение для pi2(^], л:2, /). Оно имеет аналогичный вид и содержит тернарную функцию pi23- Мы не будем, однако, вы- выписывать это уравнение, поскольку в разрежённом газе вели- величина l/v весьма мала и является малым параметром в уравнении для pi. Если мы будем интересоваться значением pi в первом 22 В. Г. Левич и др., том II
674 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III приближении по малому параметру l/v, то в выражение A5,12) следует подставить значение pi2 в нулевом приближении. По- Последнее может быть найдено без кинетического уравнения Для pi2. § 16. Вывод уравнения Больцмана из основного кинетического уравнения Рассмотрим достаточно разреженный газ, в котором частицы испытывают только попарные столкновения. Для простоты в дальнейшем мы будем считать газ простран- пространственно однородным, так что функция распределения pi зависит только от импульсов р и времени t, т. е. Pi (*, *i) = Pi (*, P). При этом бинарная функция распределения не должна изме- изменяться при пространственном смещении двух частиц на постоян- постоянный вектор а, т. е. PttC. Г\ + <*> Ъ + й, Pi, ft)ePl2(f. *Ь Ъ, Pi, ft). Это условие выполняется только в том случае, когда pi2 является функцией расстояния между частицами гХ2 = Г\—г2, Pl2 = Pl2 (^э Г12, Р\, р2)- Мы можем, очевидно, ввести следующую шкалу возрастающих времен: 1) время столкновения тс~~-, где г0 — радиус сферы взаимодействия и v — средняя скорость; 2) среднее время между двумя последовательными соударениями, т~—, где % — средняя длина свободного пробега; как мы увидим в дальней- дальнейшем, т представляет время релаксации в микроскопических объемах газа; 3) макроскопическое время релаксации или гид- гидродинамическое время Тщасго ~ -j- > где L — макроскопическая длина, например, размер сосуда с газом. Очевидно, что всегда A6,1) Рассмотрим поведение газа в течение промежутков времени Af таких, что тс < А^ <С т. За это время лишь очень немногие мо- молекулы в газе успевают испытать столкновения. Поэтому пове- поведение во времени основного числа частиц за времена Д? описы- описываются функцией pi. Те немногие частицы, которые за время Д^ успевают испы- испытать столкновения, мысленно объединим в пары. Ясно, что число
§ 16] ВЫВОД УРАВНЕНИЯ БОЛЬЦМАНА 675 пар весьма мало по сравнению с полным числом частиц N. По- Поведение пар описывается, очевидно, бинарной коррелятивной функцией pi2. Наша задача заключается в установлении связи между pi и pi2. Это будет сделано в результате рассуждения, которое, строго говоря, справедливо лишь для времени по- порядка At. Рассмотрим поведение коррелятивных функций в предельном случае ~~>0. Уравнение для функции распределения при бесконечно малой плотности газа в пространственно однородном газе приобретает вид *р|^0=0. A6,2) Формула A6,2) имеет простой смысл — в этом приближении частицы движутся независимо друг от друга. Решение уравнения A6,2) удобно записать в символическом виде \pv f-Tj. A6,3) Оператор S[l) действует на функцию рь зависящую от пере- переменных хи переводя функцию, взятую в начальный момент вре- времени (t — Тс), в функцию в момент времени t. Поскольку без столкновений частицы движутся в однородном газе с постоян- постоянным импульсом, Pi (Pi. О-Pi (Pi. *-*c). A6,4) Аналогичным образом можно написать в приближении > О уравнение для коррелятивной функции pi2. Оно имеет, очевидно, вид "(° =0. A6,5) dt Соответственно можно написать решение уравнения A6,5) в символическом виде Pi? С' XV *2) = Si2)PI2P ~ Тс> *V *2> A6,6) Оператор S?] действует на функцию pi2(*i, x2), зависящую от пары аргументов хх и х2, переводя ее от значения в началь- начальный момент времени t — тс к значению в момент времени t. Уравнение A6,6) описывает поведение пары молекул, не под- подвергающихся воздействию со стороны остальных молекул. Ясно, что такое рассмотрение и само уравнение A6,5) имеет строгий смысл только за промежуток времени меньший, чем время между последовательными столкновениями т. Поскольку, 22*
676 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III однако, это время весьма велико по сравнению с временем столк- столкновения, мы можем приближенно пользоваться A6,5) и для больших времен, т.е. будем полагать ?—>оо. Это основное до- р излагаемой теории, принадлежащей Н. Н. Боголюбову. Запишем A6,6) в виде -xc, xvx2) = f IP|2 (' - V XV *2) - P. {* - V *,) P. (' - V X2)} + t-Tc,xl)9i(t-xc,x2). A6,7) Перейдем к пределу t-*—оо, т.е. рассмотрим коррелятивную функцию задолго до столкновения. Очевидно, что при t-*—оо поведение пары частиц не коррелятивно и lim 5<2)р12 {t - тс, *,, х2) - р, (/ - тс, *,) • р, {t - хс, х2). A6,8) Поэтому можно написать условие ослабления корреляции lim р12 (t, хи х2) = р! (t - тс, агО р! (/ - тс, х2). A6,9) Функция распределения pi, в пространственно однородном газе зависит только от импульса. Пределу /-*—оо отвечают предельные значения импульсов частиц, входящих в момент времени t = to в столкновение Pi и Рг, так что lim S~(V =P., A6,10) lim VB)p2 = P2, A6,11) где Pi и Р2 — предельные значения импульсов частиц до стол- столкновения, когда они находятся вне сферы взаимодействия. Очевидно, что Pi и Р2 связаны с импульсами pi и р2 сталки- сталкивающихся частиц соотношением 11^ о6-12) Пользуясь A6,10) — A6,11) и учитывая A6,5), можно прибли- приближенно представить A6,9) в виде JTO12(/-rc, xv x2)- - р, (t - tc, хх) р, (/ - tc, х2)\ + f Ит^ S<2>Pl (t - тс, х,) р, (/ - тс, д:2) = - Pi (о. Л) pi (о, р,) = р, (/, р,) p. (t, p2). A6,13) Формула A6,13) позволяет выразить бинарную функцию рас- распределения pi2 через унарную функцию pj. Однако, в то время
§ 16] ВЫВОД УРАВНЕНИЯ БОЛЬЦМАНА 677 как pi2 является функцией импульсов р\ и р2 частиц, сталкиваю- сталкивающихся в момент времени t, в формуле A6,13) функции pi зави- зависят от другого аргумента — предельных значений импульсов Р\ и Рг до столкновения. Если мы захотим теперь перейти к получению функции рас- распределения при конечном, но малом значении параметра 1/и, то бинарную функцию нулевого приближения A6,13) следует под- подставить в правую часть уравнения A5,12). Это дает ^ JVn>; fit, РХШ P2)}dr2dp2. A6,14) Преобразуем скобки Пуассона, воспользовавшись тем, что им- импульсы Pj и Р2~постоянные заданные векторы. Благодаря этому {#;/(/, Р,Ш*,Р2)} = 0. A6,15) Пользуясь A6,15), находим откуда следует {U12; f(t, P^ f(t, P2)}=- _ p. d[f(t,P,)f(t,PJ] , p2 d[f(t,Pl)f(t,P2)} m д (ri — r2) m д (rx — r2) Таким образом, уравнение A6,14) можно представить в виде A6,16) где через / обозначен интеграл Для вычисления последнего введем цилиндрическую систему координат (г, ф, g), выбрав вектор (р2 — р\) за положительное направление полярной оси ?. Тогда имеем Х\ = х2 + г sin ф, У\=У2 + г cos ф, -Рд). о, oj,
678 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III так что можно написать Импульсы Pi и Р2 будут теперь функциями координат г, ср и |. За начало координат выберем точку гХ2 = 0, т. е. точку, в кото- которой происходит столкновение. При таком выборе осей имеем оо 2Л оо rdr]d(? J^- оо J rdr[f(t, О Рассмотрим произведение f(t, P,)f(*. P^l1"*00 =/('-'", Px)f(t-t", Рз)!1^ A6,17) где /"-*Ст. Ситуации ?->оо отвечают частицы, находящиеся на большом расстоянии друг от друга (вне области взаимодей- взаимодействия). При этом частицы удаляются друг от друга (это проще всего видно из того, что Р2 mPl =^отн растет с ростом ?). Это значит, что если частицы в момент времени t находятся на боль- большом расстоянии, то в прошлом, в некоторый момент t — t'\ они были на близком расстоянии, провзаимодействовали и затем разошлись. Импульсы Pi и Рг в A6,17) означают импульсы ча- частиц до столкновения, в частности, непосредственно перед вхо- входом в соударение. Мы запишем это в виде t(pv t)f(p2, t)\l-*~.= f(p;, t)f(p;, t), A6,18) где Р\ и Р\ — импульсы непосредственно перед соударением. Произведение /(Рь t)f(P2> /)|*-*-°° имеет другой смысл. Си- Ситуация |—>—оо также отвечает частицам, находящимся в мо- момент / на больших расстояниях, вне области взаимодействия. Однако эти частицы за промежуток времени от / — тс до t не успели сблизиться и столкнуться. Они движутся с постоянными значениями импульса, так что HP» t)f(Pu t)\l~*-°° = f(p2, t)f(pu t), A6,19) где pi и р2 — импульсы в момент /. Подставляя A6,18) и A6,19) в интеграл /, находим rdr\dv[f{P], t)f(P;, t)-f{pv t)f(pv /)]. A6.20) о
§ 16] ВЫВОД УРАВНЕНИЯ БОЛЬЦМАНА 679 Подставляя A6,20) в A6,16), находим, что кинетическое урав- уравнение приобретает вид t)\dp2. A6,21) При этом мы ввели относительную скорость частиц В подынтегральное выражение входят импульсы Р* и Р* непо- непосредственно перед столкновением. Ввиду симметрии задачи двух тел к обращению времени можно наряду с A6,21), написать , t)f(p<, 0-f(ft. t)f(put)]dp2, A6,22) где рз и р4 — импульсы после столкновения. Вместо прицельного параметра г и азимутального угла можно ввести телесный угол и эффективное сечение соотношением Произведя в A6,21) эту замену, мы приходим к уравнению Больцмана: 4. O-/(P2, 0/(Pi. t)]dp2dQ. A6,23) В случае неоднородного газа аналогичным образом получается несколько видоизмененное уравнение Больцмана. Мы видели, что переход от обратимых уравнений механики — уравнения Лиувилля A5,2) к уравнению Больцмана включал в себя стати- статистический этап — формулу A6,13). В формуле A6,13) с самого начала заложено допущение об асимметрии процесса во вре- времени. Фиксируя состояния газа в данный момент времени /, мы анализировали вопрос о том, как он пришел в данное со- состояние. При этом статистическое распределение в данный мо- момент связывается с тем, каким оно было в прошлом. Иными словами, система случайно попадает в ситуацию, которую мы называем столкновением. До столкновения «пара» частиц со- состояла из невзаимодействующих частиц. Их встреча в момент времени t является случайным актом. Начиная с этого момента и вплоть до момента / + т, когда частицы «пары» испытывают следующее столкновение, их движение имеет детерминизиро- ванный характер. Таким образом, в самом выводе уравнения Больцмана заложено допущение об асимметрии времени и раз- различие начального и конечного состояний. Поведение системы за время / — тс и / + т существенно различное.
680 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. Ш Приведенный вывод уравнения Больцмана содержит в яв- явном виде разложение по малому параметру —. Пользуясь развитой техникой разложений по параметру —, можно получить кинетическое уравнение для более плот- плотных газов, чем те, которые описываются уравнением Больцмана. Однако этот вывод связан с громоздкими выкладками и мы его приводить не будем !). § 17. Обобщенное уравнение переноса и свойства аддитивных инвариантов Из уравнения Больцмана можно получить ряд важных об- общих следствий, не связанных с нахождением явного вида функ- функции распределения. Допустим, что газ как целое совершает движение со сред- средней скоростью и. Оказывается, что с помощью уравнения Больц- Больцмана можно найти общее уравнение, которому должно удов- удовлетворять среднее значение произвольной функции скорости от- относительного движения Vt-vt-щ, A7,1) т. е. функции \|?(Уг- — «г)> где i = #, у, г. Среднее значение этой функции г, t) = -i = i Г * (Vt) f dv jfdv NJ tyf *(г, t) = -i = i Г * (Vt) f dv, A7,2) jfd NJ где N — число частиц в единице объема, является, вообще го- говоря, функцией координат и времени, поскольку от этих пере- переменных зависит функция распределения f. Составим произ- производную Пользуясь уравнением Больцмана, можно представить A7,3) в виде dt ^iy/ dt &\%& \ A7,4) 1) См. цитированную монографию Н. Н. Боголюбова, а также Д. Уленбек и Д. Форд, Лекции по статистической механике, «Мир», 1965. G. E. Uhlenbeck, G. Ford, Lectures in statictical mechanics American Mathemat. Society, Providence, 1963.
§ 17] ОБОБЩЕННОЕ УРАВНЕНИЕ ПЕРЕНОСА 681 Преобразуем интегралы, входящие в A7,4). Имеем, очевидно, J Y m dvk m vi („j^ m J ' dvk = -lL [ m У dvkUV m При этом предполагается, что функция распределения f убы- убывает достаточно быстро с ростом абсолютной величины скоро- скорости, так что (i|)f) стремится к нулю при |i>| -> оо. Таким образом, A7,4) приобретает вид Полученное уравнение носит название уравнения Энскога или обобщенного уравнения переноса. Ясно, что в общем виде, при произвольном виде функции -ф уравнение Энскога, нисколько не проще уравнения Больцмана. Если, однако, г|э является одним из аддитивных интегралов движения, т. е. Ъ(УГ) = т, mVt, -2^-, A7,6) то обобщенное уравнение переноса существенно упрощается. Для того чтобы в этом убедиться, рассмотрим важное общее свойство интеграла, входящего в правую часть обобщенного уравнения переноса. Обозначим его через G: G= jtyldv= j фа | и - vj | (Уз - ffi) dv dvx dQ. симметризуем это выражение, воспользовавшись тем, что при замене аргументов интеграл G не изменяется: G, = J яМ | vx - v | (Уз - Их) dvx dv dQ = G. С другой стороны, можно поменять местами пары переменных так, чтобы скорости до и после соударений поменялись местами: 0, v{->v2, v3; г>2, v3 При этом очевидно имеем | v - V{ | = | V2 -
682 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III и мы вновь получаем Суммируя величины G*, можно представить их в симметричном виде 4 IJ Пользуясь симметричным представлением A7,7), можно пе- переписать обобщенное уравнение переноса в виде = - \ J [*2 + *з - ¦ - *il ст^отн (Уз - f/i) Л Л>х rfO. A7,8) Допустим теперь, что г|) является одним из аддитивных интег- интегралов движения. При столкновении частиц имеют место равенства тх + т2 = const, mxv{ + m2v2 = const, mxv\ m2v\ -y^H—p= const. Для этих пяти аддитивных интегралов движения поэтому 2g,-o. Таким образом, 2G* является аддитивным интегральным инва- инвариантом столкновений. Для пяти аддитивных интегралов обоб- обобщенное уравнение переноса упрощается и приобретает вид Ясно, что уравнение A7,9) существенно проще, чем общее урав- уравнение A7,8), поскольку оно не содержит нелинейных членов, описывающих попарные соударения. По этой же причине урав- уравнение A7,9) обладает большой общностью и фактически приме- применимо и тогда, когда уравнение Больцмана уже теряет силу.
§ 18] УРАВНЕНИЯ ПЕРЕНОСА 683 § 18. Уравнения переноса массы, импульса и энергии С помощью уравнения A7,9) можно найти макроскопические законы сохранения плотности импульса и энергии. Очевидно, что макроскопическая плотность однородного вещества может быть представлена в виде р = mN\ я|э = т. При этом A7,9) дает непосредственно Уравнение A8,1) представляет закон сохранения массы в дви- движущейся среде. Часто приходится иметь дело с многокомпонентным газом, состоящим из молекул с массами та. В этом случае нужно ввести понятия плотности и скорости а-го компонента: • Ра = Nama = majf{a)dv, A8,2) „а= fv*fWdv, A8,3) где а—1, 2, ..., г, и массовую плотность и скорость: «*=j 2 №=I Для величины -тт- можно написать два выражения: дх »* | v/г/ "v - л* A8,6) к или
684 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III При этом мы ввели вектор jak = maf(vak-uk)tdv, A8,8) именуемый диффузионным потоком а-го компонента. Вектор /JJ представляет поток /?-го компонента относительно средней массовой скорости щ (ср. с G,6)). Формула A8,7) представляет собой закон сохранения массы, написанный для многокомпонентной смеси. Суммируя выражения A8,8) для разных компонент и учи- учитывая, что j та J vlfdv - UkYi ma jfdv = 0, находим закон сохранения полной массы Перейдем теперь к формулировке закона сохранения импульса. Для получения закона сохранения импульса можно подста- подставить в A7,9) значение i|) = mVi. Удобнее, однако, повторить до известной степени вывод формулы, вычислив производную от вектора импульса единицы объема J vjdv. A8,10) Мы ограничимся при этом случаем однокомпонентного газа. Имеем очевидно, с помощью уравнения Больцмана и с уче- учетом общего свойства аддитивного интегрального инварианта G: -щ){ок- uk)-^-dv + тЫщик При этом мы образовали рязности (Vi — щ) и (Vk — ин) и про- проинтегрировали последнее слагаемое по частям. Первый интеграл
§ 18] УРАВНЕНИЯ ПЕРЕНОСА 685 преобразуем к производной от интеграла: (vt - щ) (vk - ик) -J-f- dv = = ~§T J (Vi ~ 5| j f{vk-uk)dv так как, по определению среднего, интегралы Г /(#* — ut)dv Кроме того, имеем, очевидно Введем вектор силы, отнесенный к единице объема fk = FkN A8,11) и тензор oik, именуемый тензором напряжений: oik = mN j (vt-ut)(vk-uk)fdv = тЫ(юг-щ)(юк-и& A8,12) По определению тензор а^ является симметричным, oik Тогда получаем окончательно д до,, д или, пользуясь A8,9), ди, \ до. ди, Уравнение A8,14) представляет собой макроскопическое урав- уравнение движения газовой среды. Наконец, можно аналогичным образом получить закон со- сохранения макроскопической энергии газовой среды. Среднюю энергию единицы объема газа, совершающего макроскопическое
686 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III движение со средней скоростью и, можно написать в виде A8,15) Дифференцируя по времени, находим аналогично предыдущему: = -(/, + /2)^. 08,16) Преобразуем оба интеграла в отдельности. Имеем + -ft-"ft J (°i - "iffdv - J /-ft-[uk(vt - utf] dv = ди, д. Bgk + 2ukE) ди{ o.k dxk mN "*" * dxk tnN ' При этом было использовано определение A8,12) и введено обозначение ^/ A8,17) Очевидно, что вектор q^ представляет вектор плотности потока энергии.
§ 19] ЗАКОН ВОЗРАСТАНИЯ ЭНТРОПИИ 687 Для интеграла /2 имеем т Fk Г / \9 df j Окончательно находим дЕ д ди. жя(?**>««? (') Соотношение A8,18) выражает закон сохранения энергии. Из- Изменение энергии в единице объема связано с потоком полной энергии, вытекающим из этого объема (qu + Еин) и работой / ди.\ против внутренних сил (^"^""Н' Если выразить энергию идеального газа через температуру, то вместо A8,18) можно написать к к Совокупность уравнений A8,9), A8,14) и A8,19) представляет систему уравнений газа в приближении сплошной среды. Хотя эти уравнения выведены для идеального газа, область их применимости гораздо шире. Они выражают общие законы сохранения в сплошной среде и в таком общем виде применимы не только в разреженном газе, но и к капельным жидкостям. Однако фактическое их использование требует нахождения яв- явного вида тензора напряжений oik и вектора тока энергии q^ Последнее в свою очередь требует знания функции распределе- распределения f. Ниже будет показано, что в некотором приближении функ- функция распределения, а соответственно, и величины atfe и qki мо- могут быть найдены путем интегрирования уравнения Больцмана для идеального газа. В капельных жидкостях приходится довольствоваться эмпи- эмпирическими выражениями аг-& и q^. Повторяя аналогичные вычис- вычисления, можно без труда получить законы сохранения импульса и энергии для смеси идеальных газов. § 19. Закон возрастания энтропии В статистической физике мы подробно осветили закон воз- возрастания энтропии. В § 25 ч. III был установлен прийцип воз- возрастания энтропии. Было показано, что при изменении состоя- состояния замкнутой системы энтропия конечного состояния всегда больше, чем энтропия начального состояния,
688 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Однако в рамках статистического рассмотрения невозмож- невозможно установить, как совершается переход из начального в конеч- конечное состояние. В кинетике оказывается возможным более де- детально изучить характер изменения энтропии и показать, что энтропия идеального газа монотонно возрастает во времени. Вычислим изменение энтропии единицы объема одноатом- одноатомного идеального газа, воспользовавшись для этого выражением B5,6) ч. III: 5= — k ) flnfdv. Дифференцируя 5 по времени и используя уравнение Больц- мана, имеем k j(\ +\nf)vk-?^dv-k j(I + lnf)Idv + -k jI(\+lnf)dv. Легко видеть, что опущенное третье слагаемое обращается при интегрировании в нуль. Преобразуем также первое слагаемое (l+\nf)vk-§-dv = Ж-//1п/о*А'а"~ дхк Здесь /|= — Г ^f \nfdv — вектор потока энтропии. Используя свойства симметрии интеграла соударения A7,7), имеем Q. A9,1) Формула A9,1) определяет изменение энтропии в данном эле- элементе объема газа. Это изменение связано, с одной стороны,
§ 20] РАСПРЕДЕЛЕНИЯ В ИДЕАЛЬНОМ ГАЗЕ 689 с потоком энтропии переносимого частицами газа, а с другой стороны, — процессами молекулярных соудаоений, которые ха- характеризуются правой частью A9,1). Проинтегрируем A9,1) по всерлу объему V замкнутой системы. Тогда получаем 1Г в Т J |п (ж")' {f*f* ~ fM av™ dv dv> dQ dV> A9'2) где 5 — полная энтропия системы S= sdV. Интеграл diiS) '* dV J dxk поскольку поток на границе замкнутой системы равен нулю. Нетрудно заметить, что подынтегральная функция в A9,2) является существенно положительной. Действительно, Уз-#,]>0. A9,3) Если /2/з > ffu то как логарифм, так и квадратная скобка имеют положительный знак; если /г/з < ffь то оба они отрицательны. При /3f2 = ffi подынтегральная функция обращается в нуль. По- Поскольку интеграл от существенно положительной функции также положителен, мы видим, что в замкнутой системе -§f>0. A9,4) Таким образом, доказано, что энтропия замкнутой системы — идеального одноатомного газа, монотонно возрастает во времени или постоянна. Мы видим, что кинетическая теория устанавли- устанавливает характер и детализирует механизм роста энтропии, связы- связывая его с межмолекулярными столкновениями. § 20. Равновесное и локально равновесное распределение в идеальном газе При возрастании энтропии она стремится к некоторому преде- пределу, так что •§^ = 0 при *-юо. B0,1) В действительности энтропия достигает своего максимального значения не при /-*оо, но.по прошествии некоторого времени релаксации т. Вычисление времени релаксации представляет очень слож- сложную задачу. Ниже мы найдем приближенное значение времени релаксации.
690 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Ясно, что для выполнения равенства B0,1) при />т в фор- формуле A9,3) должен стоять знак равенства, т.е. hfz = ffi. B0,2) Формула B0,2) показывает, что In / является аддитивным инте- интегралом движения. При столкновениях двух частиц существует пять и только пять аддитивных интегралов движения1): инте- интегралы массы, импульса и энергии. Поэтому In/ должна быть линейной функцией этих величин: In / = am + bimvi + с -^. B0,3) Заметим, что решение функционального уравнения B0,2), при- приведенное в статистической физике, было основано на допущении о том, что / = f(v2). Приводимый здесь вывод свободен от этого допущения. Постоянные а, Ьг и с могут быть выражены через число частиц N в 1 смъ, среднюю макроскопическую скорость щ и среднюю энергию одноатомного газа в состоянии равновесия. В частности, если газ как целое покоится и щ = 0, то B0,4) B0,5) . B0,6) Отсюда находим равновесное распределение Максвелла /(M) = i В равновесном газе температура Т и плотность N имеют по- постоянное значение во всем объеме газа и в нем не происходит макроскопического движения. Если, однако, температура и плотность зависят от координат и времени и газ созершает движение со средней скоростью щ, то интеграл столкновений уравнения Больцмана обращается !) См., например, А. Зоммерфельд, Термодинамика и статистическая физика, М., ИЛ, 1955. В более общем случае задачи трех тел имеется восемь аддитивных интегралов — энергии, импульса, момента импульса и массы — см. Уиттекер, Аналитическая механика, Гостехиздат, М., 1937, По-видимому, последняя теорема имеет совершенно общий характер.
§ 20] РАСПРЕДЕЛЕНИЯ В ИДЕАЛЬНОМ ГАЗЕ 691 в нуль, если положить 2kT где N и Т являются функциями координат и времени. Положим для краткости B0,Ю) ¦*. B0,11) т 2kT B0,12) Распределение fM представляет собой решение уравнения Больц- мана, если оно обращает в нуль не только правую, но и левую часть этого уравнения. Для этого а, рг- и у должны удовлетво- удовлетворять условиям, сформулированным ниже. Распределение B0,8) или B0,9) носит название локального максвелловского распределения. Подставляя B0,9) в уравнение Больцмана, и учитывая, что равенство нулю его левой части должно выполняться при любых значениях v^ приравниваем нулю в отдельности коэффициенты при разных степенях V{. Тогда получаем систему уравнений ^Г+IiL-O, B0.13) ^?+-^-0, B0,14, fj-0. B0,16) Таким образом, уравнения B0,13) — B0,16) накладывают огра- ограничение на среднюю скорость движения uu совместимую с ло- локальным максвелловским распределением. Формула B0,16) по- показывает, что температура газа Т должна быть постоянной в пространстве. Однако температура газа как целого может из- изменяться по времени. Дифференцируя B0,15) по координатам и учитывая B0,16), имеем дхк dxt T dxt дхк и'
692 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ III откуда следует Решением уравнения B0,17) служит или B0,18) щ = 0. J Коэффициенты 6tj можно найти, подставляя B0,18) в B0,15). Тогда получим и г* и т дТ Поэтому окончательно Щ = at (t) + bikelkixt + 2^2 -q? *t или, в векторной форме, ^г. B0,19) Таким образом, с локальным максвелловским распределением совместимо произвольное поступательное и вращательное (с угловой скоростью со) движение газа как целого и радиальное движение, скорость которого определяется последним слагае- слагаемым в B0,19). Не использованное нами условие B0,14) содержит силы, вид которых накладывает определенные связи на коэффициенты а* и bij. Если газ заключен в неподвижный сосуд с непроницае- непроницаемыми стенками, то стационарное движение типа B0,19) в нем невозможно. Это значит, что в B0,18) приходится выбирать и{ = 0. Полагая в B0,14) рг- = 0, находим Если внешние силы имеют потенциал, то Ft = — -gj- и для а мы имеем U . , <х= — "^7Г + const • Тогда нормированное равновесное распределение приобретает вид А mx)i JL е 2kTe~kT, B0,20) Таким образом, мы пришли к естественному результату: в газе устанавливается равновесное распределение Максвелла — Больц-
§ 21] ОБЩАЯ ТЕОРИЯ РЕШЕНИЯ УРАВНЕНИЯ БОЛЬЦМАНА 693 мана B0,6), а не локальное максвелловское распределение B0,8). Установление равновесного распределения Максвелла — Больцмана связано с установлением распределения по скоростям и в пространстве. Время релаксации для процесса в простран- я. стве скоростей имеет порядок величины т~-т-, где X — длина свободного пробега. Пусть в начальный момент времени / = 0 задано произвольное распределение частиц в пространстве ф(г, v, t). За время порядка т в каждой точке пространства рас- распределение молекул по скоростям, приближается к локально максвелловскому, так что Ф(г, *,/)->/@)(г, v, t). При этом плотность газа N и его температура Т еще не успе- успевают принять равновесных значений во всем газе, а макроско- макроскопическое движение его частей (если оно имело место в началь- начальный момент) не успевает затухнуть. Чтобы подчеркнуть это об- обстоятельство, мы помимо аргумента v выписали в /<°> параметры rut. Изменение во времени переменных N, Т и и описывается макроскопическими переменными и характеризуется макроско- макроскопическим временем ттаСго- Это время релаксации Тщасго порядка —, где L — размер макроскопической системы, а с — скорость распространения возмущений в газе. Как будет показано в § 26, это не что иное, как скорость звука. Таким образом, /@)-ГБ) при / Следует подчеркнуть, что, в отличие от распределения Максвел- Максвелла — Больцмана, локальное распределение Максвелла никогда не является точным, а лишь приближенно описывает распреде- распределение по скоростям в ограниченном объеме газа. Оно является точным решением уравнения Больцмана толь- только для скорости, даваемой формулой B0,19), и плотности удо- удовлетворяющей уравнению B0,14). Для других значений и, Т и N(r), /(°> представляет приближенное решение уравнения Больц- Больцмана (см. следующий параграф), справедливое за промежутки времени т, в течение которых макроскопические величины и, Т и N не успевают изменяться, и их можно считать просто кон- константами. § 21. Общая теория решения уравнения Больцмана Полученные в §17—19 результаты не были связаны с полу- получением явных решений уравнения Больцмана. Как мы подчер- подчеркивали, решение уравнения Больцмана сталкивается с очень большими трудностями, как математического, так и физического
694 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III характера. Последние связаны с тем, что фактически вид функ- функции а(аотн, а) для молекулярных столкновений неизвестен и поэтому сама задача интегрирования уравнения Больцмана является несколько неопределенной. На практике всегда рас- рассматриваются некоторые упрощенные модели, для которых межмолекулярное взаимодействие может быть представлено тем или иным достаточно простым законом в зависимости от расстояния между частицами. Наиболее простыми и часто рассматриваемыми моделями являются модели частиц твердых шариков или частиц, взаимо- взаимодействующих по закону типа -рг. Эти законы взаимодействия в достаточной мере произвольны и их выбор определяется глав- главным образом простотой соответствующих формул для сечения рассеяния. Использование этих моделей отвечает переходу от реальной газовой системы к некоторой модельной системе. Од- Однако и для модельной газовой системы решение уравнения Больцмана все еще сопряжено с преодолением расчетных труд- трудностей. В настоящее время разработан ряд методов его реше- решения. Мы остановимся лишь на важнейших из них. Самым эффективным методом получения общего решения уравнения Больцмана является метод моментов. Под моментами понимают функции вида B1,1) B1,2) M?j = j viVkf dv, B1,3) B1,4) / ... vNfdv. B1,5) Моментами являются такие важные величины, как плотность, средняя скорость частиц, потоки импульса и энергии, например, 9 = NmM@), B1,6) «I- jvtfdv = M?\ B1,7) ), B1,8) oik = mN (M?) - UiUkMl0)), B1,9) B1,10)
§ 21] ОБЩАЯ ТЕОРИЯ РЕШЕНИЯ УРАВНЕНИЯ БОЛЫДМАНА 695 Идея метода моментов заключается в следующем: представим решение уравнения Больцмана в виде ряда по ортогональным полиномам. В качестве таких полиномов естественно выбрать полиномы Эрмита — Сонина (§ 10 ч. V), которые удобно запи- записать в виде Таким образом, Я<0) = 1, 1 кт 1 {¦ Полиномы Эрмита — Сонина ортогональны с весом /<°>: Представим функцию распределения в виде ряда WH() с коэффициентами с^\ ..., с^\ зависящими от координат и времени. Простое вычисление показывает, что коэффициенты этого ряда выражаются через моменты. Используя ортогональ- ортогональность полиномов Эрмита, легко найти, что т Умножая уравнение Больцмана на полиномы Эрмита №т) и ин- интегрируя его по скоростям, имеем (в отсутствии внешних сил): B1,14) Подставляя затем в B1,14) разложение B1,12) и пользуясь условиями ортогональности, приходим к уравнению для коэффи- коэффициентов с\™\г Поскольку коэффициенты с^ могут быть вы- выражены через моменты М{!?].., то эту систему можно предста- представить в виде бесконечной системы дифференциальных уравнений. Эти уравнения имеют вид dt ЪГ М™-~ = J
696 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Для специальной модели взаимодействия, когда взаимодействие между молекулами аппроксимируется силами отталкивания, обратно пропорциональными пятой степени рассеяния (так на- называемые максвелловские молекулы), бесконечный ряд обры- обрывается и сводится к конечному числу уравнений. Однако для бо- более реалистических моделей такого упрощения не возникает. Тем не менее важность метода моментов заключается в том, что он, в принципе, позволяет найти замкнутую систему уравнений от- относительно макроскопических величин (моментов), эквивалент- эквивалентную уравнению Больцмана. Точное решение этой системы было бы равноценно точному решению уравнения Больцмана. Для реальных расчетов функцию распределения приходится аппрок- аппроксимировать конечным числом членов в разложении B1,12). Чаще всего ограничиваются членами третьего порядка. При этом удобнее всего ограничиться теми моментами, которые имеют непосредственный смысл. Такими являются первые три- тринадцать моментов — М{0\ М\1\ MfH, М%, через которое выра- выражаются плотность, поток импульса и энергии. В этом так назы- называемом тринадцатимоментном приближении функция распре- распределения имеет вид Таким образом, в разложение B1,16) входят коэффициенты огн и qk, зависящие, вообще говоря, от координат и времени. Подставляя приближенное значение f по формуле B1,16) в B1,14), можно прийти к системе уравнений для этих коэффи- коэффициентов. Достоинством этой системы является то, что неизвест- неизвестные коэффициенты являются непосредственно измеряемыми ве- величинами. Для повышения степени точности можно увеличить число членов ряда, которые удерживаются в аппроксимирующем функ- функцию распределении f выражении1). Мы не можем останавли- останавливаться на этих громоздких вычислениях, тем более, что все они относятся к не обоснованным моделям газам с произвольно за- задаваемым сечением рассеяния o(vOTH; a). Уравнение Больцмана допускает существенное упрощение в двух важных случаях: 1) если мы интересуемся изменениями состояния газа за промежутки времени А/ > tmicro; 2) если газ как целое находится в состоянии, близком к рав- равновесному. В первом случае можно считать, что в каждой точке газа за время t < М установилось распределение по скоростям, близ- l) M. К о г а н, Динамика разреженного газа, «Наука», 1967.
§ 21] ОБЩАЯ ТЕОРИЯ РЕШЕНИЯ УРАВНЕНИЯ БОЛЬЦМАНА 69? кое к локально максвелловскому распределению /<°). Тогда для времен />А/ можно пытаться искать решение уравнения Больц- мана в виде f(r, v, t) ~ /(>, г, /)[1 + Ф (г, vt *)], B1,17) где ф/<0)— малое изменение функции /<0), т. е. ф <С 1. Функция ф описывает эволюцию газа за времена, большие по сравнению с tmicro. Этот метод (носящий название метода Чэпмена — Энскога) позволяет описывать макроскопическое по- поведение газа, например, вычислить потоки импульса или тепла в газе. Если газ находится в состоянии, близком к равновесному, то можно положить /(г, v, t)^fm)(v)[l+q>(r, v, /)], B1,18) где /<м>(и) — равновесное максвелловское распределение и Ф< 1, Подобная аппроксимация имеет смысл, если к перво- первоначально равновесному газу прикладываются малые возму- возмущения. В этом параграфе мы ограничимся изложением общей тео- теории. Примеры применения общей теории будут даны ниже. В обоих случаях уравнение Больцмана линеаризуется. Мы начнем с первого случая. При подстановке B1,17) в уравнение Больцмана следует сохранить только величины первого порядка малости. При этом скорость Vi и силы F{, вызывающие отклонение от равновес- равновесного локального распределения, следует считать малыми вели- величинами первого порядка. Поэтому подстановка B1,17) в левую часть уравнения Больцмана дает В операторе столкновений можно написать f-Фз-ф-ф,). B1,20) Поэтому окончательно приходим к уравнению 3<р . df® . Fk <Э/<0) —-—г~ Vh ~~^ ^ == dt R дхи т ov. = /@) J oyOTHff) (ф2 + Ф3 - Ф, - Ф) dvl dQ. B1,21) Полученное уравнение является линейным неоднородным интегро-дифференциальным уравнением относительно функции k,vh,t).
698 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III В § 22 будет проведено решение уравнения B1,21). Здесь мы укажем лишь на важное свойство неоднородного интеграль- интегрального уравнения B1,21). Запишем его в сокращенном операторном виде 1ф = Л, B1,22) где А — известная функция и L — линейный самосопряженный интегральный оператор. Для того чтобы не писать громоздких формул, мы запишем Lcp в символическом виде ?ф= J w(Vf vx)(<fx-q>)dvx, B1,23) причем w(v, vx) = w(vu v). Умножая B1,23) на произвольную функцию г|?(г>) и интегри- интегрируя по dv, находим Ja|)(v) w(v, ^^М-ф^Л^. B1,24) Кроме того, можно написать J ¦ (Vi) Lq> (v) dvx = J t|) (vx) w (vl9 v) [ф (v) - <px (vx)] dv dvx = (v)w(v, vx)[<vx(vx)-(v(v)]dvdvx. B1,25) Сравнивая B1,24) и B1,25), перепишем B1,24) в симмет- симметричном виде *- B1,26) Поменяв местами ф и -ф, находим J а|Jф dv = J yltydv. B1,27) Таким образом, L является самосопряженным оператором. В частном случае, когда г|з = ф, B1,26) дает J ф?ф dv = у J (ф - ф!J w dv dvx > 0, B1,28) поскольку всегда w(v, ) Рассмотрим две функции — функцию ф, удовлетворяющую уравнению B1,23) и одновременно уравнению J ylydv = J фЛ dv B1,29)
§ 21] ОБЩАЯ ТЕОРИЯ РЕШЕНИЯ УРАВНЕНИЯ БОЛЬЦМАНА 699 и функцию if, удовлетворяющую только интегральному соот- соотношению J a|)Li|> dv = J фЛф Л, B1,30) но не являющуюся решением уравнения B1,23). Тогда легко показать, что имеет место неравенство B1,31) Это неравенство означает, что решение линеаризованного ин- интегрального уравнения Больцмана отвечает максимуму интег- интеграла j q>Lq>dv по сравнению со всеми функциями удовлетво- удовлетворяющими условию B1,30). Для доказательства B1,31) напишем положительную [в силу B1,28)] величину f (ф ~ Ч>) L (ф — ty) dv = J ф?ф dv + \ a|)Li|) dv — Г ф?^ dv — - J tyLydv = J ф!фdv + J t|)Li|)^ - 2 [ о|Iф rfv где мы воспользовались B1,27). Пользуясь B1,22) и B1,30), находим J (ф — а|)) L (ф — а|)) dv = J ф?ф dv — J ф?о|) dv > 0. Отсюда следует доказываемое нами неравенство B1,31). Экстремальные свойства решений интегрального уравнения B1,21) позволяют для их нахождения применить обычные ме- методы вариационного исчисления, выбирая ф в виде линейной комбинации известных функций g{: Подбирая их коэффициенты так, чтобы ф имело максимальное значение, можно найти функцию, достаточно близкую к истин- истинному решению. Второй случай линеаризации уравнения Больцмана полу- получается при подстановке B1,18). Поскольку максвелловское рас- распределение автоматически удовлетворяет уравнению Больц- Больцмана, сразу получаем B1,32)
700 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Мы приходим к однородному линейному интегро-дифферен- циальному уравнению вида Цр2ф. B1,320 Его решение может быть легко найдено, если известно ре- решение однородного интегрального уравнения Г = Я,ф(°), B1,33) где Кг — собственные значения и ф<0) — собственные (ортого- (ортогональные и нормированные) функции оператора L. Решение B1,32) может быть представлено в виде разло- разложения по системе функций Ф = 2а/Ф(<». B1,34) При этом предполагается, что спектр функций ф<°) имеет дис- дискретный характер. Пример использования этого метода будет дан в § 25 и 26. Заметим лишь, что первые пять собственных значений урав- уравнения B1,33) могут быть указаны сразу. Именно, поскольку функции обращают в нуль оператор столкновений и не зависят от Х{ явно, они являются собственными функциями уравнения B1,33), которые отвечают собственным значениям оператора L. § 22. Уравнения гидродинамики, вязкость и теплопроводность газов Мы видели, что кинетическое уравнение Больцмана позво^ ляет получить, как следствие, законы механики сплошных сред. Однако фактическое нахождение тензора напряжений aih тре- требует значения функции распределения /. Мы перейдем к вычислению неравновесной функции рас- распределения в идеальном газе, совершающем макроскопическое движение. Мы будем предполагать, что скорость макроскопического движения газа и изменяется от точки к точке. Примем, однако, что это изменение является достаточно медленным. Под медлен- медленным пространственным изменением скорости и мы понимаем следующее: объемы газа с пространственной протяженностью порядка нескольких длин свободного пробега можно считать движущимися с общей постоянной скоростью. При этом, кд#
§ 22] УРАВНЕНИЯ ГИДРОДИНАМИКИ 701 это было сказано в § 20, в таких объемах устанавливается ло- локальное максвелловское распределение. Скорости движения разных объемов газа являются различными, так что u = u(r,t). Мы ограничимся изотермическим режимом движения газа, так что температура во всем объеме газа является постоянной. Считая локальное равновесие установившимся, подставим в выра- выражение для тензора напряжений аг& и потока тепла q^ значение /<°). Формула A8,12) дает aik = mN J (vt - ut)(vk - uk)f® dv = p(vt -ut)(vk - uk) = NkT6ik = pdik. B2,1) Таким образом, тензор напряжений сводится к нормальному давлению. Аналогично, из A8,17) находим ^ = 0. В этом при- приближении уравнения A8,9) и A8,14) сплошной среды приобре- приобретают вид ^-+^-(р«»)-0, B2,2) — %. B2,3, Уравнение B2,3) носит название уравнения Эйлера. Как из- известно, B2,3) является уравнением движения идеальной жид- жидкости. Уравнение для энтропии единицы объема A9,1) запишется в виде Последнее уравнение показывает, что при движении жидко- жидкости ее удельная энтропия остается постоянной, т. е. процесс пе- перемещения имеет адиабатический характер. В этом приближении сплошную среду можно рассматривать как идеальную жидкость с уравнением состояния р = NkT. B2,5) Совокупность уравнений B2,2)--B2,5) полностью определяет движение газа в приближении сплошной среды. Для получе- получения уравнений гидродинамики реального (вязкого) газа в том же приближении, будем пытаться искать решение уравнения Больцмана по методу последовательных приближений Чэпме- на — Энскога. Именно, положим, f-Z^U + qp), B2,6) где ф<1, и /<°) — локально равновесное распределение.
702 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Для краткости выкладок будем считать газ изотермическим и несжимаемым, внешние силы отсутствующими и давление по- постоянным 1). Средняя скорость щ газа может зависеть как от координат, так и от времени. Подставляя B2,6) в уравнение Больцмана и ограничиваясь величинами первого порядка малости, находим B2'7) где "~ WVmo [Ф2 + Ф3 - Ф - %} dvx d». B2,8) В левой части мы опустили члены, пропорциональные ф, по- поскольку производные от /(°> сами по себе являются величинами первого порядка малости. Вычислим производные в левой части B2,7), пользуясь вы- выражением B0,8) для /(°). Поскольку N и Т — постоянные вели- величины, имеем df{0) , df{0) m @) ди. m @) ди{ ди. Для -^г можно воспользоваться приближением идеальной жидкости, т. е. в силу B2,3) написать ди. ди. Поэтому окончательно ди. В несжимаемой жидкости -^- = 0 и можно вместо B2,9) на- написать Обозначим через Uik тензор скорости деформаций: !) Этому отвечает, например, движение газа между двумя плоскостями, движущейся и неподвижной*
§ 22] УРАВНЕНИЯ ГИДРОДИНАМИКИ 703 Тогда уравнение Больцмана приобретает вид JL {yiVk _ J^ii) Uuf» = /(о J fn^ [ф2 + фз _ ф1 _ ф] B2,11) Функция ф(у) помимо уравнения B2,11) должна удовлетворять дополнительным условиям, выражающим постоянство числа ча- частиц, импульса и энергии газа как целого: mN J fVdv = P = Nmj /(<V dv = const, 2 Отсюда следуют равенства J f0)q>dv = 0, B2,12) Nmjfo)Vicpdv = O9 B2,13) ^j>V29rfz;==O. B2,14) Нетрудно заметить, что выполнение этих пяти уравнений яв- является необходимым условием существования решений неодно- неоднородного интегрального уравнения B2,11). Действительно, если однородное интегральное уравнение /(ф) = 0 имеет решение Ф = х(^)> т0 неоднородное уравнение /(ф) = Лф B2,15) имеет решение только при выполнении условий ортогональности B2,16) Решениями однородного интегрального уравнения служат, на- например, функции Ясно, что соотношения B2,12) —B2,14) выражают необходи- необходимые условия ортогональности. Из структуры интегрального уравнения B2,11) видно, что его решение нужно пытаться искать в виде «. B2Л7)
704 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ (ГЛ. Ш При подстановке B2,17) в B2,11) величина СУгл в обеих частях уравнения сократится. Это значит, что решение B2,17) спра- справедливо при всех значениях тензора скорости деформаций, как это и должно быть. При этом тензор г|?гл является симметричным. Можно также считать, что всегда ф« = 0, поскольку при i = k всегда Uu = 0 и ф = 0. Подставляя B2,17) в B2,11), находим \ = Г /{0)ai>OTH W?l + tyfl—я|>ЭД—%k\ dvx dQ. B2,18) В этом уравнении левая часть не зависит от средней скорости, следовательно, функция ф*л зависит только от компонент отно- относительной скорости Vi. Очевидно, что при изменении тензора у/ук ~М, на- например, при вращении в пространстве скоростей, уравнение B2,18) не должно нарушаться. Отсюда следует, что для ф,-д следует написать выражение / t ГО V B2,19) удовлетворяющее указанному требованию. Здесь a(V)—неко- a(V)—некоторая скалярная функция скалярного аргумента V. Явный вид этой функции получается из решения интегрального уравнения B2,18). Для фактического получения решения необходимо знать зависимость эффективного сечения от скорости и углов. Для реальных молекул, даже одноатомных, вид этой функции не известен. Общее представление о характере решений можно получить, если рассмотреть простейший, хотя и не реалистиче- реалистический случай, когда уОтнСг(уОтн, а) зависит только от угла рас- рассеяния а, но не зависит от скорости. При этом уравнение B2,18) приобретает вид т If = (т^птТN I е~"ш'оv0TaШ + № + ¦$-%АdQdvx. B2,20) Нетрудно видеть, что интегральный член справа обладает важной особенностью: если функция, стоящая в квадратных скобках, является полиномом, то и интеграл от нее также яв- является полиномом. Если, в соответствии с нашей упрощенной моделью, принять, что величина g = v0THo(a, v0TH)
§ 22] УРАВНЕНИЯ ГИДРОДИНАМИКИ 705 не зависит от скорости, то уравнению B2,20) можно пытаться удовлетворить функцией в чем проще всего убедиться непосредственной подстановкой. Легко видеть, что функция B2,21) удовлетворяет условиям ортогональности. Соответственно, функция распределения в первом прибли- приближении приобретает вид *)Ч() А <22-22> С помощью этой функции распределения можно найти явное выражение для тензора напряжений, что и является нашей ко- конечной целью. Подставляя в A8,12) функцию распределения из B2,22) и вычисляя интеграл, находим Vh ( ди. диЛ [^+^y B2.23) Согласно (8,12) агл выражается через тензор Uih и вязкость tj. Сравнивая (8,12) и B2,23), мы приходим к выражению для вязкости идеального газа [в нашей модели g = g(a)]: В так называемой модели твердых шариков, в которой при- принимается, что сечение а равно геометрической площади сечения сферы, для вязкости получается аналогичное выражение. Фор- Формула B2,24) качественно согласуется с опытными данными, хотя, разумеется, она не может претендовать на количествен- количественный смысл. Согласие формулы B2,24) с опытом связано, по- видимому, со слабой зависимостью функции распределения ф от закона межмолекулярного взаимодействия. Заметим, что вяз- вязкость газа оказывается не зависящей от плотности. В общем случае, не конкретизируя вида сечения, можно на- написать для ц: г\ = - mN J (vt - щ) (vk ~ uk) f\k dv, где фгл выражается формулой B2,19). Вязкость — первый из вычисленных нами кинетических коэф- коэффициентов. Пользуясь выражением B2,23) для oik и подстав- подставляя его в A8,14), можно написать 23 В. Г. Левич и др , том II
706 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. Ш или, в векторном виде, f AH + /. B2,250 Полученное уравнение представляет уравнение Навье — Стокса. Напомним, что оно описывает движение вязкой несжимаемой жидкости и применимо как к случаю сравнительно разреженных газов, так и капельных жидкостей. Предыдущее рассмотрение показывает, что уравнение Навье — Стокса может быть получено теоретически для случая достаточно разреженных газов, причем вязкость г) также может быть вычислена, по крайней мере с точностью до числового ко- коэффициента. Мы не останавливаемся на аналогичных вычисле- вычислениях для сжимаемого газа1). Совершенно аналогичным образом может быть вычислен поток тепла в термически неоднородном газе. Считая температуру газа Т изменяющейся от точки к точке в газе, а газ не совершающим макроскопического движения, снова будем пытаться искать решение уравнения Больцмана по методу Чэпмена — Энскога в виде B2,6). При этом в локально равновесном распределении /<°) среднюю скорость щ положим равной нулю, таким образом, ту* mv2 2 *~W = е*". B2,26) Здесь химический потенциал jut и температура Т изменяются от точки к точке, т. е. зависят от координат xk. Для того чтобы можно было пользоваться методом Чэпмена — Энскога, необ- необходимо, однако, считать это изменение достаточно медленным. Количественный критерий того, что можно считать медленным изменением, мы сформулируем ниже. Введение парциального потенциала jut в локально равновесном распределении связано со следующим простым соображением: в неизотермическом газе число частиц в 1 см3, так же как и температура, изменяется от точки к точке. Если, однако, газ неподвижен, то давление в нем должно быть постоянным. В противном случае механиче- механическое равновесие было бы невозможным и в газе началось бы макроскопическое движение. Если записать локально равновесное распределение в виде B2,6) и считать парциальный потенциал \х функцией давления и температуры \х = |j,G\ p), то |ul будет зависеть от координат только через посредство температуры. 1) См., например, Л. Д. Ландау, Е. М. Лифшиц, Механика сплош- сплошных сред, Гостехиздат, 1944.
§ 22] УРАВНЕНИЯ ГИДРОДИНАМИКИ 707 Функция / удовлетворяет уравнению B2,7). Вычислим его левую часть, пользуясь B2,26). Имеем, очевидно, д/<0) д?0) дТ дГ .(о)Г 1 /d|i\ » , k ~Vk dxkJ [W\dT) Tn~^ -,, ^Lf@)[ s h-sT . mo2 1 "" u* а*Л ' L fcr A>r2 ^ 2*r2 J ~~~Vk~dx-k! kT> ~ VK dxk T \T где й — теплосодержание, отнесенное на одну молекулу. По- Поэтому уравнение B2,8) приобретает вид [аналогично B2,11)] 1И^ B2,28) При этом функция ф по-прежнему должна удовлетворять усло- условиям B2,12) —B2,14). Из вида уравнения B2,28) ясно, что его решение следует пытаться искать в виде где вектор ?Л зависит от скорости v. Подставляя B2,28) в B2,29), мы убеждаемся, что решение B2,29) имеет место при всех значениях градиента температуры дТ -^—> выпадающего из уравнения. При этом получаем - fmT D " W) - J ^от«- [5а + ^ - 6, - 6] Л, Л>. B2,30) Уравнение B2,30) представляет уравнение для определения вектора g. Единственной векторной величиной, входящей в B2,29), является вектор скорости v. Это означает, что направ- направление вектора v является единственным выделенным направле- направлением в пространстве. Поэтому вектор g должен быть ориенти- ориентирован по этому направлению, т. е. ? = сф)г>, B2,31) где a{v) — скалярная функция скалярного аргумента v. Помимо интегрального уравнения, a(v) должна удовлетворять условиям ортогональности B2,12) — B2,14). Конкретный вид скалярной функции a(v) зависит от вида сечения рассеяния. Если> в частности, проводить вычисление 23*
708 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III для модели, у которой g = vothg зависит только от углов, то после подстановки в B2,30) нетрудно убедиться, что полином 5W ~Т) \ NcrT \2kT 2 )\ 2kT удовлетворяет уравнению B2,30). Поэтому решение B2,28) имеет вид f = f@)fi - (SUSL _1\ 2 ( m У/а г, JEL1 ' ' [Х \2АгГ 2)oNT>\2kT) кдхк\' Зная функцию распределения, можно найти тепловой поток V/. J 2 ]VkVtdV- 2 a ^J — Отсюда следует, что теплопроводность к равна Интересно отметить, что отношение не зависит от величины а. Формула B2,33), как и формула для вязкости, находится в качественном согласии с опытом. В частности, она правильно передает температурную зависимость теплопроводности. Фор- Формула B2,34) имеет количественный смысл и находится в пол- полном согласии с экспериментом. § 23. Время релаксации Рассмотрим несколько детальнее, как именно происходит пе- переход пространственно-однородного газа, находящегося вне поля сил, в равновесное состояние. Мы ограничимся газом, находящимся в состоянии достаточ- достаточно близком к равновесному. Тогда в соответствии со сказанным в § 21 можно положить /=/@)A + ф), где /<°> — локальная равновесная функция распределения. Уравнение Больцмана приобретает вид ^21,32). В отсутствие внешнего поля в однородном газе B1,32) имеет вид 2-Ф1-ф]^1^- B3,1)
§ 23] ВРЕМЯ РЕЛАКСАЦИИ 709 Решение этого неоднородного интегро-дифференциального урав- уравнения можно попытаться искать в виде е Т/(о)- B3,2) Для г|)(и) при этом получается линейное интегральное уравне- уравнение. Для его решения требуется задание функции a(v; а). Мы видим, таким образом, что временная зависимость выражается рядом B3,2) и определяется бесконечным числом величин тг*. Сходимость этого ряда, а также существование набора дискрет- дискретных величин тг- исследована пока недостаточно полно. Однако смысл ряда B3,2) и величин тг- вполне ясен. Равновесное рас- распределение устанавливается за времена релаксации хи различ- различные в разных интервалах скоростей. Это значит, что максвелловское распределение скоростей в разных областях пространства скоростей будет устанавливаться за различное время. Естественно, что различные средние ха- характеристики газа, например, средняя скорость или средняя энергия, будут иметь свои периоды релаксации. Если, однако, в некотором грубом приближении, пренебречь этим обстоятельством и взять лишь один член ряда, написав 'Л B3,3) то для ф получаем т=~фг- B3'4) По порядку величины можно оценить т как ±~Novm. B3,5) Множитель N появляется из определения среднего. Кроме того, с той же степенью точности можно написать В этом приближении кинетическое уравнение приобретает вид Последнее уравнение означает, что скорость приближения / к равновесию тем больше, чем больше отклонение от равно- равновесного распределения. При достаточно малых отклонениях от равновесия закон изменения -—¦ в форме B3,6) передает ха- характер процесса релаксации с достаточной для ряда практиче- практических приложений степенью точности.
710 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III По-видимому, последнее обстоятельство связано с тем, что функция /<°) вместе с соответствующим весовым множителем имеет довольно резкий максимум. Поэтому главный вклад в релаксационный процесс дают частицы со скоростью, близкой к средней. Мы увидим в дальнейшем, что это особенно относится к газу фермиевских частиц. Очень часто наряду с кинетическим уравнением B3,6) используют релаксационное приближение для получения функ- функции распределения в общем случае пространственно-неоднород- пространственно-неоднородного газа, находящегося в поле сил. Именно, кинетическое урав- уравнение представляют в виде dt ^ VkdTk^ m dvk~~ x • (Z6>n Здесь т считается функцией координат, поскольку плотность газа р изменяется от точки к точке. Из предыдущего ясно, что в этом приближении кинетиче- кинетическое уравнение имеет лишь качественный смысл. Тем не менее при малых отклонениях от равновесия кинетическое уравнение часто можно фактически свести к виду B3,7) при известных допущениях о характере функции т. В особенности это отно- относится к пространственно-однородным газам, находящимся в поле внешних сил. В виде иллюстрации степени точности релаксационного при- приближения вычислим в этом приближении вязкость сжимаемого газа. В релаксационном приближении имеем При малых отклонениях от состояния равновесия в левую часть B3,8) следует подставить выражение B2,10), следовательно, т (VV у2 h \п f -i=A откуда 5(?) B3,9) Сравнивая это выражение с B2,22), мы видим, что они оказы- оказываются тождественными, если положить - 4 тг-^-г^-. B3,10) Ng где / = -тт средняя длина свободного пробега. полн Таким образом, если считать сечение рассеяния не завися- зависящим от скорости, то релаксационное приближение дает тот же
§24] ДИФФУЗИЯ ЛЕГКОЙ ПРИМЕСИ В ОСНОВНОМ ГАЗЕ 711 результат, что и точное решение линеаризованного уравнения Больцмана. Если сечение зависит от скорости, то различие в выражении для возмущенной функции распределения сведется к числовому коэффициенту. Соответственно будут различными числовые ко- коэффициенты в выражениях для вязкости. Поскольку вид функ- функциональной зависимости сечения от скорости и углов для моле- молекулярных столкновений известен плохо, нет никакой уверен- уверенности в значении числовых коэффициентов в формулах для кинетических коэффициентов. Поэтому релаксационное прибли- приближение, сильно упрощающее вычисления, дает, в сущности, столь же точное решение задачи. § 24. Диффузия легкой примеси в основном газе Весьма важным случаем, допускающим существенное упро- упрощение кинетического уравнения Больцмана, является диффузия частиц примеси легкого газа к основному тяжелому газу. Мы будем считать, что концентрация примеси к основному газу мала, т. е. что число частиц примеси в единице объема n<JV, где N — число частиц основного газа. Массу частиц лег- легкого газа т мы будем считать малой по сравнению с массой М частиц основного газа. Движение примеси может происходить под влиянием разно- разности концентраций (диффузия) или разности температур (тер- (термодиффузия). Мы будем считать, что число частиц основного газа в едини- единице объема постоянно вдоль газа. Число частиц примеси в еди- единице объема изменяется вдоль некоторого направления, которое мы выберем за ось х. Состояние системы будем считать стацио- стационарным, влияния внешнего поля сил мы рассматривать не бу- будем. Напишем кинетическое уравнение для функции распреде- распределения частиц легкого газа1). Функция распределения изменяется только в направлении оси х, так что ее можно написать в виде /(/?, О, х), где р — им- импульс частицы, а 0 — угол, образуемый вектором импульса с осью х. Поскольку число частиц примеси мало, их столкновения между собой можно не рассматривать. Поэтому в интеграле столкновений следует оставить лишь член, учитывающий столк- столкновения частиц примеси с частицами основного газа. Столкно- Столкновения легких частиц с тяжелыми можно считать вполне упру- упругими, а скорость их движения — большой по сравнению со ско- скоростью движения тяжелых молекул основного газа. Последние 1) В этом параграфе мы будем следовать книге Л. Д. Ландау и Е. М. Л ифшица, Механика сплошных сред, Гостехиздат, 1944.
712 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III мы будем считать неподвижными и положим уотн *** ^> где v — скорость движения частиц примеси. Соответственно, а(у0Тн, а)~ а (и, а). Интеграл столкновений приобретает следующий вид: /- J v0THo(v0Til> a)(Ff'-Ff)dPldQ « vN J <ф, а) (Г-/)<«. B4,1) Здесь Т7 означает функцию распределения молекул основного газа, которая равнозначна функциям f3 и f\ в обозначениях пре- предыдущего параграфа. Через /' обозначена функция f2; N = = Г F dpi — полное число молекул основного газа в единице объема. Поскольку частицы примеси испытывают лишь вполне упру- упругие столкновения, их импульсы р'ир соответственно до и после столкновения имеют одно и то же абсолютное значение; процесс столкновения сопровождается лишь изменением направления полета, так что ПР', *)«/,(р, е', *) = /(е', х), f(p, x)~f(p, б, x) = f(Q, x). Аргумент р мы для краткости писать не будем. Физически это означает, что мы будем искать зависимость распределения ча- частиц примеси от координаты х и направления полета по отно- отношению к оси х при данном значении абсолютной величины им- импульса. В результате / можно написать в виде Кинетическое уравнение A4,10) запишется соответственно как *)-/(в, x)]dQ. B4,2) ^, a) В отличие от уравнения A4,10), найденное кинетическое- уравнение B4,2) для функции распределения частиц примеси является линейным интегро-дифференциальным уравнением. Его приближенное решение можно найти в виде разложения по степеням малого параметра, в данном случае отношения —. Этот метод решения кинетического уравнения получил название метода Лоренца. Если разность концентрации или разность тем- температур, вызывающая систематическое движение примеси вдоль оси ху достаточно мала (см. ниже), то направленное движение будет накладываться на беспорядочное движение. В среднем
§ 24] ДИФФУЗИЯ ЛЕГКОЙ ПРИМЕСИ В ОСНОВНОМ ГАЗЕ 713 можно считать, что скорость упорядоченного движения vx мала по сравнению со скоростью хаотического движения v. Отклоне- Отклонение системы от равновесного состояния, в котором имеется пол- полная изотропия скоростей, будет мало. Поэтому будем искать ре- решение кинетического уравнения B4,2) в виде f (в, х) « /о(х) + vxfx (х)+ ... « /о + v cos 6 fx. B4,3) Здесь /о(х) — равновесная функция распределения в точке х (аргумент р не записан для краткости), т. е. V* р2 f (п г\ _ f п (х\ Щ ~ 2mkT • здесь п (х) — число частиц примеси в единице объема, отнесенное к точке х, /i (x) v cos 9 — искомая малая поправка к статистиче- статистическому распределению. Величина vx или cos 9, характеризующая степень анизотропии функции распределения, пропорциональна величине разности концентраций или температур, вызывающей эту анизотропию. Поэтому разложение B4,3) представляет, по существу, разложе- разложение в ряд по степеням малой анизотропии функции распреде- распределения. Подставляя разложение B4,3) в B4,2), заметим прежде всего, что равновесная функция распределения обращает ин- интеграл столкновений в нуль. Таким образом, в правой части B4,2) будет стоять величина / = v2N J о (v, a) f{ (x) [cos 9' - cos 9] dQ = = v2Nf{ (x) J o(v, a) [cos 9' - cos 9] sin a da dp. В левой части имеем Член, содержащий производную^, опущен, как малый по срав- нению с оставленным. Таким образом, получаем cos 9 |? = vNf{ (х) | a {v, a) [cos в' - cos 9] dQ . B4,4) Для дальнейшего необходимо связать углы 6' и 9, образуе- образуемые с осью х импульсами частиц с углом рассеяния а. Вос- Воспользуемся для этого известной формулой сферической тригоно- тригонометрии A,7), т. I, написав cos 6' = cos 9 cos a + sin 9 sin a cos p, где p = ipi —1|J, tyi и ^2 — азимутальные углы векторов импуль- импульса р и р'.
714 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Тогда можем написать: Г a {v, a) [cos 6' — cos 6] sin a da dp = = J o(v, a) cos 9 (cos a— 1) sin a da dp + •f j a (v, a) sin 0 sin a cos p sin a da dp = = — 2ncos9 J q(v, a)(l-cosa)sinada. В последнем преобразовании учтено, что Jcospdp = 0. При этом B4,4) приобретает вид a (a, a) (I -cos a) sin a da \fxv. J Отсюда следует, что искомая функция f\ равна где обозначено: я otr = 2n \ o(v, a) (I—cos a) sin a da. о Величина otr носит название транспортного сечения столкно- столкновения. В частном случае сечения не зависящего от угла рассея- рассеяния o(v, a) = o(v), имеем otr = o(vJK J (I — cos a) sin a da = Ana (v). о Если считать сталкивающиеся частицы твердыми шариками с радиусами гх и г2, то otr = л(г\ + г2J. Величина носит название транспортной длины свободного пробега при движении частицы легкого газа в тяжелом. Ее наглядный смысл будет пояснен ниже. Вводя в B4,5) определение длины свобод- свободного пробега, находим М*)--Я*-&?Ц B4,7) /(/>, х, в) = /„(/>, x)-lircosQdh'dP;x) . B4,8) d;
§ 24] ДИФФУЗИЯ ЛЕГКОЙ ПРИМЕСИ В ОСНОВНОМ ГАЗЕ 715 Зная функцию распределения, можно найти средний поток частиц примеси в выделенном направлении (т. е. вдоль оси х). По определению, средний поток частиц в направлении оси х — jx равен /*= Действительно, (vxf) дает число легких частиц с данным им- импульсом, проходящим через сечение 1 см2 за 1 секунду в напра- направлении оси х. Интегрируя по всем значениям импульса, находим полное число частиц, проходящих через площадку 1 см2 за 1 секунду в указанном направлений. Подставляя значение f из B4,8), находим L=jv cos в /0 (р, x)dp-j vKtr cos2 9 |k dp. B4,9) Ввиду изотропии функции распределения fo(p,x) первый инте- интеграл обращается в нуль, так что ]х = - J vXtr cos2 Q^±p2dp sin 6 dQ *[>. B4,10) Рассмотрим сначала случай, когда температура газа посто- постоянна, а вдоль оси х имеется градиент концентрации примеси ~, где с = Nn « -JJ-. При этом можно непосредственно вы- выполнить интегрирование, написав Я 2Я Jx=- j j cos2 6 sin 9 dQ d^ -^ J vltrf0p2 dp 0 0 0 4я a f v 0 0 f Г1Г дс 1 / v \ Kr dc B4,11) Здесь черта означает среднее значение по равновесному распре- распределению, т. е. Величина fe) B4,12) является коэффициентом диффузии. Окончательно для потока частиц легкого газа сквозь тяжелый получаем §-. B4,13)
716 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Если вместо концентрации с пользоваться числом частиц п лег- легкого газа в единице объема, то /*=-?> Ц-. B4,14) Из определения коэффициента диффузии D ясно, что он яв- является величиной существенно положительной. Поэтому поток примеси (легкого газа) всегда направлен в сторону убывания его концентрации. Если каким-либо способом вдоль оси х все время поддержи- поддерживается постоянная разность концентраций, в смеси газов будет существовать стационарное движение легкой компоненты (при- (примеси) в направлении от большей концентрации к меньшей. Если же, наоборот, перепад концентрации не поддерживать искус- искусственно, то произойдет выравнивание концентраций и состав смеси станет постоянным по всему сосуду. Мы ограничились случаем диффузии примеси легких частиц в тяжелом газе. Аналогичным образом можно вычислить выра- выражения для диффузии тяжелой примеси в легком газе. Мы на этом останавливаться здесь не будем. Рассмотрим теперь подробнее смысл длины свободного про- пробега Xtr- Если легкая частица движется со средней скоростью v, она сталкивается со всеми (неподвижными) частицами, лежащими в вырезаемом ею цилиндре высотой v и площадью otr. Появле- Появление Otr вместо а означает учет того обстоятельства, что не все соударения являются равно эффективными. Так, например, столкновения с углом рассеяния а«0 в меньшей степени из- изменяют направление полета и выводят частицу из этого цилинд- цилиндра, чем столкновения са = я. Полное число столкновений равно соответственно NUotr- Путь, проходимый в среднем между двумя последовательными столкновениями, т. е. средняя длина свобод- свободного пробега, равен ^ B4>I5) Полезно отметить зависимость Ktr от давления в газе. По- Поскольку р = NkT, имеем & B4'16) Если, в частности, считать сталкивающиеся частицы твердыми сферами и atr выражается формулой otr = я (л + г2J, где гх и г2 — радиусы частиц, то
§ 25] ТЕРМОДИФФУЗИЯ В ГАЗАХ 717 Соответственно, коэффициент диффузии Таким образом, коэффициент диффузии зависит от свойств диф- диффундирующей частицы (ее массы и размера), а также радиуса молекул основного газа; он растет с температурой ~Г3/* и об- обратно пропорционален давлению. Найдем теперь условия применимости найденного прибли- приближенного решения. Решение применимо, если разложение B4,3) достаточно быстро сходится. Для этого в свою очередь необхо- необходимо выполнение условия \vfx\< L или, если подставить значение f\ из B4,5), Последнее неравенство означает, что равновесная функция дол- должна достаточно мало изменяться на расстоянии, равном длине свободного пробега. § 25. Термодиффузия в газах Выше, рассматривая движение примеси легких частиц, мы считали температуру газа постоянной. Теперь мы откажемся от этого допущения и рассмотрим более общий случай, когда в направлении оси х одновременно происходит изменение кон- концентрации диффундирующего газа и его температуры. Найдем снова поток примеси легкого газа вдоль оси х, вос- воспользовавшись формулой B4,10). В ней теперь мы не можем, однако, выносить величины, зависящие от температуры газа, за знак пространственного дифференцирования, так как сама тем- температура изменяется от точки к точке. Перепишем поэтому фор- формулу B4,10) в виде Г cos2 в d ( v с \ , /ЛС- 1Ч >*=-J -n&b^fojdp. B5,1) Мы внесли под знак пространственного дифференцирования ве- величины otr и и, котбрые являются функциями истинной ско- скорости частиц (но не средней скорости частиц, зависящей от температуры). Выполняя интегрирование по углам, аналогично формуле B4,11), находим:
718 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Чтобы перейти к обычным обозначениям, в которых }х выра- выражается в зависимости от концентрации легкой примеси, на- напишем где давление газа р постоянно вдоль смеси. Тогда имеем . ___ __ kT_ J_ n_ / у \ _ 'х 3 dx p \ Off ) "" 3 dx NkT \otr) 3 dx T \ otr ) ____[_ f~v~\ jic Tc__ _d__ [J__ (ZJLX] ^L Вводя коэффициент диффузии, находим Формулу для потока частиц принято записывать в виде Сравнение формул B5,4) и B5,5) дает Величина йт носит название коэффициента термодиффузии. Для выяснения смысла полученного результата положим -—- = 0, т. е. рассмотрим случай постоянства концентрации при- примеси в сосуде с газом. При этом jx=-DNkT^. B5,7) Мы видим, что при наличии перепада температуры в смеси газов постоянного состава возникает движение частиц примеси по отношению к основному газу. Это явление носит название термической диффузии, или термодиффузии. Величина термо- термодиффузионного потока определяется величиной градиента тем- температуры и значением величины к?. Наличие термодиффузионного потокаг т. е. относительного движения частиц примеси в определенном направлении, вызо- вызовет изменение состава смеси, т. е. появление некоторого гра- градиента концентрации -~ Ф 0. Последний эффект в свою оче- очередь приведет к появлению потока частиц примеси, который будет снижать накапливание примеси из-за термодиффузии. В итоге может установиться такое состояние, при котором по-
§26] ДИСПЕРСИЯ ЗВУКА 719 ток частиц, вызываемый термодиффузией, в точности компен- компенсируется потоком из-за обычной диффузии. При этом полный поток примеси относительно основного газа будет равен нулю, и формула B5,5) дает так что &--*i"?" B5,8) В неизотермической смеси газов устанавливается стацио- стационарный градиент концентрации, определяемый формулой B5,8). В общем случае, независимо от того, достигнуто такое устано- установившееся состояние или нет, температурный градиент вызывает появление в смеси газов градиента концентрации. Мы до сих пор нигде не указывали, в каком направлении будет двигаться легкая примесь — в сторону роста или умень- уменьшения температуры. Из B5,7) ясно, что направление потока определяется знаком коэффициента термодиффузии kTi по- поскольку D — величина существенно положительная. Знак kT за- зависит от знака производной -т~- (~^~)"у • ^ общем виде ука- указать знак этой производной невозможно. Он зависит от кон- конкретного закона взаимодействия между молекулами примеси и основного газа. Явление термодиффузии имеет важное практическое значе- значение. Оно используется для разделения газовых смесей, в част- частности, смесей изотопов. Пусть в некотором сосуде, содержащем смесь газов, одна стенка поддерживается при температуре 7\, вторая при температуре Г2 > 7Y При этом в сосуде возникает термодиффузионный поток. Обычно легкий газ движется про- против потока тепла, т. е. по направлению к горячей стенке. Если первоначально в сосуде находилась смесь постоянного состава, то в результате термодиффузии у более нагретой стенки она обогатится одной, например, легкой компонентой. Производя здесь отбор частиц легкой компоненты, можно поддерживать стационарный поток термодиффузии и производить разделение легкой и тяжелой компонент смеси. § 26. Дисперсия звука в газах Одним из сравнительно новых приложений кинетической теории газов является получение закона дисперсии звука в га- газах. Рассмотрим равновесный одноатомный газ, в котором рас- распространяется плоская звуковая волна. Выберем направление ее распространения за ось х-в. Естественно пытаться искать возмущения всех величин, характеризующих состояние газа, в
720 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III частности, функции распределения в виде <р « F (о) е'<«'-**>. B6,1) Уравнение для возмущенной функции распределения имеет вид B1,32). Подстановка B6,1) в B1,32) дает icoF {v) - iv%F {v) = / (ф0). B6,2) Разложим F(v) в ряд по собственным решениям уравнения B1,33) f(i>)=2<vp!0). Тогда будем иметь 2 [toa,qf - fteoo4qf ] - V»ftqf. B6,3) Умножая B6,3) на ф^0) и интегрируя, приходим к системе ли- линейных алгебраических уравнений too* + ik 2 Pj*o* ~ Ma = 0, B6,4) где Для того чтобы система B6,4) имела ненулевые решения, не- необходимо, чтобы ее детерминант обращался в нуль. Это дает || (ко+ ;у 6<*-/?8^ = 0. B6,5) Детерминант B6,5) имеет, вообще говоря, бесконечно высокий порядок. Для определения закона дисперсии со(&) следует раскрыть этот определитель и найти его корни. Если ограничиться первыми известными собственными функ- функциями однородного уравнения B1,32), то мы имеем t mv2 <Pi=l> Фг^^, Фз = -у-"> *i = 0, Х2 = 0, Я3 = 0. При этом в детерминанте следует удержать три первых столб- столбца и три строки !). Простое вычисление приводит к формуле, получающейся в гидродинамическом приближении, ') См. Д. Уленбек, Д. Форд, Лекции по статистической механике, «Мир», 1965,
§ 27] ЛИНЕАРИЗОВАННОЕ УРАВНЕНИЕ БОЛЬЦМАНА 721 Скорость звука с оказывается постоянной: (О Учитывая собственные функции и собственные значения более высокого порядка, можно найти закон дисперсии при возра- возрастании частоты. Оказалось при этом, что скорость звука растет с частотой и одновременно возникает поглощение звука. Коэффициент поглощения быстро растет с уменьшением длины волны. При приближении длины волны звука 1/и к длине свободного про- пробега коэффициент поглощения возрастает до значения 1/х. Это означает, что распространение звука как периодического возмущения прекращается при к ~ у. § 27. Линеаризованное уравнение Больцмана для квазигазовых систем Применение уравнения Больцмана не ограничивается слу- случаем идеальных газов. Наоборот, наиболее важные его примене- применения вообще не связаны с рассмотрением идеальных газов. Су- Существует большое число важных случаев, когда кинетическое поведение систем сходно с газовым. В самом общем виде свойства таких систем, которые мы бу- будем именовать квазигазовыми, могут быть сформулированы сле- следующим образом: пусть имеется некоторая система не взаимодей- взаимодействующих между собой легких частиц (частиц первого сорта), помещенная в среду, образованную другими взаимодействую- взаимодействующими между собой тяжелыми частицами (частицами второго сорта). Между частицами обоих сортов имеет место некоторое взаимодействие, имеющее характер парных столкновений. Си- Система частиц первого сорта может быть описана некоторой одночастичной функцией распределения f(ryvyt)y поскольку между этими частицами нет никакого взаимодействия. Тогда в общем случае можно написать для изменения функции рас- распределения где \гп\ описывает изменение функции распределения вслед- вследствие парного взаимодействия — столкновений между частица* ми первого и второго сорта. Предположим, далее, что соударения можно считать со- совершенно упругими, а состояние частиц второго сорта
722 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. Ш неизменяющимся при соударениях. Тогда можно написать (¦л L=IN=N J °(y> a) v [fi"/] dQ- B7>2) Здесь, в отличие от A4,10), v представляет скорость легкой частицы, N — число тяжелых частиц в единице объема. В ре- результате для функции распределения легких частиц получается уравнение %+$%+*%-» \<»ь-№ <27>3> которое представляет линейное интегро-дифференциальное уравнение Больцмана. Частным случаем его являлось уравне- уравнение B4,2), описывающее диффузию легкой примеси. В главах, посвященных теории плазмы и теории твердого тела, мы подробно изложим современные представления о по- поведении электронов в плазме и в твердых телах. Имея в виду дальнейшие приложения, положим, что внешне силы, действую- действующие на частицы первого сорта, являются силами Лоренца: Будем считать систему неравновесной, но стационарной, температуру и химический потенциал изменяющимися в странстве, так что Т = T{r)\ jx = \i(r). Тогда уравнение B7,3) приобретает вид Для нахождения решения стационарного линейного уравнения Больцмана будем считать заданным локально равновесное рас- распределение /<°>(е, Г, \х), где е — энергия частицы, \х и Т локаль- локальные значения температуры и парциального потенциала. Локаль- Локально равновесное распределение /@) может быть как распределе- распределением Максвелла, так и распределением Ферми или Бозе. Считая отклонение от состояния равновесия достаточно малым, можно пытаться искать решение B7,4) в виде /<*/<°> + /'(Р| г), где |/'| <С/@). Физически это означает, что все поля, действую- действующие на частицы, а также все градиенты температуры и кон- концентраций малы. В отличие от fi°\ добавка к функции распре- распределения f не обладает сферической симметрией в пространстве импульсов.
§27] ЛИНЕАРИЗОВАННОЕ УРАВНЕНИЕ БОЛЫДМАНА 723 Сохранение полного числа частиц требует выполнения условия /Пр, r)dp-0. B7,5) В общем случае можно написать ) B7,6) Подставляя B7,5) в B7,4), будем удерживать в нем лишь ве- величины старшего порядка малости.. Имеем, очевидно, т дг т дг Преобразуем значение производной: дг ~ дг де так что Далее, имеем [Л д ( 1 \ df«» 1 дц W дг \ kT) дг kT дг > B7,7) поскольку первое слагаемое тождественно обращается в нуль. Наконец, для интеграла столкновений находим поскольку равновесное распределение обращает / в нуль. Под- Подставляя B7,7), B7,9) в B7,4) находим окончательно B7,10) Из-за наличия в правой части дополнительного члена решение уравнения B7,9) в магнитом поле имеет некоторые особенности. Мы рассмотрим его в гл. III, а пока положим Н = 0. Тогда уравнение B7,10) превращается в линейное интегральное
724 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. Ill уравнение, которое удобно записать сокращенно в виде Будем пытаться искать его решение, как это было уже сделано в § 24, в виде /' = — ар A cos 0, где 0= Z(p,A) и а — некоторая постоянная. Тогда имеем рА cos 0 = а — NA \ а ( — , а) [cos 0, — cos 0] d?i> где 0i = L(pi, Л). Значение cos©7 можно выразить через cos0 и cos а с помощью формулы сферической тригонометрии [т. I, A.6)]. Пользуясь этим выражением, находим \ а ( — , а ] (cos 0 cos а — cos 0) dfi = — cos Qatr. Таким образом, имеем • = т. " Nvotr Окончательно для функции распределения получаем B7,11) Заметим прежде всего, что интеграл столкновений в том же приближении можно написать в виде Последнее выражение сразу показывает, что х представляет не что иное, как время релаксации [сравни с B3,6)]. Нарушение сферической симметрии функции распределения в пространстве импульсов оказывается пропорциональным зна- значению cos 0. Фактически представление функции распределения в виде B7,11) означает разложение ее в ряд по полиномам Лежандра, в котором удержан первый член разложения. Легко видеть, что дополнительное условие на функцию распределе- распределения B7,5) автоматически удовлетворяется. Нарушение сферической симметрии функции распределения вызывает появление среднего потока частиц, плотность кото- которого равна B7,12)
§ 28] КВАЗИГАЗОВЫЕ СИСТЕМЫ ВО ВНЕШНЕМ ПОЛЕ 725 Поток / согласно B1,8) представляет первый момент функции распределения. Полезно заметить, что поток / зависит от свойств системы только через посредство производной по энергии от равновес- равновесной функции распределения B7,6). Ясно, что если бы распре- распределение по энергиям было равномерным, поток частиц обратил- обратился бы в нуль. В главе V мы воспользуемся полученными выражениями для f и /. § 28. Решение уравнения Больцмана для квазигазовых систем во внешнем поле сил В дальнейшем мы будем пользоваться общим решением ли- линеаризованного уравнения Больцмана во внешнем поле сил. Рассмотрим уравнение Будем считать поле внешних сил слабым и искать решение B8,1) в виде ряда последовательных приближений. Ограничи- Ограничиваясь нулевым и первым членами разложения, можем написать f = /@)(f, t) + r(v, t), B8,2) где fc°> отвечает отсутствию поля, a f — пропорционально полю. Чтобы не выписывать громоздких формул, ограничимся сначала пространственно-однородной системой, т. е. положим -г^ = 0. Тогда имеем где /(/')—значение оператора столкновений, в котором в каче- качестве функции распределения взята функция /'. Наряду с уравнением B8,3) введем уравнение Грина ¦ <0, B8,4) где W — функция Грина, удовлетворяющая условиям {О t- оо t ¦ -о t>tf •г, dW Смысл функции Грина весьма прост: она представляет вероят- вероятность того, что частица, имевшая в момент времени Г скорость v\ в момент t будет иметь скорость v.
726 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Решение уравнения B8,3) может быть выражено через функцию Грина обычной формулой: о - J dv J dv' J df W (v, V, t-t>)L.t?_. B8,6) — oo При этом мы воспользуемся первым свойством функции Грина B8,5). Формула B8,6) дает общую связь между изменением функции распределения и вероятностью перехода W. Зная f'(v,t)y можно найти поток частиц по формуле о t'^^--W(v, v', t-f). B8,7) Аналогичные выражения могут быть получены для про- пространственно-неоднородной, но стационарной системы. При этом вместо B8,3) и B8,4) имеем (для простоты в одномерном случае) ??* <*» v% BM) где W представляет вероятность того, что частица, находившая- находившаяся в точке х' и имевшая скорость v\ перейдет в точку х и при- приобретает скорость v в единицу времени. Решение B8,8) имеет вид f'(v, r)--J W.[^^r)dxdv'. B8,10) В частности, если положить то B8,9) приобретает вид dW , W дх xv Отсюда следует, что X — Хг w==\ е то , х>х', I 0, х<х', и i28,10) можно написать в виде J (^ -W-) е~^ djf"' B8I
§ 29] УРАВНЕНИЕ ДЛЯ НЕОДНОАТОМНЫХ ГАЗОВ 727 Интегрирование ведется по отрезку траектории, проходящему через точку х в направлении поля, для которого х" < х [мы произвели замену (х — х')-*х"\. Смысл экспоненциального множителя становится весьма прост, если написать его в виде ехр(—х"/Х), где К — длина сво- свободного пробега. Таким образом, во внешнем поле сил линеаризованное урав- уравнение Больцмана допускает решение, выражающееся в самом общем виде через вероятность перехода W. Этой формой реше- решения мы будем пользоваться в дальнейшем. § 29. Кинетическое уравнение для неодноатомных газов До сих пор мы ограничивались случаем, когда молекулы газа имели только поступательные степени свободы. Это яв- является хорошим приближением для рассмотрения одноатомных газов. Однако в более важном случае многоатомных газов при- применимость этого приближения заранее не очевидна. Оказывает- Оказывается, что возможно сформулировать в самом общем виде кинети- кинетическое уравнение для двухатомных (линейных) молекул или молекул типа волчка1). Такие молекулы имеют две вращательные степени свободы. Вращательные уровни всегда сильно возбуждены (ср. § 44 ч. III), так что их можно рассматривать классически. Колебательные степени свободы можно считать не возбу- возбужденными при не слишком высоких температурах. Таким обра- образом, движение молекулы задается тремя поступательными и двумя вращательными степенями свободы. Вращательное состоя- состояние молекулы можно характеризовать двумя обобщенными коор- координатами (например, двумя углами) и двумя отвечающими этим координатам обобщенными импульсами. Удобнее, однако, характеризовать вращательное движение четырьмя величинами — тремя компонентами момента импуль- импульса Mi (/=1,2) и углом -ф, характеризующим ориентацию мо- молекулы в плоскости, перпендикулярной к вектору М{. В этих переменных кинетическое уравнение приобретает вид Интеграл столкновений имеет вид / = Г (f2f3w' — ff{w) dv{ dQy dM{ dM dty = = J w (Уз ~ ffi) dv{ dQv dM{ dM d^y B9,2) •) Мы следуем в дальнейшем работам Ю. Кагана и др., ЖЭТФ, 41, 1536 A961); 41, 844 A961); 51, 1893 A966).
728 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ (ГЛ. III где вероятность перехода w' и w представляют вероятности прямых и обратных переходов. В силу принципа детального равновесия w' = w, так что w не изменяется при замене М на (—М). Здесь обозначено dM=MdMdQ. Элементы телесных углов dQ/u и dQv определяют ориентацию векторов М и v. Величина -ф представляет скорость вращения молекулы в плоскости, перпендикулярной к вектору М. По порядку вели- величины 1,'ij) ~ 10~13 сек, т. е. порядка длительности времени со- соударения. Время 1/aj) весьма мало по сравнению с временем между двумя последовательными соударениями т. По порядку величины имеем Поэтому можно считать, что член-ф-^- является самым боль- большим в уравнении B9,1). В первом приближении можно B9,1) представить как Щ=0. B9,4) Это означает, что функцию распределения можно считать не зависящей от угла -ф, т. е. положить |г = °- B9,5) Тогда B9,2) приобретает вид Локально равновесная функция распределения f(V, M) имеет вид f@) _ ( т \Уз 1 р WTp" 2JkT @Q 7\ 1 ~-\27ikT] DnJkT) * f \***П где по-прежнему V == v — и — скорость поступательного движе- движения молекулы относительно газа как целого. Рассмотрим теплопроводность газа. Вычисление выполняется но той же схеме, что и для одноатомного газа. Полагая и = О, так что 1 moS № f@) = т \ '2 1 р 2kT p 2JkT (9Q 8) ' \2nkT) DnJkT) e e f {^>*>
§ 29] УРАВНЕНИЕ ДЛЯ НЕОДНОАТОМНЫХ ГАЗОВ 72у напишем функцию распределения при наличии градиента тем- температуры в виде Проводя выкладки, аналогичные проделанным в § 22, имеем вместо B2,27) а^ дТ I G mv> M* dxk ~~Vk dxk T G mv> M* \f{0) \ 2 2kT 2JkT ) ' ' Соответственно вместо B2,30) получим I /<о) = 2kT 2JkT t [0)vOTH.a Вз + fe - Ci - 6] dvx du dM1 dM. B9,10) = J/f: В отличие от уравнения B2,30), содержащего только один век- вектор v, выделяющий определенное направление, для уравнении B9,10) можно построить три вектора, —v, M(Mv) и [Mv], выде- выделяющих три1) различные направления в пространстве. Поэто- Поэтому для вектора ? в самом общем виде можно написать вместо B2,31) Z M{M)^ + [Mv]yi B9,11) где а, р и y — скалярные функции. Нетрудно заметить, однако, что последняя должна быть равна нулю: Y = 0. Действительно, левая часть уравнения B9,10) инвариантна от- относительно замены М на (—М). С другой стороны, вектор [Mv] изменяет знак при этой замене, а интегральный член со- содержит еще величины /<°) и dMi dM, которые инвариантны при этой замене. Поэтому, если бы мы удержали в B9,11) послед- последний член разложения, левая и правая части уравнений преобра- преобразовывались при замене М на (—М) по разным законам. Скалярные функции зависят от всех скалярных аргументов, которые можно построить из величин, входящих в B9,10). Та- Таких скалярных величин можно построить три: и2, М2, (MvJ. Та- Таким образом, окончательно, $ = va(v\ M2, (MvY) + M(Mv)$(v2, M2, (Mvf). B9,12) Скалярные функции аир должны удовлетворять интегрально- интегральному уравнению B9,10) и дополнительным условиям B2,12) — Величина М является псевдовектором.
730 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III B2,14). Поток тепла определится по формуле Для нахождения конкретного выражения функций а и р и соот- соответственно вычисления коэффициента теплопроводности необ- необходимо сделать допущения о функции о {a, v0TH). В приближении, когда соударения можно считать упругими, а молекулы — твердыми сфероцилиндрами (цилиндрами, огра- ограниченными сверху и снизу полусферами), такие выкладки были проделаны в цитированных работах. Они слишком громоздки для того, чтобы их можно было здесь провести. В итоге для теплопроводности получается значение <29-14) где / — высота цилиндра, а а — радиус полусфер. Аналогичным образом вычисляются и другие кинетические коэффициенты. Приведенные рассуждения имеют скорее методический интерес, поскольку они показывают, как следует искать решения инте- интегрального уравнения B9,10) для неодноатомных молекул, обла- обладающих вращательными степенями свободы. Более интересным качественным эффектом, который про- проявляется в двухатомных молекулах, является зависимость кине- кинетических коэффициентов от внешних полей. Теплопроводность и вязкость парамагнитных газов оказы- оказываются зависящими от внешнего магнитного поля (эффект Зенфтлебена). Аналогичные явления наблюдаются в газах из полярных молекул, помещенных в статическое электрическое поле. Оба явления имеют одинаковую физическую природу: при наличии моментов (магнитного или дипольного) молекулы ориентируются полем. В кинетическом уравнении следует удер- удерживать слагаемое, отвечающее зависимости функции распре- распределения от момента. В результате этого возникает дополнитель- дополнительный поток тепла или импульса. Рассмотрим, например, случай теплопроводности парамаг- парамагнитного газа в магнитном поле. Кинетическое уравнение имеет вид Здесь для М можно написать в квазиклассическом прибли- приближении
§ 29] УРАВНЕНИЕ ДЛЯ НЕОДНОЛТОМИЫХ ГАЗОВ 7'6\ где IX — магнитный момент, [io—магнетон Бора и g — гиро- гиромагнитное отношение. Поэтому имеем Решение интегрального уравнения B9,16) снова можно пытать- пытаться искать в виде При этом для вектора ?л получаем mv2 М2 Т \2 2kT 21 kT B9,17) При наличии магнитного поля ?& определяется векторами vy М и Я. Вычисления, аналогичные приведенным выше, но еще более громоздкие, приводят к выражению для ?ь. Выражение для теплопроводности находится по формуле B9,13). В полном согласии с опытом оказывается, что изменение коэффициента теплопроводности ^), B9,18) TJ где F — известная функция аргумента —, а р — давление газа. Температурная зависимость этой величины определяется кон- конкретным видом сечения столкновений молекул. Наконец, оказывается, что теплопроводность в магнитном поле является анизотропной. Отношение теплопроводностей при VT\\ Н и VT JL Н в силь- сильных магнитных полях #->СХ> и перестает зависеть от каких-либо параметров. В случае газов с нелинейными молекулами, обладающими помимо вращательных также колебательными степенями свобо- свободы, формулировка кинетического уравнения оказывается за- затруднительной. Это обстоятельство связано с возможностью переходов между различными колебательными и вращательны- вращательными состояниями, которые возникают при столкновениях. Если не сделать некоторых допущений о характере перехода энергии от поступательных к колебательным степеням свободы, а так- также о характере (в частности, о кратности вырождения) послед- последних, уравнение Больцмана вообще не может быть сформулиро- сформулировано и решено.
732 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III В случае невырожденных состояний для внутренних степе- степеней свободы удается написать уравнение Больцмана. Однако фактически его решение удается найти только в предельных случаях, когда указанный переход энергии идет без затрудне- затруднений, или, наоборот, весьма затруднен. Затрудненный переход энергии между поступательными и внутренними степенями свободы приводит к появлению специфи- специфического релаксационного процесса. Это, в свою очередь, оказы- оказывает существенное влияние на кинетические свойства газов, в частности, на значение коэффициентов переноса. По самому смыслу уравнение Больцмана относится к раз- разреженным системам с парными взаимодействиями между ча- частицами. Поэтому кинетическое уравнение Больцмана позволяет рас- рассмотреть поведение лишь сравнительно весьма ограниченного круга систем. Тем не менее кинетическое уравнение Больцмана имеет огромное значение для современной физической кинетики. Оно позволяет сделать ряд общих, принципиальных выводов о ха- характере необратимых процессов, сформулировать общие урав- уравнения переноса, ввести важнейшие характеристики поведения системы при необратимом процессе — кинетические коэф- коэффициенты. Для систем, к которым кинетическое уравнение Больцмана применимо, можно получить уравнения переноса, выражение для времен релаксации и коэффициентов переноса, а при известных модельных допущениях — их числовые значения. Не менее важным является то обстоятельство, что в ряде физических систем и прежде всего в плазме и твердых телах поведение системы удается описать в виде движения системы квазичастиц, свойства которых близки к идеальному газу. По этой причине квантовое обобщение кинетического уравнения Больцмана играет основную роль в теории твердого тела. Некоторые другие примеры применения уравнения Больц- Больцмана к решению кинетических задач будут приведены в после- последующих параграфах. § 30. Замедление быстрых нейтронов Одним из детально развитых разделов кинетики является теория движения потоков нейтральных частиц или излучения в веществе. Пусть в некоторой области, которую мы будем называть источником, возникают частицы, которые движутся затем в ве- веществе, испытывая при этом рассеяние или поглощение.
§ 30] ЗАМЕДЛЕНИЕ БЫСТРЫХ НЕЙТРОНОВ 733 В кинетической теории газов такая постановка вопроса ка- кажется несколько искусственной. Однако с ней приходится стал- сталкиваться очень часто. В виде примера укажем прежде всего задачу о пространственном распределении излучения. Если не- некоторые источники излучения распределенные излучают спектр частот S(co, г), то при прохождении через вещество этот спектр будет изменяться. Поглощение и рассеяние будут изменять как интенсивность, так и угловое и частотное распределение излу- излучения. Другим, весьма подробно изученным случаем взаимодей- взаимодействия нейтральных частиц с веществом является прохождение нейтронов через вещество. Как известно, нейтроны получаются при ядерных реакциях, в частности, при ядерном делении в виде быстрых частиц, с энергиями порядка нескольких миллио- миллионов электрон-вольт. Двигаясь в веществе и испытывая столк- столкновения с ядрами, нейтроны замедляются. При неупругих соуда- соударениях их энергия уменьшается очень существенно в каждом акте рассеяния. Если, однако, энергия нейтронов оказывается ниже первого возбужденного уровня ядра, то в дальнейшем неупругие столкновения не происходят. Замедление нейтронов оказывается связанным с упругими столкновениями нейтронов с ядрами. Хотя оба рассматриваемых процесса движения излучения и нейтронов в веществе имеют совершенно различную физиче- физическую природу, их формальное рассмотрение оказывается весь- весьма близким. Именно, оказывается, что распределение нейтронов и фотонов в конфигурационном пространстве и по импульсам описываются идентичными уравнениями. Последнее обстоятель- обстоятельство связано с тем, что в обоих процессах можно пренебречь взаимодействием частиц между собой, а взаимодействие с яд- ядрами (для нейтронов) или атомами (для фотонов) имеет ха- характер близкодействия. Мы в дальнейшем для конкретности будем говорить о дви- движении потока нейтронов в веществе. Пусть система нейтронов характеризуется функцией распре- распределения f(r,p, t), где dn = f(r,p, t)dpdV — число нейтронов в элементе объема dV с данным импуль- импульсом р в момент времени t. Для функции распределения можно написать кинетическое уравнение, характеризующее изменение функции распределения в конфигурационном пространстве и в пространстве импульсов во времени. Напишем его в виде баланса частиц, входящих и выходящих в I сек из элемента фазового объема с?Г.
734 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Именно, имеем где q(г, /) — мощность источников, поставляющих нейтроны, т. е. q{r, t) — число нейтронов, возникающих в 1 см3 в точке г в одну секунду. В результате соударений нейтроны выходят из данного эле- элемента фазового пространства и входят в него. При энергиях нейтронов, достаточно больших по сравнению с тепловыми ско- скоростями движения ядер, движением последних можно пренебречь и считать их неподвижными. Всякое соударение нейтрона с дан- данным импульсом с ядром выводит его из объема dV. Напишем число этих соударений, как ( где т — полное время свободного пробега до столкновения. Представим его в виде где lu U и Uc — соответственно полная длина свободного про- пробега, длина пробега до захвата и до рассеяния. В элемент dT из-за столкновений попадают те нейтроны, которые имели другой (больший по абсолютной величине) им- импульс и упруго рассеялись на ядрах: Щсг = П° J где cr(p, pi) — эффективное сечение рассеяния от импульса р к импульсу р\ и п0 — число рассеивающих центров (ядер) в еди- единице объема. Учитывая C0,2) и C0,3), можно написать уравнение Больц- мана C0,1) в виде Jr,p1, t)dPl + q. C0,4) Уравнение C0,4) является линейным, поскольку мы пренебре- пренебрегаем соударениями нейтронов между собой. В физике нейтронов имеется две основные проблемы: 1) по- получение распределения нейтронов по энергиям (если энергия нейтронов, поступающих из источников, известна) и 2) нахожде- нахождение пространственного распределения нейтронов с данной энер- энергией. Мы рассмотрим сначала первую задачу. Поскольку^ нас не будет интересовать пространственное распределение нейтронов,
§ 30] ЗАМЕДЛЕНИЕ БЫСТРЫХ НЕЙТРОНОВ 735 проинтегрируем уравнение C0,4) по всему пространству и обо- обозначим f (г, р, t)dV = N (р, 0, J ? (г, t) dV « Q. C0,5) При этом получаем, очевидно: "Ж +Т = n° J o'atffa, Orfpi + Q. C0,6) Интеграл \ -^dV по всему пространству обращается в нуль. Чтобы не усложнять выкладок, мы ограничимся случаем источ- источника, стационарно испускающего нейтроны с энергией Ео. В этом случае Q не зависит от времени Q = —° . При этом C0,6) превращается в стационарное уравнение 4 = «о J v'a (p, Pl) W {pl)dpl + Qo^?o) . C0,7) Удобнее записать C0,7) в виде Ф(Р)- j*{p)w(p,pl)jj;dpl+ -54^-, C0,8) где вспомогательная функция -^-, C0,9) и w(p,p)—вероятность перехода, нормированная на единицу: jw{p,pi)dp"l. C0,10) Очевидно, что Необходимо теперь написать явное значение для вероят- вероятности перехода w(p,pi). Поскольку нейтроны взаимодействуют с ядрами только на весьма малых расстояниях, упругое рассея- рассеяние происходит по законам упругих соударений и является изотропным. Поэтому где аргумент б-функции выражает закон сохранения энергии при столкновении с неподвижным ядром, а ср(р)—некоторая функция энергии нейтрона -~. Через М обозначена масса ядра. Значение <р(р) может быть найдено из условия C0,10).
736 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. Ш Выполняя интегрирование, получаем Dma J Здесь /?min и /?max — минимальный и максимальный импульсы до соударения, который после соударения превращается в им- импульс р. Согласно законам упругих соударений [ср. D3,33) ч. I] _ М-т ___ Pmln - до + т Р> Ртах - Р- Поэтому окончательно \ Ф (pi) б dp{ = ф (р) (™™м\2 Р = Ь откуда ^ 4птМ2р и нормированная вероятность рассеяния приобретает вид Задача об интегрировании уравнения C0,8) при значении ш(р,pi), даваемом формулой C0,12), весьма сложна. Мы огра- ограничимся поэтому двумя предельными случаями. Во-первых, рассмотрим рассеяние нейтрона на ядрах водорода, т. е. слу- случай т = М. При этом Подставляя C0,13) в C0,8), замечаем прежде всего, что ввиду изотропии рассеяния функция \|) не зависит от углов и зависит только от абсолютной величины импульса, так что C0,8) при- приобретает вид
§ 30] ЗАМЕДЛЕНИЕ БЫСТРЫХ НЕЙТРОНОВ 737 или переходя к новой переменной — энергии, можно предста- представить C0,14) в форме / о Это уравнение решается элементарно. Дифференцирование дает (?) . Qo Г 6 (Ер) Решением этого линейного уравнения служит Qo /,(?р) j f 4я 7J^ j f /, J ^ Из C0,9) следует для функции распределения по энергиям f / J h Qo h(Eo) lt(E) j 4я /s,(?o) о 6XP J he (Ei) Ex Если поглощение отсутствует, / = lt = lsc и C0,17) упрощается: Уравнение C0,8) существенно упрощается также в другом пре- предельном случае при рассеянии нейтронов на тяжелых ядрах. В этом случае передача энергии при каждом соударении мала. Для упрощения выкладок ограничимся случаем, когда мо- можно пренебречь поглощением нейтронов в процессе их замедле- замедления в среде. При этом, однако, можно рассмотреть общий слу- случай немонохроматических источников. При отсутствии поглоще- поглощения lt = he и уравнение C0,8) приобретает вид «(P. Pi)dPi+^p-. C0,19) Поскольку нас интересует лишь энергетический спектр замед- замедляющихся нейтронов, можно проинтегрировать C0,19) по всем углам. При этом оказывается удобным перейти от абсолютной величины импульса к новой независимой переменной1) «»ln)=2ln-f, C0,20) Основание для выбора такой переменной будет ясно видно из дальнейших вычислений. 1) А. И. Ахиезер и И. Я. Померанчук, Некоторые вопросы теории ядра, Гостехиздат, 1950. 24 Bs Г, Левин и др., том II
738 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Определим новую неизвествую функцию ty(u) соотношением ¦ (tt)-|*(p)da C0,21) Положим также wdpi = г] (и, \i) dud Q. Простое преобразование дает e-ud(C0S[x 2m в f 2т в ) Интегрируя C0,19) по всем углам, находим и % (и) = J du'% (и') J т| (и - и\ v) dQ. C0,22) о Внутренний интеграл с б-функцией легко вычисляется, если учесть, что энергия нейтрона при упругом соударении после соударения Е' лежит в интервале (ср. § 43 ч. I). р — ^ \М + т ) ^"" Поэтому, введя величину М + т и выполняя интегрирование по углам в б-функции, находим (зо,23) 0 при и>им. Подставляя C0,23) в C0,22), имеем и <ф0 (и) = J A/ifo (W) % (и - «0 + Q. C0,24) о Уравнение C0,23) может быть решено в замкнутом виде с по- помощью преобразования Лапласа. Именно, умножим C0,23) на e~zu и проинтегрируем по всем и в пределах 0-<и<оо. Тогда находим J % (^) e~zu du = J e~zudu J du'i>0 (u') r\0 (u - u') + J e~2uQ{u)du. о оо о C0,25)
§ 30] ЗАМЕДЛЕНИЕ БЫСТРЫХ НЕЙТРОНОВ 739 Изменяя порядок интегрирования в двухкратном интеграле, на- находим оо оо J du'^{u')e~zu'. J e-z^-^x\(u-u')du' = 0 и оо = J du'% (и') е~™' • J е~™т\{и)du. C0,26) о Обозначим трансформанты по Лапласу через о оо Ч(г)= J Л («) о оо Q(z)=/ Q(«) -*, \е~ги du C0,27) C0,28) C0,29) о и учитывая C0,25), получаем окончательно вместо C0,24) $(z) = $(zL(z) + Q(z). C0,30) Отсюда для трансформанты ф находим Обращая преобразование Лапласа, находим искомое распреде- распределение нейтронов в виде a+foo or+ioo *<«>-ST I n(*)«-rf«-ir J %^f. C0,32) or—ico o—ioo Найдем трансформанту r\{z). Согласно C0,23) имеем Г I p"^Up-mtZtX /ill — j е е аи- 4тМ - {+г — о -uM(l+z) = х_]-им Х~\+г • C0'33> Подставляя C0,33) в C0,32), приходим к несколько громоздкой формуле для распределения нейтронов по энергиям (точнее, по 24*
740 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III логарифмам энергии): СГ-too t I 1-е Интегрирование ведется по прямой, параллельной мнимой оси и лежащей правее всех полюсов подынтегрального выражения. Контур можно замкнуть полуокружностью бесконечно большо- большого радиуса, лежащей влево от прямой. Тогда к интегралу мо- можно применить теорему о вычетах. Обычно можно считать Q(z) функцией, не имеющей полюсов. Тогда полюсами подын- подынтегрального выражения являются точки, определяемые усло- условием (l_e-^)(l+2)=l-<fVl+z>. C0,35) Это трансцендентное уравнение имеет, очевидно, корень z4= 0, а также бесконечное множество корней zh, имеющих отрицатель- отрицательную вещественную часть. Находя вычет от подынтегрального выражения C0,34) и применяя теорему о вычетах, находим При больших значениях и, т. е. при энергиях нейтронов значи- значительно меньших, чем та, с которой они поставляются источни- источниками, формула C0,36) значительно упрощается. Поскольку ве- вещественное значение Re Zh < 0, все слагаемые в сумме C0,36) при и S> 1 экспоненциально малы по сравнению с первым, от- отвечающим Zi = 0. Поэтому вместо C0,36) можно написать lSM~Q(°l C0,37) 1-е + име м По определению оо Q(O)=f Q(«)d« = Q0) о где Qo — полное число нейтронов, испускаемых источником за 1 сек. Мы видим из C0,37), что г|)о(и) не зависит от своего аргумента. Именно эта простота функции распределения в пе- переменной и делает удобной эту переменную.
31] ПРОСТРАНСТВЕННОЕ РАСПРЕДЕЛЕНИЕ НЕЙТРОНОВ 741 Распределение нейтронов по энергиям имеет вид где величина g по определению равна ~им ~им 1-е м + е мим 1 ^ы Эта величина, как показывает простое рассмотрение, предста- представляет среднелогарифмическую потерю энергии нейтрона при одном соударении. § 31. Пространственное распределение нейтронов Обсудим теперь важную проблему о пространственном рас- распределении нейтронов. Допустим, что можно пренебречь изменением энергии нейт- нейтронов при рассеянии на ядрах. Это имеет место, например, для нейтронов, замедлившихся до энергии ~kT (так называемых тепловых нейтронов). Если пренебречь изменением энергии, то в уравнении C0,4) энергию можно считать фиксированной. Если источники поставляют нейтроны в среду стационарным об- образом, то установится стационарное распределение нейтронов в пространстве. Функцию распределения можно считать завися- зависящей только от координат и направления движения нейтронфв. Последнее можно характеризовать единичным вектором *i=|. C1,1) Функция распределения нейтронов удовлетворяет уравнению: C1,2) В интеграле столкновений интегрирование ведется только по углам, поскольку абсолютная величина импульса при стол- столкновениях не изменяется. Сокращая C1,2) на у- и вводя обозначения -ш = Ъ 5<г)=?'т> C1.3) имеем ^ fl ^.. C1,4) Уравнение C1,4) сходно с уравнением для функции распреде- распределения молекул легкого газа, диффундирующего в тяжелом
742 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. Ш (§ 24). Важное отличие, однако, заключается в наличии источ- источников частиц и их поглощения в среде. В тех случаях, когда рассеяние можно считать изотропным до (?,,?{) = 1, уравнение C1,4) допускает точное решение. Ис- Исходя из точного решения уравнения C1,4), можно найти рас- распределение плотности нейтронов в пространстве. Сравнивая его с распределением, полученным в диффузионном приближении, найденном в § 24, мы сможем оценить точность последнего. Для получения точного решения удобно воспользоваться ме- методом разложения в интеграл Фурье. Написав имеем или ikvxlt)ф (*, vx) = Jgi +^ J a f Интегрируя C1,5) по углам, получим Последний интеграл вычисляется непосредственно Г J я sin9rfe _2я, 1 + Ш, 4я Ш + iklt cos0 " iklt \~iklt ~ klt A о Подставляя это значение в C1,6)г, получаем ' щ{к) • C1,7) arctg kit Заметим теперь, что интеграл, стоящий в левой части C1,6), представляет не что иное, как фурье-компоненту плотности нейтронов Ji|>(ft, vx)
§ 31] ПРОСТРАНСТВЕННОЕ РАСПРЕДЕЛЕНИЕ НЕЙТРОНОВ 743 где N(r) —число нейтронов в единице объема среды. Подстав- Подставляя C1,7) в C1,8), находим N{r)=\ eikr ( Г ф (ft, vx) dO) dk = f <pW *'*'<» . C1f9) arctg kit Для получения конкретного выражения для плотности нейт- нейтронов, рассмотрим случай точечного источника Тогда v BjtK ]± 5<> Г у BлK J *' -а arctg kit оо l* 5° Г eikrkdk ,oi im — ~~' То—\2~ I fe/ • W^»^/ " arctg kit Вычисление интеграла удобно выполнить в комплексной об- области. Рассмотрим интеграл по контуру, изображенному на рис. 40. J \ ZdZ C1,11) arctg z Подынтегральное выражение в C1,11) имеет полюс первого порядка в точке = а C1,12) и точку ветвления Контур обходит точку ветвления, интеграл по Рис. 40. большой и малой окружностям обращаются в нуль и остается лишь вычет в точке Z\ и интеграл по мнимой оси / = 2т Re (гх) + с/ 1 arctg z Оценки 1) показывают, что на больших расстояниях от ис- источника (г ^> lt) второе слагаемое мало по сравнению с пер- первым и интеграл по мнимой оси мы просто отбросим. 1) А. Д. Галанин, Теория ядерных реакторов, Атомиздат, 1957.
744 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. Ill Обозначим через i/L корень уравнения C1,12), т. е. положим A-^-. C1,13) Тогда, вычисляя вычет в точке C1,13) и подставляя значение / в C1,10), получаем Рассмотрим случай малого поглощения U ~ he- В трансцен- трансцендентном уравнении C1,13) можно разложить арктангенс в ряд и написать приближенное его решение в виде L2~Ll = \lclsc. C1,15) При этом очевидно, что / 3> /5С. Тогда C1,14) приобретает вид Интересно сравнить пространственное распределение ча- частиц C1,16) с распределением частиц в диффузионном прибли- приближении. В диффузионном приближении решение уравнения Больцмана согласно B4,17) приводит к коэффициенту диффу- диффузии JD =»-—•. Функция распределения N(r) удовлетворяет при этом уравнению где т = —. Решение его в точности совпадает с C1,16) при k *C he- Таким образом, в случае слабого поглощения точное решение кинетического уравнения оказывается с большой сте- степенью точности совпадает с решением уравнения диффузион- диффузионного приближения на больших расстояниях от источника г S> l8C. Численное сравнение решений кинетического и диффу- диффузионного уравнений показывает, что оба решения практически совпадают на расстояниях от источника, больших чем 2/5С. В обратном предельном случае очень сильного поглощения, когда lt ~ /с, уравнение приводит к значению Это означает, что N(r) существенно уменьшается на расстоя- расстоянии ~U от источника. В заключение подчеркнем, что получен-
§ 32] УРАВНЕНИЕ В ПЛАЗМЕ БЕЗ СТОЛКНОВЕНИЙ 745 ные результаты имеют весьма общий характер. Они в равной мере относятся ко всем частицам, движущимся в веществе и испытывающим рассеяние и захват, если только взаимодей- взаимодействие с рассеивающими центрами имеет характер близкодей- ствия. § 32. Кинетическое уравнение в плазме без столкновений Непосредственное применение уравнения Больцмана к плаз- плазме требует осторожности. Заряженные частицы в плазме взаимо- взаимодействуют по закону Кулона, так * что силы взаимодействия между ними сравнительно медленно убывают с расстоянием. Поэтому- необходимо обсудить те изменения, которые нужно внести в вычисление интеграла столкновений для учета особен- особенностей кулоновских взаимодействий. Мы отложим, однако, это обсуждение до § 33, а пока заметим, что наличие сил дально- дальнодействия может в какой-то мере не только усложнять, но и упро- упрощать задачу. Именно, поскольку силы взаимодействия медленно убывают с расстоянием, в системе заряженных частиц должны возникать коллективные движения, в которых принимают уча- участие сравнительно большие группы частиц. Можно говорить о коллективных возбуждениях в плазме, в которые вовлекается вся система как целое. При рассмотре- рассмотрении таких крупномасштабных движений можно пренебречь неоднородностями (флуктуациями) в системе и вовсе не учи- учитывать парных столкновений между частицами. Из теории рассеяния в поле кулоновских сил [см. § 43 ч. I; § 86 ч. V] мы знаем, что существенное отклонение частиц про- происходит при минимальных значениях прицельного параметра Pmin' mv* где ё ~ kT — средняя энергия частиц с температурой Т. Если имеет место неравенство '-у/г, C2,1) где г — среднее расстояние между частицами, а п — их плот- плотность, то роль парных соударений становится' сравнительно малой по сравнению с кулоновским взаимодействием частиц на больших, порядка г, расстояниях. В этом случае в системе частиц с кулоновским взаимодействием характер функции распределения будет определяться в основном не парными столкновениями, а средними силами, действующими на части- частицы. Полезно заметить что неравенство C2,1) эквивалентно
746 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. Ш неравенству C2Д1 Это означает, что для малости интеграла столкновений требует- требуется малость плазменного параметра [§ 41 ч. IV]. Последнее в свою очередь эквивалентно приближению дебаевской теории для равновесной плазмы. Таким образом, в том же дебаев- ском приближении, в каком обычно описываются равновесные свойства плазмы, можно учитывать коллективные взаимодей- взаимодействия, но пренебрегать парными взаимодействиями на малых расстояниях. Неравенство C2,1) или эквивалентное ему C2,1/) справед- справедливы при малой плотности и высокой температуре плазмы. К этому же результату можно прийти и с помощью другого рассуждения, основанного на приближении времени релаксации т. Если в плазме рассматриваются нестационарные процессы с частотой со, то при 0> можно пренебречь интегралом столкновений. Опуская в кинетическом уравнении интеграл столкновений, можно написать -^ + (*V)fa + ^Vvfa = O, C2,2) где индекс а означает сорт частиц (электроны, ионы), а Fa — полную силу, действующую на частицу a-го сорта: C2,3) При этом мы считаем, что jx ^ 1. Поля Е и Н в C2,3) пред- представляют поля, действующие на частицу со стороны всех осталь- остальных частиц (внутренние поля) плюс приложенные внешние поля. Для простоты рассуждений, мы сначала обсудим случай, когда внешние поля отсутствуют. Поля Е и Н удовлетворяют системе уравнений Максвелла — Лоренца: + w { дЕ _i_ 4я • 1 дН div Е = 4яр, C2,4)
§ 32] УРАВНЕНИЕ В ПЛАЗМЕ БЕЗ СТОЛКНОВЕНИЙ 747 Подчеркнем, что мы не можем в нашем приближении рассмат- рассматривать плазму как сплошную среду и пользоваться уравнения- уравнениями Максвелла. Входящие в систему уравнений Максвелла — Лоренца C2,4) плотности заряда и тока представляют средние значения этих величин, взятые по функциям распределения fa: C2,5) Таким образом, система уравнений полей и функций распреде- распределения образует замкнутую систему: -поля Е и Н находятся по заданным средним значениям плотностей заряда и тока. По- Последние зависят от функции распределения fa. Можно сказать, таким образом, что поля Е и Н определяются функцией распре- распределения fa. В свою очередь функция распределения согласно C2,2) зависит от значений полей Е и Я в каждой точке плаз-» мы в каждый момент времени. Иными словами, в системе устанавливается такое распределение частиц по скоростям и в пространстве, при котором соответствующие поля поддер- поддерживают это распределение. Каждая частица движется в поле, создаваемом всеми частицами, за исключением данной. При этом, разумеется, все частицы являются равноправными. Та- Таким образом, в плазме устанавливается самосогласованное поле [ср. § 41 ч. IV или § 70 ч. V]. Обычно тепловым движением ионов ввиду их большой мас- массы можно пренебречь, и искать функцию распределения толь- только для электронов. При этом совокупность ионов образует по- положительный заряженный фон, компенсирующий электриче- электрический заряд электронов. Уравнение C2,2) носит название кинетического уравнения с самосогласованным полем. Следует заметить, что качествен- качественные рассуждения, положенные в основу его вывода, могут быть дополнены более строгим количественным рассмотрением. При этом оказывается, что кинетическое уравнение с самосогласо- самосогласованным полем получается из цепочки уравнений для корре- коррелятивных функций при разложении по малому плазменному параметру r/lD l). Интеграл столкновений оказывается величиной следующего порядка малости в разложении по этому параметру. Описание неравновесных процессов в плазме в приближе- приближении самосогласованного поля позволяет найти целый ряд про- происходящих в ней явлений. 1) См., например, Н. Н. Боголюбов, Проблемы динамической теории в статистической физике, Гостехиздат, 1946; К. П. Гуров, Основания кине- кинетической теории, «Наука», 1966.
748 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III § 33. Дисперсия и затухание плазменных волн Мы рассматривали уже в ч. IV теорию плазменных волн. Мы получили закон дисперсии для плазменных волн, в при- приближении, когда плазму можно было считать сплошной средой (т. е. в гидродинамическом приближении). Здесь, однако, мы можем существенно уточнить макроскопическую теорию и, в частности, найти закон дисперсии и затухания плазменных волн. Рассмотрим высокочастотные собственные колебания про- пространственно-однородной плазмы в отсутствии внешнего элек- электромагнитного поля. Кинетическое уравнение для функции распределения элек- электронов в приближении самосогласованного поля имеет вид ?-0- C3,1) Тяжелые ионы считаются неподвижными. Считая поле слабым, будем пытаться искать решение си- системы уравнений C3,1) и C3,4) в виде f^fo + fu C3,2) где fo — функция распределения электронов в отсутствие коле- колебаний и /, < /о- Подставляя это выражение в C3,1) найдем без труда для /2: Здесь /i является функцией координат, скоростей и времени, fi=fi(r,v,t). Кинетическое уравнение без интеграла столкновений допускает значительное упрощение. В этом приближении можно считать, что все частицы движутся по заданным траекториям под дей- действием самосогласованного и внешнего полей. Поэтому, если Го — координата частицы в момент времени t = 0, то можно на- написать r = ro + jvdt, C3,4) о где v(t) определено уравнением движения частицы, t ?dt. C3,5)
§ 33] ДИСПЕРСИЯ И ЗАТУХАНИЕ ПЛАЗМЕННЫХ ВОЛН 749 Введём в качестве новых переменных значения г0 и v0. Тогда 0*L U'J d \dt)J ^ dv \dt Jro> Vo — I dt )r% v^ u dr ^ m dv ' Здесь мы приняли, что производные (-—-j и т (-gj-) ~ точные значения скорости — совпадают со скоростью и дей- действующей силой для невозмущенного движения. Это верно с точностью до величин второго порядка малости. Поскольку указанные величины умножаются на производные от возму- возмущенной функции распределения /ь такая замена законна. Тог- Тогда кинетическое уравнение C3,3) приобретает весьма простой вид: dfi (го, t?0, t) , еЕ (r0, t) df0 Ft + m 'WU Последнее уравнение интегрируется непосредственно. Если принять, что M*oiO-*O при ^->-оо, то, интегрируя C3,6) по невозмущенным траекториям, имеем оо оо C3,7) Еще раз подчеркнем, что столкновения нарушают движение ча- частиц и лишают возможности пользоваться представлением о дви- движении по траекториям. Рассмотрим случай изотропной однород- однородной плазмы, когда возмущением служит поле электромагнитной волны. В отсутствие возмущения v = v0 = const. В изотропной плазме /о не зависит от углов. Поэтому в вы- выражении для силы можно было оставить только электрическую силу еЕ 1). Разложим поле Е в интеграл Фурье. Тогда для /i имеем: t j& 3> 8) i) Произведение [vH] ¦§¦*¦- 2 [vH] v-^fc
750 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Поправка к функции распределения, создаваемая отдельной гармоникой поля, имеет вид t /<*, (о) = - Jt J E(k, со) el W'-ait'-t)) _^_ dt>. C3>9) —oo Зная поправку к функции распределения, можно найти соответ- соответствующий ей электрический ток t = --^Et(k,<*)jdv J Vl(tI^r)e-'^''-^-^dt\ C3,10) — oo ' Введем новую переменную: % = t-t'. Тогда oo J fi@ 0 Поскольку время t ничем не выделено, можно положить в ин- интеграле / = 0 и ток, генерируемый одной гармоникой поля, оказывается равным /,--¦$¦ Я, (*, ») J"*> J 0/ @) ^j- е'-*в-»«dT. C3,12) Подчеркнем, что здесь /0 означает функцию распределения электронов в плазме в отсутствие колебаний. Вообще говоря, /о не является равновесной функцией распределения. Если, однако, считать, что плазма является равновесной, то /о представляет распределение Максвелла (нормированное на единицу) и dL dfM mvt . ^^f C313) Тогда формула C3,11) приобретает вид оо / = •§-?/ (ft, ©) e< <*'-"><> jdv J v, @) v, (т) е* <•-*•) */ж dr. C3, И) о В § 39 мы обсудим это выражение, имеющее весьма общий характер и связывающее ток с корреляцией скоростей в момен- моменты времени, отделенные промежутком времени ,т. Однако в рас-
§ 33] ДИСПЕРСИЯ И ЗАТУХАНИЕ ПЛАЗМЕННЫХ ВОЛН 751 сматриваемом нами случае, когда внешнее магнитное поле от- отсутствует, частицы движутся с постоянной скоростью, так что г;@) = v(x) = const. Поэтому мы опустим значение аргумента при скорости в дальнейших формулах. Формула C3,12) дает для тензора электропроводности, определяемого из соотношения ji(co) = Oih((o)Eh((jD)y выражение °ч = - ¦$• J dv J °< тё?el ia~kv) x dT- <33> 15> Согласно общей формуле C3,20) .ч. IV, т. I диэлектрическая проницаемость etj имеет вид eu = 6u + i^ou = 6u-i^ j dv j vt-ilje^-^clr C3,16) или, для равновесной плазмы, где Av{ } означает усреднение по максвелловскому распреде- распределению. Выберем направление вектора ft за ось г. Тогда легко ви- видеть, что в изотропной плазме, которую мы рассматриваем, отличны от нуля только три компоненты тензора е^, перпенди- перпендикулярные к направлению распространения волны, K){ J «¦<"*' ) C3,18) и параллельная этому направлению е|| = е2г= i + i-^-i Ог\ е * *"</т )= 1 +i-^^-(h), C3,19) где ( ) означают среднее по компоненте скорости vz, так что сю VS J (Ш"Й°г)Т^ Л. C3,20) ^ C3,21)
752 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ III Зная продольную и поперечную компоненты тензора диэлек- диэлектрической проницаемости, можно найти закон дисперсии про- продольных и поперечных волн (см. § 33 ч. IV). Именно, закон дисперсии продольных волн определится условием 8,-0, C3,22) тогда как закон дисперсии поперечных волн получается из соот- соотношения ^^SO. C3,23) Мы начнем с рассмотрения дисперсии продольных волн. С учетом C3,22) и C3,19) находим трансцендентное уравне- уравнение, связывающее со и k: Й0. C3,24) Найдем прежде всего интеграл по переменной т. Для того чтобы этот интеграл имел определенный смысл, его нужно рас- рассматривать как предел * %d%- lim Как угодно малое значение у обеспечивает сходимость интегра- интеграла на верхнем пределе. Тогда получаем C3,25, Мы должны теперь вычислить среднее значение от C3,25), т. е. интеграл dx ^ _ t — x v со . iy BkT\V2 „ — > z~~u *k~* vo~\ 1 • Вместо v2 мы написали просто v. Воспользуемся тождеством, справедливым при Im z > 0: — х j о
§ 33] ДИСПЕРСИЯ И ЗАТУХАНИЕ ПЛАЗМЕННЫХ ВОЛН 753 Тогда находим оо оо (/,) = —J— Г е~х' Г е{ <г~*> adxda = 1 Vnkvo 1 Г i*«~ { e+e о В последней формуле можно совершить переход к пределу Y -* 0. Тогда получаем окончательно лГ" -(—V о -(J2-Y г lJLe \kvQ) +-?Le ^k°o) о о Очевидно, что ~- = сф—фазовая скорость распространения волн, так что <г = -г—представляет отношение этой скорости к средней скорости теплового движения электронов v = v0 \2. При Сф » v0 можно написать z z z г оо J e™2 dw= J e<*-'2) dt = e*2 J eztet2 dt = e* J e~2zt S "Cf d/ ~ 0 0 0 0 n=0 n=0 0 откуда C3,28) Для вычисления среднего значения в формуле C3,21) восполь- воспользуемся свойством интеграла /ь вытекающим из его определе- определения C3,25) (ш — kvz)Ix = 1
754 ИЛИ Аналогично, или КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ Т' [ГЛ. III ((О ~ kvzf I\ = / ((О - kvz) Усредняя C3,29), находим k2 k2 ' C3,29) Подставляя значение (Ix) из C3,28) при сф > vQy получаем окончательно Подставляя значение G2) в C3,24), приходим к следующему закону дисперсии продольных волн: где ©о = ~~-^-~плазменная (ленгмюровская) частота. В том же приближении решение уравнения C3,31) гласит: (d--cdoA+;6), C3,32) где декремент затухания б равен C3,33) 2/2 где lD — дебаевская длина. Существование в плазме продольных волн с частотой соо и фазовой скоростью с^ = —г- было установлено нами в § 46 ч. IV, где плазма рассматривалась в приближении сплошной среды. Новым результатом является затухание плазменных волн. На первый взгляд этот результат представляется пара- парадоксальным. Выше мы видели, что диссипативные процессы были связаны с молекулярными столкновениями и возникаю- возникающим при этом обменом импульсом. Найденное выше затухание плазменных волн (так называемое затухание Ландау) имеет другую природу.
§ 33] ДИСПЕРСИЯ И ЗАТУХАНИЕ ПЛАЗМЕННЫХ ВОЛН 755 Электроны в плазме могут иметь компоненту скорость vz как меньшую, так и большую, чем фазовая скорость волны сф. На первые частицы действует поле опережающей их волны. Передавая импульс, волна увлекает их за собой. Наоборот, частицы, движущиеся быстрее волны, теряют импульс, отда- отдавая его волне. Только частицы, скорость которых vz = сФ, на- находятся в резонансе с волной. Они движутся в одной фазе с волной, не теряя и не приобретая импульса. Продольная вол- волна стремится исказить распределение Максвелла, создав макси- максимум, отвечающий скорости vz, равной фазовой скорости сф. Известно, однако, что в ансамбле частиц, распределенных по Максвеллу, число частиц со скоростью меньше данной боль- больше, чем число частиц со скоростью большей данной. Поэтому число частиц, увлекаемых волной, превышает число частиц, передающих импульс волне. В итоге имеет место затухание, а не раскачка продольных волн. Формула C3,33) показывает, что затухание S мало для длин волн, существенно превышающих дебаевскую длину. Наоборот, существование плазменных волн с К < lD невозможно: коэффи- коэффициент затухания таких волн становится большим единицы. Это обстоятельство еще раз показывает, что продольные волны в плазме представляют коллективный эффект, связанный с кулоновским взаимодействием заряженных частиц. Совершенно аналогичные вычисления, основанные на ис- использовании уравнения C3,23) и выражения для (/i), приво- приводят к следующему выражению для частоты поперечных волн: (й2 = 02+?2с2>(О2# C3,34) Их фазовая скорость оказывается больше скорости света в пу- пустоте: c<p=t=c1/ Для вычисления коэффициента затухания поперечных волн сле- следовало бы учесть релятивистские эффекты. Ясно, однако, что эффект затухания мал, поскольку фазовая скорость волн столь велика по сравнению со скоростями всех электронов в плазме, что все их можно считать покоящимися. Мы не останавливаемся здесь на весьма важном в практи- практическом отношении вопросе о поведении плазмы во внешнем электромагнитном поле. Метод интегрирования кинетического уравнения при наличии внешнего магнитного поля в принципе не отличается от приведенного, но требует более громоздких выкладок. По этой же причине мы не рассматриваем задачу о плаз- плазменных волнах с учетом движения тяжелых ионов.
756 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III § 34. Кинетическое уравнение в плазме с учетом столкновений Рассмотрение плазмы в приближении самосогласованного поля оказывается недостаточным для описания ряда процессов в плазме. К ним принадлежат прежде всего релаксационные процес- процессы— установление максвелловского распределения, а также выравнивание средних энергий электронов и ионов.. Приближе- Приближение самосогласованного поля недостаточно также для вычисле- вычисления кинетических коэффициентов диффузии, вязкости и т. п. В достаточно разреженной плазме можно учитывать только парные соударения и пользоваться обычным кинетическим уравнением Больцмана, но с видоизмененным интегралом столкновений. Последнее обстоятельство связано со свойствами кулоновского взаимодействия. Поскольку силы кулоновского взаимодействия медленно спадают с расстоянием, основной вклад в интеграл соударений дают столкновения, при которых частицы рассеиваются на малые углы. Действительно, при ку- лоновском взаимодействии эффективное сечение расходится при малых углах рассеяния (см. § 43 ч. I и § 85 ч. V). При рассеянии на малые углы изменение импульсов стал- сталкивающихся частиц мало. Поэтому можно сказать, что основ- основную роль играют такие столкновения, при которых в каждом акте происходит сравнительно малый обмен импульсами. Этим можно воспользоваться для преобразования интеграла столкно- столкновений. Удобно ввести новые переменные в выражение для интегра- интеграла столкновений: / = J w(Pl, p, p3, p2)[f(p3)f(p2)-f(p)f(p1)}dpldQ. C4,1) Положим, что изменение импульса первой частицы Р2-Р = <7. C4,2) Из закона сохранения импульса следует Рз-Pi^-?- Сделаем замену переменных, положив П , Р2+Р . п » РЗ + Р1 . Н2 "~* 2 ' ^3 2 ' Р1-^РЗ-РГ> Р-*Р2-Р- Тогда очевидно, что Ирз, Ръ Ри р)->и>[?гтг1-> -^~> Рз-Рь Р2-р) = = w (р + \; рх -1; - q\ q).
§ 34] УРАВНЕНИЕ В ПЛАЗМЕ С УЧЕТОМ СТОЛКНОВЕНИЙ 757 Поскольку вероятность перехода инвариантна относительно за- замены <7—>(—<7), в силу принципа детального равновесия можно просто записать W (рЗ, #2> Pi, p)~+w[p+J> Pi ~ f > Я) • Имеем при такой замене переменных f(P3)f(P2) = f(p + g)f(Pi-4)- C4,3) Тогда интеграл столкновений приобретает вид , Pl - q/2, q) [f (p + q) f'(Pl -q)-f (p{) f &)] dpx d». C4,4) Воспользуемся теперь тем, что относительное изменение им- импульса при столкновении q мало и разложим в ряд по степе- степеням q функцию распределения / и вероятность перехода w, удерживая в разложении члены не выше второго порядка ма- малости. При этом получаем дЧ 11 d% 2 dh df) "** W др\дР\ dp\dpk) 2 Подставляя эти выражения в интеграл столкновений, находим В силу четности функции до относительно замены <7->—<7 и не- нечетности подынтегрального выражения в первом интеграле, он обращается в нуль.
758 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Третий интеграл можно преобразовать интегрированием по частям: Поскольку функция распределения быстро уменьшается с ро- ростом аргумента, проинтегрированные члены обращаются в нуль при |pi| -*оо. Подставляя C4,6) в C4,5), находим для интеграла столк- столкновений: ff df f dft\ tdh df \ dp* [tl Ч) "( где введено обозначение: Мы свели интеграл столкновений к дивергенции вектора Д-, представляющего поток в пространстве импульсов. Смысл этого результата становится понятным, если учесть результаты § 10. При изменении переменной, в данном случае импульса, малыми порциями, изменение функции распределения сводится к потоку в соответствующем пространстве, в нашем случае в простран- пространстве импульсов. Кинетическое уравнение приобретает вид df (P, r, t) df (p, r.t) F df(p.r,t) djt +v—w—+m dp ^--^ C4>9) Это уравнение именуется кинетическим уравнением Ландау. Очевидно, что кинетическое уравнение Ландау является част-
§ 34] УРАВНЕНИЕ В ПЛАЗМЕ С УЧЕТОМ СТОЛКНОВЕНИЙ 759 ным случаем уравнения медленных процессов (уравнения Фок- кера — Планка). В данном случае медленным процессом яв- является обмен импульсами между частицами с кулоновским взаимодействием. Дальнейшее упрощение выражения для потока импульса получается, если провести интегрирование по углам. Для этого мы воспользуемся тем, что главную роль играют далекие столкновения, при которых отклонение происходит на малые углы. Введем тензор " ,-^LdQ. C4,10) С помощью этого тензора выражение для /г- можно представить в виде Изменение импульса при отклонении на малые углы было вы- вычислено нами в § 43 ч. I. Если выбрать направление относитель- относительной скорости двух сталкивающихся частиц за ось л:-ов, то имеем очевидно, что J^^ C4,12) где р — прицельный параметр и еи е2 — заряды частиц. В общем случае вектор q можно записать в виде При этом очевидно, что вектор р перпендикулярен к вектору относительной скорости г;0Тн. Пользуясь C4,13), запишем C4,10) в виде l№J^ C4,14) Вероятность столкновения w с рассеянием в угол dQ можно записать в виде wdQ = dw = UqthP dp dqp, C4,15) где ф — азимутальный угол столкновения (угол, определяющий ориентацию вектора р в плоскости, перпендикулярной к век- вектору г;Отн). Учитывая это значение w и C4,14), получаем v0TH
760 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III В выбранной нами системе координат можно, очевидно, на- написать Поэтому для компонент ам получаем окончательно у-. C4,16) Интеграл по прицельным расстояниям логарифмически расхо- расходится как на верхнем, так и на нижнем пределе. Пределы ин- интегрирования— значения параметра ртах и рщщ, — можно определить из следующих соображений: при далеких проле- пролетах, когда р превышает дебаевскую длину lD, заряженные ча- частицы экранированы и практически не взаимодействуют. По- Поэтому МОЖНО ПОЛОЖИТЬ верХНИЙ Предел Ртах —/#• Нижний предел определяется из условия, чтобы углы рас- рассеяния не были слишком велики. Именно, если кинетическая энергия \i °тн велика по сравнению с потенциальной -^-, то отклонения сравнительно малы. Граница области малых отклонений определяется условием е\е2 2 pmin ИЛИ Pmin Таким образом, окончательно аУУ пгг v0TH 1П Следует заметить, что величина, стоящая под логарифмом, очень велика, так что числовое значение самого логарифма не очень чувствительно к определению параметров рШах и рщщ. В произвольной системе координат агл записывают в виде 7 Р°т""°тн aik - 2я (e&f v°Ttt6ik 7 Р°т""°тн In -^. C4,17) уотн Pmin Окончательно получаем df 4-Fk df - ,„ f ; (/-,, pmin V J <TH V */>? dP* C4,18)
§ 35] УСТАНОВЛЕНИЕ РАВНОВЕСИЯ В ПЛАЗМЕ 761 В плазме, всегда состоящей из нескольких сортов частиц, уравнения Ландау следует записать для функции распределе- распределения каждого сорта частиц. Заметим прежде всего, что в состоянии равновесия урав- уравнение Ландау допускает решение в виде распределения Мак- Максвелла f- const e-p'/2m*r, C4,19) Действительно, при подстановке C4,19) в уравнение Ландау его левая часть обращается в нуль. В правой части имеем: V mkT Ясно, однако, что OTH tk OTH V Таким образом, распределение Максвелла является решением уравнения Ландау для случая равновесия. Можно показать, что из уравнения Ландау следует Я-теорема. Поэтому распределе- распределение Максвелла является тем единственным распределением, ко- которое устанавливается в равновесной плазме. Наконец, из урав- уравнения Ландау вытекают уравнения гидродинамики плазмы и могут быть найдены соответствующие кинетические коэффи- коэффициенты. Мы не можем, однако, останавливаться на этих доволь- довольно громоздких вычислениях. § 35. Установление равновесия в электронно-ионной плазме Благодаря существенному различию в массах ионов и элек- электронов электронно-ионная плазма представляет классический пример системы, могущей находиться в состоянии неполного равновесия. Столкновения между ионами приводят к установлению рав- равновесного максвелловского распределения с некоторой темпе- температурой TW за время тг-. Аналогично, за время хе установится равновесное распределение электронов, которым, согласно ска- сказанному в предыдущем параграфе, также служит максвеллов- ское распределение. Однако температура электронов будет иметь другое значение Ке\ причем 7» ^> Г<г#). Плазма с различными температурами ионов и электронов находится в состоянии неполного равновесия. По прошествии
762 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗО& [ГЛ. Ш времени т »т*, те в плазме установится полное равновесие с общей температурой для обоих сортов частиц. Это равновесие устанавливается путем передачи энергии от электронов к ионам. Время релаксации т определяется равен- равенством ^ (° C5,1) где e(t) = Y kTt — средняя энергия ионов и Qie~*i] — поток энергии от электронов к ионам. Очевидно, что dt поскольку функция распределения ионов f<*) не зависит от ко- координат. Согласно C4,9) функция распределения удовлетво- удовлетворяет кинетическому уравнению Интеграл столкновений Д'»п«о, поскольку между ионами су- существует равновесие. Подставляя C5,2) в C5,1) и интегрируя по частям, имеем dp{i)=I «• °dpil)- C5'3) Поток импульса от электронной к ионной компоненте может быть записан, согласно C4,11), в виде df{e)\ (ЗМ) Поскольку f{oe) и fw — равновесные функции распределения с температурами Т{е) и T{i\ находим ^y^. C5,5) Введем относительную скорость
§ 35] УСТАНОВЛЕНИЕ РАВНОВЕСИЯ В ПЛАЗМЕ 763 Тогда ;(е. О = а Не)№ \ v(i) f \ _ от Имеем, однако, a a' ~i>' v2 6Ui — v2 vk =0. fe/ отн — отн отн kj отн отн Поэтому находим * Pmin Поскольку скорость электронов велика по сравнению со ско- скоростями ионов, можно положить v0TH ~ v<*\ Тогда окончательно Н-1) - ^т- ^дагln ^ J W 6fe/(°B(^oifV/> vi'l) dp'e)- Pmin C5,6) Подставляя Дв*l) из C5,6) ц C5,3), получаем Pmin {V ] C5,7) Имеем, очевидно, Кроме того, ввиду сферической симметрии /*п и f<*\ (vfvf) {vfvf) = 0 при кф j. Поэтому окончательно Дальнейшие выкладки сводятся к простому усреднению по распределениям Максвелла ионов и электронов:
764 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [ГЛ. III Итак, или для d& dt de{i) получаем k pmin где время релаксации <r = 3m(/) pmax Pmln
ГЛАВА IV МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯТИВНЫХ ФУНКЦИЙ И ТЕОРИЯ ОНЗАГЕРА § 36. Реакция системы на внешнее динамическое возмущение. Классический расчет До сих пор мы обсуждали только один метод подхода к ре- решению кинетических проблем — метод кинетического уравнения. Сложность основного кинетического уравнения приводит к не- необходимости для фактического решения кинетических задач переходить к уравнению Больцмана для одночастичной функ- функции распределения. Уравнение Больцмана, как мы видели на приведенных при- примерах, а также, как это будет особенно ясно в главе, посвя- посвященной теории твердого тела, является мощным методом исследования неравновесных процессов. Однако оно позволяет получать конкретные результаты только для ограниченного класса систем. В последние годы интенсивно развивается другой метод под- подхода к решению кинетических проблем. В работах этого направления физическую кинетику удалось построить по такой же схеме, что и статистическую физику. Рассмотрим некоторую макроскопическую систему, находя- находящуюся в состоянии статистического равновесия. Равновесные свойства этой системы описываются равновесной матрицей плотности или, в классическом приближении, распределением Гиббса. Предположим теперь, что в момент времени t—*—оо включается некоторое малое возмущение. В принципе существуют два различных класса возмущений. Первый из них связан с наложением на систему внешнего поля сил, например, электрического или магнитного полей, завися- зависящих от времени. Такие возмущения мы будем именовать дина- динамическими. При наложении динамического возмущения полный гамильтониан можно представить в виде
766 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ. IV где H'(t) описывает часть гамильтониана, связанную с дей- действием внешней силы. Таким образом, динамические возмуще- возмущения являются по своей природе микроскопическими. Они изме- изменяют гамильтониан каждой частицы, входящей в систему. Возмущения второго класса, часто именуемые термическими возмущениями, имеют по своей природе макроскопический ха- характер и имеют смысл только по отношению к системе как це- целому или ее макроскопической части. Например, при установле- установлении теплового или диффузионного контакта между телами, со- соответственно с разной температурой или имеющими различный состав, состояния каждого из тел подвергаются возмущению. Однако такое возмущение нельзя связать с изменением гамиль- гамильтониана отдельных частиц. Мы последовательно разберем действие динамических и тер- термических возмущений на равновесную макроскопическую си- систему. При этом вначале мы ограничимся квазиклассическим приближением, а затем проведем квантовый расчет. Оказалось, что все кинетические коэффициенты, а следова- следовательно, и потоки могут быть выражены через одну и ту же ве- величину— временную коррелятивную функцию. Таким образом, временная коррелятивная функция играет в физической кине- кинетике ту же роль, какую в статистической физике играет функ- функция состояний. Итак, рассмотрим некоторую классическую квазизамкнутую систему, характеризующуюся функцией распределения Гиббса Р = Те"№ C61) в состоянии равновесия. Возмущенная функция Гамильтона представится в виде где Я/(О<С^о. Для упрощения выкладок мы положим H' = -A[p(t), ?(*)]¦ 60). Это означает, что в момент времени / = 0 на систему действует некоторый импульс, тогда как при / < О и t > 0 система не подвергается никаким внешним воздействиям. Найдем измене- изменения, вызываемые в системе приложенным малым динамическим возмущением. Изменение функции распределения во времени дается об- общей формулой A5,2) -f- = {#;p}. C6,2)
§ 36] РЕАКЦИЯ НА ВНЕШНЕЕ ВОЗМУЩЕНИЕ 767 Полагая, что возмущенную функцию распределения можно представить в виде ', C6,3) где р' — малая добавка, вызванная возмущением (р'<Сро), находим ^Г = {Я'; ро) + {Яо; р'} = - {А (р, q). б (*); Ро) + (Яо; р'} C6,4) или ^1 = _{Л(р, q); ро}6(О. Интегрируя по времени, получаем р' = р' (- оо) - {А @); ро) = ~{Л @); Ро}, C6,5) где Л@) означает выражение A[p(t), q(t)]y в котором для коор- координат и импульсов частиц берутся их значения в момент t = 0. По определению скобки Пуассона и в силу C6,1) легко найти sa((\\- Л\-\(Л? дР° дЛ дР°\- 1 п\(М.<Ш± дЛ дН<>\ {Л\К))У 9o)-Jj\dq Tp dp dq J-~~ kT ^Zj\dq dp dp dq ) ' Но для любой механической величины, зависящей от координат и импульсов, можно написать Л"" dt 2u\dq dt^ dp dt) Id\dq dp dp dq )' Поэтому получаем окончательно р' = Л@)-?|г. C6,6) Зная изменение функции распределения, можно найти измене- изменение среднего значения любой механической величины, описываю- описывающей макроскопическую подсистему B(t), вызванное возмуще- возмущением (ДВ (*)> = J [В (t) (ро + рО - В (t) ро] dT == = W J А = -W {А @) В Формула C6,7) определяет изменение среднего значения про- произвольной величины В под действием единичного импульса. Обозначим это изменение через фвл и назовем его откликом или функцией реакции системы C6,8)
768 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ IV Тогда C6,7) можно записать в виде (АВ> = J q>BA (t - Г) 6 (П dt'. C6,9) Рассмотрим теперь весьма общий случай, когда возмуще- возмущение, действующее на систему, имеет вид H' — A[p(t)9q(t)]-F(t)9 C6,10) где F(t)— некоторая заданная функция времени. В линейном приближении, т. е. когда возмущение мало, изме- изменение средних значений под влиянием возмущения C6,10) можно рассматривать как наложение импульсных возмущений и вместо C6,9) написать t <Н', C6,11) где отклик срвА,по-прежнему дается формулой C6,8), так что t (АВ) = - -±r J (А @) В (t -1')) F (V) dt'. C6,12) — оо При этом, однако, необходимо, чтобы F(t) удовлетворяло одно- одному весьма общему требованию: F(t->- oo)->0. C6,13) Последнее означает, что до включения возмущения система находилась в состоянии равновесия. Важным частным случаем является случай периодического возмущения. Для того чтобы удовлетворить условию C6,13), можно принять F@ = Relimew+'»'. C6,14) 6-»0 Формула C6,14) определяет функцию, которая является прак- практически периодической при всех значениях времени t, кроме t->—оо, когда она обращается в нуль. При этом из C6,11) по- получаем <AB) = Rex^^, C6,15) где оо %ВА = lim f е-^+^фяд dt'. C6,16) 6-»0 J Последняя величина, представляющая компоненту Фурье от отклика фва, называется обобщенной комплексной восприим- восприимчивостью. Ниже мы убедимся, что это определение восприимчи-
§ 36] РЕАКЦИЯ НА ВНЕШНЕЕ ВОЗМУЩЕНИЕ 769 вости в случае воздействия электрического и магнитного полей совпадает с определением восприимчивости, данным в электро- электродинамике. Полученные соотношения имеют ту же степень общности, что и соотношения классической статистической физики. При малых отклонениях квазизамкнутой системы от состоя- состояния равновесия формула C6,6) определяет изменение ее функции распределения, а формула C6,12) — соответствующее изменение средних значений. Соотношения типа C6,11) являются точными в том смысле, что они не зависят от конкретных физических свойств рассма- рассматриваемой неравновесной системы. Таким образом, формула C6,12) определяет отклонение средних значений величин, ха- характеризующих систему от их равновесных значений при воз- воздействии на нее динамических возмущений. Оказывается, что величиной, характеризующей реакцию системы на динамиче* ское возмущение, является временная коррелятивная функция Фва = С<4 @N@)- Поскольку усреднение в срВА производится по состояниям равновесной системы, формула C6,12) позволяет найти значения средних для неравновесной по характеристике равновесной системы. Коррелятивная функция или, точнее, функция реакции, для рассматриваемых неравновесных систем играет ту же роль, ^что функция распределения для равновесных систем. Однако, и это необходимо иметь в виду, функция распреде- распределения имеет универсальный характер. Наоборот, функция реак- реакции зависит от природы возмущения — величины Л@). Прежде чем перейти к получению формулы C6,12) в кван- квантовой статистике, а также к разбору приложений общей тео- теории, сделаем еще одно замечание о сущности формулы C6,12). Она, как и формулы для вычисления средних в статистике, имеет смысл только для достаточно больших систем (N —»оо> N У->оо, ——конечно). Кроме того, время t необходимо счи- считать как угодно большим, т. е. знать реакцию системы на возмущение после его включения за достаточно большое время. Функция фба инвариантна относительно замены ?-* (—t): поскольку B(t) = В (—t). Наоборот, \АВ) при достаточно больших временах не инва- инвариантна относительно этой замены. Это очевидно из простого физического рассуждения. Если t* — время, прошедшее после 25 В. Г. Левич и др., том II
770 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ. IV включения возмущения, a t>t*, то {В(—t))—реакция системы на возмущение, которое еще на нее не действовало! Таким образом, выражение для (Д5) оказывается необрати- необратимым при достаточно больших временах и для достаточно боль- больших систем. Полученные соотношения можно переписать в более удоб- удобном виде, если воспользоваться условием ?(A@)B(t))-(±(A@)B{0)))-0. C6,17) Последнее означает, что средняя равновесная скорость измене- изменения корреляции двух произвольных величин равна нулю. Это условие выражает стационарный характер рассматриваемых процессов. С учетом C6,17) можно написать j!r C6,18) и, соответственно, t <ЛБ)=-^г j(A(O)B(t-t'))F(t')dt'. C6,19) —оо Преобразуем формулу C6,19) по Фурье. Обозначим оо /=»= I F {t)e~Mdt, о ОО </(©)> = J(AB) е- шйг = о t № = - JL ^dt'-F it') J (A @) В (t - Г)) е~ш dt = -зо 0 оо оо = - -~- U du {A @) В (и)) F(t-u) е-ш«-и)е-ш dtm о о Тогда C6,19) можно представить в виде (/@)) = Y(co)/7@), C6,20) где у((д) имеет вид оо Y («,) = _ -L J е-1»» (А @) В (и)) du. C6,21)
§ 37] РЕАКЦИЯ НА ВНЕШНЕЕ ДИНАМИЧЕСКОЕ ВОЗМУЩЕНИЕ 771 Формула C6,20) определяет обобщенный коэффициент пере- переноса, связывающий фурье-компоненты обобщенной «силы» F и вызываемые ею изменения величины В. Естественно назвать /(со) обобщенным потоком, отвечаю- отвечающим «силе» /''(со). Средний поток (/(со)) оказывается связан- связанным с «силой» F(co) соотношением, которое является обобще- обобщением хорошо известных из электродинамики эмпирических соотношений — закона Ома, диэлектрической и магнитной вос- восприимчивости и т. п. В § 39 мы убеди-мся в полной тождественности этих выра- выражений. Формула C6,21) допускает непосредственное обобщение на случай векторных сил или нескольких сил, действующих на си- систему. Можно при этом сразу написать вместо C6,21) равенство <4(<u)> = Y(-ft(<o)/M<o), где I, k пробегает соответствующий ряд значений (например, ж, у, z или &=1, 2, 3, ...). Тензор у*л называется тензором коэффициентов переноса оо Y« (ш) = - -±г J *"'•" (А, @) Вк (и)) du. 0 § 37. Реакция системы на внешнее динамическое возмущение. Квантовый расчет Рассмотрим теперь реакцию системы на внешнее динамиче- динамическое возмущение с помощью квантового уравнения для матрицы плотности B,3). Пусть некоторая квантовомеханическая система, описываемая матрицей плотности р, находится в термостате и подвергается действию произвольного внешнего поля U(t), зависящего от вре- времени. Мы будем считать внешнее поле достаточно слабым, чтобы его можно было считать малым возмущением. Кроме того, бу- будем считать, что приложенное поле удовлетворяет требованию С/@-»0 при *-*-оо. C7,1) Напишем прежде всего уравнение для статистического опе- оператора в отсутствие внешнего поля: 1Ъ&- + [рН]-0. C7,2) Уравнение для статистического оператора при наложении внешнего поля U(t) будет иметь вид f H + U(t)] = Q. C7,3) 25*
772 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ. IV От уравнения C7,3) удобно перейти к интегральному уравне- уравнению. Для этого будем считать член [р, U] известной величи- величиной. Тогда формально C7,3) будет представлять линейное неоднородное уравнение первого порядка относительно функ- функции р. Если дополнить это уравнение начальным условием: C7,4) то решение можно сразу написать в виде Ро + y J iH-(t-x) h [р (*), U (х)] е * dx. C7,5) Непосредственной постановкой можно убедиться, что C7,5) удовлетворяет уравнению C7,3) и начальному условию C7,4). Интегральное уравнение C7,5) содержит малое возмущение и может решаться итерациями (последовательными приближе- приближениями). Полагая Р = Ро + р' + р" + ..., C7,6) имеем И')—у \e h [ро, U(x)]e h dx = oa IHt' IHt' e b [p0> U{t-t'))e " df, C7,7) 0 где было положено V = / — x. Последующие поправки р", р7//, ... могут быть получены ана- аналогичным образом. Формула C7,7) дает ответ на поставленную задачу в пер- первом приближении. Она представляет квантовое обобщение классической формулы C6,6). Изменение среднего значения любой величины, описываемой оператором В, согласно A,8) имеет вид <AB) = Sp(p, B)-Sp(p0, B) = оо = Т J е~тШ' SP fPo* U С - V)\ eijhm' dtf. C7,8) о Формула C7,8) представляет общее выражение для отклика системы на малое динамическое возмущение. Она является при-
§ 38] РЕАКЦИЯ СИСТЕМЫ НА ТЕРМИЧЕСКОЕ ВОЗМУЩЕНИЕ 773 ближенной в том смысле, что учитывается лишь возмущение первого порядка малости. Однако в остальном она применима к совершенно произволь- произвольным системам при любом взаимодействии между образующими ее частицами. В отличие от кинетического уравнения, формула C7,8) дает амплитуду вероятности, т. е. содержит как диагональные, так и недиагональные матричные элементы матрицы плотности. § 38. Реакция системы на термическое возмущение Более сложным является вопрос о реакции системы на тер- термическое возмущение, которое не имеет характера внешнего по- поля, действующего на систему. Поскольку действие термического возмущения нельзя представить в виде дополнительного члена в функции Гамильтона отдельной частицы, предыдущие расчеты к этому случаю неприменимы. Оказывается, однако, что при из- известных ограничениях для термических возмущений можно полу- получить закон линейной реакции типа C6,6). Рассмотрим некоторую макроскопическую систему, находя- находящуюся в неравновесном состоянии. Будем характеризовать со- состояние этой системы совокупностью макроскопических пара- параметров Х{. Значение этих параметров будем отсчитывать от их равновесных значений, приняв последние за нуль. В неравновесной системе значения параметров Х\ будут из- изменяться во времени, так что х\ Ф 0. Мы ограничимся такими неравновесными системами, которые находятся в состояниях, до- достаточно близких к равновесным. Это значит, что параметры х{ можно считать малыми величинами. Введем в рассмотрение шкалу времен Tmicro <t< Тщасго. Здесь Tmicro — времена микроскопического масштаба, характери- характеризующие изменение состояния микроскопических частей системы, Tmacro — времена макроскопического масштаба, за которые в си- системе устанавливается состояние полного статистического равновесия. В основу дальнейшего будет положена гипотеза о существо- существовании в системе локального статистического равновесия, которое устанавливается за промежуточное время порядка т. Система, находящаяся в состоянии локального статистиче- статистического равновесия, описывается функцией распределения р1ос, имеющий вид локального распределения ГибЬса; ?{р.
774 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ. IV Параметры Хи являющиеся функциями времени, изменяются за времена порядка t ~ ттаСго и при t« ттасго обращаются в нуль. При этом при ploc _+ р^? где ре<* — равновесное распределение Гиббса. Поскольку Хг малы, в локально-равновесном распределении Гиббса они берутся при значении t Ф 0. Средние значения параметров Х{ могу*г быть вычислены по обычным формулам 5? dT = - kT ^-. C8,2) Локальное распределение Гиббса не может быть выведено из каких-либо общих положений теории. Его следует рассматри- рассматривать как некоторую гипотезу. Справедливость этой гипотезы подтверждается многочисленными опытными фактами. Неудов- Неудовлетворенность, которая возникает при такой постановке вопроса, может быть, будет несколько ослаблена напоминанием того факта, что и равновесное распределение Гиббса также является до известной степени гипотезой, хотя и весьма обоснованной и подкрепленной многочисленными убедительными соображе- соображениями. Параметры Лг\ сопряженные хи также изменяются за вре- времена t /^/ T^macro* Локально-равновесное распределение Гиббса позволяет опре- определить среднюю энергию и энтропию системы (ср. §21 и 24 ч. III) ^^ C8,3) ^r. C8,4) Энтропия является функцией параметров Х\. В состоянии равно- равновесия, когда Хг = 0, т. е. за времена порядка ттаСго, энтропия достигает максимального значения, S@) = -§r + \nZ. C8,5) Формула C8,4) позволяет выразить параметры Л» через S(xi). Удобно вместо Лг- ввести величины *< = $•• C8,6) Таким образом S fo) = — + In Z - XiX{. C8,7)
§ 38] РЕАКЦИЯ СИСТЕМЫ НА ТЕРМИЧЕСКОЕ ВОЗМУЩЕНИЕ 775 Параметры Хи а также средние значения хи мы будем счи- считать изменяющимися за времена t ~ т.Пасг0. Состоянию статисти- статистического равновесия отвечают значения Х{ = 0. Распределение Гиббса, средняя энергия и энтропия систе- системы изменяются во времени. Однако, как видно из определе- определения ^38,3), характерное время изменения этих величин поряд- порядка Ттасго^ Формула C8,7) позволяет выразить параметры Хг- через S: Хг=-к^-г C8,8) Приняв локальное распределение Гиббса, характеризующее со- состояние системы при t = 0, можно проследить за ее эволюцией во времени. При этом мы ограничимся временами t <С ттасг0. Эволюцию системы можно характеризовать величиной Л W-if, C8,9) представляющей среднюю скорость изменения параметра Х{. Пользуясь C8,1), находим It&)*t (t) pIoc @) dT = i- j xt (t) e и1 dT. Поскольку параметры лгг- считаются малыми, можно в первом приближении написать Eip, д) kT dT- (*t (t)) - sf S Aft @) (xk @) xk (t)) = (xt (t)) - 2 Xk @) (^ @) if @>. В состоянии равновесия, очевидно Преобразуем далее среднее значение: о о = (хк @) - J *к (о) rfa, ^ @)) = <^ft @) xt @)) - J (xt @) ^ (a)) rfa. -/ -/ В начальный момент времени значения параметров #г@) и скоростей их изменения xi{0) независимы друг от друга. Поэто- Поэтому их корреляция обращается в нуль:
776 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ТЛ IV Следовательно о t (*i @) Ч (t)) = - J <*, @) хк (a)) da = + J <i, @) xk (o)> da, C8,10) -* о откуда А@)^2/^А@. C8,11) Замена Xk(Q) на Xfe(/) возможна потому, что термодинами- термодинамические силы изменяются за время ~ттасго> тогда как в фор- формуле C8,11) время t ограничено неравенством * ^ч tmacro» Через Lik обозначены величины t Lik = Lu = J (xt @) *ft (a)) da. C8,12) 0 Мы видим, что отклик реакции на термодинамическое возмуще- возмущение выражается линейным законом. Термодинамические силы Xk и вызывают термодинамические потоки U. Коэффициенты Lik являются, таким образом, кинетическими коэффициентами. Воз- Возникающие потоки характеризуются совокупностью симметрич- симметричных кинетических коэффициентов L^. Последние определяются коррелятивными функциями, взя- взятыми по равновесному состоянию системы. Эта связь имеет совершенно общий характер и в этом смысле временные кор- коррелятивные функции являются основными характеристиками кинетических процессов в неравновесных системах. В виде примера рассмотрим коэффициент диффузии. По определению, ^f. C8,13) Представим смещение Д/? в виде At Д«= J vdt. о Тогда А<-»° 6 6 J dt" J D = Iim W J dt" J dt'v (//) v Среднее значение от скоростей не зависит от начала отсчета вре- времени. Поэтому можно написать v {Г) v {Г) = v@)v {Г - Г). C8,15)
§39] ВЫЧИСЛЕНИЕ КИНЕТИЧЕСКИХ КОЭФФИЦИЕНТОВ 777 Подставляя C8,15) в C8,14), и выполняя одно интегрирова- интегрирование непосредственно, находим м D= lim 4 f (l --Tr){v@)v(t"))dt7'. C8,16) 0 Если интервал At макроскопически мал, но все же велик по сравнению с характерными временами молекулярных процессов, то C8,16) можно представить в виде D ~ lim 11 dt" (v @) v (П). C8,17) § 39. Вычисление кинетических коэффициентов и связь с уравнением Больцмана Общее выражение для отклика системы на динамическое воз- возмущение, найденное в предыдущем параграфе, позволяет в прин- принципе находить любые кинетические коэффициенты при малых возмущениях системы. Мы в виде примера ограничимся расче- расчетом действия электрического поля, т. е. расчетом электропровод- электропроводности !). При этом мы рассмотрим квазигазовую систему — совокуп- совокупность заряженных частиц, не взаимодействующих между собой (частицы первого сорта) и частиц второго сорта, состояние ко- которых не изменяется под действием электрического поля. На- Например, частицы второго сорта могут быть нейтральными или заряженными, но слишком тяжелыми, чтобы их состояние воз- возмущалось слабым полем. Они могут быть заряженными и образовывать кристаллическую решетку, на состояние которой также не влияет слабое поле и т. п. Подобные системы мы уже рассматривали выше с помощью уравнения Больцмана (см., например § 28). Однако и это следует особо подчеркнуть, сейчас мы не предполагаем взаимодействие между частицами первого и второго сорта слабым. Наоборот, оно может быть как угодно сильным и описываться любым законом. Оператор Гамильтона, входящий в формулы предыду- предыдущего параграфа, включает в себя это взаимодействие. Совокуп- Совокупность всех частиц первого и второго сорта образует макроскопи- макроскопическую подсистему, которая, как целое, испытывает слабое взаи- взаимодействие с окружающим ее термостатом. См. М. Lax, Phys. Rev. 109, p. 1921 A958).
778 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ. IV Будем считать, что на подсистему действует однородное электрическое поле Е= ПтЕоешеш. а-»0 Тогда слагаемое U в полном гамильтониане приобретает вид U (/) = - lim еЕогешеа*. C9,1) <х->0 Подставляя C9,1) в C7,7), получаем оо у (/) = - -g- eEQ J eate-int'/h [p0, r] ^bra«.n о Переходя к пределу а->0, имеем а//А — оТ? otot 0—iHt'lh\z -1 olHt4ho—i<ul Af /QQ O\ p ^?/— *-^JSoc с ipo> /J 6? 6? at . ^oy,Zj 0 Пользуясь операторами в импульсном представлении, имеем LPo> rJ = Рог — ^Ро== 1" 1 Ро ^ ^Г" Ро I = "" "^Г" > w">«; откуда оо ¦'^'Л'. C9,4) Электрический ток можно записать в виде / = neSp(vp'). C9,6) Значение шпура не зависит от выбора представления. Выберем такое представление, в котором оператор скорости является диагональным. Тогда выражение для тока можно написать в виде 1 = nejv(v\{>'\v)dv9 C9,6) где матрица (v\p'\ v) дается формулой оо (v | р-' |„) = _ JL Ефш - (v | J е-ш'е~1"т -^ eiSt'lh dt' \ v) = о X {V | е1"т | г») Л' dv' dv". C9,7)
§ 39] ВЫЧИСЛЕНИЕ КИНЕТИЧЕСКИХ КОЭФФИЦИЕНТОВ 779 Таким образом, электропроводность имеет вид оо а = " Щг \ e~M'dt'\ vdv\ dv' J dv" X X (v | e-™rlh | v') (v' | |?l1 v") {v" |e-'&v* | v). C9,8) Полученное выражение имеет столь же общий характер, как и формула C9,2) для изменения матрицы плотности. Оно содер- содержит как диагональные (vf = v"), так и недиагональные матрич- матричные элементы (v' Ф v") равновесной матрицы плотности р0. Поэтому формула C9,8) обладает широкой областью примени- применимости. Так, например, эта формула определяет электропроводность жидкого металла или проводника весьма сильно легированного примесями, когда приближение уравнения Больцмана недоста- недостаточно. Весьма важно сравнить теорию реакции на внешнее динами- динамическое возмущение, основанную на точном уравнении для мат- матрицы плотности с кинетическим уравнением Больцмана. Для этого проще всего сравнить найденный нами кинетиче- кинетический коэффициент — электропроводность C9,8) с аналогичным выражением, полученным при помощи уравнения Больцмана. Для этого сделаем дальнейшее ограничение общности фор- формулы C9,8). Именно, предположим, что взаимодействие заря- заряженных частиц (частиц первого сорта) с частицами второго сор- сорта является слабым. Это значит, что в первом приближении систему заряженных частиц можно считать идеальным газом. Матрица плотности р0 может быть при этом применена к от- отдельной частице, если положить П 11 трг* C9>9) где в #о не включено взаимодействие данной частицы со всеми остальными частицами первого и второго сорта. При этом в ^-представлении, в котором записано выражение C9,9), матрица плотности р0 диагональна. Поэтому ^ ^,'') C9,10)
780 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ IV и соответственно оо а = - -^- J e~m'dt' j vdvj dv'X о X | (v | e-'&'''A 11>'> (v' | !??-1»"> <i>" | ег"«"й | v) dv" = oo о oo = --^ J е-'»' dt'jvdvjw (v9 v\ f) -^1 rftK, C9,11) о где обозначено v e h v'/\. C9,12) Очевидно, что W(v, v', t) представляет вероятность того, что ча- частица, имевшая в момент времени / = 0 скорость г>, за время t приобретает скорость v\ Сравним полученное выражение с общим решением уравнения Больцмана B8,7) во внешнем поле сил. Это сравнение позволяет убедиться в их полной тождествен- тождественности, если только заменить ро на /о- По своему смыслу матрица плотности свободной частицы р0 действительно совпадает с од- ночастичной функцией распределения. Мы видим, таким образом, что уравнение Больцмана для однородных квазигазовых систем действительно следует из точ- точного уравнения для матрицы плотности. Приведенные выше рассуждения допускают обобщение на системы взаимодействующих между собой частиц. Однако на этом мы не можем здесь останавливаться1). § 40. Теория Онзагера При малых отклонениях от состояния равновесия можно по- получить описание неравновесных процессов в замкнутой системе, исходя из весьма общих соображений, впервые высказанных Онзагером. Будем характеризовать состояние замкнутой систе- х) См. сборник «Вопросы квантовой теории необратимых процессов», ИЛ, 1961 (в особенности статью М. Лэкса) и «Термодинамика необратимых про- процессов», ИЛ, 1962.
§ 40] ТЕОРИЯ ОНЗАГЕРА 781 мы некоторыми макроскопическими параметрами Х\. Эти пара- параметры являются функциями времени. При малых отклонениях от состояния равновесия параметры, характеризующие ее состояние, можно считать имеющими тер- термодинамический смысл. Иными словами, под х{ следует пони- понимать разность между значениями термодинамических величин в данном неравновесном состоянии и в состоянии равновесия. Напомним, что в состоянии равновесия все термодинамические величины имеют значения, равные своим средним. Совершенно ясно, что при больших отклонениях от состоя- состояния равновесия термодинамические понятия теряют смысл. Од- Однако, как мы видели выше, при малых отклонениях от равнове- равновесия можно пользоваться термодинамическими величинами, ко- которые при этом не равны своим средним значениям. Для этого необходимо лишь, чтобы существовало неполное локальное рав- равновесие в каждой точке тела. При малых значениях х\ все вели- величины, характеризующие состояние системы и скорость его изме- изменения, могут быть разложены в ряд по степеням хг. В этих рядах следует удержать лишь первые члены, так что можно записать D0,1) *-, D0,2) D0,3) Формула D0,1) показывает, что все процессы вблизи состояния равновесия являются медленными. Энтропия системы в нерав- неравновесном состоянии выражается квадратичной формой, причем из условия D0,2) следует, что Возникновение энтропии 5 в единицу времени также мало. Оче- Очевидно, что все приведенные формулы могут применяться к из- изменениям состояния системы за ограниченные времена L Имен- Именно, с одной стороны, эти времена должны быть весьма велики по сравнению с микроскопическими временами, Тщюго, для того, чтобы можно было говорить о изменении макроскопических ве- величин. С другой стороны, система должна находиться в нерав- неравновесном состоянии. Если полное равновесие устанавливается в ней за время релаксации Tmicn» то должно выполняться нера- неравенство Обозначим через 1\ поток /' —
782 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ. IV и через Х\ так называемую термодинамическую силу у'.— dS — Xi-~~~~dTi- "ft***- Тогда предыдущие соотношения можно представить в виде l'{ = aikxk = -atfiJ^Xfk = Y/^I, D0, Г) S = S0+|x;*., D0,20 5 = /JzJ. D0,30 В основу дальнейшего рассмотрения будет положена следую- следующая гипотеза Онзагера: макроскопическое неравновесное со- состояние вблизи равновесия можно рассматривать как некоторую флуктуацию. Изменение во времени состояний макроскопиче- макроскопической неравновесной системы и микроскопической системы, испы- испытавшей флуктуацию, происходят по одинаковым законам. Пусть, например, в макроскопической системе создано неравномерное распределение концентрации и температуры. При этом в системе возникнут потоки, описывающиеся макроскопическими соответ- соответствующими законами переноса. Если в равновесной системе про- происходит флуктуация концентрации или температуры, в резуль- результате которых создается такое же распределение концентраций и температур, то согласно гипотезе Онзагера эти флуктуации бу- будут рассасываться по тем же законам, по каким происходит вы- выравнивание концентрации или температур в неравновесной ма- макроскопической системе. Потоки частиц и температур будут определяться законами диффузии и теплопроводности независимо от того, как возникли соответствующие разности концентраций и температур, в ре- результате самопроизвольной флуктуации в равновесной системе или в результате внешних воздействий, которые перевели систе- систему в неравновесное состояние. Таким образом, согласно гипотезе Онзагера, соотношение между потоками и силами, т. е. макроскопический закон It = %LikXk, D0,4) в равной мере применим к неравновесным системам и к процес- процессам рассасывания флуктуации. Средние макроскопические по- потоки и силы U и Х{ получаются усреднением 1\ и Х\, а коэффи- коэффициенты Lik и ytk совпадают. Оказывается, что кинетические коэффициенты Lih могут быть выражены через временную коррелятивную функцию. На осно- основании гипотезы Онзагера можно написать D0,5)
§40] ТЕОРИЯ ОНЗАГЕРА 783 Умножим D0,5) на х\@), так что Введем теперь в рассмотрение совокупность (ансамбль) иден- идентичных систем, отличающихся заданными начальными значе- значениями параметров Х{@). Обозначим среднее по этому ансамблю скобками ( ). Тогда находим « Lik (xt @) Xk (/)). D0,7) Совокупность равновесных замкнутых систем в начальный мо- момент времени образует гиббсовский ансамбль. Для этого ан- ансамбля можно написать распределение вероятностей в виде w(хи ..., Xi .. .)dxx ... dxN = Ce k dxx... d%. D0,8) Тогда средние значения входящих в формулу D0,7) величин можно записать в виде dx~Jt) AlS ) Щ dxx...dxt... dxN и соответственно (xi @) Хк (/)> = С J ^ @) Xfe (/) efe d^ ... dxN. D0,9) Необходимо подчеркнуть, что тем самым проблема определе- определения средних в неравновесной системе, для которой неизвестно распределение вероятностей, благодаря гипотезе Онзагера ока- оказывается сведенной к проблеме вычисления ансамбля средних для гиббсовского ансамбля замкнутых систем с распределением вероятностей, даваемых формулой D0,8). Пользуясь квазиэргодической гипотезой, можно написать Тогда D0,7) запишется в виде <*i @) хг (/)) = Lih <*, @) Xk (/)). D0,10) Левую часть D0,10) преобразуем так же, как это было сделано в предыдущем параграфе [ср. C8,10)]: i @) *, (/)> = <*, (- /) it @)) = <^0) +j*t (a) da, xt @)) = о t t = (xi @) *{ @)} + ( J i, (a) i, @) d (a)) = ( J if @)*, (a) da). D0,11)
784 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ. IV Правую часть можно преобразовать следующим образом: по- поскольку средняя сила изменяется за времена t ~ ттаСго, тогда как мы рассматриваем эволюцию системы за времена t <C ттасг0, можно приближенно написать Нашей задачей является нахождение среднего (Q)^-). D0,12) Для вычисления среднего мы можем на основании гипотезы Онзагера воспользоваться распределением Гиббса Интеграл по х^ можно взять по частям дх @) -А? *к J поскольку подынтегральная функция на пределах быстро стре- стремится к нулю. Таким образом, окончательно D0,13) Подставляя D0,12) и D0,13) в D0,7), находим t Мы видим, что гипотеза Онзагера приводит к точно такому же выражению для кинетических коэффициентов, что и гипотеза ло- локального распределения Гиббса [ср. C8,12)]. Это доказывает эквивалентность обеих гипотез. Симметрия кинетических коэффициентов L^ = Lhi имеет глу- глубокий смысл. Если в системе изменяются, например, два пара- параметра и возникают два потока, то из свойства симметрии сле- следует Ix = LnXx + LX2X2, D0,14) I2 = L22X2 + Ll2Xl. D0,15) Формулы D0,14), D0,15) показывают, что сила Хх дает вклад в поток /г, а сила Х2 — такой же вклад в поток h. Обобщение на большое число сил и потоков не вызывает за- затруднений.
§ 41] СЛЕДСТВИЯ ИЗ СООТНОШЕНИЙ ОНЗАГЕРА 785 В физике известно множество таких перекрестных потоков. В виде примера можно указать термодиффузию и обратный ей эффект возникновения температурного градиента при механиче- механическом перемешивании газов с одинаковой температурой. Другие примеры будут даны ниже. Соотношение симметрии позволяет установить общую связь между такими перекрестными процессами. Использование соот- соотношения симметрии позволило описать множество связанных эффектов. Согласие теории с опытными данными следует счи- считать убедительным доказательством гипотезы Онзагера. § 41. Следствия из соотношений Онзагера Заметим прежде всего, что принцип Онзагера может быть получен из гипотезы Онзагера на основе общей теории флуктуа- флуктуации. Ввиду важности этого принципа мы приведем и этот более обычный вывод. Согласно принципу микроскопической обратимости, флуктуа- флуктуации в замкнутой системе обратимы во времени, так что для кор- коррелятивной функции можно написать С другой стороны, изменяя начало отсчета времени в правой ча- части, можно написать Здесь символ ( ) означает усреднение по ансамблю. Усред- Усредняя еще раз по времени т, имеем Поскольку оба усреднения независимы и равноправны, вы- вычитая из этого равенства (xi(t)xk(t)), имеем <*/(О, xk(t + r) -^Л0> = (xk(t)y Разделив на т и переходя к пределу т->0, имеем На основании гипотезы Онзагера для флуктуации, так же как и для макроскопических процессов, имеет место соотношение D0,5). Его подстановка в последнее равенство дает (хь LkiXt) = (xki LHXi). Но согласно D0,13) имеем (*Дг) = би, (*Л) = &ии так что предыдущее равенство сводится к
786 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ. IV откуда В этом выводе доказательства принципа симметрии кинетиче- кинетических коэффициентов использованы только принцип микроскопи- микроскопической обратимости и гипотеза Онзагера [формулы D0,5) и D0,13)]. Однако смысл коэффициентов при этом остается не раскрытым. При выводе принципа Онзагера мы фактически предполагали, что система не находится в магнитном поле и не вращается. Действительно, если система находится в магнитном поле, то при изменении знака времени т->-—т имеет место ра- равенство Для выполнения принципа микроскопической обратимости сила Лоренца не должна изменять свой знак. Поэтому при обраще- обращении времени в магнитном поле имеет место равенство Точно то же самое относится к угловой скорости вращающегося тела. Повторяя предыдущие выкладки, можно без труда полу- получить, что принцип Онзагера гласит Последнее равенство имеет место всегда, если два параметра, Ял и xh таковы, что при обращении знака времени один из них из- изменяет свой знак, а другой не изменяет. Теперь мы разберем некоторые следствия, вытекающие из симметрии кинетических коэффициентов. Анализ этих следствий составляет основное содержание термодинамики необратимых процессов. Мы покажем, что из соотношений Онзагера можно получить как выводы совершенно общего характера, так и ре- результаты более практического свойства. Последние заключаются главным образом^в установлении связей между различными не- неравновесными процессами. Мы начнем с некоторых общих следствий. К ним прежде все- всего следует отнести так называемый принцип минимального воз- возникновения энтропии. Рассмотрим стационарные неравновесные процессы в некото- некоторой замкнутой системе. При стационарных процессах все функ- функции состояния системы не зависят от времени явно. Оказывает- Оказывается, что при стационарных процессах производство энтропии имеет минимальное значение. Чтобы не усложнять формул при доказательстве этого утверждения, мы ограничимся случаем двух перекрестных процессов. Производство энтропии в теле
§ 41] СЛЕДСТВИЯ ИЗ СООТНОШЕНИЙ ОНЗАГЕРА 787 можно записать в виде Р= J SdV- J lkXkdV-\ ^LikXtXkdV = = J [LnX\ + LX2XXX2 + L21X1X2 + L22XI} dV = = J {LxXX\ + 2Lx2XxX2 + L22$ldV. D1,1) Варьируемыми величинами являются силы ^ = V у и J2 = V-?, обращающиеся в нуль в состоянии равновесия. Условие минимума производства энтропии гласит: 6Р = 6 J SdV = 0. D1,2) Вычисление вариации дает ИЛИ div{Lugrad^~L12grad(f)} = 0, D1,3) 0. D1,4) Формулы D1,3) и D1,4) выражают условия стационарности. Таким образом, в стационарном состоянии производство энтропии имеет минимальное значение. Подчеркнем, что знаки в условиях симметрии существенны. Поэтому приведенное доказательство не имеет места в магнит- магнитном поле. Из других общих следствий теории Онзагера укажем на до- доказательство существования диссипативной функции для меха- механических систем, совершающих медленное движение. К уравне- уравнению движения следует добавить слагаемые силы Xk, которые при малых скоростях можно разложить в ряд и ограничиться первым членом разложения **-Mi- D1,5) Согласно D0,2) тензор Р/а является симметричным:
788 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ. IV Нулевой член в разложении отсутствует, поскольку в состоянии покоя на систему не действуют диссипативные силы. Таким образом, обобщенное уравнение движения имеет вид В силу симметрии Р/& последнее равенство можно представить в виде где обозначено D1,7) Квадратичная форма f представляет диссипативную функцию. Обычно в механике существование диссипативной функции не доказывается. Между тем если бы на систему действовало не- несколько сил трения, без принципа симметрии невозможно было бы ввести диссипативную функцию. Точно так же не существует какого-либо аналога диссипативной функции при движении в магнитном поле: хотя в этом случае сила также пропорциональ- пропорциональна скорости, тензор р^ является антисимметричным. § 42. Неравновесные процессы в однокомпонентной системе Мы подробно разберем теорию неравновесных процессов в однокомпонентной системе, чтобы пояснить метод нахождения термодинамических сил и потоков и использования соотношений Онзагера. Характер полученных результатов позволит яснее по- понять достоинства и недостатки термодинамики необратимых про- процессов. Рассмотрим однокомпонентную замкнутую- систему, со- состоящую из двух подсистем с разными (хотя и близкими) тем- температурами Т\ и Г2, давлениями р\ и /?2> внутренними энергиями Е\ и Е2 и числами частиц Ni и N2 в единице объема. Допустим, что обмен энергиями и частицами между подсистемами происхо- происходит без появления гидродинамических потоков. Для этого, на- например, обмен должен осуществляться через пористую пере- перегородку. Пусть 8Е{ и 8Nt — изменения энергии и числа частиц одной из подсистем (i = 1,2). Тогда изменение энтропии dE Nl
§ 42] НЕРАВНОВЕСНЫЕ ПРОЦЕССЫ В ОДНОКОМПОНЕНТНОЙ СИСТЕМЕ 789 Полное изменение энтропии замкнутой системы равно -тЬйг (т)<№- ж (т) Линейные члены выпали благодаря законам сохранения энергии и числа частиц, а также условиям равновесия в нулевом при- приближении по AT и Д[х. Возникновение энтропии согласно D1,1) равно С другой стороны, в силу D0,3х) можно написать 6S = 1е% где 1е и In — потоки энергии и частиц, а ХЕ и Xn — соответ- соответствующие термодинамические силы. Поэтому находим D2,1) D2,2) где v и h — объем и энтальпия, отнесенные на одну частицу. Со- Согласно D0,4) и учитывая симметрию кинетических коэффициен- коэффициентов, можно представить поток в виде 1е = ЬцХЕ + Ll2XNi IN = Ll2XE + L22XM. Подставляя значение сил, находим ^ бр, D2,3) IN = L22h~Ln ЬТ-±f- 6p. D2,4) Здесь 6Г и 8р означают изменения энергии и давления при пе- переходе от одной подсистемы к другой: 6Т=Т1- Т2\ др = р{- р2. Очевидно, что все рассмотрение имеет смысл только для малых значений 6Г и бр. Перенос энергии и частиц приводит к появле- появлению перекрестных эффектов, характеризуемых кинетическим ко- коэффициентом Li2. Важным случаем процесса является процесс переноса энергии без переноса частиц.
790 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ. IV При этом формула D2,4) показывает, что в стационарном состоянии между подсистемами устанавливаются разности да- давлений и температур, связанные между собой соотношением 6р= 6T D2>5) Формула D2,5) определяет так называемое термомолекулярное давление. В другом важном частном случае, когда разность тем- температур 6Г = 0, формула D2,3) показывает, что между подси- подсистемами течет поток энергии h = - ^f- *Р = т^ h = E*IN. D2,6) Этот эффект, именуемый термомеханическим, показывает, что вместе с частицами переносится и некоторая энергия ?*. С помощью D2,6) можно написать бр = ^1бГ. D2,7) Формулы D2,5) — D2,7) по своему характеру идентичны термо- термодинамическим соотношениям. Они устанавливают весьма общие и часто не очевидные связи между процессами и характеризую- характеризующими измеряемыми величинами — в данном случае 8р, 8Т и Е*. Однако значения этих величин должны определяться из опыта или вычисляться по формулам кинетической теории. В частно- частности, значение Е* может быть без труда вычислено для идеаль- идеального газа. Легко сообразить, что для идеального газа Е* = ft, так что в этом случае Ьр = 0 при 6Г =?0. Для систем, у которых значение Е* рассчитать невозможно, оно должно быть определено экспериментально. Опыт полностью подтверждает соотношение D2,5). Заметим еще, что проведенное нами определение сил и потоков является неоднозначным. Ясно, что выражение In может быть разложено на Х{ не только так, как это было сделано в формулах D2,3) — D2,5), но и другими способами. Можно без труда показать1), что это не повлияет на конечные формулы, в частности, на D2,7). § 43. Неравновесные процессы в многокомпонентных системах (диффузия и термодиффузия) В качестве второго примера рассмотрим явление термодиф- термодиффузии. В отличие от предыдущего примера, мы должны теперь рассматривать многокомпонентную систему, свойства которой зависят от пространственных координат. Мы ограничимся слу- 1) См. С. Де Гроот, «Термодинамика необратимых процессов», М., 1956. В своем изложении термодинамики необратимых процессов мы следуем этой монографии.
§ 43] НЕРАВНОВЕСНЫЕ ПРОЦЕССЫ В МНОГОКОМПОНЕНТНЫХ СИСТЕМАХ 791 чаем химически не реагирующих компонент и для простоты формул будем считать смесь двухкомпонентной и изотропной. Если в системе имеются градиенты температур и концентраций, в ней возникают потоки тепла, диффузии и перекрестный по- поток — термодиффузия. Мы рассмотрели в § 25 термодиффузию в случае смеси иде- идеальных газов. Сравнение результатов расчетов с помощью кине- кинетической теории газов и теории необратимых процессов является поучительным. Воспользуемся определением сил и потоков по формулам D0,14) и D0,15). Подчеркнем, что, в отличие от первого примера, в системе с непрерывно изменяющимися в пространстве свойствами дви- движение частиц всегда сопровождается появлением потока массы. Полный поток массы должен быть равен нулю в стационарном состоянии системы. Пусть /i и h — потоки обеих компонент *1 == -^11^1 ~t" -^12^2 ~t" Lu?Xe> 12 = L>2\X\ ~t" L22X2 + ЪчеЛ-Еч где силы Х\, Хг и ХЕ даются формулами, тождественными с D2,1) — D2,2) для каждой компоненты: Xt = grad -^-, ХЕ = grad у. Равенство при произвольных значениях сил дает ^11 = — ^21> ^12 = —^22^ <^1? Поэтому Л = - h = - Ln grad (?l=?l) + LlE grad | Из основного термодинамического равенства имеем grad (\i{ - \i2) = = Щр± grad т + ^^L grad dp + iia^L grad При наличии механического равновесия grad/? =0. Воспользовавшись соотношением Гиббса — Дюгема сг d\i{ + c2 d\i2 = 0,
792 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИИ [ГЛ. IV находим окончательно grad (ц, - \х2) (s, - s2) grad Г + -?¦ (-377) g™d с, = = (s, - s2) P grad у + -^ (-^-) grad c,. При этом для потока находим Если ввести коэффициент диффузии Di*-Li*(\-lCl)T "^7 <43'2) и коэффициент термодиффузии то D3,1) дает 1{ = — D12 grad c{ - DTc{ A - d) g^d T. D3,4) Знак коэффициентов диффузии и термодиффузии определен тре- требованием, чтобы возникновение энтропии FS) было положи- положительным. Полученные соотношения могут применяться к любым бинарным смесям и изотропной (жидкой или газовой) фазе, при любых значениях концентрации, но при малых значениях гради- градиентов температуры и концентрации. Точно так же можно найти выражения для потока при наличии внешних сил (например, при миграции ионов в электрическом поле или при существовании химических реакций между компонентами). Обобщение на слу- случай многокомпонентных систем не представляет никакого труда. Мы предполагали в ходе вывода, что термомеханический эф- эффект в системе с непрерывно изменяющимися параметрами от- отсутствует (т. е. gradp = 0). Постоянство давления имеет место всегда, когда отсутствует средний поток вещества A\ + /2) = О и система описывается макроскопическими законами. Сравнивая полученный результат с выводами § 25, мы ясно ви- видим, что их взаимоотношение, такое же как и между результа- результатами термодинамического и статистического описания. Из кинети- кинетической теории газов был найден молекулярный смысл всех вели- величин, но для простейшего случая идеального газа малой концен- концентрации (ci «С 1). В термодинамике необратимых процессов полу- получаются весьма общие соотношения, но содержащие постоянные, смысл и значения которых остаются не известными и которые должны определяться из опытных данных.
§ 43] НЕРАВНОВЕСНЫЕ ПРОЦЕССЫ В МНОГОКОМПОНЕНТНЫХ СИСТЕМАХ 793 Последним и, может быть, наименее тривиальным примером применения термодинамики необратимых процессов может слу- служить теория термоэлектрических явлений. Рассмотрим явления, возникающие в термопаре из двух различных металлических проводников, спаи которых поддерживаются при разных темпе- температурах 7\ и Т2. В цепь подана э. д. с, так что в системе имеет- имеется поток тепла и электрический ток. Мы будем считать, что про- процессы имеют стационарный характер. Мы можем написать для потоков общие выражения D3,5) (%) D3,6) В электрическом поле [см. § 59 ч. III] \1 = Ц0 + ??ф, где ф — потенциал поля. Поэтому D3,5) — D3,6) удобно представить в виде I^-L'u^-L'n^, D3,7) 1в —&?—&%¦, D3,8) где бф — э. д. с. и 8Т == Ti — Т2. Соотношение Онзагера гласит: L\2 = L2\. Коэффициенты в уравнениях D3,7) и D3,8) могут быть выраже- выражены через электропроводность а и теплопроводность Я. Именно, полагая AT = 0, находим ^ D3,9) D3,10) D3,11) I' так что а = —-. Полагая /* = 0, АГ Ф 0, имеем откуда Ki'Y i'i' L'T2
794 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ. IV Рассмотрим частные случаи формул D3,10) и D3,11). Пусть спай нагревается в разомкнутой цепи (А = 0). Тогда в цепи воз- возникает термо-э. д. с. б<р = --^6Г. D3,12) Появление разности потенциалов в разомкнутой цепи носит на- название эффекта Зеебека. При прохождении тока между разны- разными проводниками в изотермических условиях (8Т = 0) происхо- происходит перенос энергии и выделяется некоторое количество тепла, именуемого теплом Пельтье. Полагая в D3,10) и D3,11) 8Т = 0, находим 1Е = -тг1е = Ъ121е, D3,13) где П12 — тепло, выделяемое при прохождении тока /е = 1. Сравнивая D3,12) и D3,13) и пользуясь соотношением вза- взаимности Онзагера, находим Последняя формула носит название второго соотношения Томсона. Она содержит только непосредственно измеряемые ве- величины и хорошо согласуется с опытом. Следует заметить, что для ее вывода непосредственно требуется использование соотно- соотношения взаимности. В цитируемой книге де-Гроота очень ясно показано, каким образом неявное использование этого соотно- соотношения позволило Томсону получить формулу D3,14) из термо- термодинамических соображений, явно неприменимых к рассматри- рассматриваемым явлениям. В заключение заметим, что существенная положительность теплопроводности требует выполнения неравенства L11L22 — — (LuT- В книге де-Гроота приведено доказательство этого не- неравенства. § 44. Флуктуационно-диссипативная теорема В § 29 ч. IV мы обсудили уже флуктуационно-диссипативную теорему. При этом было указано, что область применимости флуктуационно-диссипативной теоремы гораздо шире, чем это следует из приведенного там доказательства. Квантовомехани- ческий вывод флуктуационной теоремы, к изложению которого мы можем перейти, показывает, что флуктуационно-диссипатив- флуктуационно-диссипативная теорема применима при таких частотах и температурах, ког- когда квантовые эффекты имеют основное значение.
§ 44] ФЛУКТУАЦИОННО-ДИССИПАТИВНАЯ ТЕОРЕМА 795 Существует множество различных способов доказательства флуктуационно-диссипативной теоремы, из которых мы выбрали самый простой и непосредственный1). Пусть на систему частиц, находящуюся в термостате, дейст- действует динамическое возмущение (внешняя сила), изменяющееся во времени по гармоническому закону. Для конкретности положим, что возмущенная сила имеет вид F = eEoe^y D4,1) где Ео — однородное электрическое поле. Возмущению D4,1) в гамильтониане отвечает слагаемое вида #' = еЕогеш. D4,2) Необходимо подчеркнуть, что последующие доказательства справедливы для любой пары величин в гамильтониане, для ко- которых возмущение имеет вид /?' = (|F). D4,3) Здесь § — оператор, отвечающий некоторому параметру |. Что же касается допущений об однородности поля и его изменению по гармоническому закону, то всегда можно разложить D4,3) в интеграл Фурье и рассматривать действие каждой гармоники. Поэтому фактически мы не ограничиваем общности, прини- принимая возмущение jbhда D4,1). Возмущение Н'у зависящее от времени, вызывает в системе переходы. В результате в системе поглощается энергия, диссипи- рующаяся в тепло. Поглощаемую энергию в единицу времени, т. е. поглощаемую мощность, можно представить в виде Q = ( 2 btokiWik ~ 2, *<o/*'i0/ft'). D4,4) Первое слагаемое представляет поглощенную, второе — излучае- излучаемую (в единицу времени) энергию. Усреднение производится по равновесному распределению Гиббса. Вероятности прямых (с поглощением) и обратных (с излучением) переходов, отнесен- отнесенные к интервалу частот dco, согласно E6,9) ч. V равны 2FI H'lk I2 б (° ~" со*/)' Wkl =  Wlk = F2F Соответственно Q = -gfr { 2 h®ktpi | Ны |2 б (со - v>ik) - 2 h(*ik9i I Н'ш |2 б (со - ®i D4,5) где pi—распределение Гиббса. l) Л. Д. Ландау и Е. М. Лифшиц, Статистическая физика, «Нау- ка>, 1964.
796 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ. IV Поскольку суммирование ведется по индексам / и &, можно заменять индексы суммирования. Выполняя эту замену во вто- второй сумме D0,6), получаем Q = -т^г 12 h®ki9i | Hik |2 б @ - со*/) - ]?J htoklpk | Нш |2 6 (со — 8/ / 8^~8/ б (со - co<ft) = При этом, воспользовавшись присутствием б-функции, мы поло- положим со^ = о. Оказывается, что Q можно связать с временной коррелятив- коррелятивной функцией оператора |, точнее, с фурье-компонентой этой функции. Тогда мы установим связь между диссипируемой мощ- мощностью и коррелятивной функцией, т. е. получим искомое обоб- обобщение флуктуационно-диссипативной теоремы (см. § 29 гл. IV). Классическое определение коррелятивной функции следует несколько модифицировать. Действительно, значения оператора в гейзенберговском представлении, взятые в различные моменты времени, вообще говоря, не коммутативны, так что С другой стороны, моменты времени t и t + т совершенно равноправны. Поэтому естественно определить коррелятивную функцию квантовомеханического оператора, зависящего от вре- времени, для статистической системы как симметризованное выра- выражение . D4,7) Учитывая зависимость операторов от времени по формуле C1,2) гл. V, можем написать D4,8)
§44] ФЛУКТУАЦИОННО-ДИССИПАТИВНАЯ ТЕОРЕМА 797 Найдем теперь компоненту Фурье от коррелятивной функции, определенной D4,8). Имеем, очевидно /, к Производя во втором слагаемом замену индексов суммиро- суммирования, находим окончательно: = S e""^ Б» I2 б (® - Мы видим, что диссипируемая мощность выражается через фурье-компоненту коррелятивной функции: Qtb «<«>• D4'10) Таким образом, диссипируемая мощность в совершенно произ- произвольной системе полностью определяется коррелятивной функ- функцией, т. е. флуктуативной характеристикой системы, находящей- находящейся в состоянии термодинамического равновесия. При этом мы не делали каких-либо предположений о малости флуктуацион- ных отклонений. Формулу D4,10) можно переписать в другом виде, если за- заметить, что согласно D3,3) ч. III средняя энергия линейного ос- осциллятора дается формулой Поэтому I Чтобы установить непосредственную связь полученных ре- результатов с формулой Найквиста (см. § 29 гл. IV), введем кор- коррелятивную функцию для тока в некотором проводнике. Пусть в проводнике течет ток /(о) и при этом происходят произвольные диссипативные процессы.
798 МЕТОДЫ ВРЕМЕННЫХ КОРРЕЛЯЦИЙ ФУНКЦИЙ [ГЛ. IV Если на каждую частицу в теле действует возмущение D4,3), то для диссипируемой мощности имеем Но из определения возмущения D4,3), тока и коррелятивной функции следует, что Si (©) = eWgr (©). Поэтому, выражая gj(co) через Q, находим ^(w) = ^ctg^-Q==^cth^F'*(@)' D4'I2) где /? (со) = ReZ(co)—вещественная часть импеданса, завися- зависящего от частоты. В классическом пределе йсо <С kT выражение D4,12) перехо- переходит в обобщенную формулу Найквиста B9,15) гл. IV g/@) = ^/?(co). D4,13) Наряду с формулой D4,1) можно написать выражение, связы- связывающее коррелятивную функцию с мнимой частью диэлектриче- диэлектрической проницаемости, если воспользоваться формулой C1,38) гл. IV. Последняя выражает диссипируемую мощность через eim(co). Таким образом, оказывается, что флуктуативные свой- свойства системы, характеризуемые коррелятивными функциями (), полностью определяются функцией ег'т(со).
ГЛАВА V ТЕОРИЯ ТВЕРДОГО ТЕЛА § 45. Твердое тело как квантовомеханическая система Теория твердого тела явилась одной из тех областей физики, где применение квантовомеханических представлений оказалось особенно плодотворным. Только на этой основе удалось сфор- сформулировать принципы теории твердого тела, создать теорию рав- равновесных и кинетических свойств металлов, полупроводников и диэлектриков, понять сущность различия между ними, объяс- объяснить многочисленные и своеобразные явления в твердых телах, казавшиеся долгое время парадоксальными (например, сверх- сверхпроводимость или ферромагнетизм). В настоящее время квантовая теория твердого тела достигла той стадии развития, когда она позволяет предсказывать новые, тонкие и своеобразные явления в твердых телах. На первый взгляд тот факт, что в макроскопических объек- объектах, которыми являются твердые тела, могут проявляться кван- квантовые эффекты, кажется парадоксальным. Следует, однако, пом- помнить, что каждый монокристалл представляет, по существу, одну гигантскую молекулу (ср. § 50 ч. III). Поэтому в самой основе тепловых, электрических и других свойств твердых тел лежат квантовые эффекты. Мы видели это в гл. VII ч. III, где были из- изложены некоторые качественные основы теории кристаллических решеток. В рамках этой книги мы ограничимся, естественно, из- изложением общих принципов квантовой теории твердого тела. Для более детального ознакомления следует обратиться к специальным руководствам1). Всякое макроскопическое твердое тело представляет систему из огромного числа сильно взаимодействующих между собой частиц. Ясно, что для построения теории твердого тела необхо- необходимо не только сочетание квантовомеханического и статистиче- статистического описания, но и существенное упрощение и схематизация 1) Особенно рекомендуем: Д. 3 а й м а н, Принципы теории твердого тела, «Мир», 1966; Р. П а й е р л с, Квантовая теория твердых тел, ИЛ, 1956; А. А н с е л ь м, Введение в теорию полупроводников, Физматгиз, 1963.
800 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V существующих взаимодействий между частицами. Последнее означает, что необходимо создать модель твердого тела, доста- достаточно адекватную самому объекту, передающую его основные черты и неучитывающую второстепенные и несущественные де- детали. В основу дальнейшего рассмотрения будет положена следую- следующая модель: твердое тело представляет совокупность ионов и валентных электронов. Под ионами понимаются атомные ядра вместе со всеми электронами в заполненных оболочках. Взаи- Взаимодействие электронов заполненных оболочек с ядром является столь сильным, что сближение атомов и образование кристалла не оказывает на него существенного влияния. Мы будем отвлекаться от внутренней структуры ионов и предполагать, что электроны замкнутых оболочек каждого иона взаимодействуют только с собственными ядрами. Ионы мы бу- будем считать точечными частицами, обладающими массами М (одинаковыми в случае простых веществ и разными для химиче- химических соединений). Ясно, однако, что при сближении ионов до расстояний по- порядка их собственных размеров валентные электроны данного атома вступают в сильное взаимодействие с соседними ядрами и их электронными оболочками. Это взаимодействие обеспечивает возникновение химической связи между ионами, именуемую в случае кристаллов силами сцепления. Поэтому валентные элек- электроны нельзя считать локализованными у данного атома и в не- некоторых случаях они получают возможность перемещаться по всему кристаллу. Наличие валентных электронов не является обязательным признаком твердого тела. Например, их нет в кри- кристаллах элементов нулевой группы. В таких кристаллах связь между атомами, образующими решетку, имеет характер ван- дер-ваальсовых сил. В ковалентных кристаллах в узлах решетки также помещаются не ионы, а нейтральные атомы. Поэтому ча- часто вместо того, чтобы говорить об ионах, говорят о ядрах, на- находящихся в узлах кристаллической решетки. Однако в подав- подавляющем большинстве явлений, происходящих в твердых телах, электроны играют самую существенную роль. Поэтому мы рас- рассмотрим самый общий случай, когда в кристалле содержатся ионы и валентные электроны. Пусть Ri означает координаты ионов (ядер), а ^ — соответ- соответственно координаты валентных электронов. Тогда гамильтониан системы ионов и электронов можно представить в виде u ('<-*/). D5,1)
§ 45] ТВЕРДЫЕ ТЕЛА КАК КВАНТ.-МЕХ СИСТЕМА 801 Первая сумма (по всем ионам) представляет их кинетическую энергию. Вторая сумма дает кинетическую энергию всех (ва- (валентных) электронов. Три последних слагаемых описывают со- соответственно кулоновское взаимодействие между электронами, взаимодействие между ионами и взаимодействие между ионами и электронами. Это взаимодействие зависит от расстояний меж- между соответствующими частицами. В первых двух суммах индек- индексы частиц должны быть разными, во второй они могут совпа- совпадать и множитель 7г отсутствует. В основу теории твердого тела положено допущение о воз- возможности использования адиабатической теории возмущений. Совокупность валентных электронов считается быстрой подси- подсистемой, а совокупность ядер и связанных с ними электронов замкнутых оболочек—медленной подсистемой. В этом прибли- приближении полную волновую функцию системы х?(г\, г%, ...; R\, /?2,...) можно представить в виде * (*» Г2> • • • » R\> ^2» • • •) = = ?,(*!, *2, ..., RNLei(ri, r29 ...; *ь Я2, ..., RN), D5,2) где ?i — волновая функция системы ионов, a Wei — волновая функция системы электронов. В адиабатическом приближении эти волновые функции удовлетворяют уравнениям [ср. E7,7) — E7,8) ч. VJ: 2i .... RNLeh D5,3) D5,4) В этом приближении в уравнении для волновой функции быст- быстрой подсистемы не входят импульсы (производные по координа- координатам) частиц медленной подсистемы. Это означает, что электроны движутся при заданных положениях тяжелых ионов. Каждому изменению последних отвечает перераспределение электронов, которые всегда успевают подстраиваться к изменившемуся рас- расположению ионов. -Поэтому в потенциальную энергию взаимо- взаимодействия между электронами и ионами координаты последних входят только как параметры. Энергия валентных электронов в свою очередь, является составной частью потенциальной энер- энергии системы ионов. В последнее время было обосновано применение адиабатиче- адиабатического приближения к рассмотрению твердого тела и выяснены границы его применимости. 26 Bi. Г. Левин и др., том II
802 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V В адиабатическом приближении удается, до известной сте- степени, разделить движение электронов и ионов. Зная энергию взаимодействия электронов и ионов и считая положения ионов заданными, можно в принципе решить уравнение D5,3) и найти энергию Eei системы электронов, зависящую, разумеется, от по- положений ионов. Это значение Eet должно быть использовано за- затем для решения уравнения D5,4). Ясно, однако, что фактическое осуществление этой програм- программы связано с непреодолимыми трудностями, поскольку каждое из уравнений D5,3) и D5,4) содержит макроскопически большое число переменных. Поэтому современная теория твердого тела связана с рассмотрением упрощенных моделей, отражающих важнейшие особенности их поведения. § 46. Кристаллическая решетка Мы начнем с обсуждения свойств медленной подсистемы, т. е. со свойств системы ионов. Уравнение D5,4) полностью опреде- определяет поведение этой системы. Его решение должно прежде всего дать ответ на вопрос о том, как образуется твердое тело, т. е. тело с правильным расположением тяжелых частиц в узлах кри- кристаллической решетки. Ясно, однако, что не может быть и речи о точном решении этого уравнения. Поэтому задача о расчете сил сцепления, удерживающих кристалл, и выяснении той роли, которую играют в них ван-дер-ваальсовы и обменные силы, а также имеющиеся в системе валентные электроны, является самой трудной в теории твердого тела. Она еще не может счи- считаться решенной до конца, хотя и в ней получены очень суще- существенные результаты. Мы не можем здесь излагать эту проблему и ограничимся лишь качественными соображениями. Ясно прежде всего, что взаимодействие между ионами (или атомами в случае кова- лентных кристаллов) обеспечивает в принципе возникновение кристаллической структуры. Минимуму энергии системы отве- отвечает правильное их расположение в пространстве на некоторых расстояниях друг от друга. В случае ковалентных кристаллов между атомами происходит обменное взаимодействие, которому отвечает притяжение на больших и очень сильное отталкивание на малых расстояниях. В случае ионных кристаллов притяже- притяжение имеет электростатический характер, тогда как отталкива- отталкивание обусловлено сложным взаимодействием между атомными остатками, возникающими на малых расстояниях. В металлах существенный вклад в силы сцепления дают валентные элек- электроны, сильно ослабляющие взаимодействие между ионами. В ре- результате взаимодействия атомы или ионы размещаются на рас- расстояниях, отвечающих минимуму энергии. Эти расстояния не
§46} КРИСТАЛЛИЧЕСКАЯ РЕШЕТКА 803 отличаются от расстоянии между атомами в молекулах A—2А). Соответственно этому энергия сцепления, отнесенная к одному атому, имеет тот же порядок величины, что и энергия химической связи, и колеблется от 1 эв (у металлов) до 10 эв (у ионных кристаллов типа поваренной соли) в расчете на одну частицу. Правильное расположение ионов или атомов в узлах кри- кристаллической решетки играет важнейшую роль и определяет многие физические свойства твердых тел. Поэтому нам в даль- дальнейшем понадобятся элементы геометрии кристаллической решетки. Основным геометрическим свойством кристаллической ре- решетки является ее трансляционная симметрия. Отвлечемся от конечных размеров кристалла и будем счи- считать, что он заполняет все пространство. Свойство трансляцион- трансляционной симметрии позволяет ввести тройку базисных векторов а, &, с. При трансляции кристал- кристалла в пространстве на вектор W Рис. 41. п = ща + п2Ь + п2су D6,1) где пи п>2 и п3 — целые числа, он совпадает cajvi с собой (при этом предполагается, что на- начало вектора п совпадает с од- одним из узлов решетки). Базисные векторы опреде- определяют главные кристаллогра- кристаллографические направления, в кото- которых можно производить транс- ляции. То же самое можно сформулировать и несколько иначе. Построим на трех ба- базисных векторах а, 6, с параллелепипед. Этот параллелепипед называется элементарной ячейкой. Тогда весь кристалл, запол- заполняющий бесконечное пространство, получается бесконечным по- повторением элементарных ячеек. Следует заметить, что сам выбор базисных векторов является не вполне однозначным. Это проще всего видно на рис. 41, на котором изображена простая кубическая решетка. В качестве базисных векторов могут быть выбраны три вектора, а, &, с, или три вектора аи Ьи с\. Мы видим, что если атомы решетки однотипны, все узлы ре- решетки получаются трансляцией одной точки решетки на век- вектор п при различных значениях целых чисел Пи #2 и Пз- В этом случае говорят, что элементарная ячейка содержит один атом (в узле решетки). Такая решетка называется решеткой Бравэ.
804 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V Если в элементарной ячейке помещаются два или более атома, то тогда говорят, что кристалл имеет решетку с базисом. Решетка с базисом представляет совокупность вдвинутых одна в другую простых решеток. Например, в элементарной ячейке кристалла поваренной соли содержится атом натрия и атом хлора. Атомы натрия и хлора образуют простые кубические ре- решетки, сдвинутые друг по отношению к другу на половину реб- ребра куба. Значения базисных векторов называются постоянными решетки. Постоянная решетки представляет расстояние (в данном главном кристаллографическом направлении) между ближай- ближайшими соседями. Мы не будем останавливаться на разборе возможных эле- элементов симметрии и кристаллических классах. Укажем лишь, что преобразования трансляций не являются единственным пре- преобразованием симметрии, совмещающим кристалл сам с собой. Другими преобразованиями симметрии являются повороты и отражения. В дальнейшем мы будем часто встречаться с понятием об- обратной решетки. Под обратной решеткой понимают решетку, построенную на базисных векторах аи &i и си определенных формулами Вектор обратной решетки К связан с базисными векторами а^ &i и Ci соотношением К = alm[ + bim2 + c{m3i D6,3) где mi, m<i и rrtz — целые числа. Очевидно, что D6,4) Важность вектора обратной решетки связана с тем, что всегда имеет место равенство Кп = 2я (п{т{ + п2т2 + п3т3) = 2nNf D6,5) где N — целое число. Благодаря этому часто встречающееся выражение eiKr при г = /г, т. е. при совпадении вектора г с одним из узлов решетки, обращается в единицу eiKn = ei2nN e L Заметим, что объем элементарной ячейки для решетки, по- построенной на векторах обратной решетки, связан с объемом
§ 47] КОЛЕБАНИЯ РЕШЕТКИ 805 элементарной ячейки прямой решетки соотношением = 1511 = 121 (ла7) a [be] v0 > *40''' где Vq — объем элементарной прямой решетки. § 47. Колебания решетки Ионы, или атомы, расположенные в узлах кристаллической решетки, находятся в тепловом движении и колеблются около положений равновесия. В твердых кристаллах при температу- температурах ниже температуры плавления амплитуда этих колебаний мала по сравнению с постоянной решетки. Обозначим через п положение узла (равновесное положе- положение) /1-го иона и через §„ — смещение /i-го атома так, что Яя-л + Ь,. D7,1) Тогда, поступая точно так же, как это было сделано нами в § 50 ч. III в классическом приближении, мы можем разло- разложить в ряд по степеням малых смещений потенциальную энер- энергию U(Ri — Rj). Мы видели в § 50 ч. III, что характер движе- движения решетки существенно зависит от ее структуры. Уже само наличие ячейки с базисом (например, наличие двух сортов ча- частиц с разными массами) приводит к появлению новых модов колебаний. Поскольку нас в первую очередь интересует принципиальная сторона дела, мы не будем усложнять выкладок и ограничимся кристаллами с простой решеткой Бравэ. Более того, для про- простоты записи мы будем опускать векторные индексы, как будто бы кристалл был одномерной цепочкой. Тогда можно написать вблизи положений равновесия U (Rn - Rn') = U (я - «') + RR п'.п -J dRndRn,dRn* п, п\ п" Ограничиваясь двумя членами разложения, можно написать га- гамильтониан в форме + ] ЫD7,3) п п, п' где в Но включены все слагаемые, не зависящие от смещений.
806 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V Уравнения движения гласят: К = Шп - — 2 Опп'Ъп*. D7 А) Решениями уравнений движения, удовлетворяющими условиям трансляционной симметрии, служат функции ln=S^(f"-^; D7,5) Подстановка D7,5) в D7,4) дает >е'!^"\ D7,6) Напомним, что значения волнового числа определяются из гра- граничных условий. Если в качестве граничных условий выбрать условия периодичности на длине L = Nd, то f-±?lf (*= 1,2,..., Ю. D7,7) Волновое число / в решетке определено не точно, но с точ- точностью до величины -—-: при замене /->/ + -— смещение не изменяется. Мы будем нормировать волновые числа в интер- интервале В одномерной цепочке вектор обратной решетки равен -~. Поэтому можно сказать, что вектор f лежит внутри первой зоны Бриллюэна. Не повторяя вычислений § 50 ч. III, перейдем к нормальным координатам, введя переменные /?/ и qf соотно- соотношениями йfJ D7,9) W D7,10) Поскольку рп и qn вещественные величины, имеют место равен- равенства D7-и)
§ 471 КОЛЕБАНИЯ РЕШЕТКИ 80? Подставляя D7,9) и D7,10) в D7,3), с учетом D7,6), находим 0f?f)- D7,12) Второе слагаемое в D7,12) представляет гамильтониан си- системы независимых осцилляторов с частотами со/. Переход к квантовому гамильтониану совершается, как обычно, путем за- замены pf и <7/ операторами, удовлетворяющими перестановоч- перестановочным соотношениям B6,2) — B6,4) ч. V. Сравнивая выражения D7,5) и D7,12) с соответствующими формулами для операторов электромагнитного поля, мы убе- убеждаемся в их формальной тождественности. Как и в случае электромагнитного поля, удобно ввести опе- операторы рождения 5/ и уничтожения 6/", удовлетворяющие пере- перестановочным соотношениям A01,3) ч. V. Пользуясь результатами § 101 ч. V, мы можем сразу напи- написать квантованную энергию решетки Так же как и в случае электромагнитного поля, системе кванто- квантованных волн можно сопоставить систему независимых кванто- квантовых частиц — бозонов, получивших название фоноиов. Формула D7,13) показывает, что энергия фонона с волновым числом f равна hcof. При переходе к трехмерному кристаллу общая ситуация, по существу, усложняется лишь в малой степени. Смещение |я можно представить в виде вектора В--2 2в//^<(Л—Л D7,14) f /-1 где efj — три вектора поляризации: продольной поляризации, при которой вектор efl направлен параллельно вектору /, и по- поперечной, при которой векторы ef2 и ef3 перпендикулярны к век- вектору f. Из вещественности |п следует, что q*fj = q_fj. Волновой вектор / определен с точностью до вектора обратной решетки К. Гамильтониан трехмерной решетки имеет вид f/ При данном значении / существуют три фонона с частотами (Of2 И @/3-
808 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V В отличие от фотонов, у которых имеется линейная связь между частотой со и волновым числом /, у фононов всегда имеется сложный закон дисперсии. В линейной цепочке закон дисперсии определен формулой E0,13) ч. III, в трехмерном кристалле имеются разные законы дисперсии для различных поляризаций, т. е. <of. = coifj). Лишь при малых значениях волнового вектора в кристаллах с кубической симметрией можно полагать (of/ = (of = c/, A4,16) где с — скорость звука. Для выполнения квантования удобно ввести операторы ро- рождения bfi и уничтожения 6// фононов, положив Правила коммутации для операторов рождения и уничтожения фононов A01,3) ч. V следует записать в виде 6//б;т - ЪргЪл = 6//*//'. D7,18) При этом Е=2 2 (ъ"ь"+1)ы*=22 К+i) **//• <47>19) Обобщение теории на случай решеток с базисом также не вносит принципиально новых моментов. В самом общем слу- случае можно утверждать, что тепловое возбуждение' решетки описывается системой элементарных независимых частиц — фононов. Таким образом, описание коллективных возбуждений — волн в кристаллической решетке, весьма сходно с описанием поля электромагнитного излучения в полости. Необходимо, однако, подчеркнуть, что эта аналогия является до известной степени формальной. В то время как фотоны обладают той же сте- степенью реальности, что и любые другие частицы — электроны, мезоны или протоны, — фононы являются фиктивными, фор- формально введенными образованиями. Действительно, гамильто- гамильтониан в форме D7,3), допускающий введение нормальных-коор- динат и преобразование к виду D7,19), не является точным. Он был получен в результате пренебрежения в формуле D7,2) членами третьего и более высокого порядка малости, т. е. в гармоническом приближении. Учет ангармоничности делает невозможным приведение гамильтониана к форме D7,3), т. е. к сумме квадратичных слагаемых. Поэтому сама возможность введения понятия фононов тесно связана с приближенным рас-
§ 47] КОЛЕБАНИЯ РЕШЕТКИ 809 смотрением теплового движения кристаллической решетки. В отличие от истинных бозе-частиц — фотонов, фононы име- именуются квазичастицами. Отличие квазичастиц — фононов от истинных частиц — фотонов особенно наглядно проявляется в том, что фононам нельзя приписать определенное значение импульса. Действительно, импульс свободной частицы, как и ее энергия, пробегает непрерывный и ничем не ограниченный ряд значений. В любых взаимодействиях энергия и импульс сохра- сохраняются. У фонона роль импульса формально играет величи- величина bf. Однако значения этой величины лежат в определенном интервале D7,8). Более того, значение вектора bf определено не однозначно, но лишь с точностью до величины ЬК, где К — вектор обратной решетки. Поэтому вектор bf получил название квазиимпульса. В отличие от истинного импульса, значение квазиимпульса при взаимодействиях фонона с другими фоно- нами или электронами может не сохраняться. Кристаллическая решетка может произвольным образом добавить или отнять у фонона квазиимпульс ЪК. Несмотря на фиктивный характер квазичастиц — фононов, их введение оказалось весьма плодо- плодотворным. Оно является основной для рассмотрения всех про- процессов, происходящих в твердых телах. Более того, введение элементарных возбуждений как некоторых квазичастиц, являет- является типичным для современной физики методом подхода к опи- описанию возбужденных состояний в системах с большим числом частиц. В ряде проблем возбуждение, отвечающее коллективному движению макроскопической системы, удается описать при по- помощи некоторых координат Х{ так, что полный гамильтониан системы Н оказывается равным Н = 2 Я„ где Hi = aPl + f (Xt). При этом и энергия ситемы представляется в виде суммы Очень часто оказывается при этом возможным найти такие пе- переменные, в которых оператор Гамильтона Нг имеет вид, сход- сходный с оператором Гамильтона для осциллятора. Тогда говорят, что коллективное возбуждение системы можно разложить на со- совокупность элементарных возбуждений. Собственным значениям Hi, отвечающим 1-й степени свободы коллективного движения, можно сопоставить энергию некоторой квазичастицы. Разобран- Разобранный выше случай колебаний решетки кристалла как целого
810 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V приводит к одному из видов квазичастиц — фононам. Каждая квазичастица отвечает одной степени свободы коллективного движения системы.. Введение квазичастиц имеет то преимуще- преимущество, что оно позволяет сопоставить движению системы реаль- реальных взаимодействующих частиц систему невзаимодействующих или слабо взаимодействующих квазичастиц. Энергетический спектр совокупности квазичастиц совпадает со спектром реальной системы. Возможность введения квази- квазичастиц выявилась в ряде задач, связанных с теорией систем со многими частицами и главным образом в теории твердого тела. Поэтому в настоящее время в теоретической физике имеется множество квазичастиц, например, поляроны (электроны в по- полярных кристаллах, окруженные «облаком» фононов), экситоны (пара, образованная в полупроводнике электроном и дыркой); магноны (элементарные возбуждения в парамагнитных диэлек- триках), плазмоны и т. п. Все эти квазичастицы не являются реально существующими частицами. Однако их формальное вве- введение отражает характер процессов, происходящих в системах многих частиц, и позволяет пользоваться удобным и хорошо разработанным расчетным аппаратом. Понятие о фононах является основным при рассмотрении движения электронов в кристаллической решетке. Мы увидим, что взаимодействие электронов с колеблющейся решеткой и рассеяние их на атомах решетки обусловливает появление элек- электрического сопротивления. Это взаимодействие, как будет видно из дальнейшего, можно формально описывать как взаимодей- взаимодействие сталкивающихся частиц и электронов, свободно движу- движущихся в объеме тела. Для того чтобы понятие квазичастиц имело смысл, необхо* димо, чтобы их время жизни было достаточно велико. Если е — средняя энергия квазичастицы, я Де — неопределенность в ее энергии, то должно выполняться неравенство где т — время жизни квазичастицы. Процессами, определяющими длительность жизни квазича- квазичастиц, могут быть всякого рода процессы поглощения и рассея- рассеяния. В случае фононов источниками поглощения и рассеяния могут служить примеси в кристалле и ангармоничность, отве- отвечающая столкновениям фононов между собой. В чистом кристалле число примесей малб. При низких тем- температурах ангармоничность также мала. Поэтому при низких температурах, достаточно далеких от температуры плавления, время жизни фононов оказывается весьма малым и понятие о фононах как о квазичастицах, имеет полный смысл.
§48] ВОЛНОВАЯ ФУНКЦИЯ ЭЛЕКТРОНА ДВИЖУЩЕГОСЯ 811 § 48. Волновая функция электрона, движущегося в периодическом поле Прежде чем изучать движение системы электронов во внеш- внешнем периодическом поле решетки, мы рассмотрим движение одного электрона в поле кристаллической решетки. В следую- следующих параграфах будет показано, как это решение может быть использовано для исследования всей системы электронов. Для одного, электрона, движущегося в кристаллической ре- решетке, уравнение Шредингера имеет вид эл = ?„г|)эл. D8,1) В последнем уравнении потенциальная энергия U является периодической функцией с периодом решетки кристалла. Она удовлетворяет условию периодичности U(r + n) = U(r), D8,2) где вектор п определен формулой D6,1). Введем оператор трансляции ТЯ9 который определяется следующим образом: Г-.Ф (г) = *(' + *)•' D8,3) Так как потенциальная энергия является периодической функ- функцией, то очевидно, что оператор Т„ коммутирует с гамильтониа- гамильтонианом # =—g—Д + ?/. Отсюда вытекает, что волновые функции стационарных состояний можно выбрать так, чтобы они были собственными функциями обоих операторов, Н и Г„. Последнее означает, что должны иметь место уравнения tMr)-а& {г), Здесь ап — собственное значение оператора Тп. Легко показать, что величины ап по модулю равны единице. Действительно, ве- вероятности того, что электрон будет обнаружен в точках г и г + я, должны быть одинаковыми в силу периодических свойств решетки, т. е. Используя D8,4), получаем что и доказывает наше утверждение. Не ограничивая общности, коэффициент а„ можно предста- представить в виде an = eikn. D8,5)
812 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V По причинам, которые станут ясны из дальнейшего, k именуется эффективным волновым вектором электрона, движущегося в периодическом поле. Ниже для краткости мы будем часто именовать k просто волновым вектором. Следовательно, для собственных функций операторов Н и Тп должно в соответствии с D8,4) выполняться соотношение е**яЪ(г). D8,6) В самом общем случае функцию, удовлетворяющую усло- условию D8,6), можно записать в виде так называемых блоховских функций Ъ{г) = е**'и*(г), D8,7) где un(r) — периодическая функция с периодом решетки ). D8,8) Подставляя в уравнение Шредингера волновую функцию \|э, определенную в D8,7), находим уравнение для и*(г): <v+ik?+w ?)}Uk w=°- D8>9> Уравнение D8,9) показывает, что помимо прочих квантовых чисел, энергия электрона зависит также от волнового вектора k. Если бы мы захотели учитывать поверхностные эффекты, то нам необходимо было бы потребовать, чтобы волновая функция за пределами кристалла убывала. На больших расстояниях от кристалла она должна стремиться к нулю. Мы не будем, одна- однако, заниматься исследованием поверхностных эффектов. Указан- Указанное же граничное условие заменим условием периодичности. Для кубического кристалла с ребром L оно имеет вид etktL « 1. Это соответствует услозию ty(x = 0) = ty(x = L) на плоскостях цикличности. Отсюда следует, что проекции вектора к\ прини- принимают значения kb = -у- /*, где U пробегает ряд целочисленных значений. Учитывая, однако, что размеры L весьма велики, мож- можно приближенно считать k непрерывно изменяющейся величиной и при требовании цикличности. Другой особенностью вектора k является неоднозначность его определения. Если прибавить к вектору k вектор обратной ре- решетки К, то в формуле D8,6), являющейся определением k, можно записать так: <ф (г + п) = ?»'(*+*>п ф (г) = eikn^ (r), так как, в соответствии с D8,2),
§ 49] ЭНЕРГЕТИЧЕСКИЙ СПЕКТР ЭЛЕКТРОНА 813 Таким образом, замена k на k + К не отражается на опре- определении этого вектора. Говорят, что волновой вектор k определен с точностью до вектора обратной решетки К. Формула D8,7) показывает, что волновая функция элек- электрона, движущегося в периодическом поле, имеет вид модули- модулированной плоской волны, т. е. плоской волны с переменной в пространстве амплитудой Uk(r). Таким образом, имеется сход- сходство между волновой функцией частицы в периодическом поле и волновой функцией свободной частицы. Это сходство оправ- оправдывает название эффективного волнового вектора k. Вместе с тем необходимо подчеркнуть, что электрон, движущийся в пе- периодическом поле, является связанной, а не свободной части- частицей. Его импульс не имеет определенного постоянного значения. Мы будем часто нормировать -ф(г) условием \UV = N, D8,10) где интеграл берется по так называемой основной области кри- кристалла G, т. е. по области, ограниченной ближайшими плоско- плоскостями цикличности; N — число частиц в основной области кри- кристалла. Если записать волновую функцию в виде ^**'и>(г), D8,11) то D8,10) переходит в следующее условие нормировки: ukfdV=l. D8,12) В последней формуле интегрирование проводится по элементар- элементарной ячейке. § 49. Энергетический спектр электрона, движущегося в периодическом поле Выражение D8,7) для волновой функции имеет совершенно общий характер. Для того чтобы составить представление о кон- конкретном виде функции Uk и энергетическом спектре E(k) элек- электрона в кристаллической решетке, необходимо сделать некото- некоторые допущения о характере потенциальной энергии электрона в кристалле. Мы будем считать, что известна волновая функция и энергетический спектр электрона в некотором изолированном /-м атоме, т. е. известно решение уравнения / = 0, D9,1)
814 теория твердого Тела [гл. v где Uj — потенциальная энергия электрона в /-м атоме, /г — квантовое число и Е(п) — собственные значения энергии элек- электрона в атоме. Если из атомов данного типа построена кристал- кристаллическая решетка, то из-за влияния на электрон полей соседних атомов его волновая функция и энергетические уровни изме- изменяются. Мы будем, однако, считать это влияние достаточно сла- слабым, так, чтобы: 1) можно было учитывать влияние только, ближайших со- соседей, 2) смещение энергетических уровней, вызванное воздей- вием соседних атомов, было мало по сравнению с расстояниями между соседними уровнями энергии изолированного атома. Полученное на основе этих допущений решение уравнения Шредингера для электрона в кристаллической решетке назы- называется решением в приближении сильно связанных электронов. Для характеристики электрона в кристаллической решетке, состоящей из N атомов, в нулевом приближении, т. е. без учета влияния соседей, можно написать N волновых функций, удовле- удовлетворяющих уравнению Шредингера D9,1) при одном и том же значении энергии. Поэтому состояние электрона является Af-кратно вырожденным (грубо говоря, электрон может быть ло- локализован у любого из N атомов). Взаимодействие электрона с соседними атомами снимает это вырождение. Так же, как это делается в теории возмущений вырожден- вырожденных состояний, волновую функцию в нулевом приближении ищем в виде ^=2СЯ>7, D9,2) где Су—константы, а фу—решение уравнения D9,1), для /-го атома. Суммирование производится по всем атомам кристалла. Под / мы понимаем радиус-вектор, идущий из начала коорди- координат к ядру /-го атома. Для простоты выкладок мы будем считать, что все элек- электроны находятся в невырожденном s-состоянии. Энергию электрона в атоме мы будем обозначать через ?E). Тогда энергия электрона в кристалле будет иметь вид E(k, s)~E(s) + E{l)(k, s). D9,3) Она отлична от энергии электрона в атоме и зависит от волно- волнового вектора k. Подставляя волновую функцию D9,2) и энер- энергию D9,3) в уравнение Шредингера для электрона, движуще- движущегося в кристалле, имеем ?A) (*¦ 5> ~ 2 Ui w| 2
§ 49] ЭНЕРГЕТИЧЕСКИЙ СПЕКТР ЭЛЕКТРОНА 815 При этом мы представили потенциальную энергию электрона в решетке U в виде суммы 2 ?/*(г), где Ui (r) — потенциальная энергия электрона в поле l-то атома и суммирование ведется по всем атомам решетки. Поскольку в уравнении D9,4) потенциальную энергию не- невозможно разбить на невозмущенную часть и возмущение, его решение нельзя проводить с помощью обычной теории возму- возмущений. Нашей целью служит нахождение приближенного реше- решения уравнения D9,4). В невозмущенном состоянии электрон считается локализованным у /-го атома. Малым возмущением является взаимодействие электрона с атомами решетки, бли- ближайшими к /-му атому. Выделим в потенциальной энергии электрона главное сла- слагаемое— энергию взаимодействия с /-м атомом, написав где штрих означает, что в сумме опущен член с / = /. Тогда можно написать: 2 С А Афу + ^[Е (s) - Uj] Фу }+ 2 (?@ (*. *) - 2' В силу D9,1) фигурная скобка обращается в нуль, и мы приходим к уравнению 2Cy[?(I)(fe, s)-U']<pj = 0. D9,5) В силу сделанного нами допущения о слабом влиянии со- соседних атомов на электрон, «локализованный» у /-го атома, волновые функции фу можно считать почти не перекрывающи- перекрывающимися, т. е. полагать при /# = А' при 1ФН. Умножая D9,5) на ф^ и интегрируя по объему кристалла, имеем 2 J Ф;Су (?«>(*, s) - ?/') <р,,dV - 0. i Выполняя интегрирование, получаем Ch [ЕМ (*, s) + а] + 2 Р (/ - Л) Cj = 0, D9,6)
816 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V где введены следующие обозначения: D9,7) Интеграл, входящий в р, зависит от разности / и А, но не от этих величин, взятых порознь. Учитывая малую степень перекрытия волновых функций, можно в сумме величин р(/— А) ограни- ограничиться членами, отвечающими соседним атомам, ближайшим к А-му: В последней сумме число слагаемых равно числу ближай- ближайших соседей /i-ro атома. В частном случае кубической решетки ближайших соседей будет шесть. Кроме того, очевидно, что в этом случае P(/*i) = р(—/*i). Придавая А всевозможные значения, мы приходим, таким образом, к бесконечной системе линейных алгебраических урав- уравнений: , s) + a) Ch + 2 Р (п) Сн+п = 0. D9,8) п Решение этой системы будем пытаться искать в виде Ch = eikh. D9,9) Подставляя D9,9) в D9,8) и учитывая, что у атома, нахо- находящегося в кубической решетке, имеется шесть ближайших со- соседей, получаем (ft, 5) = - а - 2 Р (п) eikn = = - а — 2р (cos kxa + cos kya + cos kza). D9,10) Соответственно волновая функция имеет вид * = 2 Cflj = 2 eWqtj = eikr 2 e~ik ^qy Для фу можно по определению написать где индекс 5 означает, что мы рассматриваем электрон, нахо- находящийся в 5-состоянии. Для волновой функции t|) имеем я|) = eikr 2 e~ik ^г-^ф5 (г - /). D9,11)
§ 49] ЭНЕРГЕТИЧЕСКИЙ СПЕКТР ЭЛЕКТРОНА 817 Сравнивая с D8,7), получаем ии (г) = 2 e~ik <r~Ap5 (г - /). D9,12) Функция ал обладает требуемыми свойствами периодичности. Перейдем теперь к обсуждению выражения для энергии электрона, определяемой величинами аир. Заметим прежде всего, что волновая функция фу электрона, локализованного у данного атома /, имеет узлы только в глубине атома. Вне атома она монотонно убывает. Покажем далее, что входящая в выражения а> и р величина U' отрицательна. Действительно, поскольку потенциальная энергия электрона в кристаллической решетке U(r) ив изолированном атоме Uj отрицательна (электрон связан в атоме), можно записать: U'-U(r)-Uj=-\U(r)\ Ясно, что добавление к отдельному атому других атомов той же природы (притягивающих электрон), приводит к дополни- дополнительному увеличению связанности электрона в системе. Поэто- Поэтому I ^(г) I > I ^у|> что и доказывает наше утверждение. Из мо- монотонности Фл и фу и отрицательного знака величины V выте- вытекает, что оба интеграла, а и. р, определенные формулами D9,7), существенно положительны. Итак, добавка к энергии s-состояния оказывается отрица- отрицательной, электрон в системе атомов связан сильнее, чем в отг дельном атоме. При малых значениях k можно разложить cos ka в ряд и написать D9,13) где ?min — постоянная, не зависящая от k величина, отвечаю- отвечающая минимальному значению энергии ?min = ?(s)-a-6p, а т* равно *-« 1 m* = !$а? (д2Е\ ' D9,14) Формула D9,13) показывает, что при малых k зависимость энергии электрона от k имеет такой же вид, как у свободной частицы. При этом роль массы играет эффективная масса т*, а величину р == bk естественно назвать импульсом частицы. Однако следует иметь в виду, что р является не реальным, а эффективным импульсом. Это видно из того факта, что век- вектор ft, а с ним и вектор р, определены лишь с точностью до
818 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V вектора обратной решетки. Поэтому величину р именуют квази- квазиимпульсом. Подобно тому как у свободной частицы имеет место закон сохранения импульса, у связанной частицы, находящей- находящейся в периодическом поле кристалла, сохраняется постоянное значение квазиимпульса. При больших значениях k разложение D9,13) теряет силу. При выполнении равенств kxa = я, kya = я, kza = я cos kid = —1 и энергия электрона принимает максимальное зна- значение: pfJL iLiL с\- Ход энергии E(k,s) схематически изображен на рис. 42. По- Поскольку E(k,s) зависит от трех переменных, на рис.42 предста- представлена зависимость энергии от &хпри фиксированных значениях ky и kz. Мы видим, что из дискретного^ уровня энергии, отвечающего s-co- стоянию электрона в атоме, в крис- Н талле возникает полоса дозволенных ^ значений энергии. Подчеркнем, что ^kjL причиной, обусловливающей обра- образование полосы дозволенных энер- энергий, является взаимодействие элек- Рис. 42. трона, «локализованного» у данного атома с полем других атомов ре- решетки. Это взаимодействие снимает вырождение, которое суще- существует в системе из Af атомов и одного электрона. Поскольку электрон может быть локализован у любого из атомов, кратность вырождения весьма высока и вырожденный уровень энергии бла- благодаря указанному взаимодействию расщепляется на множество подуровней. В том приближении, в котором волновой вектор можно считать пробегающим непрерывный ряд значений (ср. § 48), совокупность подуровней можно рассматривать как не- непрерывную полосу дозволенных значений энергии. Полоса дозволенных энергий, возникающая из основного уровня энергии атома, именуется нижней энергетической зоной. Ширина нижней энергетической зоны равна Д? = ?тах — ?тт = = 12р. Точно такой же расчет может быть проведен для состоя- состояний, возникающих из первого возбужденного состояния электро- электрона в изолированном атоме. Будем считать его р-состоянием. Энергия электрона E(k,p) при этом дается формулой того же типа, что и E(k,s). Однако оказывается1), что один из интегра- > !) См А. Вильсон, Квантовая теория • металлов, Гоствхиздат, 1941, стр. 47.
§ 49] ЭНЕРГЕТИЧЕСКИЙ СПЕКТР ЭЛЕКТРОНА 819 лов перекрытия [интегралы D9,7)] отрицателен, а два других положительны. Таким образом, из уровня энергии, отвечающего р-состоянию, в изолированном атоме возникает первая возбужденная энерге- энергетическая зона электрона, движущегося в кристаллической ре- решетке. Последующие энергетические уровни изолированного ато- атома превращаются в соответствующие зоны в кристалле. Условием количественной применимости приведенного расче- расчета служит, в полном согласии с допущением 2) (в начале пара- параграфа) требование, чтобы ширина зон была мала по сравнению с расстоянием между уровня- уровнями энергии в невозмущенном атоме. Поскольку ширина зон определяется интегралами ти- типа D9,7), это требование экви- эквивалентно малому 'перекрыва- 'перекрыванию волновых функций элек- электрона в соседних атомах. Энергетический спектр в приближении сильно связанно- связанного электрона в кристалле име- имеет характер сравнительно уз- узких полос дозволенных энер- энергий, разделенных широкими Рис. 43. полосами запрещенных энер- энергий (рис. 43). Фактически это приближение имеет место для сравнительно глубоких атомных электронов. У внешних электро- электронов волновые функции соседних атомов перекрываются настоль- настолько сильно, что приближение сильно связанных электронов теряет смысл. Иными словами, вероятность нахождения электрона вблизи любой точки в решетке кристалла имеет почти одинако- одинаковое значение. В этом случае вновь оказывается возможным провести рас- расчет энергетического спектра электрона в приближении, именуе- именуемом приближением квазисвободных электронов. Именно, в ну- нулевом приближении не будем вовсе учитывать влияние перио- периодического поля кристаллической решетки и будем считать электрон свободным. Его волновая функция, нормированная на единицу, и энергия имеют вид \ Е ikr E° (k) - Здесь невозмущенные состояния обычно вырождены. Это осо- особенно легко заметитть на примере кубического кристалла. В самом деле, в соответствии с ранее изложенным (см. § 48),
820 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V проекции вектора kXy kVf kz могут принимать следующие значения: где U принимает целочисленные значения. Таким образом, если имеется вектор k> направленный по оси х и равный — tOf где /о—некоторое целое число, то существует также ряд других векторов, имеющих тот же модуль, но разли- различающихся своим направлением. Для нахождения возмущенной волновой функции мы должны воспользоваться теорией возму- возмущений для вырожденных состояний. Положим <49>15> где суммирование производится по всем векторам kt концы ко- которых лежат на сфере \k\ = const. Для определения поправки к энергии в первом порядке по теории возмущений, согласно формуле E4,4), имеем |?/*,*'-?A)8*,И = 0, D9,16) где матричный элемент Uk, w равен Предположим вначале, что среди векторов k, по которым ве- ведется суммирование в D9,15) и концы которых лежат на по- поверхности -сферы \k\ = const, нет векторов, удовлетворяющих соотношению *'-* = *. D9,17) В этом случае все интегралы Uk v малы, кроме диагонального матричного элемента Uk, k. Это можно показать следующим об- образом. Матричный элемент определяется интегрированием по всему пространству кристал- кристалла. Удобно перейти к интегрированию по элементарной ячейке и Интеграл по /i-й. элементарной ячейке следует преобразовать, введя переменные
§ 49] ЭНЕРГЕТИЧЕСКИЙ СПЕКТР ЭЛЕКТРОНА 821 где п — вектор, направленный из начала координат в я-й атом ячейки. Тогда мы получим J U (г) е1 <*'-*> 'dV~el <*'-•>п J e* <*'-*> r'U (г' + п) dV\ Используя свойства периодичности функции U, найдем, что пра- правая часть последнего равенства имеет вид ei (k'-k)n Г ц (r/) ei (k'-ь) v dVrt То Для матричного элемента Uk.v имеем: = j- J и (г) е1«'-» rdV 2 е1 <*'-*)п. D9,18) В последней формуле интегрирование производится по эле- элементарной ячейке, а суммирование — по всем узлам решетки. Сумма В = 2 el {k'~k) n при произвольных ft' — ft обладает п следующим свойством. Она равна ^ ССЛИ к'~кь1К' D9,19) 0, если k'-кф К, п где Л^ — число узлов в решетке. Верхнее равенство D9,19) получается сразу после использо- использования формулы D6,2). Нижнее соотношение можно получить, если сделать замену п на п + а, где а — любой вектор решетки. При больших значениях Af величина В при этой подстановке из- изменяться не может, так как такая замена эквивалентна смеще- смещению всех узлов решетки п п Если ft' — кфК, то очевидно, что В = 0. Мы видим теперь, что единственный отличный от нуля диаго- диагональный матричный элемент в D9,16) равен Величина U представляет собой средний потенциал в простран- пространстве решетки.
822 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V Раскрытие детерминанта D9,16) и_ решение уравнения при- приводит к единственному корню EW = U. В соответствии с урав- уравнением E4,4) ч. V, коэффициенты С* могут быть выбраны сле- следующим образом: 1) Cfcl = 1, Cfc2 = Cfc3 =* • • . =0, 2) С*2=1, <:*, = <:*,= ... =0 и т. д. Мы можем теперь "написать выражения для волновой функции и энергии. Они имеют вид = Eo {k) + Ukk = Ео {k) + JJ% Найденные формулы совпадают по форме с результатами, которые могли бы быть получены, если бы при указанном рас- расчете мы сразу пользовались теорией возмущений без вырожде- вырождения. Это происходит потому, что решением уравнения D9,16) является единственный корень EW = U. Можно получить поправку во втором приближении. Вос- Воспользуемся обычным выражением теории возмущений без вы- вырождения: Е (k) = E°(k) + U + У' ^p*%"J • D9,20) В соответствии с D9,18) и D9,19), матричные элементы отлич- отличны от нуля только при *-*' = #. Выражение D9,20) можно записать теперь в виде D9,21) Третий член в формуле D9,21) является малой поправкой, так что расстояние между ближайшими уровнями определяется практически формулой для свободных электронов. Если, однако, в одном из членов суммы в формуле D9,21) знаменатель обра- обращается в нуль, т. е. если при некотором К имеет место равенство k'2 -k? = K2- 2kK = 0, D9,22) то эта формула теряет смысл. Поправка к энергии E(k) оказы- оказывается не малой, и, использование теории возмущений недопу- недопустимо. Наличие больших слагаемых в D9,21) позволяет предпо- предполагать существование больших расстояний между соседними уровнями.
§ 49] ЭНЕРГЕТИЧЕСКИЙ СПЕКТР ЭЛЕКТРОНА 823 Соотношение D9,22) означает, что для некоторых векторов k и Ы выполнено равенство Допустим, что это равенство имеет место только при одном зна- значении К, т. е. при определенном значении k и k'. Это значит, что состояния электрона имеют почти равные энергии E(k) и E(k + + К), т. е. являются двукратно вырожденными. В этом случае для нахождения поправки к энергии следует воспользоваться теорией возмущений для двукратно вырожденных уровней. Таким образом, уравнение D9,16) запишется теперь в виде U-E{1\ Ukk> _ ' , =0. D9,23) С/*, г, ?/-?A) Раскрывая детерминант и решая уравнение, мы найдем для по- поправки к энергии: __ Это означает, что энергия претерпевает разрыв и что рас- расстояние между соседними уровнями равно 2]1/*, *'{. Очевидно, что разрыв энергии происходит при одновременном выполнении равенств D9,22"). Формулы D9,22") выражают хорошо извест- известные условия отражения Брэгга. Они выделяют в кристалле определенное направление избирательного (селективного) отра- отражения падающих на него лучей. Действительно, умножая верх- верхнее равенство D9,22") на векторы решетки я, &, с, мы убеж- убеждаемся в тождественности формул D9,22") и C6,18) ч. IV. Таким образом, в приближении квазисвободных электронов энергия как функция волнового вектора для кубического кри- кристалла имеет следующий ход: с ростом k она увеличивается по закону D9,21). Когда k достигает'значения kx=* ky = kz= ± -~, возникает брэгговское отражение. Энергия претерпевает разрыв, причем ширина запрещенной зоны равна 2U. После этого энер- энергия вновь выражается формулой D9,21). При kx = ky = kz= ± — энергия вновь претерпевает разрыв и т. д. На рис. 44 схематически изображен энергетический спектр квазисвободного электрона. Качественная картина энергетического спектра квазисвобод- квазисвободного и сильно связанного электрона совпадают. Различие заклю- заключается в том, что в первом случае получаются широкие дозво- дозволенные зоны и узкие полосы недозволенных энергий, во втором
824 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V "Л а Рис. 44. о случае, наоборот, узкие дозволенные зоны и широкие полосы запрещенных энергий. В реальных кристаллах реализуются как предельные случаи сильно связанных и квазисвободных электро- электронов, так и вся гамма промежуточных случаев. Однако во всех случаях энергетический спектр электрона в кристалле имеет ха- характер зон дозволенных значений энергий, разделенных облас- областями запрещенных значений энергии. Количественный расчет формы зависимости E(k) для реаль- реальных кристаллов является сложной задачей. Разработан ряд при- приближенных методов расчета зон, изложение которых может быть найдено в специальной литературе. В следующем параграфе нами будет показано, что общий результат, полученный водночастйчной модели, т. е. для случая движения одного электрона в кристаллической решетке, остается в силе и в кристал- кристалле, содержащем большое число электронов. Таким образом, энергетический спектр электронов в реаль- ~4х ных кристаллах имеет зон- зонный характер. ч Рассматривая движение электронов в периодическом поле, мы пренебрегали соб- собственными размерами ионов, считая их узлами кристалличе- кристаллической решетки. На первый взгляд кажется удивительным, что такое грубое приближение и вытекающая из него модель квазисвободных электронов является хорошим приближением к действитель- действительности. Размеры ионов не очень малы по сравнению с расстояниями между ионами. Обычно радиус иона составляет около половины атомного радиуса. В области пространства, занятой ионом, волновая функция электрона должна вести себя подобно волновой функции внутри атома. Электрон внутри атома имеет большую кинетическую энергию и соответственно малую длину волны. Поэтому его вол- волновая функция испытывает осцилляции. Очевидно, что такое поведение волновой функции значительно отличается от плав- плавного хода волновой функции квазисвободного электрона. Ока- Оказывается, однако, что если мы хотим описывать поведение вол- волновой функции электрона в области вне иона и не интересуемся детальным ходом ее во всем пространстве, можно воспользо- воспользоваться методом, подобным тому, который применяется в теории рассеяния при малых энергиях. Мы видели в §4K ч. V, что
§ 49] ЭНЕРГЕТИЧЕСКИЙ СПЕКТР ЭЛЕКТРОНА 825 в этом случае поведение частицы вне области, где ее потенциал велик (вне ядра или атома), не зависит от ее поведения внутри этой области. Поэтому истинную волновую функцию, являю- являющуюся решением уравнения Шредингера можно заменить фиктивной волновой функцией ср, удовлетво- удовлетворяющей уравнению с той же энергией и с измененной потенциальной энергией. Опе- Оператор Ups носит название псевдопотенциала. Если построить Ups так, чтобы вне области г < R он совпадал с Ups = U при г>#, то вне иона .функции г|э и ф удовлетворяют одному и тому же уравнению Шредингера. Подбирая соответствующим образом псевдопотенциал C/ps, можно добиться того, чтобы фиктивная вол- волновая функция ф плавно экстраполировалась в область г < R. Сглаженная волновая функция ф будет описывать движение электрона в кристалле. Вне ионных остатков она совпадает сф, а действие на ф поля в области г < R является слабым возмущением. Выбор псевдопотенциала не является вполне однозначной процедурой. Соответственно и ф могут иметь несколько различ- различный вид. - Часто для ф пользуются выражением 9-2v*'-26rOr(r)f D9,24) где Ф&' (г) — функции для внутренних состояний электрона в атоме* Эти функции сильно локализованы и при г > R факти- фактически обращаются в нуль. Поэтому здесь ф совпадает с волновой функцией квазисвободной частицы. Коэффициенты можно подо- подобрать из условия ортогональности ф и Ф*'. Подставляя D9,24) в уравнение Шредингера, можно затем подобрать выражение для псевдопотенциала Ups. В свете сказанного становится ясным, почему поведение электронов в решетке достаточно успешно описывается моделью квазисвободных электронов. В тех случаях, когда речь идет о свойствах электронов, свя- связанных с их движением по кристаллу как целому, поведение электронов можно описывать фиктивной волновой функцией ф. На эту функцию в областях г < R действует лишь слабое поле, тогда как при г># она совпадает с истинной волновой функцией.
826 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V В целом ф обнаруживает плавный ход, изменяясь на расстоя- расстояниях порядка постоянной решетки, как это и должно быть для квазисвободных частиц. Движение электрона по решетке металла и полупроводника можно характеризовать его средней (групповой) скоростью, ко- которая может быть найдена по общей формуле - do» дЕ (к) dk d(bk) * Если подставить вместо E(k) энергию квазисвободного элек- электрона, то мы приходим к формуле - = Ькх V* m ' В случае сильно связанного электрона средняя скорость имеет вид vx = -jj-— smkxa. Мы видим, что средняя скорость электрона отлична от нуля в обоих случаях. При этом сильно связанный электрон движет- движется с тем меньшей средней скоростью, чем меньше р, т. е. чем меньше ширина зоны. Предположим теперь, что кристалл помещен во внешнее элек- электрическое поле напряженностью 8. Энергия электрона в кри- кристалле будет равна E Среднее ускорение электрона I дЕ р оказывается совпадающим с ускорением свободной частицы. Смысл этого результата легко понять, если составить выражение для баланса энергии. Средняя работа поля над электроном равна —« е дЕ р С другой стороны, эта же работа идет только на увеличение энергии электрона dE = дЕ (k) dk dt dk dt # Приравнивая оба выражения для работы, приходим к выра- выражению dk е р При этом мы считаем, что увеличение энергии электрона проис*
§ 50] СИСТЕМА ЭЛЕКТРОНОВ В ТВЕРДОМ ТЕЛЕ 827 ходит в пределах данной зоны. Отсутствие у электрона потерь энергии приводит к разгону его полем. Иными словами, элек- электрон движется по идеальной решетке без всякого сопротивле- сопротивления. В § 61—62 будет показано, что основным источником со- сопротивления служат тепловые колебания решетки, нарушающие регулярность расположения атомов в ее узлах. § 50. Система электронов в твердом теле1) Мы можем теперь перейти к обсуждению свойств системы электронов в твердом теле. Число не локализованных электро- электронов, движущихся по всему объему кристалла, может варьиро- варьировать в весьма широких пределах от 0,1 до 1 на один атом. При таких высоких плотностях критерий вырождения элек- электронного газа [см. B,360 ] V 3/ N оказывается выполненным вплоть до температур порядка 4— 5 тысяч градусов. Это означает, что при такой высокой плотно- плотности электроны всегда образуют вырожденный ферми-газ. Если, однако, обратиться к сравнению кинетической энергии вырожденного ферми-газа с его энергией кулоновского взаимо- взаимодействия, то, как показано в § 79 ч. III, это отношение h2 I 3 N\Vt . e2 (N\XU( h2 \ , Smax It-J при у— 1023. Таким образом, кулоновское взаимодействие между электро- электронами в металле является сильным и следовало было бы гово- говорить об электронной жидкости, а не об электронном газе, за- заполняющем металл. Однако, поскольку эта жидкость образована электронами, движущимися на фоне положительно заряженных ионов, в действительности еще правильнее говорить о плазме, за- заполняющей объем твердого тела. Важнейшим отличием плазмы твердого тела от газовой плазмы является то, что она является вырожденной и квантовые эффекты в ней играют важную роль. Тем не менее, как мы сейчас в этом убедимся, важнейшие свой- свойства квантовой вырожденной и классической плазмы оказы- оказываются близкими. Это по крайней мере относится к свойствам экранировки и существованию плазменных волн. Чтобы не *) См. Д. 3 а й м а н, Принципы теории твердого тела, «Мир», 1966.
828 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V усложнять выкладок, мы ограничимся приближением, в котором заряд положительных ионов можно считать равномерно «разма- «размазанным» по всему кристаллу и образующим положительный фон. Учет дискретного распределения положительных зарядов не вно- вносит существенного изменения в получающийся результат. Рассмотрим систему свободных электронов с функцией рас- распределения f(e) и положительный фон в некотором объеме, на который действует внешнее переменное поле. Будем считать, что приложенное внешнее поле создает в системе потенциал Ф = Нт f f <рDг, vtie'to'-v'Wtdqd®. E0,1) 6->0 j j Здесь ф(</, со) представляет компоненту Фурье. Множитель е6' означает, что поле адиабатически (медленно) включается за промежуток времени от t-*—оо до t = 0. При таком включении поля оно не будет вызывать в системе переходов вплоть до мо- момента t = 0. При t > 0 в системе будут происходить переходы или, иными словами, возникает отклик на приложенное возму- возмущение. Этот отклик удобно характеризовать диэлектрической проницаемостью е(<7, соI). Для вычисления е(<7, со) удобно выра- выразить ее через плотность заряда, индуцируемого в системе внеш- внешним полем. Пользуясь формулой C1,12) ч. IV и очевидными выра- выражениями для закона Ома и уравнения непрерывности в фурье- компонентах 7, со), iqj(q, со) = шр(?, со), и соотношением E(q, со)=-*<}чр(<7, cd), где ф(<7, со)—фурье-компонента скалярного потенциала, полу- получаем Дальнейшая задача заключается в вычислении фурье-компонен- ты плотности заряда р(^, со). С этой целью рассмотрим свободный электрон, находящийся в начальном состоянии с волновым вектором k и энергией e(k). Волновая функция электрона в невозмущенном состоянии может быть написана в виде t *?(*)* f * ttir h l) He смешивать е(^, со) с энергией электрона
§ 50] СИСТЕМА ЭЛЕКТРОНОВ В ТВЕРДОМ ТЕЛЕ 829 Рассмотрим возмущение, создаваемое внешним полем с часто- частотой со, т. е. положим, что возмущенный гамильтониан имеет вид Н' = lim ecp (<7, <o)(e<V №-<*» + е*№+<*»). б->0 При таком включении поля оно не будет вызывать в системе переходов во все времена вплоть до ? =0. При t>0 под влия- влиянием возмущения свободный электрон приобретает волновую функцию г|> (t) = % + c{ (t) %+q + c2 (t) %_q. E0,3) В первом порядке теории возмущений (ср. § 55 ч. V) для С\ и с2 имеем Матричный элемент берется по не зависящим от времени вол- волновым функциям. Он равен (Н')* = = ^Ф (Я, «>) [ J е-' <*+*> те* (яг-^)е1дг dy +...] = eq> {q, со) е+ ш. Аналогично Таким образом, Множитель e6t обеспечивает сходимость интегралов на нижнем цределе. Выполняя интегрирование, и переходя затем к пределу 6-^0, находим окончательно для cx(t) ¦j{e(k)-e(k+q)+h(i)}t Аналогично, ) е Найдем теперь электронную плотность в системе свободных электронов, индуцированную возмущением. Очевидно, что для одного электрона можно написать индуцированную плотность заряда в виде
830 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V При этом мы опустили члены второго порядка малости с\ и с\. Подставляя значения с\ и с2 из E0,4) и E0,5), находим бр = Лр (<}г, о) (е-1 <*г+ «« + е-1 <*'- «*>) X Х е (к) - е (к + q) + Йсо + е (Л) -е (k-q) -fico * Полная плотность заряда, индуцированного в системе электро- электронов внешним полем, равна J f(k)dk Г ~r J 0/> + сопр.) X Г f(k' + q)dk' , со) • (e*«r-o + tf^^)J e J^-i^X dk. E0,7) При этом мы во втором интеграле произвели замену переменных k-**kf + q' и затем k'-+k. Подставляя это значение р в E0,2), находим Диэлектрическая проницаемость представляет основную харак- характеристику вещества. Пользуясь формулой E0,8), можно найти реакцию системы на произвольное возмущение плазмы. Исследуем предельные случаи со->0 (постоянное поле) и E(k)—E(k + q) (высокочастотное поле). При со-^0 *- E0,9) Мы ограничимся при этом случаем длинных волн q < k. Тогда находим де E0,10) Поэтому i^J(|)ipi)) E0,11) где р{гр)—плотность уравнений на поверхности Ферми f-sj. E0,12)
§ 50] СИСТЕМА ЭЛЕКТРОНОВ В ТВЕРДОМ ТЕЛЕ 831 При этом мы использовали свойство распределения Ферми /(е), имеющего при низкой температуре вид ступенчатой функции (см. § 80 ч. III). При не малых значениях q вычислений е(#, со) является бо- более сложным, но не вносит качественного изменения в харак- характер этой величины1). Посмотрим теперь, какой вид имеет поле точечного заряда в среде с диэлектрической проницаемостью E0,12). Если заряд покоится или медленно движется, то его потенциалу в пустоте е2 — отвечает компонента Фурье Фо(<7) = ^. E0,13) Потенциал заряда в среде может быть написан в виде где дебаевская длина /d равна Формула E0,14) показывает, что как и в классической плаз- плазме, поле заряда в квантовой плазме оказывается экранирован- экранированным. Однако вместо дебаевского радиуса 1/х (§ 41 ч. IV) в вы- вырожденной квантовой плазме длина экранирования дается фор- формулой E0,15). Оценка показывает, что Id составляет 1—2 А. Таким обра- образом, экранирующее влияние плазмы обеспечивает спадание сил взаимодействия на расстояниях порядка среднего расстояния между электронами в металле. Экранирование заряда элек- электрона имеет наглядный смысл: вблизи каждого данного элек- электрона концентрация остальных электронов оказывается пони- пониженной. Это понижение концентрации обусловлено как чисто кулоновским взаимодействием, так и обменными силами. По- Последние неявно фигурировали в расчете диэлектрической прони- проницаемости: использование распределения Ферми соответствовало учету принципа Паули и связанных с ним обменных взаимо- взаимодействий. Медленное движение электрона через плазму сопровождает- сопровождается «разбеганием» электронов с его пути. Таким образом, в дей- действительности по плазме движется не электрон, а целая группа !) См., например, Д. П а й н с, Элементарные возбуждения в твердых те- телах, «Мир», 1965. D. Pines, Elementary exitations in solids, W. Benjamin, N1—-Amsterdam, 1963.
832 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V частиц, несущая суммарный заряд, равный заряду электрона. Это образование, состоящее из электрона и облака движущихся вместе с ним (или от него) электронов на фоне положительного фона, образованного ионами, может рассматриваться как неко- некоторая квазичастица с зарядом е и эффективной массой т*. Как будет видно из дальнейшего, вклад в эффективную массу вно- вносит не только взаимодействие с электронами, но с фононами решетки. Существование экранирования имеет важное значение для понимания явлений, происходящих в металлах. Именно, благо- благодаря экранированию силы взаимодействия между электронами, находящимися на сравнительно малых расстояниях, существен- существенно уменьшаются. К обсуждению этого вопроса мы вернемся несколько ниже, а пока рассмотрим, какой вид приобретает e(q, со) при высоких частотах. Для этого преобразуем E0,8) несколько иначе, написав при со-»оо: + 8 (k) - e (к + q) + Йсо ^ 8 (к) - е (к - q) - Йсо — (ЙсоJ Поэтому для е (q, 0) поЛучаем при со-*оо: efo, <d)->1—$, E0,16) где через сор обозначена величина [К) — е (k + q) — 8 (k — 9)] ^й. E0,17) Можно написать, разлагая e(ft + q) в ряд, Таким образом, о 4яМ?2 Мы при этом воспользовались формулой D9,14) для определен ния эффективной массы. Сравнивая сор с частотой плазменных колебаний классической плазмы D6,16) ч. IV, мы убеждаемся в их тождественности. Дисперсионное уравнение, определяющее связь между частотой и волновым вектором, согласно C3,18)
§50] СИСТЕМА ЭЛЕКТРОНОВ Ё ТВЕРДОМ ТЕЛЕ 833 ч. IV имеет вид е(<7, со) = 0- При этом мы считаем плазменные волны продольными (ср. § 33 ч. IV). Это дает @==@р. Таким образом, в квантовой плазме, так же как в классиче- классической, могут существовать незатухающие (точнее, не затухаю- затухающие в нашем приближении) плазменные колебания. Смысл этого результата тот же, что и в классической теории плазмы: если сдвинуть достаточно большую группу отри- отрицательно заряженных частиц с массой т* относительно непо- неподвижного положительно заряженного фона, то сдвинутые ча- частицы начнут совершать колебания около положения равнове- равновесия с плазменной частотой. Если бы мы не ограничивались первым членом разложения в знаменателе E0,8), то вместо E0,16) для частоты со(<7) было бы получено более сложное дисперсионное уравнение, из кото- которого следует, что возможны квантованные плазменные колеба- колебания с частотами, отличными от сор. Кванты плазменных колеба- колебаний получили название плазмонов. Посмотрим теперь, каковы энергетические условия возбу- возбуждения плазменных колебаний. Для того чтобы электрон мог возбудить коллективные коле- колебания в системе, т. е. излучить квант с частотой сор и волновым числом </, необходимо, чтобы был выполнен закон сохранения энергии h2k2 Ь2 (к - дJ ь 2т 2т ~~ ШР ИЛИ ~ Bkq - q2) = йор. E0,18) Поскольку для электронов волновой вектор \k\ не превышает его значение на поверхности Ферми kF, мы видим, что условие E0,18) не выполняется при малых значениях q. Это означает, что возбуждение плазменных колебаний в системе свободных (йрГП (Ир электронов возможно только при 4>-ъг- — —> где vF—ско- рость на поверхности Ферми. Энергия кванта плазменных ко- колебаний йюр ~ 20 эв. Это означает, что отдельный электрон с термической энергией не может возбудить плазменные коле- колебания в металле. Это и не удивительно — плазменные колеба- колебания отвечают коллективному движению больших групп частиц. 27 В. Г. Левин и др., том II
834 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V Если, однако, ввести в металл заряженную частицу, например, электрон, обладающую достаточно большой энергией, то такая частица может возбудить рассмотренные здесь плазменные ко- колебания. Это обстоятельство позволило успешно осуществить опыты с возбуждением колебаний в-плазме твердых тел. Из сказан- сказанного не следует, однако, сделать вывод о том, что плазменные колебания вовсе отсутствуют в системе электронов в металле. В отличие от классической плазмы, в квантовой плазме могут существовать нулевые колебания, имеющие энергию—^-. Это — нулевые кванты или нулевые плазмоны. В нулевых колебаниях участвуют коррелированным обра- образом большие группы электронов. Оценим размеры этой области по порядку величины. Длина волны, включающей группу частиц A,min = —> должна быть больше среднего расстояния экранирования lD. Пользуясь E0,18) и E0,15), получаем Более короткие плазменные волны не могут реализоваться. Можно сказать, таким образом, что в плазменных волнах участвуют электроны, находящиеся на сравнительно больших расстояниях, больших чем Jimin. Мы располагаем теперь необходимыми сведениями о системе электронов в твердом теле и можем сделать более обоснованное суждение о роли взаимодействия между ними в общем поведе- поведении системы. Запишем часть гамильтониана, характеризующую взаимодействие между электронами в виде двух слагаемых: Se2 ^Sk^ (P ^С в2 1Ф Iх п 1Ф I ' ' * 1ф/ ' ' ' I ri-ri | > ^min \rt"ri\<'Km\n Первая сумма включает в себя только слагаемые, у которых расстояние между частицами больше A,min. Это взаимодействие при низких энергиях электронов s < bf приводит к возникнове- возникновению нулевых плазменных колебаний. Эта сумма вносит неко- некоторое постоянное слагаемое в полный гамильтониан. Вторая сумма распространяется на пары, находящиеся внутри сферы экранирования. Такие пары взаимодействуют между собой по закону E0,14). Поэтому соответствующее слагаемое дает лишь очень малый вклад в полный гамильтониан. Расчет показывает, например, что изменение теплоемкости электронного газа, обус- обусловленное экранированным взаимодействием, составляет всего
§ 51] МОДЕЛЬ МЕТАЛЛА, ПОЛУПРОВОДНИКА И ДИЭЛЕКТРИКА 835 несколько процентов. Таким образом, общий вывод, который можно сделать из приведенных выше рассмотрений, сводится к тому, что благодаря эффекту экранирования влияния взаимо- взаимодействия между электронами на свойства твердого тела оказы- оказывается сравнительно не существенным. Это особенно относится к электронам с энергией, близкой к энергии Ферми. У этих электронов всегда имеется возможность оттолкнуть от себя облако электронов и двигаться вместе с этой «негативной» или «дырочной» шубой. Расчет показывает, что такое образование обладает значи- значительным временем жизни. Это обстоятельство позволяет счи- считать образование (электрон + облако) стабильной квазичасти- квазичастицей. Большое время жизни связано с принципом Паули, кото- который мешает электронам, входящим в облако «шубу», изменять свое состояние. Появление подвижных квазичастиц тесно свя- связано с тепловым возбуждением системы, когда в ней происхо- происходят переходы электронов в незаполненные состояния. Поэтому систему электронов при Т ф 0 можно рассматривать как элек- электронную жидкость, в которой движутся элементарные тепло- тепловые возбуждения. Эти возбуждения (или квазичастицы) дви- движутся независимо друг от друга, обладают зарядом (—е), мас- массой /п* и спином 1/2 и подчиняются статистике Ферми. Для краткости мы будем называть эти квазичастицы электронами. Подчеркнем, что неучтенные факторы, например, дискретное распределение положительного заряда, не изменяет полученного качественного вывода. Взаимодействие электрона (квазичастицы) с фононами, как мы увидим ниже, приводит к образованию вокруг него облака, «шубы» фононов, которое движется вместе с ним, изменяя его массу, так что m*-*nf*. Взаимодействие между электронами непосредственно проявляется в ряде эффектов, например, в из- изменении скорости звука в металле по сравнению с диэлектри- диэлектриком. И тем не менее, характер этого взаимодействия показы- показывает, почему модель идеального газа свободных электронов правильно передает основные свойства системы электронов в металлах. Экранирование существенно уменьшает взаимодей- взаимодействие между электронами. Главный эффект взаимодействия сво- сводится к изменению эффективной массы. § 51. Модель металла, полупроводника и диэлектрика Мы можем перейти теперь к обсуждению свойств системы электронов в твердом теле. На основании результатов предыдущего параграфа при качественном описании поведения системы электронов ее можно заменить системой квазичастиц —фермионов. В дальнейшем мы 27*
836 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V будем именовать их электронами, что, однако, не должно при- привести к недоразумению. Прямые измерения (см. ниже) позво- позволяют определить число нелокализоваиных электронов в 1 смг. У так называемых «хороших» металлов, таких как металлы щелочных и щелочноземельных элементов, серебра, меди, зо- золота и ряда других, число нелокализованных электронов в 1 смг примерно равно числу атомов, т. е. число таких электронов, приходящихся на один атом, равно единице. У ряда металлов число «свободных» электронов, приходя- приходящихся на один атом, оказывается значительно меньшим еди- единицы. Кроме того, проявляется существенная анизотропия, так что свойства системы электронов в разных кристаллографиче- кристаллографических направлениях оказываются различными. В виде примера можно привести висмут, обладающий резкой анизотропией в электрических и магнитных свойствах. У неметаллов число «свободных» электронов на один атом оказывается столь малым, что система электрона образует невырожденный идеальный газ. Наконец, у ряда хороших ди- диэлектриков, например, в NaCl или твердом кислороде, свободных электронов практически нет. Хотя плотность свободных элек- электронов имеет решающее значение для поведения системы элек- электронов в твердом теле, было бы неверным считать, что все различие между металлами, полупроводниками и изоляторами сводится к изменению этой характеристики и имеет количе- количественный характер. В действительности оно имеет глубокий смысл. Это видно, например, из качественного различия в ме- механизме электропроводности или в магнитных свойствах ме- металлов, полупроводников и диэлектриков. Глубокое различие в их физических свойствах связано с разным характером энер- энергетического спектра электронов. Мы видели, что электронный спектр в кристалле имеет ха- характер чередующихся зон дозволенных и недозволенных энергий. Напомним, что в каждой зоне дозволенных энергий имеется ограниченное число состояний. Именно, в ней имеется 2N со- состояний, где N— число элементарных ячеек в единице объема и множитель 2 связан с двумя электронами, заполняющими каждое состояние. Если все состояния зоны дозволенных энер- энергий попарно заполнены электронами, то они не могут изменять состояние и переходить из одного состояния в другое под дей- действием приложенного внешнего поля. Такое тело ведет себя как изолятор. Если же в дозволенной зоне только часть со- состояний заполнена электронами, то переходы между состоя- состояниями возможны и тело ведет себя как металл. Рассмотрим схематически образование металла из разде- разделенных невзаимодействующих атомов. Пусть в последних име- имеется один валентный электрон на верхнем уровне энергии. Это
§ 51] МОДЕЛЬ МЕТАЛЛА, ПОЛУПРОВОДНИКА И ДИЭЛЕКТРИКА 837 состояние будет двукратно вырожденным, поскольку энергия электрона не зависит от ориентации его спина. В системе, со- состоящей из N независимых невзаимодействующих атомов, соот- соответствующий уровень энергии будет 2М-кратно вырожденным. При сближении атомов и установлении взаимодействия между ними уровень распадается на 2N смежных уровней, образую- образующих сплошную полосу. Половина этих уровней энергии будет Зонёпрово- ^ йитсгпи t f * а ^07 уродень Рис. 45. Л 2N-KpamHbiu уровень Рис. 46. заполнена парами электронов, половина — свободна. Таким об- образом, нижняя полоса энергетических уровней, называемая зо- зоной проводимости, возникает из нижних энергетических состоя- состояний валентного электрона. Возбужденные состояния валентного электрона, расщепляясь на большое число уровней, образуют другие зоны, не заполненные электронами (рис. 45). В некото- некоторых случаях, изображенных на рис. 46, расширение полос так велико, что они перекрываются друг с другом. Между поло- полосами дозволенных энергий лежат полосы недозволенных энер- энергий. Образовавшийся кристалл будет обладать металлическими свойствами, поскольку незаполненные состояния непосредствен- непосредственно прилегают к заполненным состояниям. Такой случай имеет место у щелочных металлов, меди, серебра и некоторых других металлов.
838 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V Предположим теперь, что е; атрме имеются два внешних электрона, находящихся в одном энергетическом состоянии с противоположно ориентированными спинами. Состояние элек- электронов в атоме будет невырожденным. Соответствующее состоя- состояние системы из N невзаимодействующих атомов будет Л/-кратно вырожденным. При образовании кристалла оно распадается на N близких уровней, попарно заполненных электронами N уродней Г++- N-нра/пный t/родеиь Рис. 47. Л В N-кратньщ Рис. 48. (рис. 47). Кристалл с таким расположением уровней является изолятором. В нем заполненные уровни энергии отделены от заполненных уровней областью недозволенных энергий с интер- интервалом Де. Для того чтобы тепловое возбуждение могло пере- перевести электрон из заполненного в незаполненное состояние, тепловая энергия должна быть порядка Д?. То же относится и к возбуждению электронов электрическим полем. Значения со- соответствующей температуры или напряженности поля оказы- оказываются очень большими. При обычных температурах и полях электроны остаются на заполненных уровнях и не могут пере- переносить тока. Таким образом, диэлектрик отличается от металла не общим числом электронов, а характером расположения по- полос дозволенных энергий.
§ 521 МАГНИТНЫЕ СВОЙСТВА МЕТАЛЛОВ 839 Однако из скааанцого не следует делать вывод о том, что любые атомы с двумя внешними электронами образуют при своем объединении кристалл изолятора. Помимо разобранного случая, возможно также расположе- расположение полос, изображенное на рис. 48. Благодаря перекрыванию полос, возникающих из нормального и возбужденного состоя- состояний атома, незаполненная полоса непосредственно прилегает к заполненной. Вещество такого типа — металл. Подобными ме- металлами являются щелочноземельные металлы, свинец и ряд других. Современная теория не позволяет заранее сказать, ка- какой из этих двух случаев реализуется при объединении атомов с данными свойствами. Само собой разумеется, что разделение кристаллов на металлы и диэлектрики охватывает лишь два предельных случая. Вся гамма промежуточных свойств между металлами и диэлектриками заполняется полупроводниками. У последних ширина запрещенной 'зоны сравнительно мала и становится сравнимой с энергией теплового возбуждения при сравнительно невысоких температурах. § 52. Магнитные свойства металлов. Парамагнетизм электронного газа Оказалось, что целый ряд важных результатов может быть получен из простейшей модели металла, в которой металл рас- рассматривается как некоторый потенциальный ящик с бесконеч- бесконечно высокими стенками, заполненный газом свободных элек- электронов. В частности, эта грубая схема оказывается достаточной для описания тепловых свойств металлов. Оказалось, что магнитные свойства металлов определяются в первую очередь поведением нелокализованиых электронов. При этом взаимодействие электронов с решеткой оказывает сравнительно незначительное влияние на магнитные свойства металлов. Рассмотрим поведение вырожденного электронного газа, по- помещенного в магнитное поле. Оказывается, что в такой системе проявляются два основных эффекта. Один из них связан с на- наличием у электронов спина, а второй — с квантованием орби- орбитального движения электрона в магнитном поле. Мы начнем с первого эффекта. При наложении внешнего магнитного поля возникает преиму- преимущественная ориентация спиновых магнитных моментов в поле. В результате этого в системе возникает намагничивание. Для вычисления магнитной восприимчивости напишем преж- прежде всего выражение для свободной энергии свободных элек- электронов в магнитном поле.
840 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V Имеем по формуле Гиббса — Гельмгольца C0,12) ч. III г \^ E2,1) О где -—— V Г е kT +1 Суммирование ведется по всем (т. е. по двум) возможным ориентациям спинового магнитного момента ju,0 относительно поля Я. Напомним, что в отсутствие магнитного поля уровни энергии были вырождены и вместо суммирования в выраже- выражении для энергии (80,2) ч. III стоял множитель 2. Таким образом, - Г s <t. l Г е лг +1 е лг +1 После подстановки E2,3) в E2,1) приходим к вычислению интегралов типа С edy Г dT f_^Y_ Г J BяЙK J / е-Ц+НоЯ \ J Bя^K J e(e- 0 U лг J i , i = Г Д?У Г (e-ii + [ioH)du ¦ Г rfy Г (fx J BЯЙK J е(е~ц+М.оЯ) и + j "T" J BяЙK J е(е- е-Ц+М.оЯ \ где iV(pi — \xqH) — число частиц. Поэтому для свободной энер- энергии можно написать \^[ ) E2,4) kT Рассмотрим случай слабого магнитного поля, для которого имеет место неравенство -ТЕГ<1- E2,5)
§ 52] МАГНИТНЫЕ СВОЙСТВА МЕТАЛЛОВ 841 Разлагая E2,4) в ряд по степеням этой малой величины, по- получаем F = Щ - 2kT J -j^r In Вычислим интеграл 7^ ^ О Интегрируя два раза по частям, имеем в силу свойства распределения Ферми [см. (80,7) ч. III]. По- Поэтому и для свободной энергии получаем 15Bя»)» Ij^" • (б2>7) Магнитная восприимчивость, связанная с ориентацией спи- спинов, согласно A8,3) ч. IV, равна )*/2 лг- Формулу для восприимчивости можно записать в другом виде: где для пЭфф — эффективного числа непарных электронов, мы воспользовались формулой (80,17) ч. III. Последнее выражение имеет наглядный смысл. Именно, E2,9) совпадает с восприимчивостью газа, состоя- состоящего из /гЭфф частиц, свободно ориентирующихся в магнитном поле и имеющих собственный магнитный момент \х0. Мы видим, что электронный газ обладает спиновым пара- парамагнетизмом, не зависящим от температуры. Подчеркнем, что этот результат тесно связан с вырождением электронного газа.
842 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V § 53. Диамагнетизм электронного газа Оказывается, однако, что наряду со спиновым парамагне- парамагнетизмом электронный газ обнаруживает орбитальный диамагне- диамагнетизм. Орбитальный диамагнетизм, открытый Ландау, не имеет столь наглядного характера, как спиновый парамагнетизм. Для вычисления магнитной восприимчивости, связанной с орбиталь- орбитальным движением, необходимо найти свободную энергию элек- электронного газа в магнитном поле. Для этого в свою очередь следует найти энергию свободного электрона в однородном маг- магнитном поле. Рассмотрим решение уравнения Паули в простейшем случае движения свободного электрона в однородном магнитном поле. Выберем направление поля за ось z и представим вектор-по- вектор-потенциал в виде1) Уравнение Паули для стационарного движения можно напи- написать в виде Из уравнения E3,1) следует прежде всего, что координатная и спиновая волновые функции являются независимыми. Оператор вида constsz не действует на переменные (х, у, г), так что уравнению E3,1) удовлетворяет волновая функция вида Ф = ф($г)Ф(*, У, г). E3,2) Поскольку координаты, х и z в уравнение E3,1) явно не вхо- входят, можно попытаться искать решение его в виде O«e«*(V+V)j(jf), E3,3) Компоненты импульса рх и рг в направлении осей х и z сохра- сохраняются: рхН - Нрх = 0, р2Н - Нрг = О и могут пробегать непрерывный ряд значений. Подставляя E3,3) в уравнение E3,1), получаем E3,4) ]) Это представление вектора-потенциала для наших целей удобнее, чем A9,16) ч. I. Ясно, что оба выражения равноправны.
§ 53] ДИАМАГНЕТИЗМ ЭЛЕКТРОННОГО ГАЗА 843 где обозначено liLy E3,5) тс ' Уравнение E3,4) формально совпадает с уравнением дви- движения линейного гармонического осциллятора с частотой со (равной циклотронной частоте), колеблющегося около поло- положения равновесия уо. Поэтому, не повторяя выкладок § 10 ч. V, можно написать E1 = (n + ±)h(* E3,6) или ( ) ( 4 ~ ^Я <53>7> и \е\Н __ 2 С (у) = Я„ [о (t/ - у0)] е~ ™ ^, E3,8) где Нп — полиномы Эрмита. Поскольку полиномы Нп быстро уменьшаются с ростом ®(У — Уо) и становятся малыми при(#—#0)>"]/ — [ср. A0,2) и A0,15) ч. V], в однородном магнитном поле частица свободно движется в направлении оси z и совершает движение в ограни- ограниченной области /?/? <53>9> Движение в ограниченной области соответствует классическому движению заряда по окружности с циклотронной частотой. 2 Движению вдоль поля отвечает энергия —, движению в плоскости (ху у)—квантованная энергия Е±. Энергия электрона не зависит от значений импульса рх, так что состояния являются вырожденными. Мы применим эти результаты к движению электрона в об- области пространства, ограниченной вдоль оси у. При этом ком- компонента импульса рх, в отличие от компоненты /?z, не может принимать произвольных значений. Действительно, положение точки «равновесия» уо не может выйти за пределы размеров области в направлении оси у. Поэтому из E3,5) следует, что — L. E3,10) с
844 теория твердого тела [гл. v Зная энергию отдельного электрона, которая слагается из двух независимых частей—энергии орбитального движения и энер- энергии, связанной с собственным магнитным моментом, мы можем написать свободную энергию электронного газа. Именно, мы мо- можем положить: F = F0 + Fs + Fop6, E3,11) где Fo — свободная энергия в отсутствие поля, Fs — часть сво- свободной энергии, обусловленная спиновым магнитным моментом и найденная выше, a F0Th — вклад в свободную энергию орби- орбитального движения г E3,12) Своеобразие рассматриваемой системы заключается в том, что импульс pz в направлении поля изменяется непрерывно, тогда как движение в плоскости (ху) квантовано. Поэтому по импульсу производится интегрирование, причем dy' = ^пЪ)* ' При данной энергии еп состояния орбитального движения в плоскости (ху) вырождены. Кратность вырождения Q(en) равна р\ где импульс р\ отвечает движению в плоскости ху при данной энергии Е±. Иными словами, можно сказать, что кратность вырождения уровня энергии Е± определяется большим, но дискретным (при конечном размере металлического образца в направлении х) числом возможных значений рх. Написав очевидное соотношение мы видим, что р± может изменяться (при данном Е±) в интер- интервале от р{ = ]/4т|я0Я до р2=у 4m[i0H [n + у) . Отсюда находим Тот же результат следует из E3,10)
53] ДИАМАГНЕТИЗМ ЭЛЕКТРОННОГО ГАЗА 845 Подставляя в E3,12) значения dy' и Q(en), находим 00 оо Г 4nmti0HV Г , V 1 I оо /г=0 E3Д4) Рассмотрим случай слабых полей, когда выполнено неравен- неравенство E2,5). В этом случае логарифмическая функция аргумента мало изменяется при изменении п на я + у. Поэтому суммирование можно заменить интегрированием по формуле Эйлера (jJ л=0 О С помощью формулы Эйлера находим In 1+ехр L оо I ^ dx In I + ехр - J I n L 1 kT 24 *Г откуда —оо 0 Г 1+ехр оо Г J рЦ e ftr -1 о2 и + /со t c\ ' E3>15) В первом интеграле введем новую переменную и ¦= 2ц0Нх, а во втором положим е = -—. Тогда без труда найдем J \ — оо 0 я Bт)''г (Цо/УJ —^i^— kT Bя) Bш)% К Г f Г f у-и-рЦ2т J dpz\ dMln[l + exp| м-±— 0 оо Г rfe 1 /ко J TT~S~— E3>
846 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V Первое слагаемое в E3,16) не зависит от магнитного поля и не дает вклада в магнитную восприимчивость. Интеграл во втором слагаемом для сильно вырожденного электронного газа можно согласно (80,7) ч. III написать так: ekT Восприимчивость электронного газа, связанная с орбитальным движением, оказывается равной ^2? _ дН — 3BзтЙK ' \00>и) Мы видим, что орбитальная магнитная восприимчивость от- отрицательна, т. е. отвечает диамагнетизму электронного газа. Сравнивая E3,17) и E3,8), легко убедиться, что I %orb I = * ^s' Поэтому полная восприимчивость электронного газа оказы- оказывается равной 2 8яBш)8/2 «,/— /с-о 1ОЧ X HV> E3,18) Оказывается, что это значение х хорошо согласуется с опыт- опытными данными. Более подробное рассмотрение, связанное с учетом влияния кристаллической решетки, не изменяет общего результата. Под- Подчеркнем, что при вычислении диамагнитной восприимчивости мы считали магнитное поле слабым. В сильных магнитных полях, когда неравенство E2,5) не выполняется, магнитная восприим- восприимчивость оказывается функцией напряженности поля. Эта функ- функция имеет осциллирующий характер (эффект де Гааза — Ван Альфена). Эти осцилляции связаны с изменением с полем энер- энергии Е± и соответствующим изменением заполнения уровня Ферми !). § 54. Ферромагнетизм Ферромагнитные свойства, как было подчеркнуто в ч. IV, обнаруживаются только у сравнительно небольшого числа ме- металлов в кристаллическом состоянии. Именно, ферромагнит- ферромагнитными оказываются только металлы с незаполненными внутрен- внутренними оболочками и некоторые сплавы. 1) См., например, Д. 3 а й м а н, Принципы теории твердого тела, «Мир», 1966.
§ 54] ФЕРРОМАГНЕТИЗМ 847 При макроскопическом описании свойств ферромагнитных тел подчеркиваемся в первую очередь существование очень большой и постоянной намагниченности. При более детальном описании главной особенности ферро- ферромагнитных тел является корреляция в ориентациях магнитных моментов. С этой точки зрения ферромагнитными свойствами обладают как собственные ферромагнетики, так и антиферромагнетики и ферримагнетики. Иными словами, в широком смысле, ферро- ферромагнетиками являются все сильно намагничивающиеся вещества. Измерение отношения магнитного, момента к механическому показали, что у ферромагнитных веществ оно равно -|—, т. е. отвечает спиновой природе магнитного момента. Это показывает, что сильное намагничивание связано с взаимодействием спино- спиновых моментов электронов. Совокупность двух основных фактов — спиновой природы и намагничения и решающей роли незаполненных атомных обо- оболочек, приводит к следующей схеме явления: энергетический спектр электронов в ферромагнитных металлах имеет две по- полосы. Одна из них, образованная сильно взаимодействующими валентными электронами, имеет большую ширину и является полосой проводимости. Другая возникает при взаимодействии электронов в незаполненных оболочках. Это взаимодействие яв- является сравнительно слабым, поскольку перекрытие волновых функций внутренних электронов мало. В соответствии с фор- формулой D9,13) ширина этой полосы мала и она не может отве- отвечать за проводимость. Однако выше (§ 19 ч. IV) мы видели, что спин электронов незаполненных оболочек легко поворачивается. Поэтому срав- сравнительно слабое взаимодействие между электронами может приводить к упорядоченному расположению их спинов. Детальное рассмотрение этого взаимодействия — сложная задача. Мы ограничимся обсуждением следующей модели ферро- ферромагнетика: пусть имеется решетка правильно расположенных атомов, имеющих один электрон в s-состоянии, спин которого может иметь две ориентации. В отсутствии взаимодействия сим- метризованная волновая функция системы N электронов имеет вид [ср. F5,6) ч. V)] 1 где векторный индекс / означает номер атома, ф(|) спиновую вол- волновую функцию, отвечающую «правильному» положению спина. Положим, что в основном состоянии системы все спины имеют одну и ту же ориентацию, например, +1/2. Такая
848 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V полностью упорядоченная ориентация спинов отвечает предель- предельному намагничиванию системы. Ниже мы увидим, при каком условии такое состояние системы будет отвечать минимуму энер- энергии системы. Взаимодействие между электронами приводит к нарушению правильности ориентации их спинов. Часть спинов оказывается ориентированной неправильно. Малость возмущения означает, что число неправильно ориентированных спинов весьма мало по сравнению с полным числом спинов. Рассмотрим возмущенное состояние, в ^котором неправильно ориентирован один электрон, например, у m-го атома. Волновая функция такого состояния может быть написана в виде " ™" E4,2) где штрих в знаке произведения означает отсутствие одного множителя. Поскольку система является вырожденной (т. е. не- неправильно ориентированный спин может принадлежать любому атому), по общим правилам теории возмущений для вырожден- вырожденных систем, волновую функцию следует представить в виде W = 2cm?m. E4,3) Дальнейший расчет совпадает с приведенным в § 49. Все раз- различие сводится к учету антисимметрии волновой функции E4,2). Поскольку перекрытие волновых функций мало, мы ограни- ограничимся учетом взаимодействия электронов только атомов бли- ближайших соседей [т. е. взаимодействием электрона m-го атома с электронами (т—1) и (т+1) атомов]. Тогда, аналогично D9,8), можем написать систему линейных уравнений (?' -?0 + a)cm+2p (т') ст+т> = 0, E4,4) т' 2 т' где Е' — энергия возмущенного состояния, Ео— энергия основ- основного состояния, а а и р — кулоновский и обменный интегралы, Р = Рт, т+1 ^ Рт, т-\ ~ = -1С+. (rm+i) С Ы w*m+i К) Фж К) dvm dvm+v Здесь Ur — энергия взаимодействия между электроном и m-го атома и электронными атомным остатком (т + 1) или (т— 1)-го атома.
§ 54] ФЕРРОМАГНЕТИЗМ 849 Решение E4,4) гласит [ср. D9,9)] cM~eikm9 E4,5) где вектор к определяется условиями периодичности. Поэтому волновая функция 4l = ^eikm4m. E4,6) Для энергии возбужденного состояния в случае кубического кристалла получаем Ег = Ео — а — 2р (cos kxa + cos kya + cos kza). E4,7) Малым энергиям возбуждения отвечают малые значения век- вектора Л, так что Р2?2 ^2?2 * й /ал о\ т = jjr. F4,8) Волновая функция E4,6) и энергия E4,8) допускают нагляд- наглядное истолкование. Мы видим, что энергия возбуждения связана с обменным взаимодействием электронов. Для того чтобы энергия возбуж- возбужденного состояния была выше энергии основного состояния, не- необходимо выполнение условия Р>0, т. е. обменный интеграл должен быть положительным. Возбуж- Возбужденному состоянию кристалла отвечает наличие неправильно ориентированного, перевернутого спина. Поскольку все атомы кристалла равноправны, перевернутый спин не закреплен за определенным атомом и может блуждать по всему кристаллу. Перемещение по кристаллу от атома к атому «переверну- «перевернутого» спина описывается волновой функцией E4,6); энергетиче- энергетический спектр кристалла дается формулой E4,7). Волновая функ- функция E4,6) получила название спиновой волны. Формально пе- перемещению «перевернутого» спина можно сопоставить движение некоторой квазичастицы, получившей название магнона. Дей- Действительно, формально спиновая волна описывает распростра- распространение по кристаллу некоторой квазичастицы с волновым векто- вектором к. Энергия этой квазичастицы дается формулой E4,8), где п? — ее эффективная масса. Магионы представляют элементар- элементарные возбуждения в системе ориентированных спинов. Энергию возбуждения всего кристалла можно рассматривать как сумму таких элементарных возбуждений или как энергию идеального газа магнонов, заполняющего весь объем кристалла. Совершенно ясно, что такое описание возбужденного состоя- состояния является приближенным и разумно только при малых сте- степенях возбуждения. Это означает, что число магнонов (число
850 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V спинов, возбужденных в «перевернутое» состояние) должно быть достаточно мала. Несколько ниже мы Придадим этому утверждению количественный характер. К магнонам относится все сказанное в § 47 по поводу опи- описания возбужденного состояния системы частиц при помощи квазичастиц. Магноны могут взаимодействовать с другими ква- квазичастицами например с фононами или с реальными частицами, обладающими магнитными моментами, например с нейтронами. Магноны следует считать подчиняющимися статистике Бозе — Эйнштейна. Действительно, в состоянии с данной ориентацией может находится любое число спинов электронов, принадлежа- принадлежащих различным атомам. Число магнонов, подобно числу фоно- нов, не сохраняется. Возбуждению в «перевернутое» состояние спина того или иного электрона отвечает появление (или исчез- исчезновение) одного магнона. Поэтому функция распределения для числа магнонов с дан- данным волновым вектором представляет распределение Планка: ?i- E4>9) Зная характер возбуждений в кристалле, связанных с обмен- обменным взаимодействием электронов со свободным спином, мы мо- можем вернуться к обсуждению магнитных свойств таких кри- кристаллов. Если обменный интеграл является положительным, то в ос- основном состоянии все спины ориентированы в одну сторону. При этом кристалл обладает спонтанным магнитным моментом насыщения Мо = \i0N, где N — число электронов в единице объема. При Т Ф 0 часть спинов будет перевернута. Число «перевер- «перевернутых» спинов равно, очевидно, числу возбужденных магнонов. Последнее согласно E4,9) равно Г J dk При низких температурах интеграл быстро сходится и можно заменить предел интегрирования на бесконечный. Это дает оо An f k2dk I ~2я21 В2 J J ex2-\ ~ nW U ) ~ д2 I p J ¦ E4>
§ 54] ФЕРРОМАГНЕТИЗМ 851 При этом мы воспользовались приближенным значением инте- интеграла и заменили —д- на число электронов в единице объема, а вместо т* подставили ее значение из E4,8). Возбуждение Л/магн магнонов уменьшает магнитный момент кристалла. Он оказывается равным --?(¦?)*]. E4,11) Формула E4,11) определяет спонтанный магнитный момент ферромагнетика в зависимости от температуры. При некоторой температуре Тс, именуемой температурой Кюри, спонтанный магнитный момент должен обращаться в нуль. Очевидно, что т Р Если считать, что обменный интеграл р — величина порядка —, где а — постоянная решетки, то Гс~103°К, что согла- согласуется с опытными данными. Температурная зависимость спон- спонтанного магнитного момента, даваемая формулой E4,11), так- также хорошо согласуется с опытными данными при низких (Т < Тс) температурах. При температурах Т ~ Тс изложенная теория теряет коли- количественный смысл, поскольку число магнонов становится одного порядка с полным числом электронов. Несмотря на свою предельную схематичность, изложенная теория ферромагнетизма не только объясняет сущность явле- явления, но и позволяет получить некоторые количественные вы- выводы. Мы не учли анизотропию системы, связанную с анизотро- анизотропией волновой функции электронов в незаполненной а-оболоч- ке. Не принято также во внимание спин-спиновые и спин-орби- спин-орбитальные взаимодействия, и взаимодействие с полем решетки, которые также создают анизотропию и приводят к появлению направлений легкого намагничивания. Частично эти эффекты достаточно хорошо изучены, частично же их теория, связанная с большими расчетными трудностями, до настоящего времени еще не разработана. Отсылая за деталями к специальной лите- литературе1), остановимся лишь на одном вопросе — вопросе о зна- знаке обменного интеграла. !) С. В. Тя бликов, Методы квантовой теории ферромагнетизма, «Наука», 1965; Д. 3 а й м а н, цит, книга.
852 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V Как мы видели выше, условие р > О является решающим для существования ферромагнетизма. Обменный интеграл р можно написать в виде Первое слагаемое в скобках дает кулоновское взаимодействие между электронами, два других — взаимодействие электронов с ядрами. Для того чтобы интеграл был положительным, должна быть велика собственная обменная энергия. Это значит, что волно- волновая функция должна быть велика вдали от ядер и мала у са- самых ядер. Этому условию удовлетворяют как раз электроны в d-состояниях, имеющие сравнительно большой момент. Вместе с тем радиус орбит тех электронов, которые ответ- ответственны за взаимодействия, должен быть мал по сравнению с постоянной решетки. В противном случае электроны будут близко подходить к «чужим» ядрам и отрицательные члены будут давать большой вклад в интеграл. Совокупность этих условий имеется у атомов группы железа, которые являются наиболее яркими представителями ферро- ферромагнитных веществ. Чаще, однако, указанные довольно жест- жесткие условия не выполняются и обменный интеграл оказывает- оказывается отрицательным. В этом случае обменное взаимодействие электронов незаполненных оболочек приводит к другому основ- основному состоянию. Именно, в основном состоянии соседние спины оказываются антипараллельными и спонтанное намагничение отсутствует. Такие вещества получили название антиферромагнетиков. Антиферромагнетики, не обладая спонтанным намагничением, обнаруживают ряд характерных свойств. Мы не можем, однако, остановиться на их рассмотрении и отсылаем читателя к специальной литературе1). § 55. Взаимодействие электронов с колебаниями решетки Выше мы обсудили вопрос о взаимодействии электрона с кристаллом при правильном расположении ионов в узлах ре- решетки. Движение по решетке электронов в сопровождении раз- разбегающихся перед ним электронов квазичастицы не отличается от движения одиночного электрона. Квазичастица в решетке описывается такой же функцией Блоха. 1) См. Д. 3 а й м а н, Принципы теории твердого тела, «Мир», 1966.
§ 55] ЭЛЕКТРОНЫ И КОЛЕБАНИЯ РЕШЕТКИ 853 В дальнейшем мы обсудим вопрос о взаимодействии квази- квазичастицы с колебаниями решетки. При этом, в соответствии со сказанным в конце § 51, мы без каких-либо оговорок будем именовать квазичастицу электроном. Тепловые колебания решетки нарушают периодичность по- потенциала, действующего на электрон. При колебаниях решетки атомы испытывают смещения из положений равновесия, кото- которые характеризуются вектором |п. Нас интересует значение потенциальной энергии электро- электрона U в некоторой точке решетки г. Ее можно найти для двух предельных случаев: в приближении деформируемых ионов и приближении твердых недеформируемых ионов. Обе модели приводят к весьма близким результатам. Мы будем пользо- пользоваться первой моделью, по-видимому, несколько более близкой к истинному положению вещей. В модели деформируемых ио- ионов вся решетка заменяется колеблющимся континуумом. В некоторый момент времени потенциальная энергия электрона в точке г определяется мгновенной конфигурацией этого конти- континуума. Смещениям континуума будут отвечать изменения по- потенциальной энергии электрона в точке г. Та точка континуума, которая в положении равновесия имела координату г, после смещения перейдет в точку г + ?(г). Значение потенциальной энергии электрона, которое в равновесии отвечало радиусу- вектору г +1, после смещения будет соответствовать радиусу- вектору г. Иными словами, в точку г «придет» та потенциаль- потенциальная энергия, которая раньше «находилась» в точке г — |(г). Из- Изменение потенциальной энергии электрона в точке г будет, оче- очевидно, t/pem = U (Г- |) - U (г) = - S (Г) VC/, E5,1) если считать смещение достаточно малым. Естественно допу- допустить, что для вектора |(г) можно написать выражение D7,14), в котором вектор п заменен на вектор г. Рассмотрим с помощью метода вторичного квантования си- систему электронов, на каждый из которых действует возмуще- возмущение t/реш. Кулоновским взаимодействием электронов друг с другом мы будем пренебрегать. В соответствии с результатами, приведенными в § 47, мы можем написать гамильтониан систе- системы электронов во внешнем поле решетки. Именно, будем ха- характеризовать состояние системы электронов числами запол- заполнения состояний с данным значением k. Пользуясь представлением вторичного квантования — форму- формулой (99,23) ч. V, запишем энергию системы электронов в виде Н = 2 EkatUh + 2,
g54 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V Здесь Eh представляет энергию электрона, движущегося в строго периодическом поле решетки. Операторы а% и ak удо- удовлетворяют обычным соотношениям антикоммутации (99,9), ч. V. Оператор взаимодействия определяется матричным элемен- элементом энергии взаимодействия электрона с внешним полем, в дан- данном случае полем колеблющейся решетки. Согласно формуле (99,23) Поэтому оператор Гамильтона имеет вид Я = 2 ЕкЧ*ь + 2 2 й*й* I W**%dV. E5,2) I k k' k Подставляя в E5,2) волновые функции \\)k, определенные формулой D8,11), и оператор Upem из E5,1), получаем для опе- оператора взаимодействия ^вз = - Ж 2 2 «*А J «>"'*'' A grad U) ике"» dV. k k' Используя явный вид оператора \п D7,14), оператор взаимо- взаимодействия запишем в виде 8ВЗ = - -т 2 2 2 4Ak j «>-'" 2 Ym^ еп х X (Bfjeifr + 5f>"l/#) grad ?/Лл rf7. E5,3) Перейдем теперь от интегрирования по основной области к интегрированию по элементарной ячейке кристалла. С по- помощью соотношения D9,18) получаем для двух интегралов, входящих в E5,4) J w;,grad U ke^k-kf±^r dV ^Yiei{k"kf±f)n J <VSrad UukdV. G л t0 E5,4) Используя формулу D9,19), мы видим, что интеграл E5,4) отличен от нуля только при выполнении равенства Jfe-?'±f = O E5,5) или, в более общем случае, равенства k-k' ±f = K. E5,6) Мы ограничимся рассмотрением первого случая. Формула E5,5) показывает, что в процессе рассеяния электрона колеб-
§ 53] ЭЛЕКТРОНЫ И КОЛЕБАНИЯ РЕШЕТКИ 855 лющейся решеткой имеет место закон сохранения, аналогичный закону сохранения импульса при столкновении свободных ча- частиц. Поэтому процесс рассеяния формально можно рассматри- рассматривать как процесс поглощения или излучения фонона электро- электроном. До столкновения электрон обладал волновым числом fe, после столкновения он имеет волновое V = k ± /, где f — вол- волновой вектор фонона. Можно считать, что при переходе k->kr происходит поглощение (при V = k + f) или излучение (при k' = k — f) фонона. Ниже мы увидим, что при этом имеет место закон сохране- сохранения энергии, так что при рассеянии' энергия электрона увели- увеличивается на величину энергии фонона ftcoy Ек, = Ek± h®f. E5,7) Эта наглядная трактовка процесса рассеяния электронов теп- тепловыми колебаниями решетки оказалась весьма полезной1). С помощью соотношения D9,19) для E5,5) получаем J и;,в«<*-*>*f>r(grad U)ukdV = N J uk±f{gvadU)ukdV. G To Подставляя это значение в E5,3), находим: *л - Г J i^ferad U) uk dv] UWftjU ft. f, / где через S± обозначены интегралы по элементарной ячейке S± = efJ J uk±fgvadUukdV. E5,8") То Формула E5,8) снова допускает наглядную трактовку рассеяния электрона как процесса, при котором происходит поглощение 1) Столкновения, при которых имеет место равенство E5,6), носят назва- название процессов переброса Пайерлса. Нетрудно видеть, что при малых значе- значениях / и значениях волнового вектора электрона \k\, \k'\ ^ — процесс пере- переброса отвечает изменению направления волнового вектора электрона на об- обратное. Процессы переброса не играют особой роли в рассматриваемых ниже яв- явлениях электропроводности, но важны для установления теплового рашювесия в металлах, особенно при низких температурах.
356 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V или испускание фонона. Действительно, по смыслу опера- операторов а+, а, Ъ+ и Ъ ясно, что матричный элемент оператора u^+MkBfj отвечает возникновению электрона с волновым чис- числом k + / и исчезновению электрона с волновым числом k и фо- фонона с волновым числом f. Аналогично, матричный элемент d?_fakbfj отвечает возникновению электрона с волновым чис- числом k — /и фонона с волновым числом / и исчезновению элек- электрона с волновым числом k. Воспользовавшись свойством пе- периодичности потенциала U и функций Uk, Uk+f, а также урав- уравнением Шредингера для Uk, на основе некоторых упрощающих предположений можно исключить из S± неизвестную потен- потенциальную энергию U. Вычисления, которые мы проведем ниже, дают для S± Из E5,9) следует, что величина S± отлична от нуля только для волн решетки с продольной поляризацией. Действительно, где индекс 1 относится к продольной поляризации, 2 и 3 — к поперечной. Таким образом, в рамках сделанных при вычисле- вычислении 5 допущений (см. ниже), рассеяние электрона происходит только на волнах решетки с продольной поляризацией. Подставляя значение S± из E5,9) в оператор энергии взаи- взаимодействия E5,8), можно записать его в виде х «А5/- СА*/)- <55'10) Мы не пишем индекс / = 1 у операторов В для краткости. Даль- Дальнейшее упрощение получается, если связать со/ и / по формуле D7,16), справедливой при малых f, т. е. если пренебречь дис- дисперсией частот. Тогда получаем для Явз где Вя/5?1. ff-— f|grad^Pd7. E5,12) В следующем параграфе мы воспользуемся выражением E5,11) для вычисления вероятности перехода.
§ 55] ЭЛЕКТРОНЫ И КОЛЕБАНИЯ РЕШЕТКИ 867 Заметим, что по порядку величины g представляют среднюю кинетическую энергию электрона, движущегося в решетке. В заключение нам следует доказать формулу E5,9). Для этой цели рассмотрим интеграл Jdiv (ef.uk,ukU) dV = J efiuk,ukU dS = 0, который обращается в нуль в силу свойств периодичности функ- функций Uk и потенциала U на поверхности. С другой стороны, вве- введенный интеграл равен (.„«;, ujj)dv- = eff J U grad (w^w^dV + ef/ J uk,uk grad f/dK = 0. E5,13) Таким образом, для величины S получаем S = ef} j uk,uk grad U dV = - eff J I/ grad (и^) dl/. E5,14) Потенциальную энергию U можно исключить теперь с помощью уравнения Шредингера. Используя для функции Uk формулу D8,9), имеем -^[buk + 2ik grad uk - {kf uk] + [E(ft) -U]uk = 0. E5,15) Для функции uk, запишем аналогичное уравнение ^- [Л^, + 2ik' grad u\, - F7 м;,] + [Е (V) - ?/] и\. = 0. E5,16) Помножим уравнение E5,15) на величину eff grad ^> a Урав- Уравнение E5,16) на efjgraduk и полученные уравнения сложим. В результате легко найдем S = - { efjU grad («X) dl/ = - -? X X Vwl/(e.,Vwb)dV--ef/ f?(ft)i/.gradu., + E(k')ub,gradм J dF X Л 2 Л + -^—62 uue?. QV3.d u*., dV A ul,ee- sfrad uu dV, 2m J * и to * ' 2m J k tj & « E5,17) Интегрирование ведется по ячейке кристалла, являющейся ос- основной областью периодичности функций uk и uk,. Поэтому
858 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V сумма первых двух интегралов после применения формулы Грина сводится к поверхностным интегралам и обращается в нуль. Пятое и седьмое слагаемое можно проинтегрировать по ча- частям, написав с учетом свойств периодичности J uk, grad uk dV = - J uk grad uk, dV. Тогда имеем окончательно - efj | [? (*) - E (V) + -^(k2- k'2)] 4 grad u\, dV. E5,18) В последнем интеграле содержатся величины E(k)~-E{kf) и -^—(k2 — k/2), которые по порядку величины равны разности энергий электрона до и после рассеяния, т. е. порядка энергии фонона ico/. Как мы увидим ниже, первый интеграл по порядку величины равен кинетической энергии электрона. Поэтому он существенно больше второго и последний может быть опущен. Считая, в довольно грубом приближении, что функции uk « u*k,, и обладают сферической симметрией, можем предста- представить интеграл по элементарной ячейке в виде При интегрировании вектор г пробегает все возможные значе- значения, поэтому ясно, что вектор А может быть направлен только по единственному вектору е^. Тогда имеем A=ef/|A|. Модуль вектора А можно определить, умножив его на век- вектор efj IА' = J ^ (Чй (VJ dV - т JI gfad «»I2 dV- E5'2°) to t0 После проведенных преобразований мы можем теперь выпи- выписать выражение для S; оно имеет вид S = - -gj-(*-*')«„ J | grad uk fdV. E5,21) to Полагая k'= k + f и kf = k — /, мы получаем выражения для S+ и S_, даваемые формулой E8,9).
§ 56] ПОЛНЫЙ ГАМИЛЬТОНИАН ТВЕРДОГО ТЕЛА 859 § 56. Полный гамильтониан твердого тела Воспользовавшись полученными выше результатами, мы мо- можем написать полный гамильтониан твердого тела в виде + а k,f Здесь e(ft)— энергия электрона (квазичастицы) с волновым вектором к. Операторы й? и аи представляют операторы уни- уничтожения и рождения электрона (квазичастицы) с волновым вектором k и спиновым индексом а. Энергия другой квазичасти- квазичастицы — фонона e(f) = йсо/. Кулоновское взаимодействие между электронами на больших расстояниях сводится к нулевым плазменным колебаниям, на малых расстояниях — к экранированному взаимодействию и образованию квазичастиц. Что же касается взаимодействия между колеблющейся решеткой и электронами (квазичастица- (квазичастицами), то оно формально описывается оператором столкновений двух независимых казичастиц одного фермиона и одного бозона. Это взаимодействие служит причиной переходов электрона из одних состояний в другие. Гамильтониан твердого тела в пред- представлении вторичного квантования был впервые получен Фре- лихом. Примером использования расчетной техники метода вторичного квантования послужит получение важной формулы для вероятности перехода электрона из состояния k в состоя- состояние W с испусканием или поглощением одного фонона. В нашей задаче стационарные состояния невозмущенной системы пред- представляют состояния с определенным числом фононов щ и опре- определенным числом электронов пно- Последние в силу принципа запрета равны единице или нулю. Если мы ограничимся первым приближением теории возму- возмущений, то окажется, что возможны лишь переходы с поглоще- поглощением или испусканием только одного фонона. Действительно, в оператор возмущения входят операторы 5/ или 6*, но не их произведения. Матричные же элементы от операторов bf и bf отличны от нуля только для переходов, при которых число фо- фононов изменяется на единицу [см. § 99 ч. V].
860 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V Рассмотрим, для определенности, случай, когда электрон пе- переходит из состояния с волновым числом к и энергией Е(к) в состояние к' с большей энергией. При этом происходит погло- поглощение фонона с волновым числом /, так что Поскольку полная энергия системы (электрон + фононы) долж- должна оставаться постоянной, энергия электрона после столкновения В представлении вторичного квантования процессу перехода отвечает уменьшение на единицу числа электронов в состоя- состоянии ко и фононов в состоянии / и увеличение на единицу числа электронов в состоянии к'о. Для нахождения вероятности такого перехода следует вы- вычислить матричный элемент Пользуясь правилом вычисления матричных элементов от произведения операторов и используя вид матричных элементов а* и dk и bj, Bf, мы легко найдем, что из всей суммы E6,1) останется только один матричный элемент. Именно, E6,3) Используя формулы (99,15) ч. V, мы видим, что произведение матричных элементов d+, й равно плюс или минус единице, в зависимости от чисел заполнения. Матричные элементы опе- оператора Bf определяются формулами D7,16). Вероятность перехода с поглощением фонона равна -=Щ-\ (HB3)k,k |2 б [Е (k) -E(k + f) + h<»f] Если пренебрегать дисперсией и подставить значение D% из E5,12), мы легко находим, что Полная вероятность перехода электрона с поглощением фонона получается интегрированием по всем возможным значениям /
§ 56] ПОЛНЫЙ ГАМИЛЬТОНИАН ТВЕРДОГО ТЕЛА и объему V: 861 E6,4) Совершенно так же можно найти вероятность перехода с излу- излучением одного фонона: Процессы с поглощением и испусканием одного фонона мож- можно наглядно представить в виде диаграммы Фейнмана (рис. 49). Рис. 49. Здесь волнистой линией изображен фонон, сплошной — элек- электрон. Если не ограничиваться переходами первого порядка, то возможны и другие процессы, изображенные на диаграммах Фейнмана (рис. 50 и 51). /м-/ р Рис. 50. Рис. 51. Электрон может излучать виртуальный фонон и тут же его поглощать. Благодаря этому процессу электрон оказывается окруженным облаком или шубой виртуальных фононов с раз- различными частотами. При движении электрона по решетке об- облако фононов следует за ним, изменяя его массу. Количествен- Количественный расчет этого эффекта выходит за рамки этой книги. Второй важный эффект второго порядка изображается диа- диаграммой (рис. 51). Один из электронов испускает фонон /ь а поглощает фонон /2. Другой, наоборот, поглощает первый и испускает второй фонон. Этот обмен фононами приводит в известных условиях к сла- слабому притяжению между электронами. Несмотря на малость
862 ТЕОРИЯ ТВЕРДОГО ТЕЛА [ГЛ. V эффекта, он играет вджне&шую роль в явлениях, происходящих в металлах при низких температурах (см. § 64). Следует заметить, что в приведенном выводе гамильтониана взаимодействия содержалось неявное допущение о том, что в результате взаимодействия с фононом электрон всегда может перейти в новое состояние. Это справедливо для электронов, находящихся в зоне размытости распределения Ферми. При рассмотрении кинетических эффектов, например, элек- электропроводности, нас будет интересовать взаимодействие именно с этими электронами. Однако при изучении некоторых других свойств металлов, таких, как влияние электронов на энергети- энергетический спектр системы фононов, оказывается существенным учет поведения всей системы электронов, в том числе электро- электронов заполненной зоны. Эти электроны не могут совершать пере- переходов между состояниями внутри зоны. Поэтому описание эф- эффектов, включающих поведение всей системы электронов не мо- может проводиться на основе гамильтониана E5,11).
ГЛАВА VI КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ § 57. Кинетическое уравнение для электронов в металлах Вряд ли будет преувеличением утверждение, что в области теории твердого тела физическая кинетика добилась наиболь- наибольших успехов и позволила качественно понять и количественно описать огромное число разнообразных и тонких эффектов. Мы в рамках этой книги можем изложить лишь основные резуль- результаты в этой быстро развивающейся области. Рассмотрение кинетических явлений в твердых телах мы начнем с получения кинетического уравнения для носителей зарядов в металлах. Мы видели выше, что элементарные воз- возбуждения в системе электронов в металлах можно уподобить газу свободных фермионов. Мы будем называть их электронами проводимости и описывать одночастичной функцией распреде- распределения f(p,r,t). Для краткости квазиимпульс р мы будем назы- называть импульсом. Эта терминология не может вызвать недора- недоразумения. При движении электронов проводимости они испытывают рассеяние на колеблющихся атомах решетки (столкновения с фононами) и на всякого рода неоднородностях решетки, ко- которые именуются примесями. Достаточно хорошие результаты получаются, если считать это рассеяние упругим (см. § 58). На основании сказанного в § 50 столкновениями между электро- электронами мы будем пренебрегать. Если к металлу приложено внешнее электромагнитное поле, то функция распределения удовлетворяет кинетическому урав- уравнению Групповая скорость v может быть написана в виде E7,2)
864 КИНЕТИЧЕСКИЕ CEOftCtfiA ТВЁРДЫХ ТЕЛ [ГЛ. VI В рамках статистического описания изменение квазиимпульса под действием внешней силы может учитываться в квазикласси- квазиклассическом приближении, т. е. | [*#]). E7,3) Интеграл столкновений для частиц, подчиняющихся статистике Ферми, можно написать в приближении теории возмущений. Вероятность перехода из состояния р в состояние р' может быть представлена в виде *>м = A - / (рО) F (р, Р', пр), E7,4) где первый множитель дает вероятность того, что состояние не заполнено. Множитель F(p,p',np) представляет вероятность пе- перехода в вакантное состояние, вызванную всеми процессами упругого взаимодействия электронов с другими частицами — фононами решетки или примесями. Вероятность обратного перехода в силу принципа микроско- микроскопической обратимости имеет вид wp,+p = (l-f(p))F(p', р, пр). E7,5) Мы вернемся к формулировке кинетического уравнения в § 62, где будет уточнено выражение для вероятности перехода. Пока же мы не будем учитывать зависимость F(p7p',n) от чисел за- заполнения пр и положим F(p, P', np) = F{py р'). С учетом E7,4) и E7,5) интеграл столкновений можно напи- написать в виде , p')dp\ E7,6) как при столкновениях электронов с обычными атомами. Заме- Заметим, что это законно при /ipC$f 1. Поскольку рассеяние считается упругим, можно написать F (р, р') б (е - е') dp' - F (a) dQ, E7,7) где Таким образом, кинетическое уравнение приобретает вид . <57.8>
§ 58] ЭЛЕКТРОПРОВОДНОСТЬ МЕТАЛЛОВ 865 Соотношение E7,8) представляет линеризованное уравнение Больцмана, весьма близкое по своей структуре к уравнению B7,3). Заметим, что в стационарном состоянии при отсутствии внешних сил и в однородной системе уравнение E7,8) превра- превращается в f(pH-f(pO)-/(pOd-f(p))-0. E7,9) С учетом изотропии, когда функция распределения зависит только от абсолютной величины импульса, что то же самое, от энергии решением этого функционального уравнения служит распределение Ферми: NeH-jZ^—. E7,10) ект +1 Рассмотрение широкого класса кинетических явлений может быть проведено без конкретизации вида функции F(a). По- Поэтому мы в последующих параграфах будем считать ^(а) не- некоторой заданной функцией. При этом мы получим решение кинетического уравнения теми же методами, что в классической кинетической теории газов. Затем, пользуясь выражениями для вероятностей перехода E6,9) и E6,10), мы найдем время ре- релаксации или длину свободного пробега. Наконец, чтобы убе- убедиться в точности этих приближений, мы проведем в § 62 по- последовательную запись и решение уравнения Больцмана в ме- металле. В случае слабых полей и малых отклонений от равновесного состояния, так же как в B4,3), будем пытаться искать реше- решение E7,8) в виде / = /о(е)-+А(р, Q, <), E7,11) где fo » f ь При этом для /i получаем уравнение, совпадающее с урав- уравнением B7,10): § 58. Электропроводность металлов Если к металлу приложено постоянное электрическое поле &, то в нем будет существовать стационарный ток. Необхо- Необходимо ясно представить себе, почему движение электронов про- проводимости оказывается стационарным. Если бы интеграл стол- столкновений в уравнении E7,8) можно было опустить, то оно 28 в» Г. Левич и др., том II
866 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI приобрело бы вид и функция распределения зависела бы от времени. Фактически это означало бы, что электроны двигались ускоренно под дей- действием силы е&\ Их скорость, а значит, и ток непрерывно на- нарастал во времени. Источником потерь импульса, компенсирующим ускоряющее действие поля, служат столкновения электронов с фононами или примесями. Только учитывая интеграл столкновений, можно написать уравнение Больцмана для функции распределения, не завися- зависящей от времени. Не повторяя выкладок § 27, можно написать для плотности тока выражение j = e \vfidp~-— f Ktr^-?-{v8)dp. E8,1) Таким образом, электропроводность оказывается равной е2 Г v- В кристаллах с кубической симметрией поле & и ток / парал- параллельны друг другу. Выбирая направления вектора <§ на ось х, можно перепи- переписать E8,1) в виде / = - #g J Xtr {^j v cos2 9 dp, E8,3) где 9 — угол между векторами v и &. В формуле E8,3) можно перейти к интегрированию по энер- энергиям и по углам. Это дает оо Ше*т Г л . а/о _,_ E8>4) 3Bя о --— Воспользуемся теперь свойством функции --— для распре- распределения Ферми в металле, рассмотренным в § 80 ч. III. Имеем, аналогично (80,5) ч. III, оо J kT
Щ ЭЛЕКТРОПРОВОДНОСТЬ МЕТАЛЛОВ 867 Если длина свободного пробега Ktr зависит от энергии, то поскольку, согласно данным § 80 ч. III, производная -~- ве- ведет себя как б-функция, имеем + ferx)rfx«-^0i)n. E8,5) Отсюда для электропроводности получаем выражение )ц, E8,6) или на основании (80,10) и (80,11) ч. III п __ \bne*mXtr 00 вшах = l6ne*mXtr(iL) J?_ /JMV. (N_Vh ° 3BяЙK 3BяйK 2m\Snj \V) ' Последнюю, окончательную формулу можно еще представить в другом виде, введя скорость электрона v(\i) с энергией, рав- равной е = |л. С помощью G9,3) ч. III находим Мы видим, что электропроводность зависит от числа элек- электронов в единице объема /г, а также от скорости электрона на поверхности Ферми v(\.i) и длины свободного пробега электрона с энергией, лежащей на поверхности Ферми. Важной особенностью полученного выражения для электро- электропроводности металла является то, что она оказывается не про- пропорциональной числу электронов в единице объема так как в формуле E8,8) скорость v(ix) выражается через п. Причина этого совершенно ясна: в электропроводности принимают уча- участие только электроны, состояния которых лежат в зоне размы- размытости распределения Ферми. Только эти электроны являются электронами проводимости. Электроны, находящиеся в состоя- состояниях, лежащих в заполненной области, не могут совершать си- систематическое движение и переносить ток. Формула E8,8) для электропроводности содержит две неиз- неизвестные величины — число электронов в единице объема п и длину свободного пробега электронов с энергией, лежащей на поверхности Ферми, ^(jut). Скорость электронов у((и), как мы уже сказали, выражается через п по формулам § 79 ч. III. В следующем параграфе будет показано, что величина п может быть определена независимо от сопротивления. Тогда E8,8) позволяет выразить длину свободного пробега через электропроводность а. Значение последней измеряется непо- 2«*
868 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI средственно. При этом оказывается, что значение Xtr суще- существенно превышает межатомное расстояние (постоянную ре- решетки). Кроме того, Xtr существенно зависит от температуры. Например, для меди, у которой можно принять, что на каждый атом решетки приходится один свободный электрон, Xtr изме- изменяется от 7Х10 см, при Т «1300° К до 4 X Ю см при Т « 100° К, что в 300—2000 раз больше расстояния между ато- атомами в решетке. Расчет Xtr, проведенный в § 61, показывает, что температур- температурный ход Xtr, а с ней и электропроводности а, является различным в случае температур высоких и низких по сравнению с дебаев- ской температурой G. При высоких температурах Tk$>Q, о ~ Т. При низких тем- температурах о обнаруживает быстрое, пропорциональное 1/Г5 возрастание с понижением температуры. При Т = 0 в идеально чистом металле сг-*оо, и омическое сопротивление стремится к нулю. У загрязненных образцов, а также образцов с механиче- механическими дефектами — микротрещинами, остаточными механиче- механическими напряжениями и т. п., при весьма низких температурах (порядка нескольких абсолютных градусов) имеется так назы- называемое остаточное сопротивление, не зависящее от температуры и пропорциональное концентрации примесей. Таким образом, электропроводность металла при Т Ф 0 име- имеет конечное значение, а сопротивление отлично от нуля. Лишь при Т = 0, и притом в образце, не содержащем никаких при- примесей и дефектов, металлический проводник не оказывает ни- никакого сопротивления прохождению тока. Такой проводник по- получил название идеального. Поскольку невозможно получить температуру, равную нулю, а также невозможно изготовить чистый образец, идеальный проводник представляет собой не- некоторый предел, к которому можно стремиться, понижая тем- температуру и очищая металлы от примесей. § 59. Эффект Холла Важные сведения о свойствах электронного газа можно по- получить, изучая поведение металлов, помещенных во внешнее магнитное поле. Если металлический образец, по которому течет ток (на- (направление тока примем за ось х), помещен в магнитное поле, направленное по оси г, в нем возникает электрическое поле Еу. Происхождение этого эффекта, именуемого эффектом Холла, вполне очевидно. Под действием силы Лоренца электроны, образующие ток и совершающие преимущественное движение, отклоняются в отри-
§ 59] ЭФФЕКТ ХОЛЛА 869 дательном направлении оси у. Они накапливаются на нижней грани металла до тех пор, пока создаваемое при этом электри- электрическое поле не компенсирует действие отклоняющей силы. В дальнейшем электроны будут совершать стационарное дви- движение. Из сказанного ясно, что направление поля Еу определяется знаком носителя заряда. Мы увидим также, что его величина непосредственно связана с числом носителей тока в единице объема. Оба указанных обстоятельства делают холл-эффект одним из важнейших методов изучения свойств металлов и, как это будет видно из дальнейшего, полупроводников. Перей- Перейдем к расчету поля Еу. Напишем кинетическое уравнение Больцмана, учитывая, что в нашем случае сила F имеет компоненты: Тогда кинетическое уравнение примет вид Как и в § 27, будем следовать методу Лоренца и искать решение уравнения Больцмана E9,1) в виде / (р) = /о (Ро) + Pxfi (Р) + Pyh (P), E9,2) поскольку имеется электрическое поле в направлениях осей х и у. Вычисление интеграла столковений производится точно так же, как это было сделано в § 27. Тогда получается /= -¦¦?(/, cos6 + /2sine), E9,3) где Э — угол между направлением импульса и осью х. Подставляя разложение E9,2) в E9,1), находим с точно- точностью до величин второго порядка малости: VyH\[df0 dft df0 df, xH dh\ I df0 JE
870 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI Члены второго порядка малости Ехрх -^—, —— ^— и другие, VyH опущены. Член fx нельзя опустить, как это будет видно из дальнейших вычислений. Аналогично находим: с df0 vxvy df0 vxH \ df0 evxH Поэтому левая часть E9,1) приобретает вид Приравнивая это выражение интегралу столкновений E9,3) и объединяя все члены, содержащие cosG и sinG, находим Ввиду произвольности угла G получаем два уравнения для определения искомых функций f\ и f^ — F dfo еН ? __ __ у ? т х де тс '2~~~ Я/г '1у JL F d/o t еН ? о_ с Решение этой системы дает: %tr e df0 v m де f %tr e df0 12 v m де 1 + 1 + где = еН (°и тс '
§ 59] ЭФФЕКТ ХОЛЛА 871 Зная поправки к функции распределения, можно найти ток по направлению оси х и поле Еу. Так, имеем: l* = ej vxf dp = C (EXL{ - EyL2\ E9,4) у = 0 = e J vyf dp = С (EyLx + EXL2\ E9,5) где обозначено: \f^dB' E9>6) I - Г 1%<он\2 C ~ 3 BяйK • КОУ'О) Для краткости мы опускаем значок tr при К. Очевидно, что при Я->0 При этом jx переходит в E8,3). Для вычисления L, и L2 можно воспользоваться свойствами функций В первом приближении где Я(ц), у(ц) берутся на поверхности Ферми. Из формул E9,4) и E9,5) можно найти проводимость ме- металла, помещеннного в магнитное поле, o(H) = -jf- и попереч- поперечное поле Еу.
872 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ |ГЛ. VI Найдем прежде всего последнюю величину: Со (ц) (t ^ ~ Шфо ((») С * Подставляя сюда значение ц«емакс и 1>(ц) из (80,11) и G9,3') ч. III и С из E9,8), после несложных преобразований получаем Ey=*RHjx, E9,12) где через R обозначена величина *-5йГ- <59'13> Формула E9,12) показывает, что поперечное поле пропор- пропорционально текущему току jx и напряженности магнитного поля Я. Коэффициент пропорциональности /?, именуемый постоян- постоянной Холла, зависит, как видно из его определения, только от двух величин — заряда носителя тока е и числа частиц в еди- единице объема. Существенно, что знак R, а следовательно, и на- направление поперечного поля Еу, совпадает со знаком носителя тока. Проводимость в магнитном поле Поскольку R не зависит от напряженности магнитного поля, в первом приближении (в отношении вычисления интегралов L\ и L2) правая часть не зависит от Я. Это означает, что в этом приближении о(Н)= а, т. е. изменения сопротивления в магнит- магнитном поле не происходит. В высших приближениях проводимость о(Н) оказывается зависящей от напряженности поля. Совокупность измерений проводимости о и постоянной Холла R позволяет найти две неизвестные величины, п и X. Наоборот, задаваясь числом свободных электронов, приходящихся на атом, можно вычислить R.
§ GO] ОПТИЧЕСКИЕ СВОЙСТВА 873 Знак постоянной Холла отрицательный, когда перенос осу- осуществляется электронами. Это имеет место у одновалентных металлов. У двухвалентных металлов и металлов переходных групп, для которых имеет место перекрытие зон, в проводимости участвуют как электроны, так и дырки. Поэтому знак часто оказывается положительным. Наблю- Наблюдается также анизотропная постоянной Холла, особенно резко выраженная у таких металлов, как Bi. В следующем приближении а(Н) оказывается обратно про- пропорциональной квадрату напряженности магнитного поля. Од- Однако в поведение о(Н) в сильных полях, а также числовое зна- значение этой функции в сильных полях плохо согласуется с опыт- опытными данными. Это связано с грубостью использованной выше модели. Учет эффектов анизотропии поверхности, всегда имею- имеющей место в реальных кристаллах, позволяет существенно улуч- улучшить согласие теории с опытом. § 60. Оптические свойства системы электронов проводимости В основу рассмотрения оптических свойств металла мы по- положим допущение, что взаимодействие электромагнитного поля световой волны с электронами проводимости и электронами атомных остатков происходит независимым образом. Взаимо- Взаимодействие атомов с электромагнитным полем обсуждалось в ч. V. Мы ограничимся поэтому обсуждением поведения системы электронов проводимости в поле световой волны. Заметим, что если частота поля со не совпадает с одной из собственных атом- атомных частот, основные оптические характеристики металлов опре- определяются именно поведением электронов проводимости. Для этого проще всего найти комплексную проводимость в зависимости от частоты поля, действующего на металл. Как и при расчете статической проводимости, воспользуемся кинетическим уравнением Больцмана E7,12), которое в нашем случае приобретает вид Мы удержали в нем член -—-, ню опустили член с магнитным полем [как малый в отношении ~-j. Положим, что внешнее поле изменяется по закону
g74 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI Тогда решение уравнения F0,1) естественно пытаться искать в виде /,=0(^0)^^-»». F0,2) Подстановка в F0,1) дает e&Qv ~лГ = O,V&0 i (KV) — /<D + -г G8 L " откуда П = г.v ' т- • F0,3) to + / (nv) Поскольку к~—, а t><Cc, член, возникший от производной с -^ , мал и можно записать F0,4) Мы видим, что поправка к функции распределения оказывается комплексной. Из выражения для тока в случае кубического кристалла легко найти проводимость F0,5) где а @) — проводимость в постоянном поле. Поскольку т может быть вычислена, формула F0,5) дает полное количественное описание оптических свойств системы электронов проводимо- проводимости. Формула для проводимости в высокочастотном поле спра- справедлива в области скин-слоя, толщина которого дается форму- формулой C0,4) ч. IV. При этом необходимо, чтобы толщина скин- слоя б была велика по сравнению с длиной свободного про- пробега ktr. § 61. Длина свободного пробега электрона в металлах По определению, как и в § 27, в приближении E7,11) можно ввести понятие длины свободного пробега W ' где уэл — средняя скорость электрона и W — вероятность его столкновения (в единицу времени) с рассеивателем. Непосредственный смысл имеют величины vdJl и W. Ра- Разумеется, длину свободного пробега нельзя понимать буквально как расстояние между последовательными соударениями. Мож-
§ 61] ДЛИНА- СВОБОДНОГО ПРОБЕГА 875 но говорить о длине свободного пробега К лишь как о некоторой средней величине. Как было уже сказано выше, в металле могут происходить столкновения электронов с фононами и с примесями в решетке. Соответствующие длины пробегов обозначим через А,ф и А,пр. Очевидно, что электропроводность и другие кинетические вели- величины определяются значением наименьшей из этих двух длин пробега (т. е. наиболее вероятными столкновениями). Как будет видно из дальнейших расчетов, такой длиной является обычно Аф. Поэтому наше рассмотрение начнется с вычисления Кф. Полная вероятность того, что электрод испытает соударение с фононом, определяется суммой вероятностей W = W+ + W-, т. е. суммой вероятностей столкновения с излучением и поглоще- поглощением фонона. Величины W+ и W- даются формулами E6,4) и E6,5). Для конкретного расчета W необходимо сделать следую- следующие упрощающие допущения о величинах со/ и E(k)f входящих в эти формулы: 1) будем считать, что для всех частот со/ = с/, F1,1) где с — скорость звука, не зависящая от /. Это предположение не всегда может считаться оправданным, особенно при высоких температурах. Однако оно не приводит к существенным погреш- погрешностям в конечном результате даже и в тех случаях, когда со- соотношение F1,1) выполняется не точно; 2) будем считать, что ?(|fc|) является квадратичной функ- функцией \k\ E(\k\) = ak\ F1,2) Это предположение справедливо для электронов, движу- движущихся в почти заполненной или почти свободной зоне, т. е. для сильно связанных и квазисвободных электронов. Рассмотрим прежде всего случай температур, высоких по сравнению с дебаевской вс. Тогда в формулах E6,4) и E6,5) можно положить ««$»1 №13) Для вероятности W теперь получаем: |^-. F1,4) Преобразования с дельта-функциями проделаем подробно.
876 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI Рассмотрим первый интеграл: F1,5) При высоких температурах в металле из-за вырождения состоя- состояний фактически подвижны только электроны, находящиеся в зоне размытости распределения Ферми. Энергия электронов Еэл ~ ?Макс ^ kT, где ?макс — уровень Ферми; волновые числа этих электронов k ~ &Макс = зх/а. В решетке возбуждены все фононы вплоть до фононов с вол- волновым числом f = /макс = я/а, причем последние представлены в наибольшем количестве. Энергии фононов йсо/^й(со/)маКс ~ ~ kT. Таким образом, волновые векторы электронов и фоно- фононов— величины одного и того же порядка. Наоборот, энергии фононов много меньше энергий электронов. При столкновении электрона с фононами энергия электронов изменяется сравни- сравнительно мало, а его волновой вектор сильно. Это означает, что происходит значительное изменение направления движения элек- электрона при каждом столкновении. Для всех фононов неравенство F1,3) выполнено автоматически; оно является более слабым, чем неравенство /<^Макс. Переходя к вычислению /ь напишем: = 2я J 6{-2akf cosQ + aP + hcf)f2df sinGdQ. F1,5') Интегрирование по углу в проведем, вводя новую перемен- переменную: и= — 2akf cos Э + а/2 + hcf. При этом «1 где щ = — 2akf + af2 + fief (что отвечает 0 = 0), u2 = 2akf + aP + hcf (что отвечает 0 = я). Очевидно, что '0, если щ и и2 имеют одинаковый знак; 1, если щ и и2 имеют разные знаки. Величина и2 является существенно положительной. Поэтому величина интеграла 1\ Ф 0, если
§ 61] ДЛИНА СВОБОДНОГО ПРОБЕГА 877 ИЛИ f<2*~?. F1,6) Поскольку всегда k ^ &макс == ~ > неравенство F1,6) не накла- накладывает никаких ограничений на интегрирование по f. В силу этого получаем / — П f2 = Пт ^ 7l~~ 2а? 'макс Совершенно такое же вычисление дает для интеграла Подставляя значение 1\ и h в выражение для W, находим Sn2g2.(kT)Vmf2MaKC 9MN Bn)Wkc2 Введем vBJ1 = —т — скорость электрона, вместо /маКс подставим /макс^ ¦—> а объем кристалла положим равным Na?. Для длины свободного пробега получается выражение F1,7) Полезно произвести числовые оценки величин, входящих в Яф. Скорость звука с — обычно величина порядка 2 X Ю5 см/сек. Энергия электрона вблизи поверхности Ферми ?макс ~ Рмакс^эл ~ "J ^эл ^ 2 - 3 Эв. Отсюда уЭл порядка 108 см/сек. Величина g, определенная формулой E5,19), по порядку величины совпадает с кинетической энергией квазисвободного электрона. Но у квазисвободных электронов энергия близка к энергии Ферми (так как подвижные электроны находятся в зоне размытости распределения Ферми), таким образом, g~2-3 эв. Наконец, для металлов среднего атомного веса Me2 ~ 1 эв. Следовательно, по порядку величины Ьуэл \ 1 Ьуэл ЗЙРэл 3?макс „ /ftl ov При энергии Ферми ?"макс ^ 2 эв и комнатной температуре
878 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI Яф ~ 200 - 250 а. Это значение Хф хорошо согласуется с опытными данными. Как видно из F1,7), Л>ф~-у* Остальные величины, входя- входящие в F1,8), для данного металла являются практически по- постоянными. Рассмотрим теперь случай низких температур kT < вс. При этом энергия возбужденных фононов йю ~ kT, их волновые числа Энергия электронов лежит вблизи поверхности Ферми, т. е. по- прежнему порядка Е ~ ?"Макс; волновые числа электронов Поскольку k >> f, закон сохранения энергии при столкнове- столкновении электрона с фононом можно записать в виде откуда следует, что т. е. 6«-~. Это означает, что фонон излучается перпендику- перпендикулярно к направлению движения электрона. Последний при этом отклоняется на малый угол Ф — угол между вектором k и век- вектором k + /. По порядку величины угол Ф равен k Ьк Й Изменение волнового вектора электрона при каждом столкно- столкновении порядка о о f T \ 2 Afe~fecosФ — k~k — ~k (-Q-J . Поскольку каждое столкновение с фононом приводит лишь к малому изменению направления полета, для рассеяния на большой угол электрон должен испытать большое число столк- столкновений Р, которое определяется соотношением или (J F1,9)
61] ДЛИНА СВОБОДНОГО ПРОБЕГА 879 Найдем теперь вероятность рассеяния с малым изменением энергии и импульса электрона при столкновении с; одним фо- ноном. Вероятность столкновения с поглощением фонона нахо- находится очень просто: hcL L 1 g2Vm* f Pdf _ 1 g2Fm*(^n3 Г z*dz к $MNcb2k J i?L я(йсK 9MNcb2k J ег~1 # Поскольку * ekT -\ /макс кТ верхний предел в интеграле можно заменить на бесконечность. Тогда ^ - " 9я " Af с ' fi2A; l Йс J J ez - 1 ' о Последний интеграл вычислен в приложении IV т. I: оо Г *2 dz _ я2 J ег-1 3 # о Поэтому a \ 9J ' При вычислении вероятности перехода с излучением фонона нужно учитывать то обстоятельство, что для электрона переход в заполненное состояние запрещен. Это означает, что электрон не может излучать фононов с энергией, превышающей ширину зоны размытости распределения Ферми. Если fico/ = bef > kT, то, изучая соответствующий фонон, электрон должен был бы перейти в заполненное состояние. Поэтому возможно излучение фононов с волновыми числами f ^4—. С учетом этого обстоятельства имеем: AW [ Мsin9rf8rf<p /gift/с8 \ (R. 1fn -. F1,10) [ Мsin9 J |f.
880 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI Длина свободного пробега электрона до первого столкновения FU1) Наряду со средней длиной свободного пробега между двумя столкновениями можно ввести среднюю транспортную длину свободного пробега Atr, учитывающую эффективность соударений. Соответствующее сечение (ср. § 24) определено как ortr = JаA -cos0)dQ~J a~- dQ. Транспортная длина свободного пробега Ащ т. е. средний про- пробег до эффективного изменения импульса, в классической кине- кинетике определяется как hr = -^—. В нашем приближении вве- введем величину Atr, определив ее соотношением Р _ <*Рэл (®с\5 • г » —— уу Она очень быстро, как -р", растет с понижением температуры. При очень низких температурах, порядка нескольких градусов, Atr весьма велика по сравнению с а и достигает макроскопиче- макроскопических значений. Зная длину свободного пробега, можно найти электропро- электропроводность по формуле E8,8). Электропроводность металлов а выражается формулами еХфп 9пеМсЬиэл 0Г==~^Г== nmg*(kT)a при высоких температурах, F1,13) zLjtii ^J5 при низких температурах, F1,14) где А — числовой коэффициент. Все входящие в F1,13) и F1,14) величины известны или могут быть найдены из независимых измерений. Согласие меж- между теорией и опытными значениями оказывается хорошим, что несколько неожиданно, учитывая обилие упрощений, сделанных в ходе расчетов, в частности использование модели квазисвязан- квазисвязанных и квазисвободных электронов. Следует заметить, что при У1-* 0 электропроводность нормальных (не сверхпроводящих) металлов не растет до бесконечно больших значений, но стре- стремится к постоянному, не зависящему от температуры пределу. Это так называемое остаточное сопротивление, обусловленное рассеянием электронов примесями и неоднородностями. Его ве- величина определяется концентрацией примесей. Зная длину свободного пробега, можно найти электрон- электронную теплопроводность металла. При высоких температурах она
§ 62] ИНТЕГРАЛ СТОЛКНОВЕНИЙ 881 выражается формулой ~ Яф ^^"-const F1,15) и не зависит от температуры. Очевидно, что при Т >> 0С имеет место так называемый за- закон Видемана — Франца — = const. При низких температурах температуропроводность определяется длиной свободного про- пробега Хф. Действительно, при одиночном соударении с фононом энергия электрона изменяется на величину порядка энергии фо- нона, т. е. порядка kT. Это изменение энергии отвечает возмож- возможному переносу энергии электронами. Перенос больших энергий невозможен, поскольку электрон не может отдавать энергию, заметно превышающую kT. Поэтому механизм переноса энер- энергии электронами сводится к передачам энергии порядка / при каждом столкновении с фононом, которое отвечает отклонению электрона на малый угол. Теплопроводность электронов при kT <C 0С выражается фор- формулой Хэл « 4)С?11>эл~Я8) ' -jr—nVM~-j?, F1,16) где Я^ — длина свободного пробега до первого столкновения. Совершенно очевидно, что при этом закон Видемана — Франца не имеет места. Отношение электропроводности к теп- теплопроводности оказывается зависящим от температуры. Мы не можем в рамках этой книги останавливаться на других явле- явлениях, связанных с электронным газом в металлах, и отсылаем читателя к специальной литературе1). § 62. Интеграл столкновений для электронов в металле Перейдем теперь к последовательному рассмотрению кине- кинетического уравнения и доказательству существования длины свободного пробега электронов в металле. Для этого следует прежде всего получить выражение для интеграла столкновений. Мы будем учитывать только соударение между электронами и фононами. Рассмотрим некоторое состояние электрона к. Электрон мо- может покидать данное состояние k двояким путем: поглощая !) См., например, Р. П а й е р л с, Квантовая теория твердых тел, ИЛ, 1956; А. Вильсон, Квантовая теория металлов, Гостехиздат, 1941; Г. Бете и А. Зоммерфельд, Электронная теория металлов, Гостехиздат, 1938; Ч. К и т т е л ь, Квантовая теория твердых тел, «Наука», 1967; Дж. 3 а й- м а н, Принципы теории твердого тела, «Мир», 1966. !/228 в- г- Левич и др., т. II
882 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI фонон / или испуская фонон /, т. е. Число электронов, уходящих в единицу времени из состояния k путем излучения фонона, равно Ф(|*|)A-Ф(|*-/|))^+(*->*-/), где dW+(k->k — /) дается формулой E6,5), а множитель A—Ф(\к — /|)) введен для учета принципа Паули. Благодаря этому множителю число электронов, переходящих в заполнен- заполненное состояние, для которого Ф(к — /) = 1, равно нулю. Число электронов, уходящих из состояния k путем поглоще- поглощения фонона, равно где dW-(k ->k + /) определено в E6,4). Полное число электро- электронов, покидающих состояние к за 1 сек, получается интегрирова- интегрированием суммы приведенных выражений по всем возможным зна- значениям /, т. е. Интегрирование ведется по всем значениям |/| и всем ориен- тациям вектора /. Напишем, далее, число электронов, попадаю- попадающих в единицу времени в состояние k в результате испускания и поглощения фононов электронами, находящимися в других состояниях. Рассуждения, аналогичные приведенным, дают: Составляя баланс электронов, можем написать: 'столки == *+ ' — • Подставляя значения /+ и /_ и входящих в них вероятностей переходов dW+ и dW-, согласно формулам § 56 можем напи- написать интеграл /столки в виде /столки = Ц- (щ) g'V J -?- {{Cftf + 1) Ф (k + f) A - Ф (k)N (?,+/-
§ 62] ИНТЕГРАЛ СТОЛКНОВЕНИЙ 883 Объединяя процессы с одинаковыми дельта-функциями и под- подставляя /столки в кинетическое уравнение, получаем: + v §L + L_?1 [Лд [ [ J- J o)f При этом, объединяя члены, мы воспользовались четностью дельта-функции 6(?*+/- Ек - i©f) = б{Еш - ?ft+/+ i©f). Убедимся прежде всего, что в состоянии равновесия функция распределения электронов ф(й)==ф0 представляет распреде- распределение Ферми — Дирака, а функция распределения фононов tif = по — распределение Бозе — Эйнштейна. В состоянии рав- sitTl новесия -~- = 0, v = 0, F = 0, таким образом, /столки =0. F2,2) Нетрудно видеть, что условие F2,2) выполняется, если каждая из квадратных скобок в подынтегральном выражении F2,1) обращается в нуль, т. е. = 0, F2,3) F2,4) Решение функциональных уравнений F2,3) и F2,40) с до- дополнительными соотношениями, выражающими закон сохране- сохранения энергии, выполняется по обычной схеме. При этом полу- получается Зная равновесные функции распределения электронов и фо- фононов и считая отклонение от равновесного состояния малым, можно решить интегро-дифференциальное уравнение F2,1).
884 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI § 63. Решение кинетического уравнения В дальнейшем мы ограничимся вычислением электропровод- электропроводности металла при высокой температуре Т > 0, где 0 — дебаев- ская температура. Аналогия между классическим и квантовым кинетическим уравнением для функции распределения элек- электронов делает естественным применение для его интегрирова- интегрирования метода Лоренца. В стационарном однородном электриче- электрическом поле кинетическое уравнение можно написать как ~g ^ ^столки» \Л>О,1; Его решение будем искать в виде Ф' = Ф0 + Ф', F3,2) где поправка к функции распределения равна F3,3) а ф — угол между направлениями вектора k и полем &. При вычислении интеграла необходимо сделать некоторые допущения о виде функций E(k) и ш/. Мы будем считать, что щ = cf, где с — скорость звука. Будем, далее, полагать, что энергия электрона имеет вид см. F1,2) как это имеет место у квазисвободных электронов и у сильно связанных электронов вблизи края зоны. Преобразуем интеграл столкновений в этих упрощающих предположениях, подставляя в него со, определенное формулой D7,16). При выполнении интегрирования введем полярные ко- координаты с полярной осью, направленной по вектору k. Выпишем интеграл столкновений. Для сокращения формул ограничимся первой его частью, содержащей дельта-функцию, отвечающую процессу излучения: ) F3,4) - [Фо(*) + Ф'(*)][1 -Фо(k + f) - Ф'(k + f) ]nf) X X б {Ek+f- Ek - ficof) f* df sin 9 dQ dy. F3,5) Далее мы воспользуемся условием равновесия F2,3) и F2,4) и пренебрежем произведениями функций Ф' (k + f) Ф' (k).
§ 63J РЕШЕНИЕ КИНЕТИЧЕСКОГО УРАВНЕНИЯ 885 Подставим в дельта-функцию выражение F1,2) для энергии: Л = |т*ф'(* + ЙП -Фо(*)](^+1)-Ф'(Ь)Фо(* + Мпг+ 1)- X б Bakf cos 9 + а/2 - fief) sin 9 dQ dy df. В дальнейшем мы ограничимся случаем высоких температур. При высоких температурах nf> 1. В этом предположении можно сделать замену Напишем теперь разложение F3,2) более подробно. Именно, напишем: Ф (ft) = Фо (Ek) + к%ф{ (Ek) = Фо (Ek) + k cos «Ф, (?*), Ф (ft + f) = Фо (Ek+f) + kt Ф, (Ek+f) + f%Ox (Ek+f) = = Фо (Ek + йсо/) + k cos M>i (Ek + h&f) + f cos уФ1 (Ek + Здесь ^^ и f% — проекции векторов ft и / на направление элек- электрического поля &. Тогда найдем: = J «Aj cos 9 + f cos у) Oi (Еь+/) - - ft cos ОФ! (?Л)} б Baftf cos 9 + a/2 - Jc/) sin 9 dQ dq> df. Поскольку Ek+f = Ek + hG>f, а энергия электрона порядка ?макс> можно положить Поэтому / = ML ф! (?Л) Г /з cos y6 Baftf cos 9 + a/2 - Ac/) sin 9 dQ dq> df. DC J Для выполнения интегрирования по углам выразим cosy че- через cos 9: cos y = cos ft cos 9 + sin О sin 9 cos ср. Тогда Ix =-j?rQ>i(Ek) jP(cos9cos* + sin*sin9sin<p) X X б Bakf cos 9 + a/2 - hcf) sin 9 dQ dq> df = n = 2n -^ Ф, (Ек) cos # J /3 cos 66 Bakf cos 6 + a/2 - hcf) sin 6 c?8 df.
886 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI При интегрировании по ф слагаемое, пропорциональное sincp, обратилось в нуль. Интегрирование по углу 0 можно провести, введя новую пере- переменную При таком преобразовании получаем: 2n(kT) cos ft ф (F\[f2jt Г ( и Как мы уже видели в § 61, J б (и) du = J б (и) du = 1. Кроме того, поскольку при всех возможных значениях f, щ и и2 имеют разные знаки, J ub(u)du= J ud{u)du = 0. Ux —oo Учитывая эти равенства, получаем окончательно: 'мякс (_ _ Ъс2 ak J \2afe 2ak о макс Г (_hc 4_ J \2afe 2ak о 3S*43T Вычисление второй части интеграла столкновений дает: /2= /?{М1 В силу F3,4) и выражений для /4 и /2 находим выражение для интеграла столкновений: ^столки = 9йс2 BяK ak2 \'шГ1 cos ^^^i ^^/' \Ъо,Ъ)
§63] РЕШЕНИЕ КИНЕТИЧЕСКОГО УРАВНЕНИЯ 887 Преобразуем теперь левую часть кинетического уравнения. Считая силу F, действующую на электрон, слабой, имеем дФ0 е& дФ0 dEk dk Ъ Приравнивав последнее выражение и /столки, получаем значение поправки к равновесной функции распределения: Сравнение F3,7) с B7,11) показывает, что В соответствии с (80,13) ч. III, значение электронной энергии берется равной энергии Ферми: где \i — парциальный потенциал равновесного распределения электрона. Покажем далее, что результат, полученный для А,ф, нахо- находится в согласии с формулой F1,7). Для этого напишем выра- выражение для А,ф в виде 1Г п Это значение Кф находится в очень хорошем согласии с по- полученными в § 61 качественными результатами. Совершенно аналогичным образом может быть найдено ре- решение кинетического уравнения для случая температур ниже дебаевской. При этом получается выражение для А,ф, совпадаю- совпадающее с F1,12). Мы не будем останавливаться на этих довольно громоздких вычислениях. Теория находится в хорошем согласии с опытом для металлов, имеющих кристаллическую решетку с высокой симметрией. В металлах, обладающих решеткой с низкой симметрией, оказываются весьма существенными эффекты анизотропии. Раз- Различие между компонентами тензора а^ в разных кристаллогра- кристаллографических направлениях иногда оказываются и. очень значи- значительными. Для построения теории кинетических явлений с
888 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI учетом анизотропии необходимо более детально учесть характер поверхности Ферми1). В случае металлов с относительно малым количеством при- примесей, или в случае сплавов с малой концентрацией одной из компонент или упорядоченных твердых растворов, приближения теории оказываются справедливыми. Однако в сильно легированных металлах, неупорядоченных твердых растворах и в жидких металлах не выполнено основное допущение теории существования правильной периодической структуры. Как мы указывали в § 39, электропроводность таких систем, рассчитывается с помощью аппарата временных коррелятивных функций. § 64. Сверхпроводимость В предыдущих параграфах мы рассмотрели некоторые осо- особенности металлических проводников. Наше рассмотрение было бы неполным, если бы мы не остановились вкратце на явлении сверхпроводимости. Макроскопическая теория сверхпроводимо- сверхпроводимости обсуждалась ранее (§21 ч. IV). В последние годы удалось построить достаточно полную микроскопическую теорию сверх- сверхпроводимости, которую мы изложим здесь в общих чертах. Уже сравнительно давно было высказано предположение о сходстве между явлениями сверхтекучести и сверхпроводимости. Именно, неослабляющийся омическим сопротивлением ток в сверхпроводнике естественно было уподобить сверхтекучему по- потоку электронов по решетке. Сверхтекучесть, как это было выяснено в § 5, возникает в системе частиц, если энергетический спектр ее коллективных возбуждений удовлетворяет определенным требованиям. Эти требования не связаны непосредственно со статистикой частиц, из которых построена система. Однако спектр коллективных возбуждений, удовлетворяющий условию сверхтекучести, уда- удавалось получить до последнего времени только для неидеаль- неидеального бозе-газа. Качественно понять причину этого можно из сле- следующего рассуждения, которое позволяет уяснить различие между ферми- и бозе-системами. Частицы бозе-газа в сверхпроводящем состоянии образуют конденсат, скапливаясь в состоянии с импульсом, равным нулю. Силы отталкивания между частицами обеспечивают появление в системе коллективного движения. Коллективные возбуждения в системе обладают энергетическим спектром, удовлетворяющим >) И. М. Лифшиц, М. И. Каганов, УФН 69, 419 A959); 78, 411 A962); 87/389 A965).
§ 64] СВЕРХПРОВОДИМОСТЬ 889 условию сверхтекучести E,23). Малым импульсам возбужде- возбуждения системы отвечает малая энергия. В случае системы электронов — идеального газа ферми-ча- стиц ситуация существенно изменяется. В такой системе невоз- невозможна конденсация частиц в пространстве импульсов. Частицы последовательно заполняют нижние квантовые состояния вплоть до уровня Ферми. Появление весьма малого возбуждения в та- такой системе означает, что одна из частиц покидает состояние на поверхности Ферми и переходит в незаполненное (возбужден- (возбужденное) состояние. В системе появляются две непарные «части- «частицы»— электрон в незаполненном состоянии и дырка с импуль- импульсами, близкими к импульсу частиц на поверхности Ферми, т. е. с импульсами, имеющими очень большую абсолютную величину. Таким образом, в системе ферми-частиц условие сверхтеку- сверхтекучести |у|<—при малых е и больших р не выполняется при сколько-нибудь заметной величине скорости. Электростатиче- Электростатическое взаимодействие между ферми-частицами не может изме- изменить это положение. В системе взаимодействующих ферми-ча- ферми-частиц по-прежнему невозможна конденсация. Электроны в металле образуют газ ферми-частиц, взаимо- взаимодействующих между собой по закону Кулона, т. е. испытываю- испытывающих взаимное отталкивание. Казалось непонятным, каким обра- образом система электронов может двигаться, не взаимодействуя с кристаллической решеткой металла. Одним из важных этапов в понимании природы сверхпрово- сверхпроводимости было открытие изотопического эффекта (см. § 21 ч. IV). Из существования изотопического эффекта вытекало, что взаи- взаимодействие электронов с колебаниями решетки играет важную роль в явлении сверхпроводимости. Интересно отметить в связи с этим, что в системах, обла- обладающих хорошей проводимостью, как, например, металлы пер- первой группы периодической системы Менделеева, сверхпроводи- сверхпроводимость не возникает. Наоборот, металлы, имеющие при обычной температуре значительно большее сопротивление, обладают свойством сверхпроводимости. Таким образом, явление сверх- сверхпроводимости наблюдается у металлов с относительно сильным взаимодействием между электронным и фононным газами. Мы указывали уже в § 56 (см. рис. 51), что поглощение и испускание виртуальных фононов электронами приводит к неко- некоторому эффективному взаимодействию между электронами. В 1956 г. появилась заметка Купера1), который указал, что бла- благодаря существованию слабого взаимодействия (притяжения) между электронами они могут образовывать некоторые связанные I. Bardeen, L. Cooper, I. Schieffer, Phys. Rev. 106, 162 A957).
890 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI состояния — пары электронов. Эти пары обладают целочислен- целочисленным спином и, грубо говоря, их совокупность можно рассматри- рассматривать как некоторый бозе-газ. Последний при низких температу- температурах может обладать свойством сверхтекучести. Исходя из пред* ставления о парах, была построена теория явления сверхпрово- сверхпроводимости Бардиным и Купером. Шиффером была построена полная теория сверхпроводимости. В наиболее строгой форме теория этого явления была дана Н. Н. Боголюбовым1). Мы изложим вначале качественную картину образования эле- электронных пар, следуя наглядному выводу Купера. Рассмотрим движение двух электронов. Волновую функцию системы пред- представим в виде L, К), F4,1) где, в соответствии с A4,14) ч. V, волновая функция системы равна произведению волновых функций, характеризующих от- относительное движение и движение центра тяжести. Здесь # = r* J"**2 : г = гх — г2, К — волновой вектор всей системы как целого. Волновую функцию относительного движения запишем в им- импульсном представлении Фо= 2 a>keikr. F4,2) к > fto Плоские волны нормируем на объем V и наложим на них усло- условия периодичности. Благодаря тому, что электронные состоя- состояния с энергией, меньшей энергии Ферми, заняты, суммирование в F4,2) соответственно ограничено снизу. Разумеется, такое ограничение суммирования снизу не является строго последо- последовательной операцией. В действительности нужно рассматривать многоэлектронную задачу, Купер сводит эту проблему к задаче двух взаимодействующих электронов на фоне заполненной ферми-сферы. Учет электронов фона производится в форме ограничения при суммировании, т. е. в выражении F4,2) пола- полагается п\ = 0 при к < k0. Уравнение Шредингера для двух частиц в импульсном пред- представлении имеет вид [ср. D8,12') ч. V] (k \ H'\ V) = 0, F4,3) 1) Н. Н. Боголюбов, В. В. Толмачев и Д. В. Ширков, Новый метод в теории электропроводности, изд. АН СССР, 1958; Д. Бардин, Д. Ш р и ф е р. Новое в изучении сверхпроводимости, Физматгиз, 1962; Д. Ш р и ф е р, Теория сверхпроводимости, «Наука», 1970; Э. Л и н т о н, Сверх- Сверхпроводимость, «Мир», 1964.
§ 64] СВЕРХПРОВОДИМОСТЬ 891 где (ft | Н' | ft') = у- J dre~ikrH'eik'r Как уже упоминалось, поглощение и испускание фононов электронами приводит к некоторому эффективному взаимодей- взаимодействию между ними. Это взаимодействие аналогично кулонов- скому взаимодействию в электродинамике, обусловленному об- обменом фотонами. Обменное взаимодействие могло бы быть получено с по- помощью гамильтониана E5,11). Однако вывод, основанный на гамильтониане E5,11), является сложным. Поэтому мы рассмо- рассмотрим упрощенный гамильтониан, позволяющий правильно сде- сделать основные качественные выводы, не требующие выполне- выполнения сложных выкладок. Положим: (ft|#'|ft')=-F, если *<><*, *'<*«, где ko<km. F4,5) (ft|#|fc') = 0, если ft или ft' лежит вне указанной области. Здесь F — некоторая постоянная (F>0) и -~{К1т — *<j) « 2А© « « 0,2 эв (йсо порядка некоторой эффективной энергии фонола и е0 = —2. — энергия электрона на поверхности Ферми). Подставляем выражение F4,5) в уравнение F4,3). Тогда имеем F S ** пк = » +е -Е> h<k<km F4,6) к к и uk — 0 для ft, лежащих вне указанного интервала. Вычислим далее сумму 2 я*. Она равна k откуда получаем: 1 —F f ?(^e)tf8 - F4,8) Здесь энергии ео и ет соответствуют импульсы fto и ftm и от суммирования мы перешли к интегрированию по соответствую- соответствующему энергетическому интервалу. N(K,e) обозначает плотность
892 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI двухэлектронных состояний с энергией е и полным импуль- импульсом К. Уравнение F4,8) определяет энергию системы Е. Плот- Плотность состояний N(K,e) благодаря узости интервала энергий, в котором осуществляется взаимодействие, можно заменить на Л/(/С, 8о). После этого интегрирование проводится элементарно. Разрешая полученное уравнение относительно Я, имеем Е = Ео = &к + е0 - Д, где Л = $жгт F4>9) Р = ЛГ(/С,во)Л F4,10) Найденное состояние с энергией Е = Ео, очевидно, отвечает свя- связанному состоянию. Действительно, уравнение F4,8) имеет ре- решение только при определенном значении Е. Можно заметить, что непрерывный спектр, отвечающий распаду пары, отделен от уровня энергии связанного со- состояния щелью шириной Д. Вели- Величина Д сильно зависит от числа состояния N(K, ео). Функция N в свою очередь резко за- зависит от полного импульса па- пары К. Для того чтобы проиллю- проиллюстрировать эту зависимость, рас- Рис. 52. смотрим рис. 52. Центры сфер Ферми радиуса k0 двух электро- электронов отстоят друг от друга на величину полного импульса К системы. Величина 8k соответствует той области в импульсном пространстве, в которой осуществляется взаимодействие. По- Поскольку суммарный импульс электронов равняется /С, а каждый из импульсов отдельных электронов должен лежать в области 6&, то очевидно, что объем заштрихованной области пропор- пропорционален числу состояний N(K,Eo). Отсюда видно, что N(K,eo) имеет резкий пик при полном импульсе, равном нулю. В этом случае сферы совмещаются и объем заштрихованной области становится максимальным. Это приводит к тому, что факти- фактически в пары связываются электроны с противоположными импульсами. Таким образом, даже при очень слабом взаимодей- взаимодействии возникает связанное состояние системы двух электронов. Заметим, что, вообще говоря, две микрочастицы могут образо- образовать связанные состояния только при достаточно сильном взаи- взаимодействии. Так, в § 37 ч. V мы показали, что в сферической потенциальной яме может образовываться уровень, отвечаю- отвечающий связанному состоянию, только при условии, что глубина потенциальной ямы больше некоторого критического значения.
§ 64] СВЕРХПРОВОДИМОСТЬ 893 В данном случае связанное состояние могло бы образоваться при сколь угодно слабом взаимодействии (малом F). Формаль- Формально это произошло потому, что суммирование в F4,2) ограни- ограничено условием k > &o, фактически это связано с влиянием элек- электронов фона. Итак, в металле может происходить спаривание электронов. Электронные пары имеют целочисленный спин и подчиняются статистике Бозе. Неидеальный бозе-газ обладает свойством сверхтекучести. Так как пары заряжены, то сверхтекучее дви- движение электронов соответствует появлению сверхпроводимости. Заметим, что функцию F4,9) нельзя разложить в ряд около точки р = 0, а следовательно, никакие расчеты, построенные на основе теории возмущений, не могли привести к выяснению яв- явления сверхпроводимости. Явление спаривания электронов особенно наглядно прояв- проявляется в поведении двусвязных (полых) сверхпроводников в магнитном поле. Рассмотрим полый сверхпроводящий цилиндр, помещенный в однородное внешнее магнитное поле, направленное вдоль его оси. Нас будет интересовать волновая функция фя(/?), харак- характеризующая движение центра тяжести пары электронов в маг- магнитном поле. Внутреннее движение компонент пары мы при этом не учитываем. Поскольку спин пары равен нулю, а заряд и масса равны удвоенным значениям этих величин для одного электрона, урав- уравнение для одного электрона, уравнение Паули для пары можно представить в виде ^^]2я = ?фя. F4,11) Напомним, что при наложении магнитного поля на поверхности сверхпроводника возбуждается сверхпроводящий ток, пол- полностью экранирующий внешнее магнитное поле. Поэтому вну- внутри сверхпроводника всегда Это значит, что вектор-потенциал А в полом цилиндра может быть представлен в виде , F4,12) где % — скалярный потенциал магнитного поля, являющийся неоднозначной функцией координат. Магнитный поток через полость в цилиндре равен Ф= J HdS = J rot AdS = cj> Adr = J grad %dr = A%, F4,13)
894 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI где Ах — скачок функции % при обходе по замкнутому контуру внутри сверхпроводящего цилиндра. Пользуясь выражением F4,12), можно переписать уравне- уравнение F4,11) в виде -Ь [т V ~ "Г grad * (г)Г ф" = ?фя- F4,14) Нетрудно убедиться, что волновая функция пары в магнитном поле фя выражается через волновую функцию пары ф0 без магнитного поля соотношением ^Х(Г) ^^"^Х(Г). F4,15) Разумеется, что волновая функция фя, как и волновая функ* ция ф0, должна быть однозначной функцией координат. Мысленно переместим какую-либо пару внутри сверхпровод- сверхпроводника по произвольной замкнутой кривой. При таком переносе не могут измениться ни функция ф0, ни функция фя. Между тем согласно F4,15) неоднозначная функция %(г) изменяется при обходе замкнутого контура на величину к%. Для того чтобы волновая функция фя не изменялась при возрастании % на ве- величину А%, необходимо, чтобы выполнялось равенство 2е . где я = 0, ±1, ±2,... Таким образом, магнитный поток через полость цилиндра может пробегать дискретный ряд значений ДФ = ^Bшг), F4,16) кратных величине -— и зависящих от заряда Bе). Полный магнитный поток через полость получается путем умножения АФ на число пар в объеме сверхпроводящего цилиндра. Как самый факт квантования магнитного потока через по- полость цилиндра, так и его зависимость от заряда пары Bе) были полностью подтверждены на опыте. Проведенное выше качественное рассмотрение явления сверхпроводимости полезно дополнить более последовательным обсуждением свойств некоторой упрощенной модельной систе- системы, описываемой гамильтонианом, Н = 2 [е (р) - [i] (ApJtup* + й^йрь) + А 2 {йр+а-Рь + а±Р1,а^), F4,17) где
§ 64] СВЕРХПРОВОДИМОСТЬ 895 — энергия электрона с импульсом р, — химический потенциал и р0 импульс на поверхности Ферми. В гамильтониане F4,17) первое слагаемое представляет га- гамильтониан системы невзаимодействующих частиц, находящих- находящихся вне поверхности Ферми. Вторая сумма характеризует взаимодействие электронов, находящихся вне поверхности Ферми с конденсатом, т. е. с электронами в заполненных состояниях. Это взаимодействие приводит к порождению или уничтоже- уничтожению пар электронов с противоположно направленными импуль- импульсами и спинами. Величина А, по причинам, ясным из дальнейшего, именуе- именуемая энергетической щелью, представляет работу выхода пары из конденсата на поверхность Ферми. При выборе гамильтониана F4,17) мы воспользовались тем, что число частиц в конденсате велико. Поэтому мы, подоб- подобно тому как это было сделано в § 5, вместо четырехфермион- ного оператора взаимодействия, фигурирующего в гамильто- гамильтониане E,3), ввели упрощенные двухфермионные операторы: оператор йр^й-р^, описывающий уничтожение двух электронов с импульсом р и спином f и с импульсом (—р) и спином \, а также оператор йр+> описывающий рождение такой пары. Произведем над гамильтонианом F4,17) линейное преобра- преобразование, переходя от операторов а и й+ к новым операторам й и а+, аналогичное проделанному в § 5. Именно, положим dP*eVW + tV*ip*' F4'18) <64'19> р pния, котор таются действительными с-числами, так что Здесь ир и vp—коэффициенты преобразования, которые счи- счий Кроме того, считается, что коэффициенты ир и vp удовлетво- удовлетворяют условию *;+*;-1. F4,20) Формулами F4,18) и F4,19) коэффициенты ир и vp определены еще не полностью и мы в дальнейшем можем наложить на них еще одно условие по нашему произволу. Легко непосредст- непосредственно убедиться, что преобразования F4,18) — F4,19) являются
$96 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI каноническими, т. е. что новые операторы а и а+, так же как и старые операторы а и й+, удовлетворяют фермиевским переста- перестановочным соотношениям. Подставляя в гамильтониан F4,17) и преобразовывая его к новым ферми-операторы, получаем с учетом F4,20) Н = 2 2 [е (р) - \i] v2p - 2А 2 upvp + + 2 {[[е (р) - ц) D - 4) + ZbUpVp] • (аЙА-р* + ft&ft-j*) 1 + + 2 iMp) - ц] 2upvp - Д D - ^)] (й^йА + арфрд). Потребуем теперь, чтобы коэффициенты и и v удовлетворяли условию D?) Тогда выражение для Н существенно упростится и примет вид я = Ео + 2 е (р) (айл-м+а^ам), F4,21) где обозначено ?о = 2 2 {[в (р) - |i] up - Аи,»,}, F4,22) ? (р) = [е (р) - |i] D - ^р2) + 2Д^рир. F4,23) Гамильтониан F4,21) допускает наглядную трактовку. Он отвечает газу элементарных возбуждений. Элементарные возбуждения обладают энергией Е(р) и связаны с движением двух фермионов с импульсами соответственно (р) и (—р). Зна- Значение Е(р) может быть выражено через е(р), \х и Д, если ре- решить уравнения F4,22) и F4,23) для ир и vp Имеем очевидно, из F4,22), F4,21) и F4,20) up~2\1+ up~2\1+ e(p) J» ^-г!1 8(р) Подставляя значения ир и ирв F4,23) для Е(р), получаем Е (р) = /Мр)-1х]2 + Д2. F4,24) Таким образом, минимальная энергия элементарных возбужде- возбуждений (при е(р) = |i) оказывается равной Д. Щель шириной Д от- отделяет энергию элементарного возбуждения от энергии частиц на поверхности фаз. Вблизи поверхности Ферми можно пред- представить Е(р) в виде Е (р) = У^р-Р/^ + Д2. F4,25) Газ элементарных возбуждений со спектром, даваемым форму- формулами F4,21) и F4,25), как мы видели в § 5, обнаруживает свой- свойство сверхтекучести.
§65] ТЕОРИЯ ФЕРМИ-ЖИДКОСТИ 897 Поскольку в рассматриваемом случае речь идет об элемен- элементарных возбуждениях, движение которых связано с переносом заряда, ясно, что мы пришли к выводу о наличии у него сверх- сверхпроводимости. Следует еще заметить, что взаимодействие посредством пар- парного обмена фононов, по-видимому, не является единственным типом взаимодействия между электронами, ответственными за сверхпроводимость. Указание на это дает тот факт, что суще- существуют сверхпроводники (рутений, осмий), не обнаруживающие изотопического эффекта. Однако из предыдущих расчетов вид- видно, что существующая теория сверхпроводимости не очень чув- чувствительна к детальному характеру'сил взаимодействия (при- (притяжения) между электронами, ответственному за появление свойства сверхпроводимости. § 65. Теория ферми-жидкости Несколько лет назад Л. Д. Ландау была предложена фено- феноменологическая теория ферми-жидкости, в которой с самого на- начала предполагается существование сильного взаимодействия между ферми-частицами. Эта теория позднее получила стати- статистическое обоснование, которое слишком сложно для того, чтобы его можно было изложить в этой книге1). Эта теория была применена к описанию поведения изотопа жидкого гелия Не3, ядра которого имеют спин 1/2 и должны подчиняться статистике Ферми. Если высказать предположе- предположение, что энергетический спектр системы электронов в кри- кристаллической решетке сравнительно мало отличается от спект- спектра электронной жидкости, заполняющей соответствующий объем, то она в равной мере относится и к электронам в. металлах. В основу теории положено допущение, что как бы ни быта сильно взаимодействие между частицами, оно не может нару- нарушить принципа запрета. Поэтому числа заполнения энергетиче- энергетических состояний в жидкости, как и в газе, могут быть равны только нулю и единице. Это означает, что в ферми-жидкости при абсолютном нуле заполнены все энергетические уровни вплоть до некоторой граничной поверхности Ферми. Распределение по энергиям имеет характер ступенчатой функции, e<eF. !) См А. А. Абрикосов, Л. П. Горько в, И. Е. Дзялошинский, Методы квантовой теории поля в статистической физике, Физматгиз, 1962. В своем изложении теории ферми-жидкости мы следуем этой книге»
898 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI Энергия и импульс на поверхности Ферми связаны с числом частиц соотношением (см. § 79 ч. III) 8/7 2т ~~ 2т 8л V) ' При температуре отличной от нуля, но достаточно низкой, воз- возникают коллективные возбуждения и ступенчатое распределе- распределение несколько размыкается. Если температура является доста- достаточно низкой, то можно считать, что энергия этих возбуждений близка к граничной энергии е?. Появление возбуждения всегда сопровождается образова- образованием свободных вакансий — дырок в заполненных состояниях внутри поверхности Ферми. Исчезновение возбуждений связано с заполнением вакантных состояний — аннигиляции «дырок» и «частиц». Поэтому можно утверждать, что возбуждения воз- возникают и исчезают попарно. Если отсчитывать энергию возбуждений от поверхности Ферми и приписывать возбуждениям определенное значение импульса, то их можно трактовать как пару квазичастиц — собственно квазичастицу и дырку. Энергия возбуждений при малых возбуждениях может быть представлена в виде разложения по малому параметру (р — pF) p F5,2) Аналогично, энергия дырки (отсчитываемая, как всегда, вниз от поверхности Ферми) @)р - F5,3) В соответствии с общими положениями теории квазичастиц, оба вида частиц равноправны и их свойства могут описываться величиной где т*—эффективная масса. При низких температурах ширина интервала размытости распределения, т. е. ширина интервала, {B-eF)~kT. F5,5) Для того чтобы приближение свободных квазичастиц имело смысл, необходимо, чтобы имело смысл понятие импульса, т. е. выполнялось условие D7,20). Поскольку в ферми-жидкости возбуждения могут возникать и исчезать только попарно, число встреч пары «частица» —
§ 65] ТЕОРИЯ ФЕРМИ-ЖИДКОСТИ 899 «дырка» пропорционально N2, где N — полное число возбужде- возбуждений при данной температуре. При низких температурах последнее растет пропорциональ- пропорционально Т. Соответственно этому, время жизни возбуждений т Поэтому Де — неопределенность в энергии квазичастицы соглас- согласно F5,6) равна Де~йГ2~ ~. F5,7) Сравнивая F5,7) и F5,5), мы видим, что при достаточно низкой температуре всегда (е~8^)>Д8, F5,8) и понятие импульса независимых квазичастиц имеет смысл. Таким образом, квазичастицы в ферми-жидкости имеют импульс и эффективную массу. Они возникают или исчезают только по- попарно при редких соударениях и, следовательно, подчиняются принципу запрета. Перечисленные свойства элементарных возбуждений позво- позволяют трактовать их как ферми-систему, описываемую функ- функцией распределения: 4 в kT +1 Функцию распределения квазичастиц мы будем нормировать условием J ? F5'10) где N — число реальных частиц жидкости в объеме V. Однако, и в этом существенное отличие ферми-жидкости от ферми-газа, энергия е данной квазичастицы зависит от плот- плотности п(г)у а следовательно, и от температуры. В приближении самосогласованного поля каждая квазича- квазичастица движется в поле, создаваемом всеми остальными квази- квазичастицами. Поэтому, если функция распределения возбужде- возбуждений изменится на величину б/, соответственно изменится и энер- энергия квазичастицы. Это изменение можно представить как F5'u) где оператор F{p,p') описывает интересующее нас изменение1). Этот формально введенный оператор играет основную роль в ]) Для упрощения формул мы не выписываем здесь зависимости опера- оператора F от спинов.
$00 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI теории ферми-жидкости. Формула F5,11) показывает, что энер- энергия е является функционалом от распределения /. Свойства распределения Ферми определяют температурную зависимость термодинамических величин газа квазичастиц. Именно, пользуясь формулами § 80 ч. III, имеем -пЦ—)\ F5,12) ekT +1 И Cv = kN^^-. F5,13) GF Линейная температурная зависимость теплоемкости связана исключительно со ступенчатым характером фермиевского рас- распределения. Более примечательными оказываются кинетические свойства ферми-жидкости. Именно, согласно F5,6) длина сво- свободного пробега квазичастиц b-vpx-^r F5,14) и быстро растет с понижением температуры. Это обстоятель- обстоятельство определяет температурную зависимость кинетических ко- коэффициентов, возрастающих с понижением температуры. Так, например, вязкость, по порядку величины, равна ~4? F5>15) а теплопроводность соответственно K~(Cvti)vFl~ -Jr. F5,16) Большая длина свободного пробега квазичастиц делает не- невозможным распространение в ферми-жидкости обычного зву- звука. Как мы видели в § 26, при длинах волн, превышающих дли- длину свободного пробега, в среде начинается весьма резкое за- затухание звуковых волн. Оказывается, однако, что в ферми-жидкости могут распро- распространяться периодические возмущения высокой частоты <о> —, имеющие характер, принципиально отличный от обычных зву- звуковых волн. Напишем кинетическое уравнение для неравновесной функ- функции распределения ???=' F5Л7) и заменим в нем F--W- F5'18)
$ 65] ТЕОРИЯ ФЕРМИ-ЖИДКОСТИ 901 Тогда кинетическое уравнение примет вид *+••?-¦?¦&-'• <«•••> Интеграл столкновений / ~ — и при достаточно низких температурах мал. Иными словами, при достаточно низких тем- температурах столкновения между квазичастицами становятся столь редкими, что их влияние на изменение функции распре- распределения мало. В этих условиях в идеальном газе передача возмущений прекращается. Существующее в ферми-жидкости взаимодей- взаимодействие приводит, как видно из F5,12), к изменению энергии квазичастиц при изменении функции распределения. Это — своеобразный вид дальнодействия между частицами в ферми- жидкости. Благодаря силам дальнодействия, возникшее в не- некоторый момент времени возмущение функции распределения распространяется по всей жидкости. Положим в кинетическом уравнении p), F5,20) где fo(e) — равновесное распределение, а /ч — возмущение. Подставляя F5,20) в кинетическое уравнение, находим д& Заметим, что в равновесной жидкости -^jr—O. Поэтому в по- последнем члене мы удержали лишь величину первого порядка малости. Поскольку равновесное распределение fo имеет вид ступенчатой функции, имеем (ср. § 80 ч. III) Поэтому возмущение ft также должно быть пропорционально этой дельта-функции. Будем искать его в виде fx ~ аб (е - гР) е1 <*'-««. F5,22) Выбрав вектор k за полярную ось и считая, что а зависит только от угла 0, получаем I {vFk cos 9 - со) а + v Jjf- = 0. F5,23) Для изменения энергии -?% пользуясь F5,11), можно написать F5,24)
902 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. V! При подстановке F5,24) в уравнение F5,23) следует взять значения импульса на поверхности Ферми, так что интегриро- интегрирование- по dp сводится к интегрированию по углам. Таким обра- образом, получаем (kvF cos8 - со) a (G) + *°?&?)** \Fa ^ dQ = °" F5'25> Зависимость F от угла неизвестна. Если принять, что F вообще от углов не зависит и является некоторой постоянной, то J F (р, рО а (90 du = F J а (90 dQ = const = А ~ cos 9) а (9) = A cos 9 или ^C0SV F5'26) Подставляя это значение а в F6,26), получаем уравнение для определения ¦^¦==~'> где и — скорость распределения воз- возмущений: Из последнего выражения непосредственно видно, что ско- скорость распределения возмущений может быть вещественной только, если она превышает скорость частиц на поверхности р Ферми vP = -—-. При этом, как видно из F5,26), возмущенная функция распределения оказывается вытянутой вперед по на- направлению распространения возмущения. Полученный результат, как показывает более подробное рас- рассмотрение, имеет общий характер и не связан с принятым упро- упрощением F = const. Учет угловой зависимости F приводит к еще более асимметричному распределению возмущенной функции. Распространение рассмотренных возмущений является спе- специфическим эффектом, связанным с взаимодействием квазича- квазичастиц. Этот эффект получил название «нулевого звука», поскольку он может распространяться при 7 = 0. Ясно, что нулевой звук представляет существенно неравновесный процесс. Более полный расчет показывает, что распространение нулевого звука сопрово- сопровождается его быстрым затуханием по длине ~ их.
$ 66] ЭЛЕКТРОНЫ В КРИСТАЛЛАХ ДИЭЛЕКТРИКОВ 903 В самое последнее время существование «нулевого звука» получило полное экспериментальное подтверждение. В жидком гелии Не3 наблюдалось распространение и затухание нулевого звука, возбуждавшегося колебаниями стенок сосуда. Опыт под- подтвердил все основные выводы теории. Свойства электронной ферми-жидкости во многих отноше- отношениях оказываются сходными со свойствами ферми-жидкости нейтральных частиц. Это относится к общему характеру воз- возникновения возбуждений, ввиду энергетического спектра и т. п. Вместе с тем наличие кулоновского взаимодействия и взаимодей- взаимодействия с фононами решетки приводит к .появлению довольно су- существенных, хотя и количественных различий. Теория электрон- электронной ферми-жидкости слишком сложна и неполно разработана для того, чтобы ее можно было излагать в рамках этой книги. § 66. Электроны в кристаллах диэлектриков Как мы подчеркивали, различие между металлами, полу- полупроводниками и диэлектриками связано главным образом с разным характером электронного спектра. В кристаллах диэлектриков свободная зона отделена от за- заполненной зоны широкой (порядка одного или нескольких электрон-вольт) полосой запрещенных энергий. Допустим, что в диэлектрике происходит поглощение света и возбуждение одного из атомов решетки. Поскольку кристалл обладает трансляционной симметрией и волновая функция воз- возбужденного состояния -фп должна удовлетворять условию трансляционной симметрии Гф„ = аА, F6,1) состояние возбуждения не может быть локализовано у опре- определенного атома. Наоборот, оно должно двигаться по кристал- кристаллу и представлять возбужденное состояние кристалла как це- целого. Электронная волновая функция, описывающая кристалл в возбужденном состоянии, может быть представлена в виде (ср. 48,11) ^=2^Ф/, F6,2) где фу— симметризованная волновая функция, отвечающая возбуждению /-го атома в решетке. Волновая функция F6,2) удовлетворяет как уравнению Шредингера [при должном выборе Е{к)\ так и требованию трансляционной симметрии D8,4). Мы видим, что коллективное возбуждение, — возбуждение, передающееся по решетке от одного атома к другому, можно рассматривать как квазичастицу с квазиимпульсом р = bk. Эта квазичастица получила название экситона. К экситону
904 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI относится все сказанное в § 47 о свойствах квазичастиц. По- Поскольку экситоны возникают и исчезают, их следует считать ча- частицами, подчиняющимися статистике Бозе — Эйнштейна. В отличие от фононов, которые представляют коллективные возбуждения колебательного состояния ядер решетки, эксито- экситоны представляют электронное возбужденное состояние. Однако с перемещением экситона по кристаллу не связано движение электрического заряда. В этом отличие экситона от заряжен- заряженной квазичастицы — электрона или дырки в металле или полу- полупроводнике. Энергетический спектр экситона г(к) может быть найден в двух предельных случаях. Первый из них — так называемый экситон малого радиуса или экситон Френкеля. Экситону малого радиуса отвечает та- такое возбужденное состояние кристалла, которое в изолирован- изолированном атоме отвечало бы обычному возбуждению. Это означает, что возбужденный электрон в основном локализован возле не- некоторого атома решетки. Благодаря взаимодействию между атомами возбуждение передается соседним атомам и так ми- мигрирует по кристаллу. Наглядно экситон Френкеля можно пред- представить себе как пару электрон-ионный остаток, радиус которой мал по сравнению с постоянной решетки а. Волновая функция фу экситона малого радиуса определяет- определяется решением уравнения Шредингера с потенциалом кулонов- ского вазимодействия «*=--?- F6,3) между электроном и ионным остатком. Энергетический спектр экситона малого радиуса может быть найден "в приближении взаимодействия с ближайшими со- соседями. Соответствующие вычисления не отличаются от вычислений § 49 и приводят к выражению для e(fe), в принципе совпадаю- совпадающему с D9,13) [напомним, что конкретный вид формулы D9,13) относится к электрону в s-состоянии; это допущение часто не- оправдано для возбужденных состояний]. Спектр экситонов имеет характер полосы, причем у краев полосы энергия связана с импульсом соотношением 8*W~I^> <66>4> где т* выражается через обменный интеграл взаимодействия между атомами; п — номер зоны. По порядку величины эффек- эффективная масса экситона т* близка к аналогичной величине силь- сильно связанных электронов. Другим предельным случаем является экситон большого ра- радиуса или экситон Ванье. Образованию экситона большого ра* диуса отвечала бы ионизация изолированного атома. Это значит,
§ 66] ЭЛЕКТРОНЫ В КРИСТАЛЛАХ ДИЭЛЕКТРИКОВ 905 что энергия возбуждения достаточно велика, чтобы перевести электрон из заполненной в вакантную зону кристалла. Такой переход сопровождается одновременным появлением дырки в заполненной зоне. Электрон и дырки взаимодействуют между собой по закону Кулона в среде где 8оо — диэлектрическая проницаемость среды. Несколько ниже мы уточним, что именно следует понимать под 8оо. Формула F6,5) с макроскопической константой е<х> означает, что взаимодействие электрона и дырки описывается усреднен* ным полем достаточно большого числа атомов и, следовательно, что расстояние между компонентами пары достаточно велико по сравнению с постоянной решетки. Взаимодействующую пару электрон — дырка в кристалле и называют экситоном большого радиуса. Уравнение Шредингера для экситона, т. е. двухчастичной системы, можно представить в виде A4,5) ч. V. Вводя радиус-вектор центра массы относительного движе- движения, можно написать решение его в виде [ср. A4,14) ч. V] где ф удовлетворяет уравнению Шредингера для относитель- относительного движения (!> = еф' F6'6) а 1|з — уравнению движения центра массы в кристалле ~<? + 8>*- F6,7) Уравнение F6,6) совпадает с уравнением Шредингера в ато- атоме водорода, в котором Z = —. Его решение имеет вид водо- родных функций ф с энергиями еп, которые в области дискрет- дискретной части спектра даются формулой C8Д7) ч. V: Решением уравнения Шредингера для движения центра массы служат функции F6,2). Полная энергия экситона образует полосу. У края полосы ее можно написать в виде Е и - 29 В. Г5 Левич и др., том II
906 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ 1ГЛ. VI Таким образом, экситон большого радиуса движется по кри- кристаллу как целое и вместе с тем имеет внутреннюю степень свободы. Замечательной особенностью экситона большого радиуса яв- является именно наличие в его энергетическом спектре водородо- подобного слагаемого, отвечающего внутренней степени сво- свободы. В спектре поглощения света в диэлектрике должны про- проявляться дискретные уровни, соответствующие водородному спектру. Этот эффект наблюдался у целого ряда кристаллов и может считаться самым непосредственным доказательством су- существования экситонов большого радиуса. Размер большого экситона rw определяется величиной боровского радиуса при Z = —, т. е. дается формулой еоо Для того чтобы понятие экситона большого радиуса имело смысл, необходимо выполнение неравенства 2$->а. F6,10) Заметим, что наряду с состоянием дискретного спектра урав- уравнение F6,6) имеет решения непрерывного спектра. Эти состоя- состояния отвечают распаду экситона на электрон и дырку, движу- движущиеся по кристаллу независимо друг от друга. В отличие от движения экситона, при этом возникает не только перенос энер- энергии, но и перенос заряда (фотопроводимость диэлектрика, если возбуждение создается его освещением). Из сказанного выше ясно, что различие между экситоном большого и малого радиусов имеет несколько условный харак- характер. Возможны промежуточные случаи, когда размер экситона сравним с постоянной решетки. Мы можем обсудить теперь, какое значение диэлектрической проницаемости среды следует ввести в формулу F6,5). Элек- Электрон и дырка обращаются вокруг общего центра тяжести со скоростью, весьма большой по сравнению со скоростью движе- движения тяжелых ядер. Вместе с тем их скорость сравнима со ско- скоростями валентных электронов. Поэтому валентные электроны успевают поляризоваться и их поляризация следует за движе- движением компоненты пары, тогда как ядра остаются неподвижными. Ситуация эта отвечает действию на кристалле высокочастот- высокочастотного электромагнитного поля. Поэтому под боо следует понимать п2-диэлектрическую проницаемость при высоких частотах. В заключение заметим, что понятие экситона теряет смысл в металлах. В металлах время существования экситонов At ока-
§ 67] ВНЕШНИЙ ФОТОЭФФЕКТ С ПОВЕРХНОСТИ МЕТАЛЛА 907 зывается столь малым, что теряет смысл понятие квазичастицы: Исключение могут составить лишь сверхпроводники, обладаю- обладающие щелью в энергетическом спектре. § 67. Внешний фотоэффект с поверхности металла При освещении металла светом достаточно высокой частоты с его поверхности вылетают фотоэлектроны. Это явление, полу- получившее название внешнего фотоэффекта, широко изучено и на- нашло общеизвестные практические приложения. Однако доста- достаточно полная и последовательная теория внешнего фотоэффекта была развита совсем недавно1). Теория внешнего фотоэффекта с поверхности металла может служить иллюстрацией подхода к изучению так называемых пороговых явлений в квантовой механике. Под пороговыми яв- явлениями понимают переходы при энергиях, близких к энерге- энергетическому порогу данного процесса. Рассмотрим металл, граничащий с некоторой оптически про- прозрачной средой. Такой средой может быть твердый диэлектрик, раствор или вакуум. При освещении поверхности металла све- светом с частотой со однофотонный переход с вылетом электрона из металла может иметь место только при со > соо, где порого- пороговая частота соо связана с работой выхода W очевидным соотно- соотношением W = йсоо. Мы ограничимся частотами со, близкими к соо, и будем искать вероятность вылета фотоэлектронов и фототок / в зависимости от частоты света. Фотоэффект в металлах может иметь в принципе два раз- разных механизма: 1. Поверхностный фотоэффект, при котором фотоны сталки- сталкиваются с электронами, находящимися в поверхностном слое ме- металла. Под поверхностным слоем понимают область, в которой потенциальная энергия изменяется от значения W в глубине металла до нуля на самой поверхности. В поверхностном слое электрон находится в поле сил, изменяющихся от точки к точке. Это обеспечивает выполнение законов сохранения энергии и импульса при столкновении электрона с фотоном с вылетом электрона из металла. 2. Объемный фотоэффект, наступающий в области оптиче- оптической прозрачности металлов. Эта область лежит обычно *) Изложение этого параграфа основано на работе А. М. Бродского, Ю. Я. Гуревича и В. Г. Левича. Phys. Solid Stat. 40, 139 A970), А. М. Бродский, Ю. Я. Гуревич ЖЭТФ 27, 122 A968). 29*
908 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. VI в ультрафиолетовой части спектра. При объемном фотоэффекте взаимодействие фотонов с электронами происходит в глубине металла (в области постоянства средней потенциальной энер- энергии). Роль третьего тела, обеспечивающего выполнение законов сохранения, играют в этом случае фотоны или примеси. При энергиях фотонов ниже 8—10 эв металлы оптически не прозрачны и может иметь место только поверхностный фото- фотоэффект (исключение составляют щелочные металлы). При со ;>, соо энергия вылетевших фотоэлектронов Е мала по срав- сравнению с йсоо, так что фотоэлектроны можно считать медлен- медленными частицами. Заметим, что обычно энергия фотоэлектронов составляет около 1 эв, так что она еще велика по сравнению с kT. Будем считать, что металл занимает полупространство —оо<г-<0 и имеет однородную внешнюю поверхность. Элек- Электрон движется в потенциальном поле с потенциальной энер- энергией U(z), которая при достаточно больших значениях (—г) пе- переходит в строго периодическое поле внутри кристалла. Сред- Среднее значение потенциальной энергии в глубине металла равно [/(г)~—W. В области 0< г < 6, т. е. в поверхностном слое среды электрон попадает в сложное неизвестное потенциальное поле. Мы будем считать ширину слоя б малой, так, чтобы имело место неравенство ТГ<1, F7,1) где р — импульс вылетевшего электрона в направлении оси г. Иными словами, мы будем считать длину волны электрона Я^>б. Наконец, при z > 6 потенциальную энергию в среде можно записать как Первое слагаемое имеет смысл потенциальной энергии электрона в среде (в вакууме мы принимаем его энергию равной нулю). Второе слагаемое представляет силу изображения в среде с эф- эффективной диэлектрической проницаемостью еЭфф. Поскольку электрон движется в среде с энергией значительно большей, чем тепловая, еЭфф не совпадает со статистической диэлектриче- диэлектрической проницаемостью, а скорее приближается к оптической про- проницаемости. Напишем уравнение Шредингера для волновой функции электрона внутри и вне металла. Поскольку металл считается однородным в плоскости ху, невозмущенную волновую функ- функцию можно представить в виде , Р, г) е""Р, F7,3)
§ 67] ВНЕШНИЙ ФОТОЭФФЕКТ С ПОВЕРХНОСТИ МЕТАЛЛА 909 где р\\ и р—импульс и радиус-вектор в плоскости ху и Е — энер- энергия электрона. Невозмущенное уравнение Шредингера имеет вид F7,4) При воздействии поля излучения, которое можно характеризо- характеризовать оператором Н'(г)еш, в первом приближении теории воз- мущений можно написать + <bi(z), F7,5) где i|)i удовлетворяет уравнению } F7,6) Здесь (E+'h®) — энергия электрона, поглотившего фотон. Воспользовавшись законом сохранения энергии pf F7,7) перепишем F7,6) в виде M--*/*- F7>8) Рассмотрим решение уравнения F7,8) в областях z > б и z < 0. В первой области, учитывая быстрое спадание *фо вне ме- металла, можно опустить член #'я|)о в правой части F7,8). Вне металла электрон можно считать движущимся в поле Ua(z). При этом импульс в плоскости (ху) сохраняется, так что р(в)в F7,9) Это позволяет представить F7,8) в виде Уравнение F7,10) совпадает с уравнением, описывающим дви- движение электрона с нулевым орбитальным моментом в кулонов- ском поле. Нужное нам асимптотическое выражение \|?i при 2->оо в кулоновском поле, отвечающее уходящей на бесконеч- бесконечность частице, имеет вид ^ (z -* оо) еее j?^ = ехр {/ {рг + г] In 2pz + б0)}, F7,11)
910 КИНЕТИЧЕСКИЕ СВОЙСТВА ТВЕРДЫХ ТЕЛ [ГЛ. Vb где обозначено ч-т?р' F7'12) 60 = arg(l-/r]). F7,13) При z -> 0 для \|?i можно воспользоваться рассуждениями § Ъ% ч. V, положив [1 — р"-2ят1 Т/а / ч Поэтому -ф! (е) можно представить в виде F7,15> где х — кулоновская функция с указанным асимптотическим по- поведением, a G(p9 со) — функция, не зависящая от г. Для ее опре- определения F7,15) следует сомкнуть с решением внутри металла,, т. е. с решением F7,8) при z < б. Подобно тому как это было сделано в § 93 ч. V, при этом смыкании следует воспользоваться условием (•—-= const). Вместо того, чтобы производить смыкание при z = 6, мы будем смыкать F7,15) с решением внутри металла при z = 0. На длине б волновая функция частицы с длиной волны Я ^> б не успевает существенным образом измениться. Обращаясь к об- области z < 0, заметим, что внутри металла потенциальная энер- энергия \U(z)+ Vo\ весьма велика по сравнению с величиной у—. Поэтому в F7,8) при z < 0 в уравнении Шредингера можно< опустить слагаемое ~р В результате волновая функция внутри металла оказывается не зависящей от величины р. В точке z = 0 следует написать условие смыкания функции F7,15), зависящей, вообще говоря, от р с функцией, от р не зависящей. Ясно, что условие смыкания может быть выполнено при всех значениях р, если при г->0 i|)i(z), даваемое F7,15) г также не зависит от р. Поэтому следует положить где /(со)—некоторая функция частоты, не зависящая от р. Таким образом, при г—юо получаем
<§671 ВНЕШНИЙ ФОТОЭФФЕКТ С ПОВЕРХНОСТИ МЕТАЛЛА 911 Зная волновую функцию, можно найти фототок. Именно, плот- плотность потока вероятности / = о— (i|>*Vif> — ifVif*) = —— —==-, F7,17) 33 где Ео = ——eV. 8эфф Полный фототок с единицы поверхности металла дается формулой jn(E)p(E, pt)Q(E)dEdPfi = t X X J 2яр(?, pt)\pt\dpv F7,18) тде AZ (?) — распределение Ферми, р (?, р..) — число состояний с данным Е и рг Химический потенциал \х связан с работой вы- вывода и потенциалом Vq очевидным соотношением |ut = —W+Vq. Считая р(?, р.) медленно изменяющейся функцией, можно вы- вынести ее за знак интеграла. Дальнейшие выкладки можно про- провести для двух случаев — вылета электронов в вакуум и среду« В первом случае энергия фотоэлектронов Е <С Ео и /=const. При этом вычисление интеграла F7,18) дает I~(E-h®of. F7,19) Полученный закон зависимости фототока от частоты (закон Фаулера) хорошо согласуется с опытом. При вылете в диэлектрик или раствор электролита ^6— 10, так что Ео ~ 0,3— 1 эв и Е > Ео. Соответственно, 1 В этом случае F7,20) Эта частотная зависимость также была хорошо подтверждена опытными данными для фототока на границе металл — раствор.
ГЛАВА VII ВЗАИМОДЕЙСТВИЕ ИЗЛУЧЕНИЯ С ГАЗОМ СВОБОДНЫХ ЭЛЕКТРОНОВ § 68. Разреженная плазма в поле низкочастотного излучения В последние годы были обнаружены многочисленные и важ- важные астрономические объекты, являющиеся источниками весьма мощного излучения. Оказалось, что эти объекты обладают ха- характерным спектром излучения, очень сильно отличающимся от равновесного (планковского) распределения, с максимумом ин- интенсивности, лежащим в области радио- или инфракрасных волн. Эти объекты оказались окруженными облаками (атмос- (атмосферами) весьма разреженной и полностью ионизованной плаз- плазмы. Наряду с такими внеземными мощными источниками низ- низкочастотного излучения, в земных условиях также удалось соз- создать подобного рода излучающие системы. Ими являются лазеры и современные СВЧ-излучатели, у которых высокоинтен- высокоинтенсивное излучение создается в оптическом или радиодиапазоне. В связи с этим в физике возник большой интерес к пове- поведению разреженной плазмы в поле излучения высокой интен- интенсивности. При этом выяснилось, что такая, казалось бы, про- простая, система как свободные электроны, находящиеся в поле излучения, изучена далеко не так полно, как это представля- представлялось ранее. С другой стороны, именно кинетический подход к этой системе позволил исследовать ее свойства с достаточной полнотой. Поэтому мы подробно осветим вопрос о поведении газа свободных электронов в поле излучения1). Рассмотрим весьма разреженную плазму, помещенную в поле интенсивного низкочастотного излучения. С самого начала мы ограничимся областью нерелятивистских энергий электро- электронов и нерелятивистских частот. Очевидно, что взаимодействие излучения с тяжелыми яд- ядрами играет подчиненную роль по сравнению с прямым взаимо- !) В этой главе мы следуем работам: Я. Б. Зельдович, Е. В. Ле.вич, ЖЭТФ 65, 2423 A968); Е. В. Левич, ЖЭТФ 60, 112 A971); Т. Peraud, le Journal de Physique 29, 88, 306, 872 A958); А. С. Компанеец, ЖЭТФ 31, 876 A956); Я. Б. Зельдович, Е. В. Левич, Письма ЖЭТФ И, 57 A970).
$ 68] РАЗРЕЖЕННАЯ ПЛАЗМА В ПОЛЕ ИЗЛУЧЕНИЯ 913 действием с электронами. Естественно, что условие электроней- электронейтральности плазмы не может быть нарушено: всякое изменение распределения электронной плотности вызывает соответствую- соответствующие смещения ядер. Если, однако, движение электронов вы- вызвано полем излучения с частотой, большой по сравнению с ленгмюровской частотой плазмы, то коллективное движение ядер и электронов оказывается несущественным1). При движе- движении в таком поле электроны приобретают до известной степени независимость от ядер и взаимодействуют с излучением как сво- свободные частицы. Поэтому для наших целей достаточно рассмот- рассмотреть идеализированную систему — разреженный газ электронов в поле излучения. Более тонкие эффекты, связанные с коллек- коллективными движениями в плазме, рассматриваться не будут. Возможен двоякий подход к рассмотрению поведения сво- свободных электронов в поле низкочастотного излучения: 1) во первых, можно провести классический расчет движения отдель- отдельных электронов в волновом поле и затем перейти к рассмотре- рассмотрению статистического поведения газа таких электронов; 2) мож- можно с самого начала рассмотреть поведение системы — газ сво- свободных электронов + газ фотонов. Свойства такой системы в классической области получаются при #->0. Классическое рассмотрение возможно и законно в области достаточно низких частот и высоких плотностей излучения. При этом числа заполнения (см. § 101 ч. V) фотонов n(k) достаточно белики и в квантовомеханических формулах можно перейти к классическому пределу, как это всегда можно сделать при больших квантовых числах. Подчеркнем прежде всего, что движение электрона в спек- спектральном поле излучения, содержащем непрерывный ряд частот и волновых векторов, существенно отличается от его движения в поле отдельной монохроматической волны. Поясним это на простейшем примере движения электрона в поле двух волн с одинаковыми частотами, но сдвинутыми по фазе. Уравнение движения нерелятивистского электрона запишем в виде tn—rr = < ![*, Нх+Н2]}. F8,1) Будем искать решение уравнения F8,1) по методу последова- последовательных приближений, т. е. полагая ~±[Vuf Hx+H2]. F8,2) !) Более точные расчеты показывают, что частоты поля излучения о> должны быть больше, чем щс/и, где и — тепловая скорость электронов.
914 ГАЗ СВОБОДНЫХ ЭЛЕКТРОНОВ В ПОЛЕ ИЗЛУЧЕНИЯ [ГЛ. VI? Если представить поля в виде Ех = Еоеш + сопряженное, F8,3> Е2 - Еоеш+1а + сопряженное, F8,4> Нх = [Ехпх], F8,5> Н2 — [^Яг]» F8,6^ то без труда найдем *о = ^У^-. F8,7> При этом для vx находим = -7-2 {[Яо> [Еоп2] ] (е2Ш+*« + е** + сопряженное)}. F8,8> Мы видим, что если сдвиг фазы а отличен от нуля, то на элек- электрон действует постоянная (систематическая) сила ~ t °2 . В отличие от периодического движения электрона в поле одной волны, в поле двух волн электрон, помимо колебаний, должен под действием этой силы совершать систематическое движение, т. е. производить систематический набор энергии. Только в слу- случае двух волн одного направления, когда полное магнитное поле (#i + Н2) сдвинуто по отношению к полному электрическому полю (Z?i + Е2) на фазу я/2, электрон будет совершать строп* периодическое движение. Подчеркнем, что электрон взаимодей- взаимодействует одновременно с двумя волнами и поэтому систематиче- систематическая сила оказывается пропорциональной произведению напря- женностей полей. Если обратиться теперь к реальному спектральному полю^ содержащему бесконечное множество гармоник сог-, то ясно, что- задача о движении электрона в поле приобретает статистиче- статистический характер. Реальный смысл имеют только величины, усред- усредненные по всем значениям случайных фаз. Таким образом, уже задача о движении одного электрона в реальном поле требует статистического подхода. Ввиду сложности классического ме- метода расчета, требующего наложения полей и последующего' усреднения по случайным фазам [заметим, что уже формула F8,8) достаточно громоздка], естественно возникает мысль о втором из указанных выше подходов к решению задачи. Как будет видно из дальнейшего, он действительно оказывается не- неизмеримо более ясным с принципиальной стороны и простым в вычислительном отношении.
<§ 68] РАЗРЕЖЕННАЯ ПЛАЗМА В ПОЛЕ ИЗЛУЧЕНИЯ 915 В системе, состоящей из свободных электронов и фотонов, имеют место два основных процесса взаимодействия между ними: 1) комптоновское рассеяние, 2) свободно-свободные пе- переходы (тормозное излучение или поглощение фотонов при столкновениях между электронами). Кроме того, в системе (газ электронов + газ фотонов) про- происходят столкновения между электронами без излучения. В реальной плазме к этим процессам прибавляются столкно- вания электронов с ядрами и свободно-свободные переходы при этих столкновениях, которые являются более существенными, ^ем при столкновениях электронов. При комптоновском рассеянии фотона на свободном элек- электроне происходит изменение как волнового вектора, так и ча- частоты фотона. Проще всего рассмотреть изменение этих вели- величин в системе отсчета /Со, в которой электрон покоится. В этой системе отсчета можно написать Аро = П С " '0 + 7 (*о" О V = APi + А?2> F8>9> тде ^Г ('-*'); F8,10) •wo и wo — частоты, I и V — единичные векторы в направлении распространения падающего и рассеянного фотонов. Величина Ар\ представляет изменение импульса электрона в результате рассеяния без изменения частоты фотона, т. е. в результате про- простого изменения направления его полета. Величина Др2 определяет изменение импульса электрона в результате передачи ему энергии от фотона в акте неупру- того рассеяния. Пользуясь выражением для изменения частоты при комптон-эффекте [см. A7,12) ч. I], можно написать: -^r(l-M'), F8,11) откуда следует, что Др2 = _^L у A _ Ц'\ F8,12) Очевидно, что отношение в нерелятивистском приближении весьма мало.
916 ГАЗ СВОБОДНЫХ ЭЛЕКТРОНОВ В ПОЛЕ ИЗЛУЧЕНИЯ [ГЛ. VII Заметим еще, что в лабораторной системе отсчета изменение частоты при рассеянии на электроне с импульсом р име- имеет вид ^|Й ^*') F8>13> в том же приближении нерелятивистских скоростей. Что же касается вероятности комптоновского рассеяния фо- фотона с изменением волнового вектора к-^>Ы в телесном угле dQ, то ее можно представить, в виде dwu+v = cNe[l+n {k')\ n (k) do, F8,14) где n (k) — число фотонов с волновым вектором k и Ne— число электронов в единице объема. Множитель [1 + n(k)] (сравнить с A03,7)) связан с бозе-статистикой фотонов. Эффективное сече- сечение da дается в интересующем нас приближении длинных волн формулой Томсона. В системе покоящегося электрона Ко (см. § 36 ч. I): (^JL±f^ F8,15) где а — угол рассеяния. Мы видим, что можно различать два вида рассеяния — спонтанное, пропорциональное числу фотонов п(Л), и индуци- индуцированное, пропорциональное n(k)n(k'). В классическом пределе больших чисел заполнения вероятность индуцированного рас- рассеяния гораздо больше вероятности спонтанного рассеяния. Это — общее соотношение между спонтанными и вынужденными процессами. Последние всегда отвечают классическому пове- поведению системы. Поэтому усредненное движение электрона в спектральном поле излучения в классическом пределе, об- обсуждавшееся нами выше, может быть найдено из рассмотрения эффекта индуцированного рассеяния фотонов этим электроном. Имея в виду переход к классическому пределу й->0, введем вместо числа фотонов с данным значением вектора k спектраль- спектральное распределение р(со,/). Согласно G6,9) ч. III спектральное распределение выражается через число фотонов по формуле Р(со,/) = ~§г>г@,/). F8,16) Спектральное распределение определяет среднюю энергию из- излучения с данной частотой. Очевидно, что р (а>, /) не зависит от значения постоянной Планка Ь. Мы видим, что в классическом пределе dw ~cNe^r9 (со, I) p (ю, V) do. F8,17)
§ 69] УРАВНЕНИЯ ДЛЯ ЭЛЕКТРОНОВ И ФОТОНОВ 917 Подчеркнем, что в процессе рассеяния число фотонов остается неизменным. Тормозные свободно-свободные переходы представляют из- излучение или поглощение фотонов электроном, движущимся в поле ядра или другого электрона. Вероятность тормозного процесса И7# пропорциональна квадрату плотности электро- электронов Ne и имеет вид1) Wff-^r- F8,18) Вероятность тормозных процессов при малой плотности элек- электронного газа и больших значениях плотности излучения оказы- оказывается, вообще говоря, гораздо меньшей вероятности комптонов- ского рассеяния. Поэтому мы будем пренебрегать тормозными процессами. Исключение составляет область очень низких частот. Поскольку Wff очень быстро растет с уменьшением частоты, при достаточно низких частотах тормозные процессы становятся преобладающими. Это накладывает второе ограни- ограничение на значение рассматриваемой нами области частот, т. е. со>согр, F8,19) где соГр — та частота, при которой (при данной плотности элек- электронного и фотонного газов) изменение функции распределения из-за тормозного поглощения испускания становится больше, чем из-за комптон-эффекта. Частота соГр, очевидно, тем ниже, чем меньше плотность Ne и больше р(со,/). До сих пор мы предполагали, что разреженная плазма вза- взаимодействует с излучением с известным спектральным распре- распределением р(со, /). Возможна, однако, и другая постановка во- вопроса. Именно, в результате взаимодействия с электронами из- изменяется спектральное распределение излучения. Например, при взаимодействии с электронным газом, находящимся в состоянии равновесия, спектральное распределение излучения изменяется (эволюционирует) во времени. В тех же приближениях этот процесс также будет рассмотрен в дальнейшем. § 69. Кинетические уравнения для электронов и фотонов Обратимся* -прежде всего к формулировке кинетических урав- уравнений для электронов и фотонов. В кинетическом уравнении |f = /, F9,1) 1) См., например, В. Гайтлер, Квантовая теория излучения, ИЛ, 1956, стр. 279.
918 ГАЗ СВОБОДНЫХ ЭЛЕКТРОНОВ В ПОЛЕ ИЗЛУЧЕНИЯ [ГЛ. VII где f = f(p>t) — функция распределения электронов, интеграл столкновений можно представить в виде / = /« + /„. F9,2) Здесь 1ее—интеграл столкновения электронов между собой, определенный формулой Ландау C4,7). Интеграл /с определяет изменение функции распределения электронов вследствие комптоновского рассеяния ими падаю- падающих фотонов. При каждом акте рассеяния происходит изменение импульса электрона согласно формуле F8,9). Мы будем считать систему электронов и фотонов однородной в пространстве, так что функция распределения f не зависит от координат. В дальнейшем мы будем рассматривать самый общий случай анизотропного распределения электронов и фотонов в простран- пространстве импульсов. Поэтому мы будем считать функцию распреде- распределения электронов f(pyt) зависящей от вектора импульса и вре- времени; соответственно функцию распределения фотонов (числа заполнения) представим в виде п = n(kt t). С учетом сказанного, а также формулы F8,14) для вероятности рассеяния, интеграл столкновений электронов с фотонами можно /с записать в виде /, = - J dWk-*k>f(p, t) + J dWk>-*kf(p't t)y F9,3) где , = c[l+n(k, t)]n(k', t)dodk'= W**b . ™ e Первый интеграл в F9,3) выражает убыль числа электронов с импульсом р, второй — приход электронов в это состояние в результате столкновений с фотонами. В рассматриваемом нами случае низких частот излучения изменение импульса электрона при одиночном соударении с фо- фотоном мало по сравнению с его средним значением. Поэтому функция распределения является медленно изменяющейся функ- функцией своего аргумента, и в соответствии со сказанным в § 10 кинетическое уравнение сводится к уравнению типа Фоккера — Планка. Не повторяя выкладок § 10, можно сразу написать уравне- уравнение Фоккера — Планка для трехмерного пространства импуль- импульсов, т. е. при Я = рХу ру, pZy в виде dt = " " {uif ~ ^Г{Dikf))+ Iee {iy k = x>y>z)i F9>4)
§ 69] УРАВНЕНИЯ ДЛЯ ЭЛЕКТРОНОВ И ФОТОНОВ 919 где коэффициенты диффузии Dih и подвижность а\ в простран- пространстве импульсов выражаются формулами Dik= j bPiApkdWk^,, F9,5) а^ j APldW6^,. F9,6) Подставляя dWk+v из формулы F9,3), находим: Dik = (Др, Др*> = J Ар,^pkп(k)[l+n(*')] сdkda, F9,7) at = <ДЛ) - J ДЛл (й) [ 1 + n (*')] с dft da, F9,8) где () означает среднее по функции распределения фотонов. Заметим, что коэффициенты диффузии в пространстве импуль- импульсов характеризуют беспорядочный набор энергии электронами, тогда как подвижность — действующую на электрон системати- систематическую силу. В следующих параграфах мы вычислим кинети- кинетические коэффициенты F9,7) и F9,8) и найдем решение урав- уравнения F9,4) в различных условиях. Оказывается целесообразным проводить вычисление кинети- кинетических коэффициентов в той системе отсчета, в которой элек- электрон покоится. Именно в этой системе отсчета сечение рассея- рассеяния имеет простой вид. Кроме того, имеет простой вид и вы- выражение для передаваемого импульса. Прежде чем перейти к обсуждению кинетического уравнения для электронов, найдем соответствующее кинетическое урав- уравнение для фотонов. В этом случае мы ограничимся случаем изо- изотропного распределения фотонов, т. е. п = /г (со, /). Имеем, очевидно, ~ = jf, F9,9) где J{P — интеграл столкновений фотонов со свободными элек- электронами: 1? =- |/г(со, /)[1+/г(со7, t)]cdof(p, t)dp + + J п (со', /) [ 1 + п (со, t)] с daf (p', 0 dp. F9,10) Первое слагаемое дает убыль числа фотонов с частотой о при столкновении с электроном с импульсом р, второе — приход фо- фотонов в это состояние. В состоянии равновесия -?- = -^ = 0. Как мы видели ранее, максвелловское распределение обращает в нуль интеграл столк- столкновений электронов между собой 1ее- Простая проверка позво-
920 ГАЗ СВОБОДНЫХ ЭЛЕКТРОНОВ В ПОЛЕ ИЗЛУЧЕНИЯ [ГЛ. VII ляет убедиться в том, что интегралы /с и ]f обращаются в нуль максвелловским распределением с температурой Т для электронов и одновременно функцией распределения фотонов вида е kT т. е. функцией распределения Бозе с химическим потенциа- потенциалом [I, отличным от нуля. Последний результат имеет простой смысл: в нашем приближении, когда излучением и поглоще- поглощением фотонов пренебрегается, их полное число в системе фик- фиксировано. Напомним [ср. G6,6) и ч. III], чго в обычных усло- условиях, когда число фотонов не фиксировано, минимуму свобод- свободной энергии отвечает значение \х = 0. Поэтому ясно, что процессы поглощения и излучения приведут к тому, что по про- прошествии достаточно большого промежутка времени \х-+0 и рас- распределение F9,11) превратится в распределение Планка. Переходя теперь к обсуждению кинетического уравнения для фотонов F9,9), покажем, что и оно может быть сведено к дифференциальному у{хавнению типа Фоккера — Планка. Для случая нерелятивистских электронов и достаточно мягкого из- излучения Ьы <С тс2 и, как видно из F8,6), изменение частоты фо- фотона при рассеянии мало. Допустим, что электроны можно характеризовать равновес- равновесным максвелловским распределением с температурой Т. Вводя новую переменную х=-п?-> можно разложить функцию рас- распределения фотонов в ряд по степеням Ал:= k® > Тогда имеем, ограничиваясь первыми членами разложения, + J dpn(x + tix)[l+n(x)]cdof(s) = [l+n(x)] J dpf(в)A*cda + F9,12) Вычисление второго интеграла в разложении F9,12) прово- проводится без труда: где F9,13) = c J
§ 69] УРАВНЕНИЯ ДЛЯ ЭЛЕКТРОНОВ И ФОТОНОВ 921 При этом для Але = 0 мы воспользовались формулой F8,13) и через от обозначили полное томсоновское сечение а Вычисление первого интеграла в F9,12) гораздо более гро- громоздко. Однако это вычисление можно заменить следующим полезным и общим рассуждением. Закон сохранения числа ча- частиц при рассеянии — в данном случае числа фотонов, требует, чтобы кинетическое уравнение имело вид | F9,14) где / — поток фотонов в пространстве импульсов. В силу изо- изотропности функции распределения фотонов дивергенция потока имеет вид j F9,15) Кроме того, в состоянии равновесия, когда п(х) представляет распределение Планка, поток фотонов ](х) должен обращаться в нуль. Поэтому поток фотонов представим в виде где А(х) и g(x)— функции, подлежащие определению. В со- состоянии равновесия / = 0. Кроме того, для равновесного распре- распределения имеет место равенство A +л)л— —|jf F9,16) в чем легко убедиться непосредственной проверкой. Поэтому, если поток j(x) представить в виде F9,17) то оба сформулированных выше требования к / будут удовле- удовлетворены. Соответственно, находим для J(P общее выражение: F9,18) Для того чтобы оба выражения для № — F9,18) и F9,12), x2aTNkT совпадали, необходимо положить g(x) = —?—.
922 гла свободных электронов в поле излучения [гл. vii Таким образом, окончательно F9,19) Заметим, что хотя по форме уравнение F9,19) сходно с урав- уравнением Фоккера — Планка, оно все же не является обычным уравнением этого типа. Наличие множителя A + п) в вероят- вероятности перехода привело к тому, что уравнение F9,19) оказа- оказалось нелинейным по отношению к искомой функции п(х). Совокупность кинетических уравнений для электронов F9,4) и фотонов F9,19) образует, очевидно, связанную систему. Получение общего решения этой системы было бы слишком сложной задачей. Поэтому в дальнейшем мы рассмотрим два предельных случая: 1) при заданном произвольном распределе- распределении фотонов ищется распределение электронов f(p, t), 2) при заданном равновесном распределении электронов ищется функ- функция распределения фотонов л (со, /). § 70. Кинетика бозе-конденсации фотонного газа Обратимся прежде всего ко второй постановке задачи — изу- изучению изменения свойств неравновесного излучения при взаи- взаимодействии со свободными электронами. Иными словами, най- найдем закон эволюции распределения фотонов во времени п(ш, t) при их взаимодействии с электронным газом. Как это уже ука- указывалось ранее, при этом состояние электронного газа будем считать фиксированным. Именно, будем полагать, что электрон- электронный газ все время находится в равновесном состоянии и харак- характеризуется некоторой температурой Те. Сначала мы будем полностью пренебрегать процессами сво- свободно-свободных переходов и считать, что рассеяние является единственным видом взаимодействия фотонов с электронами. Роль поглощения будет отмечена позднее. Кинетическое уравнение F9,19), описывающее временную зависимость п(со, /), необходимо дополнить начальным усло- условием. Пусть /гп(со) —равновесное (планковское) распределение фотонов, отвечающее температуре Те. Тогда возможны два случая: 1) в момент времени / = 0 в системе задана /i(o), 0) такая, что полное число фотонов N~ J лг(лг, 0)x2dx
§ 70] КИНЕТИКА БОЗЕ-КОНДЕНСАЦИИ ФОТОННОГО ГАЗА 923 большее, чем в равновесном излучении оо Nn~jnn(x)x2dx, G0,1) о ?. е. N>NU; 2) в начальный момент времени число фотонов N<Nn. G0,2) Ясно, что ход эволюции n(x,t) в обоих случаях будет различ- различным. В первом случае при столкновениях с электронами фото- фотоны будут преимущественно терять энергию и эволюция их спек- спектра будет состоять в среднем в движении вниз по энергетиче- энергетической оси («охлаждение» фотонного газа). Во втором случае при столкновениях фотоны будут в среднем приобретать энер- энергию («нагревание» фотонов). Поскольку мы не учитываем явления поглощения фотонов, их полное число в ходе эволюции будет оставаться постоянным. Начинаем с рассмотрения явления «охлаждения» фотонного газа. При этом нас будет, как это подчеркивалось выше, инте- интересовать область сравительно низких частот. Здесь обмен энер- энергией между фотоном и электроном при рассеянии мал и спра- справедливо кинетическое уравнение в форме F9,19). Более того, числа заполнения n(x,t) будут велики. Это, как уже указыва- указывалось, область применимости классической электродинамики. Если считать О>1 и, кроме того, предположить, что вы- выполнено неравенство |1 то уравнение F9,19) можно существенно упростить, отбросив малые (по сравнению с п2) члены п и -^-. Впоследствии справедливость предположения G0,3) может быть проверена непосредственным вычислением. Итак, имеем вместо F9,19) где Решение последнего уравнения в характеристиках гласит: x = F(f)-2ft', G0,6) где вид функции F(f) определяется начальными условиями. Вводя новую неизвестную функцию / = х2п (х, t), найдем
924 ГАЗ СВОБОДНЫХ ЭЛЕКТРОНОВ В ПОЛЕ ИЗЛУЧЕНИЯ [ГЛ. VII Смысл полученного результата лучше всего понять на примере распределения, представленного на рис. 53. Согласно G0,6) все точки, расположенные на первоначальной кривой /(#, 0) = = х2п(х,0) (кривая /) движутся по характеристикам — пря- прямым, параллельным оси в направлениях уменьшающихся х (кривая 2) со скоростью, пропорциональной /. Время, в тече- течение которого данная точка до- достигнет оси /, определяется, очевидно, выражением G0,7) Т 2/ Решение G0,6) формально' применимо при всех, как поло- жительных, так и отрицатель- Рис. 53. ных значениях х. Поэтому с течением времени f(x,t) дол- должно принять вид изображенной на рис. 53 кривой 3. Ясно, однако, что поскольку переменная х представляет энергию фо- фотонов, переход к отрицательным х невозможен. Частицы, попав- попавшие в состояние х = 0, т. е. в состояние с нулевой энергией, прекращают свое движение. Иными словами, фотоны накапли- накапливаются в состоянии с нулевой энергией, или, что то же самое, в состоянии бозе-конденсата. Число частиц, перешедших в это состояние, определяется формально заштрихованной площадью на рис. 53. Необходимо, однако, подчеркнуть, что полученная картина кинетики пере- перехода фотонов к состоянию с нулевой энергией неполна и не должна восприниматься буквально. В области очень низких частот всегда начинает играть существенную роль поглощение (см. § 68), как бы ни была мала, концентрация электронного газа (точнее, плазмы). Если система (электронный газ + фотон-* ный газ) предоставлена самой себе в течение достаточно боль- большого промежутка времени, в ней, естественно, всегда устано- установится статистическое равновесие и функция распределения фо- фотонов станет планковской. Поэтому не имело бы смысла искать стационарные решения уравнения F9,19) без учета тормозных процессов. Однако динамика изменения спектра фотонов за те време- времена t* и в той области частот, в которой не проявляются тормоз- тормозные процессы, дается приведенной формулой G0,6). Изменение начального распределения п(ху0) во времени иллюстрируют кривые, приведенные на рис. 53. Каждая из них представляет как бы мгновенную фотографию этого распределения при ty лежащем в интервале
§ 71] ПОДВИЖНОСТЬ ЭЛЕКТРОНА В ПОЛЕ ИЗЛУЧЕНИЯ 925- Поскольку кинетика рассмотренного процесса существенно за- зависит от формы начального распределения, интересно разо- разобрать случай, когда f(x, 0) имеет вид, представленный на ff&>*J рис. 54. Согласно G0,6) функ- функция f(x,t) с течением времени будет деформироваться, как это показано на рис. 54. Ско- Скорость приближения к оси орди- ординат будет тем больше, чем больше f. Верхние участки * кривой выдвигаются вперед, а Рис. 54. нижние оказываются отстав- отставшими. В результате функция распределения может настолько- выгнуться, что кривая f(x,t) окажется неоднозначной. Возникает такая же ситуация, как при образовании ударных волн в однородном течении невязкой жидкости. В действитель- действительности, однако, f(x, t) не становится многозначной. При прибли- приближении к отвесному (ударному) фронту производная — не- неограниченно возрастает. При этом нарушается неравенство G0,3) и уравнение G0,4) становится неприменимым. Более того, изменение функции распределения вблизи фронта стано- становится резким и неприменимо и общее уравнение F9,19). Де- Детальная картина движения фронта f(x,t) в этом случае оказы- оказывается гораздо более сложной. По прошествии времени t* начинается второй этап эволю- эволюции. В результате процессов поглощения в системе фотонов устанавливается равновесное планковское распределение с тем- температурой фотонов, равной температуре электронов Те. Обратимся теперь ко второму случаю, когда в начальный момент времени выполнено неравенство G0,2). Эволюция спек- спектра фотонов также протекает в два этапа. На первом этапе, при t <t*, в системе фотонов устанавливается распределение Бозе — Эйнштейна с химическим потенциалом, отличным от нуля. При этом средняя энергия фотонов становится равной средней энергии электронов. Затем вступают в игру процессы поглощения и излучения. Химический потенциал начинает изме- изменяться во времени и по прошествии времени т S> t* \i -> 0, т. е. в системе фотонов устанавливается планковское распределение.- § 71. Подвижность электрона в поле излучения Прежде чем перейти к рассмотрению поведения системы электронов в поле излучения, следует обсудить важный вопрос о поведении одиночного свободного электрона в поле излучения,
926 ГАЗ СВОБОДНЫХ ЭЛЕКТРОНОВ В ПОЛЕ ИЗЛУЧЕНИЯ [ГЛ. VII Задача о поведении электрона в поле электромагнитной ролны уже обсуждалась нами в § 36 ч. I. Мы видели, что элек- электрон рассеивает падающую на него электромагнитную волну. Ясно, однако, что поскольку при рассеянии происходит пере- передача импульса от волны к электрону, возникает некоторая средняя сила, действующая на частицу, излучающую вторич- вторичные (рассеянные) волны. Согласно B9,2) ч. I средняя (за пе- период) сила, действующая на излучающую частицу (в системе отсчета, в которой частица покоится) равна 3 с9 dt* ~ Зс3 X т ^ тс [Vili J ~ — 3/nV Iмi- 3 [тс2] 4я где /— единичный вектор в направлении распространения вол- волны. Вводя томсоновское эффективное сечение рассеяния и плот- плотность энергии излучения Wo, приходим к широко известной фор- формуле для лучистого давления: F* = aTuJL = ±q, G1,1) где q— поток энергии в одинарной волне. Сила, действующая на электрон, — сила лучистого давления, оказывается не зави- зависящей от частоты. Поэтому силу, действующую на электрон со стороны спектрального поля, образуемого набором волн с раз- различными значениями частоты, также можно представить в виде /7о = -т1?. G1,2) Здесь через rq обозначен полный поток энергии в поле излу- излучения q = J ch®n (со, I) Idk = я2с4 J р (со, I) -^ dk. G1,3) Вместо плотности энергии мы ввели спектральную функцию. При переходе от G1,1) к G1,2), т. е. при переходе от силы, действующей на электрон со стороны монохроматической вол- волны, к такой же силе в спектральном поле излучения, молчаливо предполагалось, что имеет место аддитивность сил, действую- действующих на электрон со стороны каждой из волн. При таком сумми- суммировании упускался из виду упомянутый выше эффект индуци- индуцированного рассеяния. При этом оказалось существенным сле- следующее обстоятельство: если не учитывать ту часть изменения импульса Дрг, которая связана с изменением частоты при рас- рассеянии, и которая, как мы подчеркивали [см. F8,9)], дает ма-» лый вклад в изменение импульса, а также не учитывать изме-
§ 71] ПОДВИЖНОСТЬ ЭЛЕКТРОНА В ПОЛЕ ИЗЛУЧЕНИЯ 927 нение спектральной зависимости функции распределения при изменении частоты, то вклад индуцированного рассеяния в вы- выражении для давления точно равен нулю. С другой стороны, как показывает последующий расчет, учет изменения частоты при рассеянии и зависимости п от со приво- приводит к существенному изменению формулы для давления. Таким образом, ниже мы должны получить точное выраже- выражение для давления без каких-либо произвольных допущений. Под «точным» выражением мы понимаем выражение для да- давления в классическом нерелятивистском приближении (без уче- учета квантовых и релятивистских поправок). При этом вычисле- вычислении удобно (хотя в принципе и не обязательно) воспользовать- воспользоваться квантовым подходом, основанным на применении общей формулы для а{. Переходя в окончательных формулах к клас- классическому пределу й-»0, мы найдем классическое выражение для средней силы. На этом примере 1) мы убедимся в полезно- полезности указанного в предыдущем параграфе методического прие- приема— получения классических формул из квантовых в пределе Ь -> 0. Согласно F9,8) средняя сила или подвижность дается общей формулой: <Др) = J с(APl + Ар2)п(к)[\+п(k')]dadk. G1,4) Учтем теперь, что изменение частоты фотона Асо при одиноч- одиночном акте рассеяния на электроне мало2). Соответственно по- положим п (к) = п (со, /); n(kf) = я (о/, Г), причем имеем прибли* женно: п(<*', V) ~ *(©, V) + -g- (со' - со) = п (со, V) - -Ц. Асо. Вводя, кроме того, вместо чисел заполнения п(со, /) спектраль- спектральное распределение р(со, /), имеем 1) См. П. П а р а д о к с о в, УФН 89, 707 A966). 2) Напоминаем, что здесь удобно пользоваться системой покоящегося электрона Ко. Индекс нуль для простоты опускается.
928 ГАЗ СВОБОДНЫХ ЭЛЕКТРОНОВ В ПОЛЕ ИЗЛУЧЕНИЯ [ГЛ. VII где dQk — элемент телесного угла для падающего фотона, а вместо Асо подставлено значение F8,11). Перейдем теперь к пределу й—>О в формуле G1,5). Для этого в ней нужно удержать все слагаемые, не содер- содержащие Ь. При этом для полной силы, действующей на элек- электрон, получаем: J p(co, l){l-V)dkdU G1,6) Подчеркнем, что (Др) представляет среднюю силу в классиче- классическом приближении. Поэтому точно такое же выражение можно было бы получить из классической электродинамики в резуль- результате вычислений, аналогичных F8,8). Вместе с тем нужно иметь в виду, что в рамках классической теории нами не было исполь- использовано никакого разложения по малому параметру. Рассмотрим каждое из слагаемых в G1,6) порознь. Первое слагаемое можно представить в виде: = Р0. G1,7) Мы видим, что FSp представляет силу, обусловленную спонтан- спонтанным рассеянием. Она совпадает с приведенным выше выраже- выражением для силы давления излучения Fo. Второе слагаемое, G1,8) как видно из его структуры, представляет силу, обусловленную индуцированным рассеянием. Эта сила содержит под знаком интеграла произведения спектральных функций падающего и рассеянного излучения р(со, /) и р(со, /')• Характер силы Find за- зависит от вида функции р(со, /). Если, в частности, излучение представляет совокупность волн одного направления, то р (со, /г) = 0, и индуцированная сила автоматически обращается в нуль. Если р(со, /) представляет равновесное планковское рас- распределение рп(со), то после подстановки выражения рп(со) и
§ 71] ПОДВИЖНОСТЬ ЭЛЕКТРОНА В ПОЛЕ ИЗЛУЧЕНИЯ 929 простых вычислений получается Поскольку в нерелятивистской области температура излучения kT << тс2, Find представляет малую поправку к спонтанной силе Fsp. Наоборот, в неравновесном поле излучения высокой интен- интенсивности Fmd может быть сравнимо и даже существенно боль- больше Fsp. Таким образом, в общем случае Find отнюдь не являет- является малой поправкой к Fsp. Рассмотрим индуцированную силу давления при некоторых конкретных видах спектрального распределения. Пусть, напри- например, излучателем служит однородная поверхность диска радиу- радиусом R. Поскольку все точки диска излучают одинаково, функ- функцию р (соу /) можно представить в виде р(со, |)=0(ю)фA), G1,10) где первый множитель характеризует частотное, а второй — пространственное распределение излучения. Выражение для Find приобретает особенно наглядный вид, если задаться про- простой формой G(co), например, 0, со < соо. Кстати, именно таким спектральным распределением обладают некоторые астрономические источники мощного излучения. Тогда подстановка G1,10) и G1,11) в G1,8) дает ^f ^rJ V(n(t)t'(l-U')dQkdQ. G1,12) ©о Второй интеграл в G1,12) обращается в нуль, поскольку его угловая часть изменяет знак при замене / —>—V. Для диска, на большом расстоянии г ^ R от его поверх- поверхности, можно написать p2), G1,13) где р и г|> — полярный и азимутальный углы, а в — ступенча- ступенчатая функция, Ро — угол раствора конуса Р0=^-<С 1. Тогда вы- вычисление G1,12) дает для силы —ТГ'Ч-Я- G1,14) \)с Мы видим, что |Find| оказывается пропорциональной q2 и при
930 ГАЗ СВОБОДНЫХ ЭЛЕКТРОНОВ В ПОЛЕ ИЗЛУЧЕНИЯ [ГЛ. VII больших значениях потоков излучения (и при малых значениях юо) может оказаться существенно большей, чем \FSp\. В качестве второго интересного примера рассмотрим силу давления в резко анизотропном поле. В качестве такого источ- источника выберем два встречных потока излучения. Пусть один из них является когерентным (монохроматическим), направлен- направленным в положительную сторону оси z /11(©) = /16(о-©0). G1,15) Второй пучок, направленный в отрицательную сторону оси г, характеризуется некоторым спектральным распределением п2(со). Пользуясь общей формулой G1,8) для индуцированного да- давления, после вычислений приходим к формуле для компонента силы find-* ^^{^^Ц. G1,16) Формула G1,16) показывает, что Find может иметь как поло- положительный, так и отрицательный знак, в зависимости от значе- значения производной Спонтанная сила FSp в рассматриваемом случае всегда напра- направлена в сторону того из пучков, интенсивность которого выше и, соответственно, больше поток энергии q. Таким образом, в зависимости от знака указанной величины и соотношения между абсолютными значениями F^a и FSj» могут реализоваться два случая: 1) когда результирующее давление направлено по вектору полной энергии двух пучков излучения; 2) когда ре« зультирующая сила направлена против полного потока из- излучения. В заключение приведем выражение для силы спонтанного давления, действующей на движущийся электрон при v <C с. Она получается из G1,3) путем преобразования Лоренца для частоты при и<с (доплер-эффект!). Тогда *sp 3 с т ' Аналогично, индуцированная сила имеет вид Г 13 ГГр(ш)]2 14 Г ( д Г р (со) I ^2 -I
§ 72] ЭЛЕКТРОНЫ В ПРОИЗВОЛЬНОМ ПОЛЕ ИЗЛУЧЕНИЯ 93! § 72. Система электронов в произвольном поле излучения Мы теперь можем перейти к нахождению стационарного не- неравновесного распределения системы электронов, помещенных в заданное поле излучения. Будем считать, что поле излучения является изотропным. При этом функция распределения п зави- зависит только от частоты, но не от направления волнового вектора, т. е. я = /г((о). В этом простом случае можно наглядно проде- продемонстрировать основные положения теории. Из F9,4) для стационарного распределения находим щ Л-Ь G2,1) где jL определено формулой C4,8). Для получения решения G2,1), помимо подвижности, най- найденной ранее, необходимо знать коэффициент диффузии Di=D. Как и подвижность, коэффициент диффузии является, во- вообще говоря, функцией импульса. Для наших целей в выражении для подвижности аг можно ограничиться приближением а, = (Др,)~/™, G2,2) где Fsp дается формулой G1,17). Причина этого заключается в следующем: как мы увидим в дальнейшем, электроны в поле излучения могут приобретать, вообще говоря, очень высокие энергии. Оказывается, что если слагаемое Fma в выражении для подвижности G1,6) становится сравнимым с FSp, то приобре- приобретаемая средняя энергия электрона становится порядка тс2. Однако, как мы это подчеркивали с самого начала, вся изла- излагаемая теория ограничена случаем нерелятивистских элек- электронов. При вычислении коэффициента диффузии по формуле F9,7) можно ограничиться учетом изменения импульса электрона лишь в результате совершенно упругого рассеяния. Учет не- неупругости рассеяния дает квантовую поправку. Расчет коэффи- коэффициента диффузии удобно провести в системе отсчета покояще- покоящегося электрона D = (Ар]) = ^ J ап0 (о0) [1 + п0 (Ц)] (ДрJ dk0 du = Wl1 +no(»'o)]dkodQ, G2,3) -Т J где индексом нуль снабжены число фотонрв и их частота в вы- выбранной системе координат.
932 ГАЗ СВОБОДНЫХ ЭЛЕКТРОНОВ В ПОЛЕ ИЗЛУЧЕНИЯ [ГЛ. VII При переходе к лабораторной системе отсчета следует про- провести преобразование Лоренца. Оказывается, однако, что при вычислении коэффициента диффузии в нерелятивистском при- приближении следует учитывать только члены нулевого порядка малости по величине р/тс. Это связано с тем, что в уравнении G2,1) диффузионный коэффициент стоит перед производной —^—. В результате, как мы увидим ниже, при учете слагаемых порядка р/тс в аи в D следует учитывать лишь члены, не за- зависящие от р. При этом автоматически -г—(Df) окажется того же порядка малости, что и а*/. В соответствии с этим можно положить ~ cos 9 *и для D получаем G2,4) При подстановке G2,2) и G2,4) в G2,1) получаем оконча- окончательно уравнение для функции распределения электронов: df + 16 Будем пытаться искать решение уравнения G2,5) в виде рас- распределения Максвелла с некоторой эффективной температу- температурой 0, т. е. положим /^/-5ЙГ# G2,6) Как мы видели в § 34, максвелловское распределение автома- автоматически обращает в нуль интеграл /ь (при любом значении тем- температуры). Поэтому уравнению G2,5) можно удовлетворить, положив Г п (©) [1+ п (©)] (й©J ©2 d® ^. G2,7) ? 4 п (©) Й©©2 day При найденном значении эффективной температуры максвел- максвелловское распределение представляет точное решение кинетиче- кинетического уравнения G2,1).
§ 73] ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ 933 § 73. Обсуждение результатов и область применимости теории Подводя итог сказанному, следует прежде всего отметить за- замечательную особенность силы индуцированного давления: эта систематическая сила возникает в результате действия стоха- стохастического электромагнитного поля. Чтобы яснее представить себе взаимоотношение между спон- спонтанной и индуцированной силами давления излучения, удобно ввести понятие яркостной температуры. Яркостная температура определяется следующей формулой: Для равновесного излучения ТЪг тождественно совпадает с температурой излучения и пропорциональна энергии излучения. Пусть, однако, спектр излучения является неравновесным и при низких частотах его интенсивность выше, чем интенсивность рав- равновесного излучения. Тогда Ты представляет температуру того равновесного излучения, у которого спектральное распределение при низких частотах совпадает с неравновесным. Ясно, что если интенсивность излучения при низких частотах значительно выше равновесной, то яркостная температура может быть очень вы- высока. При этом, однако, она не зависит от средней энергии из- излучения. Как видно из G1,13) по порядку величины . G3,1) В случае равновесного излучения |Fmd| ~ -^т l^sP| < |^sP|. Наоборот, если спектр неравновесного излучения таков, что kTbr > me2, то | Fmd | » | Fep |. Переходя к вопросу о нагреве электронов в поле излучения, подчеркнем, что физический смысл полученного результата — существование максвелловского распределения с температурой G2,7) — заключается в следующем: при малых передачах им- импульса в элементарном акте взаимодействия движение электро- электрона в импульсном пространстве представляет броуновское блу- блуждание. По прошествии некоторого времени релаксации система электронов, помещенная в изотропное поле излучения,' приходит в стационарное состояние. У электронов устанавливается слу- случайное (гауссовское) распределение по импульсам при произ-* вольном распределении квантов по частоте п(со). Это случайное распределение в изотропном поле является максвелловским с модулем (температурой) 0. В равновесном поле излучения, когда я (со) задается формулой Планка, пользуясь формулой G2,7), получаем очевидный результат 8 = Г, т. е. равенство тем-
934 ГАЗ СВОБОДНЫХ ЭЛЕКТРОНОВ В ПОЛЕ ИЗЛУЧЕНИЯ [ГЛ. VII ператур излучения и электронов. Если, однако, распределение квантов имеет неравновесный характер, то эффективная темпе-» ратура электронов оказывается зависящей от вида функции я(со). Интересным является случай, когда распределение п(со) имеет максимум в области сравнительно низких частот. Тогда в основной части спектра, при низких частотах, числа заполне- заполнения п велики по сравнению с единицей. В формуле G2,7) мож- можно перейти к классическому пределу #->0. При этом f п(Й0J*>2Жо 23 г rof0)i2rf(O ~ f ~ I 2 * ('*>»*) 4 n (ha>) ©2 d(d ° J Основную роль в передаче энергии электронам в этом случае играет индуцированный комптон-эффект. Нагрев электронов излучением имеет чисто классический ха- характер. Поэтому формула G3,2), как и выражение G1,8), могла бы быть получена из классической электродинамики при рассмо- рассмотрении набора энергии в спектральном поле излучения. По по- поводу G3,2) необходимо сделать следующие три замечания. 1. При значительной спектральной плотности излучения в низкочастотном максимуме температуры электронов могут ока-* зываться чрезвычайно высокими, так что средняя энергия элек- электронов может оказаться гораздо больше средней энергии кван- квантов. Подчеркнем, что нагрев осуществляется именно низкочастот- низкочастотным излучением. Хотя передача энергии при каждом акте рас- рассеяния низкочастотных квантов мала, их число столь велико, что общая передача энергии системе электронов оказывается большой. 2. Легко видеть, что температура электронов 0 по порядку величины совпадает с максимальной яркостной температурой излучения, причем всегда Q^C/гТы- Поэтому допущенное нами пренебрежение слагаемыми, связанными с изменением частоты кванта при рассеянии, т. е. использование формулы F8,10), ока- оказывается неоправданным как раз тогда, когда температура 6 до- достигает релятивистских значений и формула G2,5) становится неприменимой. 3. При фактическом вычислении интеграла в числителе G3,2) нужно иметь в виду, что в области очень низких частот тормоз- тормозные процессы начинают преобладать над процессами рассеяния. Поэтому расходимость в G3,2) возникнуть не может. Перейдем теперь к обсуждению области применимости полу- полученных формул. Однако сперва следует более подробно обсудить поведение электрона в сильной монохроматической волне. Под «сильной» волной мы понимаем следующее: в § 36 ч. I при вы- выводе формулы Томсона мы считали, что волна рассеивается не-
§ 73] ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ 935 подвижным электроном, который приобретает в волне колеба- еЕ тельную скорость v~ . При увеличении напряженности элек- электрического поля Е скорость электрона в волне возрастает и мо- может стать релятивистской. В сильном поле при v ~ с поведение электрона в волне радикально изменяется. Под действием маг- магнитного поля он будет совершать вращательное движение, так что полная его траектория будет представлять собой замкнутую кривую. На этой траектории электрон будет излучать электро- электромагнитные волны с разнообразными частотами, отличными от частоты падающей волны. При этом сечение рассеяния электро- электрона оказывается отличным от томсоновского. Его можно найти из простых энергетических соображений. Согласно G1,1) энер- энергия, приобретаемая в единицу времени электроном в волне при v ~ с, по порядку величины равна ои0с1). С другой стороны, потеря энергии на излучение в магнитном поле (при v ~ с) дается формулой B6,12) (см. т. I). В стационарном состоянии эти потери уравниваются. При этом для сечения находим 1 fde\ oTv*H* I eE V 2 где а = (еЕ/пийс). Мы видим, что сечение рассеяния должно бы- быстро расти с увеличением напряженности поля. Рост сечения не может быть, однако, беспредельным, поскольку приобретаем мая электроном энергия (в единицу времени) не может превы- превысить величину еЕс работы поля за 1 сек над электроном, дви- движущимся со скоростью света. Поэтому всегда а2атсЕ < еЕс. При а ~ (А/го)Ч гДе ^ — длина волны и г0 — классический радиус электрона, сечение начинает убывать как 1/Е. Значение а <?. 1 ограничивает область применимости томсоновской теории рас- рассеяния свободными электронами. Электрон в поле сильной волны нельзя более считать свободным. Эти результаты на квантовом языке можно интерпретировать следующим образом: в поле сла- слабой волны наиболее вероятным процессом было одноквантовое рассеяние, т. е. обычный комптон-эффект; в поле сильной волны наиболее вероятным процессом становится многоквантовое рас- рассеяние, при котором число квантов в акте рассеяния уже не со- сохраняется (излучаются частоты, отличные от частоты волны). Переходя теперь к обсуждению границ применимости изло- изложенной теории, заметим, что первым, очевидным условием при- применимости служит требование, чтобы характерное время набора 1) Следует заметить, что мы пользуемся для передачи энергии электрона энергией электрона в сопутной системе отсчета. Это законно потому, что вращательное движение электрона не приводит в среднем (за период) к при- приобретению какой-либо энергии.
936 ГАЗ СВОБОДНЫХ ЭЛЕКТРОНОВ В ПОЛЕ ИЗЛУЧЕНИЯ [ГЛ. VII энергии т электроном было мало по сравнению с обратной ха- характерной частотой спектра. В противном случае поле излуче* ния не могло бы рассматриваться как случайное. Оценим характерное время набора или, что то же самое, время торможения электрона в спектральном поле излучения! Для простоты будем считать последнее изотропным. Тогда имеем по порядку величины для v ~ с T-I^indl ~ тс. G3,3) Следовательно, должно выполняться неравенство , ™с . < —. Пользуясь G1,13), мы приходим к неравенству а<1, которое совпадает с условием применимости теории спонтанного рассея- рассеяния на свободных электронах. Вторым ограничением применимости теории индуцированного рассеяния служит неравенство \Find\-c<eEc. G3,4) Подставляя значение |i^md|, снова приходим к неравенству а < 1. Этот результат показывает, что в случае индуцирован- индуцированного рассеяния увеличение сечения по сравнению с томсонов- ским не может иметь места независимо от значения параметра а. Подчеркнем, что оба условия применимости теории индуциро- индуцированного рассеяния в спектральном поле являются совершенно независимыми. В то время как первое из них выражает самую суть понятия спектрального поля, второе связано с существова- существованием предельной скорости распространения взаимодействий. При стремлении параметра а к единице сечение индуцированного рассеяния, как видно из G3,4), начинает падать по закону %% В рамках этой книги мы не можем остановиться на ряде при- приложений, которые получила изложенная теория в астрофизике *). Приведенные результаты касаются одной из сторон бурно развивающейся новой области кинетики, именуемой обычно не- нелинейной теорией плазмы. На приведенных примерах читатель мог увидеть, как пере- переход к высокоинтенсивным полям даже в простейших системах приводит к новым, совершенно своеобразным ситуациям, не сход- сходным с теми, которые известны в области слабых полей. Вместе с тем читатель мог убедиться в неисчерпаемости классической физики и мощи методов квантовой теории. 1) См., например, Е. В. Левич, Р. А. С юн я ев, Astroph, Lett, 7, 69 A971); Р, А. С юн я ев, Астрон. ж. 48, 244 A971),