Text
                    PRINCIPLES OF OPTICS
Electromagnetic Theory of Propagation,
Interference and Diffraction of Light
by
MAX BORN
M. A., Dr. Phil., F. R. S.
Nobel Laureate
-Professor Emeritus at the Universities of Goltingen and Edinburgh
and
EMIL WOLF
Ph. D., D. Sc.
Professor of Physics, University of Rochester, N. Y.
with contributions by
A. B. Bhatia, P. С Clemmow, D. Gabor, A. R. Stokes,
A. M. Taylor, P. A. Wayman and W. L. Wilcock
FOURTN EDITION
PERGAMON PRESS
OXFORD'LONDON-EDINBURGH.NEW YORK
PARIS-FRANKFURT


М. БОРН, Э. ВОЛЬФ ОСНОВЫ ОПТИКИ ИЗДАНИЕ 2-е. ИСПРАВЛЕННОЕ Перевод с английского С. Я. БРЕУСА, А. И. ГОЛОВАШКИНА, А. А. ШУБИНА Под редакцией Г. П. МОТУЛЕВИЧ ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ МОСКВА 1873
535 БД82 УДК 535 Основы оптики. Ъорн Л1 , Вольф Э., изд. 2-е. Пере- вод с английского. Главная редакция физико-математической . литературы изд-ва «Наука», 1973. Наиболее полный и авторитетный труд по оптике в миро- вой литературе, учитывающий все последние достижения классической теории. Излагаются макроскопические уравнения Максвелла с фор- мально введенными константами и подробно разбираются во- просы распространения электромагнитных волн в среде, а также связь этих констант с поляризацией и намагничением. Уравнения геометрической оптики последовательно выво- дятся из уравнении Максвелла (при этом автоматически учитывается поперечность и векторный характер световых волн) и затем применяются к теории оптического изображения и к расчету аберраций. Рассматриваются интерференция, эле- ментарная и строгая теория дифракции, дифракционная теория аберраций и дифракция света на ультразвуковых волнах. Подробно излагаются вопросы распространения, интерференции и дифракции частично когерентного света; основное внимание уделяется случаю квазимопохроматического излучения, причем общее рассмотрение строится на использовании метода корре- ляционных функций Излагаются вопросы металлооптики и кристаллооптики. Во всей книге много внимания уделяется изложению математического аппарата. Таблиц 30, иллюстраций 369, библиография 814 назв. 0234—1810 Б Ш^Тз '08-73
ОГЛАВЛЕНИЕ Предисловие редактора перевода fc 3 Предисловия к четвертому, третьему, второму изданиям 10 Из предисловия к первому изданию .. . - гц Историческое введение „ 15 Литература /л 22 Г лава 1. Основные свойства электромагнитного поля 24 § 1.1. Электромагнитное поле 24 § 1.2. Волновое уравнение и скорость Света .' 32 § 1.3. Скалярные волны .'....' ". ''.s'.".'," 35 § 1.4. Векторные волны ." . ." .'..".*.'.*." 43 § 1.5. Отражение и преломление плоской Ьо'лны '. 54 § 1.6. Распространение'воли в слоистой среде. Теория диэлектрических пленок . 66 Литература ...'_" 81 Глава 2. Эл?ктромгагНнРгН"ые Потенциалы н поляризация 83 § 2.1." Электродинамические потерщиалы в вакууме ,. 84 § 2.2. Поляризации и намагничение j 87 § 2.3. Формула Лорептц ¦— Лоренца и элементарная теория дисперсии 94 § 2.4. Описание распространения электромагнитных волн с помощью интегральных * * уравнений . " 105 Литература .__ . . . . . 11-5 Г л а б а' 3. Основы геометрической оптики 116 § 3.1. Приближение очень коротких длин воли „ Ц6 § 3.2..Общие свойства лучей , 127 § 33., Другие основные теоремы гсометрическ©й,оптики _„_... J31 Литература 136 Г л а в а" 4\ Геометрическая теория оптических изображений 138 § 4Л.-Характеристические функции Гамильтона 138 § 4.<2. Идеальное отображение 145 § 4.3. Проективное преобразование (коллинеация) при наличии аксиальной симметрии 152 § 4.4.-Параксиальная оптика 157 § 4.5. Стигматическое отображение пучками с большой угловой апертурой 165 § 4.-6. Астигматические пучки лучей* ; . 168 § 4.7. Хроматическая аберрация. Дисперсия призмы 172 § 4.6. Фотометрия. Лпертури оптических -систем 177 § 4.9. Метод построения хода лучон 185 § 4.10. Оптические системы с несферичес&ими.поверхностями 191 Литература 19G Глава 5. Геометрическая теория аберраций [98 § 5.1. Волновые и лучекые аберрации; функция аберраций 198 § 5.2. Эйконал Шваршиильда ' 201 § 5.3. Первичные аберрации (аберрации Зайделя) ...'..<- 204 § 5.4. Теорема сложения для случая первичных аберраций г, 210 § 5.5. Коэффициенты первичных аберраций произвольной центрированной системы ' линз : ; ; v эп § 5.6. Пример: первичные аберрации тонкой линзы г. 217 § 5.7. Хроматическая аберрация произвольной центрированной системы линз . . , 220 Литератур"а *. С ; .' ' I \ 222
О ОГЛАВЛЕНИЕ Глава 6. Оптические приборы, формирующие изображение 223 § 6.1. Глаз 223 § 6.2. Фотографический аппарат 225 § 6.3. Линзовый телескоп . ¦ 228 § 6.4. Зеркальный телескоп 233 § 6.5. Осветители , . . . . 237 § 6.6. Микроскоп 237 Литература 241 Глава 7. Элементы теории интерференцин и интерферометры 242 § 7.Г. Введение 242 | 7.2. Интерференция двух монохроматических воли 243 § 7.3. Двухлучевая интерференция. Деление волнового фронта 245 § 7.4. Стоячие волны 259 § 7.5. Двухлучевая интерференция. Деление амплитуды 263 § 7.6. Многолучевая интерференция . 297 § 7.7. Сравнение длнн волн с эталонным метром 337 Литература 338 Г л а в-а 8. Элементы теории дифракции 341 § 8.1. Введение ¦ 341 § 8.2. Принцип Гюйгенса — Френеля , 341 § 8.3. Теория дифракции Кирхгофа ..•• 345 | 8.4. Переход к скалярной теории 350 § 8.5. Дифракция Фраунгофера на отверстиях разной формы 362 § 8.6. Дифракция Фраупгофера в оптических приборах 369 § 8.7. Дифракция Френеля на прямолинейном крае 392 § 8.8. Трехмерное распределение света вблизи фокуса 397 § 8.9. Граничная дифрагировавшая волна 407 § 8.10. Метод Габора получения изображения восстановлением волновых фронтов . 411 Литература . 416 Глава 9. Дифракционная теория аберраций ........••.••. 420 §9.1. Дифракционный интеграл при наличии аберраций-. . .• 421 § 9.2. Разложение функции аберрации 425 § 9.3. Допустимые величины первичных аберраций . 428 § 9.4. Дифракционная картина, получающаяся при наличии одной аберрации • , • 433 § 9.5. Изображение протяженных предметов ,.».,... 441 Литература 450 Глава 10. Интерференция и дифракция частично когерентного света ........ 451 § 10.1. Введение 451 § 10.2. Комплексное представление вещественных полихроматических полей .... 454 | 10.3. Корреляционные функции световых пучков 458 § 10.4. Интерференция и дифракция квазиыонохроматического света 463 § 10.5. Некоторые приложения 477 § 10.6. Некоторые теоремы, касающиеся взаимной когерентности 489 § 10.7. Строгая теория частичной когерентности 492 § 10.8. Поляризация ква.чимонохроматического света 500 Литература 511 Глава 11. Строгая теория дифракции 513 § 11.1. Введение ."..." 513 § 11.2. Граничные условия и поверхностные токи 514 § 11.3. Дифракция на плоском экране; электромагнитная форма принципа Бабине 516 § 11.4. Двумерная дифракция иа плоском экране 517 § 11.5. Двумерная дифракция плоской вол,иы иа полуплоскости 521 § 11.6. Трехмерная дифракция плоской волны на полуплоскости ,533 § 11.7. Дифракция волн, испускаемых локализованным источником, на полупло- скости 535 § 11.8. Другие задачи 542 § 11.9. Единственность решения 546 Литература »••«»••• 547
ОГЛАВЛЕНИЕ 7 Глава 12. Дифракция света на ультразвуковых волнах 549 § 12.1. Качественное описание явления и краткое изложение теорий, основанных на применении дифференциальных уравнений Максвелла 549 § 12.2. Рассмотрение дифракции света иа ульразвуковых волнах методом интеграль- ных уравнений 554 Литература 565 Г лава 13. Металлооптика 567 § 13.1. Распространение волн в проводнике 567 § 13.2. Преломление и отражение па поверхности металла 571 § 13.3. Элементарная электронная теория оптических постоянных металлов . . . 578 § 13.4. Распространение воли в слоистой проводящей среде. Теория металлических пленок 581 § 13.5. Дифракция на проводящей сфере. Теория Ми i . . . 585 Литература 612 Глава 14. Кристаллооптика 614 § 14.1. Тензор диэлектрической проницаемости анизотропной среды . , 614 § 14.2. Структура монохроматической плоской волны в анизотропной среде 616 § 14.3. Оптические свойства одноосных и двухосных кристаллов fi25 $ 14.4. Измерения в кристаллооптике 636 § 14.5. Искусственная анизотропия 648 § 14.6. Поглощающие кристаллы ~653 Литература 662 Приложения 663 Приложение I. Элементы вариационного исчисления 663 Приложение 2. Обычная оптика, электронная оптика и волновая механика .... 679 Приложение 3. Метод асимптотических оценок интегралов 687 Приложение 4. Дельта-функция Дирака 694 Приложение 5. Математическая лемма, используемая при строгом выводе закона Лорентц — Лоренца 698 Приложение 6. Распространение разрывов электромагнитного поля 700 Приложение 7. Круговые полиномы Цернике 703 Приложение 8. Доказательство одного неравенства, приведенного в п. 10.7.3 . . . 707 Приложение 9. Вычисление двух интегралов, используемых в п. 12.2.2 708 Литература . . . . » 7П Предметный указатель 713
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА Переводимая книга крупных ученых М. Борна и Э. Вольфа задумана ими как первый том фундаментально! о курса по теоретической оптике, в ко- тором разбираются вопросы распространения электромагнитных волн, ин- терференция и, дифракция света, геометрическая оптика, мсталлооптика и. кристаллооптика. Молекулярную и квантовую оптику авюры предполагали изложить в последующих томах. Данный том — одна из последних книг, написанная с участием М. Бор- ца, лауреата Нобелевской премии по физике 1954 г. Недавняя кончина E ян- варя 1970 г.) этого крупного физика, автора многочисленных научных работ и книг, создателя большой школы теоретической физики, не позволила ему лично довести задуманный план до конца. Советским физикам работы М. Борна хорошо'известны.' Его книга «Оп- тика», вышедшая в русском переводе в 1935 г., до последнего времени была одной из настольных книг физиков-оптиков. Настоящая книга существенно- отличается от прежней. Материал изложен более последовательно и полно, добавлены новые разделы по актуальным вопросам оптики. В главе 1 рассматриваются макроскопические уравнения Максвелла с формально введенными диэлектрической и магнитной проницаемостями и электропроводностью, и подробно разбираются вопросы распространения электромагнитных волн. Связь введенных констант с поляризацией и намаг- ничением вводится в главе 2, где затронуты также некоторые вопросы моле- кулярной оптики и дается элементарная теория дисперсии света. В даль- нейшем на систематическом применении уравнений Максвелла, рассмотрен- ных в главах 1 и 2, строится вся книга. Главы 3—6 посвящены геометрической оптике, изложение которой ори- гинально и интересно. Уравнения геометрической оптики последовательно выводятся из уравнений Максвелла. При этом автоматически учитывается поперечное» и векторный характер световых волн. Далее полученные урав- нения применяются к теории оптического изображения и к расчету аберраций оптических систем. Рассмотрению указанных вопросов в книге не случайно- отведено много места, что отражаег успехи, достигнутые за последнее время в геометрической оптике. Главы 7—12 посвящены интерференции и дифракции света. В главе 7 рассматриваются явление интерференции и его применение в интерферен- ционных приборах, а в главе 8 дается элементарная теория дифракции. Стро- гая теория дифракции, основанная на уравнениях Максвелла и соответст- вующих граничных условиях, приводится в главе 11. Эта теория использу- ется для решения задач дифракции света на идеально проводящих плоском экране и полуплоскости, а также для некоторых других задач. В главе 9 да- ется дифракционная теория аберраций. Разбираются искажения дифракцион- ного изображения точечных и протяженных источников, вызванные абер- рациями. В главе 12 рассматривается дифракция све,та па ультразвуковых волнах, которая обычно почти не освещается. Очень интересна глава 10, посвященная распространению, интерференции и дифракции частично коге-
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА 91 рентного света. Особенно подробно обсуждается случай квазимонохромати- ческого излучения. Общее рассмотрение Строится на использовании техники корреляционных функций. Рассмотрены некоторые весьма интересные прило- жения: вопрос о когерентности, возникающей из-за наличия оптической сис- темы при некогерентном источнике, о влиянии освещения на разрешающую систему микроскопа, о формировании изображений при наличии частично ко- герентного квазимонохроматнческого света, о поляризационных свойствах квазимонохроматического света. Появление такой главы в курсе классической оптики представляется очень целесообразным. Главы 13 и 14, посвященные металлооптике и кристаллооптике, мало отличаются от соответствующих глав старого курса и ие отражают тех из- менений, которые произошли в этих областях за время, прошедшее после издания прежнего курса. В книге много места уделяется изложению математического аппарата, •• необходимого при рассмотрении затронутых вопросов. Помимо математи- ческих приложений в конце книги, математические отступления делаюгея во многих главах, что несколько удлиняет feKCT, но делает изложение более понятным. ¦ ' Мы не сомневаемся в том, что это фундаментальное руководство по оп- тике М. Борна и Э. Вольфа будет (так же как и книга М. Борна «Оптика») долгие годы настольной книгой всех физиков, занимающихся оптикой. Книга переведена полностью, без сокращений. Поскольку в списке ли- тературы, приведенном авторами, не отражены работы советских ученых, мы снабдили книгу примечаниями, включающими соответствующие ссылки. Книгу переводили: С. Н. Бреус (введение, г"лавы 3—5, 9, приложения), А. И. Головашкин (главы 1, 2, 10, 13, 14) и А. А, Шубин (главы 6— 8У И, 12). > ¦ Г. Мотулевич
ПРЕДИСЛОВИЕ К ЧЕТВЕРТОМУ ИЗДАНИЮ Ввиду внушительного объема этой книги было сочтено нецелесообразным включать в это новое издание дополнительный материал, относящийся к пос- ледним достижениям в оптике. Тем не менее, мы сделали ряд новых исправле- ний и улучшений в тексте и добавили ссылки на некоторые недавние публи- кации. Мы обязаны д-ру Марчанду и Кусакаве за предоставление списков опе- чаток и ошибок, замеченных в предыдущих изданиях. Мы также признательны д-ру Бедарду за помощь при переработке. Бэд Пирмонт и Рочестер Макс Борн Лв'Усг 1968 Эмиль Вольф ПРЕДИСЛОВИЕ К ТРЕТЬЕМУ ИЗДАНИЮ Целый ряд ошибок и опечаток, имевшихся в более ранних изданиях этой книги, были исправлены, а также были добавлены ссылки на некоторые недавние публикации. Был также включен новый рисунок (8. 54), относящийся к последним достижениям в технике восстановления волновых фронтов. Мы признательны Ленту и Юпетниксу за предоставление оригинальных фотографий. Бэд Пирмоит и Рочестер Макс Бори Июль 1965 Эмиль Вольф ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ В процессе подготовки нового издания этой книги был исправлен ряд ошибок и опечаток, сделано несколько небольших добавлений и добавлены новые ссылки. После выхода в свет первого издания и почти точно три года назад по- явились первые оптические мазеры (лазеры). С их помощью можно полу- чать очень интенсивные высококогерентные пучки света. Хотя очевидно, что оптические мазеры будут иметь огромное значение не только в оптике, по и в других областях науки и техники, в новом издании не сделано ника- кого обзора, касающегося их действия Дело в том, что принцип их действия выходит за рамки классической электромагнитной теории, на оснозе которой излагается большая часть материала книги. Мы, однако, включили несколько ссылок как на работы, в которых использовался свет, генерируемый лазерами, так и на те, которые появились благодаря потенциальным возможностям этих новых оптических приборов. Мы признательны многочисленным читателям, которые указали нам на некоторые ошибки и опечатки. Мы также благодарны д-ру Карчевски и Мета за помощь при переработке. Бэд Пирмонт и Рочестер Макс Борн ЯбРь 1962 Эмиль Вольф
ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ Мысль о написании этой книги родилась d связи с многочисленными запросами относительно возможности опубликования на английском язы- ке книги по оптике, написанной одним из нас") более 25 лет назад. Пред- варительное ознакомление с литературой показало, что за истекшее время появилось множество исследований почти по всех областях оптики, и ста- рая книга перестала давать о ней исчерпывающее и гармоничное представ- ление. Таким образом, мы увидели, что перевод нецелесообразен, и была написана совершенно новая книга, которую мы предлагаем теперь читателю. В процессе ее подготовки вскоре стало очевидным, что если даже включить в нее только наиболее важные результаты, полученные с момента опублико- вания «Оптики», книга окажется непомерно большой. Поэтому мы были вы- нуждены посвятить ее более узкой тематике. Старая книга также не охваты- вала всю оптику. В ней не рассматривалась оптика движущихся сред, оптика рентгеновских и у-лучей, теория спектров и связь между оптикой и атомной физикой; в ней не обсуждалось также действие света на наш орган зрения — глаз. Изучение этих вопросов более уместно в таких разделах науки, как тео- рия относительности, квантовая механика, атомная и ядерная физика, физио- логия. В настоящей книге не обсуждаются не только эти вопросы, но и исклю- чена классическая молекулярная оптика, которой была посвящена почти половина немецкого издания. Таким образом, наше рассмотрение ограничи- вается оптическими явлениями, допускающими исследование в рамках фено- менологической теории Максвелла. Сюда относятся все явления, в которых атомистическое строение вещества не играет существенной рати. О связи с атомной физикой, квантовой механикой и физиологией говорится лишь по ходу изложения в кратких отступлениях. Несмотря на такие ограничения, книга оказалась значительно больше «Оптики», что дает представление о раз- махе исследований по классической оптике за последнее время. Мы стремились к тому, чтобы в рамках указанных ограничений дать достаточно полное представление о современном состоянии этой области фи- зики и старались изложить теорию таким образом, чтобы можно было просле- дить вывод практически всех результатов из основных уравнений электро- магнитной теории Максвелла, с описания которой начинается паша книга. В гл. 1 обсуждаются основные свойства электромагнитного поля н фор- мально (с помощью обычных материальных постоянных) описывается влияние вещества на распространение электромагнитных возмущений. В гл. 2 разви- вается более физический подход к изучению его влияния; показано, что при наличии внешнего поля каждый элементарный объем среды можно считать источником вторичной (рассеянной) элементарной волны и комбинация этих волн образует наблюдаемое макроскопическое пале. Такой подход имеет важ- ное физическое значение, и его мощь иллюстрируется в одной из последующих глав (гл. 12) при исследовании дифракции света на ультразвуковых волнах, •) М. В or n, Optik, Springer, Berlin, 1933. (М. Бор и. Оптика, ГНТИУ, Харьков — Киев, 1937.)
12 из предисловия к первому изданию впервые рассмотренной таким образом Бхатиа и Ноблом (гл. 12 написана проф. Бхатиа). Значительная часть гл. 3 посвящена доказательству того, что геометри- ческая оптика является следствием волновой теории Максвелла в предельном случае коротких длин волн. Кроме обсуждения основных свойств лучей и волновых фронтов рассматриваются также вопросы, связанные с их вектор- ными свойствами (изменение направлений векторов полей при распростране- нии). Подробное обсуждение основ геометрической оптики казалось нам же- лательным в связи с большими успехами, достигнутыми за последнее время в микроволновой оптике (оптике коротких радиоволн). Они нередко стано- вились возможными благодаря сходству геометрической и микроволновой •оптик и обеспечили создание новой экспериментальной техники для проверки предсказаний теории. Мы сочли целесообразным вынести математический аи- парат геометрической оптики (вычисление вариаций) из основного текста; его изложение (см. приложение 1) основано главным образом на неопублико- ванных лекциях Гильберта, прочитанных им в Геттингенском университете в начале века. В следующем приложении (приложение 2), написанном проф. Габором, раскрывается близкая формальная аналогия между геометрической оптикой, классической и волновой механиками и электронной оптикой, про- являющаяся при обсуждении этих разделов на языке вариационного исчис- ления. Мы не жалеем, что наше рассмотрение геометрической теории изображе- ний (гл. 4) основывается на классическом методе характеристических функций Гамильтона. Этот метод не нашел широкого применения при конструировании оптических инструментов, но он, тем не менее, очень удобен для представле- ния различных аспектов теории с единой точки зрения. Несомненно, некото-' рые результаты можно получить проще с помощью специальных предположе- ний; однако, хотя последний способ удобен при решении некоторых частных задач, он может иметь лишь иллюстративное значение в книге, носвященной систематическому построению теории из нескольких простых постулатов. Дефекты оптических изображений (влияние аберраций) можно исследо- вать либо в рамках геометрической оптпки (когда аберрации велики), либо в рамках теории дифракции (когда аберрации достаточно малы). Раньше обычно возникали трудности при попытках сравнить результаты этих двух подходов, поскольку исходные положения последних совершенно различны. Мы попытались развить более единообразный метод, основанный на понятии о деформации волновых фронтов. При изложении геометрической теории абер- раций (гл. 5) мы нашли возможным и целесообразным использовать старый метод Шварцшильда после небольшого изменения введенного им эйконала. В главе, посвященной дифракционной теории аберраций (гл. 9), дается обзор теории Нижбера — Цернике; в ней излагается также вводный раздел об изоб- ражении при когерентном и некогерентном освещении протяженных объектов, где используются в основном преобразования Фурье. В гл. 6, написанной Вейманом, приводится краткое описание оснооиых оптических систем, формирующих изображение. Это делается с целью под- готовить читателя к изучению тех разделов книги, в которых рассмагривается теория формирования изображений. Гл. 7 посвящена теории интерференции и интерферометрам. В соответст- вующих разделах старой «Оптики» излагались некоторые основные положения теории, затронутые в настоящем издании, однако эти разделы полностью пе- реписаны и значительно расширены Уилкоком. В гл. 8 излагается в основном дифракционная теория Френеля — Кирх- гофа и некоторые ее приложения. Кроме обычных вопросов, в ней содержится подробное обсуждение главной проблемы теории формирования оптических изображений — анализа пространственного распределения света вблизи гео-
ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗЛЛНИЮ 13 метрического фокуса. Дается также обзор менее известного подхода к решению, задач дифракции, основанного на понятии поверхностной дифрагировавшей волны Юнга. В перечисленных выше главах свет считался почти всегда монохромати- ческим (а следовательно, полностью когерентным), исходящим из точечного источника, В гл. 10 рассматривается более реальный случай, когда свет ис- пускается источником конечных размеров и его длины волн (частоты) лежат в конечном интервале. Этот случай обсуждается в теории частичной когерент- ности, получившей очень существенное развитие в последние годы. Фактически строгая теория интерференции и дифракции частично когерентного света создана лишь в настоящее время. Кроме того, в гл. 10 рассматривается вопрос о частичной поляризации, трактуемый с точки зрения теории когерентности. Гл. 11 посвящена строгой теории дифракции, получившей за последние 20 лет огромное развитие *), вызванное в основном прогрессом в ультра- коротковолновой радиотехнике. Эта глава, а также приложение 3, посвящен- ное математическим методам наибыстрейшего спуска и стационарной фазы, написаны Клсммовым. Изложение последних двух глав, «Металлооптика» (гл. 13) и «Кристал- лооптика» (гл. 14), основано на соответствующих главах старого издания «Оптики», однако они существенно пересмотрены и дополнены соответственно Тейлором и Стоксом. Вероятно, этот материал обсуждается не так подробно, как он того заслуживает. Однако строгое рассмотрение металлооптики воз- можно только с привлечением квантовой механики электронов, что выходит за рамки настоящей книги. В кристаллооптике «центр тяжести» постепенно сместился от видимого излучения к рентгеновскому, н прогресс, достигнутый в этой области за последние годы, имеет не теоретическое, а техническое значение. Хотя мы пытались создать книгу, сходную по своим методам и общему подходу со старой «Оптикой», очевидно, что настоящую книгу нельзя считать ни переводом «Оптики», ни полной компиляцией известных сведений. Что касается нашего личного участия в создании этой книги, то следует сказать, что старший соавтор (Макс Борн) включил в нес те разделы «Оптики», которые послужили основой для ряда глав настоящего издании, и принимал активное участие в создании общего плана книги и в многочисленных дискуссиях, посвященных спорным вопросам, характеру изложения и т. д. Большая часть работы по сбору материала, написанию и исправлению текста была проделана младшим соавтором (Эмилем Вольфом). Естественно, мы стремились пользоваться единообразными обозначениями во всем тексте. Однако для книги, посвященной такой обширной области, число букв в известных алфавитах слишком мало. Поэтому нам не всегда уда- валось применять наиболее изящные обозначения, но мы надеемся, что по крайней мере в каждой главе разные величины не обозначаются одинаковыми буквами. t Как правило, мы использовали векторные обозначения, общепринятые в Великобритании. После многочисленных сомнений мы все же отказались от использования одного только оператора набла (V) и ввели обычные div, grad и rot. Мы не приняли также современных электротехнических единиц, так как их преимущество проявляется лишь при описании чисто электромаг- нитных измерений, занимающих ничтожное место в пашей книге; более того, мы надеемся, что если когда-нибудь будет написан второй том {«Молекулярная и атомная оптика»), а возможно, и третий («Квантовая оптика»), то к тому вре- ') В обзорной статье Баукампа (С. J. Bouwkamp, в сб. «Rep. Progr. Phys.s, Phys. Soc. London, 1954, Vol. 17, p. 35) имеется более 000 ссылок на работы, выполненные за период 1940—¦ 1954 гг.
14 ЯЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ мени система СГС, используемая в теоретической физике, снова окажется в почете. Хотя в этой системе единиц магнитная проницаемость ц для большин- ства сред практически не отличается or единицы в оптическом диапазоне час- тог, мы все же оставляли ее в некоторых уравнениях. В результате уравнения оказываются более симметричными и позволяют получать «двойные резуль- таты», пользуясь свойствами симметрии уравнений Максвелла. Для перио- дических во времени полей мы использовали во всей книге (при комплексном представлении) множитель ехр (— ко/). Мы не собирались ссылаться в тексте на все подходящие публикации. Приведенные ссылки, которые, как мы надеемся, относятся к наиболее важ- ным работам, служат для того, чтобы помочь читателю ориентироваться в ли- тературе; отсутствие ссылки на какую-нибудь работу не должно истолковы- ваться как недооценка ее авторами. В заключение мы хотели поблагодарить многих друзей и коллег за советы и помощь. В первою очередь мы выражаем благодарность проф. Габоруза по- лезные советы и помощь на ранней стадии работы, а также за предоставление черновика рукописи, в которой излагается его остроумный метод восстановлен- ных волновых фронтов (см. § 8.10). Мы также глубоко благодарны д-ру Абеле, подготовившему черновик текста, послужившего основой при написании § 1.6 и посвященного вопросу о распространении электромагнитных волн через слоистые среды, вопросу, в решение которого сам д-р Абеле внес существенный вклад. Кроме того, мы обязаны д-ру Биллингсу за советы, касающиеся этой же проблемы Мы очень благодарны д-ру Гопкинсу, д-ру Сильвермаиу, д-ру Велфорду и д-ру Вилли за критические замечания и ценные советы; мы признательны им, а также Д-ру Блеку, д-ру Браддику, д-ру Чако, д-ру Кану, Нисбету, Д-ру Россу и Силлитто за внимательное чтение различных разделов рукописи, Бэд Пирмонт и Манчестер Январь 1959 Макс Борн Эмиль Вольф
ИСТОРИЧЕСКОЕ ВВЕДЕНИЕ Физические принципы, лежащие в основе оптических явлений, обсуж- дению которых посвящена настоящая книга, были в основном сформулированы до 1900 г. В начале XX века оптика, как и вся остальная физика, подверглась глубокому революционному переосмысливанию, вызванному открытием кванта энергии. Однако это открытие, коренным образом изменившее наши пред- ставления о природе света, не сделало старые теории ненужными, ио позво- лило выявить их ограниченность и установить пределы их применимости. Поэтому обобщение старых принципов и методов и их использование в раз- личных конкретных случаях продолжались и продолжаются столь же ин- тенсивно и в настоящее время. При попытке систематического изложения знаний, приобретенных в те- чение нескольких столетий в такой обширной области, как оптика, невозможно придерживаться истории, изобиловавшей ошибочными идеями и отступлени- ями. Поэтому в этой вводной главе мы считаем целесообразным отметить ос- новные этапы в эволюции представлений о природе света *). Философы древности, размышлявшие о природе света, знали о зажига- тельных стеклах, о прямолинейном распространении света, о преломлении и отражении. Первые систематические описания оптических явлений, описа- ния, о которых мы имеем некоторое представление, принадлежат греческим философам и математикам (Емпедоклу D90—430 гг. до н. э.), Евклиду C00 г. до н. э.)). Из основателей новой философии следует отметить Рсне Декарта A596— 1650 гг.), который сформулировал взгляды на природу света на основе мета- физических представлений [81. Декарт считал, что свет—это сжатие, рас- пространяющееся в идеально упругой среде (эфире), которая заполняет все пространство, а различие цветов он объяснял вращательными движениями частиц этой среды с различными скоростями. Однако только после того, как Галилео Галилей A564—1642 гг.), развивая механику, продемонстрировал мощь своего экспериментального метода, оптика получила прочную основу. Закон отражения был известен еще грекам; закон же преломления света был экспериментально установлен в 1621 г. Веллебродом Снеллиусом **) A591—¦ 1626 гг.). В 1657 г. Пьер Ферма A601-1665 гг.) выдвинул свой знаменитый «принцип наименьшего времени» ***) в следующей форме: «Природа всегда следует наикратчайшему пути». В соответствии с этим принципом свет рас- пространяется по пути, требующему наименьшего времени; отсюда, а также *) Для более полного ознакомления с историей оптики см. [1—6]. Подробный историчес- кий обзор оптических исследовяпий вплоть до настоящего времени см. в книге Уиттекера [7|. Первый том этой книги послужил основным источником при написании настоящего истори- ческого введения. **) Сиеллиус умер в 1G26 г., ие опубликовав своего открытия. Закон преломлений был впервые описан в «Диоптрике» Декарта без ссылки на Снеллиуса, хотя, как считают, Де- карт был знаком с его рукописью иа эту тему. ***) В п-исьмс к Кюро де ля Шамбру. Qho опубликовано в [9].
16 ИСТОРИЧЕСКОЕ ВВЕДЕНИЕ из предположения о различиях в «сопротивлениях» разных сред вытекаег за- кон преломления света. Принцип Ферма имеет огромное философское значение и в свое время породил множество споров, так как его истолкование не сво- бодно от телеологических положений, чуждых естественным наукам. Впервые явление интерференции, а именно возникновение разноцветной окраски тонких пленок (в настоящее время такая картина называется «коль- цами Ньютона»), было независимо обнаружено Робертом Бойлем A627— 1691 гг.) 1101 и Робертом Гуком A635—1703 гг.) 1111. Гук установил также наличие света в области геометрической тени, т. е. «дифракцию* свега, однако это явление было замечено ранее Франциском Мария Гримальди A518—1663 гг.) [121. Гук был первым исследователем, который считал, что свет «состоит» из быстрых колебаний, распространяющихся мгновенно или с очень большой скоростью на любые расстояния, и что каждое колебание в однородной среде порождает сферу, радиус которой постоянно растет со временем *). С помощью таких представлений Гук пытался объяснить явление преломления и дать интерпретацию цвета. Однако природа цвета была выяснена лишь в 1666 г., когда Исаак Ньютон A642—1727 гг.) обнаружил [131, что белый цвет с помо- щью призмы можно разложить на отдельные цветовые компоненты и что для каждого чистого цвета характерна своя степень преломления. Трудности, возникавшие в волновой теории при попытках объяснить прямолинейное распространение света и явление поляризации (открытое Гюйгенсом [14)), казались Ньютону настолько серьезными, что побудили его развить корпус- кулярную теорию (или теорию истечения), согласно которой свет распростра- няется от излучающего тела в виде мельчайших частиц. ¦ Ко времени опубликования теории цвета Ньютона еще не бычо известно, распространяется ли свет мгновенно или нег. Конечность скорости света быта обнаружена в 1675 г. Олафом Рёмерэч A644—1710 гг.) при наблюдениях за затмениями спутников Юпитера [151. Волновая теория света, среди первых последователей которой, как мы видели, находился Гук, была существенно улучшена и расширена Христиа- ном Гюйгенсом A629—16Э5 гг.) [14J. Он выдвинул принцип, названный позд- нее его именем, согласно которому каждую точку «эфира», до которой дошло световое возмущение, можно рассматривать как центр нового возмущения, распространяющегося в виде сферической волны; эти вторичные волны ком- бинируются таким образом, что их огибающая определяет волновой фронг в любой последующий момент времени. С помощью этого принципа Гюйгенсу удалось вывести законы преломления и отражения света. Он также объяснил двойное лучепреломление в исландском шпате (открытое в 16G9 г. Эразмом Бартолинусом A625—1698 гг.)), предположив, что при прохождении света через кристалл возникает, кроме первичной сферической, вторичная эллип- соидальная волна. В процессе своего исследования ГюЭгепс обнаружил чрез- вычайно важное явление, а именно явление поляри.знции: он показал, что каждый из двух лучен, возникающих после прохождения свега через кристалл исландского шпата, можно погасить, пропуская его через второй такой же кри- сталл и вращая последний относительно направления луча. Однако объяснить поляризацию удалось только Ньютону; он предположил, что лучи имеют «сто- роны», и именно признание подобной «поперечности» света казалось ему непреодолимым возражением против волновой теории, поскольку ученым в то_ время были известны только продольные волны (из изучения распространения звука). Отрицание волновой теории таким авторитетом, как Ньютон, привело к паяному ее забвению в течение почти столетия. Однако иногда появлялись • *) В ранних волновых теориях Гука и Гюйгенса рассматривались единичные «импульсы», а ие волновые цуги с определенными длинами волн, *
ИСТОРИЧЕСКОЕ ВВЕДЕНИЕ 17 ее случайные защитники *), например великий математик Леонард Эйлер A707—1783 гг.) [16]. Только в начале XIX века были сделаны важнейшие открытия, при- ведшие к полному признанию волновой теории. Первым шагом в этом направ-' лении послужило объяснение интерференции, выдвинутое в 1801 г. Томасом Юнгом A773—1829 гг.), а также цветов тонких пленок 117]. Однако, поскольку идеи Юнга были развиты в основном лишь качественно, они не получили об- щего признания. Примерно в это же время Этьен Луи Малгос A775—1812 гг.) [18] обнару- жил поляризацию света при отражении. Всроягно, в один из вечеров 1808 г. он наблюдал через кристалл исландского шпата отражение Солнца в оконном стекле и обнаружил, что при вращении кристалла вокруг линии зрения от- носительные интенсивности двух изображений, возникающих благодаря двой- ному лучепреломлению, изменяются. Однако Мал юс не пытался найти объяс- нение этого явления, считая, по-видимому, что существовавшие тогда теории не в состоянии дать его. Тем временем в работах Пьера Симона де Лапласа A749—-1827 гг.) и Жана- Батиста Био A774—1862 гг.) развивалась далее корпускулярная теория. Ее сторонники предложили считать объяснение явления дифракции достойным премии, учрежденной на 1818 г. Парижской Академией наук, надеясь, что исследования в этой области полностью подтвердят корпускулярную теорию. Однако их надежды не оправдались — несмотря на сильное сопротивление, премия была присуждена Августину Жаку Френелю A788—1827 гг.), иссле- дование которого [19] основывалось на волновой теории и явилось первым из серии работ, полностью развенчавших в течение нескольких лет корпускуляр- ную теорию. Сущность его исследования состояла в синтезе идеи Гюйгенса о построении волнового фронта как огибающей сферических волн и принципа интерференции Юнга. Этого, как показал Френель, оказалось достаточно для объяснения не только «прямолинейности» распространения света, но и небольших отклонений от «прямолинейности», т. е. явления дифракции. Фре- нель решил задачи о дифракции на крае, небольших отверстиях и экране; наиболее убедительным оказалось экспериментальное подтверждение Араго предсказания, выведенного Пуассоном из теории Френеля и состоявшего в том, что в центре тени от круглого диска должно находиться светлое пятно. В том же году A818 г.) Френель занялся весьма важной проблемой влия- ния движения Земли на распространение света, а именно попытался выяснить, существует ли какое-нибудь различие между светом от звезд и светом от зем- ных источников. Доменик Франсуа Араго A78G—1853 гг.) экспериментально обнаружил, что (помимо аберрации) никакого различия нет. На основании этих наблюдений Френель создал теорию о частичном увлечении светового эфира движущимися телами, теорию, которая была подтверждена в 1851 г. прямыми измерениями Армандом Иполитом Луи Физо A819—1896 гг.). Вместе с Араго Френель исследовал интерференцию поляризованных лучей света и обнаружил (в 1816 г.), что лучи, поляризованные во взаимно перпендикуляр- ных плоскостях, никогда не интерферируют. Этот факт нельзя было согласо- вать с общепринятым тогда предположением о продольное™ световых волн. 'Юнг, узнавший об этом открытии от Араго, нашел в 1817 г. разгадку возник- шего противоречия, предположив, что световые колебания поперечны. Френель, сразу же оценив всю важность такого предположения, попытался подтвердить его, исходя из более падежной динамической основы 1.20], и вы- вел из него много следствий. Так, поскольку в жидкости могут существовать *) Последователем волновой теории света был и М. В. Ломоносов, который в работе, опубликованной в 1756 г., отстаивал представление о свете как о колебаниях эфира [62*1. (Прим. ред.)
18 ИСТОРИЧЕСКОЕ ВВЕДЕНИЕ только продольные волны, эфир должен вести себя, как твердое тело; однако в то время теория упругих волн в твердых телах еще не была сформулирована. Вместо создания такой теории и вывода из нее следствий для оптики Френель «обернул» задачу и попытался выяснить свойства светоного эфира из наблю- дений. Он начал с изучения необычных законов распространения света в крис- таллах; выяснение этих законов и сведение их к нескольким простым предпо- ложениям о природе элементарных оолн является одним из важнейших дости- жений естественной науки. В 1832 г. Вильям Гамильтон A805—1865 гг.) 1211, сам внесший большой вклад в развитие оптики, обратил внимание на важное следствие, вытекающее из теории Френеля, а именно на возможность сущест- вования конической рефракции, которая была экспериментально обнаружена вскоре после этого Хамфри Ллойдом A800—1881 гг.) I22J. Френель также первый сделал предположение A821 г.), развитое позднее Коши, что для выяснения причины дисперсии необходимо учитывать моле- кулярную структуру вещества [23]. Динамические модели механизма колебаний эфира привели Френеля к законам (носящим теперь его имя), которые дают интенсивность и поляри- зацию световых лучей после преломления и отражения [24]. Работа Френеля столь надежно обосновала волновую теорию, что каза- лось совершенно излишним проведение контрольного эксперимента, впервые предложенного Араго, который был осуществлен в 1850 г. Фуко [251 и Физо- и Б реже [26]. Корпускулярная теория объясняет преломление как притяжение свето- вых частиц на границе двух сред оптически более плотной средой, откуда вытекает, что скорость света в более плотной среде больше; волновая же теория, согласно Гюйгенсу, дает меньшую скорость света в оптически более плотной среде. Непосредственное измерение скорости света в воздухе и воде полностью подтвердило вывод волновой теории *). В последующие десятилетия была развита теория упругого эфира. Пер- вым шагом в этом направлении явилось создание теории упругости для твер- дых тел. Она была сформулирована Клодом Луи Мария Анри Навье A785—¦ 1836 гг.) 127], предположившим, что вещество состоит из бесчисленного коли- чества частиц (точечных масс, атомов), взаимодействующих друг с другом вдоль линий, соединяющих пары частиц. Августину Луи Коши A789—1857 гг.) [281 принадлежит привычный теперь вывод уравнений упругости для сплошной сре- ды. Из других ученых, принимавших участие в развитии теории оптики, сле- дует упомянуть Симона Дени Пуассона A781—1840 гг.) [291, Джорджа Грина A793—1841 "гг.) [30], Джеймса Маккалаха A809—1847 гг.) [31] и Франца Неймана A798—1895 гг.) 132]. В настоящее время нет смысла подробно об- суждать ни сами теории, ни те трудности, с которыми они сталкивались, по- скольку все эти трудности вытекали из требования (от него уже давно отка- зались), чтобы оптические явления можно было описывать в рамках механики. Достаточно упомянуть следующее. Рассмотрим две соприкасающиеся упругие среды и предположим, что в первой среде в направлении границы раздела распространяется поперечная волна. Согласно законам механики эта волна расщепится во второй среде на две: продольную и поперечную. Однако из экспериментов Араго и Френеля следует, что продольной упругой волны не должно быть. Разрешить это противоречие невозможно, не нарушая законов механики, содержащихся в граничных условиях для напряжений и натяже- ний. Различные теории, предложенные упомянутыми выше авторами, отли- чались друг от друга предполагаемыми граничными условиями, которые всегда оказывались несовместимыми с законами механики. *) По существу корпускулярная и волновая теории оперировали с разными понятиями скорости. Этот вопрос подробно разобран в [63*]. (Прим. ред.)
ИСТОРИЧЕСКОЕ ВВЕДЕНИЕ 1У Если считать эфир упругой твердой субстанцией, то как тогда ответить на следующий вопрос: каким образом движутся через такую среду планеты с огромными скоростями, не испытывая при этом никакого сопротивления? Джордж Габриэль Стоке A819—1903 гг.) считал, что эту трудность можно обойти, если предположить, что скорости планет малы по сравнению со скоро- стями колебаний частиц эфира, образующих свет; например, известно, что такие твердые тела, как смола или сургуч, могут колебаться с большой часто- той, но легко деформируются, если велик период колебания воздействующей силы. Подобные возражения кажутся нам теперь искусственными, поскольку мы не считаем необходимым, чтобы все явления природы можно было истол- ковать в рамках механических представлений. Первый шаг на пути отхода от теории упругого эфира был сделан Мак- калахом [33], постулировавшим существование среды со свойствами, кото- рыми обычные тела не обладают. Последние накапливают энергию при дефор- мации элементов объема, при вращении же накопления энергии не происходит. В эфире Маккалаха имеет место обратная ситуация. Законы распространений волн в такой среде весьма сходны с законами, вытекающими из уравнения Максвелла (для электромагнитных волн), которые являются основой современ- ной оптики. Несмотря на множество трудностей, теория упругого эфира домини- ровала в течение длительного времени, и многие выдающиеся физики XIX века внесли свой вклад в ее развитие. Кроме уже отмеченных ученых, необходимо упомянуть Вильяма Томсона (лорд Кельвин, 1824—1908 гг.) 134], Карла Ней- мана A832—1925 гг.) [35], Джона Вильяма Стрэтта (лорд Рэлей, 1842— 1919 гг.) [36] и Густава Кирхгофа A824—1887 гг.) [371. За это время были' решены многие оптические проблемы, однако объяснение основ оптики оста- валось неудовлетворительным. В это же время практически независимо от оптических работ проводились исследования по электричеству и магнетизму, увенчавшиеся открытиями Майкла Фарадея A791—1867 гг.) 138]. Джеймсу Кларку Максвеллу A831— 1879 гг.) [39] удалось подытожить все имевшиеся знания в этой области, сфор- мулировав систему уравнений; наиболее важным их следствием оказалась возможность существования электромагнитных волн, распространяющихся со скоростью, величину которой можно вычислить из результатов чисто электрических измерений. Когда Рудольф Кольрауш A809—1858 гг.) и Виль- гельм Вебер A804—1891) Г401 выполнили эти измерения, скорость электро- магнитных волн совпала со скоростью света. Отсюда Максвелл заключил, что свет представляет собой электромагнитные волны; его заключение было экспериментально подтверждено в 1888 г. Генрихом Герцем A857—1894) [41]. Несмотря на это, электромагнитная теория Максвелла выдержала длительную борьбу, прежде чем получила всеобщее признание. По-видимому, одно из характерных свойств мышления человека состоит в том, что оно крайне неохот- но отказывается от привычных представлений, особенно если приходится жертвовать ради этого конкретной картиной явления. В течение длительного времени сам Максвелл и его последователи пытались описать электромагнит- ное поле с помощью механических моделей. Только потом, когда идеи Макс- велла стали более привычными, ученые постепенно оставили попытки «объяс- нения» его уравнений на основе механики; в настоящее время не возникает трудностей при представлении электромагнитного поля Максвелла в виде некой субстанции, не сводящейся ни к чему более простому. Но даже электромагнитная теория света достигла со временем границ, за которыми она становится неприменимой. Она способна объяснить в общих чертах все явления, связанные с распространением света. Однако она не смогла описать процессы излучения и поглощения, которые определяются более тонкими особенностями взаимодействия вещества с оптическим полем.
20 ИСТОРИЧЕСКОЕ ВВЕДЕНИЕ Законы, управляющие этими процессами, являются предметом иссле- дования современной оптики, даже более того,— современной физики. Их история начинается с открытия некоторых закономерностей в спектрах. Пер- вым было открытие (в 1814—1817 гг.) темных линий в солнечном спектре Джо- зефом Фраунгофером A787—1826 гг.) [42], названных его именем *), и их интерпретация как линий поглощения, данная в 1861 г. на основе эксперимен- тов Робертом Вильгельмом Буизеном A811—1899 гг.) и Густавом Кирхгофом A824—1887 гг.) [44]. Солнечный свет, обладающий непрерывным спектром, проходя через более холодные газы солнечной атмосферы, поглощается в ат- мосфере именно на тех длинах волн, которые излучают сами газы. Это откры- тие положило начало развитию спектрального анализа, в основе которого лежит утверждение, что все газообразные химические элементы обладают ха- рактерным линейчатым спектром. Изучение этих спектров было и остается главной задачей физических исследований; поскольку в таких экспериментах свет является предметом исследования и используются оптические методы, спектральный анализ рассматривается иногда как часть оптики. Однако вопрос иб излучении и поглощении света атомами относится не к одной только оптике, так как в него входит и механика самого атома; спектральные закономерности раскрывают не столько природу света, сколько структуру излучающих частиц. Таким образом, спектроскопия из части оптики постепенно превратилась в самостоятельную дисциплину, дающую экспериментальное обоснование атом- ной и молекулярной физике. Эти вопросы, однако, выходят за рамки настоя- щей книги. Что касается методов, то со временем стало ясно, что классическая меха- ника не в состоянии дать правильное описание явлений, происходящих внутри атомов, и ее следует заменить квантовой теорией, история которой началась в 1900 г. с работы Макса Планка A858—1947 гг.) [45]. Применив эту теорию к атому, Нильсу Бору (род. в 1885 г.)**) [46] удалось в 1913 г. объяснить прос- тые закономерности в линейчатых спектрах газов. На основе этих первых работ и все возрастающего количества экспериментальных данных развилась современная квантовая механика (Гсйзенбсрг, Ворн, Иордан, де Бройль, Шредингер, Дирак) [47—52]. С ее помощью удалось существенно увеличить наши познания о структуре атомов и молекул. Квантовая теория оказала сильное влияние на наши представления о природе света. Даже в своей первоначальной форме (в теории Планка) кван- товая теория содержала предположение, полностью противоречащее класси- ческой физике, а именно предположение, что колебательная электрическая система передает свою энергию электромагнитному полю не непрерывно, а лишь конечными порциями, или «квантами» s—hv, величины которых про- порциональны частоте света V, а/г=6,55-10~" эрг/сек — постоянная Планка* f"'). Можно утверждать, что наличие постоянной h отличаег современную физику от старой. Прошло довольно много времени, прежде чем физики полностью осознали парадоксальный, почти иррациональный смысл уравнения Планка s=hv. Заслуга в этом принадлежит в основном Эйнштейну и Бору. В 1905 г. Эйн- штейн A879—1955 гг.) на основании теории Планка возродил в новой форме корпускулярную теорию света 1531, предположив, что планковские кванты энергии существуют в виде реальных частиц света, названных им световыми квантами, или фотонами. Таким образом, ему удалось объяснить некоторые явления, открытые ранее в связи с .превращением энергии света в энергию •) Волластон 'A766— 1828 гг.) наблюдал эти линии в 1802 г. [431, однако он не оценил •свое открытие и неверно их интерпретировал. **) Бор умер в 1962 г. (Прим. ред.) ***) В настоящей время счвдекд, что ft=6,6249b 10-al эрг/сек. (Прим, ред.)
ИСТОРИЧЕСКОЕ ВВЕДЕНИЕ 21 частиц и необъяснимые с помощью волновой теории. Главными среди них являются так называемый фотоэлектрический эффект и фотохимические эф- фекты. В явлениях такого рода не происходит передачи отдельной частице энер- гии, пропорциональной интенсивности света, как этого требует волновая теория, а свет скорее напоминает мелкий град. Энергия, сообщенная вторич- ным частицам, не зависит от интенсивности света, а определяется лишь его частотой (в соответствии с законом R~hv). Из года в год росло число наблюде- ний, подтверждавших это свойство света, в результате чего сложилась ситуа- ция, когда пришлось признать справедливость как волновой, так и корпус- кулярной теории света, причем первая подтверждалась явлением интерферен- ции, а вторая — фотоэлектрическим эффектом. Только в самое последнее время развитие квантовой механики позволило частично объяснить такое па- радоксальное положение, причем для этого пришлось отказаться от основного принципа старой физики, а именно, от принципа детерминированной при- чинности. 1 Развитие теории взаимодействия поля с веществом потребовало расши- рения методов квантовой механики (квантование полей). Для электромагнит- ного поля квантование было впервые проведено Дираком [54] и его работы составляют основу квантовой оптики. Обсуждение этих вопросов выходит, однако, за рамки настоящей книги. Оптика движущихся тел является другой областью оптики, не затро- нутой в настоящей книге. Как и квантовая теория, она превратилась в широ- кий независимый раздел знания. Первым наблюденным явлением в этой об- ласти, отмеченным в 1728 г. Джеймсом Брэдли A692—1762 гг.) [55], было явление аберрации «неподвижных звезд», т. е. обнаружение небольшого раз- личия их угловых положений, связанного с движением Земли относительно направления светового луча. Брэдли правильно понял это явление, связав его с конечностью скорости распространения света, в результате чего ему удалось определить последнюю. Мы уже упоминали и другие явления, отно- сящиеся к оптике движущихся сред: Френель первый заинтересовался увлече- нием света движущимися телами и показал, что световой эфир участвует в движении со скоростью, которая меньше скорости движущихся тат; затем Физо экспериментально продемонстрировал такое частичное увлечение света в опы- тах с текущей водой. Христиан Допплер A803—1853 гг.) [561 исследовал эф- фекты, связанные с движением источника света или наблюдателя, и сформули- ровал хорошо известный принцип, названный его именем. До тех пор, пока теория упругого светового эфира считалась верной, а область исследований и точность измерений были достаточно ограниченными, идея Френеля о час- тичном увлечении света была способна объяснить все наблюдаемые явления. Электромагнитная же теория света встретилась здесь с трудностями фун- даментального характера. Герц первый попытался обобщить уравнения Макс- велла на случай движущихся тел. Однако его формулы противоречили неко- торым электромагнитным и оптическим измерениям. Огромную роль сыграла теория Гендрика Антона Лоренца A853—1928 гг.), который предположил, что «эфир в состоянии абсолютного покоя» является носителем электромаг- нитного поля, и вывел свойства материальных тел из взаимодействия элемен- тарных электрических частиц — электронов. Ему удалось показать, что фре- нелевские коэффициенты увлечения свега можно получить из его теории и все известные в то время A895 г.) явления можно объяснить на основании его ги- потезы [57]. Однако в результате колоссального увеличения точности изме- рения оптических путей, достигнутого с помощью интерферометра Альберта Абрагама Майкельсона A852—1931 гг.), возникла новая трудность: оказа- лось невозможным обнаружить «эфирный ветер», наличие которого следовало из теории «неподвижного эц;ира» [58, 591. Эта трудность была преодолена в 1905 г, Альбертом Эйнштейном [60] в его специальной теории относительности.
22 ИСТОРИЧЕСКОЕ ВВЕДЕНИЕ Эта теория основана на критике старых представлений о времени и простран- стве и приводит к отказу от евклидовой геометрии и обычного понятия одно- временности. Ее дальнейшее развитие, так называемая общая теория отно- сительности [611, характеризуется совершенно новым подходом к гравита- ционным явлениям—«геометризацией» пространственно-временного кон- тинуума. Применение этой теории требует использования специальных мате- матических и физических методов, которые (хотя они и связаны во многих случаях с оптикой) лучше рассматривать отдельно. Число же оптических явлений, в которых движение тел (т. е. источников света) играет существен- ную роль, весьма незначительно. ЛИТЕРАТУРА •) 1. J. Priestley, History and Present state of Discoveries relating to Vision, Light and Colours, 2 Vols, London, 1772. 2. T. Y о u n g, A Course of Lectures on Natural Philosophy and the Mechanical Arts, London, 1845, Vol. 1, pp. 374—ЗЯ5. 3. E. Wilde, Geschichte der Optik vom Ursprung dieser Wissenschaft bis auf die gegenwartige Zeit, 2 Vols, Berlin, 1838, 1843. 4. E. M а с h, The Principles of Physical Optics, A historical and philosophical treatment 1926 (перевод с немецкого; первое немецкое издание 1913 г.). 5. Е. Н о р р е, Geschichte der Optik, Weber, Leipzig. 1926. 6. V. Ronchi, Storia della Luce, Zaniehelli, Bologna, 2nd pd., 1952. 7. E. T. \V h i t t a k e r, A History of the Theories of Aether and Electricity, Vol. I (The Classical Theory), 1952, Vol. II (The Modern Theories 1900—1926), 1953, T. Nelson a. Sons, London a. Edinburgh. 8. R. Descartes, Dioptrique, Meteores, Leyden, 1637; Principia Philosophiae, Amster- dam, 1644. 9. P. Feimat, Oeuvres, Paris, 1891, Vol. 2, p, 354. 10. R. В о у 1 e, The Philosophical Works, 2nd ed., London,- 1738, Vol. II, p. 70. 11. R. Hooke, Micrographia, 1665, p. 47. 12. F. M. Grimaldi, Physico-Mathcsis de lumine, coloribus, et iride, Bologna, 1665. 13. 1. Newton, Phil. Trans, № 80, 3075 A672). 14. С H u у g e n s, Traite de la lumiere (работа закончена в 1678 г. и опубликована а Лейдене в 1690 г.) (X. Гюйгенс, Трактат о свете. ОН'Ш, 1935). 15. О. R 6 m е г, Mem. Acad. Sci. Paris 10, 575 A666—1669); J. de Sav., 223 A676). 16. L. E u 1 er i, Opuscula varii argument!", Berlin, 1746, p. 169. 17. T. Y о u n g, Phil. Trans. Roy. Soc. xcii, 12, 387 A802); Young's Works, Vol. 1, p. 202. 18. E. L. M a 1 u s, Nouveau Bull. d. Sci., par la Soc. Philomatique 1, 266 A809); Mem. de la Soc. d'Arcueil 2 A809). 19. A. F r e s n e 1, Ann. Chim. et Phys. 1, 239 A816); Oeuvres, Vol. 1, pp. 89, 129. 20. A. Fresnel, Oeuvres, Vol. 2, pp. 261, 479. 21. W, R. Hamilto n, Trans. Roy. Irish Acad. 17, 1 A833); Mathematical Papers, Vol. 1, Geometrical Optics, ed., by J. L. Synge a. W. Conway, Cambr. Univ. Press, 1931, p. 285. 22. H. Lloy d, Trans. Roy. Irish Acad. 17, 145 A833). 23. A. Frejim 1, Oeuvres, Vol. 2, p. 438. 24. A. Fresnel, Mem. de l'Acad. 11, 393 A832); Oeuvres, Vol. 1, p. 767. 25 L. Fouca ul t, С R. Acad. Sci. 30, 551 A850). 26. H. F i z e a u, L. В r e g u e t, С R. Acad. Sci. 30, 562, 771 A850). 27. С L. M. H. N a v i e r, Mem. de l'Acad. 7, 375 (представлена в 1821 г., опубликована в 1827 г.). 28. A. L. Cauchy, Exercise dc Mathematiques 3, 160 A828). 29. S. D. Poisson, Mem. de l'Acad. 8, 623 A828). 30. G. Green, Trans. Cambr. Phil. Soc. A838); Math. Papers, 245. 31. J. M а с С u 1 1 a g h, Phil. Mag. 10, 42, 382 A837); Proc. Roy. Irish. Acad. 18 A837). 32. F. Neumann, Abh. Berl. Akad., Math. Kl. 1 A835). 33. J. MacCullagh, Trans. Roy. Irish Acad. 21; Coll. Works, Dublin, 1880, p. 145. 34. \V. Thomson, Phil. Mag. 26, 414 A888); Baltimore Lectures, London, 1904. 35. C. Neumann, Math. Ann. 1, 325 A869); 2, 182 A870). 36. J. W. S t г u t t (Lord Rayleigh), Phil. Mag. 41, 519 A871); 42, 81 A871). 37. G. K. i г с h h о f f, Berl. Abh. Physik, Abteilg 2, 57 A876); Ges. Abh. 352; Berl. Ber. 641 A882); Pogg. Ann. Physik u. Chem. B) 18, 663 A883); Ges. Abh., Nachtrag 22. *) Здесь и далее литература, добавленная при переводе, отмечена Звездочкой. {Прим, ped.)
а Итература 23 38. М. Faraday, Experimental Researches in Electricity, London, 1839. (M. Ф а р а де й. Избранные работы но электричеству, Гостехиздат, 1939.) 39. J. С. М а х w е 1 1, A Treatise on Electricity and Magnetism, 2 Vols, Oxford, 1873. (Дж. Максвелл, Избранные труды по теории электромагнитного поля Гостехиядат, 1952.) 40. R. К о h 1 г a u s с h, W. Weber, Fogg. Ann. Physik и. Chem. B) 99, 10 A856). 41. H. Hertz, Sitzb. Berl. Akad. Wiss. Feb. 2, 1888; Wiedem. Ann. 34, 551 A888). 42. J. Frau nhofer, Gilberts Ann. 56, 264 A817). 43. W. H. W oil as ton, Phil. Trans. Roy. Soc. 365 A802). 44. R. Bunsen, G. Kirchhoff, Untersuchungen fiber das Sormenspektrum und die Spektren der chemischen Elemente, Abb. Kgl. Akad. Wiss., Berlin, 1861, 1863. 45. M. Planck, Verb. d. deulsch phys. Ges. 2, 202, 237 A900). Ann. d. Physik 4, 553 A901). 46. N. Bohr, Phil. Mag. 26, 1. 476. 857 A913). 47. W. Heisenberg, Z.f. Phys. 33, 879 A925). 48. M. Born, P. J о г d a n, Z.f. Phis. 34, 858 A925). 49. M. В о r n, W. Heisenberg, P. J о г d a n, Z.f. Phys. 35, 557 A926). 50. L. de В г о g 1 i e, These, Paris, 1924; Ann. dc Physique A0) 3, 22 A925). 51. E. Schrodinger, Ann. d. Physik 79, 361, 489, 734 A926); 80, 437 A926); 81, 109* A926). 52. P. A. M.Dlru, Proc. Roy. Soc. A109, 642 A925); AIM, 561 A926). 53. A. Einstein, Aim. d. Physik 17, 132 A905); 20, 199 A906). 54. P. A. M. D i r a c, Proc. Roy. Soc.AIH, 243, 710 A927). 55. J. В r a d 1 ey, Phil. Trans, 35, 637 A728). .56. С D о p p 1 e r, Abh. Kongl. bohm. Geselsch. 2, 466 A842); Pogg. Ann. 68, 1 A847). 57. H. A. L о r e n t z, Versuch einer Theorie der electrischen und optischen Erscheinungen in bewegten Korpern, E. J. Brill, Leiden, 1895. 58. A. A. Mitlulso n, Amer. J. Sci. C) 22, 20 A881). 59. A. A. M i с h e 1 s о n, E. W. Morley, Amer. J. Sci. C) 34, 333 A887); Phil. Mag. 24, 449 A887). 60. A. Einstein, Ann. d. Physik 17, 891 A905). 61. A. Einstein, Berl. Sitz. 778, 799, 831, 844 A915); Ann. d. Physik 49, 769 A916). 62*. M. В. Ломоносов, Слово о происхождении света, новую теорию о цветах представ- ляющее. Сочинения М. В. Ломоносова, изд. Академии наук, 1898 г., т. IV, стр. 392. 63*. Г. С. Л а н д с б е р г, Оптика, Гостехиздат, 1957.
ГЛАВА t ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ § 1.1. Электромагнитное иоле 1.1.1. Уравнения Максвелла. При наличии электрических зарядов в про- странстве устанавливается возбужденное состояние, которое называют электро- магнитным полем. Его представляют двумя векторами Е и В, именуемыми соответственно электрическим вектором и магнитной индукцией. В алиментарных курках основными векторами поля по историческим причинам обычно считают векторы Е и Н, а посредством векторов D и В описывают влияние среды. Однако в об- щей теории по причинам, выясняющимся при изучении электродинамики движущихся сред, обязательно представление, указанное в тексте. Уравнения Максвелла (I)—D) (см. ниже) можно разделить на две группы: одна, содержа- щая Е и В, состоит из двух однородных уравнений (с правой частью, равной нулю, а другая, содержащая D и Н, — из двух неоднородных уравнении (с правой частью, отличной от пуля). При релятивистском преобразовании пространства и времени (преобразование Лорен^да) уравнения каждой группы преобразуются совместно. При этом они остаются инвариантными, если величины j/c и р преобраз>ются как четырехмерный вектор, а каждая из нар Е, В и D, Н — как шестимерпый вектор (апшенмметричный тензор второго ранга). Поскольку в группу, состоящую из неоднородных уравнений, входят заряды и токи (которые представляют влияние среды), мы должны считать, что соответствующая пара (D, Н) отражает влияние среды. Однако, обычно за вектор магнитного поля принимают вектор Н, а не В. Мы будем придерживаться той же терминологии, когда это не может привести к путанице. Для того чтобы описать влияние поля на материальные объекты, необ- ходимо ввести вторую группу векторов, а именно плотность электрического- тока I, электрическое смещение D и магнитный вектор Н. Пространственные и временные производные пяти указанных векторов связаны уравнениями Максвелла. Эти уравнения, выполняющиеся в каждой точке, вблизи которой физические свойства среды непрерывны, имеют вид *) rotH—i-D = ^J, A> rotE + -iB = 0. B) Точка над буквой означает дифференцирование по времени. Векторные уравнения дополняются двумя скалярными соотношениями div D = 4лр, C) riivB==O. D) Можно считать уравнение C) определением плотности электрического заряда р, а соотношение D) означает, что не существует свободных магнитных полюсов. Из уравнения A) следует (поскольку div rot ~ 0), что *) Здесь используется так называемая гауссова система единиц, т. е. электрические ве- личины (Е, D, j и A) измеряются в электростатических единицах, а магнитные величины (Н и В) в электромагнитных единицах. Постоянная с в A) и B) связывает единицы заряда в обеих системах; она равна скорости света в вакууме и составляет приблизительно 3-10'"си/сек (более точное значение приведено в § 1.2). [В отличие от системы единиц, используемой в данной книге, в СССР принята Международная система единиц, сокращенно обозначаемая СИ [44*] (Прим. ред.).\
§ 1 !] электромагнитное полг 2S или, используя C) | + divj=O. E) По аналогии с соотношением, встречающимся в гидродинамике, уравне- ние E) называется уравнением непрерывности. Оно отражает сохранение заряда в окрестности любой точки. Действительно, если мы проинтегрируем E) по некоторой области пространства, то получим, используя теорему Гаусса, O, F) причем первый интеграл берется по объему этой области, а второй по поверх- ности, ограничивающей ее. Здесь п — единичный вектор внешней нормали. Из этого уравнения следует, что полный заряд заключенный внутри рассматриваемой области, может увеличиться только- при наличии электрического тока • 3 = ^j.ndS. (8) Если все величины, характеризующие поле, не зависят от времени и от- сутствуют токи (j =• 0), то поле называют статическим. Если эти величины не зависят от времени, но имеются токи (j ф 0), то мы говорим о стационар- ном поле. Векторы оптических полей очень быстро изменяются во времени, но источники полей обычно таковы, что при рассмотрении не мгновенных значений величин, а усредненных по любому макроскопическому интервалу времени, свойства поля оказываются не зависящими от времени. Часто термин «стационарный» употребляется в более широком смысле для описания поля указанного гипа. В качестве примера укажем ноле, образуемое непрерывным потоком излечения (скажем, ог удаленной звезды) через оптическую систему. 1.1.2. Материальные уравнения. Уравнения Максвелла A)—D) связывают пять основных величин Е, Н, В, D и j. Для того чтобы при заданном распре- делении зарядов и токов уравнении допускали единственное решение для век- торов поля, к этим уравнениям необходимо добавить соотношения, описываю- щие поведение веществ под влиянием поля. Такие соотношения называются материальными уравнениями *). В общем случае они довольно сложны, но для тел, находящихся в покое друг относительно друга (или в состоянии очень медленного движения) и состоящих из изотропных веществ (т. е. веществ, физические свойства которых в каждой точке не зависят от направления), эти уравнения принимают относительно простую форму**). i = o-E, (9) D=eE, A0> В = |лН. A1} Величина а называется удельной проводимостью, е —- диэлектрической прони- цаемостью, а [1 — магнитной проницаемостью. Уравнение (9) является дифференциальной формой закона Ома. Вещества, для которых а ф 0 (вернее, не равно пренебрежимо малой величине; точный *) Существует н другой способ описания поведения среды. Вместо величин &—DIE и ц, В/П можно рж сматривать разности D—Е и В—Н. Они имеют более простой физический смысл и их мы рассмотрим в гл 2. ') Более общие соотношения, применимые к движущимся телам, изучаются в реля- ,. .^.^кой теории Из общей теории нам необходим лишь следующий результат: в случае дви- жущихся зарядов к току проводимости о"Е добавляется конвекционный ток pv, где V — ско- рость движущихся зарядов, р — плотность зарядов (см. стр. 31).
26 основные свойства электромагнитного поля [гл. 1 смысл этого неравенства здесь обсуждать невозможно), называются провод- никами. Очень хорошими проводниками служат металлы, но существуют и другие классы хорошо проводящих веществ, такие, как ионные растворы в жидкостях, а также в твердых телах. Проводимость металлов уменьшается с повышением температуры. Для других классов веществ, называемых полу- проводниками (например, германий), проводимость сильно увеличивается с ростом температуры. Вещества, для которых с пренебрежимо мала, называются изоляторами или диэлектриками. Их электрические и магнитные свойства полностью определяются величинами к и р.. Для большинства веществ магнитная прони- цаемость j.i практически равна единице. Если это не так, т. е. если р, заметно отличается от единицы, то мы называем такое вещество магнетиком. В част- ности, если \х > 1, то вещество называют парамагнетиком (например, платина, кислород, азот), если же ji < 1,— то диамагнетиком (например, висмут, медь, водород, вода). Для чрезвычайно сильных полей, которые получаются, например, при фо- кусировке света, генерируемого оптическим мазером *), к правым частям материальных уравнений, возможно, придется добавить члены, содержащие компоненты векторов поля в степени, большей единицы **). Во многих случаях величины а, <-; и |л не зависят от напряженности полей, однако часто поведение вещества невозможно описать таким простым способом. Например, ток в газе свободных ионов, который определяется средней скоро- стью ионов, в любой момент времени зависит не от мгновенного значения Е, а от всех его предыдущих значений. В так называемых ферромагнитных веще- ствах (вещества, являющиеся очень сильными магнетиками, например железо, кобальт и никель) магнитная индукция В определяется предысторией поля Н, а не его мгновенным значением. В этом случае говорят, что вещество проявляет гистерезис. В некоторых диэлектриках наблюдается подобная же зависимость от предыстории для электрического смещения. К счастью, гистерезисные эффекты для высокочастотных полей, встречающихся в оптике, как правило, незначительны. В основной части настоящей книги мы будем рассматривать распростра- нение света в таких средах, в которых не происходит заметного его ослабления (например, воздух, стекло). Подобные среды называются прозрачными. Они должны быть электрически непроводящими (а — 0), поскольку наличие про- водимости приводит к выделению джоулева тепла (см. п. 1.1.4) и, следователь- но, к потерям электромагнитной энергии. Оптические свойства проводящих сред рассматриваются в гл. 13. 1.1.3. Граничные условия на поверхностях раздела. Уравнения Максвелла были получены лишь для областей пространства, в которых физические свой- ства среды (характеризующиеся величинами е и \х.) непрерывны. В оптике часто встречается ситуация, когда эти свойства резко меняются на одной или не- скольких поверхностях. Можно ожидать, что тогда кекторы Е, Н, В и D также будут претерпевать разрыв, а величины р и j выродятся в соответствующие поверхностные величины. Выведем соотношения, описывающие переход через такую поверхность раздела. *) В русской литературе мазеры в оптическом диапазоне называются лазерами. (Прим. ред.) •*) Нелинейность соотношения между вектором смещения D и электрическим полем Е чпервые была найдена указанным способом в работе [11. Теория распространения, преломле- ния и отражения электромагнитных воли при условиях, когда необходимо учитывать такие нелинейные эффекты, развита к работах [2,3]. Подробное рассмотрение нелинейных эффектов проводится в работах 14]. [Нелинейные оптические эффекты, рассмотрены также в работах 145*, 46*] (Прим. ред.).]
§ 1.1] ЭЛЕКТРОМАГНИТНОЕ ПОЛИ 27 Заменим поверхность резкого раздела Т тонким, переходным слоем, вну- три которого е и ji быстро, но непрерывно меняются от значений около Т с одной стороны слоя до их значений вблизи Т с другой его стороны. Внутри этого слоя построим небольшой квазипилиндр, ограниченный с боков «частоколом» нормалей к Т. Основаниями цилиндра на каждой стороне Т служат небольшие площадки 6Ai и ЬА2, параллельные поверхности Т (рис. 1.1). Поскольку во всем цилиндре вектор В и его производные непрерывны, мы можем применить теорему Гаусса к интегралу от div В, взятому по объему цилиндра. Тогда, согласно D), по- лучим ^ divBdV=~5 B-nrfS^O. A2) Здесь n — единичный вектор внешней нор- а А/ мали; второй интеграл берется по поверх- Рис. u. K выводу граничных ус.ю- ПОСТИ ЦИЛИНДра. вий для нормальные компонент В Так как площадки ЬАг и 6Л2 предпо- и D. лагаются малыми, можно считать, что на них В принимает постоянные значения Ва> и В<2). Тогда выражение A2) можно заменить следующим; В111 -п^/^ + В121 -п3бу12 +вклад от стенок = 0. A3) Если высота цилиндра б/t стремится к нулю, переходный слой переходит в поверхность, а вклад от стенок цилиндра исчезает при условии, что отсутст- вует поверхностный ноток магнитной индукции. Такой поток никогда не на- блюдается и, следовательно, в пределе (В^'-^ + В'^-п^бЛ =0, A4) где ЬА — площадь пересечения нашего цилиндра с поверхностью Т. Если nJ2— единичный вектор нормали, направленный из первой среды во вторую, то rij — — nl2, n2 = п12, и из соотношения A4) получим П12-(ВМ — ВA») = 0, A5) т. е. нормальная компонента вектора магнитной индукции непрерывна на поверхности раздела. Подобным же образом можно рассмотреть электрическое смещение D, но в этом случае при наличии зарядов появится дополнительный член. Вме- сто A2) мы получим из C) $divDdF=$D-nciS = 4^pdF. A6) При слиянии площадок &А t и 6AS полный заряд остается конечным и, сле- довательно, объемная плотность становится бесконечной. При этом вместо объемной плотности заряда р необходимо ввести поверхностную плотность заряда р, определяемую соотношением *) lira \' pdV = jj pdA. A7) *) В дальнейшем нам понадобится выразить поверхностную плотность заряда и поверч- иостную плотность тока через дельта-функцию Дирака (см. приложение 4). Если уравнение поверхности раздела имеет вид F (х, у, г) — 0, то A7а) j = f|gradF|6(f). A8а) Можно лет ко проверить правильность этих выражений, подставив их в A7) и A8) и использовав соотношение dF— IgradF\dh и фильтрующее свойство дельта-функции Дирака.
28 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ. 1 Позже нам понадобится также понятие поверхностной плотности тока j, которая определяется аналогичным образом, а именно lira \\dV =\\dA. A8) bh -» 0 •> J Если-площадку 6А и высоту bh выбрать достаточно малыми, то из A6) получим 6 +вклад от Вклад от стенок стремится к нулю с уменьшением bh, и поэтому в пределе при 6A-> 0 получим nla-(D(a) — Dll)) = 4np, A9) т. е. при наличии на поверхности раздела слоя с поверхностной плотностью заряда р, нормальная компонента вектора электрического смещения при пере- ходе через эту поверхность испытывает скачок, равный 4яр. Исследуем теперь поведение тангенциальных компонент. Заменим по- верхность резкого раздела переходным слоем, а цилиндр, показанный на рис. 1.1, «прямоугольной» площадкой, стороны которой параллельны и пер- пендикулярны поверхности Т (рис. 1.2), Рис. 1.2. К выводу граничных условий для тангенциальных компонент Е и Н. Пусть b—единичный вектор, перпендикулярный плоскости рассматри- ваемого прямоугольника. Тогда на основании теоремы Стокса получим из B) frotE-bfi& = JE-dr = — -i-f B-bAS; BQ) здесь первый и третий интегралы берутся по площади прямоугольника, а вто- рой— вдоль его границ. Если длины P,Q] (=6s,) и P2Q2 (-- 8s,) малы, то на каждой из этих сторон вектор Е можно заменить постоянными значениями ?(» и ?B)_ Подобным же образом постоянным значением можно заменить и век- тор В. Тогда из B0) найдем E<1)-t16s1 + E(8>-t26sa +вклад от концов = —— В ¦ bfis 8A, B1) ^ С где 8s—линейный элемент, по которому прямоугольник пересекается с по- верхностью раздела. Если теперь постепенно уменьшать высоту прямоуголь- ника, то вклад от концов PiP% и QiQz будет стремиться к нулю при условии, что Е в пределе не имеет достаточно резких особенностей. Такую возможность мы исключим. Предположим также, что остается конечным и В; тогда в пределе при б/i—>- 0 получим (E<».t1 + E<2'-t2)as=O. B2) Если t— единичный вектор касательной к поверхности (см. рис. 1.2), то tx= = — t = — b X tii2, t2= t = b x n12, и из B2) следует b.[nI2x(EB>
§ 1.1] ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ 29 Так как ориентация прямоугольника, а следовательно, и единичного вектора b произвольна, ясно, что П12Х(Е<« —Е»>) = 0, B3) т. е. тангенциальная компонента электрического вектора непрерывна на по- верхности раздела. Наконец, рассмотрим поведение тангенциальной компоненты магнитного вектора. Анализ проводится аналогичным образом, но при наличии токов по- явится дополнительный член. Вместо B1) в этом случае получим Н(" • t^+Н(г>. t26s2 -f вклад от концов = .1Ь ¦ b 6s 6ft + -у-j • b 6s. B4) Переходя, как и раньше, к пределу 6Л^- 0, находим п1,х(Н»-Н<«)=-^]. B5) Из B5) следует, что при наличии тока с поверхностной плотностью j танген- циальная компонента магнитного вектора (рассматриваемая- как вектор) испытывает скачок, равный — ixn12. Помимо разрывов, связанных с резким изменением физических свойств среды, векторы поля могут также претерпевать разрывы из-за присутствия источника, который начинает излучать в некоторый момент времени t=t0. Тогда возмущение будет распространяться в окружающем пространстве и в лю- бой последующий момент времени WZ>tc, заполнит вполне определенную об- ласть. На (движущихся) границах этой области векторы поля будут резко изменяться от конечных значений до нуля за ее пределами.- Различные случаи разрыва можно описать уравнениями Максвелла в интегральной форме (см., например, 15], стр. 11 или 16), стр. 6). Общие условия разрывности можно также записать в форме уравнений в конечных разностях; вывод этих уравнений приведен в приложении 6. 1.1.4. Закон сохранения энергии для электромагнитного поля. В рамках электромагнитной теории интенсивность света интерпретируется как поток энергии поля. Поэтому необходимо вспомнить формулировку закона сохране- ния энергии в теории Максвелла. Из A) и B) следует, что E-rotH —H-rotE=-^-j-E + -i-E.b + yH-B. B6) Члены, стоящие слева, с помощью хороши известного векторного тождества можно выразить через дивергенцию векторного произведения Н и Е, т. е. E-rotH — H-rotE = — div(ExH). B7) Из B6) и B7) получим -i(E.D + H-B) + ^j-E + div(ExH) = O. B8) Умножив это равенство на с/4я, проинтегрировав по произвольному объему и использовав теорему Гаусса, найдем B)dV + jj.E^+^j(EXH)-nrfS=O, B9) Здесь последний интеграл берется по границе объема, an — единичный век- тор внешней нормали. Соотношение B9) непосредственно вытекает из' уравнения Максвелла и поэтому выполняется независимо от справедливости материальных урав- нений (9)—A1). Как мы увидим, оно выражает закон сохранения энергии для
30 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ 1 электромагнитного шля. Здесь мы рассмотрим его лишь для случая', когда удовлетворяются материальные уравнения (9)—A1). Позже (см. гл. 14) будет проведено обобщение этого закона для случая анизотропных сред, где мате- риальные уравнения принимают более сложную форму. Используя материальные уравнения, найдем Полагая C2) преобразуем соотношение B9) к виду ^+f j.Ec(V + — C(E\HLidS = O. C3) Покажем, что величина W представляет полную энергию, заключенную вну- три объема, и, следовательно, we можно отождествить с плотностью электриче- ской энергии, a wm— с плотностью магнитной энергии поля *). Для отождествления W с полной энергией, нужно доказать, что для замк- нутой системы (т. е. системы, в которой можно пренебречь полем на граничной поверхности) изменение W обусловливается работой, проделанной полем над материальными зарязкеиными телами, входящими в систему. Достаточно по- казать это для медленного движения названных тел, причем мы вправе считать последние столь малыми, что можем рассматривать их как точечные заряды ek(k = 1, 2, ...). Обозначим скорость заряда ek через v(! (vh <<S с). Сила, действующая со стороны поля (Е, В) на заряд, движущийся со ско- ростью v, определяется так называемым законом Лорентца C4) который основан на эксперименте. Отсюда следует, что если все заряды ек за время Ы смещаются на 6xk (k = 1, 2, ...), то полная проделанная работа равна так как бх^ — v;6/. Если число заряженных частиц велико, распределение заряда можно считать непрерывным. Введем плотность заряда р (т. е. полный заряд единицы объема); тогда последнее равенство примет вид ЬА=--Ы \pw--EdV, C5) •) В общем случае этр величины определяются выражениями Они переходят в C1), копа соотношение между Е и D и между Н и В линейно, как предпола- гается здесь.
§ 1.1] ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ 31 причем интегрирование проводится по произвольному объему. В уравнениях Максвелла не содержится в явном виде скорость v, однако ее можно ввести, используя полученный Рентгеном [7] экспериментальный результат, согласно которому конвекционный ток (т. е. течение движущихся зарядов) создает такой же электромагнитный эффект, как и ток проводимости в проволоке. Следова- тельно, плотность тока j, фигурирующую в уравнениях Максвелла, можно разделить на две части ! = !,+].. C6) где jc= аЕ— плотность тока проводимости, a jB= pv— плотность конвекци- онного тока. Тогда выражение C5) запишется в виде ^ C7) Определим вектор S и скаляр Q соотношениями , S = JLExH, C8) Q=^\,-EdV =^aWdV. C9) Теперь с помощью C5) и C6) найдем +^i D0) где вторая функция, конечно, не является полной производной от функции координат и времени. Уравнение C3) примет теперь вид D1) Для непроводящей среды (<т = 0) имеем Q = 0. Будем также считать гра- ничную поверхность расположенной так далеко, что можно пренебречь полем на ней, вызванным электромагнитными процессами, происходящими внутри нее. Тогда \S-nrfS = 0n интегрирование выражения D1) дает W -f A = const. D2) Следовательно, для изолированной системы увеличение W в единицу времени обусловливается работой, проделанной над системой в течение этого времени. Полученный результат подтверждает наше определение электромагнитной энергии выражением C2). Член Q (он называется джоулевым теплом) представляет собой диссипа- цию энергии в проводнике (а Ф 0) из-за наличия сопротивления. Если поле достигает граничной поверхности, то, согласно D1), происходит дополнитель- ное уменьшение энергии. Поэтому поверхностный интеграл должен определять поток энергии через эту граничную поверхность. Вектор S известен как вектор Пойнтинга и представляет количество энергии, протекающее за одну секунду через единичную площадку, перпендикулярную к направлениям Е и Н. Необходимо отметить, что интерпретация S как потока энергии (точнее, как плотности этого потока) вносит известную степень произвола. Согласна D1) физическим смыслом обладает не сама величина S, а интеграл от S-n, взятый по замкнутой поверхности. Ясно, что из значения интеграла нельзя вывести однозначное заключение о детальном распределении S, поэтому воз- можны и другие определения плотности потока энергии. К S всегда можно при- бавить ротор произвольного вектора, поскольку такой член не вносит вклада в поверхностный интеграл, что следует из теоремы Гаусса и тождества
32 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ. 1 (jjv rot=0 *). Однако при осторожном применении этого определения, в частно- сти для средних значений небольших, но конечных интервалов прострапава или времени, никакого противоречия с экспериментом не возникает. Поэтому мы примем приведенное выше определение плотности потока энергии через век- тор Пойнтинга. Наконец, отметим, что в непроводящей среде (а — 0) в отсутствие механи- ческой работы (А — 0) закон сохранения энергии можно записать в форме гидродинамического уравнения непрерывности для несжимаемой жидкости, а именно ^ D3) Гидродинамическая модель часто оказывается полезной при описании рас- пространения света, в частности в геометрической оптике или при рассмотре- нии скалярных дифракционных полей, так как она дает картину распростране- ния энергии в простой графической форме, В оптике наибольший интерес пред- ставляет усредненный вектор Пойнтинга. Величина его служит мерой ингеп- •сивности света, а направление указывает направление распространения света. § 1.2. Волновое уравнение и скорость света "Уравнения Максвелла связывают между собой векторы поля системой диф- ференциальных уравнений. Дифференциальные уравнения, которым должен удовлетворять каждый из векторов в отдельности, можно получить путем ис- ключения остальных векторов. Мы ограничимся рассмотрением области поля, не содержащей ни зарядов, ни токов, т. е. j = 0 и р=0. Подставим выражение для В из материального уравнения A.1.11) **) во второе уравнение Максвелла A.1.2), разделим обе его части на jj, и при- меним операцию rot. Это дает rot (—Ые)+~ТоШ = 0. A) Продифференцируем затем первое уравнение Максвелла A.1.1) по времени, используем уравнение для D A.1.10) и исключим rot H из системы двух урав- нений, содержащей получающееся уравнение и уравнение A). Тогда получим ^-E = 0. B) Если использовать тождества rot«v=« rot v + (grad u) Xv и rot rot == = grad div — Vs, то B) примет вид V3E —^ E + [grad (In Ц)] xrot E—grad div E = 0. C) Используя снова материальное уравнение для D и применяя тождество div и v = и div v -}- v-grad и, найдем из A.1.3) соотношение 8 div Е + Е grad е = 0. D) Следовательно, уравнение C) можно записать в виде VaE—^-Е + [grad (In ц)]хrot E +grad [Е-grad (Ins)] =0. (б) *) Современная теория поля допускает даже больший произвол, связанный с возмож- ностью добавлять к лагранжиану поля четырехмерную дивер!енцию. При этом допустимы другие выражения как для потока энергии, так и для плотности энергии. **) Здесь н далее при ссылках на формулы, приведенные в других параграфах, мы будем указывать также номер главы и номер параграфа. Например, ссылка па формулу E 3,13) озна- чает, что имеется в виду формула. A3), приведенная в § 3 гл, 5. (Прим, ред.)
§ 1.2| ВОЛНОВОР УРАВНЕНИЕ И СКОРОСТЬ СВЕТА > 83 Подобным же образом получается уравнение для Н V2H —-^ Н Ч- [grad (In e)J x rot H + grad (H • grad (In ц)] = 0. F) В частности, если среда однородна, то grad (In e) = grad (In ц.) = 0, и соот- ношения E) и F) принимают вид V2E —^-Ё = 0, V2H—^-Н = 0. G) Это обычные уравнения волнового движения. Они означают, что существуют электромагнитные волны, распространяющиеся со скоростью *) Впервые постоянная с была определена Р. Кольраушем и В. Вебером в 1856 г. из отношения значений емкости конденсатора, измеренных в электро- статических и электромагнитных единицах. Оказалось, что она совпадает со скоростью света в вакууме. Используя этот результат. Максвелл развил свою электромагнитную теорию света, предсказывающую существование электро- магнитных волн. Правильность его предсказания была подтверждена знамени- тыми экспериментами Г. Герца (см. «Историческое введение»). В любой волновой теории света элементарным процессом считают гармони- ческую волну в пространстве — времени (в простейшей форме она будет рас- смотрена в §§ 1.3 и 1.4). Если ее частота лежит в интервале от 4-10" сек~г до 7,5-1014 сек'1 (приблизительно), то она вызывает у человека физиологиче- ское ощущение определенного цвета. (Обратное, однако, неверно: окрашенный свет, вызывающий определенное субъективное цветовое ощущение, может быть совокупностью гармонических волн с весьма различными частотами.) Действительная связь между цветом и частотой очень сложна и не будет изу- чаться в настоящей книге **). Первое определение скорости света было сделано Рёмером в 1675 г. на основе наблюдений затмений первого спутника Юпитера; позднее другим спосо- бом (путем наблюдения аберрации неподвижных звезд) ее измерил Брэдли A728 г.) ***). Первые измерения скорости света с земными источниками были выпол- нены Физо в 1849 г. При таких измерениях необходимо использовать модуля- тор, который разбивает пучок на части ****). Для этой цели Физо применил вращающееся колесо. В более поздних измерениях применялись вращающиеся зеркала и электронные прерыватели. Метод вращающегося зеркала был пред- ложен Уитотоном в 1834 г. и его использовал Фуко в 1860 г. Позднее в течение многих лет Майкельсон систематически занимался усовершенствованием этого метода. Среднее значение с, полеченное примерно из 200 измерений Майкель- сона, равно 299 796 км!сек. Метод оптического прерывателя, использующий *) Понятие скорости электромагнитной волны имеет определенный смысл лишь в связи с волнами очень простого виду, например плоскими волнами. Очевидно, что v не являет- ся скоростью распространения в случае произвольного решения уравнений G), поскольку эти уравнения допускают также решения в виде стоячих волн. В настоящем вводном разделе предполагается, что читатель знаком с понятием плоской полны, и мы рассматриваем v как скорость се движения. Математическое представление пло- ской волны приведено в §§ 1.3 и 1.4. **) Однако в п. 4.8.1 будет кратко рассмотрена чувствительность глаза человека к различный цветам. ***) Методы, использовавшиеся для определения скорости света, описаны, например, в [8]. Подробный апалнз результатов, полученных различными методами, изложен также в (9]. *¦*•*) Такие измерения дают, по существу, i рупповую скорость (см и I 3.4) Различие между групповой и фазовой скоростями света в воздухе при обычных температуре и давлении примерно равно 1 : 50 000.
34 OCHOBHblF СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [гл. Т ячейку Керра, был развит Каролусом и Миттельштетом A928 г.), Андерсоном A937 г.) и Хюттелем A940 г.). Значения с, полученные из этих измерений, находятся в превосходном согласии с теми значениями, которые найдены не- прямыми методами, например путем определения отношения значений элек- трического заряда, измеренных в электростатических и электромагнитных единицах. Так, Роза и Дорсей A907 г.) нашли последним методом с = = 299 784 км/сек Измерения скорости электромагнитных волн в проволоках, выполненные Мерсье A923 г.), дали значение с, равное 299 782 км/сек. Ве- личина, полученная Бирджем [9] на основании тщательного анализа всех имею- щихся данных, равна с = 299 776 ± 4 км/сек. (9) Хорошее согласие значений с, полученных из столь различных экспериментов (причем в некоторых случаях использовалось излучение, частота которого в сотни тысяч раз отличалась от оп- тических частот), служит замечатель- * ным подтверждением теории Мак- свелла. Для прозрачных веществ диэлект- *}„?л рическая проницаемость е обычно боль- Р п ше единицы, a jx практически совпа- * ' дает с единицей, и следовательно, со- гласно (8), скорость v меньше скоро- сти в вакууме с. Это было впервые Франт падающей показано экспериментально для слу- ванны Валновж фронт щ /е, Рис. 1.3. Преломление плоской волны. чая распространения света в воде в. 1850 г, Фуко и Физо. Как правило, определяется несамо- значение v, а лишь его отношение к с; для этой цели используется закон преломления. Согласно закону преломления при падении плоской электромагнитной волны на плоскую границу, разделяю- щую две однородные среды, отношение синуса угла bL между нормалью *) к падающей волне и нормалью к поверхности к синусу угла 02 между нормалью к преломленной волне и нормалью к поверхности (рис. 1.3) постоянно и равно отношению скоростей распространения волн в двух средах vi и v2, т. е. Этот результат будет получен в § 1.5. Здесь мы отметим лишь, что он эквива- лентен следующему предположению: несмотря на изгиб на границе, волновой фронт остается непрерывным, так что линия пересечения падающей волны с гра- ницей движется с такой же скоростью (скажем, v'), как и линия пересечения преломленной волны с границей. Тогда у v, = »'sine1, ys = y'sin82. (И) Отсюда, если исключить v', следует A0). Это рассуждение в несколько более развернутой форме часто служит для иллюстрации построения Гюйгенса (см. § 3.3). Значение постоянного отношения A0) обычно обозначают символом гс12 и называют показателем преломления для преломления из первой среды во вторую. Мы определим также «абсолютный показатель преломлениям среды п *) Здесь и ниже термин нормаль к волне означает нормаль к волновому фронту этой. волиы. Однако для краткости мы б}дем всюду опускать слова «волновой фронг». (Прим. ред.}
§ КЗ] СКАЛЯРПЫР ВОЛНЫ 36 как показатель преломления из вакуума в эту среду, т. е. п — c/v. A2) Если nt и пг— абсолютные показатели преломления двух сред, то относитель- ный показатель преломления «12 для преломления из первой среды во вторую равен re12 = «2/«1=fi/y2. A3) Из сравнения A2) и (8) получим формулу Максвелла я = 1/"ё|Г A4) Для всех веществ, которыми мы будем заниматься, \i практически не отличается от единицы (немагнитные вещества), и поэтому показатель прелом- ления должен равняться квадратному корню из диэлектрической проницаемо- сти, которая, по предположению, является постоянной среды. Вместе с тем хо- рошо известны эксперименты с призмой, впервые выполненные Ньютоном, которые показывают, что показатель преломления зависит от цвета, т. е. от частоты света. Если мы хотим сохранить формулу Максвелла, то необходимо предположить, что е не является постоянной величиной, характеризующей сре- ду, а зависит от частоты поля. Зависимость е от частоты можно объяснить, лишь принимая во внимание атомную структуру вещества. Эта зависимость кратко будет рассмотрена в § 2.3. Формула Максвелла (с в — статической диэлектрической проницае- мостью) служит хорошим приближенным выражением, например, для газов с простой химической структурой, в которых не происходит существенной дисперсии света, т. е. для веществ с оптическими свойствами, слабо зависящими от цвета света. В табл. 1.1 приведены результаты некоторых ранних измерений Таблица 1.1 Таблица 1.2 Воздух Водород На . . . . Двуокись углерода СОг Окись углерода СО п (желтый цвет) 1,000294 1,000138 1,000449 1,000340 YT 1,000295 1,000132 1,000473 1,000345 Метиловый спирт СН3ОН Этиловый спирт С Н5ОН Вода Н2О . п (желтый Цвет) 1,34 1,36 1,33 VT 5,7 5,0 9,0 для таких газов, выполненные Л Больцманом [10] Формула A4) представляет собой хорошее приближенное выражение и для жидких углеводородов, на- пример, у бензола СъНв п = 1,482 для желтого света, а 1/1 = 1,489. Вместе с тем для многих твердых тел (например, стекол) и для ряда жид- костей наблюдается сильное отклонение от формулы A4) (табл. 1.2). § 1.3. Скалярные волны В однородной среде в областях, свободных от токов и зарядов, каждая из декартовых компонент V (г, t) векторов поля удовлетворяет, согласно A.2.7), однородному волновому уравнению Ниже мы кратко исследуем простейшее решение этого уравнения.
36 ochcbhhf свойства электромагнитного поля 1гл. 1.3.1. Плоские волны. Пусть т (х, у, г) — радиус-вектор точки Р, а $(sx,sy,sz)—единичный вектор с фиксированным направлением. Говорят, что любое решение уравнения A) вида V = F(r-s, 0 B) Представляет плоскую волну, так как в каждый момент времени величина V постоянна в плоскостях г- s = const, которые перпендикулярны к единичному вектору s. Удобно выбрать новое положение декартовых осей 0|, От), О? так, что- бы ось O'Q была направлена по s. Тогда 14) (рис. 1.4) C) a dx x <?^ * ду у dt, * д д Рис. 1 4 Распространение пло- ской ВСУШЫ Отсюда легко получить и, следовательно, волновое уравнение A) запишется в таком виде д'С? Если мы положим то E) примет вид dpdq = 0. D) E) F) G) S\O.e Vi и У2— произвольные функции. Мы видим, что аргумент функции Vi не изменяется при замене (?, ^) на {5 + vz, i + t), где т произвольно Следовательно, Vj представляет возмуще- ние, которое распространяется со скоростью и в положшольном направлении оси Z,. Аналогично V2{t, + vi) — это возмещение, распространяющееся со ско- ростью v в отрицательном направлении оси ?. 1.3.2. Сферические волны. Теперь рассмотрим решения, представляющие сферические волны, т. е. решения вида V = V(r,t), (9) Общим решением этого уравнения служит ! тде г = |r| = K^2 + i/2 + .?a- Используя соотношения непосредственным расчетом найдем дг д ~"дхдг'' х д следовательно, волновое уравнение A) примет вид A0) (И)
§ 1.3] СКАЛЯРНЫЕ ВОЛНЫ 37 Это уравнение совпадает с E), если в последнем заменить Z, на г и Vна rV. Следовательно, решение уравнения A1) можно сразу же записать в виде (8), т. с. ... ,, V^r-vt) Vyjr+ot) ,,9, у— т i 'г • 1 ' где Vi и V2— по-прежнему произвольные функции. В правой части равенства A2) первый член представляет сферическую волну, расходящуюся от начала координат, второй — сферическую волну, сходящуюся к началу координат, причем скорость распространения обеих волн равна у. 1.3.3. Гармонические воины. Фазовая скорость. В точке г„ пространства возмущение, вызнанное вечной, зависит только от времени, т. е. Ич приведенных замечаний о цвете очевидно, что особый интерес представляет периодическая функция Г. Поэтому рассмотрим случай, когда F имеет вид F(t)-acos(a>t + 8). . A4) Величина а(>0) называется амплитудой, а аргумент косинуса (a>t + б) — фазой. Величина v_JL==± П5) 2я Г У } называется частотой и представляет число колебаний в секунду. Величина «> называется угловой (или циклической) частотои и дает число колебаний в 2я се- кунд При замене t на t -f- T значение функции F остается неизменным, поэтому Г является периодом колебаний. Волновые функции (т. е. решения волнового уравнения) в форме A4) называют гармоническими относительно времени. Рассмотрим вначале волновую функцию, которая представляет гармони- ческую плккую волну, распространяющеюся в направлении, заданном единич- ным вектором s. Согласно п. 1.3.1 она получается при замене в формуле A4) t ка t— (r-s)/ti, т. е. [(^!) ] A6) Уравнение A6) не изменится, если r-s заменить на r-s + "К, где я = 0^.=рг. . A7); Длина X называется длиной волны. Полезно также определить приведенную длину волны Яо Х0=сТ = п\. A8) Эта длина волны соответствует распространяющейся в вакууме гармонической волне той же частоты В спектроскопии пользуются также понятием волнового числа *) к, которое определяется как число длин волн в вакууме, приходящееся на единицу длины (см) л0 с Удобно также ввести векторы к„ и к, направления которых совпадают с направлением распространения s, а длины соответственно равны ?о = 2як = 2яДо=<о/с B0) и k = nkB = 2яД = па/с = (o/ti. B1) Вектор k = ?s называется волновым вектором или вектором распространения в среде, а к,,=/e,,s—соответствующим вектором для вакуума. *) Мы будем называть к «спектроскопическим волновым числом», а термин «волновое число» оставим для k^ или к, определяемых равенствами B0) и B1), как это принято в оптике.
38 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ 1 Вместо постоянной б применяют также понятие длины пути I, представляю- щей собой расстояние, на которое удаляется волновой фронт при увеличении фазы на S, т. е. /=^_б = ^-б = -^-б. B2) Рассмотрим теперь гармонические волны более сложной формы. В общем случае вещественную гармоническую скалярную волну с частотой со можно определить как вещественное решение волнового уравнения вида V{r,t)=a(r)cos[<ot—g(r)], B3) где а(> 0) и g— вещественные скалярные функции положения. Поверхности g (г) = const B4) называют поверхностями постоянной фазы, или волновыми поверхностями. В отличие от предыдущего случая, поверхности постоянной амплитуды волны B3), вообще говоря, не совпадают с поверхностями постоянной фазы. Говорят, что такая волна неоднородна. Расчеты, связанные с гармоническими волнами, упрощаются, если исполь- зовать экспоненциальные функции вместо тригонометрических. Уравнение B3) можно записать в виде V(r, O = Re{t/(r)exp[—мо*]}, B5) где ?/(r) = a(r)exp[;g(rj], B6) а символ Re означает, что берется вещественная часть. Подставляя B6) в вол- новое уравнение A), мы найдем, что U должно удовлетворять уравнению V2t/ 4- n2klU = 0. B7) Величину U называют комплексной амплитудой волны. В частности, для пло- ской волны имеем *) (^N = ?(r-s)-6 = k-r—б. B8) Если операции, производимые над V, линейны, то в выражении B5) можно опустить символ Re и оперировать прямо с комплексной функцией. При этом вещественная часть окончательного выражения будет представлять изучаем) ю физическую величину. Однако если приходится иметь дело с нелинейными опе- рациями, такими, как возведение в квадрат и т. д. (например, при расчетах плотности электрической или магнитной энергии), то, вообще говоря, необхо- димо взять действительные части и оперировать только с ними **). В отличие от плоской гармонической волны, волна более общего вида B5) не периодична в пространстве. Однако фаза со* — g (г) одинакова для (г, *) и (г + dr, t + df) при условии, что <s>dt— (gradg)-dr=^O. B9) Обозначив через q единичный вектор в направлении йт и написав dr = q db, найдем отсюда — -—^— " dt q grad^- . Эта величина минимальна, когда вектор q перпендикулярен к поверхности по- *) В случае плоских волн часто выделяют постоянный множитель ехр(—1Й) и называют комплексной амплитудой только переменную часть иехр(гк-г). *•) Это не обязательно, когда нас интересует лишь среднее по времени от квадратичного выражения (см. уравнения A.4.54) — A.4 оЬ)}. \
§ 1.3] СКАЛЯРНЫЕ ВОЛНЫ 39 стоянной фазы, т. е. когда q = (grad g)/|grad g\, причем тогда значение C0) •будет равно Величина и'*" (r) называется фазовой скоростью и равна скорости, с которой распространяется каждая поверхность постоянной фазы. Для плоской электро- магнитной волны из B8) найдем grad g = k и, учитывая B1), получим t)V" - м/А = с/У в|х. Для волн более сложной формы, фазовая скорость v'p) в общем случае отличается от с\Ущ и меняется от точки к точке даже в одно- родной среде. Однако ниже (см. п. 3.1.2) мы увидим, что при достаточно большой частоте фазовая скорость приблизительно равна отношению с/к Щ даже для волн, у которых поверхности постоянной фазы не являются плос- кими. Необходимо отметить, что выражение C0) для dsldt не является компо- вентой фазовой скорости в направлении q, т. е. фазовая скорость не ведет себя, как вектор. С другой стороны, величина, обратная ей, т. е. величина *g»dg C2) ds ш ' как видно из этого выражения, есть компонента вектора (grad g)/<a в направ- лении q В определенных случаях фазовая скорость может превышать с. Для плоских воли это осуществляется, когда п = У ец меньше единицы, как в слу- чае диспергирующих сред в областях так называемой аномальной дисперсии *) (см. и. 2.3 4). Согласно теории относительности сигналы не могут распростра- няться со скоростью, превышающей с. Это означает, что фазовая скорость не может соответствовать скорости распространения сигнала. В самом деле, легко видеть, что фазовую скорость нельзя определить экспериментально, и поэтому следует считать ее лшиенной какого-либо прямого физического смысла. Для измерения фазовой скорости необходимо было бы сделать отметку на бесконеч- ной гладкой волне и измерить скорость этой отметки, что, однако, означало бы замену бесконечной гармонической волны другой функцией координат и вре- мени. 1.3.4. Волновые пакеты. Групповая скорость. Монохроматические волны,- рассматриваемые в предыдущем разделе,— это идеализация, никогда строго не реализующаяся на практике. Из теоремы Фурье следует, что любую волну V (г, /) (если она удовлетворяет определенным, очень общим условиям) можно рассматривать как суперпозицию монохроматических волн разных частот, а именно V(r, t)=\aa(г)cos И—gm(r)] di0- C3) о Здесь снова удобно воспользоваться комплексным представлением, в котором V отождествляется с вещественной частью соответствующей комплексной волны **) V(r, 0 = Re $ аш (г) ехр {— i [cat—?M(r)]}cto. C3a) D •) Проблема распространения электромагнитных сигналов в диспергирующих средах -очень подробно исследовалась в работах Зоммерфельда [11] и Бриллюэна \\'Л Английский пере- еод этик статен включен в [13] (см также [14]) **) Комплексное предстаолении вещественных полихроматических волн более полно изложено в § 10.2.
40 OCHOBHbTF СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ. Т Если фурье-амплитуды ал заметно отличаются от нуля лишь внутри узкого интервала вблизи средней частоты со, то волну можно назвать «почти монохроматической». В этом случае мы обычно говорим о волновой группе, или волновом пакете *). Для иллюстрации некоторых основных свойств волновой группы рас- смотрим вначале волну, которая распространяется вдоль оси г и образована в результате суперпозиции двух плоских монохроматических волн с одинако- выми амплитудами и слегка различными частотами и волновыми числами. V(z, t) =а ехр [—t" (at — Щ + а ехр {— i [(ю + бю) t — (k + 6k) г]}. C4) В соответствии с принятым ранее соглашением символ Re здесь опущен. Урав- нение C4) можно записать в форме V(z, t)-aUxp [~i(t8u> — гЩ j+expf— i-i(<8M- zbk)] lx Xexp [— I (mt —kz)] = 2a cos \j (/6co— г8*)| ехр [— i (at —kz)], C5) ' где ш = ш + у6ш, ?=fc+-ifi# C6) ¦— средняя частота и среднее волновое число соответственно. Можно считать что выражение C5) описывает плоскую волну с частотой ш и длиной волны 2nlk, распространяющуюся в направлении оси г. Однако амплитуда эгой волны не постоянна, а изменяется во времени и пространстве от нуля до значения 2а аТК Л АЛА Л Л А Л А А ,А Рис. 1.5. Простая волновая группа. А —волна acosfwi —й): В—волна 2а «га — («га —гв*) I; В —волновая группа 2a cos -—(tia—zbk) IX Xcos (co?—ftz). Абсцисса представляет одну из дкух независимых переменных it пли г), тогда как другая сохраняется постоянной (рис. 1.5), что вызывает хорошо известное явление биений. Соседние максимумы функции, описывающей амплитуду, находятся на расстояниях 6^ = g^j- при фиксированном г ' или } C7) Sz = -t?- при фиксированном t. *) Строго говоря, для того чтобы функция V обладала свойствами, которые обычно приписывают волновой группе, необходимо также предположить, что во всем эффективном ин- тервале частот фазовую функцию gm можно аппроксимировать линейной функцией »,
§ t.3) Смлярньп7 волны 41 а максимумы функции, связанной с фазой,— на расстояниях Ы=^^- при фиксированном г (О или бг = -=т- при фиксированном t. Следовательно, поскольку считается, что бсо/со и bklk малы по сравнению с единицей, амплитуда будет меняться медленно по сравнению с изменением другого члена Из C5) вытекает, что плоскости постоянной амплитуды и, в частности', максимумы амплитуды расдространяются со скоростью 0<*)==Ж' C9) тогда как плоскости постоянной фазы распространяются со скоростью у</>> = ot)/k. D0)' Величина v1^ называется групповой скоростью волны. Поскольку V удовле- творяет волновому уравнению, частота со и волновое число k связаны друг с другом, в среде с показателем преломления п (см. B1)) fe — n (со) со/с; D1) здесь показатель преломления п зависит от со. Уравнение D1) выражает дис- персию волны. В недиспергирующей среде п не зависит от со; в такой среде и фазовая скорость v(p\ и групповая скорость о(«> равны с/п. Однако в дис- пергирующей среде эти аде скорости в общем случае различны. Так как, по предположению, бсо мало, бсо'6^ можно заменить дифферен- циальным соотношением dco/dk; тогда выражение для групповой скорости запишется в виде 0<г> = — ф D2) Мы покажем, что фактически это соотношение выполняется при более общих условиях. Рассмотрим одномерную волновую группу V(z, t)~ J ашехр[—i(at—kz)] da, D3) (Ли) где Дсо означает небольшой интервал вблизи средней частоты со (Дсо/со <* 1), в котором аа заметно отличается от нуля. Пусть k = n (S) сп/с — соответствую- щее волновое число. Тогда последнее соотношение можно переписать с форме V(z, t) = A(z, /)exp [—-i(&l—kz)], D4)- где А B,0= J Я-щ^хр!—i [(w—<»)* — (k—k)z]}dw~ (Aw) если Дсо достаточно мало. Снова V можно интерпретировать как плоскую волну с переменной амплитудой, частотой со и волновым числом k, распро- страняющ\юся в направлении г. Амплитуда А (г, t) представляет суперпози- цию гармонических волн с частотами ш — си. Так как Аса/5 мало по сравнению с единицей, А медленно меняется по сравнению с изменением второго члена. В общем случае А комплексно и дает вклад (arg/lj в фазу оЗ?— кг. Как мы
-42 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ. t -Видим, поверхности Ч?).-« D6) играют особую роль: на каждой такой поверхности А (г, t) постоянно. Следо- вательно, скорость перемещения какого-либо значения А, а также максимума \А\ определяется, как и раньше, групповой скоростью Легко показать справедливость следующих соотношений между групповой и фазовой скоростями: *? „<,,_^ , D8) причем все величины здесь относятся к средней частоте ш. Наконец, рассмотрим трехмерную группу общего вида V(r, O-Re J aw(r)exp{—»K—gm(r)]}dce. D9) D3) выделим член, соответствующий средней частоте ш, и для лых Дсо напишем V(г, 0 = 4 (г, t) ехр {-» Й-?5 (г)]}, E0) где А (г, t)= J аш (г) ехр (— i (Дш) ^ ' ^ ^ / ю J I / Выражение E0) представляет волну с частотой <о, амплитуда которой А (г, i) (обычно комплексная) меняется и в пространстве, и во времени, причем ее изменение также медленно по сравнению с изменением второго члена. Можно •ожидать, по аналогии с D6), что поверхность будет играть особую роль. Однако теперь амплитудная функция А не обя- зательно постоянна на каждой такой поверхности, так как здесь фурье-ампли- туды ат зависят не только от частоты, но и от положения. Значение поверх- ности, описываемой E2), станет ясным, если мы будем рассматривать абсо- лютную величину амплитуды М = \А\. Имеем 7И2 (г, t) = A (г, t) ¦ А* (г, t) = = 5 \ йш(г)аа>-(г)ехр/-1(со-й)') [f-.№2)_1 Idaxto'. E3) (Ди) (Дм) ' ' L V /<0J ' Очевидно, что мнимая часть двойного интеграла равна нулю, так как вели- чина М2 вещественна. (Формально в этом легко убедиться, если поменять местами независимые переменные и и со' и заметить, что при этом мнимая часть .подынтегрального выражения меняет знак.) Следовательно, (r)cos{(co — со') \t~ {ЦЩЛХйиЛа'. E4) Рассматривая какую-нибудь определенную точку г = г0 и вспоминая, что аю либо положительно, либо равно нулю, мы видим, что Мг (г„, t) достигает максимального значения, когда аргумент косинуса равен нулю, т. е. когда 4 = ( 'fa, J- • Таким образом, соотношение E2) представляет поверхности.
5 1.4] ВЕКТОРНЫР ВОЛНЫ 43 на которых в момент времени t абсолютное значение амплитуды максимально в указанном выше смысле. Поэтому в общем случае разумно определить груп- повую скорость трехмерной волновой группы как скорость, с которой пере- мещаются эти поверхности. Рассмотрим малое смешение dr = q ds, где q — единичный вектор в направлении нормали к поверхности. Согласно E2) соот- ветствующее изменение 6t определяется выражением grad^^J^j, E5) и, следовательно, в общем случае групповая скорость трехмерной группы равна 1 E6) Это выражение нужно сравнивать с выражением для фазовой скорости гармо- нической волны общего вида C1), т. е. с В частном случае распространения группы плоских волн в направлении г имеем ?,„== кг, и E6) переходит в D7) Как ясно из предыдущего, эффективный интервал частот Дш представляет собой важный параметр, относящийся к волновой группе; по существу эта величина определяет скорость изменения амплитуды и фазы. Если дисперсия среды невелика, волновая группа проходит значительное расстояние без за- метного «размытия» При таких обстоятельствах групповая скорость, которую можно считать скоростью распространения группы как целого, является так- же скоростью распространения энергии (см., например, 115, 16]). Однако в об- щем случае это неверно. В частности, в области аномальной дисперсии (см. п. 2.3.4) групповая скорость может превысить скорость света или стать отрица- тельной; в таких случаях она уже не имеет физического смысла. § 1.4. Векторные волны 1.4.1. Электромагнитная плоская волна общего вида. Простейшим электро- магнитным полем является поле плоской волны. В этом случае, согласно п. 1 3 1, каждая из компонент векторов поля, а следовательно, и векторы Е и Н зависят лишь от переменной и = r-s— vt, т. е. E = E(rs--^), H=H(r-s—vt), A) здесь s, как и раньше, единичный вектор в направлении распространения. Обозначим точкой дифференцирование по t и штрихом дифференциро- вание по переменной и. Тогда B) Подставляя эти выражения в уравнения Максвелла A.1.1) и A.1.2) с j —& и используя материальные уравнения A.1.10) и A.1.11), получим sxH'+ — E' = 0, sxE' -Н' = 0. C) Полагая постоянную интегрирования равной нулю (т. е. пренебрегая постоян- ным полем во всем пространстве) и, как и раньше, считая v/c= l/j/"ej*, получим после интегрировании соотношения C) D)
44 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ 1 Скалярное умножение на s дает E-s = Hs = 0. E> Это соотношение выражает «поперечность» поля, т. е. оно показывает, что электрический и магнитный векторы лежат в плоскостях, перпендикулярных к направлению распространения. Из соотношений D) и E) вытекает, что Е, Н и s образ\ ют правую ортогональную систему векторов. Из равенств D) следует также, что УцН = УЁЕ, F) где ?=-|Е!, Н ~ |Н|. Рассмотрим количество энергии, которое протекает в единицу времени через элемент площади, перпендикулярный направлению распространения. Вообразим цилиндр, ось которого параллельна s, а площадь поперечного сечения равна единице. Тогда количество энергии, которое протекает через основание цилиндра в единицу времени, равно энергии, содержащейся в части цилиндра длиной v. Следовательно, поток энергии равен vw. где w — плот- ность энергии. Согласно F), а также A.1.31) плотность энергии определяется выражением С другой стороны, вектор Пойнтинга, в соответствии с A.1.38), равен Сравнивая выражения G) и (8), получим S = - ws — вш. (9) Мы видим, что, в согласии с п. 1.1.4, вектор Пойнтинга представляет собой поток энергии и по величине, и по направлению распространения. 1.4.2. Гармоническая электромагнитная плоская волна. Особый интерес представляет случай плоской волны гармонической во времени, т. е. случай, когда каждая из декартовых компонент векторов Е и Н имеет вид a cos (т -f- б) = Re {а ехр [—i(t + S)]} (a>0). A0) Здесь т обозначает переменную часть фазового мнажителя, т. е. -.Ш — kr. (II). Выберем ось г в направлении s. Тогда отличными от нуля будут лишь х- и (/-компоненты Е и Н, поскольку, в соответствии с E), поле поперечно. Ниже мы рассмотрим характер кривой, которую описывает конец электри- ческого вектора в произвольной точке пространства. Эта кривая является геометрическим местом точек, координаты которых {Ех, Еу) равны а. Эллиптическая поляризация Для того чтобы исключить % из первых, двух уравнений A2), перепишем их в виде Еж/а, = cos т cos 6a—sin т sin б,, ?у/д2 = cos т cos 62—sin т. sin 62. A3). Следовательно, -^sinS2—— sin 61== cost sin (fi3—8j), I -^cos62—-?¦ cos 6Л = sin т sin FZ—6j). I I
I.4J BEKTOPHHF ПОЛНЫ 45 Возводя з квадрат и складывая, получим /Е \2 ЕЕ где б =-6,-6,. A6) Соотношение A5) является уравнением конического сечения. Оно имеет форму эллипса, так как соответствующий детер- минант неотрицателен, т. е. 1 cos 6 cos 8 1 aja3 ып~- 6 3*0. Этот эллипс вписан в прямоугольник, сто- роны которого параллельны осям коорди- нат и имеют длины 2а, и 2а2 (рис 1.6). Эллипс касается сторон прямоугольника в точках C+fli, ±а2 соь 6) и (+ai cos б, +а2). В этом случае говорят, что волна, описываемая A2), эллиптически поляри- зована. Легко видеть, что волна, связанная с магнитным вектором, также поляризована эллиптически. Из D) и A2) следует Рис. 1.6. Эллиптически поляризован ная волна Эллипс сош истствующий колебанию электрического вектора Ну = j 0 Ех = . ax cos (т + 6J, A7) Конец магнитного вектора описывает эллипс, который вписан в прямоугольник ¦со сторонами длиной 2 |/"в/ц а2 и гКе/цйц параллельными осям ^ и г/. 'В общем случае оси эллипса не параллельны осям Ох и Ог/. Пусть Ос, и От) —¦ новые оси, направленные по осям эллипса, а ф @ §; ф < п) — угол между Ох и направлением главной оси 0| (см. рис. 1.6). Тогда компоненты Ef и ?,, будут связаны с ?'ж и ?? соотношениями ?Е = Ех cos if + ?j, sin if, ?, = —?xsini|5 + ?ycosi|5. A8) Если 2а и 26 (a ^ fe) — длины осей эллипса, то уравнение эллипса относительно осей Og, Or) будет иметь вид ?? = acos(T + 80), ?, = ±bsm(T+S0). A9) Наличие двух знаков указывает на возможность двух направлений движения конца электрического вектора, описывающего эллипс. Чтобы определить а и Ь, сравним A8) и A9) и используем A3); тогда a (cos т cos 60 — sin т sin ё„) = = аг (cost cos 6l — sin т sin 6J cos if -+- a3 (cos т cos 82 — sin т sin 62) sin if, + b (sin т cos а„ + cos т sin 60) = = —aa (cost cos §!—sinTSin6j) sin^f + a2 (соь тcosfi2 — sinт sin 6a)cosaf. Приравнивая коэффициенты дри cos тг и sin т, получим a cos ао = ax cos 6, cos я|з -;- a., cos б2 s t n if, B0a) a sin 60 = аг sin 64 cos if -j- a2 sin 62 sin if, B06) + 6cos 80 —a, sine, sin^—a2sin62cosif, B1a) ± 6 sin 60 = — ax cos 6t sin if -j- a2 cos 6a cos if. B16)
46 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ |ГЛ t Возводя в квадрат, складывая B0а) и B06) и используя A6), находим а- — а\ cos3 т|/ + а% .sm2 ty 4- 2а1аг cos -ф sin -ф cos 6, \ аналогично из B1а) и B16) имеем \ B2> Ь2 = а\ sin21|з + а\ cos2 if—га^а cos i|j sin -ф cos S. J Следовательно, а2 + Ь* = а1 + а1 B3) Умножим теперь B0а) на B1а), B06) на B16) и сложим. Это даст ±ab = aia,.sin6. B4) Деля B1а) на B0а) и B16) на B06), получим Ь ах sin бх sin ф - a sin б2 cos \\, — а, cos 6t sm \|) + а„ cos 8а cos i|> ¦*" a «! cos bt cos i|)-p a3 cos 62 sln Ф ai sm fii cos \f -t- a2 sm 6. sm \p ' Отсюда находим следующее уравнение для i|r (fli — а%) sin 2i(i = 2ala2 cos 6 cos 2я|5 Удобно ввеЬти такой вспомогательный угол a @ ^ a ^ я/2), чтобы 0,/д, == tg a. B5> Тогда предыдущее уравнение примет вид tg 2ф = -^Ц. cos б = -?*?«_ cos б, 6 т о?—at I —tg^a т. е. tg2^ = (tg2a)cos6. B6) Из B3) и B4) мы найдем также <27> Пусть х (—я/4 ^ X ^ "/4) — другой вспомогательный угол, такой что dzb/a^tgx- B8) Численное значение tg x определяет величину отношения осей эллипса, а знак при х характеризует два варианта, которые можно использовать при описании эллипса. Перепишем уравнение B7) в виде ) sm6, B9) Полезно кратко просуммировать результаты Если заданы аи д2 и раз- ность фаз б, относящиеся к произвольному положению осей, и если а @ ^ ^ а ^ я/2) — угол, определяемый соотношением tgtt = а2/о„ C0) то главные полуоси эллипса аи b и угол яр @ <; -ф < л), который большая ось образует с осью Ох, находятся из формул C1а) tg2ip-(tg2a)cos6, C16) sin 2х = (sin 2a) sin б, C1в) где- % (—я/4 < X ^ я/4) — вспомогательный угол, определяющий форму и ориентацию эллипса колебаний, а именно* ±*>/a. C2> Наоборот, если известны длины осей аи b и ориентация эллипса (т е заданы a, b и i|>), то эти форм\лы позволяют найти амплитуды а!, а2 и разность фаз 6.
§ 1.4] ВЕКТОРНЫЕ ВОЛНЫ 47 В гл. 14 будут описаны устройства, которые дают возможность определять эти величины прямым способом. Прежде чем перейти к обсуждению некоторых важных специальных случаев, необходимо сказать несколько слов о терминологии. Мы различаем, две поляризации в соответствии с направлением, в котором конец электричес- кого вектора описывает эллипс. По-видимому, естественно было бы называть, поляризацию правой или левой в соответствии с тем, образует ли вращение Е н направление распространения правый или левый винт. Однако принята пря- мо противоположная терминология: она основана на картине поведения век- тора Е, когда его движение «рассматривается» наблюдателем со стороны по- ложительного направления движения. В настоящей книге мы будем следовать именно такому определению. Итак, будем называть поляризацию правой, когда наблюдателю, смотрящему навстречу световому лучу, кажется, что конец электрического вектора описывает эллипс, двигаясь по часовой стрелке. Если для этого случая мы найдем значения величин A2) для двух моментов времени, отличающихся на четверть периода, то увидим, что sin б > 0, или, согласно B9), 0 < х < я/4. Для левой поляризации справедливо обратное, т. е. наблю- дателю, смотрящему навстречу световому лучу, кажется, что электрический вектор описывает эллипс, двигаясь против часовой стрелки. В этом случае sin б < 0, так что — л/4 sj; % < 0. По причинам исторического характера, направление магнитного вектора часто называют направлением поляризации, а плоскость, в которой лежат магнитный вектор и направление распространения,— плоскостью поляриза- ции. Однако такая терминология совсем не общепринята; некоторые авторы определяют эти величины не относительно магнитного, а относительно элек- трического вектора. Нарушение единообразия возникает частично из-за от- сутствия одного-единственного физического понятия, которое можно было бы однозначно считать «световым вектором». Когда особое внимание уделяется физическому действию векторов поля, действительно имеются некоторые ос- нования считать световым вектором вектор Е. В самом деле, любое действие есть следствие движения элементарных заряженных частиц (электронов, ядер), приведенных в движение электромагнитным полем. В этом случае механи- ческая сила F, действующая на частицу со стороны поля, определяется законом. Лорентца (см. A.1.34)) где е — заряд, v — скорость частицы. Следовательно, электрический вектор- будет действовать даже на покоящуюся частицу. Вместе с тем магнитный вектор влияет лишь на движущуюся частицу. Однако обычно vfc очень мало по сравнению с единицей, и этим эффектом часто можно пренебречь. Тем не менее «направление поляризации» и «плоскость поляризации», как правило, связывают с магнитным вектором. Причина выбора такой терминологии станет ясной в следующем разделе при рассмотрении поляризации при отражении. Чтобы избежать путаницы, мы, в соответствии с практикой последнего времени, ие будем пользоваться терминами «направление поляризации» или «плоскость поляризации», а будем говорить о направлении колебаний и плоско- сти колебаний, чтобы указать направление вектора поля и плоскость, содер- жащую вектор поля и направление распространения, причем в каждом случае будем оговаривать, о каком именно векторе идет речь. б. Линейная и. круговая поляризации. Наиболее важны два специальных. случая, когда эллипс поляризации вырождается либо в прямую, либо в окруж- ность. Согласно A2) эллипс перейдет в прямую при б = 6а—\ = тп (/п = 0, ±1, ±2, ...). C3)
48 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ* 1 Тогда чх а, и мы говорим о линейной поляризации *) Е. Одну из координатных осей, на- пример х, можно выбрать вдоль эт i up пюй Тома остается лишь одна ком- понента, а именно Ех. Более того, поскольку электрический и магнитный век- торы ортогональны и лежат в плоскости, перпендикулярной к направлению г, компонента Пх тоже исчезает, и, следовательно, вектор Н линейно поляризо- ван в направлении у. Другой важный специальный случай — случай круговой поляризации волны, когда эллипс вырождается в круг. Ясно, что необходимое условие этого заключается в превращении описанного прямоугольника в квадрат, т. е. а2=а2 = а. C5) Кроме того, одна из компонент вектора Е должна равняться нулю, когда дру- гая достигает максимального значения; отсюда следует, что 6 = 6,-6,-™ (то--±1, ±3, ±5, ...) C6) и уравнение A5) переходит в уравнение окружности ЗЫ-?• = <!«. C7) В случае правой поляризации sin 6 > 0, так что +2тя (т = 0, ±1, ±2, ...), C8) + 6j + |-W — a sm (х + б,). C9) Для-'ЛеваЦ. поляризации sin 8 < 0, так что  = — у+2тя (т = 0, ±1, ±2, ...), D0) [ Ех = a cos (т + б Д, ?y = acos^T+6, — ^j=asm{x + bx). D1) Если вместо вещественного представления используется комплексное .¦(т. е. если вместо косинусов в A2) написаны экспоненциальные функции), то |? = .?exp[*(8f-81)]=|ie", D2) и из значения этого отношения сразу же можно определить характер поляри- зации. а) Линейная поляризация электрической волны (б = тп, т — 0 ±1 ±2, ...) Ь— (_iv»?l ?х-^ '^ a, \ б) Правая круговая поляризация электрической волны **) (aj= о2, й = я/2) ^- = ехр (г'я/2) = «. в) Лееая круговая поляризация электрической волны (ах— а2, 6 = —я/2) Еу р~ = ехр (—гя/2) = —I. *) Употребляется также менее подходящий термин плоская поляризация. **) Правая по традиционной, а ве по естественной терминологии.
'§ 1-4] ВЕКТОРНЫЕ ВОЛНЫ 0<S<f В более общем случае можно показать, что для правой эллиптической поляризации мнимая часть отношения ЕУ1ЕХ положительна, тогда как для левой эллиптической поляризации она отрицательна. На рис. 1.7 показаны эллипсы поляризации при разных значениях б. в. Характеристика состояния поляризации с помощью параметров Стокса. Для характеристики эллипса поляризации необходимы три независимые величины, например амплитуды fli и аг и разность фаз 5 или ма- лая и большая оси а, Ь и угол %', характеризующий ориентацию эллипса. Для практических це- лей состояние поляризации удоб- но охарактеризовать некоторы- ми параметрами, обладающими одинаковой физической размер- ностью; они были введены Сток- д = л я<&<— д=-22- —-zd<:2it сом в 1852 г. при его исследо- г г 2 ваниях частично поляризован- Рис- 1-7. Эллиптическая поляризация при различ- ного света. В общем виде мы иых значениях разности фаз 6. определим их позднее (см. п. 10.8 3). Там мы покажем также, что для любой заданной волны эти пара- метры можно определить из простых экспериментов. Параметрами Стокса для плоской монохроматической волны служат четыре величины: s0 = oj-f-a|, s1 = af—a%, s8 = 2a,aa cos 6, s3 = 2a,a3sin8. D3) Лишь три из них независимы, так как справедливо тождество с^ _- о2 | ^2 | с2 /44^ Очевидно, что параметр s0 пропорционален интенсивности волны. Пара- метры Si, S2 и Ss простым образом связаны с углом г|) @ <; \|з <; п), характери- г злющим ориентацию эллипса, и углом % {—л/4 <; % <! it/4), характеризующим эл- липтичность и направление вращения. Вы- полняются следующие соотношения: Sj = s0 cos 2% cos 2я|), D5а) s2 = s0 cos 2% sin 2ip, D56) s3 = s0 sin 2%. D5b) У Выражение D5в) следует из B5) и B9). Для вывода двух других соотношений заметим, что, согласно уравнению, предшествующе- му B6), s2 = s1tg2ap.1 D6) Соотношение D5а) получается, если выраже- п , о п ния D6) и D5в) подставить в D4). Наконец, Рис 1 8 Представление состояния по- ,, __Л v ,,r- ^ /,^7 ляризации монохроматической волны D56) получается при подстановке D5а) в D6). по Пуанкаре (сфера Пуанкаре). Выражения D5) указывают простое геометрическое представление различных состояний поляризации: slt s2 и s» можно рассматривать ' как декартовы координаты точки Р на сфере 2 радиуса s,,, причем 2/ и 2iJ> являются сфериче- скими угловыми координатами этой точки (рис. 1.8). Таким образом, каждому возможному состоянию поляризации плоской монохроматической волны заданной интенсивности (&а — const) соответствует одна точка на сфере 2 и наоборот. Так как угол % положителен или отрицателен в зависимости от того, имеем ли
50 ОСНОВНЫЙ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ. 1 мы дело с правой или левой поляризацией, то из D5в) следует, что правая поляризация представляется точками на 2, лежащими выше экваториальной плоскости (плоскости ху), а левая — точками на 2, лежащими ниже этой пло- скости. Далее, для линейно поляризованного света разность фаз равна нулю или целому кратному я; согласно D3) параметр Стокса s3 равен тогда нулю, так что линейная поляризация представляется точками на экваториальной плоскости. Для круговой поляризации ах= а2 и б — я/2 или б = -—я/2 в со- ответствии с тем, имеем ли мы дело с правой или левой поляризацией. Следо- вательно, правая круговая поляризация представляется северным полюсом (^=52=0, s3= so), а левая поляризация—южным полюсом (s,— s2= 0, ss= —So). Такое геометрическое представление различных состояний поляри- зации точками на сфере было предложено Пуанкаре [17]. Оно чрезвычайно полезно в кристаллооптике для определения влияния кристаллических сред па состояние поляризации проходящего через них света *). Сфера 2 называется сферой Пуанкаре. 1.4.3. Гармонические векторные волны произвольной формы. Основные ре- зультаты предыдущих разделов легко' распространить на гармонические волны более сложной формы. Вещественная гармоническая векторная волна общего вида V (г, /) яв- ляется решением векторного волнового уравнения. Проекции V на оси коор- динат Vx, Vy, Vz представляются выражениями вида A.3.23), т. е. Vx(r, 0 = 'Ч (г) cos [©/—A (r)J, ) Vy(T,f) = al{r)cos[*t—gtir)\, \ D7) Vz(r, /) = a,(r)cos[(a/-g,(r)], J где as и gs (s = 1, 2, 3) — вещественные функции координат. Для плоской гармонической волны, рассмотренной в предыдущем разделе, величины а постоянны и g-,(r) = k-г—б.,. Удобно записать D7) а виде Vx(r, t) = рх (г) cos at + qx (r) sin at и т. д., D8) где Рх (г) = <*i (г) cos g1 (r), qx (r) = а, (г) sin qx (r). D9) Если выбрать другое положение осей, то каждая компонента V в новой системе вновь примет форму D7), так как каждая новая компонента будет линейной комбинацией старых и может поэтому равняться лишь сумме членов с cos ш? и sin ю/. Мы можем рассматривать (рх, ру, рг) и (qx, qv, qr) как компоненты двух ве- щественных векторов р н q. Тогда V(r, 0 = p(r)cosW + q(r)sin<o*. E0) С помощью разложения Фурье можно выразить произвольную векторную волну в виде суперпозиции волн такого типа. Как и в случае скалярных волн, часто удобно пользоваться комплексным представлением. Запишем E0) в форме V(r, 0 = Re {U(r)e-'-<}, E1) где 1) — комплексный вектор вида U(r) = p(r) + iq(r), E2) а символ Re означает, что берется вещественная часть. Мы можем, как и в со- ответствующем случае скалярных волн, оперировать прямо с комплексной величиной, опуская символ Re, если операции над V линейны. Вещественная *¦) Примеры, иллюстрирующие этот метод, и ссылки на соответствующую литературу даны в работе [181 (см. также [19, 20]).
§ 1.4] ВЕКТОРНЫЕ- ВОЛНЫ 51 часть окончательного выражения тогда представляет рассматриваемую физи- ческую величину. Действия с комплексными векторами производятся по обычным правилам векторной алгебры и алгебры комплексных чисел. Например, вектор, сопря- женный с U, имеет вид U*=p-iq. Аналогичным образом и т. д. Для. иллюстрации расчетов с комплексными векторами выведем фор- мулы, которые понадобятся нам в дальнейшем, для плотностей энергии и век- тора Поинтинга в случае гармонического электромагнитного поля. Электри- ческий и магнитный векторы запишутся в виде Е (г, t) = Re {Е„ (г) ехр (—ml)} = = 1 [Efl (г) ехр (—Ш) + Е; (г) ехр (Ш)}, где Ео и Ни— комплексные векторные функции координат. Так как оптические частоты очень велики (со порядка 1015 сек'1), нельзя наблюдать мгновенные значения ни одной из таких быстро осциллирующих величин. Можно говорить лишь об их значениях, усредненных по времени за интервал (скажем, —Т' ^ jS^sSCT'), который велик по сравнению с основным периодом Т = 2л/ш. В частности, средняя по времени плотность электрической энергии равна Г' =4[Н0(г)ехр(—Ш) + Щ(г)ехр(Ш)], — "&Г 27" ' Т ' " еХР ^— -Т' Но г ~ j ехр (-2Ш)dt = — ^р [ехр(—2ш/)] 1'г =-^утsin2шГ'. -г Так как, по предположению, интервал Т велик по сравнению с Г, величина TIT' мала по сравнению с единицей, и поэтому можно пренебречь интегралом, содержащим ехр (—2по/). Подобным же образом можно пренебречь интегралом, содержащим ехр BШ), и окончательно мы получим Аналогично средняя по времени плотность магнитной энергии запишется в виде Среднее значение вектора Поинтинга равно <S>=^ J ^(Е х H)dt=-^-±r \ ~(Еа х H0exp(-2to» + -г -г- + Е0 х Н0' + Ео* х Но + Ео* X Щ ехр BШ)) dt & « ~ (Е, X Но* + Е,* х Н.) —^ Re {Е,, х Н,'}. E6) 4»
52 ОСНОВНЫЕ СЧОЙСТЧА ЧТРИТРОМАГНИТЯОГ" ПОЛЯ [ГЛ. ^ Простую форму принимает также закон сохранения энергии. Для непро- водящей среды (о = 0), где не производится механическая работа, находим, усредняя по времени уравнение A.1.43), div<S> = 0. E7) Если проинтегрировать E7) по произвольному объему, который не содержит ни источника, ни поглотителя энергии, и применить теорему Гаусса, то получим $ 0. " . E8) Здесь п — вектор внешней нормали к граничной поверхности, по которой про- водится интегрирование. Таким образом, среднее значение полного потока энергии через любую замкнутую поверхность равно нулю. Вернемся теперь к гармонической векторной волне общего вида E0) и исследуем поведение V в точке пространства г — г0. В общем случае при изменении времени конец вектора V описывает эллипс. Поэтому волна вида E0), как и плоская волна, в общем случае также эллиптически поляризована. Чтобы показать это, отметим прежде всего, что с изменением времени копен, вектора V описывает кривую в плоскости, определяемой векторами р (г„) и q (го). Из периодичности V следует, что эта кривая должна быть замкнутой. Мы можем положить p-Mq = (a + (b)^, E9) где е — произвольная скалярная величина. Выразим а и b через р, q и е. а = р cos к + q sin р, Ь — —р sin g -j- q cos г. F0) Выберем s так, чтобы векторы а и b оказались перпендикулярными друг к другу, и допустим, что [ а | ^ | b |. Чтобы а и b были ортогональны,* в должно удовлетворять уравнению (pcose + q sins)-(—psins + q cos e) = 0, F1) tg28 = p-|^. 'F2) В качестве параметров, определяющих волну, вместо шести компонент векторов р и q будем рассматривать пять независимых компонент ортогональ- ных векторов а и b и соответствующий фазовый фактор е. Тогда из соотноше- ний E1), E2) и E9) находим V -= Re {(a + fb) exp [—i (at—е)]} = a cos (mt—е) + b sin (mt—e). F3) Взяв декартову систему координат с начал-ом в г0 и с осями х к у, направлен- ными по а и Ь, получим Vx=acos(<ot—e), Vy = bsm(ait—e), Кг = 0. F4) Это уравнение эллипса (эллипс поляризации) Р+р-1. F5) длины полуосей которого равны а и Ь, а направления осей совпадают с осями координат х и у. С помощью элементарной геометрии можно показать, что р и q являются парой сопряженных полудиаметров эллипса. Как и в случае плоских волн, конец вектора может описывать эллипс в двух направлениях, соответствующих левой и правой поляризации; они различаются знаком смешанного произведения [a, b, Ve] = Ip, q, Vel. Длины полуосей эллипса поляризации легко найти из выражений F0) и F2). Согласно F0) а* = р3 cos2 е + <?a sin2 e + 2р- q sin s cos e = =y(p*+я2)+yM*~~ q2)cos 2s+P" чsin 2e-
§ 1.4) ВЕКТОРНЫР ВОЛНЫ 53 Из F2) имеем sin2e = - Следовательно, Аналогично получим 2р q I |-4(р cos 2e = —- P'-q- qK p-q)!]. | F6) Чтобы найти выражение для угла между аир, запишем уравнение эллипса в параметрической форме V^ V F7) где ф—вспомогательный угол, показанный на рис. 1.9. Из элементарной геометрии известно, что этот угол связан с полярным углом б точки (Vi, Vv) соотношением tgO = — tg ф. F8) Сравнение F4) и F7) показывает, что в дан- ном случае ф = Ы— е. Согласно E0) V = р, когда I = 0, так что угол ф для вектора р равен —е. Следовательно, угол *|з между р и а определяется выражением tg -ф == — tg е. F9) Если угол между р и q обозначить через у и ввести вспомогательный угол |3, определив его соотношением <?//) = tgp, G0) то F2) примет внд = pc^s cos v = tg 2P cos у. G1) Рис. 1.9. К выводу уравнений F7) и F8). Суммируем сказанное. Если векторы р и q заданы, у — угол между ними, ар— вспомогательный угол, определяемый равенством G0), то главные по- луоси эллипса и угол ф, который большая ось образует с р, задаются соотно- шениями _я * Г __ П 1 .nil f I . 1 .4 где tg 2e = tg 2P cos y. G2) G3) Как и для плоских волн, особый интерес представляют два случая, а имен- но случаи, когда эллипс вырождается в окружность или прямую. Для волны, поляризованной по кругу, а и Ь, а следовательно, и е ие определены. Согласно F2) для этого необходимо, чтобы P.q = p2-qa=O. G4) Для линейно поляризованной волны малая ось равна нулю Fа= 0), и тогда из
54' ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [гл. 1 F6) находим pV--=(P-q)8- G5) В заключение мы хотим подчеркнуть, что понятие «поляризация» относится к поведению волны в данной точке поля, и поэтому состояние поляризации будет, вообще говоря, неодинаковым в различных точках поля. Таким обра- зом, волна может быть поляризованной линейно или по кругу в одних точках и эллиптически поляризованной в других *). Только в специальных случаях, например для однородной плоской волны, состояние поляризации одинаково во всех точках поля. § 1.5. Отражение и преломление плоской волны В п. 1.1.3 были получены соотношения, которым должны удовлетворять векторы поля на поверхностях, где физические свойства среды претерпевают разрыв. Применим теперь эти формулы к исследованию распространения плоской волны, падающей на плоскую границу, разделяющую две однородные изотропные среды. 1.5.1. Законы отражения и преломления. Если на границу двух однородных сред с разными оптическими свойствами падает плоская волна, она разделяется на две волны: проходящую во вторую среду и отраженную. Существование двух волн вытекает нз граничных условий, так как легко видеть, что последние невозможно удовлетворить, если не постулировать наличия как проходящей, так и отраженной волн. Предположим, что эти волны также являются пло- с-кими, и выведем выражения для их амплитуд и направлений распространения. Плоская волна, распространяющаяся в направлении единичного вектора s'"**), полностью определена, если известно поведение возмущения во времени в одной точке пространства, ибо если F (f) представляет зависимость возмуще- ния от времени в какой-то одной точке, то эта зависимость в другой точке, отстоящей от первой на г, будет F it— (r-s)/v]. На границе двух сред вто- ричные поля будут так же изменяться во времени, как и первичное поле па- дающей волны. Следовательно, если s(n и sl<> — единичные векторы в на- правлении распространения отраженной и прошедшей волн, то, приравнивая аргументы трех волновых функций в точке г на граничной плоскости г — О, получим г. -^) г - ч^"> г ¦ ч^> t—t-LL = t—L5_ = ^——, A) Щ Щ о2 v ' где Vi и v-i— скорости распространения в одной и другой средах. Учитывая, что г = {х, у, 0}, находим из A) щ 7г • W Равенства B) должны выполняться для любых значений х и у на границе, и поэтому f Плоскость, определяемая вектором s"'1 и нормалью к границе, называется Плоскостью падения. Соотношения C) показывают, что и sln, и s(" лежат в этой плоскости. *¦) Обилии свойства гармонических электромагнитных волн произвольной формы, но с линейной поляризацией по крайней мере одного из векторов поля, исследовались в работе [21]. **) Инлекгы i. <- в t относятся соответственно к падающей, отраженной и проходящей (преломленной) волнам.
1.5] ОТРАЖЕНИЕ И ПРЕЛОМЛЕНИЕ ПЛОСКОЙ ВОЛНЫ 55 Считая плоскость xz плоскостью падения и обозначая через 9г, 9Г и Qt углы, которые su), s(rt и sW) образуют с осью Oz, получим (рис. 1.10) si"-sme;, «<й = о, si°= sin6r, s^> = 0, D) Если волна распространяется из первой среды во вторую, компонента вектора s вдоль оси г положительна; если волна распространяется в противоположном направлении, эта компонента отрица- тельна, т. е. Подставляя значения D) в первую си- стему равенств C), получим sin 0,- sin Qr sin 0^ ,~* t), "~ a, ~ v,_ Следовательно, sin 9r= sin 9t. Исполь- зуя E), мы находим, что cos 9r= ¦—-cos 9;, поэтому в, = я-е,. (?) Рис. 1.10. Преломление и отражение пло- ской волны. Плоскость падения. Это соотношение вместе с утверждением, что нормаль sin к отраженной волне лежит в плоскости падения, составляет закон отражения. Используя соотношение Максвелла A.2.14), связывающее показатель преломления и диэлектрическую проницаемость, из F) найдем также sinj, __ v^ = ¦¦/МН = "а _ я sin 6f и2 г ejjx, »i, 1: (8) Соотношение sin 9;/sin G(= tijtit вместе с утверждением, что нормаль s@ к пре- ломленной волне лежит в плоскости падения, составляет Закон преломления (или закон Снеллиуса). Если я2> Пи то «la > 1, и мы говорим, что оптическая плотность второй среды больше, чем первой. В этом случае, учитывая (8), имеем I sin9t = — sin9,< sine,-, (9) так что для каждого угла падения существует вещественный угол преломле- ния 9f. Однако если вторая среда оптически менее плотна, чем первая (т. е. если п12< 1), то вещественное значение 0; мы получим лишь для таких углов падения 0;, для которых sin 8; <; п12. Для больших значений dt имеет место так называемое полное внутреннее отражение. Оно будет рассмотрено ниже в п. 1.5.4. 1.5.2. Формулы Френеля. Здесь мы рассмотрим амплитуды отраженной и преломленной волн. Предположим, что обе среды (однородные и изотропные) обладают нулевой проводимостью и, следовательно, совершенно прозрачны; их магнитные проницаемости фактически будут отличаться от единицы на пре- небрежимо малые величины, и поэтому мы положим ц1== \ii= 1. Пусть А — амплитуда электрического вектора поля падающей волны, будем считать ее комплексной величиной с фазой, равной постоянной части аргумента волновой функции. Переменная ее часть имеет вид
56 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ. t Разложим каждый вектор на компоненты — параллельную (снабдим ее индексом ||) и перпендикулярную (индекс J_) плоскости падения. Выбор положительных направлений для параллельных компонент указан на рис. 1.10. Перпендикулярные компоненты располагаются перпендикулярно к плоскости рисунка. Тогда компоненты электрического вектора поля падающей волны запи- шутся в виде ?« = -Л11созе/ехр(—гт,), ' Ef = Лх ехр (—h(), \ Ef = A4 sine,-exp(— ix,). j ( > Компоненты магнитного вектора сразу же получаются из соотношения A.4.4) (при ц = 1) " H=Y«sxE. A2) Отсюда W« = -^j.cos0,.K^exp(—Jx,.), Я«> = —Л „J/"^ exp (--«,) — Hf — AL sine,-VEt exp(—«,•). Аналогично, если Т и fl — комплексные амплитуды прошедшей и отра- женной волн, то соответствующие компоненты электрического- и магнитного векторов равны следующим величинам. Поле прошедшей волны ?«> = —ти cosQt exp (—ft,); HP =—T± cos6, V% exp (—ixt); j ?<," = Tj_exp(—ft,); Я»' = —Г„К^ехр(—(т(); \ A4> Ep = T „ sin et exp (—ht), H{?> = Tx sin Bt Ke2 exp (—ixt), ) где \ v% J Поле отраженной волны ?i° = —flu cos 0, exp (—ft,); Hp -=—flj. cos ?«r) = flxexp(-ft,); ' Wj," = —fl,,Ki7exp(—ft,); > A6) ?^-fln sine, exp (—гт,), % Hlp J где Граничные условия A.1.23) и A.1.25) требуют, чтобы на границе танген- циальные составляющие векторов Е и Н были непрерывны. Следовательно, должны выполняться соотношения ;<Г) = ?Ч') Е -\-Е(г> = Еи> I ч у " ' > M8V при этом условия для нормальных компонент В и D A.1.15) и A.1.19) будут удовлетворяться автоматически. Подставляя в A8) значения всех компонент и используя тот факт, что cos 0r= cos (л'— 9г) = —cos 9,, получим четыре соотношения cos 9, (А и—fl|1) = cos0tT'ii, A± + Rj_ = T±, \ ]/T1cosBt(AL — R1_) = V^cosQtTL, Уч{А{, + /?„) = VT,T п. } A9> Заметим, что уравнения A9) делятся на две группы, одна из которых содержит лишь компоненты, параллельные плоскости падения, а другая — только компоненты, перпендикулярные ей. Следовательно, волны этих двух типов независимы друг от друга.
§ 1.5] ОТРАЖЕНИЕ И ПРЕЛОМЛЕНИЕ ПЛОСКОЙ ВОЛНЫ 57 Можно решить уравнения A9) относительно компонент отраженной и про- шедшей волн, выразив их через компоненты падающей волны. Вновь используя соотношение Максвелла « = 1/^6, получим 2пу cos 9,- . т — 2"'cos 9г А , l Л||> ^""njCose. + njCosGt л±' ¦ „ n, cos 8,-—п„ cos 8f ¦ "' ^J-— n, cos 0/ + n.2 cos fy -1- n, cos 0/ + n.2 cos fy Уравнения B0) и B1) называются формулами Френеля. Впервые они были выведены Френелем в несколько менее общем виде в 1823 г. на основе его теории, рассматривавшей свет как колебания упругой среды. Эти соотно- шения пишутся обычно в другой форме, которую можно получить из B0) и B1), используя закон преломления (8), а именно в форме _ 2 sin 6t cos 6, . т 2 sin 0t cos 0,- sin(ef-et) Так как б,- и 9f вещественны (случай полного внутреннего отражения" пока исключаем), то тригонометрические функции, стоящие в правой части уравнений B0а) и B1я), также вещественны. Следовательно, фаза каждой компоненты отраженной и прошедшей волн либо равна фазе соответствующей компоненты падающей волны, либо отличается от нее на л. Так как знаки Гц и Tj совпадают со знаками Л\ и Ах , фаза прошедшей волны равна фазе па- дающей. R случае же. ограженной волны фаза будет зависеть от относительных аначений 0; и 6^. Если оптическая плотность второй среды больше, чем первой (е2>е1), ToBt<0;; поэтому, согласно B1), знаки Ri и ЛL различны и фазы отличаются друг от друга на л. При тех же обстоятельствах значение lg (9,-—¦ — 6^) положительно, но знаменатель tg (б,+ Qt) становится отрицательным для 9,+ 6(> я/2, и в этом случае фазы R* и Ал отличаются друг от друга *) на л,. Аналогичное рассмотрение можно провести для случая, когда вторая сре- да оптически менее плотна, чем первая. ' Для нормального падения Э;— 0 и, следовательно, 6t= 0; тагда соотноше- ния B0) и B1) примут вид Л ^ где п = njnt. 1.5.3. Отражательная и пропускательная способности; поляризация при отражении и преломлении. Рассмотрим теперь, как энергия поля падающей волны распределяется между двумя вторичными полями. Интенсивность света (снова считаем \х = 1), согласно A.4.8), равна ± B4> *) Из A 1) и A6) следует , что 4°. 4й" В ПЛОСКОСТИ 2=0 _*1 & _ Ах' Ef An Этот результат означает, что в плоскости г=0 фазы Е(у' и Е^ отличаются на я, а фазы Е*Р" и Ех равны друг Другу. Указанная разница в поведении фаз у- и х-кимпонент формальна н. возникает из-за способа определения угла отражения 0, ^см. рис. 1.10).
58 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ 1 Поэтому количество энергии в первичной волне, которое попадает на единицу площади поверхности раздела за 1 сек, будет равно Jli) = 5'" cos6,- = °^\А |'- cos 0,. B5) Для отраженной и преломленной воли энопгия, покидающая единицу площади поверхности раздела за 1 сек, определяется подобными же выражениями, а именно: jw^5<rtcosе, = ^-|/?рcose,, /(« = s<»coset = ^|r|acoset. B6) Отношения называют соответственно отражательной и пропускательноп способностью *). Легко проверить, что в соответствии с законом сохранения энергии St-\-ST=\. B8) Отражательная ' и пропускательная способности зависят от поляризации падающен волны. Их можно выразить через соответствующие отражательную и нропускательную способности для света, поляризованного параллельно и перпендикулярно плоскости падения. Пусть вектор Е падающей волны образует с плоскостью падения угол аг. Тогда Ан = Acoscti, AL = Asinai. B9) Пусть, далее, *$" ЪIл" t2 cos e-=JU) cos*a" J"'=Ik iAj- ia cos e<-=Ji;1 sinS a' ^ ^ C1) Тогда ,, C2) где C3) x ' ' Подобным же образом получим где <r _ /if _  соэ 6, I 7» |2 sin 20,- sin 26t is2(e,—et) ' ¦'"' = "¦•<- cos 0/ I Г L I',_ Sln 2e- "ln 26' /«> ~ л, cos6,1 Лхр ~ suiJ F, *) Как видно из A.4.8), если jijt 1, множитель ujn^ в выражении для ^сцедует заменить ¦величиной
5 1 51 ОТРАЖЕНИЕ И ПРЕЛОМЛЕНИЕ ПЛОСКОЙ ВОЛНЫ 59 Снова можно показать, что Для нормального падения различие между параллельной и перпендикуляр- ной компонентами исчезает, и из B2), B3) и B7) находим Отсюда следует, что lim 5? = О, Шп<Г=1. C8) Рис. l.H. К определению угла полной поля- ризации (>гол Брюстера) Аналогичные результаты получаются также для предельных значений 5?ц, <^Гц и S?x> <^*i- Это легко увидеть из C3) и C5), если учесть, что, согласно закону преломления, Bt->- 9, при « ->- 1. Следовательно, чем меньше раз- лииие в оптической плотности обеих сред, тем меньше энергии уносится отраженной волной. Знаменатели в C3) и C5) конечны, за исключением случая 6,-(- 6(= я/2. Тогда tg F,+ 9<) = о° и, следователь- но, Sin = 0. В этом случае (рис. 1.11) отраженный и преломленный лучи перпендикулярны друг другу, а из закона преломления следует (так как теперь sin й,= sin {я/2—0,}=cosOJ), что tge, = n. C9) Угол 9„ определяемый этим выраже- нием, называется углом полной поляри- зации или углом Брюстера. Его важность была впервые отмечена в 1815 г. Давидом Брюстером A781—1868 гг.). Если свет падает под этим углом, элек- трический вектор отраженной волны не имеет, составляющей в плоскости падения. Мы обычно говорим в этом случае, что свет поляризован «в плоскости падения». Таким образом, согласно традиционной терминологии, плоскостью поляризации называется плоскость, в которой лежат магнитный вектор и на- правление распространения. Однако по уже упомянутым в п. 1.4.2 причинам лучше не пользоваться этим термином. Полученный выше результат, часто называемый законом Брюстера, можно пояснить следующим, более прямым рассуждением. Поле падающей волны вызывает колебания электронов в атомах второй среды, которые совер- шаются в направлении электрического вектора прошедшей волны. Колеблю- щиеся электроны вызывают отраженную волну, которая распространяется обратно в первую среду. Но линейно колеблющийся электрон излучает в ос- новном в направлении, перпендикулярном к направлению колебаний (см. ниже, п. 2.2.3), так что в последнем направлении поток энергии излучения отсути- вует. Отсюда следует, что когда отраженный и прошедший лучи перпендику- лярны друг другу, то в отраженном луче энергия колебаний в плоскости паде- ния равна нулю. На рис. 1.12 показана зависимость отражательной способности стекла с по- казателем преломления 1,52 от угла падения Ьг. Числа над верхней горизон- тальной линией относятся к углу преломления 0(. Нулевое значение ify\ ца кривой б соответствует углу поляризации arctg 1,52 - 56°40'. В оптическом диапазоне показатели преломления по отношению к воздуху .обычно порядка 1,5, но в радиодиапазоне они значительно больше, поэтому
60 OCHOBHHF СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ. Г там соответственно велики и углы поляризации. Например, для оптических длин волн показатель преломления воды примерно равен 1,3 и ^гол поляриза- ции 53е. В радиодиапазоне значение показателя преломления достигает при- мерно 9, а угол поляризации близок к 84°. ,• *,. Легко видеть, что, согласно C2), кривая б тйГ рис. 1.12 соответствует а = 45°. Как сейчас будет показано, та же кривая представляет также отража- '" i4§sJs%|Nit:*:?3§> тельную способность Si для естественного света, т. е. для света, испускаемого нагретым телом. Направление колебаний в естественном свете быстро изменяется беспорядочным, случайным образом. Соответствующую отражательную спо- собность Я можно получить путем усреднения по всем направлениям. Так как средние значе- ния sin3 а и cos2 а равны 1/2, то для средних -"¦ и J\l> V 0,9 цв Ц7 0,6 0,5 0,4 аз 0,1 $=0° 10° 20° 30° 40° 50° 00° 70° 80° S0° Рис. 1.12. Зависимость отража- тельной способности от угла па- дения [22] г* 55% —* If/ / 1 0j/ I Щ J I I 1 j значений получим >— «о —4- /'» D0> Однако для отраженного света обе компоненты в общем случае неодинаковы. В самом деле, ис- пользуя D0), найдем , г (О , ' Jll Hi) J_ es Hi) J1 Jl" D1) .у«-' = -1-5гхУ1". При этом говорят, что отраженный свет частично поляризован, и степень его поляризации Р можно определить следующим образом *): p = Отражательная способность определится теперь выражением D2) .г , ,, . „. D3) и поэтому она по-прежнему будет описываться кривой б на рис. 1.12. Степень поляризации теперь можно выразить в виде выражением в фигурных скобках определяют иногда поляризованную часть отраженного света. Аналогичные результаты можно получить и для проходящего света. Для. естественного света мы также найдем. М + Т=\. , D4} Возвращаясь к случаю линейно поляризованного падающего света, мы видим, что отраженный и прошедший свет останется линейно поляризованным, так как их фазы либо не изменяются, либо изменяются на it. Однако направ- •) Более обшее определение степени поляризации дается в п. 10.8.2, где рассматривается также физический смысл эюи величины.
1.3] ОТРАЖР"И" И ПРЕЛОЧЛ^ОТР7 ТОТОСТОЙ ПОЛНЫ б! ления колебаний в отраженном ft проходящем свете изменяются относительно направления колебаний в падающем свете в противоположные стороны. Это можно показать следующим образом. Угол, который мы обозначили через а, т. е. угол между плоскостью коле- баний и плоскостью падении, называют азимутом колебания. Мы будем счи- тать его положительным, когда плоскость колебаний поворачивается по часовой стрел- ке вокруг направления распространения (рис. 1.13). Можно предполагать, что азимут из- Рис. \. 13. К определению знаков азиму- тальных углов. 140° 730" 120° 710" 700°- 30°- 80° 70" Ж 20" 70° 5640' 0° 70°20°38Чв°50°6в°70°60Ж Рис. 1,14. Зависимость азимуталь- ных углов от угла падения 1221 меняется в пределах от —л/2 до я/2. Для падающей, отраженной и прошед- шей электрических волн имеем I A, R, т *g ai = иг ' *8 аг — ~п^ . *g «(— т^=. D5) л и * и ' и Используя формулы Френеля B0) и B1), найдем , cos @; — 6Г) D6) D7) Так как 0 < е,< я/2, 0 < Э,< л/2, то D8) D9) Знак равенства в соотношении D8) справедлив лишь при нормальном или сколь- зящем падении @,= Qf= 0 или 9,= я/2), в соотношении D9) — лишь при нор- мальном падении. Эти неравенства показывают, что при отражении угол между плоскостью колебаний и плоскостью падения увеличивается, тогда как при пре- ломлении он уменьшается. Па рис. 1.14 показано поведение а, и at для п = =-- 1,52 и а,— 45". Мы видим, что когда 8, равно углу Брюстера 56°40', то аг = = 90 . В самом деле, согласно D6) tg с,г= оо (т. е. <хг== и/2) для Э;+ Э(= я/2 при любом значении угла а,. Из закона Брюстера следует, что свет можно поляризовать, просто заставив его отразиться под углом Брюстера. Один из старейших приборов, основанный на таком принципе,— это так называемый отражательный прибор Нюррсн- берга (Нюрренберг, 1787—1862 гг.). Его основные части—две стеклянные пластинки (рис. 1.15), на которые лучи падают под углом Брюстера. Первая пластинка играет роль поляризатора, т. е. приспособления, создающего линей*
62 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ {гл. Т но поляризованный свет из иеполяризованного света. Вторая служит анализа- тором, т. е. устройством, которое детектирует линейно поляризованный свет. Однако этот прибор обладает рядом недостатков, из них наиболее существенны сравнительно малая доля света, отраженного под углом Брюстера, и довольно сложный путь лучей через прибор. Предпочтительнее использовать устройства, которые поляризуют падающий свет без изменения направления его распро- странения. Это можно сделать, например, с помощью стопы тонких плоскопа- раллельных пластинок. Если на стопу падает пучок неполяризованного света, r.l то при каждом преломлении оч частично поляризуется, и по- этому можно достичь достаточно высокой степени поляриза- ции даже при небольшом числе пластинок. Для отношения интенсивностей двух компонент волны после прохождения через обе поверхности пластинки имеем = cos*(9, — E0) Рис. 1.15. Схе- ма , иллюстри- рующая прин- цип отража- тельного прибо- ра Нюррепбереа р — поляризую- щая стеклянная пластинка S — от- ражающее зерка- ло, Л — анализа- тор, с—падающий пучок, р — поля- ризованный пу- чок, г—ЛУЧОК, отраженный от А что получается из C5). Таким образом, при выходе из плас- тинки параллельная компонента преобладает над перпенди- кулярной, причем степень поляризации тем больше, чем боль- ше угол 9,. Если в1 равно углу Брюстера, то б:+ 6(= л/2, tg вг— п, и мы получим Для п = 1,5 это выражение равно 0,73. Следовательно, если свет проходит, например, через пять пластинок, мы получим отношение, равное @,73M, т. е. около 0,2. Раньше поляризованный соет получали, как правило, с помощью двойного лучепреломления в кристаллах исланд- ского шпата или кварца, как описано в п. 14.4.1. Теперь наиболее удобный метод заключается в использовании так называемых поляроидных пленок. Их действие основано на свойстве, известном как дихроизм. Вещества, обладающие этим свойством, имеют различные коэф- фициенты поглощения для света, поляризованного в различных направлениях. Например, можно изготовить пленки из поливинилового спирта с внедренным иодом, которые пропускают почти 80% света, поляризованного в одной пло- скости, и менее 1% света, поляризованного в перпендикулярном направлении. Теория этого эффекта кратко будет рассмотрена в п. 14.6.3. 1.5.4. Полное внутреннее отражение. До сих пор мы исключали случай, когда закон преломления sin 6f «is sm et = E2) не дает вещественного значения для угла преломления 9(. Сейчас мы исследуем этот случай. Он осуществляется при распространении света из оптически более плотной среды в среду с меньшей оптической плотностью, т. е. когда при условии, что угол падения 9, превосходит критическое значение 0„ опре- деляющееся выражением sine, = я12 E3) Если 0,= 9„ то sin Qt= 1, т. е. Qt= 90°, так что направление распространения света касательно к поверхности раздела. Если 6, превышает предельное значе-
§ 1.5] ОТРАЖЕНИЕ И ПРЕЛОМЛЕНИЕ ПЛОСКОЙ ВОЛНЫ 63 ние flj, свет не входит во вторую среду. Весь падающий свет отражается обрат- но в первую среду, и мы говорим о полном внутреннем отражении. Тем не менее электромагнитное иоле ro второй среде не равно нулю, отсутствует лишь поток энергии через границу. Действительно, если в фазовом множителе A5) прошедшей волны мы положим sin е, = iSLEi, cos e( = ± t -/Щр-1 E4) (индекс 12 у «12 опущен), то получим ехр(-«т,) = ехр [-«»(* __i)Jexp[=F-|/-^-lJ. E5)- Выражение E5) описывает неоднородную волну, которая распространяется вдоль поверхности раздела в плоскости падения (т. е. в направлении х) и ме- няется экспоненциально с изменением расстояния г от этой поверхности. Ко- нечно, физический смысл имеет лишь отрицательный знак перед квадратным корнем в E5), в противном случае при увеличении расстояния амплитуда росла, бы неограниченно. Как мы видим, амплитуда очень быстро уменьшается с глу- биной проникновения г, причем эффективная глубина проникновения порядка vju> -— Х2/2я, т. е. порядка длины волны. Эта волна не является поперечной, поскольку, как будет показано ниже, компонента электрического вектора в на- правлении распространения не равна нулю. Экспериментальная проверка наличия возмущения во второй (менее плотной) среде представляет довольно трудную задачу, ибо любое устройство, используемое для обнаружения возмущения, будет нарушать граничные усло- вия. Грубое подтверждение можно получить, если поместить вторую прелом- ляющую среду на расстоянии около четверти длины волны от поверхности раздела, на которой происходит полное внутреннее отражение, и наблюдать проникновение излучения во вторую среду. Изящный способ наблюдения этого явления описан r работе [23], где использовались волны длиной 1,25 см *). Чтобы применить формулы Френеля B1а) к случаю полного внутреннего отражения, перепишем их в виде „ sin 0; cos 0,- — sin 0/ cos 0/ . sin 0,-cos 0,- —sin Bt соьЭ, sin 9,-cos 0t—sin 6t cos 0,- sint),-coset + sin0, cosO,- Подставив в эти выражения значения величин E4) и помня, что перед квадрат- ным корнем необходимо брать верхний знак, получи i г, п1 cos 8,- —; V^sin2 0,-—п2 . " ~ пг cos В,- +1 Y'sw-iii— п* " „ _ cos 0,- — С V^sin^B,-— п? . Х cos 0,- + i /"sin2 0,- — п2 1- Следовательно, l*.i|=|4i|. |/?xl = |i4i|, E8)- т. е. для каждой компоненты интенсивность света, отраженного при полном внутреннем отражении, равна интенсивности падающего света. Хотя во второй среде поле отлично от нуля, легко видеть, что поток энер- гии через поверхность отсутствует. Точнее, можно показать, что хотя в общем *) Проникновение поля во вторую (менее плотную) среду наблюдалось в очень тонких опытах Л. И. Мандельштама еще в 1914 г, [47*], (Прим. ред.)
¦64 OCHOBHHF СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ. 1 ¦случае компонента вектора Пойнтинга в направлении, нормальном к границе, конечна, ее значение, усредненное по времени, равно нулю. Это означает, что ие существует постоянного потока во вторую среду, а энергия течет туда и об- ратно.Запишем для ?—О компоненты поля прошедшей волны вдоль осей х ну и используем E41. (Тут необходимо брать вещественные выражения для Е и Н, так как поток энергии является квадратичной функцией компонент.) Отмечая -сопряженную комплексную величину звездочкой, получим из A4) Ef = — i- (Г, cos 6» ехр (— it?) +>и«>s• Bt exp (+ it?)) = ^ — I {T „ ехр (— (т?) — Т;, ехр (+ Ef = -i- (TL exp (— hi) + Т\ ехр (+ it])), ? = — у (TL cos 6( У7г ехр (— it?) + T*L cos* б^К^ехр ( + »т?)) = i - 1 (T± exp (- it°t)-T'L ex где tJ = oiU —x s^" ' j. Если мы рассмотрим среднее по времени значение величины в интервале—V ^ itg; V, где f велико по сравнению с периодом Т = 2л/й>, то увидим, что оба члена исчезают при г = 0. Действительно, один из них со- держит множитель ±р J (Т\ ехр (- 21т?)-(Г,1)« ехр (+ 2»т?)) d? = который пренебрежимо мал при t'^> T; другой содержит подобный же множи- тель с Tj_ вместо Гц. Вместе с тем расчет показывает, что средние по времени значения двух других компонент вектора S(" для г — 0, а именно S[l> и SJ/\ в общем случае оказываются конечными. Поэтому энергия не проникает во вторую среду, а те- чет вдоль поверхности раздела в плоскости падения. Проведенный выше анализ относился к стационарному состоянию и осно- вывался на предположении, что граничная поверхность и волновые фронты бесконечны. Он не выясняет, как энергия первоначально попала во вторую -среду. В реальном эксперименте падающая волна ограничена и в пространстве, и во времени *). В начале процесса небольшое количество энергии будет про- никать во вторую среду и создавать там поле. Наконец, вычислим изменение фаз компонент отраженной и падающей волн. На основании E8) мы можем положить 5± = e'V J± = e*L. E9) *) Полное внутреннее отражение пучка света конечного поперечного сечения рассматри- валось в работе [24].
§ 1.5] ОТРАЖЕНИЕ И ПРЕЛОМЛЕНИЕ ПЛОСКОЙ ВОЛНЫ 65 Согласно E7) каждая из величин RnIA ц и R±/Aj_ имеет форму г (г*). Следо- вательно, если а— аргумент г (т. е. г = аеи, где а и а вещественны), то е'8 = г(г*)-1 = е2/з, т. е. tg|- = tga, и поэтому 6l & 2 & 2 nrcos 6,- '• & 2 cosS,- ' Отсюда видно, что обе компоненты испытывают скачки фаз разной величины. Вследствие этого линейно поляризованный свет при полном внутреннем отра- жении окажется поляризованным эллиптически. Мы можем теперь записать выражение для относительной разности фаз б = 6j_— 6 ц в виде cos 8, т. е. Это выражение обращается в нуль прискользящем падении Fг= я/2) и при падении под критическим углом 6, (sin 6г— п). Между этими двумя углами ле- жит угол, соответствующий максимуму относительной разности фаз. Он опре- деляется уравнением Jf Ь\__ 2па—(i-!-n*)sin*-e/ 2 ) ~ sin3 G,- (/"iTP'eT11^3 = 0- Это уравнение удовлетворяется, когда sin*e, = n^. F2) Подставляя F2) в F1), мы получим для максимума Ьт относительной разности фаз б выражение Из F1) видно, что при заданном п существуют два значения угла падения 0г для каждого значения 6. Изменение фазы при полном внутреннем отражении можно использовать (как было показано еще Френелем) для получения света, поляризованного по кругу, из линейно поляризованного света. Амплитуды компонент падающего света уравнивают (\А п I = \А±\), выбирая направление поляризации падаю- щей волны под углом 45° к нормали к плоскости падения (т. е. а,= 45°). Тогда, согласно E8), получим \Rn | — \R± \. Затем п и 6, подбирают таким образом, чтобы относительная разность фаз б была равна 90°. Для получения такого значения б при одном отражении необходимо, согласно F3), чтобы tgf=1<Ii^' T- e- n=nl2<V2-1=0,414. Отсюда следует, что показатель преломления я21= \1п более плотной среды относительно менее плотной должен равняться по крайней мере 2,41. Это зна- чение довольно велико, хотя непоглощающие вещества, показатель преломле- ния которых приближается или даже превышает его, существуют. Френель использовал два полных внутренних отражения в стекле. Когда «21 = 1,51, то, согласно F2) и F3), максимальная относительная разность фаз 6т = 5 м. Бора, Э. Вольф
66 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ ?4°37' Рис. 1.16, Ромб Френеля. = 45°56' получается при угле падения 6г, равном 51°20'. Поэтому значение б = 45° можно получить с одним из следующих углов падения: е,- = 48037', е,- = 54°37'. Разность фаз в 90° возникает в результате двух последовательных полных вну- тренних отражений при любом из приведенных углов. Для получения такой разности фаз применяется стеклянный .блок, известный как ромб Френеля (рис. 1.16). Разумеется, ромб Френе- ля можно использовать также для получения эллиптически поляризованного света. В этом случае азимут падающего (ли- нейно поляризованного) све- та должен отличаться от 45°. Можно также получать по- средством ромба Френеля ли- нейно поляризованный свет из света, поляризованного эллиптически. Измерение критического угла бг позволяет удобно и точно определять показатель преломления п = sin 6г. Приборы, используемые для этой цели, называются рефрактометрами. § 1.6. Распространение волн в слоистой среде. Теория диэлектрических пленок Среда, свойства которой постоянны на каждой плоскости, перпендику- лярной к фиксированному направлению, называется слоистой средой. Если считать это специальное направление осью z декартовой системы координат, то 8 = в(г), ц = ц,(г). A) Рассмотрим распространение плоской гармонической электромагнитной волны через такую среду. Это естественное обобщение простого случая, рассмотрен- ного выше. Теория слоистых сред приобретает важное значение в оптике в связи с многослойными системами, т. е. с системами тонких плоскопараллельпых пленок. Такие пленки можно изготовлять методом напыления в высоком вакууме, а их толщину можно контролировать с очень большой точностью. Они находят множество полезных приложений. Например, ниже будет показано, что их можно применять в качестве просветляющих пленок, т. е. в качестве по- крытий, которые уменьшают отражение от данной поверхности. Вместе с тем тонкие пленки при соответств\юших условиях будут увеличивать отражение. Нанесенные на поверхность стекла пленки можно использовать для разделения пучка; такие устройства применяются в интерферометрии для разделения пада- ющего пучка на две части. При определенных условиях многослойная система может служить фильтром, который пропускает (или отражает) лишь выделен- ные участки спектра. Многослойные системы употребляются также в качестве поляризаторов. Вопрос о диэлектрических и металлических пленках очень широко обсуж- дался в научной литературе. Было предложено много схем для расчега оптиче- ских свойств многослойных систем. Мы изложим общую теорию, развитую в превосходных и важных исследованиях Абеле [25] *), и подробно рассмотрим. *) Более детальное изложение вопроса о тонких пленках можно найти в специализиро* ванных монографиях, например в [26, 27] или [28]\
§ 1 ,6j РАСПРОСТРАНЕНИИ ВОЛН П СЛОИСТОЙ СРЕДЕ 67 некоторые специальные случаи, представляющие особый интерес. Естественно, пет необходимости пользоваться общей теорией при рассмотрении проблем, boi- кнкающих в случае небольшого чткла пленок. Поэтому позднее (см. (j 7.6) мы изложим второй, более старый метод, основанный на многократном отражении. Здесь мы будем заниматься лишь диэлектрической слоистой средой. Рас* пространение этого анализа на проводящие среды проведено в § 13.4. 1.6.1. Основные дифференциальные уравнения. Рассмотрим плоскую гармоническую электромагнитную волну, распространяющуюся через слои- ciyio среду. В частном случае, когда полня поляризована линейно и ее элек- трический вектор перпендикуляре» к плоскости падения, мы будем говорить о поперечной электрической волне (обозначаемой ТЕ); если она поляризована л пнейпо и ее магнитный вектор перпендикулярен к плоскости падения, мы будем говорить о поперечной магнитной волне (обозначаемой ТАТ) *). Любую произ- вольно поляризованную плоскую волну можно разложить па две волны, одна из которых является волной ТЕ-типа, а другая — 7714-типа. Так как, согласно § 1.5, граничные условия на поверхности раздела для перпендикулярной к ней и параллельной компонент не зависят друг от друга, то эти две волны также будут взаимно независимы. Более того, если поменять местами Е и Н и одно- временно ей — ii, то уравнения Макспелла не изменятся. Поэтому любую тео- рему, относящуюся к 77И-волннм, сразу же можно вывести из схкиветствую- щего результата для 7"?-волн с помощью такой замены. Таким образом, до- статочно изучить подробно лишь ТЬ'-волны. Возьмем в качестве плоскости падения плоскость **) yz, причем г— на- правление поперек слоев. Для волны Т?-типа Еу— Ez~ 0, и уравнения Макс- велла переходят в следующие шесть скалярных уравнений (зависимость от времени предполагается в виде exp (-~—ia>t)'. -^Я^О, B6) Эти уравнения показывают, что Ну, Hz и Ех зависят только от у и г. Исключая Ни и Hz из Aа), B6) и Bв) (или определяя компоненту вдоль оси х волнового уравнения A.2.5) для Е), найдем где пя = ец, й0 = со/с=2яА0. D) Будем искать решение C) в виде произведения двух функций, одна из ко- торых зависит лишь от у, а другая только от г: Ex(y,z) = Y(y)U(z). E) Тогда уравнение C) примет вид 1 6}Y _ 1 dW ,8 d(ln\i) 1 dU Левая его часть зависит лишь от у, тогда как правая —¦ лишь от г. Следова- тельно, F) может выполняться лишь в том случае, если каждая его часть равна "') Используются также термины «?-поляризованная» и «Я-поляризоваиная» (см, п. 11 4 1). Нужно упомянуть, что в теории волн-толов термины «поперечная электрическая волна» ii (поперечная магнитная волна» имеют ;i;jjioc' значение. " *) А не плоскость xz, как в предыдущем разделе.
68 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ. 1 постоянной (скажем, —К2), т. е. « G) _ [_ + пЩи = ки^ (8) Удобно положить К'- = Ца.\ (9) Тогда уравнение G) дает Y = const-exp (ikaay), и, следовательно, Ех имеет вид y—(ot)], A0) где U (г) — функция г (возможно, комплексная). Из B6) и Bз) мы видим, что выражения для Ну и Нг имеют такую же форму, т. е, Wy = V(z)exp[«(*.«*-«>0]. 00 Hz = W(z)txp[i(kl>ay-~mt)}. A2) Амплитудные функции U, V и W на основании Aа), B6) И Bв) связаны сле- дующими уравнениями: . V' = iko(aW + eU), A3а) U' = lkoV.V, A36) af/ + (j.W = 0; A3в) здесь штрих означает дифференцирование по г. Подставляя W из A3в) в A3а), мы получим вместе с A36) систему из двух дифференциальных уравнений пер- вого порядка *) относительно U и V Bj). A4) Переходя к уравнениям, содержащим лишь по одной неизвестной функции, окончательно получим следующие линейные дифференциальные уравнения второго порядка для U и V- e^-dJ^§ + k*(n°-a*)U = 0, A5) A6) В соответствии с правилом замещения, которое является следствием сим- метрии уравнений Максвелла, сразу же можно написать, что для волны ТМ- типа (Ну— Нг= 0) неисчезающие компоненты векторов поля имеют вид HK=U (г) exp [i (kgay-(ot)], A7) >Ey--^ — V{z)exp [i(khay — wl)], A8) ?г = — W(z)cxp[i(koay— ш/)], A9) причем Uf) B0) *) Форма уравнений A4) совпадает е формой уравнений электрической линии передачи, dV/dz = — Zl, dltdz = — YV, где У — падение напряжения вдоль линии, / — ток в линии, Z — импеданс, а Г — проводи- мость. Поэтому теорию слоистых сред можно развить совершенно аналогично теории электри- ческих линий передачи, что и было сделано рядом авторов (см., например, [29—30]),
$ 1.61 РАСПРОСТРАНЕНИЕ ВОЛН В СЛОИСТОЙ' СРЕДЕ 69 a W и U связаны соотношением 0. B1) Функции U и V удовлетворяют следующим линейным дифференциальным урав- нениям второго порядка: dJ^% -*»U-0, B2) B3) В общем случае U, V и W являются комплексными функциями г. Поверх- ности постоянной амплитуды Ех определяются из уравнения |?/(z)|= const, поверхности постоянной фазы — из уравнения Ф (г) + koay = const, где ф (г) — фаза U. Оба семейства поверхностей в общем случае не совпадают, так что ?х (и аналогично Ни и Нг) будет неоднородной волной. Для небольшого смещения (dy, dz) вдоль поверхности постоянной фазы имеем следовательно, если через 6 обозначить угол между нормалью к поверхности постоянной фазы и Ог, то получим t' (г)' В специальном случае однородной плоской волны имеем ф(г) — konz cos д, a = nsinS. B4) Следовательно, соотношение а = const с условием (9) можно рассматривать как обобщение закона преломления Снеллиуса для слоистых сред. 1.6.2. Характеристическая матрица для слоистой среды. Решения только что выведенных дифференциальных уравнений, подчиняющиеся соответствую- щим граничным условиям, и различные теоремы, относящиеся к слоистым сре- дам, удобнее представлять в матричной форме. Поэтому перед тем, как рас- сматривать следствия из наших уравнений, мы кратко изложим основные опре- деления, относящиеся к матрицам. I. Под матрицей мы понимаем совокупность вещественных или комплекс- ных чисел, расположенных в виде прямоугольной или квадратной таблички ап а,2 ... аь tint) ... Cla, Lflral "иг ••• "к Символ a,j обозначает элемент в г'-й строке /-го столбца. Матрица обозначается символом А или [а,;]. Если матрица содержит т строк и п столбцов, то говорят, что это матрица т на п (или т х «-матрица). В специальном случае, когда т — п, А называют квадратной матрицей порядка т. Если А — квадратная матрица, то определитель, который состоит из таких же элементов в тех же по- ложениях, что и элементы матрицы А, называегся определителем матрицы А. Он обозначается через |А| или | atl ]. Если |А| = 1, то говорят, что матрица А унимодулярна.
70 асяовньш свойства электромагнитного голя {гл. 1 По определению две матрицы равны, только если они имеют одинаковое число строк т и одинаковое число столбцов я и если равны их соответствующие элементы. Если А = [аи\ и В= [Ьц] — две матрицы с равным числом строк и равным числом столбцов, то их сумма A-f-В определяется как матрица С, элементы которой ряпны си =¦- ац + Ьц. Аналогично их разность А—В опре- деляется как матрица Д с элементами с1^ = а.ц — Ьц. Матрица, у которой все элементы равны нулю, называется нулевой матри- цей. Квадратная матрица с элементами atl — 0 при i Ф / и а,ц — 1 дли всех значений I называется единичной матрицей и обозначается через I. Произведение матрицы А и числа }. (вещественного или комплексного) определяется как матрица В с элементами Ьц = %a-,j. Произведение двух матриц АВ определено лишь для случая равенства числа столбцов в А числу строк в В. Если А — это т X р-матрица, а 6 — это р X л-матрица, то их произведение по определению будет т X «-матрицей с элементами " р Таким образом, операция умножения двух матриц аналогична умножению оп- ределителей равных порядков, когда строка умножается на столбец. В общем случае АВ Ф ВА. Например, ГО П 1 О! ГО —П L1 о j * о —1 г" 11 oj' тогда как П 01.10 1} Г 0 11 1.0,-1 J [юг l-i oj- В специальном случае АВ = ВА матрицы А и В называют коммутирующими. Приведенных определений к свойств чгнрнц достаточно для наших целей, и поэтому мы можем вновь возвратиться к обсуждению распространения элек- тромагнитных воли через слоистую среду. П. Поскольку функции U (?) ш V (г) в п. 1.6.1 удовлетворяют линейным дифференциальным уравнениям второго порядка [тина A5) и A6I, каждую из них можно выразить в виде линейной комбинации двух частных решений, скажем (J,, U3 и \'\, \'%. Эти частные решения не могут быть произвольными; они должны быть связаны дифференциальными у равнениями первого порядка A4), а именно. Отсюда следует, что так что Это соотношение означает, что определитель ??!• Bб) соответствующий любым двум произвольным решениям системы A4), постоя- нен, т. е. что D является инвариантом нашей системы уравнений *). *¦) Это следует также из хорошо извечного свойства вронскиана для линейных дифферен- циальных уравнений второго порядка. Более 'foro, нетрудно также показать, что если L\ из- вестно, то U2 можно получить с помощью интегрирования из соотношения U, = ikDUl I -tafe (си. 126], стр. ЫЗЗ),
§ 1.6] РАСПРОСТРАНЕНИЕ ВОЛН В СЛОИСТОЙ СРЕДЕ 71 Для наших целей наиболее удобно выбрать такое частное решение: (/,=7B), Ut=*F(z), Vt^g(z), F3 = G(z), B7) чтобы f(O) = G(O) = O и F@) = g@)=l. B8) Тогда решение с иф) = и„ V@) = V, B9) можно выразить в виде илц в матричной форме Q^NQor C0) где Из соотношения D = const следует, что определитель квадратной мат- рицы N постоянен. Значение этой постоянной сразу же можно получить, полагая г = О, что дает |N| = Fg—/G = l. Обычно удобнее выражать С„ и V<, как функции U (г) и V (г). Разрешая от- носительно Uty и Vo, получим Q0=MQ, C2) где ё(г) —/BI • п~ Эта матрица также унимодулярна, т. е. |М|=1. C4) Смысл матрицы М ясен: она связывает х- и (/-компоненты электрического (или магнитного) векторов на плоскости г = 0 с этими компонентами на произ- вольной плоскости г — const. Таким образом, мы видим, что для полного определения поля достаточно знать U и V. Следовательно, для того чтобы уз- нать, как распространяется плоская монохроматическая волна через слоистую среду, последнюю необходимо охарактеризовать лишь соответствующей унимо- дулярной 2 X 2-матрицей М. По эгой причине мы будем называть М характе- ристической матрицей слоистой среды. Постоянство определителя |М | можно доказать с помощью закона сохранения энергии *). Ниже рассматривается форма характеристической матрицы для случаев, представляющих особый интерес. а. Однородная диэлектрическая пленка. В этом случае величины в, (i и п —-Ущ постоянны. Если 6— угол между нормалью к волне и осью г, то, согласно B4), имеем а = п sin 0., Для волны Tf-типа получим в соответствии с A5) и A6) ^+ (kin* cos2 6) U = 0, ~+ {kfa* cos2 в) V = 0. C5) Легко видеть, что решения этих уравнений, удовлетворяющие соотношениям A4), имеют вид } U (г) —A cos {konz cos в) -{-В sin (kanz cos в), | l ГТ \ C6) V (г) = j- у — cos 0 {В cos (konz cos в) —A sin (А,ю cos &)}. j *) Чтобы показать это, выразим отражательную и пропускательиую способности E1) через матричные элементы. Если, далее, учесть, что для иепоглогцающей среды характеристи- ческая матрица имеет вид D5), то, как мы видим, закон сохранения t/i \-?Г— 1 будет удовлет- воряться при условии |М|=1,
72 ОСНОВНЫЕ СВОЙСТВА 9-ЛГКТРОМАГНИТНОГО ПОЛЯ [ГЛ. t Следовательно, частное решение B7), удовлетворяющее граничным условиям B8), запишется следующим образом: i/i = / (z)=~^VJ/e sin (konz cos 9), j V± = g (г) = cos (Аугг cos 6), ^ C7) Ua = F (z) = cos (?owz cos 6), V2 = G (г) = г l/^i/fl cos 9 sin (khm cos 6). Если мы положим C8) то получим характеристическую матрицу в виде М(г) Г cos (Vk созв) —^sln(Aei»cose)l C9) L—ip sin (konz cos 9) cos (katiz cos 6) J Те же уравнения будут справедливы для волны ТМ-типа, если р заменить на q= |/-^-cos9. D0) б. Слоистая среда, состоящая из тонких однородных пленок. Рассмотрим две смежные слоистые среды, первая из которых занимает пространство от г = 0 до г == гь а вторая — от г — г\ до г = zz. Если Mi(e) и М2(г) — характе- ристические матрицы двух сред, то Q»=M, (г)О (гО, Q (гх) =М2 (г2—г^О (га), так что Q0=M(z2)Q(z2), где M(z2) =М1(г,)М,(г2—zj. Этот результат немедленно можно обобщить на случай непрерывного ряда слоистых сред, расположенных в областях 0^г^гь Zis^zsg^, ..., zN_ik Если Mi, Ma> ..., M^v— характеристические матрицы сред, то ГДе Где С помощью последнего соотношения легко вывести соответствующее выражение для характеристической матрицы любой слоистой среды *): мы разбиваем эту среду на очень большое число тонких пленок толщиной Ьги 6г2, бг3, ..., Ьгп. Если их максимальная толщина достаточно мала, можно счи- тать, что е, (д, и л постоянны в каждой пленке. Из C9) видно, что в этом случае характеристическая матрица /-й пленки приближенно равна м Следовательно, характеристическая матрица всей среды, рассматриваемой как совокупность тонких пленок, приблизительно равна D2) где N *1 Более подробное рассмотрение слоистых сред с непрерывно меняющимся показателем преломления проведено в работе [31].
§ 1 .6] РАСПРОСТРАНЕНИЕ ВОЛН В СЛОИСТОЙ СРЕДЕ 73" Здесь также оставлены лишь члены до первого порядка по 6г включительно. Переходя к пределу при N -> оо таким образом, чтобы максимум 16zj) стре- мился к нулю, получим где ^ = J(e-f)dz, S=Jurfz, D4) а интегрирование проводится по всему интервалу изменения г. Выраже- ние D3) дает первое приближение для характеристической матрицы произ- вольной слоистой среды. Оставляя в разложении величин cos (k9nbz cos 6) и sin {к0пЬг cos 9) и в произведении D2) члены более высоких порядков, можно получить следующие приближения *). Поскольку для непоглощающей среды 8 и jx вещественны, то видно также, что характер ис/цическая матрица непоглощающей слоистой среды имеет вид М -UJJ- где а, Ь, с и d вещественны. 1.6.3. Коэффициенты отражения и пропускания. Рассмотрим плоскую волну, падающую на слоистую среду, которая занимает область от г = 0 до г -- ?! и с обеих сторон граничит с однородными полубесконечными средами. Выведем выражения для амплитуд и иптеисивностей отраженной и прошедшей волн **). Пусть А, R и Т обозначают, как и раньше., амплитуды (возможно, комплекс- ные) электрических векторов падающей, отраженной и преломленной волн. Далее пусть еь цъ и е„ цг— диэлектрические и магнитные проницаемости пер- вой и последней сред, а ёг и 6г— углы между нормалями к падающей и про- шедшей волнам и направлением оси z (направлением стратификации). Граничные условия, приведенные в § 1.1, требуют, чтобы тангенциальные компоненты векторов Е и Н были непрерывны на каждой из двух поверхностей раздела слоистой среды. Вместе с соотношением A.4.4) Н = Кё/[1 sxE это приводит к следующим соотношениям для волны ТЕ-тша: где Четыре величины ?/0, Vo, U и V, определяемые равенствами D6), связаны основным соотношением C2); следовательно, D8) /0 = p1(A-R), vt*\-*T ( D6) где rn'ij— элементы характеристической матрицы среды при г = zu Из D8) мы найдем коэффициенты отражения и пропускания пленки ,_Д _ (mji + mvtPi) р, — (дгг1 + tnU_pj) ._. Л (т + тр)р + (от + лгр) E0) *) Это подробно рассматривается в работе [25], стр. 611. **\ Мы рассматриваем амплшуды электрических векторов, когда изучаем волны Т?-тнпа, а амплитуды магнитных векторов, когда изучаем волиы ГЛ1-типа.
74 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ. 1 Отражательная и пропускательная способности, выраженные через г имеют вид и t, E1) Фазу бг величины г можно назвать изменением фазы при отражении, а фазу бЕ величины t—¦ изменением фазы при пропускании. Изменение фазы Sr отнесено к первой поверхности раздела, тогда как 8f— к плоской границе между слоистой средой и последней нолубесконечно» средой. Соответствующие формулы для волны ГЛ4-типа сразу же получаются из D9) — E1) путем замены величины рг и pt на величины <7i = V^-J^y. cos 9Х, qt = yr\ii/El cos 6j. E2) В этом случае г и t являются отношениями амплитуд магнитных, а не электри- ческих векторов. 1.6.4. Однородная диэлектрическая пленка*). В оптике особый интерес представляют свойства однородной диэлектрической пленки, расположенной между двумя однородными средами. Поэтому этот случай мы рассмотрим более подробно. Все среды будем считать немагнитными ([л=1). Характеристическая матрица однородной диэлектрической пленки имеет вид C9). Обозначая через h толщину пленки и приписывая индексы 1, 2иЗве- личинам, которые относятся к трем сре- дам (рис. 1.17), получим /M11 = ma2 = cosp, mlt = - snip, т$!=—1/7, sinB, E3) где > = -jL njl COS 62 Рис. 1.17. Распространение злектромаг- и нитной волны через однородную пленку. п. = п.COS 9 /=1 2 3 E4) Коэффициенты отражения и пропускания rut можно получить, подставляя эти выражения в D9) и E0) и считая I = 3. Окончательные формулы для них удобно записать, используя соответствующие коэффициенты rs,, lt2 и r^, ti3, связанные с отражением и пропусканием на первой и второй поверхностях раздела соот- ветственно. Согласно формулам Френеля A,5.20) и A.5.21) получим для волны Т?-типа !—/i2cose2 у i—Pj " rtt cos Qi-f- n2 cos 92 2ni cos Bt "«iCOS 0! + n2COS 98 ' E5) E6) и аналогичные выражения для г13 и tri. Если в формулы для г к t подставить эти величины, то они примут вид **) E7) E8) •) Другой вывод эсновных формул, относящихся к свойствам одиночной диэлектриче- ской пленки, встретится б п. 7.6.1. Эти формулы, разумеется, можно вынести непосредственно, использовав 1раничные условия, приведенные в п. 1.1 3, на каждой границе пленки (см |32i или [26]). **' Впервые эти формулы были получены другим способом в работе Эйрн [33]; см. также 134].
§ 1 61 РАСПРОСТРАНИ? ВОЛН В СЛОИСТОЙ СРЕДЕ 7" Поэтому отражательная и пропускательная способности запишутся следующим образом: а — I г [»- '"I" r*-> + 2r™r™ cos 2P .-,9) 1+,}„!,+ &¦„/¦„ cos 20 Прямой расчет, как и следовало ожидать, дает Из E7) и E8) легко также рассчитать изменения фазы. Они определяются ,выражениями 'П'?) sl~ 2g ^, F1) л!,) cos 2E ' F2) Рассмотрим кратко некоторые выводы из этих формул. Во-первых, г ме- тим, что выражения E9) и F0) остаются неизменными при замене |i па |j - л. т. е. при замене h на ft + ДА, где Д/г = Я" . F3) 2ла cos Йа v ' Следовательно, диэлектрические пленки, которые различаются по толщине на величину, кратную XJ2n, соз 0,, обладают одинаковыми отражательными и пропускательными способности пи. Определим теперь оптическую толщину, для которой коэффициент отра- жения достигает максимум шш -минимума. Если положить H = nji, (ГА) то из E9) мы найдем ^j =0- когда sin 2|5 = О( т. е. когда 4 co Необходимо различать два случая: 1. от нечетно, т. е. Я принимает значения 4 cos ()j ' 4 cos 0» ' 4 cos 0, ' ' ' тогда cos 2p = — 1 и E9) переходит в В частности, для нормального падения мы получим из E5) и F5) примет вид <¦>? I "гПз я* 1 ffi7» •л. ^ j -2 ) . \u/j 2. m четно, т. е. оптическая толщина принимает значения it ^1) 2Ац ЗЛ{) ~ 2 cos 02 ' 2 соз 63 ' 2 cos 8a ' *"'¦ тогда cos 2/5 = 1 и E9) переход и г в
76 ОСНОВНЫЕ СВОЙСТВА. ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [гл 1 В частности, для нормального падения получим ^=(|^5J. FЭ) и, как мы видим, Я не зависит от п2. Единственное отличие в случае наклонного падения состоит в том, что во всех формулах п, заменяется на я7 cos 0, (/ = 1, 2, 3). Следовательно, пластинка с оптической толщиной mA0/2cos92, где яг = = 1, 2, 3 не влияет на интенсивность отраженного (или прошедшего) света. Нам нужно определить характер этих экстремальных значений. После простого расчета мы найдем, что при Я— /лЛи/4соз6,, (от— 1, 2, »..) в соответствии с G0) Верхний знак соответствует минимуму, нижний — максимуму. В частности, лри нормальном падении г1г и ггп определяются выражениями F6), и мы имеем максимум^ если (—\)т (nt—я2)(я2—raj > 0, \ минимум, если ( —1)я(п, — п2) (я2—*ft3) < 0. J Обычно первой средой является воздух («, с оптической толщиной Хц-Ч, ЗЯ0/4, 5л„/4, 1), и мы видим, что для пленки ,». отражательная способность уЛ? ¦у^ 7-^ Рис. 1.18. Отражательная способность ди- электрической пленки с показатели прелом- ления я, как функция ее оптической толщи- ны [36]. 9j=0, пг= 1, я3-1,5. достигает максимума или минимума в зависимости оттого, превышает ли показатель преломления пленки пока- затель преломления последней среды или он меньше его. Для пленки, с опти- ческой толщиной А,о/2, 2XJ2, ЗХ»/2,».. справедливо обратное. Эти результаты, которые иллю- стрируются рис. 1.18, оказались в хо- рошем согласии с экспериментом (см., например, [35]). Из предыдущего анализа ясно, что пласшнку с достаточно низким показателем преломления, оптическая толщина которой составляет четверть длины волны, можно использовать в качестве просветляющей пленки, т. е. пленки, уменьшающей отражательную способность поверхности. Чаще всего для этой цели применяются два ве- щества: криолит (я ~ 1,35) и фтори- стый магний (MgF,, n— 1,38). Согласно F7) отражательная спо- собность при нормальном падении была бы точно равна нулю, если бы ' na = l/"ivv G2) При tii—1, «з= 1,5 это требует, чтобы да примерно равнялось 1,22, условие, которому практически нельзя удовлетворить. Однако более полный анализ вы- ражения E9) показывает, что при наклонном падении можно получить равную нулю отражательную способность для волны ТМ-типа (электрический вектор параллелен плоскости падения), но не для волны ГЯ-типа (электрический век- тор перпендикулярен плоскости падения), т. е, при благоприятных условиях
§ 1-61 РАСПРОСТРАНЕНИЕ ВОЛН В СЛОИСТОЙ СРЕДЕ 77 можно получить одновременно 5&„ = 0 и Я±ф0. Следовательно, тонкая пленка из подходящего диэлектрика способна служить поляризатором, работающим на отражение. Такой поляризатор можно считать более общим вариантом простого устройства, обсуждавшегося ранее в связи с углом Брюстера. Чтобы получить большое значение для Я (при й 0) большое значение для Sl± (при _. должен быть по возможности боль- шим [37]. Например, при п± — 1, «2 = 2,5, я3=1,53 мы получим 5?„ = 0, .5*1=0,79, когда 0!= = 74°30'. Если стеклянную поверхность покрыть материалом с достаточно высоким показателем преломления, то отражательная способность по- верхности, согласно предыдущему анализу, сильно увеличится (см, рис. 1.18 и 1.19). Такая поверх- ность будет действовать как хоро- ший делитель пучка. Для этой цели очень подходят покрытия из дву- окиси титана (TiO2, /г —2,45) или сернистого цинка (ZnS, /г~2,3), которые дают максимальную отра- жательную способность, примерно равную 0,3. Существуют и другие вещества, обладающие высокими у показатель преломления пленки п3 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 02 0,1 ! ! / X f / / // - У .'' & /\ У .-¦•;; ^~ %=i Л7=П 2 S л? Рис. 1.19. Отражательная способность четверть- волновой пленки (nJi=XJi) при нормальном падении как функция показателя преломления пленки л3 [35]. показателями преломления, но они поглощают часть падающего света Напри- мер, пользуясь покрытием из стибнита (Sb2S3, n~2,8), можно достичь значений 5?=Jr=0,46, но при этом 8% падающего света поглощается пленкой. Интересно также исследовать случай полного внутреннего отражения на первой поверхности раздела. При этом получим i- «1sin91>n3, «1sinei<n3 и (см. уравнение A.5.54)) я2 cos 63 = ~i Vn\ sin2 Q.—nl G3) Коэффициенты отражения для обеих поверхностей раздела теперь будут равны (СМ. (l.D.Zi)) ' Л, cos 0, —i V л? sinJ ft. —и? \ '12 = - га, cos 6, + i iV n\ sin2 г _ sin3 0,— п\— п, Если положить где, согласно G3), -iy n\ sitr1 Вх—na+n3cos0a k^njh. cos 62 == ib. G4) G5) 6= —i;AJ/">sin:;ei-«i> G6) то для коэффициента отражения мы получим вместо E7) выражение Так как | = 1, то г12 и ris имеют вид , ru = exp ( G7) G8)
78 ОСНОВНЫЕ СВОЙСТВА ЭЛСКТРО"! U НИ! МОЮ ПОЛЯ (ГЛ. 1 где величины <р вещественны. Следовательно, отражательная способность равна «'Ч«-г»+2«"<ф'г) G9) В отличие от предыдущего случая, 91 уже не является периодической функцией толщины пленки. Выражение G6) показывает, что если пренебречь зависимо- стью показателя преломления от длины волны, то неличина b обратно пропор- циональна длине волны. Так как для достаточно больших значений Ъ величина .71 практически равна единице, то более короткие длины воли не будут пропу- скаться. В этом случае пленка действует как фильтр нижних частот,"т. е. как фильтр, пропускающий лишь длинные волны. Мы видели, что с помощью диэлектрических пленок из подходящего мате- риала можно получить много полезных эсЬфгктоз. Из дальнейшего станет ясно, что, применяя систему из нескольких таких п тонок, можно еще. больше усилить нужные свойства. Характеристическую матрицу подобной многослойной 'системы можно получить с помощью теоремы, выраженной в виде D1) •*). Мы рассмотрим подробно лишь случай периодической многослойной системы. 1.6.5. Периодические слоистые среды. Слоистая периодическая среда с периодом h характеризуется диэлектрической проницаемостью а и магнитной лро-т1ицае\аэсгью ц, зависящими только от г; они имеют вид е(г + /7г) = е(г), ц (z-f/ft) =ц(г), где / —¦ любое целое число-из некоторого, фиксированного интервала 1 ^/^Г N. Пусть М (И) — характеристическая матрица, соответствующая одному пе- риоду. Запишем **) [яг,, т-,Л ' «« J • (80> В этом случае, в соответствии с D1) и с-учетом периодичности среды, получим - М (Nk) = М (ft) M (h) ... М (/г) = [М (h)]N. (81) Для определения элементов матрицы М (Nh) воспользуемся результатом, по- лученным в теории матриц, согласно которому N-я степень унимодулярной. матрицы М(/г) равна ***) tkA.uvN f«iXr-i<a)-%v-i(a) '"А'-Ля) 1 tM <*M"- к«„_1(«) п,»<и„-Ла^Ч1л-М\ ' (82> где а = ^{тп +"?.;), (83) а %у— полиномы Чебышева второго рода: *) Формулы, относящиеся к многослойным системам, были получены многими авто- рами, см., например, [38, 39]. "¦*) Здесь мы опускаем штрих у элементов млтрицы. ***¦) В правильности этою ревультатл можно jot (иться методом индукции, используя рекуррентное соотношение Щ(х) = 2х<11/-1 (*)-%_» (х), которое следует как тождество из определения полипомов Чебышева. Прямое доказательство, основанное на теории мтриц, приведено ь работе [25].
§ 1.6] РАСПРОСТРАНЕНИЕ ВОЛН В СЛОИСТОЙ СРЕДЕ 79 Эти полиномы •) удовлетворяют следующим условиям ортогональности и нор- мировки: +' / 0 при п ф т, Для удобства выпишем в явном виде первые шесть полиномов; , ад4 (лг) = Юл-4—12л;2+ I, "-—l, Ч1Ь (х) = 32л:6 — 32*3+6х., Многослойная система обычно состоит из чередующихся однородных слоев с низким и высоким показателями преломления п2 и п3 и толщинами /Л. Пз Т1г "з (А /С в? 712 ы. Рис. 1.20. Периодическая многослойная система. ft2 и А3, расположенных между двумя однородными средами с показателями преломления щ ииг (рис. 1.20). Мы снова считаем среду немагнитной (ц— 1) и полагаем (85) ^шрЛ :osp3 J Рз COS Согласно C9) и D1) в этом случае характеристическая матрица М2(Л) одного периода имеет вид -—^-smp2 I Г cos рз —- — ip%smp2 cosp2 J L — ip3sinpa cos P2 cos p3—— sin p, sin p3 • cos paSinp^—— s — t'PjSinPjCos ps—i/?3cosp, sinpi3 cos p2 cos p3—^sinPjSinpa Следовательно, в соответствии с (81) характеристическая матрица M2jy (Nh) многослойной системы (с полным числом пленок 2N) определяется следующими формулами, полученными Абеле: 87) *) Таблицы полиномов Чебышова были опубликованы Национальным Бюро Стандартов- 140]; там же приведена сводка их наиболее важных свойств (см, также [41]),
80 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ. 1 где 2 = ~ »{|; cos cos рз — j* sin p2 sin sin лг_1 (а) —'Мл,., (а), cos p%) «Мл,_, (a), 1 = — i (p2 sin §2 cos p3 + />, cos p2 sin ра) 'Мл,_] (а), ± ({? a = cos p2 cos p,_± (•{? +j?) sin p2 sin p3. (88) (89) Коэффициенты отражения и пропускания многослойной системы сразу же получаются при подстановке этих выражений в D9) и E0). Особый интерес представляет случай, когда два основных слоя имеют одну и ту же оптическую толщину (обычно Л„/4), т. е, когда nji2^nsh3, (90) и падение нормально F,,= 0). Тогда если эту общую для обоих слоев величину обозначить через р\ то аргумент полиномов Чебышева примет вид Видно, что величина а не может превышать единицу, но для некоторых значений [i она может стать меньше — 1. В этом случае arccosa—¦ мнимая величина, а так как для любого % . , . ех—е-х то, следовательно, 4lN будет вести себя как экспонента. Отсюда следует, что отражательная способность такой многослойной снстемы быстро увеличивается с ростом числа периодов. Для четвертьволновых пленок (nji2 — rtji3= Я0/4) при нормальном падении (вновь считая среды немагнитными) имеем и (86) переходит в ~ -Is. о AA,(ft) = 0 —'-а л. (94) Характеристическая матрица (87) многослойпой системы, основным периодом которой служит такой двойной слой, имеет вид (95) о Г-* V "г что можно подтвердить, умножая матрицу (94) саму на себя N раз. Согласно D9) и E0) отражательная способность рассматриваемой системы равна (96)
ЛИТЕРАТУРА 81 Отсюда следует, что для фиксированного числа двойных слоев *) N отража- тельная способность Ыгы увеличивается при увеличении пй/пя, а для фиксиро- ванного значения этого отношения М2Л- увеличивается с ростом N. Иногда, например, при покрытии пластин интерферометра Фабри— Перо (см. § 7.6) слои располагают так, что их показатели преломления образуют сле- дующую последовательность: ге2, ла, пг матрица такой многослойной системы равна М2Л,+1-М2Л,-М, (97) где М2Лг определяется выражением (87), а М— характеристическая мат- рица последней пленки этого ряда. Для четвертьволновых пленок при нормальном падении М2Лг переходит в (95), р2= я/2, и (97) примет вид «3) •••» пг, п3, п2. Характеристическая Таблица 1.3 Отражательная способность J%3,v+1 мно- гослойных систем, состоящих из периодиче- ской совокупности четвертьволновых пленок сернистого цинка и криолита, при нормаль- ном палении (n, = l, А2 = 2,3, л? =1,35, нг~1,52, nJl., = и3й, = X0/4, й„ ^= 54S0 А, о о Подстановка в D9) и E0) жательную способность (98) даст отра- 14-—— I — К^\. (99) 0 1 2 3 4 0,306 0,676 0,872 @,865) 0,954 @,945) 0,984 @,97) В скобках приведены эксперименталь- ные результаты, полученные в работе [43]. Как мы- видим, отражательная способность быстро увеличивается с увели- чением отношения njnsn N (см. табл. 1.3). ЛИТЕРАТУРА 1. P. A. F г а п к е п, А. Е. Hill, С. W. Peters, G. W e i n r I с h, Phys. Rev. Lett. 7, 118 A961). 2. J. A. Armstrong, N. Bloembergen, J. Duelling, P. S. Pershan Phys. Rev. 127, 1918 A902). 3. N. Bloembergen, P. S. Pershan, Phys. Rev. 128, 606 A902). 4. N. Bloembergen, Nonlinear Optics, W. A. Benjamin, Inc., New York, 1965; (H. Бломбсрген, Нелинейная оптика, «Мир», 1966.) P. S. Р и г s h a n, u сб.: «Progr. in Optics», ed. E. Wolf, Korlh Holland Publ. Co , Amster- dam, J. Wiley a. Sons, N. Y., 1965, p. 83; P. A. E r a n k e n, J. E. War d, Rev. Mod Phys. 35, 23 A963). 5. A. S о m ra e r i e 1 d, Electrodynamics, Acad. Press. New York, 1952. 6. J. A. S t г a t t о n, Electromagnetic Theory, McGraw-Hill, New York, 1941. (Дж. А. Стрэттон, Теория электромагнетизма, ИЛ, 1948.) 7. W. С. R б n t g e n, Ann. d. Physik 35, 264 A888); 40, 93 A890). S. E. Bergstrand, в кн. «Encyclopedia of Physics», ed. S. Fliigge, Springer, Berlin, 1956, Vol. 24, p. 1. 9. R. Т. В i r g e, в сб. «Rep. Progr. Phys.», The Phys. Soc. London, 1941, Vol. 8, p. 90. 10. L. В о 1 t zm a n n, Wien. Ber. 69, 795 A874); Pogg. Ann. 155, 403 A875); Wiss. Abh. Phvsik-techn. Reichsanst. 1, № 26, 537. 11. A. Sommerfeld, Ann. d. Physik 44, 177 A914). 12. L. Brillouin, Ann. d. Physik 44, 203 A914). 13. L. Brillouin, Wave Propagation and Group Velocity, Acad. Press, New York, 1960, pp. 17, 43. *) Свойства системы двойных слоев подробно рассматриваются в статье [42].
82 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [ГЛ. 1 14. Н. G. B-a е rw a 1 4, Ann. d. Physik 6, 295 A930); 7, 731 A930); 8, 565 A931). 15. F. В о г g n i s, Z. Phys. 117, 642 A941). 16. L. .1. F. Broer, Appl. Sri. Res A2, 329 A951). 17. H. P о i n с а г ё, Theorie Mathematique de la Lumiere, Georges Carre, Paris, 1892, Vol. 2, Ch. 12. 18. H. G. J e r r a r d, J. Opt. Soc. Amer. 44, 634 A954). 19. M. J. Walker, Amer. J. Phys. 22, 170 A954). 20. S. Pancharatnam, Proc. Indiam Acad. Sci. A44, 247 A956). 21. A. N i s b e t, E. W о 1 f, Proc. Cambr. Phil. Soc. 50, 614 A954). N 22. О. Д. X в о л ь с о и, Курс физики, РСФСР, ГИЗ, Берлин, 1923, т. 2, стр. 623.( 23. W. С u I s h a w, D. S. Jone s, Proc. Phys. Soc. B66, 859 A954). 24. .1. Picht, Ann. d. Physik, 3, 433 A929). 25. F. Abeles, Ann. de Physique 5, 596—640, 70fi—782 A950). 2G. H. Mayer, Physik dunner Schichten, Wissenschafthche Verlagsgessellschaft, Stuttgart, 1950. 27. S. Methfessel, Dunne Schichten, VEB Wilhelm Knapp Verlag, Halle (Saale), 1953. (С. М е т ф е с с е л ь, Тонкие пленки, их изготовление и измерение, Госэнергоиздат, 1963.> 28. О. S. H eavens, Optical Properties of Thin Solid Films, Butterworths Sci. Publ., London,. 1955. 29. R. B. M u ch mor e, J. Opt. Soc. Amer. 38, 20 A948). 30. K. Schuster, Ann. d. Physik 4, 352 A949); R. К г о n i g, R. S. В 1 a i s s e, J. J. v. v. Sande, J. Appl. Sci. Res. Bl, 63 A947). 31. R. Jacobsson, в сб.: «Protjr. in Optics», ed. E. Wolf, North Helland Publ. Co., Amster- dam, J. Wiley a. Sons, N. Y , 1965, p. 247. 32. M. Born, Optik, Springer, Berlin, 1933. (M. Бори, Оптика, ГНТИУ, 1937.) 33. G. В. Airy, Phil. Mag. 2, 20 A833). 34. G. B. Airy, Ann. Phys. a. Chem. 41, 512 A837). 35. K. Hammer, Z. techn. Phys. 24, 169 A943). 36. R. Messner, Zeiss Ndchr. 4, (H9), 253 A943). 37. H. Schroder, Optik 3, 499 A948). 38. R. L. Mo one y, J. Opt. Soc. Amer. 36, 256 A946). 39. W. Weinste'in, J. Opt. Soc. Amer. 37, 576 A947). 40. Applied Mathematics Series 9, Nat. Bur. Stand. Washington, 1952. 41. Higher Transcendental Functions, Bateman Manuscript Project, McGraw-Hill, New 'York, 1953, Vol. 2, p. 1S3. 42. С Dufour, A. H e r p i n, Rev. d'Opt. 32, 321 A953). 43. P. Gucomo, C. R. Acad. Sci. 235, 1027 A952). 44*. Г. Д. R yp ду н, Единицы физических величин, Стаидартгиз, 1962, стр. 29. 45*. С. А. А х м а н о в, Р. В. X о х л о в, Проблемы нелинейной оптики (Электромагнит- ные волны в нелинейных диспергирующих средах), 1962—1963. Ин-т научной информации АН СССР, 1964. 46*. В. М. Ф а й и, Я- И. X а и и н, Квантовая радиофизика, «Сов. радио», 1965. 47*. Л. И. Мандельштам, Phys. Z. 15, 220 A914); Полное собрание трудов, изд. АН СССР, 1948, т. 1, стр. 261.
ГЛАВА 2 ЭЛЕКТРОМАГНИТНЫЕ ПОТЕНЦИАЛЫ И ПОЛЯРИЗАЦИЯ В предыдущей главе влияние вещества на электромагнитное поле выража- лось через ряд макроскопических постоянных. Однако область их применения ограничена и фактически, пользуясь ими, нельзя адекватно описать такие про- цессы, как излучение, поглощение и дисперсия света. Полное описание этих явлений потребовало бы подробного изучения атомистики и поэтому выходит за рамки настоящей книги. Можно, однако, адекватно описать взаимодействие поля и вещества при помощи простой модели, вполне применимой для большинства разделов оптики. Для этой цели каждый из векторов D и В выражают в виде суммы двух членов *% Один из них считают равным соответствующему вектору поля в вакууме и по- лагают, что другой описывает влияние среды. Таким образом, мы приходим к необходимости ввести два новых вектора для описания влияния вещества: электрическую поляризацию Р и магнитную поляризацию, или намагничение М. Вместо материальных уравнений A.1.10) и A.1.11), связывающих D и В с Е и Н, теперь появятся уравнения, связывающие Р и М с Е и Н. Эти новые уравнения имеют более прямой физический смысл и приводят к следующей кон- цепции распространении электромагнитного поля в среде. Электромагнитное поле создает в данном элементе объема известные степени поляризации Р и М, которые в первом приближении пропорциональны полю, причем коэффициент пропорциональности служит мерой реакции поля. Тогда каждый элемент объема становится источником новой вторичной, или рассеянной, волны, амплитуда 'которой простым образом связана с Р и М. Все вторичные волны комбинируются друг с другом и с падающим полем и об- разуют полное поле, причем именно оно и считается основным. Формализуя сказанное выше, мы получим два интегральных уравнения **), которые, как легко показать, эквивалентны дифференциальным уравнениям Максвелла, но описывают распространение электромагнитного поля способом, более ясно свя- занным с атомным строением вещества. Из теории будут получены следующие два основных результата: 1) формула Лорентц—Лоренца***), которая связывает макроскопические оптические свойства среды с числом и свойствами рассеивающих частиц, и 2) так называе- мая теорема погашения Эвальда и Озеена, которая показывает, каким образом внешнее электромагнитное возмущение, распространяющееся со скоростью света в вакууме, точно компенсируется и заменяется в веществе вторичным воз- мущением, распространяющимся с соответственно меньшей скоростью. *) Согласно замечанию на стр. 24 правильнее было бы писать Н вместо В. Отступление от обшей теории делается здесь просто ради удобства иметь положительные знаки в правой части уравнения B.2.2), как это обычно принято. '**) В случае немагнитных веществ остается лишь одно интегральное уравнение. Второе уравнение, переходит в относительно простое выражение для магнитного поля, н сто можнф найти, кохда получено решение первого уравнения. Рассматриваемые здесь «материальные» интегральные уравнения необходимо отличать от «геометрических» интегральных уравнений, которые применяются при изучении некоторых дифракционных проблем (см. рл. 11). ***) В русской литературе фамилии обоих ученых (Lorentz и Lorenz) обычно транскриби- руются одинаковым образом — Лоренц. Однако поскольку в тексте встречаются ссылки на каждого из авторов в отдельности, мы сочли целесообразным принять тоже встречающуюся в ряде случаев разную транскрипцию. (Прим. ред.)
84 ЭЛЕКТРОМАГНИТНЫЕ ПОТЕНЦИАЛЫ И ПОЛЯРИЗАЦИЯ [ГЛ. 2 Теория дает и другой математический подход к рассмотрению некоторых проблем электромагнитной теории. Мы проиллюстрируем его выводом законов преломления и отражения и формул Френеля, а затем решением более сложной проблемы в гл. 12. ( Вывод этих результатов потребует несколько другого математического аппарата. Поэтому вначале мы рассмотрим представление электромагнитного поля через так называемые запаздывающие потенциалы, которые являются обобщениями хороню известных статических потенциалов. Выражение потенци- алов через векторы поляризации приводит к необходимости ввести другие вспомогательные величины, известные как векторы Герца. В §§ 2.1 и 2.2 мы рассмотрим математические предпосылки, а в § 2 3 кратко изложим исходные физические понятия. Интегральные уравнения и упоминавшиеся выше две ос- новные теоремы будут выведены в § 2.4. §2.1. Электродинамические потенциалы в вакууме 2.1.1. Векторные и скалярные потенциалы. Рассмотрим электромагнитное поле в вакууме, обусловленное заданным распределением зарядов р (г, I) и то- ков j (r, t). Оно удовлетворяет уравнениям Максвелла A.1.1)—A.1.4). В ваку- уме D= Е и В= Н, и эти уравнения можно переписать в виде A) <2> divE = 4n;p, C) divB = 0. D) Так как дивергенция ротора любого вектора равна нулю, то уравнение D) будет удовлетворяться, если положить В = rot A, E) где А —« произвольная векторная функция координат и времени. Если соотно- шение E) подставить во второе уравнение Максвелла, мы получим fA) = o. F) Уравнение F) будет удовлетворяться, если Е = — 1а — grad(p; G) здесь ф — произвольная скалярная функция. Величины А и ср необходимо оп- ределить таким образом, чтобы удовлетворить оставшимся уравнениям Макс- велла. Подставляя E) и G) в A) н C) и используя тождества rot rot = grad div — V2 и div grad = V3, получим (8) V2q>—^-cp-f"jJ^divA+-i-(p) = — 4яр„ (9) Если связать А и ср соотношением div А 4-7 Ф = 0, A0)
§ 2.11 ЭЛЕКТРОДИНАМИЧЕСКИЕ ПОТЕНЦИАЛЫ В ВЯКУУМЕ 85 то (8) и (9) перейдут в неоднородные волновые уравнения A1) V2cp—^Ф = -4 Функции А и ф, из которых посредством соотношений E) и G) можно опреде- лить В и Е, известны как магнитный векторный потенциал и электрический скалярный потенциал соответственно. Соотношение A0), связывающее оба по- тенциала, называется условием Лорентца. Заметим, что оно согласуется с урав- нением непрерывности A.1.5) p+divj=O. A3) Легко показать, что выражения A1), A2) и A0) не определяют потен- циалы однозначно. Действительно, если мы добавим к А вектор grad %, где % произвольно, то В не изменится, а если, кроме того, ф заменить на ф—%!с, то Е также не изменится. Другими словами, В и Е инвариантны при преобра- зовании А' = A + gradx, A4а) <р' = ф— J-X- A46) Из A0) и A4) получим (^) A5) Следовательно, А' и <р' будут удовлетворять соотношению Лорентца, если на х наложить условие V2X—^х==°- A6) Уравнения A4), подчиняющиеся условию AG), выражают так называемое калибровочное преобразование. Калибровочное преобразование можно исполь- зовать для упрощения записи векторов поля. Например, в области с нулевой плотностью заряда р величина ф удовлетворяет однородному волновому урав- нению ?2Ф—4гФ = 0; A7) тогда величину % можно выбрать так, чтобы скалярный потенциал оказался равным нулю. Согласно A46) и A6) для этого необходимо положить Х=с$ф<Й. A8) Поле можно найти с помощью одного лишь векторного потенциала посредством соотношений *) (штрих над А опущен) В = rot А, Е = -уА, A9) тогда как условие Лорентца переходит в divA = 0. B0) 2.1.2. Запаздывающие потенциалы. Рассмотрим решения неоднородных волновых уравнений A1) и A2) дли векторного и скалярного потенциалов, под- чиняющиеся соотношению A0), и покажем вначале, что этим уравнениям *') Уравнение A9) описывает поле в свободной от зарядов области в вакууме тремя ска- лярными волновыми функциями (декартовы компоненты вектора А). Из-за соотношения B0). их, однако, нельзя считать независимыми. Нетрудно показать, что фактически в такой области поле определяется двумя вещественными скалярными волновыми функциями (см., например, U-3]).
86 ЭЛЕКТРОМАГНИТНЫЕ ПОТЬНЦИ\ЛЫ И ПОЛЯРИЗАЦИЯ [ГЛ. 2 удовлетворяют следующие функции: А (г, Q = lJHr'-?-«/cW', B1) Ф(г, t)^l^Jf^dV. B2) Здесь Я = | г-г'|=J/"(*—х'J + (г/-г/'J + (г— г'K B3) <— расстояние между точкой г (*, г/, г) и точкой г'(х', г/', г') элемента объема dV. Интегрирование проводится по всему пространству. Чтобы убедиться в том, что B2) удовлетворяет неоднородному волновому уравнению для скалярного потенциала, мы вообразим, что точка г окружена сферой радиуса а с центром в этой точке, и разделим B2) на две части Ф = Ф* + Ф«, B4) где ф!— вклад и интеграл от внутренней части сферы, а <р2— вклад от осталь- ной части пространства. Так как ЯфО для каждой точки г' (х1, у', г') вне сфе- ры, то <ра можно продифференцировать под знаком интеграла. Тогда прямым расчетом легко убедиться, что ф2 удовлетворяет однородному волновому урав- нению V2cp2—?$, = 0. B5) При этом ясно, что <р. представляет суперпозицию ряда сферических волн (см. уравнение A.3.12)). В случае epi мы должны, однако, поступить иначе, так как подынтегральное выражение имеет особенность в центре сферы R = 0. Заметим, что, выбрав радиус сферы достаточно малым, можно добиться того (при условии, что р —¦ непрерывная функция г и /), чтобы для всех точек г' пнутри сферы p(r', t—Ric) отличалось от p(r, t) на величину, меньшую любого наперед заданного значения. Следовательно, когда радиус а стремится к нулю, V^epi будет все более и более приближаться к значению, соответствующему электростатическому потенциалу равномерно заряженной сферы с плотностью заряда р; т. е. для достаточно малых а имеем V2?! = —4яр(г, 0- B6) Аналогично <pi-v 0, когда а-> 0. В самом деле, если а достаточно мало, мы мо- жем написать а Ф, = р (г, t) j ^ = 4яр J R dr = 2ла3р'; B7) Жа 0 а эта величина стремится к нулю при уменьшении а. Следовательно, из B4)—> B6) вытекает, что при а-*- 0 qp=V!(? + ?)^(Ф+Ф)——4лр(г, t), B8) так что B2) удовлетворяет неоднородному волновому уравнению для скаляр- ного потенциала. Совершенно аналогичным способом можно показать, что каж- дая из декартовых компонент вектора B1) является решением соответствую- щего скалярного волнового уравнения, неоднородный член которого содержит вместо (> соответствующую компоненту вектора Iс. Следовательно, B1) удовле- творяет неоднородному волновому уравнению для векторного потенциала. Бо- лее того, в силу справедливости уравнения непрерывности A3) эти решения удовлетворяют также условию Лорентца A0). Выражения B1) и B2) допускают простую физическую интерпретацию. Они показывают, что мы можем считать А и ф состоящими из вкладов от каж- дого элемента объема пространства, причем вклады от произвольного элемента
$ 2.2] " Поляризация и намагничение " '87 ¦dV в А и ф составляют соответственно 1 j(r', t—Ric) р(г', t—Ric) И с R И R • Величина Rlc в точности равна времени, необходимому для распространения •света от точки г' до г, так что каждый вклад должен «покинуть» элемент в такой предыдущий момент времени, чтобы «достичь» точки наблюдении в требуемое время t. По этой причине B1) и B2) называют запаздывающими потенциа- лами *). Выражения B1) и B2) представляют собой частное решение волновых уравнений A1) и A2), а именно такое, которое получается при заданных заря- дах и токах. Общее решение можно найти, если добавить к нему общее решение однородных волновых уравнений VA—^-А = 0, B9) 72Ф—4гФ = 0, C0) также подчиняющееся условиго Лорентца. § 2.2. Поляризация и намагничение 2.2.1. Выражение потенциалов через поляризацию и намагничение. В гл. 1 мы привлекали к изучению поля материальные уравнения D=eE и В — цН. Они означают, что поля Е и Н в каждой точке среды вызывают некие смещения D и В, пропорциональные Е и Н. Вместо того чтобы описывать взаимодействие поля и среды посредством таких «мультипликативных соот- ношений», мы будем описывать его с помощью «аддитивных соотношений» D = E + 4nP, A) В = Н + 4лМ. B) величина Р называется электрической поляризацией, а М — магнитной поля- ризацией или намагничением. Физический смысл этих величин выяснится поз- же; здесь мы заметим только, что и Р и М равны нулю в вакууме, и поэтому они отражают влияние среды на поле простым, интуитивно понятным способом. Предположим, что среда является непроводящей (а=0), и рассмотрим поле в области, где плотности тока и заряда равны нулю ((> = j= 0). Исключая JD и Н из уравнений Максвелла A.1.1)—A.1.4) посредством A) и B), получим iE = ^b C) B = 0, D) divE = 4itp, E) divB — 0, F) где плотность свободного тока j и плотность свободного заряда р определяются соотношениями j=P + crotM, G) р = —divP. (8) *) Можно сконструировать решения также н форме опережающих потенциалов (с (tJ-Rlc) вместо (t—Rlc)). Они представляют влияние приходящих сферических волн, тогда как запазды- вающие потенциалы отражают влияние уходящих сферических волн. За счет некоторой формальной асимметрии мы можем ограничиться решениями в виде одних запаздывающих потенциалов. При термодинамическом рассмотрении взаимодействия излучения с веществом оказывается, что асимметрия присуща физической ситуации. Это оправ- дывает наш выбор (ем. [4], особенно, стр. 26),
88 ЭЛЕКТРОМАГНИТНЫЕ ПОТЕНЦИАЛЫ И ПОЛЯРИЗАЦИЯ [гЛ ? Уравнения C)—F) формально идентичны уравнениям для поля в вакууме^ рассмотренным в предыдущем разделе. Следовательно, как и в случае вакуума, мы можем ввести такие векторный потенциал А и скалярный потенциал го, что В = rot А, (9) Е = — у A—gradtp. A0) Кроме того, если наложить, как и ранее, условие Лорентца divA+_L<p=O, (И) то по аналогии с B.1.11) и B.1.12) мц получим следующие уравнения для А »ср: Условие A1) согласуется с A2) и A3), если = 0. A4) Это соотношение удовлетворяется тождественно, что легко получить из G) и (8), использовав векторное тождество div rot=0. Согласно B.1.21) и B.1.22), а также G) и (8) решения уравнений A2) и A3) можно выразить через поляризацию и намагничение в виде A5) A6) Здесь дифференциальные операторы div' и rot' берутся для координат (х', у', г') точки интегрирования г' в элементе объема dV, а квадратные скобки озна- чают запаздывающие значения, т. е. внутри каждой скобки аргумент ^заменяется на t—Rlc. Прямой расчет позволяет получить следующие тождества: div'[P] = [div'P]+iR-[P], A7а) rot'fM] = [rot'M]+^-Rx[M], A76) R-=r—r'. A8) Следовательно, A5) и A6) можно записать в виде } A9) V. B0) Из первого члена каждого интеграла можно выделить интеграл по гранич- ной поверхности. Для этого воспользуемся векторными тождествами -L, B1а) rot(-iM)=-^-rotM—Mxgrad^-. B16) Интегрируя приведенные соотношения до произвольной конечной области
5 2.2] поляризация и намагничение и используя теорему Гаусса, получим B2а) . B26) Интегралы слева берутся по поверхности, ограничивающей эту область, п—единичный вектор внешней нормали к поверхности. Предположим, что вещество (т. е. область пространства, где Р и М отличны от нуля) находится внутри конечной замкнутой поверхности. Если интегралы A9) и B0) берутся по объему, заключенному внутри этой поверхности, то по- верхностные интегралы в B2) равны нулю, а A9) и B0) можно записать в виде V", ' B3) А = j | [М] Xgrad' -L-jJj R x [M] +^ [Р] j-dV. B4) Последние выражения позволяют понять физический смысл величин Р и М. В самом деле, рассмотрим случай, когда Р и М равны нулю всюду, кроме печезающе малого элемента объема вблизи точки го(Хо, У а, г0). Формально это можно записать с помощью дельта-функции Дирака (см. приложение 4) в виде Р(г\ 0=Р(О6(г--го), B5) M(r\ t) = m(()&(r' — г„). B6) Тогда B3) и B4) перейдут в <P=[p]-grado-?- + -^R.[p], B7) А = [ш] Xgrad.' ±—ap Rx[m]4-^ [р], B8) где R = r—г„, /? = | г—г01. B9) a grade означает, что оператор берется относительно координат х0, у„, г0 точки г0. Уравнения B7) и B8) допускают простую интерпретацию. Рассмотрим электростатический потенциал двух фиксированных электрических зарядов —е и +е, расположенных в точках, радиусы-векторы которых относительно фикси- рованной точки Qc(r0) равны — а/2 и а/2 соответ- ственно. Кулоновский потенциал ф (R), связан- ^ ный с этими зарядами, равен (рис. 2.1) г +е* е , . Рис. 2.1. К расчету потенциалов ф = -т- —. C0) электрического диполя. Если а достатЬчно мало, можно разложить l/R,2 по степеням компонент а; имеем i = i + a-grad^ + ..., C1) где операция grad берется по координатам точки, в которой расположен заряд —е. Пренебрегая в C1) членами более высоких порядков, получим вместо соот- ношения C0) (p-ea-grad-i- = e^i. C2) Пусть а постепенно уменьшается, а е неограниченно увеличивается таким
tH ЭЛЕКТРОМАГНИТНЫГ ПОТЕНЦИАЛЫ И ПОЛЯРИЗАЦИЯ [ГЛ. 2 образом, что еа стремится к конечному значению р, т. е. C3) а ~* о Тогда R, приближается к R, и в пределе C2) примет вид L. C4) В частном случае, когда р не зависит от времени, это выражение идентично B7). Если заряды зависят от времени, но в каждый данный момент различаются лишь знаком, то вместо C0) получим Снова переходя к пределу, найдем что совпадает с B7). Итак, B3) можно интерпретировать как скалярный по- тенциал распределения электрических диполей с моментом Р в единице объема. Легко показать, что последний член в B8) является магнитным потенциалом, создаваемым этими диполями. Аналогично можно показать, что B8) является векторным потенциалом магнитного диполя с моментом т(/), причем такой диполь, конечно, эквива- лентен бесконечно малому замкнутому контуру с площадью А, нормальному к m и несущему ток *"), равный cm'А. Следовательно, два первых члена в B4) можно интерпретировать как векторный потенциал распределения магнитных диполей с моментом. М в единице объема. 2.2.2. Векторы Герца. Вместо того чтобы использовать потенциалы А и tp, мы можем выразить поле через другую пару потенциальных функций Пе и Пт, зависимость которых от Р и М имеет значительно более простой вид. Они известны как векторы Герца, или поляризационные потенциалы **), и вводятся посредством соотношений ^ C6) Ф = —divlle. C7) Как мы видим Пе и Пт связаны с А и ср такими же соотношениями, как поля- ризации Р и М с /7с и р. Условие Лорентца при этом автоматически выполняется, а уравнения {12) и A3) для А и <р также будут удовлетворяться, если П„ и Пт являются ре- шениями неоднородных волновых уравнений V2IIe—^Пе = — 4яР, C8) ГИт—^Пи = -4яМ.> C9) Согласно § 2.1 частные их решения можно выразить через запаздывающие *) Бесконечно малые токи Ампера рассматриваются в любом учебнике по электричеству» а также в книге E1 на стр. 305—306 (в русском переводе ни стр. 411—412). **) Векторы Пе и П/л преобразуются аналогично ыскторам Е и В (или D и Н), т. е. об- разуют 6-еектор (антисимметричный тензор второго ранга). Они являются обобщениями некой потенциальной функции, введенной Г. Герцем для электромагнитного поля осциллирующего диполя [61. Векторный характер потенциала Герца был замечен А. Ричи [71, которыи ввел •соответствующий магнитный потенциал Общая теория векторов Герца и соответствующего калибровочною преобразования развита d работах [8] (см. также [91).
§ 2.2) ПОЛЯРИЗАЦИЯ И НАМАГНИЧЕНИЕ 91 потенциалы в виде ^ЛГ, D0) Векторы поля можно выразить непосредственно через Пе и Пт простым дифференцированием. Из (9) и C6) получим (| nM), D2) а из A0), C6) и C7) найдем Е = - Т Ъ {т Й- + rot п- ) + §rad div П^ ) (ne-ln(!)t D3) где использовано тождество grad div=rotrot+V2. Согласно C8) член во вто- рых скобках равен —4яР. Следовательно, используя A), находим ) D4) Наконец, из B), D2) и C9) имеем Н = rot A. Пе + rot Пт ) + ( ГПт -1 Пй ) == В § 2.1 было показано, что потенциалы А и гр, связанные с данным полем, не- однозначны; любая другая пара (A', q;'), которую можно получить из возмож- ной пары (А, (р) посредством калибровочного преобразования B.1.14), будет представлять то же поле. Векторы Герца также неоднозначны. Их можно под- вергнуть следующему преобразованию, которое оставит векторы поля неиз- менными: Щ = П/+ rot F -grad G, П; = ПИ—i-F, D6) где векторная функция F и скалярная функция G — произвольные решения однородных волновых уравнений V2F — ^-F = 0, V-G—~G = 0. D7) Инвариантность векторов поля относительно такого преобразования легко по- казать, подставляя D6) в C6) и C7). Величины А и ф при этом преобразуются в А' и ф' согласно B.1.14) с х=-тс. Кроме того, подстановка D6) в C8) и C9) показывает, что We и Wm также удовлетворяют неоднородным волновым уравнениям для векторов Герца. 2.2.3. Поле линейного электрического диполя. Для дальнейшего полезно записать в явном виде полные решения уравнений поля в вакууме для поли, создаваемого линейным электрическим диполем, расположенным в точке г„ и колеблющимся в фиксированном направлении, определяемом единичным век- тором п. Такой диполь характеризуется электрической поляризацией Р(г, 0 = Р@«(г—г„)п, D8) где р — функция времени, а б — дельта-функция Дирака, В общем случае
92' ЭЛЕКТРОМАГНИТНЫЕ ПОТЕНЦИАЛЫ И ПОЛЯРИЗАЦИЯ [гл. 2 диполь с ориентацией п, также зависящей от времени, эквивалентен трем ли- нейным диполям, дипольные моменты которых ориентированы вдоль трех вза- имно перпендикулярных направлений. Согласно D0) электрический вектор Герца, связанный с D8), равен Ee = p{t-R/C)n, D9) где R — расстояние точки г от точки г0. Так как JJm = O, а Пс удовлетворяет всюду (кроме начала координат) однородному волновому уравнению для вакуума, уравнения D2)—D5) сво- дятся к Используя тождество rot rot = grad div—Vs и соотношение V2He = ^- tte, мож- но переписать E0) в виде E = D = graddivIIe—^-fi^. E2) Из D9) после простого .расчета получим 3[р] , [р] _Ш+ШП) grad divII2= где, как и раньше, величины в квадратных скобках соответствуют запаздываю- 2 щим значениям. Подставляя эти выражения в E2) и E1), получим искомые формулы для векторов поля, а именно 3[р] , 3[р1 . U Рис. 2.2. Расчет поля линепного электрического диполя с: диполь- ным моментом вдоль оси г. E4) Позже нам понадобятся также выражения для Е и Н в сферических координатах. Выби- рая направление п в качестве оси г (рис. 2.2) и обозначая через \R, ц и i^ единичные век- торы в направлении увеличения R, 6 и ip, получим n = (cos9)i«— (sin9) ie, Тогда E3) и E4) дают где nxR = («sin9)i,+. E5) E5) E7)
$ 2.2] ПОЛЯРШАЦИЯ И НАМАГНИЧЕНИЕ - 93 Таким образом, электрический вектор лежит в меридиональной плоскости, проходящей через ось диполя, а магнитный вектор перпендикулярен этой пло- скости. Особый интерес представляет поле в области, которая настолько удалена от диполя, что в приведенных выше уравнениях можно пренебречь всеми чле- нами, кроме членов первого порядка относительно 1/R, Эта волновая (или радиационная) зона характеризуется тем, что для нее 4 , R^cll , E8) р I p В этой области ЕЬ~Н„~ Д|-sine, E9) а другие компоненты пренебрежимо малы. Следовательно, в волновой зоне век- торы Е и Н по величине равны между собой и перпендикулярны друг к другу и к радиус>-вектору R, который совпадает там с направлением вектора Пойн- гинга. Поэтому в этой зоне структура поля линейного электрического диполя подобна структуре поля плоской волны. Однако в случае диполя на каждой «волновой поверхности» (сфере с центром в точке г») векторы поля меняются от точки к точке, уменьшаясь по величине от экватора к полюсам, причем на оси осциллятора они равны нулю. Поэтому диполь не излучает энергии в на- правлении своей оси. Рассчитаем количество энергии, излучаемой за 1 сек через каждую сфери- ческую волновую поверхность Оно равно интегралу от величины вектора Пойнтинга S, взятому по этой поверхности. В волновой зоне Следовательно, общее количество энергии, протекающее через сферическую поверхность в секунду, равно (da обозначает элемент поверхности) огз • (Ы) Рассмотрим специальный случай, когда р (t) является периодической функ- цией t с угловой частотой со, т. е. рA)=р^-ш, F2) где ра— комплексная постоянная. Будем считать, что вещественная часть F2) представляет р. Два условия E8) теперь сводятся к одному R > Х/2л. (Я — 2яс/со), F3) а E9) дает для неисчезающих компонент поля в волновой зоне выражение р{-у-1^У: F4) предполагается, что берется вещественная часть выражения, стоящего в правой части F4). Количество энергии, проходящее в секунду через единичную пло- щадь сферической поверхности в волновой зоне, равно S = U (тL1~Ж sin2ecoSa [@ {t_m_a], F5) где а — фаза р0- Отсюда, усредняя по времени за интервал времени, большой по сравне- нию с периодом Т — 2я/ю, получим <*>=ё??8ш1в- F6)
94 ЭЛЕКТРОМАГНИТНЫЕ ПОТЕНЦИАЛЫ И ПОЛЯРИЗАЦИЯ [ГЛ. 2 Поэтому энергия (усредненная по времени), проходящая в секунду через всю поверхность, равна j Mj!^ F7) §2.3. Формула Лорентц — Лоренца и элементарная теория дисперсии*) 2.3.1. Диэлектрическая и магнитная восприимчивости. Интерпретация потенциалов при помощи поляризации и намагничения имеет фундаментальное значение в теории атомного строения вещества. В рамках такой теории адди- тивные соотношения B.2.1) и B.2.2), связывающие поле Е с D и Р и поле Н с В и М, имеют более ясный физический смысл, чем мультипликативные соот- ношения (материальные уравнения A.1.10) и A.1.11)). В этой теории вещество рассматривается как совокупность взаимодейст- вующих частиц (атомов и молекул), находящихся в вакууме. Такие частицы об- разуют поле, которое испытывает большие локальные колебания внутри вещества. Эго внутреннее поле видоизменяется любым полем, которое прикла- дывается извне, и свойства вещества находят путем усреднения по полному полю внутри него. Поскольку область, по которой проводится усреднение, велика по сравнению с линейными размерами частиц, их электромагнитные свойства можно отождествить со свойствами электрического и магнитного ди- полей; тогда вторичное ноле совпадает с нолем таких диполей (с запаздывани- ем). Фактически именно это мы только что описали, рассматривая вещество как некое непрерывное распределение, взаимодействующее с полем: такой подход соответствует первому приближению теории атомного строения (для медлен- ного изменения в пространстве). В этом приближении для достаточно слабых полей * *) мы можем, предположить, что Р и М пропорциональны соответственно Е и Н, т. е. Р = т|Е, М = ХН. A) Множитель т] называют диэлектрической восприимчивостью, а. % — магнитной восприимчивостью, причем последняя является понятием, которое широко при- меняется в практических приложениях магнетизма. Сравнивая A), B.2.1) и B.2.2) с материальными уравнениям» A.1.10) и A.1.11), получим, что ди- электрическая проницаемость е и магнитная проницаемость |г связаны с ди- электрической и магнитной восприимчивостямн соотношениями s=1+4ju|, ц = 1+4лх. B) Посредством B) обеспечивается полная формальная эквивалентность «мульти- пликативного» и «аддитивного» подходов. Но при таком формальном сравнении постоянных не используются никакие следствия из факта атомного строения вещества. Детальное рассмотрение, учитывающее результаты теории атомного строения, выходит за рамки настоящей книги, однако будет полезно ввести ряд необходимых понятий и формул. С их помощью мы достигнем более ясного понимания физического содержания интегральных уравнений, которые будут введены в § 2.4 вместо обычных дифференциальных уравнений теории Мак- свелла. *) В настоящем разделе мы отклонимся от нашей дедуктивной схемы, чтобы достичь белее ясного понимания явлений перед тем, как сформулировать интегральные уравнения, которые будут введены в § 2.4 вместо дифференциальных уравнений Максвелла. Рассмотрение здесь носит скорее иллюстративный, чем строгий характер, так как строгая теория включала бы большую часть теории атомного строения материи и увела бы нас далеко за разумные границы этой книги. **) Поле считается сильным на атомном уровне, если электростатическая энергия элект- рона меняется на заметную долю ионизационного потенциала атома на расстоянии, равном диа- метру атома, т. е. к сильным относят поля в миллионы вольт на сантиметр. В действительности же в реальных веществах электрический пробой наступает при значительно меньших полях.
§ 2.3] ФОРМУЛА ЛОРЕНТЦ— ЛОРЕНЦА И ТЕОРИЯ ДИСПЕРСИИ? 95 Простейшее предположение, служащее первым шагом учета атомной струк- туры вещества, заключается в рассмотрении вещества как совокупности опре- деленных физических объектов —- молекул, которые могут поляризоваться и, следовательно, приобретать под действием внешнего поля электрический и магнитный моменты. В первом приближении можно предположить, что ком- поненты этих моментов являются линейными функциями компонент поля; в общем случае направление вектора момента не совпадает с направлением поля. Из этого предположения вытекает много следствий, на которых здесь мы остановимся лишь очень кратко. Мы ограничимся изотропными немагнитными веществами и рассмотрим вначале зависимость электрических постоянных от плотности для вещества, состоящего из одинаковых молекул. Мы исследуем так- же зависимость показателя преломления от частоты. Здесь мы приведем лишь несколько упрощенные рассуждения, а строгий, хотя и более формальный, вы- вод главного результата (формулы Лорентц — Лоренца) будет изложен в § 2.4. 2.3.2. Эффективное поле. Прежде всего необходимо различать эффек- тивное поле Е', Н', действующее на молекулу, и среднее, или наблюдаемое, поле Е, Н, полученное усреднением по области, которая содержит множество молекул. Различие между этими двумя полями обусловлено промежутками между молекулами и зависит от числа молекул в единице объема (их концент- рации N), Для того чтобы оценить разность Е'— Е, рассмотрим отдельную молекулу и вообразим, что она окружена небольшой сферой, радиус которой, тем не ме- нее, велик по сравнению с ее линейными размерами. Мы отдельно рассмотрим влияние на центральную молекулу вещества, находящегося снаружи и внутри этой сферы. При определении влияния среды, расположенной вне сферы, очевидно, можно пренебречь молекулярной структурой и считать среду непрерывной. Тогда мы имеем право предположить, что вне сферы поляризация Р, создавае- мая средним электрическим полем, постоянна. Мы предположим далее, что мо- лекулы, находящиеся внутри сферы, не создают какого-либо результирующего поля вблизи центральной молекулы. Это можно показать для ряда важных спе- циальных случаев, в том числе для случая хаотического распределения. Следо- вательно, мы имеем право считать, что молекула расположена в такой сфериче- ской области, внутри которой вакуум, а вне — равномерно поляризованная среда. Теперь нужно определить потенциал ср подобной конфигурации, т. е. потенциал, создаваемый свободными зарядами, находящимися на сферической поверхности разрыва, на которой величина Р меняется от значения, равного нулю внутри сферы, до постоянного значения вне сферы. Для этой цели рассмотрим потенциал <р «дополнительной» конфигурации, а именно однородно поляризованной сферы, находящейся в вакууме. Супер- позиция таких двух конфигураций дает равномерно поляризованную среду» свободную от всяких границ. Следовательно, потенциал, обусловленный границей, равен нулю, и мы имеем Потенциал ф можно сразу получить из B.2.23), считая Р постоянным, Так как R = V(x-x'f+ {у- у')' + (г- г')\ мы можем в D) заменить grad' на —grad и написать
S6 ЭЛЕКТРОМАГНИТНЫЕ ПОТЕНЦИАЛЫ И ПОЛЯРИЗАЦИЯ [ГЛ. 2 где Ф. —Jx« (В) Последнее выражение можно рассматривать как потенциал однородно заря- женной сферы с плотностью заряда, равной —1. Следовательно, оно удовлетво- ряет уравнению Пуассона Vs<p0 = 4я. G) Теперь компоненты поля, связанного с потенциалом E), запишутся в виде и т. д. Из условия симметрии в центре поля имеем <Эд;а (Ю) Используя G), находим, что каждый член равенств A0) равен 4зг/3; тогда вы- ражение (8) показывает, что искомый вклад в эффективное поле равен -V<p = -^P. (II) Полное поле внутри сферы, которое представляет собой эффективное поле, действующее на центральную молекулу, получается при добавлении к этой величине среднего поля Е, т. е. E'-E + ipP. A2) Соответствующее соотношение между Н', Н и М существует и для магнитных веществ. Однако, поскольку нас интересуют лишь немагнитные вещества, мы всегда будем полагать Н'= Н. Далее свяжем поляризацию Р с плотностью. 2.3.3. Средняя поляризуемость. Формула Лорентц — Лоренца. Как уже говорилось выше, мы будем предполагать, что для каждой молекулы электри- ческий дипольный момент р, возникающий под влиянием поля, пропорционален эффективном} полю *) Е', т. е. р = аЕ'. A3) Здесь предполагается, что рассматриваемая нами молекула изотропна **), но поскольку нас интересует лишь эффект, усредненный по всем возможным ее ориентациям, нет необходимости считать каждую отдельную молекулу изо- тропной. В этом случае а будет представлять среднюю поляризуемость, а так как р имеет размерность [г/1, Е'— размерность [el,~2] (е— заряд, / — длина), то а. будет иметь размерность М3], т. е. размерность объема. Если, как и раньше, Af — число молекул в единице объема, то полный электрический момент Р единицы объема будет равен P = JVp=iVaE'. A4) Исключая Е' из уравнений A2) и A4), получим первую из формул A), причем *) Мы ограничимся здесь рассмотрением так называемых иеполярных молекул, не обла- дающих постоянным диполышм моментом в отсутствие поля. **) В общем случае поляриз\емость а является тензором второго ранга.
§ 2.3) ФОРМУЯ* ЛОРЕНТЦ^ЛОРЕНЦЛ И ТЕОРИЯ 'ДИСПЕРСИЯ 97 выражение для диэлектрической восприимчивости запишется в явном виде сле- дующим образом: Л'а Подставляя это значение т| в первую из формул B), находим для диэлектриче- ской проницаемости 1-fNa В свою очередь A6) дает зависимость средней поляризуемости от е и N или (если использовать соотношение Максвелла е = я3) от п и N, а именно: 3 в —1 3 л2-! 4я.?е+2 По удивительному совпадению соотношение A7) было получено независимо и практически одновременно двумя учеными с почти идентичными фамилиями, Лорентцом [10] и Лоренцо.м fill, и поэтому называется формулой Лорентц—• Лоренца *). Как мы видим, она служит мостом, связывающим феноменологиче- скую теорию Максвелла с теорией атомного строения вещества. Вместо средней поляризуемости а часто пользуются другой величиной А, называемой молекулярной рефракцией (в случае одноатомных веществ она назы- вается также атомной рефракцией). Это, по существу, полная поляризуемость моля вещества **), определяемая как A=~Naa. A8) Здесь Nт= 6,02-1023— число Авогадро, равное числу молекул в одном моле. Если W— молекулярный вес, р— плотность, р — давление и Т— абсолют- ная температура, то молярный объем равен ?-?-?. 09) где использован закон Бойля. Следовательно, молекулярную рефракцию можно записать в двух формах _W п*—1_ХТп* — 1 р ni+2~~7F+21 -B°) Выражение B0) показывает, что А имеет размерность и порядок величины мо- лярного объема. Для газа пг почти равно единице, так что а~ 4я.? ' Л ¦*- р 3 ~~р ~- <21) *) Аналогичная формула для статических полей была раньше получена в работах [12] и [13]. Их авторы пытались объяснить диэлектрические свойства изоляторов, предположив,|что атомы ивляются небольшими проводящими сферами, взаимное расстояние между которыми велико по сравнению с их диаметрами; они получили следующее соотношение между концент- рацией сфер g и диэлектрической проницаемостью: в—1 •*) Молем или грамм-молекулой называется такое количество вещества, вес которого в граммах равен молекулярному весу эт,ого вещества. 7 м. Ьорн, э. Вольф
98 ЭЛЕКТРОМАГНИТНЫЕ ПбТЕНЦШЯЫ W ПОЛЯРИЗАЦИЯ [гл. 2 Таблица 2.1 Молекулярная рефракция А воздуха при температуре около 14,5° С для различных давлений (Д-линия натрия) Формула B0) дает в явном виде зависимость показателя преломления от плотности для света какого-то определенного цвета. Она должна выполняться при изменении плотности при условии, что сохраняется изотропия. В случае газов мы действительно обнаруживаем, что я2— 1 и р почти пропорциональны друг другу, как это следует из второй формулы B1). И даже при высоком давле- нии, когда п заметно отличается от едини- цы, молекулярная рефракция остается по существу постоянной, что видно из табл. 2.1. Оказывается, что молекуляр- ная рефракция остается также практиче- ски постоянной и при. конденсации газа в жидкость (табл. 2.2). Используя B0), можно показать, что молекулярная рефракция смеси двух веществ в хорошем приближении равна сумме вкладов от каждого вещества. Таким образом, если смешиваются две жидкости с рефракциями Аг и А% и если Таблица 2.Z Молекулярная рефракция А различных соединений для Д-липни натрия Давление агпм 1,00 - 42,13 96,16 136,21 176,27 I,0002929 1,01241 1,02842 1,04027 1,05213 4,606 4,661 4,713 4,743 4,772 Вещество Кислород Соляная кислота Вода Сероуглерод Ацетон Формула на cs2 CsHeO В столбцах, в которых приведены w 32 36,5 18 76 58 а величины п н жидкости, второе к пару. Плотности паров неизвестны, н а идеальных газов из известной плотности водороду ,221 ,000271 ,245 ,000447 ,334 000249 ,628 ,00147 ,3589 ,00108 А, первое а 1,124 0,95 1,00 1,264 0,791 значение но расе читаны на А 4,00 4,05 5,95 6,68 3,71 3,72 21,33 21,99 16,14 16,16 относится к основе зако- единичный объем первой жидкости содержит Nx молекул, а второй — Ыг молекул, то молекулярная рефракция смеси будет равна A=AlKX!llAt- B2) Таблица 2.3 Молекулярная рефракция для Д-лииии натрия смеси воды и серной кислоты при 15° С Относитель- ное содержа- ние H3SO4, вес % 0 19,98 39,76 - 59,98 80,10 100 0 С 0 0 0 I Nt i + JV, ,044 ,109 ,216 ,425 « 18, 21, 26, 35, 52, 98 00 52 72 Я» 00 а 1,3336 1,3578 1,3817 1,4065 1,4308 1,4277 р 0,9991 1,1381 1,2936 1,4803 1,6955 1,8417 (получено по B2)) 3,72 4,19 4,80 5,86 7,95 13,68 (рассчитано по B 0» 3,72 4,15 4.81 5,86 7,93 13,68
§ 2.3] ФОРМУЛА ЛОРЕНТЦ — ЛОРЕНЦА И ТЕОРИЯ ДИСПЕРСИИ Этот результат также оказывается в достаточно хорошем согласии с экс- периментом (табл. 2.3). Наконец, рассмотрим зависимость молекулярной рефракции А соединения от атомных рефракций составляющих его атомов. Если молекула состоит из olVi атомов с рефракцией Ль <Л% атомов с рефракцией А% и т. д., то, очевидно, А = ЛгА, + „Г Иа- B3) Эта формула также довольно хорошо согласуется с экспериментом, как видно из табл. 2.5. Рефракции составляющих атомов приведены в табл. 2.4. Таблица 2.4 Таблица 2.5 Молекулярные рефракции различных Атомные рефракции различных элементов соединений для Д-лииии натрия для Д-линии натрия Элемент Водород Углерод Кислород Сера Хлор Символ н с о S CI Атомный вес 1 12 16 32 , 35,5 А 1,02 2,11 2,01 8,23 5,72 Вещество Соляная кислота Вода Сероуглерод Ацетон Формула HCL Н2О cs2 С3Н6О II О- С 6,68 3,72 21,97 16,14 SCO CJ ~ S.C 6,74 4,05 18,57 14,46 Согласие, полученное в этом- случае, лучше, чем можно было бы ожидать, исходя из нашего простого рассмотрения. В других случаях действительно нужно учитывать некоторые другие соображения, например, при исследовании азота мы должны приписать атому азота различные атомные поляризуемости в зависимости от того, в какие соединения он входит. Вводя необходимые моди- фикации, мы видим, что а служит хорошо определенным атомным параметром, который можно использовать также при изучении других явлений, таких, как силы сцепления Ван-дер-Ваальса, поверхностная адсорбция и т. д. Эти явле- ния, однако, удовлетворительно объясняются лишь с помощью квантовой механики. 2.3.4. Элементарная теория дисперсии. В § 1.2 указывалось, что фазовая скорость и, следовательно, показатель преломления не могут быть постоянными среды, как мы предполагали вначале при формальном рассмотрении. Эти величины должны зависеть от частоты. Изменение показателя преломления с частотой составляет явление дисперсии. Для адекватного описания диспер- сии необходимо сильно углубиться в теорию атомного строения материи, но можно дать упрощенную модель диспергирующей среды, используя один или два основных результата, касающихся структуры молекул. Молекула состоит из нескольких тяжелых частиц (ядер атомов, образую- щих молекулу), вокруг которых обращаются легкие частицы (электроны). Электроны несут отрицательный заряд, а ядра — положительный. В нейтраль- ных молекулах заряды электронов точно компенсируют заряды ядер. Однако центры положительных (ядерных) и центры отрицательных (электронных) зарядов могут не совпадать; такая система является электрическим диполем и называется полярной. Для простоты мы здесь не будем рассматривать поляр- ные молекулы, хотя они играют огромную роль во многих физических и химиче- ских явлениях. Если нсполярную молекулу поместить в электрическое поле, то электроны и ядра смещаются и возникает дипольный момент. Векторная сумма всех ди- польных моментов молекул в единице объема является по существу вектором поляризации Р, введенным формально в предыдущем разделе.
100 ЭЛЕКТРОМАГНИТНЫЕ" ПОТЕНЦИАЛЫ И ПОЛЯРИЗАЦИЯ [ГЛ 2 Для того чтобы определить зависимость поляризации и показателя прелом- ления от частоты поля, нам прежде всего необходимо найти смещение г каждой заряженной частицы относительно ее положения равновесия. Мы можем пред- положить, что на каждый электрон действует сила Лорентца F (см. уравнение A.1.34)), равная ) где е— заряд электрона, a v — его скорость. Пусть скорость электрона мала по сравнению со скоростью света в вакууме с, и, следовательно, в выражении для силы Лорентца можно пренебречь вкладом магнитного поля. Строгое опре- деление эффективного смещения ядер и электронов под действием электриче- ской силы является сложной проблемой квантовой механики. Однако представ- ляется правдоподобным (и действительно подтверждается строгой теорией), что с хорошим приближением электроны ведут себя так, как если бы при откло- нении от положения равновесия на них действовала квазиупругая возвращаю- щая сила Q=—qr. Следовательно, если через т обозначить массу электро- на, то уравнение его движения запишется в виде mr + qr=eE'. B4) Пусть се — циклическая частота поля падающей волны, т. е. Е' = Е; exp (—irnt); B5) будем искать решение B4) в виде г = г0 ехр (—tat). B6) Тогда искомое стационарное решение уравнения B4) запишется следующим образом: г= /Г л, B7) где B8) называется резонансной частотой. Согласно B7) электрон колеблется с частотой поля падающей волны. Каждый электрон вносит в поляризацию момент р = ег. Ядра также вносят свой вклад в нее, но так как массы ядер велики но сравнению с массой электро- нов, их вкладом в первом приближении можно пренебречь. Предположим сна- чала, что в молекуле имеется лишь один эффективный электрон с резонансной частотой соо; тогда для полной поляризации Р мы получим выражение Р = Np=Ner = N = . B9) т ©г—со2 Сравнение B9) с A4) дает "- " е* C0) f что выражает «плотность поляризуемости» через атомные параметры. Таким образом, оказывается, что величина а непостоянна, как это было 5ы, если бы е в A7) означало статическую диэлектрическую проницаемость Удобно ввести понятие зависящей от частоты диэлектрической проницаемости s (со), которая определяется соотношением Максвелла s =- лг, где п — показатель преломле- ния, являющийся функцией от со, т. е. п (ш). Тогда статическая диэлектриче- ская проницаемость равна величине е @) = гс2@); согласно A7) она соответст- вует- предельному значению iVa@), которое в соответствии с C0) имеет вид
§ 2.3] ФОРМУЛА ЛОРЕНТЦ—ЛОРЕНЦА "И ТЕОРИЯ ДИСПЕРСИЯ 101 Подставив это значение в A6), мы получим статическую диэлектрическую про- ницаемость е@). Для ш=г=0 функция Na,(w), согласно C0), монотонно увеличивается с ро- стом со и обращается в бесконечность (резонансная точка) при со = <в0; для <в><в0 при увеличении со она стремится к нулю с отрицательной стороны. Подставляя C0) в A7), мы найдем зависимость показателя преломления от частоты в явном виде „2_1 4л ,V^ «2+2 3 m(to;_»«) ' Для газа я близко к единице *), и поэтому в знаменателе левой части мы можем положить' п?-\- 2 ~-3; тогда .4jlfe2 .. C2) т(и>Ъю2) I 1 Как мы видим, п растет с увеличением частоты. Говорят, что в этом случае имеет место нормальная дисперсия. Далее, я больше или меньше единицы в за- висимости от того, меньше со, чем «о, или больше нее, и я прибли- жается к единице при увеличении to (рис. 2.3) **). На самом же деле при резонан- сной частоте (со = соо) п и а не бес- конечны, как утверждает наша фор- мула. Возникает лишь формальная особенность, так как мы пренебре- гали влиянием затухания. Факти- чески затухание служит сущест- венным фактором во всем процессе, поскольку колеблющиеся электро- ны излучают электромагнитные волны, которые уносят энергию. Имеются и другие причины дис- сипации энергии (например, со- ударения между атомами). Фор- мально затухание можно учесть путем добавления в уравнение' движения B4) члена gr, представляющего тормозящую силу (Or, со Рис. 2.3. Диперсионные кривые для газа. Сплошная кривая — влияние затухания не учитывается^ пунктирная кривая —с учетом затухания. В последнем случае по оси ординат отложены вещественные части величин ns и 4nNa. mr + gr + qr = eE'. C3) Тогда вместо B7) мы получим еЕ1 ¦ - < 2 \ " ¦ C4) т (»; — to2) — lag Поляризация, а следовательно, и Ма становятся комплексными. Можно по- казать (аналогичная ситуации возникает и в теории металлов, где используется комплексный показатель преломления, см. гл. 13), что вещественная часть этой комплексной функции является истинной «плотностью поляризуемости». Она показана пунктирной кривой на рис. 2.3. Кривая имеет резкий максимум при значении со, несколько меньшем со0, и резкий минимум при значении, несколько большем ш0. Между максимумом и минимумом функция умень- *) Речь идет здесь о частотах, не слишком близких к частоте Wq. При to—> щ, как видно из C2), п—>со. (Прим. перев.) **) Поскольку здесь идет речь о вещественном показателе преломления п, формула C2), в которой не учтено затухание, не может правильно передавать поведение п вблизи частоты Л)и. В самом деле, из C2) при со^э «о следует, что г? < 0 и, значит, величина п должна быть Комплек» сной. (Прим, перев.) •
102 ЭЛЕКТРОМАГНИТНЫЕ ПОТЕНЦИАЛЫ И ПОЛЯРИЗАЦИЯ (гл. 2 шается с увеличением частоты, и мы говорим об области аномальной диспер- сии. В этом случае лучи с более короткой длиной волны преломляются меньше, чем лучи с большей длиной волны, что приводит к обращению обычного поряд- ка чередования призматических цветов. Для наших целен область аномальной дисперсии не представляет большого интереса, так как резонансные частоты свободных атомов лежат почти исключительно в ультрафиолетовой области спектра. Показатель преломления в видимой области спектра в таком случае всегда больше единицы. До сих пор мы предполагали, что у системы имеется лишь одна резонансная частота. В общем случае будет существовать много таких частот даже в системе, состоящей нз молекул одного сорта; тогда C1) и C2) придется заменить более общими выражениями. Вновь пренебрегая временно движением ядер, мы полу- чим вместо C1) соотношение где Nfk— число электронов для соответствующей резонансной частоты Для газов (п~ 1) последнее соотношение можно переписать в виде где -^- 2я Используя тождество получим вместо C6) где C6) C7) C8) C9) Для представления показателя преломления во всей видимой области спектра обычно достаточно учесть лишь одну или две резонансные частоты в ультрафиолетовой области Кох [14], например, нашел, что в интервале от % = 0,436 мк до \ = 8,68 мк для водорода, кислорода и воздуха выполняется следующее соотношение: постоянные a, b и ка приведены в табл. 2.6. Таблица 2.6 Дисперсионные в области С Гаа Водород Кислород Воздух а- 27, 52, 57, постоянные ,436 — 8,88 216 842 642 для мк 10", 211, 369, 327, кислорода, водорода и при 0°С и 760 мм рт см' 2 9 7 ,2 V 10-» см' 0,007760 0,007000 0,005685 воздуха . ст. 10" 3 3 3 v0, сек~ * ,40 ,55 ,98
§ 2.31 7ТОРЕНТЦ — ЛОРЕНЦ» П ТЕОРИЯ ДИСПЕРСИИ 103 В спектральном интервале, который не содержит резонансных частот, выражение C8) с хорошей точностью можно заменить более простым. Для всех веществ, которые кажутся глазу прозрачными, таким интервалом является видимая область спектра. Обозначим через vB резонансные частоты с коротко- волновой (фиолетовой) стороны нашего интервала, а через vr— частоты с длин- новолновой (красной) его стороны; тогда дисперсионная формула C6) при раз- ложении в степенные ряды относительно v и X соответственно примет вид „2_ 1 ^ А + Bv* + Cvl + ..._?_?_...= Be* . Cc* B'l2 C'X* где л = Z- v» ' Z- v« ' Z- v« B' = D1) D2) В такой области, свободной от поглощения, значение «для газов так мало отли- чается от единицы, что мы можем заменить п?— 1 на 2 (п— 1). Кроме того, члены с В', С', ..., возникающие из-за резонансных частот, соответствующих ультра- фиолетовой области, обычно не оказывают заметного влияния. Тогда, оставив только члены до ИХ', увидим, что D1) переходит в формулу Коши [151 D3) где А - А " <4*> В табл. 2.7 приведены значения АЛ и Sx для наиболее важных газов. Для ил- люстрации точности формулы D3) в табл. 2.8 сравниваются друг с другом Таблица 2.7 Значения постоянных Ах и Вх в дисперсионной формуле Коши для различных 1азов Газ Аргои Азот Гелий Водород Л.-10» 27,92 29,19 3,48 13,6 В,- 10', см' 5,6 7,7 2,3 7,7 Газ Кислород Воздух Этан Метан 26,63 • 28,79 73,65 42,6 B.-IO', см' 5,07 5,67 9,08 14,41 Таблица 2.8 Наблюдаемые значения показателя преломления для воздуха и знамения, даваемые дисперсионной формулой Коши D3) 7,594 6,563 5,896 5,378 5,184 •4,861 4,677 (п — 1) 10* наблю- даемые 2,905 2,916 2,926 2,935 2,940 2,948 2,951 рассчи- танные 2,907 2,917 2,926 2,935 2,940 2,948 2,954 0,002 0,001 0,000 0,000 0,000 0,000 0,003 4,308 3,969 3,728 3,441 3,180 3,021 2,948 (я — и аблю- даемыс 2,966 2,983 2,995 3,016 3,040 3,056 3,065 ) 10« рассчи- танные 2,967 2,983 2,996 3,017 3,041 3,058 3,067 Разность 0,001 0,000 0,001 0,001 0,001 0,002 0,002
104 ЭЛЕКТРОМАГНИТНЫЕ ПОТЕНЦИАЛЫ И ПОЛПРИЗАЛШЯ [ГЛ. 2 наблюдаемые значения показателя преломления для воздуха и значения, давае- мые формулой Коши. ¦ В случае веществ с большой плотностью, т. е. для жидкостей или твердых тел, нельзя заменять я на единицу в знаменателе второго члена C5). Тем не менее можно привести C5) к той же форме, что и выше. Так как nl—\ _ 4я N ———j —- —— JYUbj то г , _ 12лЛ'а где 4nN<x = — \ ———- — \ —~—-. D6) Как прайило, достаточно учитывать лишь конечное число резонансных частот. Отсюда следует, что величина п*—• 1, определяемая формулой D5), представляет собой рациональную функцию v2, и поэтому ее можно разложить на элементар- ные дроби. Для этой цели мы должны найти значения, при которых знамена- тель обращается в нуль, т. е. корни уравнения 3—4яуУсс = 3—у^ гр* г=0. D7) Обозначив их через vft, можно привести D5) к виду Это выражение идентично по форме с формулой C6) для газов. Например, при наличии лишь одной резонансной частоты V! она будет кор- нем уравнения 3 г^-г-О, <49) v;— v2 откуда v;=v;—1-р,, р, = р,. E0) Уравнение, D8), которое можно также переписать в форме C8), известно как дисперсионная формула Зельмейера. До сих пор мы пренебрегали влиянием движения ядер. В действительности оно существенно лишь при очень длинных волнах (инфракрасная область). Причину этого легко понять. Электрический момент и среднюю поляризуемость приближенно можно разложить на две части — одну, связанную с электронами, и другую, связанную с ядрами, т. е. Р = Рг + Р„, E1)' где р, = аеЕ\ р„=а„Е'. E2) Электроны почти мгновенно будут следовать за полем вплоть до довольно высоких частот, включая во многих случаях частоты всего видимого спектра. Масса же ядер, так велика, что при высоких частотах они не могут следовать за полем, т. е. для видимого света an^t- 0. Эго видно также из дисперсионной фор- мулы D1), где й1— 1 представляется двумя группами членов— одной, связан- ной с высокочастотными («фиолетовыми») колебаниями vB, и другой — с низко- частотными («красными») колебаниями vr. Разумно предположить (и это строга следует из квантовой' механики), что квазиупругие силы, связывающие ядра и электроны, одинаковы по порядку величины; следовательно, по порядку
§ 2.4] ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ДЛЯ РАСПРОСТРАНЕНИЯ ВОЛН 105 величины частоты будут связаны соотношением mvf ~ М\*„, E3> где т — масса электрона, М —- масса ядра, ve и vn— частоты колебаний элек- тронов и ядер соответственно. Для того чтобы обобщить формулы D1) и D2) и учесть движение ядер, мы можем просто предположить, что «фиолетовые»- колебания обусловлены электронами, а «красные» колебания — ядрами. Тогда придется также различать два типа коэффициентов рь определяемых выраже- нием C7) — одни коэффициенты будут связаны с электронными, другие —¦ с ядерными колебаниями. При этом по порядку величины выполняется соотно- шение тре ~ Мр„. E4) Следовательно, значения коэффициентов D2) дисперсионных формул будут равны по порядку величины B~i- С~Т' В'~%А* С'~ЖА^ E5) откуда где я, Ь, ..., а', V, ...— численные постоянные порядка единицы. Первая группа членов соответствует электронной части поляризуемости ае, вторая группа — ядерной части а„. Мы видим, что, поскольку величина т/М мала («1/1840), члены второй группы пренебрежимо малы при условии, что частота v составляет не очень малую долю «фиолетовых» резонансных частот vs. Следовательно, для оптической частоты (т. е. частоты, соответствующей видимому свету) поляризация выражается, по существу, только через ае (как предполагалось в наших предыдущих расчетах), тогда как для статиче- ского поля она выражается через ае-\-ап. Рассмотрение в настоящем разделе основывалось исключительно ва клас- сической механике. Когда подобные расчеты выполняются на основе квантовой механики, взаимодействие поля с веществом по-прежиему можно описывать при помощи виртуальных осцилляторов, но число их, даже при наличии лишь одного электрона, оказывается бесконечно большим. И хотя уравнение C5) все еще остается применимым, но силы осцилляторов fh определяют теперь не число электронов некоторого типа, а скорее число виртуальных осциллято- ров, принадлежащих одному электрону или группе электронов. В большинстве случаев заметную величину имеет лишь конечное число значений fh, тогда как остальными можно пренебречь. Фактически полная формальная теория почти не меняется при введении квантовой механики, но с ее помощью мы можем рассчитать величины /\ для данной электронной системы. § 2.4. Описание распространения электромагнитных волн с помощью интегральных уравнений*) В начале настоящей главы был намечен подход, позволяющий описывать распространение электромагнитных волн с помощью интегральных уравнений, а в последующих разделах были введены вспомогательные величины, необхо- димые для этой цели. Теперь мы сформулируем эти интегральные уравнения и рассмотрим некоторые их следствия, что можно сделать, оставаясь полностью- *) Излагаемая здесь теория была развита главным образом в работах [16—19]. Полное изложение теории приведено в j20] См также |21, 22] t Некоторые обобщения этой теории, учитывающие нелинейное поведение среды (проявляю- щееся при исключительно сильных полях), рассмотрены в работе [23].
106 ЭЛЕКТРОМАГНИТНЫЕ ПОТЕНЦИАЛЫ И ПОЛЯРИЗАЦИЯ [ГЛ. 2 в рамках макроскопической теории, излагаемой на протяжении данной книги. В рамках этой теории интегральные уравнения эквивалентны уравнениям Макс- велла и представляют собой математическое описание электромагнитных явлений с помощью взаимодействий на конечных расстояниях (им, конечно, необходимо время для распространения). Определенные преимущества такого подхода, который в ряде случаев оказывается мощнее обычного подхода, осно- ванного на дифференциальных уравнениях, заключаются в том, что он связы- вает макроскопические явления с молекулярными, рассмотренными в преды- дущем разделе. Как мы уже говорили выше, можно считать, что молекулы, составляющие вещество, ведут себя в поле падающих волн подобно диполям. При этом все излучаемые диполями волны действуют па любой другой диполь с эффективной силой и определяют среднее измеряемое поле. Предположим, что диполи равно- мерно распределены по среде, и среднее значение их электрического момента в единице объема Р будем рассматривать как основную величину, На самом же деле распределение молекул в среде никогда не бывает совершенно равномер- ным (т. е. имеются флуктуации плотности) и, следовательно, электрический мо- мент отдельных частиц флуктуирует около среднего значения. Возникающие явления настоящая теория может объяснить, проводи расчеты несколько дальше, т. е. рассчитывая не только средние величины, но и их среднеквадра- тичные отклонения. Подобные расчеты важны для некоторых проблем, напри- мер для объяснения голубого цвета неба, впервые данного Рэлеем *). Но такое распространение теории здесь провести невозможно **). 2.4.1. Основное интегральное уравнение. Рассмотрим распространение электромагнитной волны в однородной изотропной немагнитной среде. Элек- трическое и магнитное поля Е) и HJ, которые действуют на /-и диполь внутри среды, можно разделить на поля падающей волны Е(г\ Н(" (распространяю- щиеся со скоростью света в вакууме с) и вклад, создаваемый всеми диполями, т. е. здесь суммирование распространяется на все диполи, кроме /-го. В точке гг, где расположен /-и диполь, поле от 1-го диполя можно определить из формул B.2.49) —B.2.51), а именно E/l = wtTot——^—— , H^ = -j-rot^— fl , B) где р,@ — момент 1-го диполя, i?/,— | г,— г,| и операция rot производится ОТНОСИТеЛЬНО КООрдИНаТ X;, у,, Zj /-ГО ДИПОЛЯ. Как мы уже говорили, распределение можно с хорошим приближением считать непрерывным, т. с. момент диполей можно рассматривать как непре- рывную функцию координат (и времени) p-^p(r, f). Концентрацию jV также будем считать непрерывной функцией координат N(r). В этом случае полный электрический диполыгый момент Р единицы объема определяется формулой B.3.14), т.е. C) *) Позже мы будем вновь ссылаться на теорию Рэлея в § 13.5, где рассматривается рас- сеяние света сферическими частицами, находящимися в вакууме. Если частицы малы, зависи- мость интенсивности рассеянного излучения от длины волны совпадает с этой зависимостью в рассматриваемом случае спонтанных флуктуации плотности в однородной среде (а именно, обратная пропорциональность четвертой степени длины волны). Однако, кроме этого резуль- тата, флуктуационная теория дает также зависимость интенсивности рассеянного излучения от флуктуации плотности ") Эта теория рассматривается, например, в § 81 книги [5J,
§ 2.4] ИНТРГРАЛЬНЫЕ VPARHFHHfl ДЛЯ ТАСПРОСТРАНЕНИЯ ROJTF 107 По причинам, изложенным в § 2.3, мы пренебрегли вкладом в C) силы, созда- ваемой магнитным полем. Поскольку допускается также, что вещество немаг- нитно (т. с М = 0), в устанавливаемые ниже условия динамического равновесия не будет входить эффективное поле Н'. Если подставить B) в A) и перейти к непрерывному распределению, ис- пользуя C), то получим *) Е'(г, I) =Е<» + J rot rot Na Е< ""'¦ '^^ dV\ D) Н' (г, t) = H"'> + 4~ [ rot No, Ё (г1^~ВД#, E) где Я=|г—г'|. Если точка наблюдения г находится вне рассматриваемой среды, интеграл берется но всей среде. Если она расположена внутри среды, то необходимо вна- чале исключить небольшую область, занятую атомом; будем считать этх об- ласть небольшой сферой а радиуса а. В коненном счете мы обычным образом перейдем к пределу а—>-0. Уравнение D) представляет собой интегро-дифференцилльное уравнение относительно Е'. Если решить его, то можно получить Н' из E). Эти два урав- нения, по существу, эквивалентны уравнениям Максвелла для изотропных не- магнитных веществ. Обобщение на магнитные среды можно провести с помощью второго вектора Герца. 2.4.2. Теорема погашения Эвальда — Озеена и строгий вывод формулы Лорентц — Лоренца. Уравнение D) связывает довольно сложным образом эффективное электрическое поле с электрическим полем падающей волны. Это уравнение решается в явном виде лишь в специальных случаях. Тем не менее из него можно получить ряд основных результатов, таких, как формула Ло- рентц— Лоренца, законы преломления и отражения и формулы Френеля. Пе- ред тем как показать это, выведем одно важное общее следствие решения. Пусть 2 обозначает границу рассматриваемой среды. Для точек наблюде- ния, находящихся внутри среды, основное уравнение D) можно записать в виде Р = Мх(Е") + Е№), F) где Е1*— вклад от диполей, равный otrotp(r'^-R/cW'. G) Здесь мы явно указали границу объема, по которому проводится интегриро- вание. Будем считать, 'что поле Еи) создается падающей монохроматической вол- ной с угловой частотой и>, т. е. Е"> = А("(г)е-'ш'. (8) В качестве пробного решения для Р выберем волну, которая также монохрома- тична и имеет ту же частоту, но обладает другой скоростью распространения (скажем, с/п) Р = (л» —l)^Q(r)e-'«", (9) где, как и раньше, &„= <о/с и 0. A0) *) Мы должны суммировать поля, а не потенциалы, т. е. в D) оператор rot rot должен стоять под знаком интеграла, а не вне его. В самом деле, поле, действующее на молекулу и вы- раженное в виде C), получается суммированием всех индивидуальных полей. Наличие особен- ности у полей вблизи источников ведет к различию между суммой полей и полем, связанным с полным потенциалом (суммой потенциалов, связанных с индивидуальными полями). См. ниже соотношение A5).
108 ЭЛЕКТРдМАГНИТНБШ ПОТЕНЦИАЛЫ И ПОЛЯРЯЗАПИЯ [гл, 2 Постоянный множитель (я2— 1) k\ в (9) введен для упрощения последующих формул. Постоянную п следует рассматривать как неизвестную величину, при- чем ее определение является одной из главных задач настоящего анализа. Предположим также, что внутри среды divQ = 0. A1) На первый взгляд возможность решения осповного интегро-дифференци- ального уравнения F) в форме нашего пробного решения может показаться до некоторой степени странной, так как Е1" представляет волну, распространяю- щуюся со скоростью света в вакууме с, тогда как Р, по предположению, распро- страняется со скоростью с'п. Однако будет показано, что поле диполей Е№ можно выразить в виде суммы двух членов, один из которых удовлетворяет волновому уравнению в вакууме и в точности гасит падающую волну, тогда как другой удовлетворяет волновому уравнению для распространения со ско- ростью с/п. Поэтому можно считать, что падающая волна гасится в любой точке внутри среды в результате интерференции создаваемого ею поля с полем диполей; при этом появляется новая волна с иной скоростью распространения (а в общем случае и с иным направлением распространения). Найденный ре- зультат известен как теорема погашения; он был установлен вначале для кри- сталлических сред Эвальдом [24) и для иадтроппых сред Озееном [17]. Чтобы доказать теорему погашения, перепишем F) в форме, не зависящей от времени где i > = $rotrotQ(r')G(tf)u!V" A3) В приложении 5 показано, что если радиус сферы а достаточно мал, то |^ A5) Здесь функция G представляет сферическую волну в вакуум^и поэтому удов- летворяет волновому уравнению V2G + ?*G = 0. A6) Таким образом, из уравнений A0) и A6) следует, что член, стоящий под знаком интеграла в правой части A5), можно записать в виде \п — I; При интегрировании с помощью теоремы Грина это дает где символ d/dv' означает дифференцирование вдоль внешней нормали к гра- нице 2. Прямой расчет показывает (см, п, 8.3,1), что предел поверхностного
§ 2.4] ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ДЛЯ РАСПРОСТРАНЕНИЯ ВОЛН 109 интеграла по а при а-*-0 равен — 4nQ(r) и, следовательно, A9) сг Is В пределе из A3), A5) и A9) получим ? A(rfl = J rot rot Q (г') G (R) dV = Используем далее тождество rot rot Q = grad div Q — V2Q. . Первый член в правой части исчезает из-за условия A1), а второй, согласно A0), равен nzklQ. Следовательно, при подстановке их в B0) окончательно получим следующее выражение для поля диполей: Согласно A0) первый член в правой части представляет волну, распростра- няющуюся со скоростью cm, тогда как второй — волну, которая, подобно G, распространяется со скоростью света в вакууме с. Следовательно, как мы и ожи- дали, основное уравнение A2) разделяется на две группы членов, каждая из которых представляет волну, распространяющуюся со своей скоростью. Это возможно, только если каждая группа в нем равна нулю, и, следовательно, -3-^ = 7^+2 ¦ <22> S' = 0. B3) Соотношение B3) выражает погашение падающей воЛны в любой точке внутри среды, возникающее вследствие интерференции с частью пола диполей. Падающая волна заменяется другой, а именно волной вида E'=}4P=3^(nl-lLQe-'e« = -y-(n4-2)ftJQe-i»', B4) которая распространяется внутри среды со скоростью с/я. Величина п выра- жается в B2) через концентрацию N и поляризуемость а. В этом выражении мы узнаем формулу Лорентц — Лоренца, введенную предварительно в п. 2.3.3. Нужно отметить, что погашение падающей волны осуществляется исключитель- но диполями, расположенными на границе среды, а поляризация Р возникает только вследствие взаимодействия соседних диполей. В принципе общее решение интегро-дифференциальното уравнения B3) можно получить, приведя его к системе двух связанных интегральных уравне- ний Фредгольма для Q и dQ/dv' на поверхности. Тогда величину Q в любой точке внутри среды можно получить, решая уравнение A0) при условии, что Q принимает указанные значения на границе. Это нетрудно сделать обыч- ными методами, используя функции Грина или интегральную формулу Гельм- гольца — Кирхгофа (см, уравнение (&3,7))„
НО ЭЛЕКТРОМАГНИТНЫЕ ПОТЕНЦИАЛЫ И ПОЧЯРЧ1АПИЯ {ГЛ. 2 Мы должны теперь связать эффективное поле Е' с обычным полем Е теории Максвелла. Для этого запишем два определения электрического сме- щения D, а именно D = еЕ = й2Е B5а) и D - Е + 4яР. B56) Исключая из них D, найдем Теперь из C) и B2) получим и, следовательно, используя B6), имеем '_ ' р_4я п* + 2 ~Na 3 л2—1 B7> что согласуется с B.3Л2). Наконец, из B6) и (9) следует, что поле Е внутри среды (пф\) задается формулой wt. B8) Для нахождения электрического поля вне среды мы должны вернуться к уравнению D). Интегралы, входящие в уравнения D) и E), теперь берутся по всей среде, так что оператор rot rot можно вынести из-под знака соответст- вующего интеграла. Далее, так как вне среды D = Е, то Р = 0 и, следовательно, согласно B7), мы формально получим Е' = Е. Вместо F) теперь мы находим где I (9qv Для рассматриваемого здесь случая гармонической зависимости от времени получим, подставляя сюда выражение (9) и используя A7) и теорему Грина, соотношение a Q — та же функция на поверхности 2, что и раньше. До сих пор мы занимались только электрическим полем. Для нахождения магнитного поля нужно лишь подставить Е' в (о) и взять интеграл. Это можно сделать методом, аналогичным приведенному выше, но такая операция сейчас несколько проще, так как оператор rot в E) можно вынести из-под знака ин- теграла, что следует из результатов, изложенных в приложении 5. При срав- нении получающихся выражений для Н и для Е мы увидим, что найденные ре- шения согласуются с уравнениями Максвелла. Мы не будем приводить здесь эти расчеты, поскольку они довольно просты и не вносят каких-либо важных новых особенностей. Чрезвычайно интересно отметить, что подход, основанный на физическом соображении о том, что поле в среде более естественно характеризовать поля- ризацией, чем вектором смещения, очень изящно, через интегродифференциаль- нос уравнение D), приводит к строгому выводу формулы Лорентц— Лоренца и теоремы погашения. Этот мощный метод до сих пор. слабо использовался при -
§ 2.41 ИНТЕГРАЛЬНЫР УРАВНЕНИЯ ДЛЯ РАСПРОСГРАНРНИЯ ЗОЛЯ 111 рассмотрении более частных проблем *); пример его применения будет дан в гл. 13. 2.4.3. Рассмотрение преломления и отражения плоской волны с помощью теоремы погашения Эвальда — Озеена. Применим теперь теорему погашения Эвальда — Озеена, выраженную формулой B3), к случаю плоской монохрома- тической волны, входящей в однородную среду, которая заполняет полупростран- ство г<0. Покажем, что из этой теоремы вытекают законы преломления и отра- жения, а также формулы Френеля. Падающую волну запишем в форме Е1"^ Аш (г) <?-'">' = fe0(r.s»')-o)/]}> C1) Рис. 2.4. Проникновение волны в однен родную среду, рассматриваемую как си- стема диполей. где fe0 = и/с, \f—постоянный вектор и S®— единичный вектор в направлении распространения. Выберем ось г так, чтобы она про- ходила через точку наблюдения р, кото- рую мы вначале считаем находящейся внутри среды на расстоянии г от границы 2 (рис. 2.4). Ось х выбираем так, чтобы вектор s"> лежал в плоскости хг. Сле- довательно, обозначая угол падения через 6,, мы получим s« = —sine,, s<° = s«> = —cos9,.. C2) В соответствии с результатами предыдущего раздела, предположим, что прошедшая волна имеет ту же частоту, что и падающая, но другую скорость с/я, где я выражается через поляризуемость и плотность с помощью формулы Лорентц — Лоренца. В качестве пробного решения для прошедшей волны вы- берем плоскую волну, распространяющуюся в направлении единичного век- Тора sU), который, по предположению, лежит в плоскости хг: s? = — sine,, s?> —0, s? = — cos6t. C3) Тогда выражение B8) примет вид E=-4n/e02Q<r"»t = 4^Q(lexp{i [V4r-s<")—w^]}, C4) где Qo— постоянный вектор, который, согласно A1), ортогонален s@. Решение интегро-дифференциального уравнения легко получить, если рас- сматривать лишь точки наблюдения р, отстоящие от границы г = 0 на расстоя- ниях, больших по сравнению с длиной волны, т. е. если 2лг А= C5) Это условие наложено лишь для упрощения расчетов и не соответствует огра- ничению физической обоснованности интегро-дифференциального уравнения. Производные, входящие в интеграл по 2, теперь имеют вид Р =5^Q0 ехр{!я*0(г' -s1»)} = ink, (~, • s«>) Qo exp {inkc (r' -s'»)}. C6a) dv' Последним членом в C66) можно пренебречь из-за условия C5), и интеграл, *) Этот метод был применен к исследованию распространения электромагнитных вола через слоистую среду в работе [251.
Ц2 ЭЛЕКТГОМАГНИТИЬП1 ПОТЕНЦИАЛЫ И ПОЛЯРИЗАЦИЯ {ГЛ. 2 входящий в B3), записывается следующим образом: С/ dG „dQ\ С idK /дт' иЛ] е"Р {ife0 fR +л (г' s<f))]f J = \ I Цд—? — G yr~/ do '^oQo \ \ ~А~> — п [ я~< ' s ) г р ^^ • 2 " C7) Компоненты векторов г, г' и R равны (см. рис. 2.4) г: 0, 0, —г, г': х\ у\ О, R: -х', -у', —г, следовательно, Интеграл C7) после подстановки примет вид y'. C9) Удобно ввести угол ср и соотвегствующии единичный вектор s, определяе- мые выражениями и sin в, = sirup, D0) sx = — sin ф, Sj, = O, sz= — соэф. D1) Так как, по предположению, k,/ велико по сравнению с единицей, показатель степени экспоненциального члена в C9) также велик по сравнению с единицей и этот член будет быстро осциллировать и много раз менять знак, когда точка (х', у') будет пробегать область интегрирования. При таких условиях хорошее приближение к значению J получается путем применения следующей формулы, которая является следствием принципа стационарной фазы (см. прило- жение 3): j J §(•*'• У') ехР [*'*о/ (х'< У'У] dx' dy' « D 1ш —, "у Здесь {x'j, у]) — точки в области интегрирования D, для которых / постоянна, -И j' +1 когда ос;ру > у), а; > 0, \ о =| —1, когда ауру > -ft, а,) < 0, i D36) ( —г, когда аД, < у) J Если использовать соотношения D0) и D1), то в данном случае мы получим / = #—x'sln<p, D4) к, следовательно,
§ 2 4] ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ДЛЯ РАСПРОСТРАНЕНИЯ ВОЛН 113 Для постоянства / необходимо, чтобы дх' ду' и- Следовательно, как легко показать (отметим, что при вычислении частных производных необходимо брать положительный квадратный корень), / будет постоянна, только если х —xlt у = Уц где А = г^ц>, у'г^О. D5) В этой точке выражения D3) и D4) принимают следующие значенияг D66) D6в) Dбг) ^^ D6д) Теперь D2) примет вид 05 Ч- да Г Г — C-^- + ftcosef J exp{i^0(i?—пх' sixxQ^dx' dy' так что C9) равно J= \ й-п—G ~} dS ——2я — v 'Q. exp fife. (r-sI. D7) s Подставив теперь это выражение в интегро-дифференциальное уравнение B3), которое выражает погашение падающей волны, получим rotQ0 exp [tk0 (r-s)] ~ika (sxQJexp [ik0 (r-s)], rot rot Qo exp [ika (r-s)j = —feJsx(sxQo) exp [ik0 (r-s)]. Следовательно, B3) перейдет в A?>exp[^^r-s<»)] = -2n^^±]^sx(sxQ0)exvlift0(r-s)]. • D8) Это соотношение должно тождественно выполняться для всех точек г на гра- нице. Следовательно, s = s(" D9) Уравнение D9) выражает закон преломления A.5.8). В самом деле, он оз- начает, что Ф = е„ E1) или, в соответствии с D0), «sme^slne,. E2) Более того, соотношения D1) и C2) показывают, что вектор s(() лежит в пло- скости, определяемой вектором s1" и нормалью к границе 2» 8 М Ьпшг. Я Rnjihrti
114 ЭЛЕКТРОМАГНИТНЫЕ ПОТЕНЦИАЛЫ И ПОЛЯРИЗАЦИЯ [ГЛ. 2 Уравнение E0) связывает амплитуды падающей волны C1) и прошедшей врлны C4). Обозначая амплитуду (векторную) прошедшей волны через То, ' E3> и раскрывая тройное векторное произведение, получим вместо E0) А° ~ 2 cos 6,-sin 6* I1» S (S 'o)J- (° ' Пусть A±, A ii и T±, Tn-— составляющие А"' и То в направлениях, перпендику- лярном И параллельном плоскости падения. Тогда, вспоминая, что вектор AJ," ортогонален s1'1, а То ортогонален &ш и что s"'* и s№ составляют друг с другом угол (Q{— Qt), найдем из E4) ' (9 + ад А г Л1 —2 cose,- sin в,] L> (b5a> . 1 sin (б;^-9f) cos F,— et) .,„ -A» = T cos e,- sine, •T «• E56> В этих соотношениях мы узнаём формулы Френеля для преломления (см, A,5.20а)). Наконец, рассмотрим случай, когда точка наблюдения находится вне среды (г>0). Расчеты совершенно аналогичны, только теперь в соответствую- щих формулах г'= —-г следует заменить на г' = г. Это эквивалентно замене sz ¦на —s2 в D6г), т. е. замене <р = Вг на <р = 8Г, где 6г = я—в,.. E6> Вместо единичного вектора s = s"'' введем теперь единичный вектор s(r> с ком- понентами s{? = — sin er = — sin 9,-, 4n = 0, s'P=— cos9r = cos0(.. E7) и получим вместо D7) соотношение i!^-^^^^ E8> Из выражения C0) длячне зависящей от времени части отраженной волны на- ходим xp.{ik0 (х-if»)] = 2nkl ^"ff"^ {s(rt X(s« XQo)}exp [/A, (r.e<»)]. E9> Выражение E9) представляет плоскую волну, распространяющуюся в направ- лении, определяемом единичным вектором s<r>, причем это направление связано. с направлением s(" падающей волны соотношением EG). Соотношение E6) выражает закон отражения в согласии с A.5.7). Амплитуда Aj,° отражен- ной волны, выраженная через амплитуду прошедшей, записывается в виде д(о_ 1 sin (9,— 8<) fT с(г)/с<от^1 /finv А° Тcos 0,-sin 0,1'" S (S 'loU- К™} Обозначая через /?х и Rn составляющие А'ог) в направлениях, перпендикуляр- ном и параллельном плоскости падения, и используя E5), получим о 1 sin (9,— dt)r sinF,—et) , i sin(8,—ef)cos((y-8f)r tg(e,—et) . fi] . = ~Т cose,-sine, y " ~ЩёТ+ад "" (bl6> Соотношения F.1) совпадают с формулами Френеля\ для отражения A,5,21а),
ЛИТЕРАТУРА 115 ЛИТЕРАТУРА 1. S. A. Schelkunoff, Electromagnetic Waves, Van Nostrand, New York, 1943, p. 382 2. H. S. Green, E. Wolf, Proc. Phys. Soc. A66, 1129 A953). 3. A. Nisbet, Proc. Roy. Soc. A231, 251 A955). 4. M. В о г n, Natural Philosophy of Cause and Chance, Clarendon Press, Oxford, 1949 5. M. Bom, Optik, Springer, Berlin, 1933. (M. Бор н, Оптика, ГНТИУ, Харьков — Киев, 1937.) 6. Н. Н е г t z, Ann. d. Physik, 36, 1 A889). 7. A. R igli 1, Nuovo Cimento 2, 104 A901). > 8. F. К о t t 1 e r, Ann. d. Physik 71, 462 A923); A. N J s b e t, Proc. Roy. Soc. A231, 250 A955) 9. W, H. McCrea, Proc. Roy. Soc. A240, 447 A957). 10. H. A. Lorentz, Wiedem. Ann. 9, 641 A880). 11. L. Lorenz, Wiedem. Ann. 11, 70 A881). 12.' R. С 1 a u s i u s, Mechanische Warmetheoric, Braunschweig, 2nd ed. 1879, Vol. 2, p. 62. 13. O. F. Mossott i, Mem. Soc. Sci. Modena 14, 49 A850). 14. J. Koch, Nov. Act. Soc Upsala 2, 61 A909). 15. L. С a u с h y, Bull. des. Sci. Math. 14, 9 A830); Sur la dispersion de la lumiere, Nouv. exerc. de math. 1836. 16. W. E s m a r с h, Ann. d. Physik, 42, 1257 A913). 17. С W. О s e e n, Aim. d. Physik 48, 1 П915). 18. W. В о e t h e, Beitrage zur Theone der Brechung und Reflexion, Dissertation! Berlin, 1914, 19. W. Boethf, Ann. d. Physik 64, 693 A921). 20. R. L u n d b I a d, Univ. Arsskrift, Upsala, 1920. ' 21. С G. Darwin, Trans. Cambr. Phil. Soc. 23, 137 A924). 22. H. H о e k, Algcmeene theone dcr optische activiteit van isotrope media, Thesis, Leiden, 1939. 23. N. В 1 о e ra b e r g e и, P. S. P e г s h a n, Phys. Rev. 128, 619 A962). 24. P. P. E w a 1 d, Dissertation, Miinchen, 1912; Ann. d. Physik 49, 1 A916). 25. С W. Oseen, Ann. d. Physik 48, 1 A915). 26. D. R. Hartree, Proc. Cambr. Phil, Soc. 25, 97 A929).
ГЛАВА 3 ОСНОВЫ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ § 3.1. Приближение очень коротких длин волн Электромагнитное поле видимого света характеризуется очень быстрыми колебаниями (с частотой порядка 1014 сел~1), или, что то же, малостью длин волн (порядка 10~6с.«)- Поэтому можно ожидать, что для законов распрост- ранения видимого света получится хорошее первое приближение, если пол- ностью пренебречь конечностью длин волн. Оказывается, что такая процедура справедлива при решении многих оптических задач; более того, физические явления, которые не описываются этой приближенной теорией (так называемые дифракционные явления, рассматривающиеся в гл. 8), можно обнаружить лишь с помощью очень тонких экспериментов. Раздел оптики, в котором пренебрегают конечностью длин волн, что соответствует предельному переходу Хо->- 0, называется геометрической опти- кой *), поскольку в этом приближении оптические законы можно сформулиро- вать на языке геометрии. В рамках геометрической оптики считается, что энер- гия распространяется вдоль определенных кривых (световых лучей). Физиче- скую модель пучка световых лучей можно получить, если пропустить свет от источника пренебрежимо малого размера через небольшое отверстие в непро- зрачном экране. Свет, выходящий из отверстия, заполняет область, граница которой (край пучка лучей) кажется на первый взгляд резкой. Однако более тщательное исследование показывает, что интенсивность света около границы изменяется хотя и быстро, но непрерывно, от нуля в области тени до максималь- ного значения в освещенной области, Это изменение не является монотонным, а носит периодический характер, что приводит к появлению светлых и темных полос, называемых дифракционными. Размер области, в которой происходит это быстрое изменение интенсивности света, порядка длины волны. Следова- тельно, если длина волны пренебрежимо мала по сравнению с размерами отвер- стия, то можно говорить о пучке световых лучей с резкой границей **). При уменьшении размеров отверстия до величины, сравнимой с длиной волны, воз- никают эффекты, для объяснения которых требуется более тонкое исследова- ние, Однако если ограничиться рассмотрением предельного случая пренебре- жимо малых длин волн, то па размер отверстия не накладывается никакого ограничения и можно считать, что из отверстия исчезагоще малых размеров вы- ходит бесконечно тонкий пучок света — световой луч. Будем показано, что из- менение поперечного сечения пучка световых лучей служит мерой изменения интенсивности света. Кроме того, мы увидим, что с каждым лучом можно свя- зать состояние поляризации и исследовать его изменение вдоль луча. Далее будет показано, что для коротких длин воли общий характер поля такой же, как и в случае плоской волны; более того, законы преломления и от- ражения, установленные для плоской волны, падающей на плоскую границу, остаются в приближении геометрической оптики справедливыми и при более общих условиях. Следовательно, если на резкую границу (например, поверх- *) История развития геометрической оптики описана в работах [1—31. **) Тот факт, что граница становится резкой в пределе Х0-*0, был впервые установлен Кирхгофом [4]. См. также [5, 6].
§ 3 1] ПРИБЛИЖЕНА ОЧЕНЬ КОРОТКИХ ДЛИН ВОЛН 117 ность линзы) падает луч света, то он разделяется на отраженный и преломлен- ный лучи, а изменение состояния поляризации и отражательную, и пропуска- тельную способности можно вычислить из соответствующих формул для пло- ских волн. Из приведенных выше рассуждений следует, что для достаточно коротких длин волн полное объяснение оптических явлений можно получить из геометри- ческих соображений путем определения пути световых лучей и соответствую- щих им интенсивности и состояния поляризации Сформулируем теперь соот- ветствующие законы, переходя в уравнениях Максвелла к пределу *) Л.о->- 0. 3.1.1. Вывод уравнения эйконала. Рассмотрим гармонически меняю- щееся со временем поле общего вида Е(г, 0 = Е,(г)е-Ч Н(г, О = Но(г)в-<«>* A) в непроводящей изотропной среде. Ео и Но являются комплексными вектор- ными функциями положения и, как показано в и 1.4 3, вещественные части стоящих справа выражении A) описывают физические поля. Комплексные векторы Е„ и Но удовлетворяют уравнениям Максвелла в форме, не зависящей от времени, которые получаются при подстановке выражений A) в уравнения A 1 1)—A 1 4) В областях, свободных от токов И зарядов (j=p = O), уравнения Максвелла имеют вид rot Но+1*08^=0, B) rotE0 —»?0(Ш» = 0, C) diveE0 = 0, D) divuH0 = 0. E) При выводе этих уравнений были использованы материальные соотношения D = eE, В = |хН, и, как и раньше, соотношения ko= ш/е = 2яДо, где К— длина волны в вакууме Ранее было показано, что однородная плоская волна, распространяющаяся в среде с показателем преломления п = Vzp в направлении, определяемом еди- ничным вектором s, описывается следующими выражениями: Eo = eexp(**on(s.r)), Н„ = haxp (ikon(s-r)), F) где е и h — постоянные векторы, в общем случае комплексные. Для монохро- матического поля электрического диполя в вакууме было найдено (см. § 2 2) Ео=еехр(/?ог), H0 = hexp(«V). G) где г— расстояние от диполя. Здесь векторы е и h уже не являются постоян- ными, но на достаточно больших расстояниях от диполя (r§>h0) и при соответ- ствующей нормировке дипольного момента они не зависят от kc. На основании этого разумно предположить, что в областях, расположен- ных на расстояниях многих длин волн ог источника, поля более общего типа можно представить в виде Е„=те(г)ехр(й0^(г)), Но = h(r) exp (Й„^(г)), (8) где <У(г) —«оптический путь» — вещественная скалярная функция положения, а е(г) и h(r)—векторные функции положения, в общем случае комплексные**). *) Зоммерфетьд и Pyiire [7], используя идею Дебая впервые показали, что основное уравнение геометрической оптики (\ равнение эйконала A56)) можно вывести из скалярного волнового уравнения при а,,—>0 Обобщение этого вывода, учитывающее векторный характер электромагнитного поля, проведено в рпботах [8—14] *"*) е н h обязательно дотжны пьггь комплексными ссы необходимо учесть rcc- возможные состояния поляризации Вещественные е и h, согласно A 4 75), соответствуют линепно поляри- зованному свету.
118 основы геометрической оптики [гл. 3 Подстановка (8) в качестве пробного решения в уравнения Максвелла дает не- сколько соотношений между е, h и Of. Будет показано, что в случае больших k0 (малых Х„) из этих соотношений вытекает требование, чтобы величина У удовлетворяла некоторому дифференциальному уравнению, не зависящему от векторных амплитуд е и h. Используя хорошо известные векторные тождества, получив из (8) rotH0 = (roth+.t\grad^xh)exp(^;)^l, * (9) div |х Но = (j.i div h + h • grad |x + ^oF11 • grad <^) ехр (г*0^) . A0) и аналогичные выражения для -rot Eo и-'diveEo. Следовательно, уравнения B) — E) примут вид grad^xh+ee=—4-roth, A1) grad^xe —nh=—jj-rote, A2) e-grad<^=— .щ (e- grading + dive), A3) h-grad,§P=—ji-(h. grading + div h). A4) Нас интересует решение, соответствующее случаю очень больших k0. Поэтому правыми частями уравнений A1)—A4) можно пренебречь, если выражения, которые умножаются на lHk0, не будут чрезвычайно большими. В этом случае уравнения A1)—A4) запишутся следующим образом: grad^xh + ве —О, ¦ (Па) grad^xe — p,h = O, A2a) e-grad^=0, A3a) ^0. A4a) Ограничимся изучением лишь уравнений (Па) и A2а), так как A3а) и A4а) получаются из них, если первые скалярно умножить на grad &". Урав- нения (Па) и A2а) можно рассматривать как совместную систему шести одно- родных линейных скалярных уравнений относительно декартовых компонент ех, hx,... векторов е и h. Эта система имеет нетривиальное решение лишь в слу- чае выполнения условия совместности (равенство нулю соответствующего опре- делителя). Последнее легко получить, исключая е или h из (Па) и A2а). Под- ставляя h из A2а) в (Па), находим Первый член обращается в нуль на основании A3а), и поскольку е не равно нулю во всем пространстве, находим (grad &>у-=п\ ' A5а) или в явном виде где, как и ранее, п=\ ей, — показатель преломления. Функцию <У часто на- зывают эйконалом *), а соотношение A56) — уравнением эйконала; оно является *) Термин «эГжонал» (от греческого слова e/xcov — изображение) был введен в 1895 г. Бруксом для обозначения некоторых связанных функций (см. стр. 138), однако в дальнейшем он стал применяться в более широком смысле.
3) 3.1] ПРИБЛИЖЕНИЕ ОЧЕНЬ КОРОТКИХ ДЛИН ВОЛЯ 119 основным уравнением геометрической оптики *): Поверхности ^(г) = const называются геометрическими волновыми поверхностями или геометрическими волновыми фронтами **). Уравнение эйконала было выведено нами из уравнений Максвелла (диф- ференциальных уравнений первого порядка), однако его можно получить и из волновых уравнений (уравнений второго порядка) для векторов электрического или магнитного полей. Для этого следует подставить выражения A) и (8) в волновое уравнение A.2.5), и тогда после простых преобразований получим К(е, if, n)+j^L(e, if, п, ц)+-(г^-М(е, е, ц) = 0, A6) где - К(е, if, п) = {п*-(grad iff} е, 1(е, if, п, jx) = {grad^-gradln(x—у2^}е—. — 2 {е-grad In я} grad if—2 (grad ^-grad) e, M(e, e, (д,) = rotexgrad In(j. — V2e—grad (e-grad In e). Соответствующее уравнение, содержащее h и получающееся после подстановки выражения для Н в A.2.6) (либо, проще, используя то обстоятельство, что урав- нения Максвелла остаются неизменными при одновременной замене Е на Н я е на —р,), имеет вид K(h, if, n)+7^L(h, if, п, е)+-~-М'(Ь, ц, е) = 0. A7) В случае достаточно больших k,, вторыми и третьими членами в A6) и A7) обычно можно пренебречь; тогда К = 0, откуда сразу же следует уравнение эйконала. Позднее будет показано, что члены в A6) и A7), содержащие 1/tJfe, в первой степени, также имеют физическое истолкование. Можно показать, что во многих важных случаях векторы Ео и Но можно разложить в асимптотические ряды вида ***) Ео = exp (tt.F) ? -^г , Но = exp (lk&) ? -щ^к , A8) где е1я) и Ь(я0^функции координат, a if— та же функция, что и раньше ****), Геометрической оптике соответствуют первые члены этих разложений. 3.1.2. Световые лучи и закон интенсивности в геометрической оптике. Из соотношений (8), A.4.54) и A.4.55) следует, что усредненные по времени плотности электрической <ше> и магнитной <шт> энергии записываются *) Уравнение эйконала можно считать также характеристическим уравнением волновых уравнений E) и F) из Я 1.2 для Е и Н. Оно дзет строгое описание распространения разрызоа решений этих уравнений. Однако в геометрической оптике интересуются ие распространением разрывов, а решениями, гармонически (или почти гармонически) меняющимися со временем. В приложении 6 показана формальная эквивалентность этих дпух интерпретаций. Уравнение эйконала можно рассматривать также как уравнение Гамильтона — Якоби для вариационной задачи 6 J га ds=O, впервые поставленной применнтельнв к оптике Ферма (см. п. 3.3.2 и приложение 1). **) В дальнейшем в тех местах, "где это не вызовет недоразумений, мы будем опускать прилагательное «геометрический». ***) Здесь мы предполагаем, что через каждую точку проходит только один геометриче- ский волновой фронт. В некоторых случаях, например, при наличии в среде отражающих пре- пятствий, через каждую точку может проходить несколько волновых фронтов. Тогда резуль- тирующее поле получается сложением нескольких рядов подобного типа. ****) Теория таких асимптотических разложений была впервые развита главным обра- зом в работе Лунсбсрга 116]. См, также [17а], [18] и [22]. Исчерпывающий обзор теории приве- ден в [17].
120 ОСНОВЫ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ [ГЛ. 3 в виде Подставляя сюда е* из (Па) и h из A2а), получим <we> = <а>я> = -L [e, h*. grad ff], B0) где квадратные скобки обозначают смешанное произведение. Следовательно, в приближении геометрической оптики усредненные по времени плотности электрической и магнитной энергии равны друг другу. Среднее по времени значение вектора Пойнтинга можно получить с по- мощью (8) и A.4.52); имеем Используя A2а), получим <S> = g^-{(e¦ е*) grad У—(е-grad ^)e*}. На основании A3а) последний член в этом выражении равен нулю; выражая затем е-е* через <й>е> и используя соотношение Максвелла eji — п2, находим <S> = |<^>grad^, B1) Поскольку <а>е> = <ffiim> член 2<ше> определяет среднюю по времени плот- ность полной энергии <ш> (<ш»> — <ауе> +<шт>). Выражение же (graded)//!: на основании уравнения эйконала является единичным вектором (ска- жем, s), i.e. «. _ grad of _ grad У . ,„„. S~ n ~ | grad 4f I' ( ' тогда из B1) следует, что вектор s направлен вдоль усредненного вектора Пойнтинга. Полагая, как и раньше, c/n = v, выражение B1) можно переписать в виде <S> = c<ffi>>s. B3) Следовательно, направление усредненного по времени вектора Пойнтинга совпадает с нормалью к геометрическому волновому фронту, а абсолютная его величина равна произведению средней плотности энергии на спорость v = = cln. Этот результат аналогичен соотношению A.4.9) для случая плоских волн и свидетельствует о том, что в приближении геометрической оптики средняя плотность энергии распространяется со скоростью v = с/п. Геометрические световые лучи можно теперь определить как траектории, ортогональные к геометрическим волновым фронтам &= const. Мы будем при- писывать этим линиям направление, полагая, что оно совпадает в каждой точке с направлением усредненного вектора Пойнтинга *). Если радиус-вектор г is) точки Р, расположенной на луче, рассматривать как функцию длин s дуги луча, то dr/ds = s, и уравнение луча запишется в виде n^ = grad?P. B4) Из A3а) и A4а) видно, что векторы электрического и магнитного полей в каждой точке ортогональны лучу. *) Такое определение световых лучей справедливо лишь для изотропных сред Позже, в гл. 14 мы увидим, что р, анизотропной сп1До нормаль к волновому фронту б общем случае ич совпадает с направлением вектора Поинтинга,
§ 3.1] ПРИБЛИЖЕНИЕ ОЧЕНЬ КОРОТКИХ ДЛИН ВОЛН 121 Смысл уравнения B4) можно пояснить следующим образом. Рассмотрим два соседних волновых фронта $f— const и if+d^f= com,t (рис. 3,1). Тогда f = lr?rad^ = "- ^ B5) Следовательно, расстояние ds между точками пересечения нормали с этими вол- новыми фронтами обратно пропорционально показателю преломления, г. е, прямо пропорционально v, Рис. 3 1. Чертеж, поясняющий смысл Рис 3 2 К выводу закона интенсивности в соотношения nS—grad ?f геометрической оптике Интеграл ) nds вдоль кривой С называется оптической длиной этой кривой. Показывая квадратными скобками оптическую длину луча, соединяющего точки Pi и Pz, получим f, [PlPt] = ^nds = &'(P^-Sf(Pl). ' B6) pt Как мы установили, средняя плотность энергии распространяется вдоль луча со скоростью v =c/n, поэтому где dt — время прохождения энергией расстояния ds вдоль луча; следовательно^ Рг [Р,Р2] =с \ dt, B7) р, т. е. оптическая длина [РА! равна произведению скорости света в вакууме на время распространения света от Pt к Р2. Интенсивность света / была определена нами как абсолютное значение от среднего по времени вектора Пойнтинга. Поэтому из B3) следует, что B8) а закон сохранения A.4.57) дает div(/s) = 0. ' B9) Для того чтобы понять смысл этого соотношения, рассмотрим узкую трубку, образованную световыми лучами, выходящими из элемента dSi волнового фрон- та if (г) = fli (где О].— постоянная), и обозначим через dS2 соответствующий эле- мент, который пересекают эги лучи на другом волновом фронте <У (г) = а2 (рис. 3.2). Интегрируя B9) по объему трубки и применяя теорему Гаусса, по- лучиМ $/s.vdS = 0, C0> где v — внешняя нормаль к поверхности трубки. Поскольку ( 1 на dS2, s-v= < —1 на dSlt \ 0 на'остальной поверхности/
122 ОСНОВЫ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ {30) сводится к выражению l.dS, = /jdS,, C 1) где /L и /2— интенсивности на dSi и dS2 соответственно. Следовательно, вели- чина IdS остается постоянной вдоль трубки лучей. Это соотношение выражает закон интенсивности в геометри- ческой оптике Позже будет показано, что в однородной среде световые лучи имеют вид прямых линий. Закон интенсивности в этом случае мож- но представить в несколько иной форме. Предположим сначала, что rfSi, а следовательно, и dS2 огра- ничены отрезками линий кривизны (рис. 3 3). Если Rt и R[— главные радиусы кривизны отрезков AiBt и BiCi, то Puc 3 3 К выводу закона интенсивности в гео- метрической оптике для прямолинейных лучей B1Cl = R[d<f, где d9 и d(f — углы, под которыми видны А xB-i и BiCi из соответствующих цент- ров кривизны Q и Q'r Следовательно, C2) Аналогичное выражение получается для элемента dSs, который выделяется пучком лучей, прошедших через dSlt из другого волнового фронта семейства, т. е. C3) Если I •— расстояние между dSx и dS2, измеренное вдоль луча, то и окончательно получим C4) Если площадки dSt и dS2 ограничены произвольными кривыми, то формула C4) все равно остается справедливой- В этом легко убедиться, если разбить площадки на большое число элементов, ограниченных линиями кривизны, а за- тем просуммировать вклады от всех элементов, Если R±<^1, R[<^,1, то C4) сводится к 7= 73 • C5) Этой формулой иногда пользуются при изучении рассеяния света. Величина 1/RR', обратная произведению двух главных радиусов кривиз- ны, называется гауссовой (или второй) кривизной поверхности. Из C4) следует, что в любой точке прямолинейного луча интенсивность пропорциональна гауссовой кривизне волнового фронта, проходящего через эту точку В частности, если все (прямолинейные) лучи имеют одну общую точку, го волновые фронты имеют вид сферических поверхностей с центром в этой точке, тогда Ri= R[, Ri= R't, и мы получим (опуская индексы) закон обратного квадрата расстоя- ния, т. е. / = cjnst C6)
§ 3 1] • ПРИБЛИЖЕНИЕ ОЧЕНЬ КОРОТКИХ ДЛИН ВОЛН 123 Возвращаясь к общему случаю произвольного пучка лучей (искривленных или прямых), мы можем, воспользовавшись функцией gP, записать в явном виде соотношения для изменения интенсивности вдоль каждого луча. Подставляя s из B2) в B9) и используя тождества div от = и div v+v-grad и, div grad =F2, получим ~ V1 & + grad tf.grad -1 = 0. Зто можно переписать следующим образом: V2 if -\- grad У-grad In-1 = 0. C7) Введем теперь оператор J^grad^-grad, C8) где т — параметр, характеризующий положение вдоль луча, Тогда C7) примет вид и после интегрирования находим "Г Однако из C8), A5) и B5) следует, что и мы получим окончательное выражение для отношения интенсивностей в двух произвольных точках луча в виде Ц^ехр(-^Л}: D0) здесь интегрирование проводится вдоль луча *). 3.1.3. Распространение векторных амплитуд. Мы видели, что в случае достаточно коротких длин волн распространение энергии можно описать с помощью простой гидродинамической модели, полностью характеризующейся вещественной скалярной функцией I/, которая служит решением уравнения эйконала A5) По традиции считается, что в геометрической оптике рассматри- вается именно гакая приближенная картина распространения энергии, в кото- рой использовались понятия луча и волновых фронтов. Другими словами, поляризация света не рассматривалась Это, без сомнения, объясняется тем, что простые законы геометрической оптики, относящиеся к лучам и волновым фронтам, были известны из экспериментов задолго до появления электромаг- нитной теории света Однако можно, и с нашей точки зрения вполне естественно, расширить рамки геометрической оптики, включив в нее некоторые геометри- ческие законы, связанные с распространением векторных амплитуд е и h. Эти законы легко получить из волновых уравнении AС) и A7). Поскольку функция of удовлетворяет уравнению эйконала, К = 0, и мы видим, что при достаточно больших k0 (малых Хо) в уравнениях A6) и A7) остаются лишь члены, содержащие L Следовательно, в рассматриваемом приближении векторные амплитуды и эйконал связаны мс-кду собой соотноше- *) Клейн [20] показал, что отношение интенсивиостей D0) можно выразить через интег- рал, содержащий 1Лавныс радиусы кривизны соответствующих волновых фронтов Формула Клейна является сстилисниым оообщением соотношения C4) для неоднородной среды. См. также 117].
124 основы геометрической оптики [гл 3 ниями L = 0. Если снова воспользоваться оператором д/дх, определенным C8), то уравнения 1_ = 0 примут вид i|'^) «)grad^ = 0, D1) r%+\( уае7—^pjh + (h-grad In я) grad ?> = (). D2) Это и есгь искомые уравнения переноса, описывающие изменения е и h вдоль каждого луча Чтобы лучше понять их физический смысл, необходимо отдельно рассмотреть изменения этих векторов по величине и направлению. Умножим D1) скалярно на е* и к полученному уравнению прибавим комп- лексно сопряженное. Это дает ^ t *\л-[ ш д\пц\ % „ ,.„\ Учитывая тождество div и v = «div v +v-grad'H, разность (у2еУ— д Aпц)/дт) можно записать следующим образом V2^— Црг= V'ef—grad<5f- grading =ц div (—gT&d^f). D4) Интегрируя D3) вдоль луча, получим для отношения величин е-е* в любых двух точках луча соотношение = ехр -j |/idiv(lgrad^ds\ D5) Это соотношение можно представить и в форме е е \ -.Iе е Л ехр J_ IX^-dsl. D5а) которая получается, если D3) записать в виде и интегрировать вдоль луча Фактически соотношение D5а) является лишь иной формой выра- жения D0) для изменения интенсивности и следует из него, если использовать выражение и формулу Максвелла ец=в3 Аналогичным образом получим (h ^=ехр ~ Рассмотрим теперь изменение комплексных единичных векторов и=уё^' у~тш D7) вдоль каждого луча Подстановка в D1) дает flu , I (д (In е е*) , ,,„ 5 ]п и, 5i + T [~Ч^—" +V2^ g/1 и + (и • grad In n) grad еУ = 0. Согласно D3) выражение в квадратных скобках равно нулю, и мы имеем А.. А.. 1пи)(
•§ 3 11 и аналогично приближение очень коротких длин воля 125 D9) Эти соотношения и представляют законы изменения и и v вдоль луча *). В част- ности, для однородной среды (п — const) D8) и D9) сводятся к выражениям dtx/ds==dvlds = O, т. е. векторы, и и v в этом случае остаются постоянными вдоль каждого луча. Наконец, отметим, что для гармонической по времени однородной плоской волны в однородной среде !/= ль-г, а е, h, e и jx постоянны; следовательно, в уравнении A6) К --= L — М == 0. Поэтому такая волна (независимо от ее ча- стоты) строго подчиняется законам геометрической оптики. 3.1.4. Обобщения геометрической оптики и пределы ее применимости. Выводы предыдущих разделов относились к строго монохроматическому полю. Такое поле, которое можно рассматривать как фурьс-компоненту произволь- ного поля, создает гармонический осциллятор или набор подобных осциллято- ров с одинаковой частотой. В оптике обычно имеют дело с источником, излучающим свет в узком, но конечном диапазоне частот. Такой источник можно рассматривать как набор, большого числа гармонических осцилляторов, частоты которых попадают в ука- занный диапазон. Для вычисления интенсивности света в какой-то точке Р необходимо просуммировать все поля, созданные каждым осциллятором (эле- ментом источника), т. е. е2е н 2н E0) Тогда интенсивность определяется (в вещественном представлении) соотно- шением |? <Е„ХНЮ> Во многих оптических .задачах можно допустить, что вторая сумма в E1) равна нулю (в этих случаях говорят, что поля некогерентны); тогда E2) где Sn— вектор Пойитинга, соответствующий д-му элементу источника. Сей- час мы еще не в состоянии выяснить условия, при которых оправдано пренебре- жение вторым членом в формуле E1), однако мы это сделаем позже при рассмот- рении частичной когерентности (см гл 10). Пусть 6S — небольшая часть волнового фронта, соответствующего какому- то определенному элементу источника. Через 55 проходят трубки лучей, исхо- дящих от каждого элемента источника, центральные лучи этих трубок запол- няют конус с телесным углом 6Q (рис. 3.4). Если угол раствора конуса достаточ- *) Выражения D8) и D9) интересно интерпретируются в неевклидовой геометрии. Если рассмотреть соответств} ющее неевклидово пространство, в котором элемент длины дается соот- ношением то геометрические световые лучи в этом пространстве совпадают с геодезическими линиями, а соотношения D8) и D9), как можно показать, свидетельствуют о том, что векторы и и v пере- мещаются кдоль каждою луча параллельно (в смысле Леви-Чивита) самим себе (см. [15J, [17J, стр 180-183 и [21]).
126 основы геометрической оптики [гл 3 но мал, то можно пренебречь зависимостью Sn от направления и записать E2) в виде /(P)=2j<sn>!=2/B. E3) ц п Теперь положим, что число элементов (осцилляторов) настолько велико, что их распределение без существенной ошибки можно считать непрерывным. Вклад от каждого элемента бесконечно мал, однако суммарный эффект коне- чен. В этом случае сумма (интеграл) пропорциональна 6Й, т. е. / (Р) = B6Q, Канув с телесным углам да, вфаза- ванный централь- ными мучами. Источник Рас. 3.4. К выводу закона интенсивности в геометрической оптике для некогерентного источ- ника конечных размеров. и полный (усредненный по р ^е-чени) поток энергии 8F, проходящий через эле- мент 6S в единицу времени, равен 5F = B6Q6S. E4) Последняя формула играет важную роль в фотометрии и будет использована позже. Рассмотрим теперь кратко пределы применимости геометрической оптики. Уравнение эйконала было получено в предположении, что членами, стоящими в правых частях соотношений A1) и A2), можно пренебречь. Если допустить что безразмерные величины 8, |л и | graded порядка единицы, то, как мы видим, пренебрежение указанными выше членами оправдано, когда изменения е и h на расстояниях, сравнимых с длиной волны, Малы по сравнению с самими вели- чинами е и h. Это условие нарушается, например, на границах тени, так как там интенсивность (а следовательно, е и h) резко меняется. Нельзя также ожидать, что геометрическая оптика даст правильное описание полей вблизи точек, где интенсивность имеет резкий максимум (например, в фокусе, см. § 8 8). Уравнения переноса D1) и D2) для комплексных векторных амплитуд е и h были выведены в предположении, что функция ef удовлетворяет урав- нению эйконала, а члены Х„\ М(е, в, ц| и X0|M(h, p,, к) | малы по сравнению с | L (е, У, п, jx) | и | L(h, gf, п, s) | соответственно. Эти предположения накла- дывают некоторые дополнительные ограничения не только на первые, но и на вторые производные от е и h. Соответствующие условия довольно громоздки, и мы их рассматривать не будем. Можно, конечно, получить более точное приближение, оставляя в разло- жениях для полей некоторые члены более высоких порядков *). Однако прак- тическая ценность такой процедуры для решения задач инструментальной оптики весьма сомнительна, поскольку чем ближе мы подходим к особым областям, тем больше членов в разложениях надо оставлять, а в точках, пред- ставляющих наибольший интерес (в фокусе или на каустической поверхности), *) Келлер [23] предположил, что вклад от членов высшего порядка можно изучить с помощью модели являющейся обобщением обычной геометрической оптики В этой теории вво- дится понятие дифрагировавшего луча, подчиняющегося обобщенному принципу Ферма Каж- дому такому лучу соответствует поле, и предполагается, что последнее подчиняется тем же общим законам распространения, что и поля в грометрическои оптике. Были рассмотрены некоторые приложения этой теории [24j 25] (см также [17]),
§ 3.2] ОБЩИЕ СВОЙСТВА ЛУЧЕЙ 127 эти разложения, как правило, расходятся. Для изучения распределения интенсивности в таких областях более эффективны методы, которые будут рассмотрены в главах, посвященных дифракции.. Наконец подчеркнем, что простота геометрической оптики связана в основ- ном с тем, что обычно в каждой точке поле представляет собой плоскую волну. В оптическом диапазоне частот области, в которых простая геометрическая модель оказывается несправедливой, встречаются весьма редко; фактически в большинстве оптических задач эта модель дает по крайней мере хорошее нулевое приближение для более тонкого исследования. §3.2, Общие свойства лучей 3.2.1. Дифференциальное уравнение для световых лучей. Световые лучи были определены как траектории, ортогональные к геометрическим волновым фронтам if (х, у, г) = const, и мы показали, что если г есть радиус-вектор произвольной точки луча, as**» длина луча, отсчитываемая от .этой точки на нем, то ^ A) Уравнение A) описывает поведение лучей с помощью функции if, однако из него легко получить дифференциальное уравнение, характеризующее лучи непосредственно показателем преломления п (г). Дифференцируя A) по s, получим = igrad ?>-grad (grad if) = ±grad (grad |0a =-^-gradrta. При этих преобразованиях использовано соотношение C.1.15). Таким об- разом, ' . Последнее соотношение представляет собой векторную форму дифференциаль- ных уравнений дли световых лучей. В частности, в однородной среде п =const и B) принимает вид d2 откуда r = sa + b; C) здесь а и b — постоянные векторы. Соотношение C) —¦ это векторное уравнение прямой линии, направленной по а и проходящей через точку г = Ь. Следова- тельно, в однородной среде световые лучи являются прямыми линиями. В качестве примера, представляющего известный интерес, расмотрим по- ведение лучей в среде, обладающей центральной симметрией, т. е. в среде, показатель преломления которой зависит только от расстояния г до фиксиро- ванной точки О: л = п(г). D) Подобные условия приближенно выполняются в земной атмосфере, еслц учи- тывается кривизна Земли. Рассмотрим изменение вектора г х [п (г) s] вдоль луча. Имеем ^ j(ns). E)
128 ОСНОВЫ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ [гл. 3 Поскольку dr/ds = s, первый член в правой части E) обращается в нуль. Второй член можно на основании B) переписать в виде г X grad п. Далее из D) получим х dn ; таким образом, второй член в правой части E) также обращается в нуль. •Следовательно, rX«s = const. F) Отсюда следует, что все лучи являются плоскими кривыми,- лежащими в пло- скости, проходящей через начало коорди- нат, и вдоль каждого луча выполняется условие nr sin tp = const, G) где ф — угол между радиусом-вектором г и касательной в точке Р (рис. 3.5). Так как величина г sin cp равна расстоя- нию от начала координат до касатель- ной, выражение G) можно записать в виде nd — const. (8) Рис. 3 5. К выводу формулы Бугера nd~ const для лучей, распространяющихся н сферически симметричной среде. Это соотношение иногда называют формулой Бугера; она является аналогом известной формулы динамики, выражающей закон сохранения углового мо- мента частицы, движущейся под действием центральной силы. Чтобы получить в явном виде уравнения световых лучей в сферически симметричной среде, вспомним из элементарной геометрии, что если (г, 9) — полярные координаты, то угол ср между радиусом-вектором точки Р на плоской кривой и касательной в этой точке дается соотношением (см., например, B61) Г(е\ (9) Г ¦<6)+ Из G) и (9) найдем &г а ?-! A0) где с— постоянная. Тогда уравнение лучей в сферически симметричной среде можно записать в виде г A1) Вернемся теперь к обсуждению общего случая и рассмотрим вектор кри- еизны луча, т, е. вектор K=| = lv, A2) длина которого 1/р равна величине, обратной радиусу кривизны; v — единич- ный вектор главной нормали в произвольной точке луча, Из соотношений B) и A2) следует, что «K = gradn— jjs. A3) Это соотношение показывает, что градиент показателя преломления лежит ¦в соприкасающейся плоскости луча. Умножив A3) скалярно на К и воспользовавшись A2), получим | = - = v-grad!nn. A4)
§ 3.2] ОБЩИЕ СВОЙСТВА ЛУЧЕЙ 129 Поскольку величина р всегда положительна, отсюда следует, что вдоль главной нормали показатель преломления возрастает, т. е. луч «.загибается-» в область € большим показателем преломления (рис. 3.6). 3.2.2. Законы преломления и отражения. До сих пор предполагалось, что показатель преломления п — непрерывная функция. Рассмотрим теперь по- ведение лучей, пересекающих поверхность, разделяющую две однородные сре- ды с различными показателями преломления. Зоммерфельд и Рунге [71 показа- ли, что его легко установить с помощью рассуждений, сходных с рассуждени- ями, которые проводились при выводе граничных условий для векторов полей на поверхности раздела (см. п. 1.1.3). Рис. 3.6. Искривление луча в не- однородной среде. Рис. 3.7. К выводу законов преломления и отражения. Учитывая тождество rot grad == 0, находим, что в соответствии с A) вектор ns я dr/ds, называемый иногда лучевым вектором, удовлетворяег соотно- шению rotras = 0. A5) Как и в п. 1.1.3, заменим поверхность раздела Т переходным слоем, в котором величины е, (д, и я меняются быстро, но непрерывно от своих значений около Т с одной стороны поверхности до значений около Т с другой ее стороны Далее рассмотрим плоский элемент поверхности, стороны которого PiQi и PiQ2 парал- лельны, a PiP2 и Q,Q2 перпендикулярны к Т (рис. 3.7). Если обозначить через b единичный вектор нормали к этому элементу, то, интегрируя A5) по площади элемента и используя теорему Стокса, получим (rot ns) ¦ bdS = [ п sdr = О, A6) где второй интеграл берется по ограничивающему элемент контуру PiQiQaPa. Переходя к пределу, когда высота б/г-> 0, совершенно таким же способом, как и при выводе A.1.23), найдем п х iti s tt s \ = 0 (\ 1\ гдеп12— единичный вектор нормали к поверхности раздела, направленный из первой среды во вторую. Из A7) следует, что тангенциальная составляющая лучевого вектора ns непрерывна при переходе через поверхность раздела, или, что то же самое, вектор N — h,,s2— nLsL перпендикулярен к этой поверхности. Пусть 6± и fl2— углы, которые образуют падающий и преломленный лучи с нормалью к поверхности п12 (рис. 3.8, а). Тогда, согласно A7), имеем A8) A9) Смысл формулы A8) состоит в том, что преломленный луч лежит в плоскости, образованной падающим лучом и нормалью к поверхности раздела (плоскости падения), а формулы A9) — в том, что отношение синуса угла преломления к си- нусу угла падения равно отношению показателей преломления njn^. Эти два ре- 9 М. Бора, Э. Вольф или
ьзо- ОСНОВЫ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ [гл. 3 зудьтата выражают закон преломления (закон Снелиуса). Он был выведен нами ранее в § 1.5 для частного случая плоских волн. Однако если прежний вывод справедлив для случая падения плоской волны с произвольным значением Ха на плоскую отражающую поверхность, настоящий относится к волнам и отра- жающим поверхностям более общей формы при условии, что длина волны достаточно мала (Ло—>¦ 0). Последнее условие практически означает, что радиу- сы кривизны волнового фронта падающей волны и поверхности раздела должны быть велики по сравнению с длиной волны падающего света. Как и в случае, рассмотренном в § 1.5, следует ожидать, что и здесь появит- ся другая отраженная волна, возвращающаяся обратно в первую среду .Полагая а) Рис. 3.8. К выводу законов преломления (а) и отражения (б). в A8) и A9) л2= «1 (см. рис. 3.8, б), получим, что отраженный луч лежит в пло- скости падения, a sin 02= sir! Si и, следовательно, - е8 = л—в,. B0) Последние два результата выражают закон отражения. 3.2.3.Конгруэнции лучей и фокальные свойства. Соотношение A5), а именно ' rotns = 0, • .,B1) определяет все системы лучей, которые могут существовать в изотропной среде, и выделяет нх из более общих семейств кривых. В однородной изотропной среде показатель преломления п постоянен, и поэтому B1) принимает вид rots = 0. . ; " B2): В неоднородной изотропной среде лучи также можно описать соотношением, не зависящим от п. Его можно получить из B1), если воспользоваться тождест- вом rot its ¦— п rot s -f (grad n) Xs, а затем умножить соотношение B1) скалярно на S. В результате получим, что система лучей в любой изотропной среде должна. удовлетворять соотношению ¦'¦ . '•¦' ' s-rots = 0. ' B3} Система кривых, заполняющих некоторую часть пространства так, что через каждую точку данной области, в общем случае проходит одна кривая, называется конгруэнцией. Говорят, что конгруэнция нормальна, если сущест- вует семейство поверхностей, пересекающих каждую кривую под прямым углом; если такого семейства нет, то говорят о косой конгруэнции. В обычной- геометрической оптике (распространение света) рассматривают только нормаль- ные конгруэнции, однако в электронной оптикел(см. приложение 2) важную роль, играют и косые конгруэнции. ', , . Если все линии, составляющие конгруэнцию, имеют вид прямых, то такая .конгруэнция называется прямолинейной; формулы B3) и B4) служат иеобхо-
§ 3 3] ДРУГИЕ ОСНОВНЫЕ ТЕОРЕМЫ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ 131 димыми и достаточными условиями того, что конгруэцция является соответст- венно нормальной и нормальной прямолинейной *). Выберем па одной из ортогональных поверхностей <У(л, у, г) = const систему криволинейных координат и, v Каждой точке Q (и, v) на этой поверх- ности соответствует одна кри- _ вая конгруэнции, а именно X\\N. s ^__?__ •- кривая, пересекающая дай- ^SJv-V-V^s^^""" Кривая нормальной. ную поверхность в точке Q ^\^f\^ , " комгрутциа '" Пусть г—радиус-вектор точки Р, расположенной на такой кривой Величину г можно рассматривать как функцию ^* "Поверхность $=const координат (и о) и длины дуги Рщ._ 3 g введеиию понятия нормальной конгру. s qt точки Q до Р, измерен- энции ной вдоль кривой (рис 3 9). Рассмотрим две соседиие кривые из конгруэнции, пересекающие поверх- ность Sf = const в точках (и, v) и (и + du, v -г dv), и выясним, имеются ли на этих кривых такие точки, расстояние между которыми второго или более вы- сокого порядка малости (говорят, что кривые в таких точках имеют пересечение первого порядка) Точки подобного типа называются фокусами и удовлетворяют уравнению г (и, v, s) — r(u-~du, v-\-dv, s + ds) B4) с точностью до членов второго порядка малости. Разлагая B4) в ряд, получим rttdu + rvdv + sds = Q, B5) где г„, rv— частные производные по и и v. Из условия B5) следует, что ra, tv и s компланарны. Это .эквивалентно утверждению, что смешанное произведение этих трех векторов равно нулю, т. е. [г,, r,,s]=O. B6) Число фокусов на данной кпивой зависит от числа значений s, удовлетво- ряющих уравнению B6) Если г есть полином по s степени т, то, поскольку s = dn'ds, B6) является уравнением относительно s степени Ът — 1. В частно- сти, если конгруэнция прямолинейна, то г—линейная функция s(m~ 1), и, следовательно, на каждом луче прямолинейной конгруэнции имеюпыч два фокуса. Если величины и и v принимают все возможные значения, то фокусы обра- зуют поверхность, которая описывается уравнением B5) и называется фо- кальной поверхностью, в оптике она называется каустической поверхностью Любая кривая данной конгруэнции касается фокальной поверхности в каждом своем фокусе Плоскость, касающаяся фокальной поверхности в какой-либо се точке, называется фокальной плоскостью В дальнейшем мы будем в основном изучать поведение лучей в однородной среде, т е рассматривать лишь прямолинейные конгруэнции В § 4 6 при рас- смотрении астигматических пучков лучей мы обсудим и некоторые другие езой- ства таких конгруэнции. § 3.3. Другие основные теоремы геометрической оптики С помощью соотношений, полученных выше, выведем несколько теорем о поведении тхчей и волновых фронтов 3.3.1. Интегральный инвариант Лагранжа. Сначала предположим, что показатель преломления я является непрерывной функцией координат. Тогда, Для более подробного ознакомления t теорией конгруэнции кривых см , например, [27].
132 основы геометрической оптики [гл. 3 если применить теорему Стокса к интегралу от нормальной компоненты rot ns, взятому по любой открытой поверхности, получим (как и при выводе C.2.16)) &ns-dr=0. A) Интегрирование здесь проводится по замкнутому контуру С, ограничивающе- му указанную поверхность. Полученное соотношение называется интегральным инвариантом Лагранжа *\ и означает, что интеграл I ns-dr, B) р, взятый между любыми двумя точками поля Pi и Р.г, не зависит от пути интегрирования. С помощью закона преломления легко показать, что формула A) остается справедливой, если кон- тур С пересекает поверхность, разделяющую две Рис 3 10 К выводу интег- однородные среды с разными показателями ирелом- рлльнош инварианта Лагран- ления. Для доказательства положим, что контур жа при наличии у функции С разделяется на части 6\ и С2, расположенные по показателя преломления по- разные «ороны от преломляющей поверхности Т верхности разрыва. (рис. 3 10), а точки пересечения контура С с по- верхностью Т соединены другой кривой АГ, лежащей па этой поверхности. Применяя A) к обоим контурам CiK и С3/С и складывая полученные уравнения, имее i \ ftjSj • dr + J rt2s2 • dr + j («2s2 — n^) • dr = 0. C) с, с, к Интеграл вдоль К равен нулю, поскольку вектор N = п&— я^г, согласно за- кону преломления, нормален поверхности Т в любой точке кривой К, и, следо- вательно выражение C) сводится к A). 3.3.2. Принцип Ферма Принцип Ферма, известный также как принцип- наикратчайшего оптического пути**), утверждает, что оптическая длина \ D) р, реального луча между любыми двумя точками Pt и Р* короче оптической длины любой другой кривой, соединяющей эти точки и, лежащей в некоторой регулярной окрестности луча Под регулярной окрестностью понимается область, которую можно заполнить лучами таким образом, что через каждлю ее точку будет про- ходить один (и только один) луч. Например, такой областью является та часть пространства, которую заполняют лучи oi точечного источника Рь где эти лучи (из-за преломления, отражения ичи из-за своей кривизны) не пересекаются. Прежде чем доказывать это, необходимо отметить, что принцип Ферма можно сформулировать н несколько иной, более слабой форме, применимой, однако, в более широкой области. Согласно данной формулировке реальный *) Иногда это выражение называют инвариантом Пуанкаре Фактически оно является ¦шгаь частым одномерным сличаем гораздо более общих интегральных инвариантов, рассмот- ренных Пуанкаре |28, 29] См тлкже приложение 1, уравнение (85). **) Поскольку из C 1 21) следует, что Р, Pt f nds = c С dt, р, р, его называют также принципом наименьшего времени.
§ 3.3] ДРУГИЕ ОСНОВНЫЕ ТЕОРЕМЫ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ 133 луч отличается от остальных кривых (не обязательно лежащих в регулярной окрестности) тем, что соответствующий ему интеграл D) имеет стационарное Значение. Чтобы найти кривые, для которых интеграл имсег стационарное значение, необходимо в общгм случае применить методы вариационного исчисления, описанные и приложении 1. Там показано, что координаты таких кривых удовлетворяют дифференциальным уравнениям Эйлера (см. G) приложения 1). В нашем случае это просто уравнения лучен C.2-2), что пока- зано в и. 11 приложения 1. Каратеодори [2] подчеркивал, что стационарное значение никогда не является истинным максимумом. Поэтому во второй, более слабой формулировке принципа Ферма необходимо гово- рить о стационарном, а не экстремальном значении. Исходной же формулировке принципа соответствует «сильный минимум» в смысле Якоби (см. приложе- ние 1, п. 10). Для доказательства принципа Ферма рассмотрим пучок лучей и сравним опти- ческие длины отрезка РгРг луча С и произ- вольной кривой С, соединяющей точки Р, и Р-2 (рис. 3.11). Пусть два соседних волновых фронта пучка пересекают С в точках Qz и Q2, а С — в точках Q, и Q2. Далее обозна- чим через QI точку пересечения волнового фронта Q2Q2 с лучом С', проходящим через точку Q2. Применяя интегральное соотношение Лагранжа к маленькому Рис, 3.11. К доказательству принципа Ферма. треугольнику .получим E) Из определения скалярного произведения следует, что QlQ,QtQt Далее, вектор s перпендикулярен к йт на волновом фронте, и поэтому Применяя в соотношении E) последние три выражения, получим и после интегрирования Поскольку Qu Q'2 и Qlt Q2 являются соответствующими точками на двух вол- новых фронтах, находим, согласно C.1.25), F) G) Кроме того, знак равенства можно ставить л'ишь в том случае, если направле- ния s и dr совпадают в каждой точке кривой С, т. с. если она является реальным лучом. Однако такой случай исключен нашим предположением, что через каж- дую точку окрестности проходит только один луч. Следовательно, оптическая длина луча меньше оптической длины произвольной кривой С, т. е. принцип Ферма доказан. Легко показать, что в случае невыполнения условия регулярности оптиче- ская длина луча может оказаться не минимальной. Рассмотрим, например, поле лучей от точечного источника Рх в однородной среде, отраженных плоским зеркалом (рис. 3.12). Через любую точку Рг в этом случае проходят два луча; оптическая длина прямого луча Р\Р?. является абсолютно минимальной, тогда
134 ОСНОВЫ TFOMfTPHMbCKOfi ОПТИКИ [гл. 3 /7 Рис 3 12. Поле лучек, образующихся при отраже- нии света точечного источника от плоского зеркала. как оптическая длина отраженного луча РгМР? мгнимальна лишь по отноше- нию к оптическим длинам кривых, лежащих в некоторой ограниченной окрест- ности луча. В общем случае, если лучи от ючечною источника Р, преломляются или отражаются на поверхностях раздела однородных сред, го регулярная об- ласть оканчивается на огибаю- щей (ка\стике) совокупности лу- чей Точка Р'г, в которой луч от точечного источника Рг касается огибающей, называется точкой, сопряженной точке Pi на данном луче. Для того чтобы оптическая длина луча PLP,— была мини- мальной, точка Р^ должна ле- жать между Рг и Р[, т. е. точ- ки Pi и Р2 должны лежать по одну сторону от каустики. Например, в слу- чае нескорректированной линзы (рис. 3.13) центральный луч от Рг имеет мини- мальнхю оптичеекмо длину лишь до кончика каустики Р[ (гауссово изображе- ние ючки PCl Длч любой почки Я2, лежащей за огибающей, оптическая длина прямого п\тп PiP\P, превышает оптическую длин) ломаного пути РгАВР^. 3.3.3. Теорема Малюса и Дюпина и некоторые другие связанные с ней тео- ремы. Световые лучи были определены как траектории, ортогональные к вол- новым поверхностям У (х, у, г) — = const, где kf— решение урав- нения эиконала C 1 15) Такое определение естественно при вы- воде законов i еометрической оптики из уравнений Максвел- ла. Однако исторически геомст- Каустика Рис 3 13 Каустика, образованная лучами от то- чечного источника, расположенного па оси, после их прохождения через линзу. рическая оптика развивалась как теория световых лучей,опреде- ленных по-другому, а именно как кривых, для которых криволи- нейные интегралы \ rids имеют стационарные значения. Геометрическую оп- тику, сформулировашлю таким образом, можно развивать далее, только ис- пользуя аппарат вариационного исчисления *). Вариационный метод играет в физике очень важную роль, так как он часто раскрывает аналогии между ее различными областями. В частности, существует 1лубокая аналогия между геометрической оптикой и механикой движущейся частицы, эга аналогия была отчетливо обнаружена благодаря блестящим ис- следованиям Гамильтона, метод которого приобрел весьма важное значение в со- временной физике, особенно в волновой механике де Бройля Чтобы не преры- вать рассмотрение оптических проблем, изложение способов вычисления вариа- ций и описание аналогии Гамильтона помещены в отдельных разделах (см. при- ложения 1 и 2). Здесь мы только покажем, как из интегрального инварианта Лагранжа можно пол\чить несколько теорем, сыгравших важную роль в раз- витии i еометрической оптики. Рассмотрим л)чи в однородной среде: если все они имеют общую точку, например исходят нз точечного источника, то говорят, что лучи образуют гомоцентрический пучок Такой пучок образует нормальную конгруэнцию, по- скольк> каждый луч пучка пересекает под прямым \глом сферические поверх- ности, центр которых расположен в точке пересечения лучей. *) Систематическое изложение такого типа приведено, например, в работе Каратео- дори [2].
§ 3.3) ДРУГИЕ ОСНОВНЫЕ ТЕОРЕМЫ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ -135 Малюс *) в 1808 г. показал, что если гомоцентрический пучок прямо линейных лучей преломляется или отражается какой-нибудь поверхностью, то получающийся после этого пучок (в общем случае уже не гомоцентрический) тоже образует нормальную конгруэнцию. Позднее Люпин A816 г.), Кветеле {1825 п) и Жергонн A825 г.) обобщили результат Малюса. Работы этих ученых позволили сбормулировать следующую теорему, называемую иногда теоремой Малюса и Люпина. Нормальная прямолиней- ная конгру /нция остается нормальной после любого числа преломлений и отражений **). Достаточно доказать эту теорему для слу- чая одного акта преломления. Рассмотрим нормальную прямолинейную конгруэнцию лучей в однородной среде с показателем пре- ломления л, и предположим, что лучи прелом- ляются на поверхности Т, отделяющей эту среду от другой однородной среды с показате- , """ лем преломления п, (рис. 3.14). Рис. 3.14. К, доказательству теаре- Пусть S, — один из волновых фронтов мы Малюса и Дюпина. в первой области, Д, и Р—точки пересе- чений произвольного луча в первой среде соответственно с Si и Т, а Аг— точка на преломленном л\'че. Если точку А, сместить в другую точку В, на том же волновом фронте, то точка Р на поверхности преломления сместится в Q. Теперь на преломленном в точке Q луче выберем такую точку В.,, чтобы оптиче- ский путь от Bt до В2 равнялся оптическому пути от Аг до Аг, т. е. чтобы [А,РА,] = [В^В,]. ' ' Щ Если перемещать точку Вг по всей поверхности Si, то точка В2 при своем пере- мещении заполнит поверхность S2. Покажем, что преломленный луч QB, перпендикулярен к этой поверхности. Вычисляя интегральный инвариант Лагранжа щ> замкнутому пути AxPA^B^QBiAt, получим I nds+ J ns-dr + I nds+ I na-dr = 0. (9) A,'PA, A,B, < B,QBt B,Al На основании (8) можно напирать 5 nds+ I «ds=0. A0) Л,/'Л, B2QB, Кроме того, поскольку на волновом фронте Si единичный вектор s всюду пер- пендикулярен к нему, имеем : 5 /zs-dr = O A1) В,А, и, следовательно, (9) принимает вид \ ns-dr = 0. A2) л"в, Полученное соотношение должно выполниться на S2 для любого отрезка кривой. Это возможно только в том случае, если s-dr = 0 для каждого линей- •) См. !30], а также [31]. В работе [32] приведены ссылки и изложена иитересиая история теоремы А^алюса — Дюпина. **) Леви Чнвита [331 доказал обратную теорему, состоящую в том, что две любые нормаль- ные прямолинейные нопгруэнцин можно перевести друг в друга с помощью одного преломле- ния или отражения.
136 ОСНОВЫ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ (П 3 него элемента dr поверхности 52) т. е. если преломленные лучи перпендикуляр- ны к ней, другими словами, если преломленные лучи образуют нормальную конгруэнцию Доказательство для случая отражения абсолютно аналогично приведенному выше. Поскольку [/^P/IJ — [BjQBJ, можно утверждать, что оптическая длина пути между любыми двумя волновыми фронтами одинакова для всех лучей. Очевидно, что этот результат остается справедливым для случая нескольких последовательных преломлений или отражений, а также, как непосредственно следует из C.1.26), в случае распространения лучей в среде с непрерывно из- меняющимся показателем преломления. Эта теорема называется принципом равного оптического пути, из нее следует, что геометрические волновые фронты нормальной конгруэнции лучей или совокупности нормальных конгруэнции, образованных в результате последовательных преломлении или отражений, «оптически параллельны» друг другу (см. приложение 1). С последней теоремой связана теорема, впервые выдвинутая Гюйгенсом [34], которая утверждает, что каждый элемент волнового фронта можно рас- сматривать как центр вторичного возмущения, пороокдающего вторичные сфе- рические волны и, кроме того, что волновым фронтом в любой последующий момент времени служит огибающая этих вторичных сферических волн Это утверждение (построение Гюйгенса) служит правилом для построения поверх- ностей, «оптически параллельных» друг другу Если среда однородна, то при построении можно использовать сферические волны конечного радиуса, в про- тивном случае необходимо пользоваться волнами бесконечно малого радиуса. Теорема Гюйгенса была позднее обобщена Френелем и легла в основу так называемого принципа Гюйгенса—Френеля, играющего важную роль в теории дифракции (см. § 8 2) и являющегося основным постулатом волновой теории света. ЛИТЕРАТУРА 1 М Herzberger, Strahlenoptik, Springer, Berlin, 1931, p 179, Z f Instrkde 52, 429— 435, 485—493, 534—542 A932) 2. С Caratheodory, Geometrische Optik, Springer, Berlin, 1937 3 E M а с h, The Principles of Physical Optics, A Historical and Philosophical Treatment (первое немецкое издание 1913 г ) 4. G Kirchhoff, Vorlesungen u Math Phys 2 (Mathematische Optik), Teubner, Leipzig, 1891, p 33 5. В Baker, E Copson, The Mathematical Theory of Huygens' Principle, Clarendon Press, Oxford, 2nd ed 1950, p 79 6. A Sommerfeld, Optics, Acad Press, New York, 1954. (А Зоммерфельд, Оптика, ИЛ, 1953) 7. A Sommeifeld, J. Runge, Ann. d Physik 35, 289 A911). 8. В И г f а т о в с к и й, Труды Оптического института, Петроград, I, III A919). А Фок, Труды Оптического института 3, 3 A924) М Рыт о в, Д\Н СССР 18, 263 A938) \ г 1 е >, Det Kgl Danske Vidensk Selsk 22, № 8, 1945 G Friedlander, Proc Cambr Phil Soc 43, 284A947) S u с h y, Ann d Physik 11, 113 A952), 12, 423 A953), 13, 178 A953) S Ingarden, A Krzywicki, Acta Phys Polonica 14, 255 A955) 15 R К Luneburg, Mathematical Theory of Optics (Мимеограф), Brown Umv , Provi- dence, 1944, p 55—59, печатное издание Univ California Press, Berkeley a Los Angeles, 1964, p 51—55 16. R K. Luneburg, Propagation of Electromagnetic Waves, New York, University, 1947— 1948 17 M Kline, I W. К а у, Electromagnetic Theory of Geometrical Optics, Intersci Publ , New York, 1965 17a M Klin e, Comm Pure a Appl. Math., 8, 595 A955) 18. M Kim e, Comm Pure a Appl Math 4, 225 A951) 19 Symposium on Theory of Electromagnetic Waves, Intcrscience New York, 1951, p. 225 20 M Kline, Comm Pure a Appl Math 14, 473 A961) 21 Г В о r t о 1 о t t l. Rend R Ace Naz Line 6a 4, 552 A926) 22. W. В r a u n b e k, Z Naturforsch 6, 672 A951). 9 10. 11 12 13 14 В С N F К R
ЛИТЕРАТУРА - 13? 23. J. В. Keller, J. Appl. Phys. 28, 426A957); см. также Calculus of Variations and its Appli- cations, ed. L. M. Graves, McGrow-Hill, New York, 1958. 24. J. B. Keller, Trans. IRE, A. P.-4, 312 A956). 25. J. B. Keller, R. M. Lewis, B. D. Scckler, J. Appl. Phys. 28, 570 A957). 26. R. Conrant, Differential and Integral Calculus, Vol. I., Blackie, Glasgow, 2-nd ed., 1942 (P. Курант, Курс дифференциального и интегрального исчисления, ГТТИ, 1931.) 27. С. Е. W e a t h е г b u r n. Differential Geometry ©t Three Dimensions, Cambr. Univ. Press., Vol. I, 1927; Vol. II, 1930. 28. J. H. Poincare, Les Methodes Nouvelles de la Mecanique Celeste, Gauthier-Villars, Paris, 1899, Vol. 3. 29. E. С a r t a n, Lecons sur les Invariants Integraux, Hermann, Paris, 1922. (Э. Карта н. Интегральные инварианты, Гостехиздат, 1940.) 30. Е. Mai us, Optique Dioptrique, J. Ecole polylechn. 7, 1—44, 84—129 A808). 31. E. M a 1 u s, Traite d'Optique, Mem. present a I'lnstitut par divers savants 2, 214—3O2ARU). 32. W. R. Hamilton, Mathematical Papers, Vol. 1, Geometrical Optics, ed. by A. W. Con- way, a. J. L. Synge, Cambr. Univ. Press. 1931, p. 463. 33. T. Levi-Civita, Rend. R. Ace. Naz. Line. 9, 237 A900). 34. Chr. Huygens, Traite de la Lumiere, Leiden, 1690; MacMillan a. Co. 1912. (X. Гюй- генс, Трактат о свете, ОНТИ, 1935.)
Г Л А В А 4 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ §4.1. Характеристические функции Гамильтона В § 3.1 было показано, что в приближении геометрической оптики поле можно охарактеризовать одной скалярной функцией а/Чг). Поскольку е/(г) удовлетворяет уравнению эйконала C.1.15), эта функция полностью опреде- ляется величиной показателя преломления я (г), и соответствующими граничны- ми условиями. Часто вместо функции $f (r) используют тесно связанные с ней функции, называемые характеристическими функциями среды. Они были введены в оп- тику Гамильтоном в серии его классических статей [11 *). Несмотря на то, что вследствие существенных алгебраических трудностей характеристические функции можно вычислить в яв- ном виде лишь для самых про- стых сред, методы Гамильтона являются мощным средством для систематических аналитических исследований общих свойств оп- тических систем. При обсуждении свойств этих функций и их приложений Рис. 4.1. К определению точечной характеристики, мы будем предполагать, что рас- сматриваемая среда изотропна, но, вообще говоря, неоднородна. 4.1.1. Точечная характеристика. Пусть <х0, (/„, г„) и (х„ ylt zj— соответ- ственно координаты двух точек Р„ и Я, в двух различных прямоугольных координатных системах, оси которых параллельны друг другу **) (рис. 4.1). Если соединить эти точки всеми возможными кривыми, то в общем случае неко- торые из них окажутся оптическими лучами, удовлетворяющими принципу Ферма. Предположим вначале, что две произвольные точки соединяются только •одним лучом. Тогда характеристическая функция V, или точечная характери- стика, определяется как оптическая длина [РсРг1 луча между двумя точками, рассматриваемая как функция их координат, т. е. V (х0, у„, г0; xlt ylt zj = J n ds. A) Необходимо подчеркнуть, что эта функция определяется свойствами среди. *) Эти работы перепечатаны в [2]. Много лет спустя Брунс независимо рассмотрел ана- логичные функции, которые он назвал эйконалами [3]. Как уже отмечалось выше, этот термин .стал употребляться позднее в более широком смысле. Сами характеристические функции Га- мильтона тоже иногда называют эйконалами. Полезным введением к изучению методов Гамильтона служит монография Синджа [4]. Связь между работами Гамильтона и Брунса обсуждалась в трудах Клейна [5, 6], Каратеодори 17] и в полемике Герцбергера с Синджем [8]. **) Использование двух координатных систем имеет некоторое преимущество, поскольку точки Р(, и Рг часто расположены в различных областях, а именно в пространстве объекта и пространстве изображения оптической системы.
-§ 4.1) ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ ГАМИЛЬТОНА J39 Из выражения A) и соотношения C.1.26) следует, что г У(х„, у0, г0; xlt у„ zl). = ^f(xl, ylt г,)—??(х0, у0, z0), B)' где функция У связана с любым пучком лучей, к которому принадлежит све- товой луч, соединяющий точки Ро и Pi (например, с пучком, испускаемым то- чечным источником в Р„) *). Тогда на основании C 1 24) получим следующие соотношения для направленных вдоль луча единичных векторов s0 и Si в точках' Ро и Л: = — noso, grad'V^n^, C) здесь индексы 0 и 1 указывают, что оператор grad действует соответственно на координаты (*о, У а, 20) и (A'i> #!•• г1)- Вектор g=-ns D)' иногда называют лучевым вектором. Пусть а, $ и 7'— углы, образованные лу- чевым вектором с координатными осями; тогда его проекции на оси p = ncosoc, q — n cosp, m = ncosy E) называются лучевыми компонентами **). Учитывая тождество cos3 a + cos3 p -f cos2 у = 1, мы видим, что они удовлетворяют следующему соотношению: p2 + <72-f-m2 = n3. F) Согласно C) лучевые компоненты в точках Ра и Рг определяются выраже- аналогичные соотношения справедлив^ для qa, qt и щ,0, Ш\. Отсюда следует, что, зная точечную характеристику, можно сразу же определить компоненты луча, соединяющего две произвольные точки в среде. Далее из F) и G) выте- кает, что точечная характеристика удовлетворяет уравнению эйконала, запи- санному как в координатах хв, у„, г0, так и в координатах хи у1у гь т. е. Часто вместо точечной характеристики удобно использовать другие, сья* занные с ней функции (также введенные Гамильтоном), которые называются смешанной и угловой характеристиками. Их можно получить из точечной ха- рактеристики с помощью преобразований Лежандра* * *), и они оказываются осо- бенно полезными, когда Ро или Ри или обе эти точки находятся в бесконеч- ности. *) На я1ым> зарптионногоисчисления ?Р служит решением уравнения Гамильтона — Якоби, связанно! о с вариационной задачей Ферма, содержащим двухпарпметрическое семеиство (оо2) экстремален Г очечная характеристическая функция V является общим решением, содер- жащим все (со4} женкмми (см приложение 1) ¦**) Такое сжич\к.тричное» обозначение выбрано здесь с опреде-ченной целыо^—напом- вить, что блпюдтря 'ожд^стпу F) независимы только две лучевые компоненты ***) Преобразование Лежандра в общем случае так трансформирует функцию"f{x, у) й функцию g(x, г), где z—dfldy, что производная от g по новой переменной г равна старой пере1 менной у.
140 ГЕОМЕТРИЧЕСКАЯ TFOPHH ОПТИЧЬСКИХ ИЗОБРАЖРНИЙ (ГЛ. 4 4.1.2. Смешанная характеристика. Смешанная характеристическая функ- ция W определяется из уравнения v w—V Vni ПОУ где суммируются три сходных члена с индексом 1. Чтобы придать смешанной характеристике более наглядным физический смысл, мы, сле- дуя Синджу, определяем ее со знаком, противоположным тому, который использовал Гамильтон Смешанную характеристику можно также определить соотношением №" — V-|-2 Ро*о> где суммирование производится по сходным членам с индексом 0 Функции W и №" обладают, конечно, совершенно одинаковыми свойствами Как мы видим, W — функция девяти переменных, однако в общем случае только шесть из них независимы (в однородной среде— пять). Для доказатель- ства последнего утверждения предположим, что точки Ро и Рг сместились на небольшие расстояния. Соответствующее изменение W дается выражением Согласно G) Из A1) и A2) находим Отсюда следует, что в общем случае W является функцией шести переменных Хс, tfo, гс, Ри i. «1ь при этом <№_ №_ , . "° дх„' г dpt' аналогичные выражения справедливы для q0, уи т„ и zt. Согласно F) функция j W (х0, уа, 20, Pi, Qu nil) удовлетворяет уравнению эйконала Отметим (рис. 4.2), что сумма ^р-^Хх имеет простое геометрическое истолкование, а именно 2>A = iid,. A6) где dt= QiPx— проекция ОгРх на касательную к лучу в точке Pt Если Pt находится в однородной среде, то часть луча в окрестности Р, совпадает с от- Рис 4 2 К определению сме- резком Qi/\, тогда, согласно A0) и A6), функция № шанной характеристики. является оптической длиной луча от точки Ро до ос- нования Qi перпендикуляра, опущенного из начала координат Ot на выходящий из системы луч (рис 4 3), т е. Поскольку в этом случае показатель преломления среды около точки Pt посто- янен, из выражения F) следует, что а формула A3) после подстановки в нее A8) принимает вид *) ъ,1. A9) •) Если какая либо функция зависит от переменных, связанных дополнительными соот- ношениями, такими, как (б"), то часть этих переменных можно исключить можно также вое. пользоваться указанными соотношениями для преобразования функции в однородную по всем переменным Последнюю процедуру, которая оказывается довольно сложной, часто использо- вгл Гамильтон.
ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ ГАМИЛЬТОНА 141 Следовательно, если у конца луча среда однородна, то смешанная характери- стика является функцией пяти переменных W = W (х„ у0, za; Pl, q,), B0) а ее производные удовлетворяют следующим соотношениям B1) B2) dW &№ dW Pi ~ ml dPl ' Отсюда вытекает, что если заданы точка на луче в первой среде и лучевые ком- поненты во второй среде, то, зная смешанную характеристику, можно сразу Рис 4 3. Интерпретация характеристических функций Гамильтона в случае однородных начальной и конечной сред IV <*„, j/o. г.. *,. III. »i)=[P.P,]. W{x,.y,. г, p,,qt) = [P»Q,1. T Qv gt pL. i/J^tQ.QJ же определить лучевые компоненты в первой среде и точки на луче во второй среде. 4.1.3. Угловая характеристика. Угловую характеристику Т можно опре- делить с помощью следующего соотношения' 2"=-=у+2рл—2рл. B3) При небольшом смещении точек Ро и Pt соответствующее изменение Т, согласно A2), равно Следовательно, Т является функцией шести лучевых компонент, и при этом дТ Фо ' B5) аналогичные выражения справедливы и для других координат Из B3) следует, что если среды, в которых находятся точки Ро и Pi, одно- родны, то функция Т является оптической длиной луча между основаниями Qt) и Qi перпендикуляров, опущенных из О0 и 0t на начальный и конечный отрезки луча (см. рис. 4 3), т. е. T=[QeQ1]. B6) В этом случае угловую характеристику можно представить как функцию шлько четырех переменных. В самом деле, если использовать формулу A8) для 6oti и аналогичную формулу для бда0, то B4) примет вид ЬТ-и-ЯгЛЬр.- ' B7) Последнее выражение показывает, что в случае однородных начальной и конеч- ной сред угловая характеристика зависит от четырех переменных ра, q0, pi и qu
142 ГЕОМЕТЕИЧЕОДАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ. 4 а именно Т = Т(Ро, qo\ л, qx а ее производные удовлетворяют соотношениям i28) Pi дТ B9) Итак, если известны лучевые компоненты начального и конечного отрезков луча, то, зная угловую характеристику, можно сразу же с помощью B9) опре- делить координаты точек на этих участках туча 4.1.4. Приближенное выражение для угловой характеристики преломляю- щей поверхности вращения. Пусть Z = 62 \ \ -р У } "(~ С4 \Х -р у ) — . . , W^/ где с-2, с4, ...— постоянные, является уравнением преломтяющей поверхности вращения, отнесенным к декартовой системе координат, начато которой О совпадает с осевой точкой (называемой полюсом) поверхности, а ось г направ- лена вдоль оси симметрии Если чере, г обозначить радиус кривизны поверх- ности у полюса (считающийся положите 1Ьным, когда и- верчпость обращена вып\клостью к свету, распро- страняющемуся вдоль положи- тельного направления оси г), то ()-1/2г C1) Для сферической поверхности радиуса г имеем с4 1/8г°. В слу- чае произвольной поверхности. вращения \ ожно написать Рис, 4 4 Углооая характеристика преломляющей j поверхности вращения С4 — —t(l-\-b), C2) Точки Of,, О; О,, Q,, P Qp не обязательно компланарны где константа b (иногда называе- мая коэффициентом деформации) служит гр\боч Aiepoii отктонения формы поверхности от сферической Уравнение C0), выраженное через rub, при- нимает вид У. ott о * JP &гл 7 *> 1 в, Z V (Х2 2/ '¦A-Ь)- C3) Пусть по обе стороны от поверхности вращения среды оч' оротны и обладают показателями преломления п„ и пх Отнесем углов\ю харакк-ристнку к коорди- натным системам, оси которых параллельны осям системы с началом в точке О, а начала расположены в осевых точках О„@, 0, в») и Ot(Q, 0, Qi)(Qo<O, a^X), г>0 на рис 4 4). Если Р—точка пересечения падающего луча с прело- мляющей поверхностью, a Qo и Q,— основания перпендш iярок, опущенных из О0 и О, на падающий и преломленный лучи, то, coi ы^но B6), >гловая характеристика Т равна T = lQ,P] + [PQ1]=--{xp0^yql) + (z—al))ma} — {xp1 + yq1+ : ajm,}, C4) где (х, у, г) — координаты точки Р в системе координат с началом в О, а (Ри, q0, /п0), (pi, <7i, nil) — лучевые компоненты падающего и преломленного в точке Р лучей. Координаты (х, у, г) можно исключить из C4) с помощью закона прелом- ления, Закон преломления, согласно п. 3,2,2, эквивалентен утверждению, что
§ 4.1] ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ ГАМИЛЬТОНА , 143 вектор N(/70— pt, д„—q,, т„—т,) нормален к преломляющей поверхности. в точке Р. Следовательно, если C3) записать в виде ^ф #{1+Ь)+...~0. C5) то А,— = Я =га0—лгх. j Из этих уравнений следует, что '=-"¦7^+^. *=-'^+А* <37> где Дх и Аг/ — величины третьего порядка по р, q, x'r, ylr: Подставляя C7} Е C5), получим формулу для г, выраженную через лучевые компоненты: РГШ-Ь [^ (Р. ~ Р.) + Для нахождения разложения Т с точностью до членов четвертого порядка включительно нет необходимости вычислять величины Дх и Ау, так как после подстановки C7) и C8) в C4) члены, содержащие Ах и At/, оказываются более высокого, чем четвертый, порядка малости, и поэтому ими можно пренебречь. В результате C4) принимает вид Т (р0, <?о. т0; />!, qx, mx) = —-moaQ + m1a1 + S Яг)^. C9) Выражение C9) является разложением угловой характеристики до членов чет- вертого порядка включительно, причем эта характеристика рассматривается как функция всех шести лучевых компонент. Две компоненты можно исключить с помощью равенства F). Из F) найдем . D0V и, следовательно, Подставляя это в C9), получим q \ Pi^i)=«!A —п„а0^-т D2)
144 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [гл. 4 Как мы видим, четыре переменные р0, в комбинациях ц, рг и c?i входят в это выражение только p\-\-Q%— <**> /fiH-^f —у2 и PoPi~^~QeQt~*&' D3) Можно показать в более общем виде, что угловая характеристика любой среды, враща- телыю симметричной относительно оси г, зависит от четырех переменных, входящих только в трех комбинациях D3). Для доказательства этого используем результат, полученный ниже, в § 5.1, согласно которому любая функция F(xa, y0; xL, j/j), инвариантная относительно враще- ния осей вокруг начала координат в плоскости jcy, зависит только от величин трех скалярных произведений двух векторов та(х0, уа) и ri(,r1, у,). Считая г„ и т1 проекциями векторов распространения go (Ро. <Л>. '"о) и UiiPi, <7i> f«i) на плоскости ху, получим требуемый результат. Подставляя D3) в D2) и> выделяя члены одного порядка, получим оконча- тельно Т(р„ <?<,; Л. <7l) = где D4) 9 | я п г Г i+> ,n , i 4 (n, - n0)" [2 (гц - n0) "Г n0J ^ 84 ' >¦ Г 1+& П % 4(л1-пA)= [2(л,-л0) nj Snl ' — {\-\-b)r g_ г Г \ + Ь . 1 П 4(пх— л0K [лц — п„'па nt\ ' 2(Я1-л„)" 1_л,-л„ n D5) j 4. 1.5. Приближенное выражение для угловой характеристики отражающей поверхности вращения. Разложение угловой характеристики отражающей поверхности вращения до членов четвертого порядка включительно можно про- вести аналогичным способом. Однако нет необходимости повторять полностью все вычисления. Если использовать те же обозначения, что и выше (ср. рис. 4.4 и 4.5), то все уравнения из п. 4.1.4 до соотношения C9) включительно остаются прежними; следовательно, для отражающей поверхности вращения C9) являет- ся также угловой характеристикой, рассматриваемой как функция всех шести лучевых компонент. Однако при исключении /л„ и тх из C9) с помощью двух соотношений, связывающих лучевые компоненты, для Т (как функции четырех лучевых компонент) в случаях преломляющей и отражающей поверхностей по- лучаются два различных выражения. Если обозначить показатель преломления
§4 2] ИДЕАЛЬНОЕ ОТОВРАЖЕНИЕ !45 среды, в которой распространяются лучи, через п, то вместо D0) найдем 8b0»! 1 D6) Для второго из этих соотноше- нии выбран отрицательный корень — V п- -¦ (р- ',(?), поскольку отражен- ный луч попадает обратно в ту область, Но которой он приходит (?<0), поэтому направляющий косин\с отраженного лу- ча относительно положительного нап- равления г, а следовательно, и т отри- ца1ельны Поскольку D0) переходит в D6) при замене л0 —«i n, можно ал- к почить, что угловая характеристика отражающей поверхности вращении, рассматриваемая как. функция четырех лучевых компонент р„, qih p, и qlt полу- чается из угловой характеристики преломлчюш/и поверхности врищенич, если положить ио= — ftj— r> Следовательно, для сглчая отражении имеем Рис 4 5 Угловзя характеристика отра- жающей поверхности крлщашя Точки О0 О,, О Qo, P, Ql hi- обязяк-льно компланарны > = Л'и* \ 33'V + ё 'ш2, + 3r'wi + Vu'-v3 + SZ'u'w* D7) где SB'=; 2n' 1+ft D8) Ш* l±*_ 2 § 4.2. Идеальное отображение Рассмотрим распространение света от точечного источника, расположен- ного в точке Ро, в среде с показателем преломления п (х, у, г) Из Р„ выходит бесконечное число лучей, но, вообще говоря, через любую другую точку среды проходит кояечпое их число Однако в некоторых частных случаях удает- ся найти такую точку Ри через которою тоже проходит бесконечное количество лучей Эгя точка Рг называется стигматическим (или резким) изображением Ро. 10 м Ьорн. Э Вольф
146 ГЕОМЕТРИЧЕСКАЯ TFOPHfl ОПТИЧЕСКИХ ИЗОВРМКЕНИЙ [ГЛ 4 Идеальный оптический прибор дает для каждой точки Р„ трехмерной об- ласти, называемой пространством предмета, стигматическое изображение Рг Совокупность точек изображений опредетяет пространство изображения Соогвстств ющис точки в лих дв\х областях называются сопряженными В общем случае hi hc,q лучи, выходящие и,=. Р , достигнхт пространств? изобра- жения, например, некоторые лучи задержатся диафрагмой прибора I оворят, что лучи, достигающие пространства изображении, лежат в поле прибора Если Р„ описывает в пространстве предмета кривую Со, то Рг описывает сопря- женною кривую С, Обе кривые не обязате тьно геометрически подобны др\[ другу Если кижаая кривая Со в пространстве предмета геометрически подобьа своему изображению, то говорят, что эти области идеально отображают друг друга Таким же образом можно опредетить идеальное отображение и для поверхностей Оптические приборы, чающие идеальные изображения в указанном смысле, представляют значите )ьиый интерес, ijojtoviv мы сформулируем некоторые об шие георемы, относящиеся к идеальном)., или по крайней мере резкому, ото- бражению трехмерных предметов В п 4 2 3 будут кратко изложены некоторые- результаты исследования резкого отображения двумерных предметов (поверх- ностей) 4.2.1. Общие теоремы. Оптическая система ^-, дающая стигматическое изображение трехмерного предмета, часто называется абсолютным прибором Будет показано, что ь абсолютном приборе оптическая длина любой кривой, лежат/ей в пространстве изображения, равна omnwecuou дгине своего изображе ния Впервые эта теорема бьла сформ\лироваиа в 1858 i Максвеллом 19, 10] для частного случая, когда и пространство предмета, и пространство изображе- ния однородны Позднее Б руне [11], Клейн [5, 12] (см также В, [13]) и Либман 114] дали более строгое доказательство *) Как было потом показано Каратеодори [16], эта теорема оказывается справедливой не Рис 4 6 Абсолютный оптический прибор, только для однородной, но и ДЛЯ неоднородной анизотропной сре- ды. При доказательстве ее мы используем метод Каратеодори, однако ограни чимся рассмотрением абсолютныл приборов с изотропными (но в общем случае неоднородными) пространствами предмета и изображения **). П)сть А„В0 и AiBt— отрезки луча в пространстве предмета и в пространст- ве изображения (рис 4 Ь), находящегося в поле абсолютного прибора 'f Любой другой луч, линейный элемент которого не отклоняется существенно от эле мента AoBqAxB, ни но абсолютной величине, ни по направлению, также лежит в поле этого прибора Если кажтыи элемент кривой (которая, как предполагается, имеет не- прерывно поворачивающуюся касательную) совпадает с элементом некоторого луча, полностью лежащего в поле прибора f, то говорят, что эта кривая распо- ложена в поле |' тангенциально Если заменить ее ломаной с достаточным чис- лом отрезков, то каждый ее отрезок будет совпадать с элементом луча, пол- ностью лежащим в поле прибора Coivjat но принцппл равного оптинеского пути (см. п. 3.3,3) все лучи, соеди- няющие точку А„ с ее изображением А1г имеют одинаковую оптическую длину. *) Обзор этчх исследовании можно также найти в статье [15] **) В обычной оптике не используются неоднородные материалы, однако в микроволно- вой оптике с такими материалами часто имеют дело (cvi , например, [171) В электронной огтике «покачене ib преломления» (см приложение 2} также 1шлч( тся функцией координат. Наши ряесуждеиия поэтому представляют не только чисто академический интерес,
§ 4.2] идеальной отовражьние 147 Обозначим ее через V (Ло) и покажем, что фактически она не зависит от Ав. Пусть В„ и Bi— другая пара сопряженных точек. Тогда (см. рис. 4.6) A) Пусть Со— кривая, соединяющая А„ и Во и лежащая тангенциально в поле прибора, а С,— ее изображение. Заменим Со томами A0PaQ0Ba и обозначим изображения точек Ро и Qo через Pt и <3, Применяя A) к отрезку ломаной Л,Л. получим и аналогично для других отрезков lPiQi]=\PeQ,]+V(Qt)-V(Pt) и [Q1BJ = [Q0B Следовательно, [ЛЛ] + [ЛОЛ f [Qx^J - [Л0Р0] + [/>„<?„] + [Q0B0]+V(B0)~V(An). Очевидно, что этот результат можно обобщить на случай ломаной с любым числом отрезков Лг. Переходя к пределу при N—>-oo так, чтобы длина наиболь- шего отрезка стремилась к нулю, получим соотношение /,1=I0 + V(B0)-V(A). B) где Lo = J «„ ds0, L, = I пл dst C) с. с, являются оптическими длинами кривых Са и Сх. Покажем теперь, что V (Во) = -У(Л„). Точки иа кривых Со и С, находятся во взаимно однозначном соответ- ствии, что можно выразить следующими соотношениями: *! = /(*». У„, го)> У1 = 8(х«, У«< г»), г,=А(дг0, г/0> г0). D) Элемент dsi кривой С\ является функцией соответствующего элемента dSy, т. е. Следовательно, где — однородная функция первой степени по производным dx^ds0, dyjds,, и dzjds,,', более того, F не меняется ори замене dxjds,,, ... на — dxjdso, Далее из (i) имеем dx, _ j)f_ dx^ _j_ df_ dt/j, , df_ d% „. аналогичные соотношения получаются для dt/JdsB и dzjdsu. Следовательно, используя G) и D), получим для F следующее выражение: , У» г-,, -j- , d4 , ds-J - Ф ^0, уа, г„, -^ , dSe , d где Ф — также однородная функция первой степени по dxjds^, »..; более того, Ф не меняется при замене dxjdsa, ... на —dxo/ds0, ..., т. е. ' У" Z<" _ ds0 ¦ dsa > 1^)~Ш\Х<" У<" 3(" ds0 ¦ ds0 ' dsj ¦ 10*
148 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ. 4 Из B), F) и (8) имеем с, это свидетельствует о том, что величина криволинейного интеграла в A0) зависит только от положения крайних точек Ао, В„ и не зависит от выбора кривой С„. Кривая Со, однако, не является совершенно произвольной, посколь- ку она должна лежать тангенциально в поле прибора. Тем не менее мы вправе заключшь, что выражение (п„— Ф) ds0 есть полный дифференциал от некоторой функции Чг, т. е. 0 ~ дх„ dsa Ьуа dsu ' dz0 ds0 Если заменить здесь производные dxo/ds0, ... на —dxjdso, ..., то правая часть изменит знак, а левая, согласно (9), не изменит, что возможно только в том слу- чае, если и левая и правая части этого выражения равны нулю (V — const), следовательно, Ф = п0. A1) Тогда из соотношения A0) вытекает, что V (Ао) = V (Ва), и выражение B) принимает вид Lx= Lo. Следовательно, для любой кривой, имеющей изображе- ние, независимо от того, лежит она в ноле при- бора тангенциально или иет, справедливо соот- ношение \ nodso = $ ftjds,. A2) с, с, Это и есть теорема Максвелла для абсолютного прибора. Рис. 4.7. К доказа1сльству Леица теоремы Максвелла для абсолютного прибора. Ленд [18] дал следующее менее общее, но чрезвычайно простое и изящное токазатсльство [еоречы Максвелла Пусть все лучи or каждой точки предмета достш.осп изображения, и пусть (Л„, А,) и (Bq, Bi) — две пары сопряженных точек Согласно предположению луч Л050 должен проитн через Ах и Вг Луч В„А„ тоже должен пройти через эти точки Следовательно, каждый луч дол- жен представлять зачк^\т}Ю кривую тогда в соответствии с принципом равного оптического пути получим (рис 4 7)" 1 ° ! по час. стрелке по 4aCi стрелке ""' ° " "' ° г' против час. стрелки против час. стрелки Если ввести обозначения то написанные выше соотношения принимают вид откуда следует, что Приведенное здесь доказательство справедливо лишь в том ел>чае, когда кривая является частью луча Его можно обобщи1ь тез случаи произвольноп kphrijh чакпы же способом, как это было сделано нами ранге, т е заменить кривую многоугольником, стороны которого состоят из отрезков лучей, а затем устремить число этих сторон к бесконечности. Из теоремы Максвелла сразу же вытекает несколько интересных следствий. Рассмотрим небольшой треугольник со сторонами dsj,1', ds'^> и dsj,". и пусть ds^\ dsf и dsf1 — стороны треугольника, являющегося изображением исход- ного в абсолютном приборе. Далее, пусть «0 и пг— показатели преломления областей, и которых расположены выбранные треугольники. Согласно теореме Максвелла n.dsf^^ds^, n.dsf'^n.ds? A3)
§ 4.2] ИДЕАЛЬНО? ОТОБРАЖЕНИЕ 149 и, следовательно, эти треугольники подобны, а отношения соответствующих сторон обратно пропорциональны величинам показателен преломления. По- этому углы между любыми двумя кривыми в предмете не изменяются в его изображении, i.e. такое отображение должно бьпь конформным. Из общей теоремы Лиунилля (см , например, 119]) следует, что конформным отображением трехмерной области в трехмерную область может быть только проективное пре- образование (коллинеация), инверсия к) или их комбинация. Таким образом, мы док.нлли следующую теорему, впервые сформулированную Каратеодори. Опюбраэкение, создаваемое абсолютным прибором, является либо проективным преобразованием, либо инверсией, либо их комбинацией Рассмотрим теперь вкратце случай, когда отображение не только стиг- матично, но и идеально, т е любой объект преобразуется в объект, геометри- чески подобный исходному Ясно, что гакое отображение должно быть проектив- ным преобразованием, поскольку оно преобразует липни в личии [20] Тогда из A3) следует, чго увеличение ds^dsa для любых двух сопряженных линейных эле- ментов равно отношению показателей преломления njnr. В чаетпост! , если п„ - п± - const, то ds,i'ds0 1, таким образом, идеальное отображение двух однородных областей с одинаковыми показателями преломления друг в друга всегда тривиально в том смысле, что изображение полностью конгруэнтно пред- мету Единственным известным прибором, обеспечивающим такое отображение, является плоское зеркало (или комбинация плоских зеркал). Из этих общих рассуждений следует, что для получения нетривиального отображения однородных областей с одинаковыми показателями преломления друг в друга нельзя требовать строгого стигматизма или полного подобия изо- бражения объекту. ' 4.2.2. «Рыбий глаз» Максвелла. Простым и интересным примером абсо- лютного прибора можно считать среду, характеризующуюся показателем пре- ломления где г— расстояние до фиксированной точки О, а пп и а— постоянные Такая среда называется «рыбьим глазом», и ее своиива были впервые исследованы Максвеллом **) [10, 21) В § 3.2 было показано, что в сферически симметричной среде лучи пред- ставляют собой плоские кривые и лежат в плоскостях, проходящих через начало координат, а уравнение таких лучей имеет вид (см. C.2.11)) где с— постоянная. Подставляя сюда выражение для п (г) из A4) и полагая р = г/а, К — с!ап9, A5) получим *) При инверсии каждая точка Ро преобразуется в такую точку Рг, лежащую на линии, которая соединяет Ро с фиксированным началом координат О, что произведение ОРошОРг ос- тается посто я н н ым **) Лени [ 18] и Стеттлер [22] дали интересные обобщения рабагы Максвелла Статья Стст- тлера содержит чакже обобщение теории так называемой шнзы Луисосрга, которая блаю^фя своей вес-направленности нашла широкое применение при конструировании антенн саншмогро- вою диапазона Такая липза, впервые исследованная Лунебергом |23], представляет собой не- однородную сферу <- показателем преломления п (г)= ~\/~ '2 — rz (O^rs^ I). Если поместить ее в с~пгорот,ную среду с показателем преломления, равным 1, то каждый падающий пучок па- раллельных лучей соберется в резкий фокус. См 124—26].
150 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [гл. 4 Легко показать, что К 1 —4/C2 тогда A6) можно переписать в виде sin (в—ct) = - A7) где ее— постоянная интегрирования. Соотношение A7) является \ равнением лучей в полярных координатах. Поэтому для однопараметрического семейства лучей, проходящих через задан- н)ю точку Р0(г„, 0„), имеем Окружность г* -а2 . г sin @—a) r0 sin F0— а)" A8) Как мы видим, при любом значении параметра а этому уравнению удовлетворяют г — ги 0 - Oi, г1^аг/г„, 61 = я + 60; A9) отсюда следует, что все лучи из произвольной точки Ра собираются в точке Яь лежащей на прямой, ко- торая соединяет Ро и О, Ро и Pt расположены но разные стороны от О, и произведение ОРО- ОР-, а1. Следовательно, «рыбий паз», служит абсолютным прибором, в котором отображение осуществляется преобразованием инверсии. Отметим, что A7) удовлетворяется при г а, 9 _ а и г — а, 6 = я -4- ct, т. е. каждый л\ч пересекает фиксированную окружность г = а в противопо- ложных точках ее диаметра (рис 4 8). Чтобы получить уравнение лучей в декартовых координатах, положим в A7) х — г cos Э и у = г sin 6; тогда Рис. 4 8 Лучи в «рыбьем гла зе» Максвелла. у cos а—X sina = aV aHl—i -(х' у* — а'-), или где usrna)!-f ((/— B0) Из соотношения B0) видно, что каждый луч представляет собой окружность. 4.2.3. Стигматическое отображение поверхностей. До сих пор мы рассмат- ривали юлько идеальное, и ш резкое, изображение трехмерных областей. Было показано, что если пространство предмета и пространство изображения однородны и обладают одинаковыми показателями преломления, то идеальное отображение должно быть только тривиальным, т, е зеркальным отображением предмета Естественно, возникает вопрос, получается ли нетривиальное ото- бражение, если потребовать, чтобы прибор обеспечивал идеальное (или по крайней \iepe резкое) отображение лишь некоторых поверхностей. Этим вопро- сом занимался ряд авторов [27—301, которые нашли, что если пространства предмета и изображения однородны, то вращшпельно симметричная оптическая система о общем случае "') может обеспечить резкое отображение не более чем ') «В общем случае» вставлено для того, чтобы исключить некоторые вырожденные слуг чаи, ко1дл идеально отображается все пространство предмета (например, при отражении от плоскою jcpiuina).
4.2] ИДЕАЛЬНОЕ ОТОЬРЛЖЕИИЕ 131 двух поверхностей. Доказательство этой теоремы можно найти в работах Г27, 29]. Здесь мы подробно рассмотрим только простой случай резкого отображения сферической поверхности, представтяющии наибольший практический интерес. Исследуем преломление лучей па поверхности твердой однородной сферы S, находящейся в однородной среде. Пусть О—точка, где расположен цешр сферы, г— ее радиус и п и п'— показатели преломления соответственно мате- риала сферы и окружающей ее среды. Далее пусть AQ— луч, падающий на сферу. С помощью следующих рассуждений легко определить направление преломленного луча QB Пусть So и S,— сферы, центры которых находятся в О, а радиусы равны Если Р„— точка пересечения AQ сХ, и Рг— точка, в которой пересекаются Рис 4 9 Преломление на сферической поверхности. Апланатические точки. 0Р„ и Si, то QP, является преломленным лучом. Последнее следует из построе- ния (рис. 4 9), гач как OQ _ OPi n Кроме того, B3) Таким образом, треугольники OQP0 и OPXQ подобны, и, следовательно, S1I) фо ОРд П' sin ф, OQ n ' B4) где фо"^ <.OQPq и cpt= <,OQPi — соответственно углы падения и прелолпения. Величины углов <р„ и ф] удовлетворяют закону преломления, и поэтому прямая QPL представляет собой преломленный луч. Из построения видно, что все лучи, выходящие4 из точки Р„ на S», дают {виртуальное) стигматическое изображение в точке Ри расположенной в месте пересечения радиуса 0Р0 со сферой S, Следовательно, сфера Si представляет собой стигматическое изображение 5„ и наоборот. , Удобно выразить B4) в несколько иной форме. Если обозначить через 0„ и 0, углы, которые сопряженные лучи образуют с линией PaPt, т. с. 90= = < OP0Q и 0, <OPiQ, то, поскольку рассмотренные выше треугольники лодобны, 0„= ф, и 01= ф0; следовательно, sin В, i = — = const. B5) Уравнение B5) чвляется частным случаем так называемого условия синусов, значение которого будет объяснено в § 4.5. Согласно терминологии, принятой
152 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [гл. 4 в § 4.5, точки Р„ и Pt называются апланатическими тачками сферической по- верхности 5. Как будет показано в § 6.6, при конструировании некоторых видов объек- тивов микроскопов используется существование апланатических точек прелом- ляющей сферической поверхности. § 4.3. Проективное преобразование (коллииеация) при наличии аксиальной симметрии Выше было показано, что идеальное отображение трехмерных объектов друг в друга можно осуществить лишь с помощью проективного преобразова- ния, поскольку последнее преобразует линии в линии Свонства проективных преобразований важны даже в тех случаях, когда условия, необходимые 1ля достижения идеального отображения, выполнены пс полностью, поскольку, как будет показано позднее, отображение предмета любой оптической системой осуществляется, по крайней мере в первом приближении, с помощью преобра- зования такого рода. Поэтому, прежде чем выводить законы построения изо- бражений в реальных оптических системах, полезно исследовахь общие свойст- ва проективных преобразований Хотя такое предварительное рассмотрение носит чисго геометрический характер, удобно по возможности сохранять отпи- ческую терминологию. 4.3.1. Общие формулы. Пусть (х, у, г) — координаты точки Р в простран- стве предмета и (х1, у', г') — координаты точки Р' в пространстве изображения в одной и той же произвольно выбранной декартовой системе координат. Про- ективное преобразование этих двух областей друг в друга осуществляется с по- мощью следующих соотношений: x' = FJF0, y' = F,/F0, z' = F3/F0, A) где Fl=^alx + bly+c,z + dl (i = 0, 1, 2, 3). B) Две точки, координаты которых связаны соотношением A), называются сопря- женной парой. Разрешая A) относительно х, у, г, получим соотношения такого же типа, а именно x = /7;//7;, y = F'JFl z^F'jFl C) где F't = а\х! + b',y' + с',г' + d\ Из A) следует, чго изображение любой точки, лежащей в плоскости Fo=0, находится на бесконечности. Аналогично из C) вытекает, что все точки пред- Meia, изображения которых лежат в плоскости h'n -О, расположены на беско- нечности. Плоскость F0-=0 называется фокальной плоскостью пространства предмета, я плоскость F'e=Q—фокальной плоскостью пространства изобра- жения *). Лучи, параллельные в пространстве предмета, преобразуются в лучи, пересекающиеся в некоюрои точке, лежащей в фокальной плоскости F'o= 0. Лучи же, выходящие из точки, расположенной в фокальной плоскости Ft,= 0r преобразуются в пучок параллельных лучей В некоторых сл> чаях обе фокаль- ные плоскости находятся на бесконечности Преобразования такого рода на- зываются аффинными или телескопическими При телескопических преобразо- ваниях всегда Гоф 0 и F'o^ 0, так как конечным значением (х, у, г) должны соответствовать конечные значения (х', у', г'). Разумеется, это возможно лишь в том случае, если ао= 60= с0—0 и а'„= Ь'„— с'0= 0. •) Здесь термины «фокальная плоскость» и «фокальные точки > имсют несколько иной смысл, чем при рассмотрении нормальных конгруэнции (см п 3 2 Ъ) и астигматических пучков лучей (см. ниже, § 4 6).
§ 4.3] ПРОЕКТИВНОЕ ПРЕОБРАЗОВАНИЕ ПРИ АКСИАЛЬНОЙ СИММЕТРИИ 153 Поскольку большинство оптических систем состоит из поверхностей вра- щения с общей осью (такие системы обычно называются центрированными), особую роль в оптике играет случай аксиальной симметрии. Тогда из симмет- рии системы следует, что изображение любой точки Р„ лежит в плоскости, проходящей через эту точку и ось симметрии; поэтому при изучении свойств соответствующчх проективных преобразований можно ограничиться рассмотре- нием точек, лежащих в такой меридиональной плоскости. Пусть эта плоскость совпадает с плоскостью уг, а ось г направлена вдоль оси симметрии. Тогда точка (О, у, г) в пространстве предмета преобразуется в точку @, у', г') в пространстве изображения, где Из симметрии системы вытекает, что г' не меняется при замене у на —у. Это возможно только в том случае, если &0= &з= 0. Далее ясно, что при замене у на —у координата у' меняется на—у', откуда следуег, что са= й%— 0. Следо- вательно, ^4) принимает кид г - Эти уравнения содержат пять постоянных, однако важны только их отноше- ния. Таким образом, проективные преобразования при наличии аксиальной симметрии характеризуются четырьмя параметрами. Разрешая E) относительно х и у, получим rf rf У' rf' d и -^ ¦ F) Из соотношений E) и F) вытекает, что фокальные плоскости описываются W Рис. 4.10. Кардинальные точки и плоскости оптической системы. F, F' — главные фокусы, V, U' — главные, или единичные, точки; N, N' — узловые точки; $f\ q) кальные плоскости; ЭД, %' — главные, или единичные, плоскости. уравнениями F„ = сог + d0 = 0, F'a =s сог' —с3 = 0; следовательно, они секают ось г под прямым углом в точках, координаты которых равны Эти точки называются главными фокусами и обозначены на рис. 4.10 F и F'. Теперь каждое пространство (пространство предмета и пространство ражения) удобно отнести к своей системе координат, поместив их начала в ные фокусы, т. с. положив У — * > Св? С3 -— Cq?j . ) Тогда выражение E) принимает вид —фо- пере- через изоб- глав- (8)
154 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ. 4 Обозначим В результате уравнения для преобразований запишутся в простой форме, а именно Y'-J-~z> т Второе из этих уравнении, ZZ' — ff, обычно называют уравнением Ньютона. Постоянная /' называется фокусным расстоянием в пространстве предмета, a f— фокусным расстоянием в пространстве изображения. Для фиксированных плоскостей предмета и изображения находим из A0) \~5Fjz=const =T==T = F ¦ ^^ Эта величина называется поперечным увеличением. Далее получим следующее выражение для продольного увеличения, не зависящее oi Y и Y': Ж="~1="~"Т-==~ Jf Из A1) и A2) видно, что величины продольного и поперечного увеличения свя- заны соотношением ~dZ~ T~ I dY 17— t' U1^/ Поскольку величина поперечного увеличения зависит только от Z, но не от У, фигура, расположенная в плоскости, перпендикулярной к оси, преобразует- ся в фигуру, геометрически подобную исход- ной. А, t Поперечное увеличение равно единице, если ~~7Р> Z. = / и Z'= f. Эти плоскости называются глав- /г ними или единичными плоскостями, на рис. 4.10 в и 4.11 они обозначены буквами 41 и %'. Точки их пересечения с осью U и 6" называются /¦' W ~ ными или единичными точками. Пусть /г — расстояние от оси, на котором луч, выходящий из точки @, 0, Z), пересекает главную плоскость в пространстве предмета. Рис. 4.11. Графическое опреде- Сопряженный луч пересекает другую главную ление точки изображения плоскость на таком же расстоянии h' - h от оси: утлы у и у', которые составляют лучи с осью Z, задаются соотношениями (см. рис. 4.10) tgY' tgv ft f-Z' f-z r—r Чу' z r r h t Z' Отношение A4) называется угловым увеличением или коэффициентом сходимости. Эта величина не зависит or h и h' и равна единице, если Z = —f' и Z'= —/. Точки на оси /V и Л'', определенные последними двумя равенствами, называются узловыми. Они являются сопряженными точками и характеризуются тем, что сопряжен- ные лучи, проходящие через них, параллельны друг другу. Расстояние между узловыми точками равно расстоянию между главными точками. При f /' узловые то^ки совпадают с главными. Фокусы, главные и узловые точки назы- ваются кардинальными точками данного преобразования.
¦§ 4.3] ПРОЕКТИВНОЕ ПРЕОБРАЗОВАНИЕ ПРИ АКСИАЛЬНОЙ СИММЕТРИИ 155 Иногда оказывается удобным отсчитывать расстояния не от фокальных плоскостей, а от главных. В этом случае вместо 2. и Z' используют переменные Уравнение Ньютона ZZ'= ff принимает тогда вид 1 + ? = -1. ' A6) Используя свойства фокальных точек и главных плоскостей, можно про- стым геометрическим построением найти точку Р', сопряженную данной точке Р. Через точку Р проводят дне прямые, одна из которых параллельна оси, а дру- гая проходит через фок^с F (рис. 4.11). Пусть А и В— точки, в которых эти прямые пересекаются с главной плоскостью %. Тогда из свойств главных пло- скостей следует, что точки А' и В', сопряженные А и В, являются точками пересечения двух прямых, проведенных через А и В параллельно оси, с пло- скостью 41'. Далее, поскольку РА проходит через фокус /•', прямая Р'А' должна быть параллельна оси, а так как РВ параллельна оси, Р'В' должна проходить через другой фокус F'. Следовательно, изображение Р' находится на пересечении линий А А' и B'F'. 4.3.2. Телескопическое отображение. Рассмотрим теперь частный случай телескопического отображения (аффинной коллинсации). Как уже ранее отме- чалось, оно характеризуется тем, что обе фокальные плоскости находятся в бес- конечности. В этом случае со= 0 в E) и F) и соотношение E) принимает вид Введем оинчь две самостоятельные координатные системы в пространстве пред- мета и в пространстве изображения. Начала этих систем поместим в любые две сопряженные точки оси. Формулы преобразования в новых координатах примут простой вид К'=аУ, Z' = $Z, A8) где а --= bjd,, и |3 - ty'd,,. Поперечное я продольное увеличения в данном случае постоянны. Угловое увеличение тоже постоянно: для доказательства последнего утверждения рас- смотрим два сопряженных луча, а начала координатных систем поместим в точ- ки, где эти лучи пересекают ось. Тогда уравнения лучей запишутся в виде Y = Ztgy, F' = Z'tgY'. A9) Следовательно, till _ Г J_ _«.-** (9П\ Хотя в случае телескопического отображения как /, так и /' бесконечны, их отношение f If должно оставаться конечным. Так, согласно {9) при с0 -*• О имеем 4.3.3. Классификация проективных преобразований. Проективные пре- образования можно классифицировать по чнаку фокусных расстояний. Если фокусные расстояния имеют разные знаки, то //'< 0, и в соотвегствии с A2) имеем dZ'ldZ > 0. Отсюда следует, что если предмет сместить вдоль оси, то его изображение сместится в том же направлении. Позднее б)дег показано, что подобное отображение осуществляется при использовании либо только прелом- ления, либо четного числа отражений, либо их комбинации, Такое отображение называется диоптрическим. Если фокусные расстояния имеют одинаковые знаки, то ff> 0, dZ'/dZ<iO, и смещению предмета вдоль оси соответствует смещение изображения в противо-
156 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [гл. 4 наложную сторону. Такое'отображение осуществляется с помощью либо, нечет- ного числа отражений, либо комбинации нечетного числа отражений с любым числом преломлений. Подобное отображение называется катоптрическим. В зависимости от знака фокусного расстояния / в каждом из рассмотрен- ных случаев различают два типа преобразований. Из A1) видно, что при Z>0 поперечное увеличение положительно при / > 0 и отрицательно при /< 0. Следовательно, объект, расположенный в пространстве предмета, имеет прямое или перевернутое изображение, в зависимости от тою, положительно ли / или отрицательно. В первом случае преобразование называется сходящим- ся, во втором — расходящимся. Такая терминология связана с тем, что падаю- щий пучок параллельных лучей после прохождения главной плоскости в про- странстве изображения становится в первом случае сходящимся, а во втором — расходящимся. В табл. 4.1 приведена классификация преобразований. Таблица 4.1 Классификация проективных преобразований (правило знаков Декарта) Диоптрические Катоптрические Сходящиеся f > 0; f < 0 t > 0; Г > 0 Расходящиеся Г < 0; Г > 0 ' f < 0; f < 0 В частном случае телескопических преобразований указанные четыре типа различают по знакам величин а и р1. Из B1) следует, что если |3 > 0, то получается диоптрическое преобразование, а если [S < 0, то катоптрическое. Далее из A8) следует, что преобразование будет сходящимся или расходящимся в зависимости от того, положительно ли а или отрицательно. 4.3.4. Комбинация проективных преобразований. Рассмотрим теперь съа последовательных проекпшных преобразования, вращательно симметричных относительно одной и той же осп. Индексом 0 будем отмечать первое преобразование, а индексом 1 — вто- рое. Тогда уравнения, определяющие эти два преобразования, запишутся в виде Y(l—lsL—^ Ll LL ^J; Пусть с— расстояние между фокусами F'o и /ч. Поскольку пространство изо- бражения первого преобразования совпадает с пространством предмета вто- рого, то z^zs—c, kj = k;. B3) Исключая из B2) с помощью B3) координаты промежуточной области, получим Пусть 1 /i f'i ¦ f\7-a ' faf'o~cZo у- __ fifi __ fth /i/i __ fifiZg 1 Zj ^' с //' f f cZ у — у Z~Z ^Q^° Y' =Y' B4) B5) Уравнения B5) описывают изменение координат при смещении начал коорди- натных систем соответственно на величины f'jjc и —fj'jc вдоль оси 2, В этих
§ 4.4] ПАРАКСИАЛЬНАЯ ОПТИКА 157 координатах уравнения комбинированного преобразования принимают вид ?=4=?' ' B6) где / = — М., Г^Ы±. B7) Из B5) следует, что расстояния между началами новых и старые систем ко* ординат, т. е. расстояния 6 — FaF и 6'= F\F' между фокусами комбинирован- ного преобразования и фокусами отдельных преобразований, равны соответ- ственно 6=,^, 6'- — ^. B8) С С Если с = 0, то f = /' = сю, и эквивалентная коллинёацвя становится телеско- пической. Уравнения B4) при этом принимают вид V" ^ V ' i — ~р~ ' о> to /о/о постоянные а и р из A8) для эквивалентного преобразования выражаются сле- дующим образом' а = 4, р--^. C0) /о /о/о Угловое увеличение равно теперь Если одно или оба преобразования телескопические, то приведенные рассуж- дения необходимо несколько видоизменить. § 4.4. Параксиальная оптика Перейдем теперь к изучению простейших свойств линз, зеркал и их комби" наций. В приводимой ни>К1- теории рассматриваются лить точки и лучи, лежа" щие в непосредственной близости от оси; члены, содержащие квадраты и более высокие степени расстояний от оси или углов между лучами и осью, отбрасы- ваются. Эта теория называется параксиальной оптикой или оптикой Гаусса +). 4.4.1. Преломляющая поверхность вращения. Рассмотрим пучок парал- лельных лучей, падающий на преломляющую поверхность вращения, которая разделяет две однородные среды с показателями преломления л0 и «,. Положе- ние точек и лучей в обеих средах будет описываться относительно одной декар- товой системы координат, начало которой находится в полюсе О поверхности, а ось г направлена вдоль оси симметрии. Пусть Рв(х(ь </о. 20) и Pi(Xi, i/i, Zi) — точки соответственно на падающем и преломленном лучах. Если пренебречь членами второго и более высоких порядков, то из выражений D.1.29). D.1.40) и D.1.44) следует, что коорди- наты этих точек и лучевые компоненты обоих лучей связаны между собой ") Здесь, как и раньше, будет использовано обычное правило знаков ana itri и ческой (ео- мстрии (правило энакоп Декарта). Другие правила знаков, применяемые на практике, подробно оСп \жд.1клси о докладе, посвященном изучению геометрической оптики и опубликованном Лондонским физическим обществом в 1934 г.
158 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [гл. 4 соотношениями где, согласно D.1.45), 4 4—— 2 я,— в0 B) а г—«параксиальный» радиус кривизны Поверхности. Выясним теперь, при каких условиях все лучи, исходящие из точки Ро (можно предположить, что они лежат в плоскости х = 0), пройдут после пре- ломления через Р,. В этом случае координаты точки Рг будут зависеть только от координат /\ и не будут зависеть от лучевых компонент; поэтому при исклю- чении q1 из A6) величина q,t тоже должна исчезнуть. Из первого уравнения A6) следует, что C) Подставляя это выражение во второе уравнение A6), получим Следовательно, Рх является стигматическим изображением Ро, если или после подстановки сюда B)- L»i —л0 ' " что можно записать также в виде Из G) видно, что в рассматриваемом нами приближении каждая точка дает стигматическое изображение; расстояния сопряженных плоскостей до полюса преломляющей поверхности О связаны между собой соотношением G). Более того, уравнение D) при условии E) означает, что данное отображение является проективным преобразованием. Правая и левая части G) называются инвариантом Аббе (д/1я преломления) и играют важную роль в теории оптического отображения. Соотношение G) можно еще представить в виде «1 ' «О _ "l —4I /оч i7"-. г • W Величина {пг— поIг называется оптической силой преломляющей поверхности и обозначается буквой Э>, т. е. Согласно D) и E) поперечное увеличение уЛ1уп равно единице, если г*,//гх == = 2ЭЗ-\-'ё. Однако из B) вытекает, что 2,®+^-^-= 0. Следовательно, координа- ты г0 и Z\ главных точек 1/„ и V^ равны нулю, т. е. главные точки совпадают с полюсом поверхности вращения. Далее из (8) имеем го¦"¦""•"—S"^ ПРИ 2i—*°° и 2i^r^V при г»™*—°°>
§ 4.4] ПАРАКСИАЛЬНАЯ ОПТИКА 159 следовательно, абсциссы фокусов F0 и Т7, равны соответственно —^{i0) и гцгЦп,— п0)- Поэтому фокусные расстояния fa= FoUo и Д= FiGi определя- ются соотношениями я, —и„ или, используя выражение для ZP 1Ь. /о к A0) (И) Позже будет показано, что соотношение ni)lh——n1lf1 справедливо нетолько для одной пре- ломляющей поверхности, но и для любон центрироааыюп сиекмы, причем величины с индек- сом 0 относятся к пространству предмета, а величины с индексом 1 -— к пространешу изобра- жения Следовательно, можно считать, что соотношение A1) служит общим определением оптической силы центрированной системы Практической единицей оптической силы яв- ляется диоптрия, соответствующая силе сферической поверхности с фокусным расстоя- нием /о=1 -ив вакууме (яо=-1) Оптическая сила положительна для собирательной систе- мы (fo>0) и отрицательна для рассеивающей (f о < 0) Поскольку /о и /, имеют разные знаки, отображение оказывается дмоя- трическ или см п. 4.3.3). Если поверх- ность обращена своей выпуклой ча- стью к падающему пучку (г>0) и «о<"ь то /о>О, Д<0, и отображе- ние получается сходящимся. Если /¦>0, по>«,, то оно будет расходя- щимся (рис. 4.12). Если же поверх- ность обращена своей вогнутой частью к падающему пучку, то типы отобра- жений поменяются местами. Используя A0), можно записать соотношение (8) в виде V A2) а коэффициенты B) — в форме Fn Z Рис. 4.12. Положение кардинальных точек при преломлении на поверхности вращения. ~2п. A3) Введем в каждом из двух пространств свои системы координат, начала ко- торых находятся в фокусах, а оеи параллельны осям исходной системы; тогда В этих координатах уравнения A2) и D) при выполнении условия (б) прини- мают обычный вид D.3.10), т. е. A4) 4.4.2. Отражающая поверхность вращения. Легко показать, что поведение световых лучей на отражающей поверхности враихения описывается теми же уравнениями Aа) и A6), что и выше, если коэффициенты <А, ЭЗ и И в них заме- нить на А\ 3d' и V, введенные в п. 4.1.5. Там же было отмечено, что Л', S3' и g" получаются из Л, id и %, если положить п„=. -~пх= п, где п — показа-
160 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ 4 тель преломления среды, в которой распространяются лучи. Следовательно, положив «0~~ — fh~ п в предыдущих формулах, можно сразу же записать соответствующие выражения для отражающей поверхности. В частности, из G) следует, что A5) 1 где правая и левая части являются инвариантом Аббе для отражения. Послед- нее выражение можно представить в виде ±4-1 = - ,г„ 'г, г ' A6) Фокусные расстояния f0 и Д в этом случае равны Го " 11 ~ ?Г » а оптическая сила —• A7) A8) Так как произведение fj1 больше нуля, то получается катоптрическое отобра- жение. Если поверхность обращена своей выпуклой частью к падающему пучку „ д, 4L-qL (г>0), то /,,<0 и отображение оказывается расходящимся; если же она обращена к нему своей во- гнутой частью (г < 0), то /„ > 0 и получается сходящееся отображе- ние (рис. 4.13). 4.4.3. Толстая линза. Полу- чим теперь форм\лы Гаусса для отображения двумя поверхностя- ми, вращательно симметричными \ 0 К" О z С Fsf, -.0 г>0 Рис. 4.13. Положение кардинальных точек при от- ражении от поверхности вращения относительно одной оси. Пусть л„, пг и ««— показа- тели преломления трех сред в том порядке, в каком луч пересекает их, и гх и г2— «параксиальные» радиусы кривизны поверхностей, считающиеся положительными при падении света на выпуклую сторону поверхности. Фокусные расстояния первой поверхности выражаются на основании A0) формулами а второй поверхности — формулами '1 я._ п. > B0) Фокусные расстояния комбинации поверхностей, согласно D.3.27), равны г Ых с — lib. /on где с — расстояние между фокусами F'o и F, Пусть / — осевая толщина линзы, т. е. расстояние между полюсами двух поверхностей; тогда (рис. 4.14) г, — f.i-f f Ю9\ Подставляя сюда выражения для f'o и flt получим с = - -z^rrz. г-,, B3) B4) где (П,.г-П0) (Лг —П]) ' D = («! — «,) (Пг — IIJ t—П, [(nt — nj /-,'+ (П1—По) Tt\.
§ 4.4] ПАРАКСИАЛЬНАЯ ОПТИКА 161 Если мы теперь подставим в B1) выражения для f0, fu f'o, f[ и с, то получим тре- буемые выражения для фокусных расстояний комбинации двух поверхностей, а именно f = —ПЛТГ. f'=>w/-jr- B5) Поскольку произведение ff'<0, отображение будет диоптрическим. Оптиче- ская сила Э> линзы равна 5 f 5 f -^Л. B6) где 5*1 и 5Ъ2 — оптические силы двух поверхностей. Из D.3.28) следует, что рас- стояния б — FqF и б' - F'JF' рав- ны з Рис. 4.14. Кардинальные точки комбннирован- §'_w n,n' "" -2. B7) ной системы (толстая линза). Расстояния d и d' от главных плоскостей ЭД и *Ц' до полюсов поверхностей вы- ражаются формулами (см. рис. 4.14) B8) Особый интерес представляет случай равенства показателей преломления сред по обе стороны от линзы, т. е. я,= п0. Положив в предыдущих формулах ujno= njnt— n, получим а- где 1 = (я—1)[я(г,—г2)—(п—l)t]. _ C0) В системах координат с началами в фокусах F и F' абсциссы главных точек Z = f и Z'= /', а абсциссы узловых точек Z — —/' и Z = —f. Поскольку f = = —/', главные и узловые точки в этом случае совпадают. Выражение D.3.16), связывающее расстояния ? и ?' между сопряженными и главными плоскостями, принимает вид ill i C1) L Рассматриваемая линза является собирательной (/X)) или рассеивающей (/<0), в соответствии с / = -^Э0, • C2) Т. е. с При / = оо имеет место промежуточный случай телескопического отображения, 1J М. Борн, Э. Вольф
162 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖСНИЙ (гл. 4 Тогда Л = О, т. е. fi — rt — t. C4) Собврательные Рассеивающие Указанные выше три типа отображений можно проиллюстрировать на примере двояковыпуклой линзы, у которой г%> О, a r,<L О (рис. 4.15). Если дли иросто- „,1„ а,а„ ararr ты предположить, что оба радиуса ««' ш' Ш w Ш кривизны равны друг другу по абсо- лютной величине, г е г, гг — г, то отображение б>дет сходящимся или расходящимся в сомветствин с t 55 2nrl (п— 1), и телескопическим, когда / — 2пг/(п— 1) 4.4.4. Тонкая лииза. Формулы предыдущего параграфа существенно упрощаются, если толщина линзы t настолько мата, что ею можно пре- небречь. В этом случае, согласно B8), d — d'— 0, i. e. главные плоскости проходят через осевую точку (беско- нечно тонкой) линзы Следовательно, лучи, пересекающие центр линзы, не отклоняются; это означает, что отобра- о/сение тонкой линзой является центральной проекцией из центра линзы. Положив в B6) t --- 0, получим Ф = Ф 4- Ф —"i n" I "a ni /окл '1 '2 т. е. оптическая сила тонкой линзы равна сумме оптических сил двух образую- щих ее поверхностей. Если показатели преломления сред, расположенных по обе стороны от линзы, одинаковы (ио= п2), то из B5) имеем 1 1 Рис 4 15 Линзы обычного типа а—двояковыпуклая линза, 0 — плоско выпуклая' в — собирательниц мениск. г —двояковогиута.1 д плоско вогиутяя, е — рассеивающий мениск % и 41'— главные плоскости, предполагается, «о свет падает слева. где, как и раньше, п = njna— п^пг. Полагая п> 1 (что обычно выполняется), получим, что величина f положительна или отрицательна в зависимости от того, больше или меньше кривизна 1/г, первой поверхности, чем кривизна 1/г2 второй (выбор знака связан с кривизной). Отсюда следует, что тонкие линзы, толщина которых уменьшается от центра к краю, являются собирательными, а линзы, толщина которых возрастает к краю,— рассеивающими. Выпишем выражения, которые понадобятся нам позже для фокусных рас- стояний / и f системы из двух центрированных тонких линз, находящихся в воздухе. Согласно D.3..27) получим, учитывая, что fo~ —/i, Д= —fi, с,оотио- шение _1 1 с_ где с— расстояние между фокусами F'o и Ft (рис. 4.16). Если I- между обеими линзами, то Следовательно, 1 I C7) расстояние C8) C9) Если линзы соприкасаются (I = 0), то последнее соотношение можно записать в виде 5s=5*1+^2, т. е. оптическая сила системы равна в этом случае просто сумме оптических сил двух линз.
§ 4.4] ПАРАКСИАЛЬНАЯ ОПТИКА -163 4.4.5. Произвольная центрированная система. Было показано, что в приб- лижении параксиальной оптики преломление и отражение лучей на поверхно- сти вращения описывается проективными соотношениями между величинами, относящимися к пространствам предмета и изображения *). Поскольку, со- гласно § 4.3, последовательное применение нескольких проективных преобра- зований эквивалентно одному проективному преобразованию, в этом прибли- жении отображение центрированной системой тоже оказывается таким преоб- разованием. Используя формулы, приведенные в пп. 4.4.1, 4.4.2 и 4.4.4, можно Рис. 4.16. Система из двух центрированных тонких линз. найти кардинальные точки эквивалентного преобразования. Наше рассмотре- ние будет в основном посвящено выводу важного инвариантного соотношения, справедливого (в принятом приближении) для любой центрированной системы. Пусть S], S2, ..., Sm—последовательные поверхности системы, /0, f'e, fi, f'v • ••> I my f'm—соответствующие фокусные расстояния и п0, пи ..., Пи- показатели преломления соответствующих сред (рис. 4.17). Далее, пусть Ро, Рис. 4.17. К выводу формулы Смита — Гельмгольца. р* две точки в пространстве предмета, расположенные в меридиональной плоскости, а Ри Р1, Рг, Pi, • • ¦ — их изображения последовательными по- верхностями. В системе координат с началом в фокусе первой поверхности координаты точек Ро, Р1 и Ри Р\ связаны соотношениями • &- = -?- = -^. , D0) D1) Следовательно, h *) Как и в случае одной поверхности, пространства предмета и изображения считаются наложенными друг па друга и неограниченно протяженными во асех направлениях. Часть про- странства предмета, расположенная перед первой поверхностью (отсчитываемой по ходу свето- вы\ лучей через систему), называется действительной частью пространства предмета, а часть пространства изображения, расположенная за последней поверхностью, называется действи- тельной частью пространства изображения. Оставшиеся части обоих пространств называются виртуальными. Таким же способом можно определить действительную и виртуальную части любой промежуточной области системы. . ...... ,
164 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ. 4 н у* у V* V* V" V* V V* Пусть Z;-Z0 = AZa, Zl — Zl = &Zl. D4) Тогда из D2) и D3) найдем hY<,Y'« kYxY' D5) AZ ~ AZ • Согласно A0) fofi— —njiit, так что последнее уравнение принимает вид п„У<у1 __ П1У^ D6) t±Za AZ, • Аналогичным образом получим выражение для преломления на второй поверх- ности ~AZ, т. е. в общем случае D8) Следовательно, ntYiYf/AZi есть инвариант последовательных преобразований. Этот результат играет важную роль в геометрической теории построения изоб- ражения. Если положить y*/AZf= tg Yj (см- рис. 4.17), то D8) примет вид n,-tYi_1tgyl_1 = niY,tgyi. В рассматриваемом нами приближении tg у и tg у' можно заменить соответст- венно на 7 и y'> н тогда мы получим формулу Смита—¦> Гельмгольца *) «/-1^-Л-1 = Я/^. D9) Величина Я;К;7; называется инвариантом Смита — Гельмгольца. Из D8) и D9) можно вывести целый ряд важных следствий. Поскольку обычно интересуются только соотношениями между величинами, относящимися к первой и последней средам (пространство предмета и пространство изображе- ния), мы будем в дальнейшем опускать все индексы и обозначать величины, относящиеся к этим двум средам, соответственно нештрихованными и штрихо- ванными символами. Пусть (Y, Z) и (Y + bY, Z + 6Z)— две соседние точки в пространстве предмета, а (У, Z') и (K'-f 6У", Z'+ 6Z') — сопряженные им точки. Применяя формулу Смита — Гельмгольца, получим n'Y'jY' В пределе при 6F->0 и 6Z->0 находим Согласно D.3.11) Y'/Y = (dY'ldY)z=const; следовательно, последнее выраже- ние принимает вид €1 dZ ~ п. \ dY Jz=const' l0Z' Это соотиошение называется формулой Максвелла для относительного увеличе- ния. Из нее следует, что продольное увеличение равно квадрату поперечного уве- личения, умноженному на отношение показателей преломления п In. В § 4.3 *) Эту формулу иногда связывают также с именами Лагранжа в Клаузиуса. В более простом виде она была известна еще Гюйгенсу и Котсу ^см. [31]),
§ 4.5] СТИГМАТИЧЕСКОЕ ОТОБРАЖЕНИЕ ПРИ БОЛЬШОЙ АПЕРТУРЕ K5S была выведена аналогичная формула A3), связывающая увеличения и отноше- ние фокусных расстояний. Сравнивая последнюю с E2), получим т. е. отношение фокусных расстояний прибора равно отношению показателей преломления п''п, взятому со знаком минус. Из формулы Смита — Гельмгольца следует также, что т. е. произведение поперечного и углового увеличений не зависит от выбора сопряженных плоскостей. До сих нор предполагалось, что система состоит только из преломляющих поверхностей. Если же одна из них (скажем, i-н) представляет собой зеркало, то вместо D8) находим Г ' Д2, где знак минус появился из-за того, что в случае отражения /;_i/f,-= I, тогда как в случае преломления ft_ilf,= —П1_г1п.г. Поэтому в окончательной форму- ле нужно заменить п' на —и'. Такую же замену следует провести и в более общем случае, когда система содержит нечетное число зеркал; если же система содержит четное число зеркал, то окончательная формула не изменяется. § 4.5. Стигматическое отображение пучками с большой угловой апертурой Законы параксиальной оптики были получены в предположении, что размеры предмета и углы, которые образуют лучи с осью, достаточно малы. Часто приходится иметь дело с оптическими системами и малыми предметами, но большими углами наклона лучей относительно оси. В таких случаях имеются Рис. 4.18. К выводу условия синусов и условия Гершеля. два простых условия существования стигматического отображения, называемых условием синусов *) и условием Гершеля [373. ч ,, Пусть 0„— точка предмета, находящаяся на оси, и Р„— произвольная близкая к ней точка, не обязательно лежащая на оси. Предположим, что система отображает эти точки стигматически и 0г и Рг— их изображения. Пусть (х0, г/о. г0) и (xlt г/л, zt) — координаты точек Р„ и Рг, причем коорди- наты Ро берутся относительно прямоугольной системы с центром в 00, а коор- динаты Р,— относительно системы с параллельными осями и центром в Ой оси г в этих системах выбраны так, что они направлены вдоль оптической оси системы (рис. 4.18). *) Условие синусов было впервые получено Клаузиусом [32] и Гельмгольцем [33] из тер- модинамических сообргшений. Однако важность этого условия была замечена лишь после того, как его вторична сформулировал Аббе [34, 35]. В тексте мы следуем, по существу, - выводу, предложенному Хокином C6].
166 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ. 4 Из принципа равного оптического пути вытекает, что длины всех лучей, соединяющих Ро и Ри одинаковы. Следовательно, если обозначить через V точечную характеристику среды, то V(x0, ус, г„; хи уи г,)—V@, 0, 0; 0, О, 0) = ,F(*0, г/„, г0; xlt у„ г,), A) где F— некоторая функция, не зависящая от лучевых компонент. Используя основные соотношения D.1.7), выражающие лучевые компоненты через точеч- ную характеристику, и пренебрегая членами, содержащими вторую и более высокие степени длины, получим из A) ") = ? (*о. У°> V> *1> У к zi)> B) где (р™, q\,m, т'®) и (pj", qf\ m{f) — лучевые компоненты произвольной пары соответствующих лучей, проходящих через О„ и OL. Необходимо отметить, что на величину лучевых компонент не наложено никакого ограничения, хотя вна- чале и предполагалось, что точки Ро и Pi расположены вблизи О„ и О,. Два случая представляют особый интерес, а именно: 1) Ро и Pi лежат соот- ветственно в плоскостях го= 0 и 2j— 0 и 2) Р„ и Рг лежат на оси симметрии. Эти |Два случая будут исследованы отдельно. 4.5.1. Условие синусов. Не уменьшая общности рассуждений, можно и здесь рассматривать только точки, лежащие в меридиональной плоскости (х0—xt = = 0). Если Р„ лежит в плоскости г0— 0, а Рх— в плоскости zi= 0, то B) при- нимает вид 0о. 0; 0, (/„ 0). C) Это соотношение справедливо для любой пары сопряженных лучей. Поэтому оно должно быть справедливым и для осевой пары р$)= q'tf— Oup^}= д[т~0. Следовательно. F@, </„, 0; 0, ylt 0) = 0. D) Таким образом, C) запишется следующим образом: <ПУ1 = 4Ру.. E) или в явном виде n^1sinvi = n0y0sin7o, F) где Yo и уг— углы, образованные соответствующими лучами, проходящими через О0 и Ох, с осью г; п0 и п,у— показатели преломления среды в пространствах предмета и изображения. Соотношение F) называется условием синусов; это то условие, при выполнении которого небольшая часть плоскости предмета, лежащей вблизи оси, резко отображается расходящимся пучком лучей с любой угловой апертурой. Если угловое расхождение достаточно мало, то .sin y0 и sin Yi можно заменить соответственно на у0 и ylt и условие синусов перейдег ¦в формулу Смита—Гельмгольца D.4.49). Если предмет находится на бесконечности, то условие синусов имеет другой вид. Предположим сначала, что осевая точка предмета расположена на большом расстоянии от первой поверхности. Если Zo—абсцисса этой точки в системе координат с центром в первом фокусе и hu—расстояние от оси точки пересечения луча, выходящего из осевой точки, с первой поверхностью, то Zosin yo/ho-^> 1 npuZo—>-оо и постоянном Ао. Следовательно, если Zo достаточно велико, то F) принимает вид ^ | G) Но согласно D.3.10) yiZ0/ye= /0, а согласно D.4.53) no/ni= —/0//ь так что в пре- деле Z<,-*-oo выражение (б) сводится к (рис. 4.19)
<§ 4-.Б] СТИГМАТИЧЕСКОЕ ОТОБРАЖЕНИЕ ПРИ БбЛЬШоЙ АПЕРТУРЕ 167 Отсюда следует, что любой луч, падающий параллельно оси, пересечет сопря- женный ему луч на сфере радиуса [г с центром в фокусе Рг. Говорят, что две осевые точки образуют апланатическую пару, если, во-первых, они являются стигматическими изображениями одна другой и, во-вторых, сопряженные лучи, проходящие через них, удовлетворяют условию синусов. Мы уже встречались с такими точками при изучении преломления лу- чей нл сферической поверхности (см. п. 4.2.3). В терминах теории аберраций (см. гл. 5) осевой стигматизм означает, что в разложении характеристической функции отсутствуют члены, не зависящие от расстояния предмета до оси, т. е. отсутствует сферическая аберрация всех порядков. Если же выполняется еще и условие синусов, то пропадают члены, ¦_/ [Рис. 4.19. Условие синусов в случае, когда предмет находится в бесконечности. содержащие расстояние до оси в первой степени; эти члены описывают аберра- цию, которая называется круговой комой.. Условие синусов играет важную роль при конструировании различных оптических систем, поскольку оно дает информацию о качестве изображения точек, не расположенных на оси, выраженную через свойства аксиальных пучков. 4.5.2. Условие Гершеля. Рассмотрим теперь случай, когда Ро и Рг находят- ся на оси системы (хо= уо= О, Xi= уг= 0). Условие резкого отображения B) примет тогда вид m?'Zl—<>z0 = ,F(O, 0, г„; 0, 0, г,), (9) или через у0 и Yi— nlzIcosy1 — n0z№cosy0 = F{Q, 0, г„; 0, 0, г2). A0) В частном случае осевого луча получим F@, 0, г,\ 0, 0, г^лА-я,?,. A1) Следовательно, A0) можно представить в виде n^sm^^n^sm^. A2) Это соотношение является одной из форм запис/условия Гершеля. Поскольку предполагается, что расстояния от начала координат малы, то на основании формулы Максвелла D.4.52) найдем и тогда условие Гершеля можно записать следующим образом: ^ no(/osin^. A4) Если это условие выполнено, то любой элемент оси, расположенный вблизи О0, будет резко отображаться пучком лучей независимо от величины его угло- вого расхождения. Необходимо отметить, что условие синусов и условие Гершеля могут удовлетворяться одновременно лишь в случае \h~ y0. Тогда yi/yo~ zjza— ^=njnu т.е. продольное и поперечное увеличения равны отношению показате- лей преломления среды в пространстве предмета и в пространстве изображения.
168 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ |ГЛ. 4 § 4.6. Астигматические пучки лучей Прямолинейные лучи, имеющие общую точку, образуют так называемый гомоцентрический пучок. Волновые фронты в этом случае имеют вид сфериче- ских поверхностей, центры которых находятся в точке пересечения лучей, В предыдущих разделах мы изучали именно такие пучки. Обычно после преломления или отражения лучей их гомоцентричность нарушается. Поэтому целесообразно исследовать свойства пучков прямолиней- ных лучей более общего типа. 4.6.1. Фокальные свойства тонкого пучка. Пусть 5— один из волновых фронтов пучка прямолинейных лучей, а Р — произвольная точка на нем (рис. 4.20). Рассмотрим плоскость, проходящую через луч в точке Р, и обозна- чим кривую пересечения этой плоскости с 5 через С. Поскольку лучи пучка Pt Рис. Ф.20 Тонкий пучок лучей. нормальны к поверхности S, центр круга кривизны в точке Р расположен на луче, проходящем через эту точку. Если теперь поворачивать рассматриваемую плоскость вокруг луча, то кривая С, а следовательно, и радиус кривизны будут изменяться непрерыв- ным образом. При повороте плоскости на 180° величина радиуса кривизны пройдет через свои максимальное и минимальное значения. С помощью простых геометрических рассуждений можно показать *), что две плоскости, в которых лежат максимальный и минимальный радиусы кривизны, взаимно перпендику- лярны. Эти плоскости называются главными плоскостями **) для точки Р, а соответствующие радиусы — главными радиусами кривизны. Кривые на по- верхности S, касающиеся во всех своих точках главных плоскостей, образуют два взаимно ортогональных семейства кривых, называемых линиями кривизны. В первом приближении две нормали к поверхности в смежных ее точках, вообще говоря, не пересекаются. Однако если эти точки находятся на линии кривизны, то нормали пересекаются и точка их пересечения служит фокусом конгруэнции, образованной нормалями (лучами). Следовательно, в согласии с общими выводами п. 3.2.3 на каждой нормали имеются два фокуса, которые являются главными центрами кривизны. Поэтому каустическая поверхность пучка прямолинейных лучей состоит в общем случае из двух листов и служит эволютой волновых фронтов; волновые фронты в свою очередь являются эволь- вентами каустической поверхности. Если волновые фронты представляют со- бой поверхности вращения, то один лист каустической поверхности вырождает- ся в отрезок оси вращения, а другой становится поверхностью вращения, меридиональное сечение которой является эволютой меридионального сечения волнового фронта. Рассмотрим тонкий пучок лучей, пересекающих элемент dS волнового фронта. В качестве границы элемента dS удобно выбрать две пары линий кривизны, которые можно считать отрезками дуг окружностей. Два из них •) См., например, [38]. **) Термины «главные плоскости» и «фокальные плоскости» имеют здесь другой смысл, чем при изучении проективных преобразований, рассмотренных в § 4.3,
§ 4.6] АСТИГМАТИЧЕСКИЕ ПУЧКИ ЛУЧЕЙ 169 (РгРг и PiPb) направлены по вертикали, а два других (Р2Р4 и Р2РЯ) — по гори- зонтали (см. рис. 4.20). Все лучи, проходящие через дугу РгР.г, пересекутся (с точностью до членов первого порядка малости) в фокусе Р,г, а лучи, проходящие через Р3Рл,— в фо- кусе Fsi. Линия /', соединяющая F12 и FSi, называется фокальной линией пучка и, как видно из чертежа, лежит в горизонтальной плоскости. Лучам, проходя- щим через Р,Р4 и РгРз, соответствует вертикальная фокальная линия /. Если провести линии кривизны через любую точку на dS, то соответствую- щие им фокусы окажутся на двух фокальных линиях, и наоборот. Таким обра- зом, приближенная модель тонкого пучка лучей полу- чается путем соединения всех пар точек на двух вза- имно ортогональных отрезках линий. Луч /, проходящий через центральную точку Р, называется центральным (или главным) лучом пучка, а расстояние между фокальными линиями, i+змеренное вдоль этого луча,— астигматической разностью пуч- ка. Две плоскости, проходящие через /, / и /', /, на- зываются фокальными плоскостями пучка; эти пло- скости перпендикулярны друг к другу. Однако фокаль- ные линии не обязательно перпендикулярны к цен- тральному лучу (как часто неверно утверждается в литературе). Рассмотрим, например, семейство волно- вых фронтов, обладающих цилиндрической симмет- рией относительно общей оси (рис. 4.21). Пусть dS —¦ элемент поверхности (не содержащий осев\ю точку) одного из волновых фронтов, ads — участок кривой пересечения dS с плоско- стью, проходящей через ось. Тогда ясно, что фокальная линия / в центре кри- визны К элемента кривой ds ортогональна этой плоскости. Другая фокальная линия /' совпадает с отрезком оси, ограниченным нормалями-к концам ds. В общем случае эта фокальная линии не ортогональна /. 4.6.2. Преломление тонкого пучка. Было показано, что тонкий пучок лучей полностью характеризуется своим центральным лучом и двумя своими Ось вращения Рис. 4 2! Фокальные ли- нии волнового фронта с цилиндрической сиымет* рней. Рис. 4 22. Преломление тонкого астигматического пучка лучей. фокальными линиями. Предположим, что такой пучок падает на преломляю- щую поверхность. Определим центральный луч и фокальные линии преломлен- ного пучка. Рассмотрим случай, имеющий большое практическое значение, с именно случай совпадения одной из главных плоскостей падающего пучка а главной плоскостью кривизны преломляющей поверхности в точке О, в кото- рой ее пересекает центральный луч (рис. 4.22). Выберем декартову систему координат с началом в точке О, осью г, направ- ленной по нормали к поверхности Т, и осями х и у, направленными по главным линиям кривизны поверхности Т. Далее, пусть б„ и 9Х— углы, образованные центральными лучами /, и U двух пучков и осью z, Fo и F'u— фокусы падающего пучка, расположенные со-
170 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОВРАЖЕНИЙ [ГЛ. 4 ответственно при г = ?0 и г = ?i. Предположим, что фокальная линия в Fo перпендикулярна к плоскости падения; в этом случае F0 называется первичным фокусом, а соответствующая фокальная линия /0— первичной фокальной линией. Фокус F'n называется тогда вторичным фокусом, а соответствующая фокальная линия f'o (лежащая в плоскости падения) — вторичной фокальной линией. В случае центрированной систему первичный и вторичный фокусы пучка, центральный луч которого находится в меридиональной плоскости, называют соответственно тангенциальным и сагиттальным фокусами. Для нахождения фокальных линий преломленного пучка необходимо прежде всего выписать выражение для угловой характеристики преломляющей поверхности. Если радиусы кривизны преломляющей поверхности в главных направлениях х и у равны гх и гу, то уравнение этой поверхности имеет вид Тогда, согласно D.1.34), угловая характеристика относительно системы коор- динат с началом в О (при ао= аг— 0) равна Т = (po—Pi)x+ (<7o—<7i) У + (Щ — Щ) г. B) Из закона преломления, учитывая лишь члены низших порядков, можно получить таким же способом, как и в § 4.1 (где рассматривался случай гх= г,), соотношения г— г Ро — Pi „_ , la — Qi io\ X Гх , у Г v '. (О) fljQ — OTi * ftlo — ftl^ Подстановка C) в A) дает где 9a—«0cos60. E) Подставляя теперь C) и D) в B), получим требуемое выражение для угловой характеристики Т(Ро, <7„; Pi, qi) = ^Vx(p0—ply + ry{qt,—qir} + .~ F) Используя это соотношение в D.1.29), получим уравнения для падающего и преломленного лучей в виде *о-^г,=7г*<Л-Л)' G) xi ^ zi = ~ гу (А> Pi); (8) соответствующие уравнения, содержащие координату у, совершенно ана- логичны. Исследуем теперь изменения различных величин при переходе от централь- нога луча к соседнему. Из G) и (8) имеем 1 гяFр„~ вл). A0) Лучевые компоненты центрального луча падающего пучка равны | />о = 0, % = так что 6 (-) = Л{щЬр,-р№>) -= -1 sec Э„вЛ A2)
§'4.6] АСТИГМАТИЧЕСКИЕ ПУЧКИ ЛУЧЕЙ 171 И б (—) — -т (mo6qo — qo6mo)*= — sec3Q,j8q0. A3) •V"o/ гщ п0 Здесь было использовано тождество mo6me+ po6po-h qo6qv= 0, Уравнения (9) и A0) принимают вид — rx(&Pi — ^Д))> ('4) rx(Sp1 — 8р0). A5) При выводе A5) использовался тот факт, что рг— 0; этот результат следует из закона преломления и предположения, что ро= 0. Аналогичным образом получим о rv (&Qi—6</о)» A6) i— (tg 9i)fei = ^ (sec3 вг) 6^—^F^- Рассмотрим теперь такие лучи пучка, которые проходят через фокус F„. Тогда го== ?„, 8лго= 8г/0= 6го= 0. Поскольку все эти лучи пересекают также фокальную линию f'o, то бро= 0. Учитывая это, находим из A4) и A6) брх = О A4а) в jjSsec»eQa?e-.Ir),(aq<1-&70)=0. A6а) Уравнение A4а) показывает, что соответствующие преломленные лучи лежат в плоскости j/г. Так как все лучи из Fo проходят через фокус Fx(zi= Si), то уравнение A7) должно выполняться при 2j= Zu &Xi~ 6#i= 6zi= 0 для любого значения 6q0, т. е. |sec3916%'-ir;,F^-6^) = 0. A7a) Уравнения A6а) и A7а) при произвольном значении 6д0 могут одновременно удовлетворяться только в том случае, если «„.cos3 90 я, cos3 9г >i0 cos 0„ — nt cos 8t ,, „. to ti ry Это соотношение определяет положение фокуса Fx преломленных лучей. Из A4а) следует, что фокальная линия, проходящая через Т7,,перпендикулярна к плоскости уг и, следовательно, Fi яйляется первичным фокусом. Для нахождения положения другого фокуса рассмотрим лучи, выходящие из F„. В этом случае го= ?о, Ьх0— 6j/0= бго= 0. Поскольку все эти лучи пере- секают фокальную линию /„, имеем 6до= бт„= 0. Тогда из уравнений A4) и П6) находим ^Л—1л,(вЛ-вр„) = О A46) 6^ = 0. A66) Из A66) следует, что преломленные лучи лежат теперь в плоскости хг. Все эти лучи проходят через второй фокус F'1(z1-^ ?,[), так что A5) должно удовле- творяться при ?t= t,\, Sx, - Si/,^ бгх= 0 для любого значения величины бр»- Следовательно, ¦J sec в^р,—?-МбЛ-6А) = 0. A56)
172 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ (ГЛ. 4 Поскольку как A56), так и A46) должны удовлетворяться при произвольном значении бдо, т° щ cos 80 nt cos 8t д0 cos 8n—nt cos 9t ,10, So Ei rx Полученное соотношение определяет положение вторичного фокуса F[. Часто оказывается удобным определять положение фокусов, задавая их расстояния до точки О, а не координаты г. Обозначая 0F0— d''>, OF^= dj", OFi=dll\ OF\=df (на рис. 4.22 d«><0, dj,s'<0, di">0, df>>0), находим ?;=<*«> cos 9,, B0) а уравнения A8) и A9) принимают вид «0cos290 «t cos2 От п„ cos 90 — ^собЭ, ,-., "(>  Ту И «О п\ пЧ cos 9ц — Щ COS 9t mni —(s>— (s7— ~ • \^ ) Соответствующие соотношения для случая отражения можно получить, если в приведенных выше формулах положить щ— —п„. § 4.7. Хроматическая аберрация. Дисперсия призмы В гл. 2 было показано, что показатель преломления не постоянен для дан- ной среды, а зависит от цвета, т. е. от длины волны света. Рассмотрим сейчас некоторые простые следствия из этого, касающиеся работы линз и призм. 4.7.1. Хроматическая аберрация. Если пучок немонохроматического света падает на преломляющую поверхность, то он расщепляется на несколько лучей, каждый из которых имеет определенную длину волны. Поэтому, пере- секая оптическую систему, лучи света с различными длинами волн будут ffjj . Лоперечтгя д f- тхршалш- xi ! l ческая Продольная хроматическая аберрация Рис. 4.23. Продольная и поперечная хроматические аберрации. распространяться после первого преломления не вполне одинаковыми путями. В результате изображение окажется нерезким, и в этом случае говорят, что система обладает хроматической аберрацией. Мы снова ограничимся рассмотрением точек и лучей, расположенных вблизи оси, т. е. предположим, что для каждой длины волны отображение под- чиняется законам параксиальной оптики. В этом случае говорят о хроматиче- ской аберрации первого порядка, или о первичной аберрации. Пусть Qa и Q4— отображения точки Р в различных длинах волн (рис. 4.23); тогда проекции Q,Qq на направления, параллельное и перпендикулярное оси, определяют со- ответственно продольную и поперечную хроматические аберрации. Рассмотрим изменение 6/ фокусного расстояния тонкой линзы в зависимо- сти от изменения показателя преломления бп, Согласно D.4,36) величина
§ 4.7] ХРОМАТИЧЕСКАЯ АБЕРРАЦИЯ. ДИСПЕРСИЯ ПРИЗМЫ 173 (п —- 1) / для такой линзы не зависит от длины волны. Следовательно, -1 - = 0. Величина nD-l A) B) п 1,70 1,65 1,60 где пг, nD и пс— показатели преломления, соответствующие линиям Фраун- гофера F, D и С (Х4861 А, 5893 А и 6563 А), служит грубой мерой дисперсии стекла и называется относительной дисперсией. Из A) видно, что эта величина приблизительно равна расстоянию между красным и синим изображениями, деленному на фокусное расстояние линзы. На рис. 4.24 показано изменение величин показателей пре- ломления с изменением длины волны для стекла нескольких сортов, обычно используемых в опти- ческих системах. Соответствующие значения Д ле- жат в пределах от 1/60 до 1/30. Для получения изображения хорошего качест- ва необходимо, чтобы как монохроматические, так и хроматические аберрации были малы. Обычно выбирают некоторое компромиссное решение, по- скольку в общем случае невозможно устранить одно- временно аберрации всех типов. Часто оказывается достаточным избавиться от хроматической аберра- ции для двух выбранных длин волн. Выбор этих длин волн зависит, естественно, от назначения той или иной оптической системы; например, фотообъ- ективы, в отличие от приборов, служащих для ви- зуальных наблюдений, обычно «ахроматизируют» для цветов, близких к синему концу спектра, так как обычная фотографическая пластинка более чув- ствительна к синей области спектра, чем человече- ский глаз. Конечно, ахроматизация для двух длин волн не устраняет полностью цветовую ошибку. Остающаяся хроматическая аберрация называется вторичным спектром. Рассмотрим теперь условия, при которых две тонкие линзы образуют ком- бинацию, свободную от хроматизме фокусного расстояния. Согласно D.4.39) величина, обратная фокусному расстоянию комбинации двух тонких линз, расположенных на расстоянии / друг от друга, равна j = 2.+?L_jL. C) Как мы видим, 8f = 0, когда / 4000 5000 6000 7000 А Рис. 4.24. Типичные диспер- сионные кривые для стекла различных сортов. /—тяжелый флинт; //—тяже- лый бариевый крон; /// — легкий флинт, IV—тяжелый крон; V — боросиликатный крои. Если ахроматизация производится для линии С и F, то, используя (I) и B), получим где Ai и Д г— относительные дисперсии обеих линз. Один из методов уменьшения хроматической аберрации состоит в исполь- зовании двух соприкасающихся тонких линз (рис, 4.25), одна из которых сде- лана из крона, а вторая — из флинта, В этом случае, поскольку / = 0, получим из E) 0, F)
174 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [гл. 4 или, используя C), • /l д,-д, G) Соотношения G) для данных сортов стекла и заданного фокусного расстоя- ния / однозначно определяют }г и f2. Но ft и /2 зависят от трех радиусов кривиз- ны, следовательно, величину одного из них можно выб- рать произвольно. Эта дополнительная степень свободы позволяет иногда уменьшить до минимума сферическую аберрацию. Другой способ создания ахроматической системы со- стоит в использовании двух гонких линз, изготовлен- 1 Флинт- ных из одинакового стекла (Aj— Д2) и расположенных друг от друга на расстоянии, равном пол}сумме их фо- кусных расстояний, т. е. Крои Рис 4 23 Ахромата- / i / /г i f \ (ал ческии дублет l~ Wi + W tS> Ахроматичность такой комбинации линз следует непо- средственно из E). В приборе, состоящем из нескольких частей, в общем случае нельзя одновременно устранить хроматизм положения и хроматизм увеличения, если это не сделано для каждой его части. Докажем последнее утверждение для слу- чая двух центрированных тонких линз, разнесенных на расстояние /. Согласно Рис. 4 26. Ахроматизация системы из двух тонких линз. п. 4.4.4 отображение тонкой линзой является центральной проекцией из ее центра; следовательно (рис. 4.26), УI ?l ' У г Поскольку Yi~ Y't, лаходим для увеличения У л (9) A0) Если длина волны изменится, то величина t,i останется той же, величина ?2 также будет прежней, если допустить отсутствие хроматизма положения. Следовательно, условие отсутствия хроматизма увеличения системы можно за- писать в виде Так как ?2+ ?i= I, bZ,\= —6t,2, то A1) удовлетворяется лишь при 6?j= 8?г= О, т. е. если каждая из этих линз ахроматизирована. До сих пор мы рассматривали только первичную хроматическую аберра- цию тонкой линзы и комбинации двух таких линз. В гл. 5 будут получены вы- ражения для первичной хроматической аберрации центрированной системы в общем случае. 4.7.2. Дисперсия призмы. Рассмотрим теперь кратко прохождение света через призму.
§ 4.7] ХРОМАТИЧЕрКАЯ АБЕРРАЦИЯ. ДИСПЕРСИЯ ПРИЗМЫ 175 Пусть а — угол между двумя рабочими гранями призмы. Предположим, что ребро А, вдоль которого пересекаются эти грани, перпендикулярно к пло- скости, в которой лежат падающий, преломленный и вышедший лучи (рис. 4.27), Вначале будем считать свет стро- го монохроматическим. Пусть 5i иВ2— точки пере- сечения падающего и вышедшего лучей с гранями призмы, tft и 4l'i— углы падения и преломле- ния в точке Bi и г|J и ф2— внут- ренний и внешний углы в точке В, (т. е. углы, которые обра- зуют луч 5i52 И вышедший луч •Рис'4.27. Прохождение луча через призму, с нормалью в точке В2). Далее, пусть С— точка пересечения нормалей к граням 'призмы в Bi и Bj и fl -« точка, в которой пересекаются продолжения падающего и вышедшего лучей. Если обозначить через е угол отклонения, т, е. угол между вышедшим и па- дающим лучами, то е + а, A2) '«. A3) Из закона преломления находим sin (p, = n simp,, sin <p2 = п sin ipa, A4) где п — показатель преломления стекла относительно окружающего воздуха. Угол отклонения е экстремален, если С учетом A2) это условие принимает вид V*p.; экстр '• A0> Тогда из A3) и A4) найдем &=-?• «»*-««»*,?. cos^jg-ncosibg;. A7) или после преобразований. riq>3 _ cos у, cos ti /jg4 dcfi cos ф, cos ф3' ^ ' Как следует из A6) и A8), в случае экстремума имеем COS <pt COS ^, _ j COS lj?1 COS ф2 ' или, возводя A9) в квадрат и используя A4), получим 1 —slng<p, __ 1 —sin3 ф, n2 —sin^tp, n* — sinai|)a* Это уравнение удовлетворяется, если Ф1="ф2; ) при этом j- ' B1)< Чтобы определить характер экстремума, надо исследовать d}e,Jd^\. Из A2) и A8) имеем dtp! d<pi depi «ftp, L V d9i/J
176 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ. 4 При (pt= фг> i|?i р2 это выражение с учетом A4), A6) и A7) принимает вид B3) Так как п> 1, то tpi>tj;i; кроме того, поскольку 0<<р1<я/2, то tg<pi:>0. Следовательно, (d26/d<Pi)>Q, т. е. отклонение минимально. Из B1) следует, что при таком отклонении лучи проходят через призму симметрично. Величина угла наименьшего отклонения, равна г„я — 2ч>1—а. B4) Углы падения и преломления иа первой грани призмы можно выразить через емнн и а в виде откуда п = sin \— (е sin_$i _ 12 е""" sin ( j a B6) Последняя формула часто используется при определении показателя прелом- ления стекла. С помощью спек- трометра измеряют значения еЧ1Ш в»/ \ i || ~>/»г и а' а затем п0 формуле B6) вы- ¦^х \ г \ I —• числяют величину п. Рассмотрим теперь прохож- дение через призму пучка парал- лельных лучей, выходящих, на- пример, из точечного источника Р, расположенного в фокальной плоскости линзы Lx (рис. 4.28); свет по-прежнему считается мо- нохроматическим. Пусть В, и Рис. 4.28. Схема, иллюстрирующая дисперсию призмы В', — основания перпендикуля- ров, опущенных из точек Вг и S2 на лучи, которые проходят через ребро А. Тогда BiB[ и В2В'2 являются линиями пересечения двух волновых фронтов с плоскостью падения (плоскостью чертежа). Эти две линии образуют между собой угол, равный углу отклонения в. Положим 6,5; = /,, b2b;=/s, BtB%=t. B7) Рассмотрим теперь параллельный^ пучок немонохроматического света. Если линза Lx исправлена на хроматическую аберрацию, то Bi-б', останется на волновом фронте падающего пучка. С другой стороны, линия В»В'% уже не будет единственной; ее положение будет зависеть от длины волиы X, поскольку пока- затель преломления призмы зависит от длины волны, т. е. п~п(К), B8) а следовательно, угол отклонения к тоже зависит от Я: Величину ds ds dn B9) C0) соответствующую постоянному значению угла падения q>i, часто называют угловой дисперсией призмы. Первый сомножитель в правой части C0) зависит только от геометрии системы, а второй характеризует относительную дисперсию
§ 4.8) ФОТОМЕТРИЯ. АПЕРТУРЫ ОПТИЧЕСКИХ СИСТЕМ 177 стекла, из которого изготовлена призма. Поскольку (pi= const, то из A2) и A3) находим _*L = ^ ^1 <*Ъч C1) dn dn ' dn dn ' а из A4) — sin if, + n cos ift -^ =¦ 0, = sm\|)l! + racosi);2-^- = 0; C2) после преобразований имеем ' ds sin (г|I + i|K) sin а dn cos 1|>и cos ip, cos ф2 cos if, ' Из треугольника Л^/Зе получим на основании теоремы синусов ЛВ. = Э'- C4) а из треугольника ЛВаб^— ЛВ / C5 Используя последние три соотношения, можно представить C0) в виде Из симметрии следует, что в положении минимума отклонения k— lt. Если, кроме того, линзы настолько велики, что пучок полностью заполняет призму, то величина t будет равна длине Ь основания призмы. В этом случае из C6) получаем следующее выражение для угловой дисперсии 8е, т. е. для угла между волновыми фронтами, относящимися к длинам волн А. и к + 6к 68 = ±^6Х. C7) § 4.8. Фотометрия. Апертуры оптических систем Фотометрией называется раздел оптики, связанный с измерениями свето- вых потоков. Строго говоря, фотометрия не относится к геометрической оптике, однако во многих практических приложениях приближенная геометрическая картина электромагнитного поля служит при фотометрических исследованиях достаточно хорошей основой, и поэтому целесообразно включить в настоящую главу краткое рассмотрение этого раздела. Ограничимся простой геометриче- ской моделью, согласно ^которой свет представляет собой ноток лучистой энер- гии, распространяющийся вдоль геометрических лучей и подчиняющийся закону сохранения энергии. Последний состоит в том (см. уравнение C.1.31)), что энергия, протекающая в единицу времени через любое поперечное сечение трубки лучей, остается постоянной. 4.8.1. Основные понятия фотометрии*). В фотометрии обычно рассмат- ривается энергия света, испускаемого элементом поверхности 6'. Эта поверх- ность может быть либо фиктивной, либо реальной; в последнем случае она может совпадать с излучающей поверхностью источника или с освещенной поверхностью твердого тела. Если тело непрозрачно, то исследуется отражен- ный свет, если же оно прозрачно или полупрозрачно (в этом случае происходит частичное поглощение или рассеяние света), то измеряется обычно прошедший, свет. •) Здесь будут рассмотрены только фундаментальные фотометрические понятия. Более подробную информацию и описание приборов, используемых при световых измерениях, можно найти, например, в [39, 40]. 12 М. Ьорн, Э. Вольф
178 TEOMETPHHFCKAH ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ. 4- Пусть Р (|, г|) ¦—произвольная точка на поверхности S, отнесенная к какой-то криволинейной системе координат на этой поверхности. Количество энергии (усредненное по времени), прошедшее за единицу времени через элемент поверхности 8S, содержащий точку Р, в телесный угол 8Q в направ- лении, определяемом полярными углами (а, C), можно записать следующим об- разом: Здесь б — угол между направлением (а, Р) и нормалью к элементу поверхности r(ccJ) (Рис- 4.29) и В— коэффициент, в общем случае зависящий от A, г() и (a, C), т. е. В выражении A) стоит множитель cos 9, По- скольку физический смысл имеет не сам элемент поверхности 6S, а его проекция на плоскость, перпендикулярную к направлению (а, C). Вели- чина В называется фотометрической яркостью Рис. 4.29. Схема, иллюстрирую- D точке (| ц\ в направлении (а, В). Необходимо щая распространение энергии от *¦*' " у я элемента поверхности отличать эту величину от субъективного ощуще- ния яркости, поскольку глаз человека обладает разной чувствительностью по отношению к различным цветам *); этот вопрос будет обсуждаться более подробно в дальнейшем. Величина 8F записывается обычно двумя способами, чтобы показать в яв- ном виде ее зависимость от 6Q и 6S: 6F = б/ 6Q = 8Е 6S. C) Сравнивая A) и C), получим to 6f g E) Интеграл взятый по определенной поверхности, называется фотометрической силой света в направлении (a, f>), a интеграл E(l, ri)=$ScosedQ, G) взятый по телесному углу,— фонометрической освещенностью в точке**) (Е. П>. Характер изменения В с направлением будет зависеть от свойств поверх- ности и особенно от того, шероховатая она или гладкая, обладает она способ- ностью сама излучать свет или пропускает, или отражает падающее на нее излучение. Часто можно полагать, что В с хорошей точностью не зависит от направления. В этом сл\чае говорят, что излучение изотропно. Если излучение изотропно и излучает плоская поверхность, то F) принимает вид /(a, P) = /Ocose, (8) где /0 = $BdS • *) Мы используем прилагательное «фотометрический», когда хотим подчеркнуть, что данная величина определяется не по зрительному ощущению, а но физическому воздействию. **) Если элемент поверхности 8.S в точке Р перпендикулярен к вектору Лойнтинга, то фотометрическая освещенность б? в точке Р совпадает с интенсивностью света, определенной в гл. 1.
§ 4г8] ФОТОМЕТРИЯ. АПЕРТУРЫ ОПТИЧЕСКИХ СИСТЕМ 179 Следовательно, фотометрическая сила света в каком-то направлении пропорциональна косинусу угла между этим направлением и нормалью к по- верхности. Соотношение (8) называется законом Ламберта (законом косинусов); если он выполняется, то говорят о диффузном излучении, или диффузном отра- жении, в соответствии с тем, имеем мы дело с излучающей или отражающей поверхностью. Измерения величин F, В, I и Е состоят в определении временного проме- жутка, площади, направления, телесного угла и энергии. Поскольку средние значения указанных величин обычно малы, необходимо использовать чувстви- тельные приборы. Последние делятся на два типа. Первые реагируют на тепло, выделяющееся в поглощающей среде (например, болометр, тер- мопара и др.), и используются главным образом при изучении теплового излучения (инфракрас- ного); вторые основаны на явле- нии поверхностного фотоэффек- та, состоящего В ТОМ, что свет, Рис. 4.30.. К выводу закона освещенности в случае падающий на поверхность ме- точечного источника, талла, вызывает эмиссию элек- тронов (если свет монохроматический, то число выбитых электронов (т. е. ток) пропорционально энергии падающего света). Приборы второго типа применяются, например, в фотографии в качестве экспонометров. Однако в технической фотометрии обычно используются косвенные методы. Сначала создают стандарт источника света и выражают его фотометрические показатели в абсолютных энергетических единицах. Затем результаты измере- ния сравнивают с этими показателями, причем часто в качестве нуль-индика- тора, т. е. индикатора одинаковой яркости, используют глаз. Сравнение с эта- лоном основано на простом законе, справедливом для освещенности, создавае- мой точечным источником *) Q. Пусть 65 — элемент поверхности в точке Р, и пусть QP = г. Если 9 — угол, образованный QP с нормалью к 65 (рис. 4.30), то энергия, посылаемая источником через 6S в единицу времени, равна /6Q, где /— фотометрическая сила света источника в направлении QP, a 6Q — телесный угол, под которым виден элемент 8S из точки Q. Из элементарной геометрии следует, что cosG6S = rs6Q. (9) Отсюда, используя C), йолучим (Ю) Соотношение A0) представляет собой основное уравнение практической фото- метрии. Оно выражает закон освещенности, утверждающий, что освещенность Е, создаваемая точечным источником, пропорциональна cos 9 и обратно про- порциональна г*. Этот закон позволяет сравнивать силу света источников пу- тем простых геометрических построений. Если элемент поверхности 6S осве- щается двумя точечными источниками Q, и Q2, фотометрические силы света которых равны 1Х и /а, а линии, соединяющие 8S с источниками, образуют с нор- *) Фотометрическая сила света / точечного источника определяется с помощью про- цедуры, часто используемой при введении предельных величии. Предположим, что площадь поверхности стремится к нулю, а значение В — к бесконечности таким образом, чго интеграл F) остается конечным. Тогда / будет функцией a, f> и положения точечного источника. При расчете фотометрической освещенности обычно пренебрегают конечной протяжен- ностью источника, если его линейные размеры меньше 1/20 его расстояния до освещаемой поверхности. 12*
180 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ' |гл. 4 малью к 6'S углы в, и 62 (рис. 4.31), то в случае равенства фотометрических освещенностей имеем (И) 11 cos 9] ' cos 02' Сравнивая данный источник со стандартным, можно с помощью A1) определить его силу света. Равенство освещенностей, создаваемых двумя источниками, можно установить либо физическими методами, либо непосредственно глазом. Последний способ достаточно прост, если монохроматический свет от двух ис- точников имеет одинаковую частоту, однако в общем случае приходится срав- нивать источники, излучающие свет различного спектрального состава. Тогда Рис. 4.31. К сравнению силы света двух точечных источ- ников ' 1 0,9 а,8 0,7 ИВ 0,5 0,4 0,3 0,2 0,1 400 450 500 550 В00 650 700Л,ММК Рис. 4.32 Кривая относительной спектральной чув- ствительности К\ для среднего человеческого гла- за: /—для яркого света, И—для слабого света этот простой метод уже не годится, поскольку глаз обладает различной чувст- ьительностью к езету разных длин волн. В подобных случаях используют орилыры, пропускающие свет в узком спектральном интервале около известной длины волны; тогда установление равенства освещенностей для различных цветов сводится к определению относительных значений энергии с учетом кривой спектральной чувствительности глаза., Эта кривая характеризует зависимость от длины волны величины К\, обратной значению потока, вызы- вающего ощущение одинаковой/ яркости. Вид кривой до некоторой степени зависит от величины освещенности. Для яркого света она имеет максимум при А, около 550 ммк (см. рис. 4.32 и табл. 4.2). С уменьшением освещенности кривая сохраняет свою форму, но максимум смещается в сторону синего конца спектра; при очень слабом свете максимум лежит при А., близком к 507 ммк. Это явление называется эффектом Пуркинье. Если поток энергии оценивается по создаваемому им зрительному ощуще- нию, а не по его истинной физической величине, то говорят о световой энер- гии F'l A2) где F}d\— количество энергии в интервале (X, Х'+ dk), K\— относительная спектральная чувствительность, или относительная видность, и интегрирование проводится по всем длинам волн. Величины В', /'и Е', связанные с В, I и Е,
• 8] ФОТОМКТРИЯ, АПЕРТУРЫ ОПТИЧЕСКИХ СИСТЕМ 181 Таблица 4.2 Таблица значений относительной спектральной чувствительности J(^ среднего человеческого глаза (яркий свет) %, ммк 400 410 420 430 440 450 460 470 480 490 500 510 520 КХ 0,0004 0,0012 0,0040 0,0116 0,023 0,038 0,060 0,091 0,139 0,208 0,323 0,503 0,710 К, ммк 530 540 550 560 570 580 590 600 610 620 630 640 0,862 0,954 0,995 0,995 0,952 0,870 0,757 0,631 0,503 0,381 0,265 0,175 \. ммк 650 660 670 680 690 700 710 720 730 740 750 760 КХ 0,107 0,061 0,032 0,017 0,0082 0,0041 0,0021 0,00105 0,00052 0,00025 0,00012 0,00006 как F' с F, называются соответственно яркостью, силой света и освещенно- стью *). Эти понятия широко применяются в визуальной фотометрии. Каждая из четырех величин F', В', Г и Е' имеет свою единицу измерения в практической системе. Обычно основной фотометрической единицей считается единица силы света и через нее уже выражают единицы для F', В' и Е', посколь- ку эталон силы света изготовить гораздо проще, чем эталон светового потока. Ранее за единицу силы света принималась международная свеча; соответствую- щие эталонные источники (угольные лампы) хранились в ряде национальных лабораторий. Недавно была введена новая единица, называемая свечой (св)\ по- следняя определяется как одна шестидесятая силы света на квадратный санти- метр от абсолютно черного тела при температуре затвердевания платины (~2042° К). Значение силы света для излучения различного спектрального состава должно оцениваться с помощью описанной выше процедуры с учетом кривой спектральной чувствительности глаза. Единица светового потока называется люменом. Она соответствует свето- вому потоку, посылаемому внутрь единичного телесного угла однородным то- чечным источником с силой света в 1 свечу. Величина единицы освещенности зависит от выбранной единицы длины. Метрической единицей освещенности является люкс (лк), называемый иногда метр-свеча; она соответствует освещенности площади в 1 квадратный метр, на которую падает световой поток в 1 люмен. Единицей яркости служат свеча на квадратный сантиметр, называемая стильбом (сб), и свеча на квадратный метр — нит. Иногда применяют и другие единицы, определения которых и их связь с рассмотренными здесь единицами можно найти в специальных книгах по фотометрии, 4.8.2. Диафрагмы и зрачки**). Количество света, достигающее простран- ство изображения оптической системы, зависит не только от яркости предмета, но и от размеров оптических элементов (линз, зеркал) и диафрагм. Диафрагма представляет собой отверстие, обычно круглое, в непрозрачном экране. Этот экран не пропускает лучи, претерпевшие сильную аберрацию. В этом разделе *) В русской литературе термины «яркость», «сила света» и «освещенность» употребля- ются как для величин, связанных со световым восприятием В, Г и Е', так н для соответствую- щих энергетических величин В, I и Е. (Прим ред.) • **) Теория диафрагмы была развита Аббе [41] и обобщена Рором [42].
182 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЙ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ. 4 под термином «диафрагмы» мы будем понимать не только отверстия в экране, но и края линз и зеркал. Рассмотрим все лучи, исходящие из осевой точки предмета Ро. Диафрагма, определяющая поперечное сечение пучка, формирующего изображение, назы- вается апертурной диафрагмой. Для определения се положения необходимо найти параксиальное изображение каждой диафрагмы в части системы, пред- шествовавшей ей; изображение, которое видно из точки Ро под наименьшим уг- лом, называется входным зрачком. Реальная диафрагма, изображением которой является входной зрачок, является апертурной диафрагмой. (Если эта диа- фрагма находится перед первой поверхностью, то она совпадает с входным зрач- ком.) Угол 290, под которым виден диаметр входного зрачка из точки Ро, назы- вается угловой апертурой со стороны предмета или просто угловой апертурой (рис. 4.33). Изображение апертурной диафрагмы той частью системы, которая нахо- дится за этой диафрагмой (или изображение входного зрачка всей системой), Входной Входной, люк зрачок Выходной, Выходной зрачок люк Рис. 4.33. Диафрагмы и зрачки. называется выходным зрачком; угол 2Gi, под которым виден его диаметр из точ- ки Р1г можно назвать угловой апертурой со стороны изображения (или углом проекции системы). В пучке лучей, исходящих из каждой точки предмета, всегда имеется луч, проходящий через центр входного зрачка; он называется главным (или опорным) лучом пучка и играет важную роль в теории аберраций. В отсутствие аберраций главный луч проходит также через центры апертурной диафрагмы и выходного зрачка. Если апертурная диафрагма находится на задней фокальной плоскости той части системы, которая предшествует этой диафрагме, то входной зрачок рас- положен ,в бесконечности и> все главные лучи в пространстве предмета будут параллельны оси. Такая система называется телецентрической со стороны предмета. Если апертурная диафрагма находится на передней фокальной пло- скости той части системы, которая следует за этой диафрагмой, то выходной зрачок лежит в бесконечности, и все главные лучи в пространстве изображения будут параллельны оси; в этом случае система называется телеценЬгрической со стороны изображения. Телецентрические системы используются при измере- ниях размеров предметов. Если параметры системы, за исключением величины угловой апертуры, фиксированы, то последняя определяет количество света, проходящего через систему. Имеются и другие величины, часто используемые для описания «све- тосилы» оптической системы, например числовая апертура (Ч. А.) объектива микроскопа. Последняя определяется как произведение синуса от половины угловой апертуры со стороны предмета на показатель преломления среды в про- странстве предмета, т, е, Ч.А. = я sine». A3)
§ 4.8] ФОТОМЕТРИЯ. АПЕРТУРЫ ОПТИЧЕСКИХ СИСТЕМ 183 Подходящей мерой, характеризующей светосилу систем, предназначенных для работы с предметами, расположенными на больших расстояниях, например телескопов или некоторых фотографических объективов, служит так называе- мое «число F» или «номинальное фокальное отношение» *). Оно равно отношению фокусного расстояния / объектива к диаметру входного зрачка d, т. е. F = fld. A4) Так для линзы с фокусным расстоянием 10 см и апертурой 2 см величина F — 5. Такая линза называется линзой //5. Такие величины, как угловая апертура, числовая апертура и число F, которые можно считать мерой светосилы прибора, часто называют относитель- ными апертурами. Кроме апертурных диафрагм, в оптических системах существуют еще и диа- фрагмы поля зрения; они определяют ту часть поверхности протяженного пред- мета, которая отображается прибором. Рис. 4.34 иллюстрирует различие между этими двумя типами диафрагм. Диафрагма Дтртурная поля диафрагма зрения Рис. 4.34. Схема, иллюстрирующая различия между апертурной диафрагмой и диафрагмой поля зрения. Рис. 4.35. Виньетирование. Чтобы определить диафрагму поля зрения, найдем сначала изображение каждой диафрагмы той частью системы, которая предшествует ей. Изображение, которое видно из центра входного зрачка под наименьшим углом Bф„ на рис. 4.33), называется входным люком, а угол 2<р0— полевым углом или углом поля зрения. Диафрагма, которой соответствует входной люк, и является тре- буемой диафрагмой поля зрения. Изображение входного люка всей системой (или изображение диафрагмы поля зрения той частью системы, которая следует за ней) называется выходным люком. Угол, под которым виден выходной люк из центра выходного зрачка B(pi на рис. 4.33), иногда называется угловым полем изображения. Может случиться, что некоторые лучи полностью минуют линзу или ла часть ее не попадут лучи от ряда областей предмета, даже если величина апертурной диафрагмы меньше диаметра линзы. Такое срезание части пучка называется виньетированием (рис. 4.35). Подобное явление наблюдается до- вольно редко в системах, обладающих относительно малым полем зрения (на- пример, в телескопах), однако оно играет важную роль в других приборах, например в фотообъективах. Иногда при конструировании оптических приборов используют эффект виньетирования для уничтожения нежелательных внеосе- вых аберраций. 4.8.3. Яркость и освещенность изображений. Рассмотрим теперь кратко соотношения между основными фотометрическими величинами, которые ха- рактеризуют излучение в пространствах изображения и предмета. *) В русской литературе обычно используется обратная величина dlf, называемая «све- тосилой». {Прим. ред~)
184 ГЕОМЕТРИЧРСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [гл. 4 Предположим, что предметом служит небольшой элемент плоскости 650, перпендикулярный к оси и излучающий по закону Ламберта. Тогда фотометри- ческая яркость Во не зависит от направления. Количество энергии bF0, падаю- щей в единицу времени на кольцевой элемент входного зрачка с центром на оси, равно 8Fe = Bocasyr,bS0bQo, A5) где 6Q0 = 2nsinVo6vo. A6} a 7d— угол, который образует луч, проходящий через кольцо, с осью. Следова- тельно, если, как и раньше, обозначить половину угловой апертуры со стороны предмета через Уо, то полный поток энергии, проходящей в единицу времени через входной зрачок, будет определяться соотношением Fo = 2яВ„ 650 jj sin у„ cos 70 dfe = геД, bSos\r? 6„. A7) о Поток энергии Ft, выходящей из выходного зрачка, можно выразить ана- логичным образом, а именно F1 = nB1l)Sis\n2ei. A8) Величина Гх не может превышать величину Fo и может лишь равняться ей, если в системе отсутствуют потери из-за отражения, поглощения или рассея- ния; следовательно, B^itfGjSS^BoSin^eoSS,,, A9) Отношение 6Sx/6S0 равно квадрату поперечного увеличения М: §гм: B0) Если предположить, что система удовлетворяет условию!синусов D.5.6), то Подставляя B0) и B1) в A9), получим B^inJn.fB,. B2) Из B2), в частности, следует, что в случае, когда показатели преломления в пространствах предмета и изображения равны между собой, фотометриче- ская яркость изображения не может превышать фотометрическую яркость предмета и равна ей, только если потери в системе пренебрежимо малы. Предполагая, что эти потери ничтожны, находим из A8) и B2) \ f1 = n(n1//i0)aB06S1sina01, B3) т. е. фотометрическая освещенность Ег= Fi/6St на осевой точке изображения Рг равна Ег = п (п,/я0J Ва sin2 Qt. B4) При ех<^ 1 телесный угол Qt, под которым виден выходной зрачок из точки Ри примерно равен я sin2 6Ь так что B4) можно записать в виде Ег = К/п,J Во Qv B5) Эта формула" получена для аксиального изображения; однако аналогичное вы- ражение можно вывести и для неаксиального изображения. Если обозначить через ф! угол, образованный главным лучом CQi с осью (рис. 4.36), то вместо B5) мы получим E1 = {njnoyB0Q[cos(f1, B6) где Qi— телесный угол, под которым выходной зрачок зиден из точки Qlr
§ 4.9] МЕТОД ПОСТРОЕНИЯ ХОДА ЛУ.ЧПЙ ' 185 С помощью (9). можно написать Q;/Q, = cos ф, (CPJC-QJ* = cos3 qjj, B7) т. е. ^-(я./гд'В.Й^оз'ф,. B8) Полученное выражение говорит о том, что в случае, когда предмет излучает согласно закону Ламберта и отсутствуют потери в системе, а половина угловой, апертуры Oj мала, освещенность в некоторой точке изображения пропорциональна четвертой сте- пени косинуса от угла, образо- ванного главным лучом, проходя- щим через эту точку, с осью. При использовании выве- денных ранее формул необходи- мо помнить, что они были по- ' I Плоскость лучены с помощью законов гсо- Выходной. изображения метрической оптики. Эти фор- зрачок мулы могут оказаться неспра- рис 4 36. Освещенность в точке внеаксиального. всдливыми для очень маленьких изображения, источников. Например, изобра- жением точечного источника является не точка, а яркий диск, окру- женный кольцами (диск Эйри, см. п. 8.5.2); в этом случае свет распределен по всей дифракционной картине, и, следовательно, величина освещенности в гео- метрическом фокусе меньше той величины, которая получается из формулы B4). § 4.9. Метод построения хода лучей *) При конструировании оптических приборов траектории световых лучей нужно определять с гораздо большей точностью, чем та, которую дает паракси- альная оптика. Для этого следует воспользоваться алгебраическим анализом, учитывающим в разложении характеристической функции члены более высо- кого порядка малости (см. гл. 5). Другой способ, позволяющий с помощью элементарной геометрии более точно определять траектории световых лучей состоит в последовательном применении закона преломления (или отражения); этот метод, который будет сейчас кратко изложен, называется методом построе- ния хода лучей; он находит широкое применение на практике. 4.9.1. Наклонные меридиональные лучи**). Рассмотрим сначала ход наклон- ного меридионального луча, т. е. луча, выходящего из точки, не лежащей на оси. Пусть А — полюс первой поверхности системы. Предположим, что это преломляющая сферическая поверхность радиуса г с центром в точке С, кото- рая разделяет среды с показателями преломления п и п'. Падающий луч ОР (рис. 4.37), лежащий в меридиональной плоскости, характеризуется углом U, образованным им с осью, и расстоянием L = АВ между полюсом А и точкой В, в которой данный луч пересекает ось. Пусть / — угол между падающим лучом и нормалью -PC. Соответствующие величины, относящиеся к преломленному лучу, отмечены штрихами. *) Для более полного ознакомления с методом построения хода лучей см., например,. [43—45]. В работе [46] описан метод построения хода лучей с помощью электронных вычисли- тельных машин, в работе [47] был предложен метод построения хода лучей, пересекающих несферические поверхности; см. также [481. **) Здесь, в п. 4.9.2 и в § 4.10 будут использоваться общепринятые в данном случае обоз- начения и правило знаков. Правило знаков для углов отличается от декартова правила знаков, употребляемого в остальных разделах книги, и приводится к нему, если положить U=—у*
186 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ. 4 Здесь будет использоваться следующее правило знаков: величины г, L и U считаются положительными, если С, В я В' расположены справа от А (предполагается, что лучи падают слева). Углы U и U' положительны, если можно совместить ось с лучами РВ и РВ' путем ее поворота по часовой стрелке соответственно вокруг В и В' на угол, меньший 90=. Углы / и /' положительны, если можно совместить падающий и преломленный лучи с нормалью PC путем поворота по часовой стрелке вокруг точки падения Р на угол, меньший 90°. р Рис. 4.37. Обозначения, применяемые при построении хода наклонного меридионального Луча. Предполагается, что величины L и U, характеризующие падающий луч, заданы и нужно вычислить L' и ?/'. Полагая также, что как L, так и г конечны, из треугольника РСВ получим sinJ=^~-s'mU. A) Закон преломления дает - sin/' =-^sin/. B) Из рисунка следует, что ?/' = ?/ + /_/'. C) И, наконец, из треугольника РСВ' находим Итак, последовательно применяя законы преломления A) — D), мы получили величины L' и W, характеризующие преломленный луч РВ'. Преломленный луч РВ' является падающим относительно второй поверх- ности. Если написать L\ вместо L', О[ вместо U' и обозначить соответствующие величины через L2, U% (L2 отсчитывается от полюса второй поверхности), то мы получим уравнения перехода Lt = L[—d, E) U, = U[, F) где d>0-—расстояние между полюсами первой и второй поверхностей. Подставим теперь величины E) и F) в уравнения A) — D). Решая эти уравнения относительно штрихованных величин, мы находим ход луча, про- шедшего вторую поверхность. Многократно применяя законы преломления и уравнения перехода, мы получим значения величин U и U', относящихся к лучу в пространстве изображения. После этого можно найти точку пересече- ния этого луча с плоскостью изображения. Практически, конечно, строят ход не одного, а нескольких, специально выбранных лучей; их точки пересечения с плоскостью изображения позволяют судить о работе данной системы. Если одна из поверхностей (скажем, й-я) является зеркалом, то соответст- вующие формулы можно формально получить из уже выведенных, положив щ— —яй. Тогда величину dh следует считать отрицательной. Более того, все величины показателей преломления последующих сред и соответствующие зна- чения d также нужно считать отрицательными до места второго отражения, когда они снова становятся положительными,
4.93 МЕТОД ПОСТРОЕНИЯ ХОДА ЛУЧЕЙ 187 Рассмотрим теперь два частных случая, которые мы исключали до сих пер. Если падающий луч параллелен оси системы (L =оо), то вместо уравнения A) следует использовать соотношение sin/ = У/г, G) где У — расстояние от луча до этой оси (рис. 4.38, а). в' dj Рис. 4.38. Ход лучей в оптической системе. а - падение лучей параллельно оси G.= от), б—падение лучей на плоскую поверхность {/¦=<»>. В случае плоской поверхности {г =оо) вместо A)—D) мы имеем следую- щую систему уравнений (рис. 4.38, б): I~—U, (8) p I в U' >-^ —с В' sin V =^ sin U, ¦L. Учитывая (9), уравнение A1) можно представить в виде j iп' cos V , (9) A0) (И) (lla) который удобнее A1) при расчетах, если углы малы. Полезно определить также координаты (У\, Zh) точки падения Ри на k-ю поверхность и расстояние Dh— PuPh+i между точками падения на соседние поверхности (рис. 4.39). V, В'ъ Рис 4 ЗэЛХод наклонного меридионального луча, проходящего через две соседние прелом- ляющие поверхности. Из рисунка видно, что У* = rk sin (?/* Yl Выразив L'k, через Yh, Zh и U'k, находим A2) A3) A4) A5)
1 88 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ. 4 Этим соотношением можно пользоваться для проверки величин, вычисленных с помощью A1а) или A1). В частном случае, когда значение L^ равно бесконечности, ?/&= 0, и соот- ношения A2)—A5) остаются справедливыми. Если гй=оо, то величину. Fft можно вычислить из выражения Y\ = Lkt%Uk, A6) a Zjj равно нулю. 4.9.2. Параксиальные лучи. Если угол между направлением луча и осью достаточно мал, то d полученных ранее формулах можно заменить синусы от различных углов на сами углы. Тогда эти формулы переходят в формулы параксиальной оптики. Последние используются на практике для вычисления гауссова увеличения и фокусного расстояния системы. Поэтому здесь будет дана краткая их сводка. Принято обозначать величины, относящиеся к параксиальной области, маленькими буквами. Тогда законы преломления A)—D) запишутся следую- щим образом: 1 = '-^и, A7) *" = ?'. A8) • u' = u + i — i', A9) l'=~r + r. B0) Уравнения перехода E) и F) примут вид tt = n-d, B1) Щ = и\ B2) Из G)—(На) можно аналогичным образом получить соотношения параксиаль- ной оптики для случаев L = do и г= оо. Согласно A2) уравнение параксиальной оптики для высоты точки падения, которое потребуется в дальнейшем, имеет вид У к = гк («*+ ik). B3) Хотя в соотношения A7)—B0) входят углы, образованные падающим и пре- ломленным лучами с осью, величина /' не зависит от них. Этот результат, установленный в п. 4.4.1 другим способом, следует из настоящих формул, если из них исключить i, V и и!. Оказывается, что величина ы тоже исчезает, и окон- чательно получим (?НD) B4) Это уравнение совпадает с соотношением Аббе D.4.7). Для определения попе- речного гауссового увеличения М необходимо построить лишь параксиаль- ный луч, выходящий из осевой точки предмета. Тогда, согласно D.4.54), М-%%' B5) где индексы 1 и / относятся к первой и последней средам. Фокусное расстояние системы }' можно получить, если построить паракси- альный луч на любой заданной высоте уи исходящий от бесконечно удаленного предмета. Тогда уравнение сопряженпого луча в пространстве изображения, отнесенное к системе координат с началом во втором фокусе, имеет вид ytIZt — = — u'h а из D.3.10) следует, что /'--g. B6)
§ 4.9] МЕТОЛ ПОСТРОЕНИЯ ХОДА ЛУЧЕЙ 189 4.9.3. Косые лучи. До сих пор мы рассматривали только лучи, лежащие в меридиональной плоскости. Сейчас мы кратко исследуем прохождение косых лучей, т. е. лучей, не компланарных с осью. Построение траекторий таких лучей весьма трудоемко и обычно проводится лишь при конструировании систем с очень большими апертурами. Будем теперь характеризовать луч направляющими косинусами и коорди- натами точки, в которой он пересекает определенную поверхность системы. Выберем в полюсе Л] первой поверхности прямоугольную систему координат с осью Z, направленной вдоль оси системы. Пусть Lx, Mx, Nx (Lf+ M\-\- N\ = -¦ 1)— направляющие косинусы луча, падающего в точку PX(XU Yu Zx) (рис. 4.40). Y, *>*>Щ4> Ci \ \ Рис. 4.40. Построение хода косого луча.4 Первый шаг состоит в вычислении косинуса угла падения 1,. Если г(— радиус первой поверхности, то направляющие косинусы нормали в точке Рх равны так что cos /, =Lxrr+ AM?, + N.N, -= Nx- -~ (L1X1 + M1Y1 + tfxZx). B7) Следующий шаг состоит в определении направляющих косинусов L[, M[, N[ преломленного луча. Это делается в два приема. Сначала вычисляется косинус угла преломления с помощью закона преломления в форме n'cos/;=]/n'2—п-+ п* cos4v B8) Затем учитывается, что преломленный луч лежит в плоскости падающего луча и нормали к поверхности. Если обозначить через sb s[ и Si единичные век-' торы в направлениях падающего луча, преломленного луча и нормали к пре- ломляющей поверхности, т. е. векторы с компонентами (Lu Mi, N±), (L[, M'lt N[) и (Lb Mi, Nt), то из условия компланарности получим s^^ + UjSi, B9) где Ji ri |x— некоторые скалярные функции. Для определения Лиц. умножим сначала B9) скалярно на Sj и используем соотношения (см. рис. 4.40) s,-s| = =¦= cos (Л— /i) и s-sx= cos Д. Получим COS (Д — /0 = % + [Л COS Iv Затем, умножая B9) скалярно на Si и учитывая соотношения Si-Si= cos I\ и srSi= cos 11, находим cos I[ = X cos /j + (x, Из двух последних соотношений следует, что « sin /, п ¦ 1 . , ,, ¦ - , . %'^ iETT = F • V- = т> <л cos Л-л cos Л>,
190 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ. 4 и из B9) получаем три уравнения для направляющих косинусов преломленного луча, а именно n'M[ = nM1 — aY1, > C0} n'N'l = nNl—a(Zl—r1), J где a = -^-(n'cos/;—ncos/J. C1) Таким образом, с помощью уравнений B7), B8), C0) и C1) мы определили тра» екторию луча, прошедшего через первую поверхность. Преломленный луч можно теперь считать падающим относительно второй поверхности. Выбирая систему координат с началом в полюсе второй поверх- ности Аг и осями, параллельными осям первой системы, получим уравнения перехода для направляющих косинусов в виде ?, = /,;, Mt = M[, Ni = N[. ' C2} Пусть d —- расстояние А-,А2 между полюсами первой и второй поверхно- стей. Обозначая через Xt, Yf, Z\ координаты точки Ри отнесенные к системе с началом в точке Аг, получим уравнения перехода для координат в виде Х,+ = Х„ Yt = Yu Z\^Zx-d. C3) Далее необходимо определить координаты (Х2, Yu Z2) точки Р2, в которой преломленный луч пересекает вторую поверхность. Если D — расстояние меж- ду Рг и Р2> то Xt<=Xi + LtD, Ya = Yt + M2D, Zt = Zi + NtD. C4) При определении D используется то обстоятельство, что Р% лежит на второй ' поверхности. Пусть га— радиус этой поверхности; тогда Xl + Yl + Zl—2Z2r2 = 0. C5) Подставляя C4) в это выражение, получим уравнение для D D* — 2FrJ) + Gr^0, C6} где F = N%-±-{LtXi + MtYi + N&), ) \ C7) ]-2Zi. j Уравнение C6) дает следующее значение D, если учесть, что для осевого луча D=d: D = rt[F-y F*-j-G). C8) Подставляя полученное выражение для/) в C4), находим координаты точки Р2, И, наконец,(Для завершения цикла вычислений следует найти косинус угла падения /2 на второй поверхности. Он определяется из выражения, совершенно аналогичного B7), а именно cos / -= N. (L,X., + M.Y, + NiZt), C9) г* * ' или с учетом C4) и C8) — cos/, = /¦—i-D- |/f2—~G. D0) Таким образом, последний шаг состоит в вычислении выражений D0), C8) и C4),
§ 4.10] ОПТИЧЕСКИЕ СИСТЕМЫ С НЁСФЕРИЧР.СКИМИ ПОВЕРХНОСТЯМИ 191 Из-за больших трудностей, возникающих при построении хода произволь- ных косых лучей, иногда ограничиваются случаем косых лучей, находящихся в непосредственной близости от выбранного главного луча. Построение хода таких лучей можно осуществить с помощью упрощенных методов (см. [49, 501), сходных с методами, использованными при построении хода параксиальных лучей, и пригодных для определения положения сагиттальной фокальной по- верхности, §4.10. Оптические системы с несферическими поверхностями В подавляющем большинстве оптических систем используются линзы и зеркала, поверхности которых имеют форму плоскости, сферы или параболои- да. Выбор таких простых форм связан в основном с теми практическими труд- ностями, которые встречаются при изготовлении более сложных поверхностей с высокой степенью точности, необходимой в оптике. Использование поверхно- стей простой формы накладывает, естественно, ограничение на характеристики обычных оптических систем. Поэтому в некоторых системах применяют поверх- ности более сложной формы, называемые асферическими, несмотря на трудно- сти, встречающиеся при их изготовлении. Еще в 1905 г. Шварцшильд [511 рассмотрел класс объективов телескопов *), состоящих из двух несферических зеркал, и показал, что такие системы можно сделать аггланатическими. В 1930 г. гамбургский оптик Бернард Шмидт сконструировал телескоп нового типа, состоящий из сферического зеркала и соответствующим образом рассчитанной асферической линзы, помещенной в центр кривизны зеркала. Оказалось, что такая система (она рассмотрена более подробно в § 6.4) обладает замечательными свойствами. С помощью этого телескопа удается сфотографи- ровать на одной пластинке очень большой участок неба, в сотни раз превышаю- щий но размерам участок, который можно сфотографировать при использова- нии телескопов обычной конструкции. С тех пор камера Шмидта стала очень важным инструментом при астрономических наблюдениях. Асферические сис- темы, в которых используется принцип камеры Шмидта, применяются также в некоторых телевизионных приемниках проекторного типа (см., например, [52J), в рентгеновской фотографии с флуоресцирующим экраном и в некоторых скоростных спектрографах с'низкой дисперсией. Асферические поверхности находят также полезное применение в микроскопии (см. § 6.6). Если одну из поверхностей какой-либо центрированной системы сделать асферической, то в общем случае можно добиться полного осевого стигматиз- ма; с помощью двух асферических поверхностей любую центрированную- систему можно сделать в общем случае апланатической. В этом разделе бу- дут выведены формулы, необходимые при конструировании таких по- верхностей. 4.10.1. Получение осевого стигматизма**). Рассмотрим лучи, выходящие из осевой точки предмета Р. В общем случае лучи из различных зон выходного зрачка пересекают ось в различных точках пространства изображений. Пусть 5<01 — последняя поверхность системы и О — осевая точка этой поверхности (рис. 4.41). Покажем, что, подбирая форму поверхности 5'0>, можно полностью скомпенсировать отклонение пучка лучей, формирующих изображение, от гомоцентричности; иными словами, покажем, что, заменяя поверхность Sc0) новой поверхностью S, можно в общем случае добиться пересечения всех лучей в пространстве изображения с осью в любой заданной точке Q. *) Позднее были построены два телескопа такого типа: один с апертурой 60 см в Индиаа- ском университете и второй с апертурой 30 см в Университете Брауна. '*) Описанными здесь методами мы обязаны Вольфу и Предди [53, 54J. Аналогичные формулы были получены Лунебергом [23].
192 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ. 4 Из симметрии следует, что достаточно рассматривать только меридиональ- ные лучи. Каждый луч, падающий на последнюю поверхность, характеризуется следующими параметрами: углом U, который он образует с осью, и расстоя- нием Н = ОМ от начала координат до точки пересечения луча с осью Y (см. рис. 4.41): удобно пометить все лучи. Пусть i— любой подходящий параметр, например угол ?/0, образованный лучом с осью в пространстве предмета, или Рис 4.41. К расчету формы асферической поверхности, обеспечивающей осевой стигматизм. высота точки пересечения луча с первой поверхностью. Тогда пучок полностью характеризуется двумя функциональными соотношениями U = U(t), H=--H{t). (l) Можно предположить, что t = 0 для осевого луча. В общем случае мы не внаем явного вида соотношений A); однако методом построения хода лучей можно получить таблицу значений U и Н для любого заданного набора значе- ний t. Пусть W — волновой фронт пучка, проходящий через точку О (см. рис. 4.41), а /V— точка пересечения луча, идущего из точки М, еэтой поверх ностью. Предполагая, что можно найти скорректированную поверхность S с требуемыми свойствами, получим, что в исправленной таким образом системе оптическая длина пути от Л' до Q равна оптической длине пути от О до Q. Сле- довательно, если Т (Y, Z) — точка пересечения луча с S, то [NT] + tTQ] = [OQ]. B) Обозначая через п показатель преломления среды, расположенной перед по- верхностью S, и через п'— показатель преломления среды в пространстве изо- бражения, получим *) [NT]= [MT] — [MN] =nZ sec U — [MN], \ [TQ] =n' V(L'-Zf + (H-Ztg Uf, ) [OQ]-=n'L', } где L'— расстояние от О до Q. Оптическую длину пути [MN], входящую в выражение для [NT], такж' можно вычислить с помощью заданных величин. Применяя инвариантное соот- ношение Лагранжа C.3.1) к линии, образованной отрезком ОМ оси У, отрезком MN луча и кривой N0 на волновом фронте W, получим J ns.rfr+ \ ns-dr + -\j ns-dr = Q, (i) ОМ MN NO где s — единичный вектор вдоль луча и dr — элемент пути интегрирования. C) *1 Как и в п. 4.9 Л, считается, что угол U положителен, если можно совместить ось с лучом путем поворота по часовой стрелке вокруг осевой Точки на угол, меньший 90°,
§ 4.19] ОПТИЧЕСКИЕ СИСТЕМЫ С НЕСФЕРИЧЕСКИМИ ПОВЕРХНОСТЯМИ 193 Далее, из рис. 4.41 следует, что я < \ ns-dr = —л \ sin U dfi = —п \ sin U —л- dtt ом а о > E) мл l no ) тогда D) принимает вид г Г ИИ [MN] ~=n \ sin U -?-dt. F) о Таким образом, величина [MN] выражается через интеграл F), который можно численно проинтегрировать с помощью таблицы значений U и Н *). Подставляя C) и F) в B), получим следующее уравнение для Z: AZ°"+ 2Ш cos U + Ш cos2 U <= 0, G> где = пг Г sin U ^-dt — n'3 (L' cos С/ + Н sin t/) + лл7/, с (8) % = п'%Нг — [п \ smU —ц-dt jf л \ sin (У —y-dt + 2n'L' Следовательно, Из рис. 4.41 видно, что Y = H-ZtgU. A0) Перед корнем в выражении (9) необходимо взять положительный знак, так как Z= ?/ = # = 0 при НО и мы полагаем, что U положительная величина (см. рис. 4.41). Наконец, комбинируя (9) и A0), получим Z-\-iY = ^-^-е 'и-\-1п. A1) Последнее соотношение является точным параметрическим уравнением асфери- ческой поверхности S, выраженным черен свободный параметр t. Представляет интерес частный случай, когда фокус Q лежит на бесконеч- ности (V =оо). При выводе соответствующих формул учтем, что величины S3 и if содержат L' только в первой степени. Следовательно, при достаточно боль- ших L' Л% 1 Аг%* В пределе при L'-^oo выражение (Ц) сводит-ся к dH A2) б Мы рассмотрели только случай, когда асферическая поверхность является последней в системе. Однако использованный нами метод можно применить и к *) Конечно, величину [MN] можно псиосредсгвеино вычислить методом построения хода лучей, если воспользоваться тем, что оптическая дляпа пути от Р до /V рпвна оптической длине пути от Р до О. Это дает [MN]=IPO]~[PMI. 13 м. Ьррн, Э. Вольф
194 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ (гл. 4 расчету асферической поверхности, находящейся внутри оптической системы. В этих случаях вычисления значительно более громоздки, и поэтому мьких не будем рассматривать в настоящей книге *). 4.10.2. Получение апланатизма **). Мы показали, что, используя в системе одну асферическую поверхность, можно добиться точного осевого стигматизма. Рассмотрим теперь случай двух асферических поверхностей, позволяющих не только получить осевой стигматизм, но и обеспечить выполнение условия синусов. Пусть S и S'— две асферические поверхности, форму которых необходимо определить. Предположим, что в данной системе между ними нет никаких по- верхностей ***). Однако они могут быть отделены от точек предмета и изобра- жения любым количеством преломляющих или отражающих поверхностей. Как и раньше, мы ограничимся только окончательной корректировкой системы, У к Рис. 4.42. К расчету формы двух асферических поверхностей системы, обеспечивающей апла- натизм. предполагая, что все расчетные параметры, за исключением профилей S и S\ известны. ' Выберем в полюсах О и О' поверхностей S и S' начала двух прямоугольных систем координат с осями Z, совпадающими с осью системы. Поверхность S будет рассматриваться относительно системы с началом в О, поверхность 5'—- относительно системы с началом в О'. В пространстве, расположенном до поверхности S, пучок лучей, выходя- щий из осевой точки предмета Р, характеризуется соотношением вида (рис. 4.42) H=--H(t). A3) Пучок лучен в пространстве за 5' (в исправленной системе) характеризуется аналогичным соотношением U' = U'{t'), H'=H'(t'). A4) Последние выражения можно протабулировать, строя ход лучей от выбранной осевой точки изображения Р' в обратную сторону. Бели предмет и его изображение не лежат в бесконечности, то в качестве параметров t и V выбирают синусы углов, которые образуют соответствующие лучи в пространствах предмета и изображения с осью системы s ""'¦*): ^ О' 1" \1 ^ f Если предмет находится в бесконечности, то в качестве параметра t выбирают *) Подробное исследование см. в работе [541. Другие методы описаны в статьях [56 и 56]. *'¦} Методы, описанные в настоящем разделе, разработаны Вассерманом и Вольфом [57]. ***) Обобщение на случай систем, в которых S и S' не являются соседними, сделано в работе [58]. '*<"•) Если вместо условия синусов мы хотим (в дополнение к осевому стигматизму) удовлетворить условию Гершеля, то необходимо положить i=sin [UJ2), /'=sin (UJ2)*
§ 4.10] ОПТИЧЕСКИЕ СИСТЕМ!,! С НЕСФЕРИЧЕСКИМИ ПОВРРХНОСТ^МИ 195 расстояние Но от соответствующего луча до оси в пространстве предмета; если же в бесконечности находится изображение, то t'= Ни где Нг— расстояние от соответствующею луча до оси в пространстве изображения. В обоих этих слу- чаях должно выполняться следующее соотношение, вытекающее из условия синусов: ;/r=const. A6) Нашу задачу можно теперь сформулировать так: по данным A3) и A4) найти такие формы поверхностей 5 и S', которые обеспечили бы переход пуика (U, Н) после двух последовательных преломлений на этих поверхностях в пучок (W, Н')\ кроме того, соответствующие лучи в двух пучках должны удовлетво- рять условию A6). Пусть я— показатель преломления среды до поверхности S, п'— показа- тель продолжения среды после S' и п" — показатель преломления среды, на- ходящейся между ними. Далее, пусть s — единичный вектор вдоль луча, падаю- щего в точку T(Z, Y), и s*— единичный вектор вдоль преломленного луча (см. рис. 4.42). Согласно закону преломления (см. п. 3.2.2) вектор N = «s—'MS* должен быть параллелен нормали к поверхности S в точке Т. Следовательно, если т — единичный вектор касательной в точке Т меридионального сечения поверхности S, то (ns-n's').T-O. A7) Таким образом, компоненты векторов s, s* и т будут равны s: 0, —sin U, s*: 0, —sint/*, о 9 ^' ( {Щ где U* — угол, образованный преломленным лучом XT' с осью системы, а точка обозначает дифференцирование по параметру L Уравнение A7) принимает вид п (Z cos U— Y sin U) = п* (Zcos U*-~ У sin U*). A9) Теперь, если обозначить через D расстояние между точками Т и V, через ?>,, и Dz— проекции D на оси Y и Z и через d— расстояние вдоль оси между О и О', то имеем cosU* = -^, sin G* = ^, B0) причем Dy--=Y—Y', D2=d + Z'-Z, D-^УЩ+Щ. ,21) Из рис. 4.42 следует, что Y=-H — ZigU, B2) Y'^H'-Z'tgU'. B3) Подставляя в A9) значения cos И* и sin U* из B1) и значение Y из B2), получим iZ fnDcosV—n*Dz Аналогично находим dZ' fn'D cos U'—пЮ? , , r,,\-i/dH' ?, d Уравнения B1)—B5) вместе е соотношением A6) и граничными условиями Z = Z' — 0 при t = V — 0 позволяют провести полный расчет скорректированных 13*
196 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ ОПТИЧЕСКИХ ИЗОБРАЖЕНИЙ [ГЛ. 4- профилей двух поверхностей. Так, с помощью B1) — B3) можно исключить У и У из B4) и B5); далее, используя A6), получаем систему из двух диффе- ренциальных уравнений первого порядка относительно Z и Z' вида § = f(z, z; t), d?^g(z,z\t). B6) Эту систему можно решить обычными методами *). Однако, поскольку требует- ся определить не только Z и Z', но и Y и У для выбранных значений параметра t, проще не исключать из уравнений У и У, а последовательно вычислять не- известные величины. ЛИТЕРАТУРА 1. W. R. H a m 11 t о n, Trans. Roy. Irish Acad. 15, 69 A828); 16, 1 A830); 16, 93 A831), 17, 1 A837). 2. W. R. Hamilton, Mathematical Papers, Vol. 1, Geometrical Optics, ed. by A. W. Con- way a. J. L. Synge. Cambr Univ. Press, 1931 3. H.'B runs, Abh. Kgl. Sachs, Ges Wiss., math-phys. Kl. 21, 323 A895). 4. J. L. Synge, Geometrical Optics, Cambr. Univ. Press, 1937. 5. F. Klein, Z. Math. Ph\s, 4B, 370 A901). Ji. F. Klein, Ges. Math. Abh. 2, 603 A922). 7. C. Caratheodory, Geometrische Optik, Springer, Berlin, 1937, p. 4. 8. M. H e r z b e r g e r, J. L. S у n g e, J. Opt. Soc. Amer. 27, 75, 133, 138 A937). 9. X. С Maxwell, Quart. J. Pure Appl. Math. 2, 233 A858). 10. J. С Maxwell, Scientific Papers Vol. 1, Cambr. Univ. Press. 1890. П. Н. В runs, Das Ekonal, Abh Kgl. Sachs. Ges. Wiss., math.-phys. Kl. 21, 370 A895). 12. F. К 1 e i П, Ges. Math. Abh. 2, 607 A922). 13. E. T. Whittaker, The Theory of Optical Instruments, Cambr. Univ. Press, ,1907, p. 47. 14. H. Licbmann, Sitzgsber. Bayer. Akad. Wiss., Math, naturwiss. Abt. 183 A916). 15. H. Boegehold, в сб. S. С г a p s k i, O. E p p e n s t e 1 n, «Grundzuge dcr optischen. Instrnrnente nach Abbe», Barth, Leipzig, 3rd ed., 1924, p. 213. 16. C. Caratheodory, Sitzgsber. Bayer. Akad. Wiss. Math.-naturwiss. Abt. 56, 1 A926). 17. J. Brown, Microwave Lenses, Methuen, London, 1953. 18. W. L e n z, в сб. «Pmbleme der Modernen Physik», ed by Debye, 1928, p. 198. 19. W. В 1 a s с h k e, Vorlesungen liber Differential-Geomet'rie, 4th ed. Springer, Berlin, 1945, p. 101. 20. F. К 1 e i n, Elementary Mathematics from an Advanced Standpoint, Macmillan, London, 1939, Vol. II (перевод с немецкого). 21. J. С. Maxwell, Cambr. a. Dublin Math. J. 8, 188 A854). 22. R. S tet t ler, Optik 12, 529 A955). 23. R. K. L u n e b e r g, Mathematical Theory of Optics (мимеограф), Brown Univ., Provi- dence, R. I., 1944, p. 213; печатное издание Univ. California Press, Berkeley a. Los Angeles, 1964, § 24. 24. R. F. R in eh art, J. Appl. Phys. 19, 860 A948). 25. A. F 1 e t с h e r, T. M u r p h y, A. Y о u n g, Proc. Roy. Soc. A223, 216 A954). 26. G. Тога 1 do' d i F r a n с i a, Oplica Ada 1, 157 A954—1955). 27. H. Boegehold, M. Herzbergcr, Compositio Math. 1, 448 A935). 28. M. Herzberger, Ann. New York Acad. Sci. 48, 1 A946). 29. T. Smith, Proc. Phys. Sor. 60, 293 A9-18) 30. С G. Wynne, Proc. Phys. Soc. B63, 436 A952), 31. Rayleigh, Phil. Mag " 21. 466 A886). 32. R. Glaus i us, Pugg Aim 121, 1 A864). 33. H. He 1 mho Hz, Pogg. Ann Jubelband. 1874, p. 557. 34. W. Abbe, Jenaisb. Ges Med. Naturwiss. 1879, p. 129. 35. E. Abbe, Carl. Repert Phys 16, 303 A880). 36. С Hock in, J. Roy. Micro Soc, B) 4, 337 A884). 37. J. F. W. Herschel, Phil. Trans. Roy. Soc. Ill, 226 A821). 38. С. Е. W e a t h e r b u r n, Differential Geometry of Three Dimensions, Cambr. Univ. Press, 1927, p. 185. 39. .1. W. T. W a 1 s h, Photometry, Constable, 2nd ed., London, 1953. 40. Measurement of Radiant Energy, ed. by W. E. F о r s у t h e, McGraw-Hill, N. Y., 1937. 41. E. Abbe, Jena Z. Naturwiss. 6, 203 A871). 42. M. Rohr, Zentr. Z. Opt. Mech. 41, 145, 159, 171 A920). •) Например, методом Адамса (см. 159]) или методом Рупге — Кутта (см. [60]),
ЛИТЕРАТУРА 197 43. А. Е. С о n r a d у, Applied Optics and Optical Design, Oxford Univ. Press, 1929, Pt. I. 44. M. Rohr, The Geometrical Investigation of Formation of Images in Optical Systems, Stationary Office, London, 1920 (перевод с немецкого). 45. M. Н е г z b е г g е г. Modem Geometrical Optics, Intersci. Publ., New York, 1958 46. G. В I а с k, Proc. Phys. Soc. Б68, 569 A954). 47. T. Smith, Proc. Phys. Sos 67, 286 A945). 48. W. Weinstein, Proc. Phys. Soc. B65, 731 A952). 49. H. H. Hopkins, Proc. Phys. Soc. 58, 663 A946). • 50. H. H. Hopkins, Wave Theory of Aberrations, Clarendon Press, Oxford 1950, pp.59, 65. 51. K. Schwarzschild, Astr. Mitt. Komgl. Sternwarte Gottmgen, 1905 (перепечатано из Abh. Konigl. Ges. Wiss. Gottingcn, Math Phvs. KL 4, .№ 2 A905—1906). 52. I. G. M a 1 о f f, D. W. E p s t e i n, Electronics 17, 98 A944). 53. E. W о If, W. S. Pieddy, Proc. Phys. Soc. 59, 704 A947). 54. E. Wolf, Proc. Phys. Soc. SI, 494 A948). 55. M. H e r z b e r g e г, Н. О. Н о a d 1 e y, J. Opt. Soc. Amer. 36, 334 A946). 50. D. S. Vo 1 о so v, J. Opt. Soc. Amer. 37, 342 A947). 57. G. D. Wasserma n n, E. W о 1 f, Proc. Phys. Soc. B62, 2 A949). 58. E. M. V a s k a s, J. Opt. Soc. Amer. 47, GG9 A957). 59. E. T. W h i 11 a k e r, G. R о b i n s о n, The Calculus of Observations, Blackte a. Son. Glasgow, 4th, cd., 1946, p. 363. 60. С Runge, H. Xonig, Numerisches Rechnen, Springer, Berlin, 1924.
ГЛАВА 5 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ В § 4.9 было указано, что отклонение световых лучей от траекторий, предсказанных теорией Гаусса, можно исследовать в рамках геометрической оптики либо методом построения хода лучей, либо с помощью алгебраического анализа. В последнем методе, которому посвящена настоящая глава, при разложении характеристических функций оставляются члены, содержащие более высокие, чем вторая, степени расстояний от оси. Эти члены описывают геометрические аберрации. Ранние попытки расширить теорию Гаусса связаны в основном с изобрете- нием в 1839 г. Дагерром A789—1851 гг.) фотографии. Перед практической оп- тикой, в которой до этого занимались главным образом конструированием объ- ективов телескопов, встала новая задача создания объективов с большими апер- турами и большими полями зрения. Венгерский математик Петцваль достиг большого успеха в решении этой проблемы, добавив в формулы Гаусса члены, содержащие более высокие степени углов наклона лучей относительно оси, К сожалению, его обширная монография, посвященная этому вопросу, была уничтожена ворами; все, что известно об его работе, содержится в полупопу- лярных статьях [1, 21. Петцваль доказал практическую ценность своих вычис- лений, изготовив в 1840 г. широко известный портретный объектив (показанный на рис. 6.3, б), обладавший многими преимуществами по сравнению с извест- ными тогда объективами. Наиболее раннее систематическое исследование гео- метрических аберраций, которое было полностью опубликовано, принадлежит Зайделю [3—5]; он учел все члены третьего порядка при рассмотрении общего случая центрированной системы, состоящей из сферических поверхностей.С тех пор это исследование было обобщено и упрощено многими авторами. Поскольку волновые фронты ортогональны лучам, то при отклонении пучка лучей, формирующих изображение, от гомоцентричности форма соот- ветствующих волновых фронтов отличается от сферической. Знание формы волновых фронтов играет существенную роль при более строгом исследовании аберраций, основанном на теории дифракции (см. гл. 9). По этой причине, а также из-за тесной связи между негомоцептричиостыо пучков и асферичностью соответствующих волновых фронтов мы будем рассматривать их совместно. ¦ Наше изложение будет частично основано на важной работе Шварцшильда 16] *), несколько упрощенной с этой целью. §5.1. Волновые и лучевые аберрации; функция аберраций Рассмотрим вращательно-симметричную оптическую систему. Пусть Р'„, Р[ и Рг— точки пересечения луча, выходящего из точки предмета Р„, соответ- ственно с плоскостью входного зрачка, плоскостью выходного зрачка и пло- скостью параксиального изображения. Если Р[—параксиальное изображение точки Р„, то вектор 6,= PjPi называется аберрацией луча или просто лучевой аберрацией (рис. 5.1). *) Обобщение работы Шварцшильда на системы, ие обладающие вращательной симмет- рией, проведено в статье [7].
§ 5.Ц ВОЛНОВЫЕ Т1 ЛУЧЕВЫЕ АБЕРРАЦИ; ФУНКЦИЯ АБЕРРАЦИЙ 199 Пусть W —' волновой фронт, проходящий через центр (У, выходного зрачка и связанный с пучком, который формирует изображение и выходит из точки Р„. Если аберрации отсутствуют, то W совпадает со сферой S, центр которой лежит A Pa ~-& X Плоская» прев memo. Плоскость входного зрачка Плоскость выхадн&м jpa'MH 1 или просто волновой аберрацией и счи- 1. Рис. 5.1. Плоскость предмета, плоскость изображения и плоскости зрачкбв. в точке параксиального изображения Р\, а сама она проходит через точку С[. S называется опорной сферой Гаусса (рис. 5.2). Пусть Q и Q — точки пересечения луча Р^ с опорной сферой и волновым фронтом W соответственно. Оптическую длину пути Ф — [QQ] можно назвать аберрацией волнового элемента в точке Г тать положительной, если Q и Р, рас- положены по разные стороны от Q. В обычных приборах волновые аберра- ции достигают 40—50 длин волн, од- нако в приборах, используемых для более точных исследований (напри- мер, в астрономических телескопах или микроскопах), они должны быть значительно меньше, порядка долей длины волны. Выражения для волновой аберра- ции легко получить с помощью точеч- ной характеристической функции Га- мильтона системы. Если, как и раньше, пользовать- ся для обозначения оптической длины пути квадратными скобками I.. J, то ф-= [QQ] —[p\Q] — [PoQ] — [PoQ] — [p<iO'i]- <-!) Здесь было использовано то обстоятельство, что точки Q и 0[ лежат на одном волновом фронте, т. с. [P0Q] = lP0OIi- Введем две прямоугольные системы координат со взаимно параллельными осями, начала которых находятся в осевых точках 0„ и Ог плоскостей предмета и изображения, а оси Z совпадают с осью системы. Точки в пространстве пред- мета будут рассматриваться в первой системе, а в пространстве изображения — во второй. Z-координаты плоскостей, в которых лежат зрачки, обозначены че- рез А, и D, (на рис. 5.1 ?>,<0). Согласно A) волновая аберрация выражается через точечную характери- стику V следующим образом: Ф = У(Х0, УЛ, 0; X, У, Z)-V(X0, Y., 0; 0, 0, -?>х), B) Рис. 5.2. Волновая и лучевая аберрации.
200 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 5 где (Хо, Ко) —• координаты точки Ро и (X, У', Z) — координаты точки Q. Коор- динаты (X, У, Z) уже не являются независимыми; они связаны соотношением, учитывающим, что точка Q лежит на опорной сфере, т. е. (X — X'xf + (Y — Y{)'+Z* = R-. C) Здесь х; = мхг„ у; = му„ D) — координаты точки Р1 параксиального изображения, М — гауссово попереч- ное увеличение и R — радиус опорной сферы Гаусса R = (X?-+Y?+D*y>*. E) Величину Z в выражении B) можно исключить с помощью C), в результате чего Ф станет функцией только *) Хо, Уо, X и Y, т. е. Ф = Ф(Х0, Уо; X, Y). Лучевые аберрации связаны с функцией аберраций Ф(Х0, Y„; X, Y) про- стыми соотношениями. Из B) имеем dX ~ dX + SZ ' dX ¦ ^ ' Если И], pj и Yi— углы, которые образуют луч QPt с осями, а (X, Y', Z) и (Хи Vii Zi) — координаты точек Q и Рь то, согласно D.1.7) и рис. 5.2, получим -|^- = W; cos a, = п, Xl~X , -||- = «lcosv1=— пг-|-,, G) где Я' ={(X1-XJ + (У, —yy + Z»}»/» (8) есть расстояние от Q до Pi и nt— показатель преломления среды в пространстве изображения. Далее из C) имеем SZ _ Л—-Х! /о\ 5А ~~ z ¦ у ' Подставляя G) и (9) в соотношение F), находим для компонент лучевой аберрации и аналогично > A0) v _f«_ R' дф 1 > r» ~~ n, av • Последние соотношения являются точными, но стоящая справа величина R' сама зависит от координат точки Ри т. е. от лучевых аберраций **). Тем не менее для большинства практических целей R' можно заменять на радичс опорной сферы R или на другое приближенное выражение (см. ниже, уравне- ние A5)). Легко показать, что в силу симметрии задачи величина Ф зависит or четырех переменных, входящих только в трех комбинациях, а именно: X|-f- + Y%, X2+ Y2 и ХоХ + YoY. В самом деле, если ввести в плоскостях XY по- лярные координаты, т. е. положить X0=r0cos90, ,X = rcos6, yo=r0sm80, y=rsin6, A1} -то окажется, что Ф зависит только от г0, 0О> г и, 6, или, что то же самое, ф зависит от г0, г, 0О—0 и 0. Предположим теперь, что оси X и У систем с нача- лами в О„ и Ог поворачиваются на один и тот же угол и в одном и том же направ- *) Вольф [8] ввел более общую функцию аберраций, удобную для исследования отобра- жения протяженных предметов. , •*) Несколько отличная пара точных уравнений, связывающих лучевые и волновые аберрации, бала получена в [9].
§ 5.2] ЭЙКОНАЛ ШВАРЦШИЛЬДА 201 лении относительно оси системы. При этом г0, г и в„— 9 не изменяются, а угол О увеличивается на угол поворота. Поскольку функция Ф инвариантна относи- тельно таких поворотов, она не должна зависеть от последней переменной, т. е. зависит только от г„, г и 9„—¦ 0. Следовательно, функция аберраций Ф является функцией трех скалярных произведений A2) двух векторов гв(Х„, Yo) и r(X, Y). Отсюда вытекает, что при разложении Ф в ряд по степеням четырех коор- динат нечетные степени будут отсутствовать. Поскольку Ф @, 0; 0, 0) = 0, то членов пулевой степени тоже не будет. Более того, не будет и членов второй степени, так как, согласно A0), они соответствуют лучевым аберрациям, ли- нейно зависящим от координат, а это противоречит тому, что Р1 является парак- сиальным изображением точки Ро. Таким образом, наше разложение имеет вид Ф = с(Х;+К*)-гФ<4> + Ф<'»+... ' A3) где с — константа, а ф<2*> — полином степени 2k по координатам и содержит их только в виде трех скалярных инвариантов A2). Говорят, что член степени Ik описывает волновую аберрацию порядка 2k. Аберрации наинизшего порядка Bk -- 4) обычно называются первичными аберрациями или аберрациями Зай- деля *); они будут подробно рассмотрены в § 5.3. а > Для оценки порядка величин некоторых выражений и точности наших вычислений удобно ввести параметр j.i. Этим параметром может служить любая величина первого порядка, скажем, угловая апертура системы. Тогда можно допустить, что все лучи, проходящие через систему, составляют с оптической осью углы О (ji), где символ О (jx) означает, что величина угла порядка [г. Оценим погрешность, возникающую при замене /?' в основном уравнении A0) на величины, не зависящие от Xi и Yt. Из C) и E) имеем Z*=-D\—(X> + Y2) + 2(XXf1 + YY'l); (Щ тогда вместо (8) можем написать | Xl+Vl~2X(Xl~Xl)-2Y(Y1-Yt) У'* = A5) Соотношения A0) длд компонент лучевой аберрации принимают вид = A6а) A6б> = A7a> <17б> § 5.2. Эйконал Шваршнильда При исследовании геометрических аберраций Шварцшильд использовал метод, сходный с методом, применяемым в небесной механике при расчетах элементов орбит. В таких расчетах вводятся переменные, остающиеся постоян- ными при невозыущенном движении, а небольшие их изменения при действи- тельном движении определяются с помощью функции возмущения. По анало- •) .Эти аберрации иногда называют аберрациями третьего порядки, так как связанные с ними лучевые аберрации содержат координаты в третьей степени.
202 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 5 гии с этим методом Шварцшильд в своих работах (ссылки на них уже приводи- лись) ввел некоторые переменные, которые в приближении параксиальной оптики остаются постоянными вдоль каждого луча, проходящего через оптиче- скую систему. Затем, введя некоторую функцию возмущения, названную им эйконалом Зайделя, он исследовал изменения этих переменных, возникающие при учете членов четвертого порядка в разложении характеристической функ- ции *). Эти переменные были названы Шварщпильдом переменными Зайделя, поскольку они связаны с теми величинами, которые ранее использовал Зайдель. Функция аберраций Ф, определенная выше, тесно связана в приближении теории Зайделя с возмущенным эйконалом Шварцшильда; используя метод Шварцшильда, можно получить выражения для коэффициентов ie-гвертого порядка в разложении функции аберраций для произвольной центрированной системы. Это будет подробно проведено в § 5.5. Здесп мы определим перемен- ные Зайделя и исследуем связь между нашей функцией аберраций и возмущен- ной функцией Шварцшильда. Введем такие новые единицы длины в плоскостях предмета и параксиаль- аого изображения соответственно 1а и llt чтобы ?=Ai. A) где М — поперечное гауссово увеличение. Точки на плоскости предмета будем определять координатами х0, уа, а на плоскости изображения координатами Xi, Ух, для которых где (Хо, Fo), (Xi, У0 — обычные координаты точек Ро и Pt (см. рис. 5.1) и С — постоянная, которую мы определим позже. В приближении параксиальной оп- тики Хг= Хо И ух= у„. Координаты (Х'„, Y'o) точек пересечения луча, исходящего из (Хо, Ya), с входным зрачком связаны с лучевыми компонентами следующими соотноше- ниями: ' л о — Ко Ра Уд Yп Gf, V П%-Л-Ч 13) Соотношения для точек пересечения луча с выходным зрачком имеют совершен- но аналогичный вид. Квадратные корни в знаменателях можно в приближении параксиальной оптики заменить соответственно на п0 и пг, в результате чего мы получим линейные соотношения между координатами вида о— л"_ Ра Л1 — At_ Pi Do "о ' Oi ~ «г ' i 4) Y'«-Y*= ?„ K'-.yi=..9' ! ?>„ ч„ ' Dj n, ' } Теперь введем такие новые'единицы длины ке и Я^ в плоскостях входного я выходного зрачков, чтобы %11"к„ = М', E) где М'— поперечное увеличение входной зрачок —• выходной зрачок. Вместо *) Шварцшильд исследовал также общин вид лучевых аберраций пятою порядка. Выра- жения для соответствующих коэффициентов шестого, порядка в разложении характеристиче- ской функции (возмущенного эйконала Шварцшильда) были впервые получены его учеником Колшюттером [10]. Аберрации пятого порядка рассматривались также в работах [ll, 14] и других. Обзор теории аберраций более высоких порядков приведен в [J2].
§ 5.2] ЭЙКОНАЛ ШЕАРЦШИЛЬДА 203 Х'а, Y'o, Х[, Y[ используем следующие переменные: 1^ F) Ya__ Yd Doq0 —Xl^ — Kl. ¦ D^i ' В приближении параксиальной оптики g!= ^0, г]!= rju. Для упрощения дальнейших вычислений, удобно выбрать С в виде Ь~ D, ~ D, • <'> Другое выражение для С, часто используемое при изучении изображений с помощью тео- рии дифракции, имеет вид С = knjf, sin 90 = ¦— knj-^ sin 0ц. Здесь fe — волновое число для света в вакууме, а 290 и 29Д — угловые апертуры системы, или углы, под которыми видны входной и выходной зрачки соответственно из осевых точек пред- мета и изображения. При таком значении С имеем xo = te0XosinOo, x1=— knlXl sin0lv ya = kn0Y0 sin 90, {/!=—kniY1 sin 6^ Равенство двух правых частей в выражении G) следует из формулы Сми- та— Гельмгольца A.4.48). Величины, определенные соотношениями B) н F), являются переменными Зайделя. Нам потребуются и обратные соотношения, которые связывают старые переменные с переменными Зайделя. Решая B) и F), получим Выразим теперь функцию аберраций через переменные Зайделя. Отметим сначала, что аргументы X и Y можно заменить в функции Ф на Х\ и Y[, не из- меняя членов О (D^5) в уравнениях E.1.166) и E.1.176). Обозначив функцию аберраций, выраженную через переменные Зайделя, через ф, имеем Ф(Х0, Yo; X'v О = ф(*о. У„: li. %). (Ю) Тогда Э д 1 и, учитывая A), B), G) и E.1.4), С помощью уравнений A1) находим вместо E.1.166) и E.1.176) соотношения ^ ^ Ъ'). A2) Ранее указывалось, что в приближении теории Зайделя <р тесно связана с функцией возмущепьы, введенной Шварцшильдом и названной им эйконалом Зайделя. Эта функция определяется соотношением * = Г+-^5-{х! + Й)—^h-W + i© + *.(ii-W+».Di-1o). A3) где Т — Т (р0, q0> pu ?i) — угловая характеристика, отнесенная к системам с
204 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ (гЛ. 5 началами координат в Оа и О±. Рассмотрим теперь небольшие вариации коорди- нат. Согласно уравнению D.1.27) и условию Zo= Zi= 0, получим, что соответ- ствующее изменение Т равно 6T = Xodpe + Ytdqc-X1dpx-Y1dqu A4) или, выразив его через переменные Зайделя,— -^k dy°) ~ *• (d%i-—hrdxi — Используя последнее соотношение, находим из A3), что при малых изменениях переменных изменение г|э имеет вид d$ ^ (ii—feo)dx» + (i\i — Ло) dD» + D ~xi) dii + (Уо —Уг) di)lt A6) т. с. г); является функцией х„, у0, \и ци и поэтому получим строго К > Следовательно, зная tl\ можно простым дифференцированием найти величины лучевых аберраций как в плоскости изображения, так и в плоскости выходного зрачка. Сравнивая A7) и A2), видим, что в приближении теории Зайделя вели- чина <р — г|) не зависит от $г и ц,, т. е. <р(*„, Уо; lu ii) = *(x0, у„; ii. ni) + x(x«, ^Л-Оф^'), A8) где %(*о> t/o) — некоторая функция от х0 и t/0. Р1з определения <р следует, что (f(x0, у0; 0, 0) = 0; следовательно, % (х0, у0) — —г|з(л'о, у„; 0, 0) и <р(*о. л; ?!, ¦п1)=Ф(*и. у«\ ii. I,)—ifK. %; о, 0)-ьо(Д)г8). A9) В области применимости теории Зайделя члены в A2), учитывающие по- грешность, можно отбросить Однако если оставляются члены более высокого порядка чем четвертый, то соотношения для компонент лучевой аберрации, вы- раженные через функцию аберраций ср, принимают более сложный вид. Вместе с тем простые соотношения A7), выражающие компоненты лучевой аберрации через возмущенный эйконал, оказываются точными; однако возмущенный эйко- нал, по-видимому, не имеет простого физического смысла. Определение членов более высокого норядка чем четвертый сопряжено, за исключением простейших случаев, с очень трудоемкими математическими вы- кладками. Поэтому обычно алгебраический анализ проводится в рамках теории Зайделя, которая затем в случае необходимости уточняется с помощью метода построения хода лучей. § 5.3. Первичные аберрации (аб?ррации Зайделя) Используя рассуждения, совершенно аналогичные тем, которые относились в § 5.1 к функции аберраций, можно показать, что разложение в степенной ряд возмущенного эйконала Шварцшильда имеет в силу симметрии задачи сле- дующий вид: @D(+T|)<s>-|- ..., A) где -фBй> — полином степени Ik по четырем переменным; более того, эти пере- менные входят только в трех комбинациях: B)
§ 5.3] ПЕРВИЧНЫЕ АБЕРРАЦИИ (АБЕРРАЦИИ ЗАЙДЕЛЯ) 205 В соотношении A) отсутствует член второй степени, так как в противном случае это противоречило бы тому, что, согласно E.2.17), Xi= xa, у{ = у0, §2= |, и %= г|0 в приближении параксиальной оптики. Поскольку переменные входят только в комбинациях B), члент|зш должен иметь вид ¦ф<4) ^ — х/4Лг4 — 7<До4 — Ck* — VjDrapa + ?гг/с2 + F рак2, C) где А, В, ... — постоянные. Знаки и числовые множители в C) общепринятые; выражения для лучевых аберраций в этом случае принимают простой вид. Вы- числение аберрационных постоянных для произвольной центрированной сис- темы проводится в § 5.5. Конечно, разложение в степенной ряд функции ц> имеет такой же вид, как и A), но оно не содержит члена нулевого порядка (ф10) = 0), и главный член <f>D) отличается от ij)D) тем, что в нем отсутствует слагаемое —-т- Лг4, как это непосредственно следует из уравнения E.2.19). Таким образом, общее вы- ражение для волновой аберрации паинизшего (четвертого) порядка записывает- ся следующим образом: ФD> = — -1 Вр1 — Ск* — ~ ?>г 2р2 + F r2fi* + FpW, D) где В, С, ...— те же коэффициенты, что и в C). Подставляя последнее соотношение в уравнение E.2.12), получим общее выражение для компонент лучевой аберрации наинизшего (третьего) порядка в виде ДC)г— _ %&! /v у», I ) " л— Xj — Хо — D (Лх—Л1) — \ = х„ BС/с2—Ет2—Fp2) + It (Вр2 + Dr2—2Fk3) , j AC'i/i/;t/^(^F-) - [ t5) *—Ers—Fps) + T)! (Bpa + Z>s — Z Коэффициент А не входит в выражения D) и E), т. е. существуют только пять типов аберрации наинизшего порядка, характеризуемых пятью коэффи- циентами В, С, D, Е и F. Как указывалось выше, эти аберрации называются первичными аберрациями или аберрациями Зайделя. При исследовании аберраций Зайделя удобно выбрать оси таким образом, чтобы (глоскость уг проходила через сочку предмета; тогда ха-= 0. Если затем ввести полярные координаты \у = р sin 9, % = р cos 6, F) то D) примет вид ФD) = — -j Bp4—Cylp* cos2 в—-j Dylp2 4- Eylp cos в 4- Fyop3 cos в, G) E) — вид ; = Bps sin 0—2Fуорг sin 0 cos 0 4- Dylp sin 6, -Ey%. В частном случае равенства нулю всех коэффициентов в G) волновой фронт, проходящий через выходной зрачок совпадает (в рассматриваемом приближении) с опорной сферой Гаусса (см. рис. 5.2). В общем случае эти коэф- фициенты отличны от пуля. Тогда каждый член в G) описывает определенный тип отклонения волнового фронта от правильной сферической формы; на рис, 5.3 показаны пять различных типов аберраций. Важность лучевых аберраций, связанных с определенной точкой предмета, можно проиллюстрировать графически с помощью так называемых аберрщион~
206 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АВЕРРАЦИЙ [ГЛ. 5 ных (или характеристических) кривых. Эти кривые являются геометрическим местом точек пересечения лучей, выходящих из фиксированной зоны р = coribt выходного зрачка, с плоскостью изображения. Тогда поверхность, образован- ная аберрационными кривыми, соответствующими всем возможным значениям р, представляет собой неидеальиое изображение. Рассмотрим отдельно каждую из аберраций Зайделя *). Рис. 5.3. Первичные волновые аберрации. в—сферическая аберрация, <р = — Вр*; б — кома, q>=FyClps cos 6; в —астигматизм; <р=— Су^&9 cos2 в; г—кривизна поля, <р= 5- Оу^р*: д—дисторсия, ф=Еу„(> cos 6. I. Сферическая аберрация В (8) р ррц нием В, равны нулю, то (8) принимает вид Если все коэффициенты, за исключе- (9) Аберрационные кривые в этом случае имеют форму концентрических окруж- ностей, центры которых расположены в точке параксиального изображения, а радиусы пропорциональны третьей степени радиуса зоны р, но не зависят от положения (у0) предмета в поле зрения. Такой дефект изображения называется сферической аберрацией. Сферическая аберрация, будучи независимой от т/с искажает как осевые, так и внеосевые точки изображения. Лучи, выходящие из осевой точки предмета и составляющие существенные углы с осью, пересекут ее в точках, лежащих перед параксиальным фокусом или за ним (рис. 5.4). Точка, в которой пересе- каются с осью лучи от края диафрагмы, называется краевым фокусом. Если экран в области изображения помещен под прямым углом к оси, то существует такое положение экрана, при котором кругогое пятно изображения па нем ми- нимально; это минимальное «изображение» называется наименьшим кружком рассеяния. II. Кома (F ф 0). Аберрация, характеризующаяся отличным от нуля коэффициентом F, называется комой. Компоненты лучевой аберрации в этом *) Аберрационные кривые, соответствующие аберрациям более высокого поряжка, рас- сматривается* в работах A3, 141,
§ 5.3) ПЕРВИЧНЫЕ АБЕРРАЦИИ (АБЕРРАЦИИ ЗАЙДЕЛя) 207 случае имеют, согласно (8), вид д<з)х = _ 2Fр2у„ sin 9 cos 9 = — />,,р2 sin 29, "| Л™у = — Fp%, A+2 cos* 9) = — Fyop' B + cos 29). I Как мы видим, при фиксированных у„ и радиусе зоны р точка Рг (см. рис. 5.1) при изменении 9 от 0 до 2л: дважды описывает в плоскости изображения окружность. Радиус окружности равен \Ь'у„р1\, а се центр находится ли рас- стоянии 2/г(K1/,, от параксиального фокуса в сторону отрицательных значений у. С тедовательно, эта окружность касается двух прямых, проходящих чере) параксиальное изображение Я, и составляющих с осью у углы в 30°. Если (> пробегает вес возможные значения, то совокупность подобных окружностей образует область, ограниченную отрезками этих пря- мых и дугой наибольшей аберрационной окружности (рис. 5.5). Размеры получающейся области линейно Плоскость выхвднвга зрачки. Рис. 5.4. Сферическая аОеррация Плоскость параксиального изоопежетш Рис. 5.5. Кома. возрастают с увеличением расстояния точки предмета от оси системы. В § 4.5 было показано, что при выполнении условия синусов Аббе система дает резкое изображение элемента плоскости предмета, расположенного в непосредственной близости от оси. Следовательно, в этом случае разложение функции аберрации не может содержать члены, линейно зависящие от у„. Отсюда вытекает, что если условие синусов выполняется, первичная кома отсутствует. III. Астигматизм (С ф 0) и кривизна поля (D Ф 0). Аберрации, характе- ризующиеся коэффициентами С иО, удобнее рассматривать совместно. Если все остальные коэффициенты в (8) равны нулю, то Чтобы продемонстрировать важность таких аберраций, предположим вна- чале, что пучок, формирующий изображение, очень узок. Согласно § 4.6 лучи такого пучка пересекают два коротких отрезка кривых, одна из которых (тангенциальная фокальная линия) ортогональна меридиональной плоскости, а другая (сагиттальная фокальная линия) лежит в этой плоскости. Рассмотрим теперь свет, исходящий от всех точек конечной области плоскости предмета. Фокальные линии в пространстве изображения перейдут в тангенциальную и сагиттальную фокальные поверхности. В первом приближении эти поверхно- сти молено считать сферами. Щсть Rt и ^s— их радиусы, которые считаются положительными, если соответствующие центры кривизны расположены по ту сторону от плоскости изображения, откуда распространяется свет (в случае, изображенном на рис. 5.6, Rt>0 и i?s<C0). Радиусы кривизны можно выразить через коэффициенты С и D. Для этого при вычислении лучевых аберраций с учетом кривизны удобнее использовать обычные координаты, а не переменные Зайделя. Имеем (рис. 5.7)
208 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 5 где и — малое по величине расстояние между сагиттальной фокальной линией и плоскостью изображения. Если v— расстояние от этой фокальной линии до оси, то Rf^vs + (Rt~uf, или Если считать и величиной первого порядка малости, то v можно заменить на Плавкость вшивного зрачка Рис 5.6. Тангенциальная и сагиттальная фокальные поверхности. Рис. 5.7. Астигматизм и кривизна ПОЛЯ Yt, а в последнем уравнении отбросить и2; тогда если еще пренебречь и по сравнению с Du то из A2) находим Аналогично 3)У ^' ^1 * 1 A3) A4) A5) Запишем теперь эти соотношения через переменные Зайделя. Подставляя в них E.2.6) и E.2.8), полечим A6) и аналогично дек х — - В последних двух соотношениях у, можно заменить на у0 и тогда, используя A1) и F), получим 2BС О -^-2n,D. A8) Величину 2С + D обычно называют тангенциальной кривизной поля, величину D — сагиттальной кривизной ноля, а их полусумму ?), A9)
§ 5.3] ПЕРВИЧНЫЕ АБЕРРАЦИИ (АБЕРРАЦИИ ЗАЙДЕЛй) 209 которая пропорциональна их среднему арифметическому значению,— просто кривизной поля. Из A3) и A8) следует, что на высоте Ki от оси расстояние между двумя фокальными поверхностями (т. е. астигматическая разность пучка, формирую- щего изображение) равно Полуразность B1) называется астигматизмом. В отсутствие астигматизма (С = 0) имеем /?,= = Rs~ R. В п. 5.5.3 будет показано, что радиус R общей, совпадающей, фо- кальной поверхности можно в этом случае вычислить с помощью простой фор- мулы, в которую входят радиусы кривизны отдельных поверхностей системы и показатели преломления всех сред. IV. Дисторсия (Е Ф 0). Если в соотношениях (8) отличен от нуля лишь коэффициент Е, то Д<3>а: = 0, А<3)у = — Еу1 B2) Поскольку сюда не входят координаты р и 9, отображение получится стигма- тическим и не будет зависеть от радиуса выходного зрачка; однако расстояния точек изображения до оси не будут пропорциональны соответствующим рас- стояниям для точек предмета. Эта аберрация называется диапорсией. При наличии тако аберрации изображение любой прямой в плоскости предмета, проходящей через ось, будет прямой линией, но изображение любой другой прямой будет искривленным. На рис. 5.8, а показан предмет в виде Уо 1 СТ. У] -и L L а) 6) Рис. 5.8. Дисторсия. о —предмет; 6—бочкообразная дисторсия <? > 0), в — подушкообразная дисторсия (Я < 0). сетки прямых, параллельных осям х и у и расположенных на одинаковом рас- стоянии друг от друга. Рпс. 5.8, б иллюстрирует так называемую бочкообразную дисторсию (?>0), а рис. 5.8, в—подушкообразную дисторсию (Е<С<У). Ранее указывалось, что из пяти аберраций Зайделя три (сферическая, кома и астигматизм) нарушают резкость изображения. Две другие (кривизна поля и дисторсия) изменяют его положение и форму. В общем случае невозмож- но сконструировать систему, свободную как от всех первичных аберраций, так и от аберраций более высокого порядка; поэтому всегда приходится искать какое-то подходящее компромиссное решение, учитывающее их относительные величины. В некоторых случаях аберрации Зайделя можно существенно умень- шить за счет аберраций более высокого порядка. В других случаях необходимо полностью уничтожить некоторые аберрации, несмотря на то, что при этом по- являются аберрации других типов. Например, в телескопах должна быть пол- ностью устранена кома, потому что при наличии ее изображение будет несим- метричным и все прецизионные астрономические измерения положения поте- 14 М. Борн, Э. Вольф
210 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ {ГЛ. 5 ряют смысл. С другой стороны, наличие некоторой кривизны поля и дисторсии относительно безвредно, поскольку от них можно избавиться с помощью соот- ветствующих вычислений. До сих пор мы изучали аберрации только в рамках геометрической оптики. Однако если аберрации малы {волновые аберрации порядка длины волны или меньше), то становятся существенными дифракционные эффекты, В этом случае геометрическая теория должна быть дополнена более тонкими исследованиями, что и будет сделано в гл. 9. § 5.4. Теорема сложения для случая первичных аберраций Продемонстрировав важность первичных аберраций, мы должны присту- пить к решению гораздо более трудной задачи, состоящей в вычислении коэф- фициентов первичных аберраций для случая произвольной центрированной системы. Как было показано, это эквивалентно определению членов четвертого порядка в разложении возмущенного эйконала Шварцшильда. Чтобы не пре- рывать основных вычислений, удобно вначале рассмотреть зависимость возму- щенного эйконала системы от возмущенных эйконалов, связанных с отдельными поверхностями системы. Рассмотрим центрированную систему, состоящую из двух поверхностей вращения, и пусть О0— осевая точка предмета, а Ох и О2— се параксиальные изображения, создаваемые соответственно первой и обеими поверхностями. Пусть далее Т, = Т1{р0, <?„; ри gt) x A} — угловая характеристика для преломления первой поверхностью, а T, = rt(p,. Яп pt. Я,) B> — угловая характеристика для преломления второй поверхностью, причем Тг рассматривается относительно координатных систем с началами в О0 и 01т а Т2— относительно координатных систем с началами в d и О2; оси X и Y этих систем взаимно параллельны, а оси Z направлены вдоль оси системы. Поскольку среда считается однородной, угловая характеристика представляет собой оптическую длину пути между основаниями перпендикуляров, опущен- ных из обоих начал координат на начальный и конечный отрезки луча (см. рис. 4.3). Следовательно, угловая характеристика системы Т, отнесенная к системам с началами в Оо и О2, равна сумме Тг и Га, т, е. Г = 7\ + Г,. C) Переменные plt qx в этом выражении, относящиеся к лучу в промежуточном пространстве, нужно исключить, пользуясь формулами, которые описывают отображения каждой из поверхностей. Это удобно сделать в явном виде в соот- ветствующих выражениях для возмущенного эйконала. Согласно E.2.13), возмущенные эйконалы ^ и -фа имеют внд *i = Тг + "TtV W + ^ ~ Т%- (Х? + № + Х" & — ?°) + У* ^1 — По) а возмущенный эйконал ¦ф системы — вид Следовательно, на основании C) имеем
"§ 5.5] ПЕРВИЧНЫЕ АБЕРРАЦИИ ДЛЯ ЦЕНТРИРОВАННОЙ СИСТЕМЫ ЛИНЗ 211 или, используя E.2.17), Ih_,,, , ,h , *l'i dih | Э-фд. ftj), ^-^+^-^-^- + -5^-^-. D) Подставив в D) разложения в степенные ряды величин гр! и гр2, получим (напомним, что, согласно E.3.1), члены второго порядка отсутствуют) 1|> = 1|>г» + 1Й» + 1Й'>+ ¦?»+..., E) где точки означают члены шестого и более высокого порядков. Очевидно, что в выражениях для ^} и г|;(г4) мы имеем право заменить аргументы их гауссо- выми значениями. Таким образом, переменные, относящиеся к промежуточному пространству, можно исключить с помощью следующего правила: заменить ёь Tli на 12, -па в $[*> (х„, у0; U, тц) и xL, yL на х0, у0 в тр<« (хи уп |2, тJ) и по- лученные выражения сложить. В результате получим \рш как функцию четы- рех переменных х„, у а и |а, гJ, что и требовалось. Проведем теперь это исклю- чение более подробно. Согласно E.3,3) у W= —± Ajl—^Btfi—CiKb — Dflpl + EfPcb + FrflKb \ где где r* Заменяя |i, т|1 на \z\ цг и Xi, уг на х0, ^,, т, е, р* на р2, rj на г0 и 6ia на ко^=х„1г + у„г\„ (8) находим после сложения —i- (Dx + D%) rjjpl + (?-!+ E,) Tpclt + {Ft + F,)«&. ' (9) Сходный результат, конечно, получится и для произвольной центрированной системы, состоящей из любого числа поверхностей. Таким образом, мы доказали следующую теорему. Каждый коэффициент первичной аберрации для любой центрированной системы равен сумме соответствующих коэффициентов для отдельных ее по- верхностей. Именно здесь особенно отчетливо видна практическая полезность пере- менных Зайделя, поскольку этот простой, но важный результат можно полу- чить при использовании указанных переменных и он не имеет аналога для обычных переменных, § 5.5. Коэффициенты первичных аберраций произвольной центрированной системы линз Сформулированная в предыдущем параграфе теорема позволяет свести задачу о нахождении коэффициентов первичных аберраций произвольной цент- рированной системы к вычислению соответствующих коэффициентов для о> дельных ее поверхностей. Проведем теперь эти вычисления.
2J2 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 5 5.5.1. Формулы Зайделя, выраженные через параметры двух параксиаль- ных лучей. Напомним, что коэффициенты аберраций Зайделя равны (с точ- ностью до постоянных множителей) коэффициентам при членах четвертого по- рядка в разложении возмущенного эйконала Шварцшильда г|з. Согласно E.2.13) эта функция получается, если к угловой характеристике Т прибавить некоторые квадратичные члены, а результирующее выражение записать в пе- ременных Зайделя. Поскольку переменные Зайделя и лучевые компоненты связаны линейными соотношениями, порядок членов при такой замене пере- менных не изменится. Следовательно, Ф*Чх„ у.; Si, ¦4i) = 7441(pJ, <?<,; Pi, ?,)• (i) Разложение угловой характеристики для преломляющей поверхности вра- щения до членов четвертого порядка малости включительно было проведено в § 4.1. Согласно D.1.42) члены четвертого порядка можно записать в виде *) l + q!K- B). Удобно расположить осевые точки предметами их параксиального изображения 1 в г = о, и г=в1 и положить (рис. 5.9> Плавкость Плоскость f = aI + D1. C) Обозначим через К и L соот- ветствующие инварианты Аббе (см. D.4.7)) \ зрачки Плоскость Плашеть еыхойногв параксшлшого nJ\lr — \lS) = nA\lr—\ls'\ = К. зрачка. изобретения u ' lv/ ' ' ' D) Рнс. 5.9. К вычислению коэффициентов первичной ,. . .... ,. . ,,ч , аберрации. ПлA/Г—l/t) = n1(i/r—l/t ) — L. E) Прежде чем подставлять выражения для лучевых компонент, записанные в переменных Зайделя, в A), удобно переписать это соотношение в несколько иной форме. Согласно D) имеем Подставляя это выражение в B), получим qjy- F) Переменные в F) можно заменить на их параксиальные значения; в част- ности, переменные Зайделя, относящиеся к точкам на падающем и преломлен- ном лучах, можно поменять местами. Тогда для получения tyu> как функции *) Как и в § 4.1, г обозначает радиус -кривизны преломляющей поверхности. Его не сле- "дует путать с символом г, который обозначает инвариант вращения j/xo + f/o' введенный в E.3.2).
§ 5.5] ПЕРВИЧНЫЕ АБЕРРАЦИИ ДЛЯ ЦЕНТРИРОВАННОЙ СИСТЕМЫ ЛИНЗ 213 *oi сУо, Si и rii можно использовать вместо E.2.9) соотношения Полезно провести еще одну модификацию. Гауссовы поперечные увеличения предмет — изображение (IJl^) и входной — выходной зрачки (XJK0) можно определить из D.4.14) и D.4.10) или просто из тех соображений, что отображе- ние сферической поверхностью является проекцией из центра соответствующей сферы. Тогда с улетом D) получим la r — s tijs ' Хо~ r — t ~ nif ' ' Вводя обозначения h — ht—hiL и . '' 1Ч\ п - d(> - о, • " - г.аП, ~ v7 • V> где были использованы соотношения (8) ilE.2.7), перепишем G) в виде ft w\ /ft Н Если, как и раньше, обозначить через г2, р2 и к8 три инварианта вращения • i* = x\ + yl, j P2 = S! + n!. «• = *.Si+y,ri,, A1) то члены в фигурных скобках в соотношении F) примут вид (А. - Р ( = НЧ* ]l — (К — L) р] + йгрУС — 2ft/f««L, Подставляя эти соотношения в F) и используя A), получим окончательное выражение для i|jM) _ /. (/C_i) (j^-sjp)} -4-р-А-ЯА- {Д.(«„-nj + /И. (^L-jip)}. A2)
214 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 5 Эта формула, если ее сравнить с общим выражением E.3.3), дает коэффи- циенты разложения четвертого порядка А, В, ...,'F возмущенного эйконала преломляющей поверхности вращения. Теперь нетрудно обобщить этот результат на случай произвольной центри- рованной системы, состоящей из любого числа преломляющих поверхностей. Отметим индексом i величины, относящиеся к i-й поверхности, и пусть я,—¦ показатель преломления среды, расположенной за i-й поверхностью. Тогда, используя теорему сложения из § 5.4 и сравнивая A2) с формулой E.3.3), находим в Ч5 Это и есть формулы Зайделя для коэффициентов первичных аберраций произ- вольной центрированной системы преломляющих поверхностей *). Соотношения A3) выражают коэффициенты первичных аберраций через величины, характеризующие прохождение двух параксиальных лучей через систему, а именно одного луча, выходящего из осевой точки предмета, и дру- гого— выходящего из центра входного зрачка. Полезно сделать сводку соот- ветствующих формул Гаусса. Пусть dt—• расстояние между полюсами i-й и (г + 1)-й поверхностей. Поскольку параксиальное изображение первыми I поверхностями системы служит предметом для (t + 1)-й поверхности, можно написать следующие формулы перехода: ! = si—du tn.1 = t'i—dl. A4) При заданных расстояниях St и 4 от плоскости предмета и плоскости входного зрачка до полюса первой поверхности можно с помощью соотношений Аббе — \/s\) = Ко A5) и формулы A4) последовательно вычислить расстояние srlt t\, s2, 4. s'2, f2, и соответствующие значения Ki, Lu K%, Ls, ... Необходимо также определить величины ht и Hi. Если положить для простоты длину л.о в плоскости входного зрачка равной единице и использовать соотношения D;= t't—s\= ti+1—st+l, то из (9) следует, что величины hi и Я; можно последовательно вычислить с *) Фактически Зайдель исследовал системы, состоящие только из сферических поверх - аостей. Эффекты иесферичности (характеризующиеся постоянными Ь() были учтены позднее (см. [17]),
,§ 5.5] ПЕРВИЧНЫЕ АБЕРРАЦИЯ ДЛЯ ЦЕНТРИРОВАННОЙ СИСТЕМЫ ЛИНЗ 215 помощью уравнений *) Из формул (9) и из соотношений Аббе D) н E) находим следующее выражение, которое может служить для проверки вычислений и понадобится нам позже: и И — *'*' = s'ltl = ' п'п1 n^^tt-s,) n^t's') tt—Щ) nity'i—s'i) Li — Ki' 5.5.2. Формулы Зайделя, выраженные через параметры одного параксиаль- ного луча. Часто представляется желательным выразить коэффициенты пер- вичной аберрации в такой форме, которая наиболее отчетливо показывает их зависимость от параметров оптической системы; формулы A3) непригодны для этой цели. Чтобы воспользоваться ими необходимо, в соответствии с законами параксиальной оптики, построить ход двух лучей, один из которых выходит из осевой точки предмета, а другой — из центра входного зрачка. Зайдель, од- нако, показал, что параметры второго луча можно исключить, т. е. выразить коэффициенты первичных аберраций только через параметры первого луча. Естественно, в формулах останется величина, зависящая от положения вход- ного зрачка, поскольку ясно, что изменение положения соответствующей диафрагмы влияет на аберрации. Для исключения величин, относящихся к лучу из центра входного зрачка, необходимо прежде всего выразить расстояния от оси Я,- через ht. Из A4), A6) и A7) имеем tf.-+i fli __ 1 н h- (*i+1 ^Л * н fid- ( ) — ^г A8) Если положить ff( = *i»n (.19) то из A8) следует, что k,+, = k, + У" —т-l B01 где, согласно A6), 1 ft, /I0Sj Другие величины в A3), характеризующие параксиальный луч из центра входного зрачка, также легко выразить через параметры другого луча. Из A7) и A9) имеем Далее в соответствии с A5) и B2) мы можем написать llfSf nt-lsl !/L ! ^ /931 *) Из соотношения hi + Jhi=s; + 1ls1 следует, что h/ пропорционально расстоянию от оси, на котором параксиальный луч, выходящий из осевой точки предмета, пересекает t-ю поверх- ность. Соотношение Я,-+]/Я,-=^ + 1/^ интерпретируется таким же образом для параксиального луча, выходящего из центра входного зрачка.
216 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ [гл. 5 Подставляя A9), B2) и B3) в A3), окончательно получим 1 1 L J____J \ \+h\kjKi /J_ B4) Это и есть требуемая форма соотношений Зайделя. Координаты входного зрачка содержатся только в коэффициенте klt который связан с расстоянием it от плоскости входного зрачка до полюса первой поверхности выражением B1). Величины S,, s/, Ki и /i; вычисляются, как и раньше, с помощью соответствую- щих формул A4) — A6), а величины kt— с помощь о B0). 5.5.3. Теорема Петцваля. Из выражений для коэффициентов астигматизма и кривизны поля можно вывести интересное соотношение, полученное впервые Петцвалем. Учитывая A5), имеем -D= уБ {[A 2 Ц. B5) Согласно § 5.3 коэффициенты С и D определяют сагиттальную и тангенци- альную кривизны поля. Если обозначить через я„ показатель преломления по- следней среды, то из уравнений E.3.18) и E.3.19) получим пLL Следовательно, B5) можно представить в виде Ц {27) Таким образом, мы получили соотношение, связывающее кривизны двух фо- кальных поверхностей, которое содержит только радиусы кривизны прелом- ляющих поверхностей системы и соответствующие показатели преломления. Если система свободна от сферической аберрации, комы и астигматизма, то на поверхности радиуса Rs= Rt= R получается резкое изображение; радиус этой поверхности, согласно B7), можно найти из соотношения Полученный результат называется терремой Петцваля.
§ 5.6! пример: первичные аберрации тонкой линзы 217 Условие X - Г- -1=0 • B9> называется условием Петцваля. Оно служит необходимым условием того, что поле будет плоским. Однако следует помнить, что оно справедливо лишь в рам- ках теории Зайделя; вне этих рамок оно теряет свое значение. Сферическая поверхность, касающаяся двух фокальных поверхностей в их обшей осевой точке и имеющая радиус R, определенный B8), называется по- верхностью Петцваля независимо от наличия аберраций. Согласно B7) и B8) радиусы кривизны сагиттальной фокальной поверхности, тангенциальной фо- кальной поверхности и поверхности Петцваля связаны между собой соотно- шением $5.6. Пример: первичные аберрации тонкой линзы Используем теперь формулы Зайделя для нахождения коэффициентов. первичных аберраций тонкой линзы с показателем преломления п, располо- женной в воздухе (вакууме). В этом случае /гр=П,= 1, nl = n. A) Поскольку толщиной линзы d можно пренебречь, то, согласно E.5.14), имеем s2=s;, B> и E.5.15) дает l/r1—l/sI=rt A/^—1^) = /^, \ лA//-,-1/а,)=.A/г,-1/яЭ = /С.. /. W Далее, учитывая B), получим из E.5.16) и E.5.20) hl — ht = h, k1 = ka — k, \ гДе I /лч. \ <4> Линзу удобно характеризовать несколькими простыми параметрами. Пусть 5s—оптическая сила линзы (см. уравнения D.4.35) и D.4.36)), т.е. 5>=1// = (п—1)A//-,—1/а,), E> и пусть а = (ге— l)(l/rx+ l/ra). F> Из C) имеем (n_i)l=4.-f. (ft-i)l=i-4-. G> Г1 Si Sl Г1 S2 Sa так что с учетом B) 1/s;—1/Sl = ^>. (8) Перепишем это соотношение в виде здесь %' играет для линзы ту же роль, что и К для одной поверхности. Соот- ветственно величину % мы будем называть инвариантом Аббг линзы. Позднее будет показано, что коэффициенты деформации bi и b2 двух по- верхностей линзы входят в формулы лишь в комбинации Р-=(я-пD—V); \ Г1 Г2 / эту величину можно назвать коэффициентом деформации линзы,
218 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 5 Выразим теперь величины, входящие в формулы Зайделя E.5.24), через параметры !р, а, р и X. Первые три параметра характеризуют линзу, а послед- ний — положение предмета. Сначала получим из C) Далее 4 ж., п 2п 2 ; Подставляя эти соотношения в формулы Зайделя E.5.24), находим следующие выражения для коэффициентов первичных аберраций тонкой линзы: B=h*U, 1 2 ? = hW + 3ft2A2V + A где ¦t/ = 7r p + 8(n_i)i ^3~ A3) Здесь мы рассмотрим только случай совпадения входного зрачка с линзой (ti= 0). Согласно D) имеем ft=—1, fe = 0, л формулы A3) принимают вид ^^ ^(С-Л)=-1^ A5) ? = 0. ) Таким образом, величины U и V, определенные A4), характеризуют сфе- рическую аберрацию и кому линзы с диафрагмой, расположенной в ее плоско- сти. В такой линзе отсутствует дисторсия (Е = 0), однако всегда имеются ас- тигматизм и кривизна поля (С Ф- 0, D ф 0). Выясним, существует ли для такой линзы пара апланатических точек (В = F = 0). Согласно A5) кома будет отсутствовать, если 1/ = 0, или f^r)a + B«+l)» = 0. A6) Тогда из (9) найдем расстояние до предмета sx 1 1±l n—1)Bл + 1) °* A/' При таком выборе sa сферическая аберрация линзы полностью определена. Следовательно, в общем случае для линзы с диафрагмой, лежащей в плоскости линзы, не существует пары апланатических точек. Однако если заданы только S1 и 0, то сферическую аберрацию можно устранить, выбрав подходящий ко- эффициент деформации [3.
§ 5.6] ПРИМЕР? ПЕРВИЧНЫЕ АБЕРРАЦИИ ТОНКОЙ ЛИНЗЫ 219 Если же заданы Si и фокусное расстояние / = UP, то можно так подобрать радиусы Гг и rs, чтобы исчезла кома. В этом случае, согласно E), F) и A7), имеем 1 2«+1 1 n» \ г, /i+l Sl + «!-l''1 I A8) 1 _2«+1 1 Ф — п— 1 | ra "~n+l s, + л* — ] J * / Если, например, предмет находится в бесконечности (si= оо) и п = 1,5, то <; ri = -9"|f = -g"/> гг — ~ ~<р — ~~ 5f- A9) На рис. 5.10 изображена такая линза, свободная от комы. Рис. 5.10. Тонкая линза, свободная от комы. ХДредмет находится в бесконечности, Ct и С3—.центры кривизны поверхностей линзы. Сферическую аберрацию можно теперь устранить подходящим выбором р, Если предмет находится в бесконечности, то, согласно (9), % = — 5V2 и, сле- довательно, из A6) имеем а — Bп + 1) (п— 1Mъ/(п + 1); тогда из условия отсутствия сферической аберрации U = 0 получим следующее выражение для §: ИЛИ При ге"= 1,5 имеем Р = -|5", B1) так что из A0) и A9) находим 7296, + Ь2 = —540. B2) Последнее соотношение выполняется, например, при bi= Ь2= — 0,74. Можно вместо устранения комы попытаться сначала уменьшить сфериче- скую аберрацию. Оказывается, что в случае положительного фокусного рас- стояния линзы сферическая аберрация исчезает полностью лишь тогда, когда предмет находится в определенной, ограниченной области пространства; при п = 1,5 эта область простирается от 0,36 / до 0,44 f за линзой. При любом другом положении предмета некоторая сферическая аберрация всегда имеется. Для устранения кривизны поля необходимо использовать диафрагму, по- мещенную в соответствующее место, которое можно определить из общих фор- мул A3). Для линзы с положительным фокусным расстоянием и п = 1,5 удается устранить кривизну поля, только если предмет находится в области, прости- рающейся от точки, удаленной на одно фокусное расстояние перед линзой, до точки, удаленной на половину фокусного расстояния за линзой. Для системы, состоящей из нескольких линз, вычисления становятся зна- чительно сложнее и основная задача состоит в устранении хроматической абер- рации. Относительно просто исследовать первичные аберрации ахроматиче- ского объектива телескопа, состоящего из двух склеенных тонких линз; ока- зывается, что в этом случае все первичные аберрации, кроме астигматизма и и кривизны поля, можно устранить, следовательно, такой объектив годится только для узкого поля зрения (не более 3° для системы //10),
220 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 5 § 5.7. Хроматическая аберрация произвольной центрированной системы линз Хроматическая аберрация была уже кратко рассмотрена в § 4.7. Здесь же с помощью общего формализма, развитого в предыдущих параграфах *), будут получены в явном виде выражения для хроматизма положения изображения и хроматизма увеличения системы. Предположим, что для монохроматического света система полностью скорректирована. Такое предположение допустимо, если исследуются только основные эффекты, так как можно считать, что изме- нения монохроматических аберраций при небольших изменениях длины волны малы по сравнению с самими аберрациями; в общем случае эти изменения имеют те же порядки величин, что и члены, отброшенные в теории Зайделя. Согласно E.5.14) и E.5.15) имеем п,_, A/г,— 1/s,.) = п,{Цг,— l/sl) = /С„ (I) sl+J = s;—d,, B) Если обозначать изменение какой-либо величины при малом изменении 61 длины волны через 6^.то из A) и B) находим 6s(' 6s; _ /fin,- 6rt;-i 6s,+i~6s;. D) Умножая (З) на h\ и используя соотношение "Й? T' - E) получим Пусть а — число поверхностей в исследуемой оптической системе. Тогда, складывая все уравнения вида F), имеем Так как положение предмета не зависит от длины волны, 6si= 0, и мы получа- ем следующее выражение для хроматической аберрации 8sa положения изоб- ражения: Рассмотрим теперь хроматическую аберрацию увеличения системы М, Имеем Согласно E.5.8) li-l П\ Si y и поэтому ") Здесь мы снова, по существу, следуем анализу Шварцшильда J.6J,»
§ 5.7] ХРОМАТИЧЕСКАЯ АБЕРРАЦИЯ ЦЕНТРИРОВАННОЙ СИСТЕМЫ ЛИНЗ _ 221 Беря логарифмическую производную, получим 6Л1Йя08па . Сумму, входящую в это выражение, перепишем в виде V &, /1 i-Л = у *1ф. = у %ir^- (Г» ^' «-» / ы% s's-> Й s? '"" Но из E.5.18) следует, что и, следовательно, или, перегруппировав члены с kt, Переписав второй член в правой части этого соотношения с помощью D) и E), а последний — с помощью (б), получим Подставляя это выражение в A0) и используя тот факт, что 6si— 0, имеем Однако, согласно E.5.15) и E.5.22) и, следовательно, окончательное выражение для хроматического изменениябМ увеличения системы будет иметь вид 6М fSna 6na\ , 6stt А .,, „ /6п/ 6^-^ ' .... ———- I — . I —4 > (I /С, Л .' I ••—~ ————— 1 \1 1 § М \ "о ««У ьа —/а ^ V «1 »(-J Если, как это обычно бывает на практике, показатели преломления сред в пространствах предмета и изображения одинаковы, то первые два члена в пра- вой части A1) пропадают. Если система ахроматизирована относительно поло- жения изображения, то 6sa (определенная в G)) тоже исчезает, и мы получаем следующие два условия, обеспечивающие отсутствие хроматических искажений
222 ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ положения изображения и увеличения системы: 0 A2) Для тонкой линзы, находящейся в воздухе, мы можем, используя соответст- вующие формулы из § 5.6, написать эти суммы в виде где h, k и оптическая сила SP линзы определены D), E.6.4) и E.6.5). Тогда, под- ставляя A4) в G) и A5) в A1), найдем соответствующие выражения для хрома- тических искаягений положения изображения и увеличения линзы, ЛИТЕРАТУРА 1. J. Petzval, Bericht fiber die Ergebnisse einiger dioptrischer Untersuchungen, Pesth, 1843. 2. J. Petzval, Bericht tiber optische Untersuchungen, Ber. Kais. Akad. Wien, Math, natur- wiss KI. 24, 50, 92, 129 A857). 3. L. S e i d e i, Astr. Nachr. 43, № 1027, 289 A856). 4. L. Seidel, Astr. Nachr. 43, Л» 1028, 305 A836). 5. L. S e i del, Astr. Nachr. 43, № 1029, 321 A856). 6. K. Schwarzschlld, Abh. Konigl. Ges. Wis. Gottingen. Math.-phys. Kl. 4, N 1, 2, 3 A905—1906). Перепечатано в журнале Astr. Mitt. Konigl. Sternwarte Gottingen A905). 7. Г.Д. Рабинович, ЖЭТФ 16, 161 A946). 8. E. Wolf, J. Opt. Soc. Amer. 42, 547 A952). 9. J. L. R а у ces, Optica Acta, 11, 85 A9G4). 10 A. Kohlschiitter, Dissertation, Gottrngen, 1908. 11. M. H e r z b e r g e r, .1. Opt. Soc. Amer. 29, 395 A939); Modern Geometrical Optics, Inter- sci. Publ. New York, 1958. (M. Гер ибер гер, Современная геометрическая оптика,. ИЛ, 1962.) 12. J. F о с к е, в сб.: eProgr. in Optica», vol. 4, ed. E. Wolf, North Holland Publ. Co., Amster- dam; a. New. York, J. Wiley, a. Sons, N. Y., 1965, p. 1. л 13. G. С Steward, Trans. Cambr. Phil. Soc. 23, 235 A926). ¦ 14. N. Cha ko, Trans. Chalmers Univ. Technology, Gothenburg №. 191 A957). 15. M. R о h r, Geometrical Investigation of Formation of Images in Optical Systems. Stationery Office, London, p. 344 (перевод с немецкого). ¦
ГЛАВА 6 ОПТИЧЕСКИЕ ПРИБОРЫ, ФОРМИРУЮЩИЕ ИЗОБРАЖЕНИЕ В трех предыдущих главах мы познакомились с геометрической теорией оптического отображения, пользуясь главным образом законами параксиаль- ной оптики и теорией Зайделя. Исключительно велика ценность этого раздела оптики, позволяющего описывать принципы работы оптических приборов в наглядной форме. Качество оптических систем нельзя оценить при помощи одной только теории Гаусса, но она позволяет указать назначение отдельных оптических элементов, так что часто можно получить ясное, хотя и несколько- упрощенное представление о действии системы без глубокого проникновения в сложную технику оптических расчетов. Совершенствование оптических приборов в прошлом происходило непре- рывно^ по мере того, как преодолевались технические трудности. Однако два. обстоятельства не позволяют дать последовательное описание конструкций оптических систем. Во-первых, простая теория не указывает на пределы при- менимости данного устройства; в каждом отдельном случае требуется длитель- ный анализ, часто содержащий утомительные вычисления. Во-вторых, трудно- сти практического характера часто могут препятствовать использованию полез- ного устройства. В приводимом ниже обзоре нет указаний на практические и теоретические положения, ограничивающие применение тех или иных уст- ройств; в нем излагаются только основные принципы работы наиболее важных оптических приборов, что необходимо для понимания более строгой теории фор- мирования оптического изображения, которой посвящены последующие- главы *), §6,1. Глаз Вероятно, простейшим оптическим прибором можно считать устройство, состоящее из одной собирательной линзы, дающей действительное изображение предмета на светочувствительной поверхно- сти. Примерами таких оптических систем слу- жат фотоаппарат и глаз (рис. 6.1). Дно глаз- ного яблока **), называемое, сетчаткой, со- стоит из слоя светочувствительных элементов. Поскольку глаз часто входит как составная часть в оптическую систему, изучение его ха- рактеристик весьма существенно для инстру- ментальной оптики. Этот параграф содержит Рис' е-1- Глаз человека- описание некоторых особенностей глаза. Преломление света в глазе происходит главным образом на его внешней1 поверхности — роговой оболочке, или роговице, а также на поверхностях хру- сталика, находящегося позади способной к сокращению радужной оболочки (ириса). Последняя определяет апертурный диаметр, величина которого в со- отвегствии с полным световым потоком, попадающим в глаз, может изменяться непроизвольным мышечным усилием, приблизительно от 1,5 до 6 мм. Хруста- *) Более полное описание оптических приборов можно найти, например, в П—4]. **) Для детального знакомства с физиологической оптикой мы отсылаем читателя к клае» сическому труду Гелшгольца [5] и к книге Соуталла [6].
224 ОПТИЧЕСКИ? ПРИБОРЫ, ФОРМИРУЮЩИЕ ИЗОБРАЖЕНИЕ [ГЛ. 6 лик имеет форму двояковыпуклой линзы с плотностью (а следовательно, и по- казателем преломления), снижающейся по направлению к периферии, что уменьшает создаваемую им сферическою аберрацию (см. § 5.3). Средняя вели- чина показателя преломления хрусталика равна 1,44, тогда как у стекловид- ного тела, находящегося между хрусталиком и сетчаткой, она составляет 1,34, т. е. близка к показателю преломления воды. Радиус кривизны хрусталика может изменяться сокращением мышц, ме- няя таким образом фокусировку глаза. Эта способность называется аккомода- цией. Наименьшее расстояние отчетливого видения для нормального, или эме- тропического, глаза примерно равно 25 см. Аккомодация глаза в большей сте- пени изменяется от одного индивидуума к другому; она изменяется также с возрастом *). Исправление значительных недостатков глаз с помощью дополнительных линз (очков) составляет предмет офтальмологии. Глазу свойственны три ос- новных недостатка. а». Миопия, или близорукость, при которой лучи от бесконечно удаленного точечного источника фокусируются перед сетчаткой. Она корректируется рас- сеивающей линзой, помещаемой перед глазом. б. jTunepMempo/шя, или дальнозоркость, при которой истинный фокус лучей от бесконечно удаленного предмета лежит за сетчаткой. Она корректи- руется собирательной линзой. в. Астигматизм, при котором преломляющая способность глаза различна в разных плоскостях, проходящих через его оптическую ось. Этот дефект кор- ректируется цилиндрической или тороидальной очковой линзой. Сетчатка содержит два основных типа светочувствительных приемников, палочки и колбочки. Последние, согласно принятой теории цветного зрения, делятся на три типа цветочувствительных элементов. Колбочки преобладают в средней части сетчатки и их концентрация наиболее велика в так называемой центральной ямке желтого пятна. Эта область сетчатки ограничивает поле наиболее отчетливого зрения размером, несколько меньшим Г, и определяет фиксацию, или направление «видения», глаза. Диаметр колбочек в центральной ямке меняется от 0,0015 до 0,005 мм. Палочки, малочувствительные к цвету, доминируют в периферических участках сетчатки. Они особенно чувствительны к свету малоинтенсивных источников. С этим связано явление «бокового зре- ния», которое проявляется, например, когда мы рассматриваем картину ноч- ного неба. л Существует некий конечный предел в отчетливости деталей, который может быть достигнут с любой оптической системой. Этот предел, как будет показано в п. 8.6.2, в конечном счете обусловлен волновой природой света. Большой интерес для конструкторов-оптиков представляет величина нижнего предела разрешения глазом двух соседних точечных объектов, или острота зрения, поскольку от этой неличины зависит все допуски (как оптические, так и механические), приемлемые при создании приборов для визуальных наблю- дений. Для нормального глаза предельное угловое разрешение составляет около Г, что при фокусном расстоянии 15 мм соответствует 0,0045 мм на сет- чатке. При диаметре зрачка, большем 5 мм, хроматическая и сферическая абер- рации ухудшают разрешающую способность глаза. Поэтому обычно при конст- руировании приборов для визуальных наблюдений предполагается, что диа- метр светового пучка, попадающего в глаз, не превышает 4—5 мм. При расчете таких приборов почти никогда не учитываются недостатки глаза, так как они меняются от человека к человеку. *) К Ю годам оптическая сила глаза может изменяться в пределах 14 диоптрий, к 25 го-> дам — 10 диоптрий и к 50 годам — 2,5 диоптрий.
§ 6.2] ФОТОГРАФИЧЕСКИЙ АППАРАТ 225 Диафрагма. Фпто- 'плаапшиа. § 6.2. Фотографический аппарат В фотографическом аппарате (рис. 6.2) действительное обрашое изобра- жение предмета образуется одной литой (или комбинацией линз) на поверхно- сти фотографической пленки или плаепшкн. Предмет может бьпь неподвижным или движущимся относительно камеры. В последнем случае необходимы ко- роткие выдержки и соответственно большая апертура, обеспечивающая доста- точное количество света. Как следует из D.8.24), количество света от протя- женного предмета, приходящееся на еди- ницу площади изображений (освещен- ность Е), пропорционально отношению d%!fl, где d — диаметр входного зрачка, a /—^ фокусное расстояние, т. е. обрат- но пропорционально квадрату числа F {номинальное фокальное отношение). Обычно его можно менять с помощью пе- ременной диафрагмы В отсутствие аберраций линейный размер изображения удаленного объек- та, видимого под углом SO в первой узловой точке, равен /6В. Следовательно, для получения изображения большого размера фокусное расстояние должяо быть большим Таким образом, для фотоаппарата важны две основные характе- ристики фокусное расстояние его оптической системы и диапазон изменения фокального отношения, который эта система допускает. Еще одно требование, которое можно предъявить фотоаппарату — это большая широкоугольность. Фотоаппараты часто конструируют так, чтобы поле их зрения охватывало углы от 10 дс90с, а фокусные расстояния варьировали от 25 мм до 2 м. Еще боль- шие фок\-спые расстояния B—20 м) используются в астрономической фотогра- фии, где поле очень малых угловых размеров (~ 1°) с точечными объектами часто должно изображаться в большом масштабе. В простых небольших фотоаппаратах используется одиночная собиратель- ная линза, обычно в виде мениска (вогну ю-вып\ клан), с диафрагмой, несколько 171 I Рис. 6.2. Фотографический аппарат. а) Ф е) Рис. 6.3. Объективы разного типа. с —объектив Шевалье, б —объектив Петцваля. в — объектив Рапид Ректилинеар; г —объектив Тояогон. отодвинутой от нее, как это показано на рис. 6.2. Такие линзы, не исправлен- ные на хроматическую аберрацию, оставались вполне пригодными до тех пор, пока фотографические эмульсии были чувствительны глазным образом к не- большому участку в синей части спектра D000—4800 Л). Подобные линзы при- менялись в дешевых типах фотоаппаратов с фокальным отношением //11 и с полем 40е, Мениск, названный «ландшафтной линзой-», появился около 1812 г., но вскоре его заменил ахроматический дублет Шевалье (рис. 6.3, а). Хотя с по- мощью ахроматической комбинации и удалось совместить фокусировку фото- графически активного света и фокусировку всего видимого света (максимум яркости около X = 5800 А), однако при фокальном отношении, меньшем //16, хорошего изображения гюлуяить не удавалось. Потребность в более свето' 15 М Ьорн. Э Вольф
226 ОПТИЧЕСКИЕ ПРИБОРЫ, ФОРМИРУЮЩИЕ ИЗОБРАЖЕНИЕ [гл. 6 сильных объективах (т. е. с меньшим фокальным отношением) для портретной фотографии привела к широкому распространению портретного объектива Пепщоаля, созданного около 1840 г. (рис. 6.3, б). Этот объектив состоял из двух отдельных дублетов. Кривизна поля изображения, создаваемая таким объек- тивом, довольно значительна, но для поля, не превышающего нескольких градусов, достигается хорошая четкость при фокальном отношении до //4. Улучшенный Даллмейером объектив Петцваля широко применяется в кино- проекторах. ' Примерно с 1841 г. стало известно, что симметричные объективы всегда свободны от дисторсии, что строго справедливо только для случая единичного увеличения, но достаточно близко к истине и для других рабочих расстояний. Этот принцип лег в основу расчета целого ряда нряморисующих фотографиче- ских объективов. Объектив Рапид Ректилинеар Даллмейера (рис. 6.3, в), существующий с 1866 г., применялся во многих фотоаппаратах и в конце кон- цов в 1920 г. его фокальное отношение стало меньше //8, а поле составляло при- мерно 45°. Многие фирмы выпускали такие объективы и они получили общее название «апланатов». Тот же принцип симметрии, позволяющий устранить дисторсию, многократно использовался при конструировании широкоуголь- ных объектинов. Первый объектив такого тина Гипергон Герца 1900 г. мог охватить плоское поле размером до 150° при фокальном отношении около 25, хотя значительно чаще достаточным было поле в 90° при //16. Чстырехкомпо- нентный ТопЬгон (рис. 6.3, г) 1933 г. с полем в 90° при //6,3 лег в основу кон- струкции современных широкоугольных объективов. В течение большой части девятнадцатого столетия конструкторы объекти- вов были ограничены в своем выборе двумя основными типами стекол: боро- силикатным кроном и тяжелым флинтом. Около 1890 г. Иенская компания ввела совершенно новый сорт стекла — бариевый крон, имеющий большой показатель преломления при малой дисперсии. Применение стекла такого типа в системе линз объектива позволило добиться большей степени коррекции. Рудольф из Иены, с чьим именем связано появление многих типов фотографиче- ских объективов, придумал название «анастигмат» для объектива, у которого для одного внеосевого направления астигматизм может быть полностью устра- нен. Пользуясь только старыми сортами стекол, Рудольф изготовил анастиг- мат, который позже стал известен под-'названием Протар Цейсса (рис. 6.4, а). Рис. 0.4. Объективы разного типа. с—объектив npoiap; б — объектив Дагор: в — объектив Селор; г—объектив Тессар. Применив же три сорта стекла, он смог изготовить анастигматический триплет. Два анастигматических триплета, соединенные симметрично, дали хорошо скорректированную систему. Такой объектив выпускался Цейссом под назва- нием Триоль Протар и Герцем — под названием Дагор или двойной анастиг- мат (рис. 6.4, б). Типичный объектив подобного типа может охватить поле в 50" при /74,5. Позднее Рудольф показал, что если каждая половина образована четырьмя склеенными компонентами, то она может быть «самостоятельной», т. е. половины с разными фокусными расстояниями можно использовать либо по отдельности, либо в комбинации. Такой объектив был изготовлен в 1894 г. и называется Дубль Протар. Объектив, состоящий из четырех отдельных элементов, был усовершенство- ван Герцем в 1898 г, и получил название Селор (рис, 6,4, в); он стал прототипом
§ 6.2] ФОТОГРАФИЧЕСКИЙ АППАРАТ^ 227 некоторых известных объективов с фокальным отношением до //4,5 (например, Унифокаль Штейнхеля и Авиар Кука для аэрофотографии). В 1902 г. Рудольф создал свой Тессар (рис. 6.4, г), до сих пор пользующийся широкой известно- стью как относительно недорогой объектив, дающий превосходное изображение по полю до 60° с фокальным отношением, меньшим //3,5. Изготовляют такие объективы с самыми разными фокусными расстояниями. Старая конструкция Рудольфа—симметричный Планар 1895 г.— состо- яла из двух менисковых линз, служащих первым и последним элементами сис- темы (рис. 6.5, а). После 1920 г. было разработано много очень светосильных Рис. 6.5. Объективы разного типа, в—объектив Планар; 0 — объектив Биотар Цейсса, в—триплет Кука, г — объектив Зоннар объективов, у которых первым элементом была менисковая линза, а послед- ним в ^большинстве случаев склеенный дублет (например, Биотар Цейсса (рис. 6.5, б), рассчитанный Мертье). Другое направление в конструировании объективов, начатое в 1895 г. Тейлором, возникло благодаря усовершенствованию трехлинзового анастиг- мата, известного под названием триплет Кука (рис. 6.5, о). Достоинство такой трехэлементной системы заключается в возможности многочисленных вариаций параметров отдельных элементов. В недорогих фотоаппаратах эти «анастигма- тические» конструкции повсюду заменили «аплаиатические» объективы старых систем типа Рапид Ректилинеар. Светосильные объективы, предшественником которых можно считать триплет Кука (например, Зоннар //1,5, рис. 6.5, г), широко используются в кинокамерах и миниатюрных фотоаппаратах. У Зон- нара центральный отрицательный элемент и ьторой положительный — три- плеты. В камерах,, предназначенных для специальных целей с большими эффектив- ными фокусными расстояниями и соответственно малыми полями зрения, можно Рис. 6 6. Телеобъектив (а) и фотогелиограф (б). использовать оптическую систему, состояцшо из объектива и линзы, удлиняю- щей фокус. В телеобъективах удлинение фо1<;еа обеспечивается рассеивающей линзой, помещенной перед первичным изображением (рис. 6.6, а). В фотогелио- графе — приборе, предназначенном для фотографирования Солнца в большом масштабе, обычно применяется удлиняющая система собирающего типа (рис, 6,6, б). Эффективное фокусное расстояние такой системы приближенно 15* L
228 ОПТИЧЕСКИЕ ПРИБОРЫ, ФОРМИРУЮЩИЕ ИЗОБРАЖЕНИЕ |ГЛ. 6 определяется выражением D.7.3), т. е. где /, и f2— соответственно фокусные расстояния объектива и удлиняющей линзы, а /— расстояние между ними. У подобных систем эффективное фокус- ное расстояние может превышать расстояние от объектива до фокальной пло- скости в 15 раз *). В заключение следует отметить, что число F характеризует «скорость дей- ствия» фотографического объектива только в случае протяженного объекта. В случае точечного источника (что действительно имеет место в астрономии) свет в плоскости изображения в идеале будет концентрироваться на исчезающе малой площадке. Тогда лучшей характеристикой оптической силы объектива будет не число F, а квадрат диаметра апертуры. На самом же деле все обстоит значительно сложнее и существует ряд причин, увеличивающих изображение точечного источника до конечной (хотя часто и очень малой) величины. Главные из них — дифракция (см. гл. 8), зернистость (фотографической эмульсии и не- стабильность атмосферы. § 6.3. Линзовый телескоп **) Телескоп — это оптическая система, с помощью которой можно рассматри- вать увеличенное изображение удаленного объекта. Fit' рис. 6.7 схематически показана астрономическая труба, или рефрактор. Такой телескоп состоит из двух собирательных линз; первая, объектив— обычно ахроматический дублет, Объект! Рис. 6.7. Астрономическая труба, или рефрактор. дает перевернутое изображение /, которое рассматривается с помощью второй линзы, или окуляра. В обычных условиях задняя фокальная плоскость объек- тива совпадает с передней фокальной плоскостью окуляра, так что падающий на объектив параллельный пучок лучен выходит из окуляра также параллельным. С помощью вспомогательной линзы перевернутое изображение можно превра- тить в прямое. Входной зрачок системы совпадает с объективом: его изображение осталь- ной частью системы, т. е. выходной зрачок, обозначен на рис. 6.7 через Е'. Глаз должен располагаться так, чтобы его входной зрачок совмещался с Е'\ тогда весь свет, входящий в объектив под разными углами к оси, попадет в глаз. Увеличение системы, применяемой для рассматривания объектов, находя- щихся в бесконечности, определяется как угловое увеличение на зрачках. По формуле Смита — Гельмгольца D.4.491 оно равно величине, обратной линей- ному увеличению в плоскостях зрачков, и, значит, равно отношению радиусов входного и выходного зрачков. Выражение для увеличения получается нело- *) Более полное описание фотографических объективов можно иайти в книге [7]. Более поздние конструкции описаны в статьях [8—И]. *•) Для_ более полного знакомства с телескопами см., например, [12J.
§ 6.3] ЛИНЗОВЫЙ ТЕЛЕСКОП 229 средственно из С4.3.31), откуда, полагая, что углы малы, и заменяя tg у и tgy' на y и y'> находим Глаз можно аккомодировать на расстояние, отличное от бесконечности, а телескоп легко переюстировать так, чтобы он давал мнимое изображение на некотором расстоянии D от глаза *). Однако D не должно становиться меньше 2Г> см, что, как отмечалось выше, является ближайшим расстоянием, на кото- ром нормальный глаз без напряжения отчетливо видит предмет. Первый телескоп, о существовании которого достоверно известно, был теле- скоп Галилея, построенный в 1609 г. В этой системе (рис. 6.8) объективом слу- жила собирательная линза, а окуляром — рассеивающая, помещенная перед Объектив Зрачок Рис. 6.8. Телескоп Галилея. первичным изображением в таком месте, чтобы фокусы обеих линз совпадали. При таком расположении прямое изображение лежит в бесконечности, а проме- жуточное отсутствует. В телескопе подобного типа, известном под названием телескопа Галилея, апертурная диафрагма не совпадает с плоскостью объектива, поскольку изображение объектива окуляром находится между линзами и, сле- довательно, не доступно глазу. Глаз помещается непосредственно за окуляром, так что зрачок глаза становится апертурной диафрагмой и выходным зрачком. Главный луч для точек на границе поля пройдет очень близко от края объек- тива, и, следовательно, последний служит диафрагмой поля зрения, а не апертурной диафрагмой. К недостаткам телескопа Галилея следует отнести малое поле зрения и от- сутствие действительного изображения. Последнее обстоятельство не позволяет использовать в нем ни креста нитей, ни сетки. Вместе с тем малая длина теле- скопа, а также то обстоятельство, что он дает прямое изображение, делает его особенно удобным для театральных биноклей с увеличением от двух до трех раз. В бинокле, с такой же оптической системой, как и у астрономического теле- скопа, прямое ичображение получается путем четырехкратного отражения (рис. 6.9). Последние происходят при падении света под углом 45° на поверх- ность стекло— воздух в так называемых призмах Поро. Этот угол, конечно, больше критического. Оборачивающая система такого рода удобна и часто при- меняется в небольших оптических приборах. В бинокле другого типа изобра- жение переворачивается призмой Кенией. Эта сложная система с двумя взаимно перпендикулярными (с точностью до 1") отражающими поверхностями, так на- зываемой «крышей», ставится на пути светового пучка, как показано (а рис. 6.10. Увеличенное расстояние между объективами у биноклей более рас- пространенного типа полезно, так как усиливает стереоскопический эффект **). *) При этом увеличение будет равно — — —тг + -jj- ¦ **) Хорошее описание биноклей можно найти а книге [13].
230 ОПТИЧЕСКИЕ ПРИБОРЫ, ФОРМИРУЮЩИЕ ИЗОБРАЖЕНИВ Ггл. -6 Земные зрительные трубы в основном подобны астрономическим телеско- пам, за исключением того, что изображение у них должно быть прямым. Для переворачивания изображения служат либо призмы, как в бинокле, либо до- полнительные линзы. Типичная система такого рода показана на рис. 6.11. Рис. 6.9. Бинокль. Рис. 6 10 Оборачивающая призма Кеиига В качеств^ объектива телескопа обычно применяют ахроматическую комбинацию двух линз, у которых радиусы кривизны выбраны так, чтобы сфе- рическая аберрация была небольшой. Для этой Цели подходит склеенный дублет Объектив Выходной, зрачок Рис. 6 П. Земная зрительная труба Ф с первой симметричной двояковыпуклой линзой из крона и второй плоско-вог- нутой из флинта (рис. 6,12, а). Если нужно устранить не только сферическую аберрацию, но и кому (как, например в вы- сококачественном астрономическом телеско- пе), то возникают большие трудности при ра- счете обеих несклеенных компонент объекти- ва, от радиуса кривизны которых зависит аил апатичность конструкции. Примерная конструкция такого типа с вогнуто-выпуклой компонентой из флинта показана на рис, 6.12,6. различного Чрезмерную вогнутость первой поверх- ности можно уменьшить, если в свободную от комы конструкцию объектива ввести несфе- рическую поверхность, дающую на оси си- стемы стигматическое изображение. Наиболее распространенный тип объективов с передней линзой из крона — это объектив Фраунгофера. Объектив Штеинхеля с передней линзой из флинта менее известен вследствие повышенной чувствительности флинта (по сравнению с кроном) к воздействию атмосферы. Фотовизуальный объектив— третий тип объектива, широко применяемый в рефракторах, показан на рис. 6.12, в Использование трех различных сортов стекла позволило значительно уменьшить хроматическую разницу фокусных Объективы типа. а—склеенный ахромат б- ческий ахромат, о—фото! объектив
6.3] ЛИНЗОВЫЙ ТЕЛЕСКОП 231 расстояний в заданном спектральном интервале. Такой объектив почти одина- ково хорош как для фотографических, так и для визуальных наблюдений и одно время был широко распространен в астрономических инструментах с диамет- рами отверстий до 30 см. Значительная кривизна центральной компоненты, затрудняющая центрировку системы, и нестабильность флинтовой компоненты уменьшают, однако, ценность этих объективов. Окуляры зрительных труб, вообще говоря, должны удовлетворять двум требованиям. Во-первых, фокусное расстояние такого окуляра должно обеспе- чивать необходимое увеличение и, во-вторых, его апертура должна быть доста- точной, чтобы собрать свет от протяженного изображения. Этим требованиям удовлетворяет одиночная линза (рис. 6.13, а), но более удобна система из двух меньших линз, показанная на рис. 6.13, б, где изображена оптическая ¦схема окуляра Рамсдена. ЛьаоЯнаИ зрачок Рис. 6.13. Однолинзовый окуляр окуляр Раысдена (б) зрачок (а) и Рис. 6.14. Окуляр Гюйгенса (а) и окуляр Келлиерз (б). Окуляр должен давать изображение апертурной диафрагмы в таком месте, где удобно поместить глаз. Расстояние между этим изображением и последней поверхностью окуляра называется удалением выходного зрачка. Первая линза двухкомпонентиого окуляра называется полевой линзой, так как ее часто помещают очень близко от первичного изображения. Она отделена от него частично для того, чтобы стало незаметным любое загрязнение или дефект линзы, и частично для того, чтобы в плоскость изображения можно было поместить кресг нитей или сетку. Вторая компонента окуляра называется глазной линзой. Наиболее широкое распространение получили окуляр Рамсдена и изобра- женный на рис. 6.14, о окуляр Гюйгенса. Полевая линза у последнего нахо- дится впереди первичного изображения. Недостатком окуляра Гюйгенса яв- ляется небольшое удаление выходного зрачка; кроме того, им нельзя пользо- ваться с внешним крестом нитей. В этом окуляре сферическую аберрацию нельзя исправить так же хорошо, как в окуляре Рамсдена, но зато он свобо- ден от поперечной хроматической аберрации и внеосевои комы. Применение двух линз вместо одной (см. рис. 6.14) способствует устране- нию хромашческой аберрации, и коррекцию окуляра Рамсдена можно значи- тельно улучшить путем замены одиночной глазной линзы дублетом. Еще более сложны «ортоскопические» и «симметричные» окуляры, которые в основном подобны окуляру Рамсдена, но состоят из четырех компонент. Они в высокой степени свободны от аберраций (особенно от дисторсии) и обеспечивают значи- тельное удаление выходного зрачка при данном увеличении,
232 ОПТИЧЕСКИЕ ПРИБОРЫ, ФОРМИРУЮЩИЕ ИЗОБРАЖЕНИЕ (ГЛ. & Принцип устройства перископа, т. е. прибора, предназначенного для рас- сматривания предметов, расположенных так, что прямому наблюдению их ме- шает какое-либо препятствие, тот же что и у зрительной трубы. Однако два дополнительных требования значительно усложняют его конструкцию. Во- первых, в перископе ход лучей дол- жен иметь вид ломаных линий, а сам он должен давать прямое, не- перевернутое изображение. Для получения такого изображения не- обходимо чнбо четное число отра- жений, либо полное их отсутствие. Рис. 6.15. Перископические зеркала. На рис. 6.15 показаны два про- стых устройства; в одном из них входящий и выходящий световые пучки распространяются в одну сторону, в другом направления пучков противоположны. Первое должно работать совместно со зритель- ной трубой, дающей прямое изображение, второе— с оборачивающей трубой. Еще одно устройство показано на рис. 6.16, направление выходящего из него Рис. 6.16. Перископ с призмой Дове Рис. G.17. Тре.хлинчояые системы с единичным уве- личением пучка остается постоянным, тогда как вращение нерпой призмы обеспечивает возможность наблюдения в сазных направлениях. Пряное изображение в этой системе сохраняется с помощью призмы Довей, которая дает одно дополнитель- ное отражение и вращается со скоростью в два раза меньшей, чем первая приз- Таблица 6.1 1 а б е Фокусные расстояния линз 1/2 1/6 //11 т Не ЦП L, 1/2 1/6 //11 Изображение Обратное Прямое Прямое Апертура на оси d d/2 d/2 Поле (рад) 2d/l 2d/l 1ld/2/ Виньетиро- вание на краю толя 0 100% ~86%
§ 6.4] ЗЕРКАЛЬНЫЙ ТЕЛЕСКОП 233 ма. Нижняя «крышеобразная» призма (Амичн) дополняет число отражений ао четырех. Второе требование, предъявляемое к перископу, заключается в том, что он должен иметь большое угловое поле зрения, хотя сама перископическая сис- тема заключена в узкую трубу. Труба диаметром 20 см и длиной 12 м допускает максимальное поле зрения, равное лишь 2°. Такие требования можно удовле- творить, только заставив свет проходить вдоль трубы сквозь ряд линз. Расстоя- ния между ними могут быть различными. На рис. 6.17 показаны три трех.чин- зовые системы с единичным увеличением, а в табл. 6.1 приведены величины полей зрения и эффективные апертуры этих систем. Очевидно, что с увеличе- нием числа линз диапазон этих величин можно расширить *). § 6.4. Зеркальный телескоп В астрономических зеркальных телескопах, или рефлекторах, свет от небесных объектов падает на вогнутое главное зеркало, выполняющее ту же роль, что и объектив рефрактора, а именно, образуя действительное изображе- ние объекта в своей фокальной плоскости. Это изображение либо получается непосредственно на фотографической пластинке, либо исследуется визуально через окуляр. Астрономические телеско- пы подобного типа особенно широко ис- пользуются в наши дни. Так же как и у рефрактора, увеличение такого теле- скопа равно отношению фокусных рас- стояний объектива и окуляра. Первый зеркальный телескоп был построен в 1668 г. Ньютоном. В создан- ном им телескопе ка пути лучей, отраженных от главного зеркала, устанавлива- лось еще небольшое плоское эеркальис, отклоняющее лучи так, чтобы удобно было рассматривать изображение (рис. 6.18). Такое устройство известно под названием телескопа Ньютона, Для получения стигматического осевого изображения зеркало должно быть параболическим. Однако у параболического зеркала внеосевые изображе- ния искажаются сильной комой, в результате чего при больших относительных апертурах пригодное для работы поле зрения становится очень малым. При зер- кале диаметром 90 см с фокальным от- ношением //6 поле зрения составляет при- мерно 20', тогда как у наибольшего совре- менного телескопа Хале с главным зерка- лом диаметром 5 м угловое поле зрения равно приблизительно 45' [15]**). В других тинах зеркальных телеско- пов главная оптическая система состоит из двух зеркал. H=s них первое всегда вогнутое. В телескопе Кассегрена второе зеркало выпуклое (рис, 6.19). В больших астрономических телескопах такое устройство часто заменяет ньютоновское. Для получения разных фокусных расстояний можно использовать различные зеркала. Если в телескопах этой системы применяется параболическое главное зеркало, то второе зеркало долж- но быть гиперболическим. Можно выбрать и другие формы зеркал, дающие стиг- матическое осевое изображение при различных величинах внеосевой комы. В § 4.10 упоминалась двухзеркальная система, предложенная Шварцшильдом, Рис. 6.18. Телескоп Ньютона. Рис. 6.19 Телескоп Кассегрена. *) Дополнительные сведения можно иайти в статье Смита [14]. **) Общее описание 5-метрового телескопа см. в статьях [16, 17].
234 ОПТИЧЕСКИЕ ПРИБОРЫ, ФОРМИРУЮЩИЕ ИЗОБРАЖЕНИЕ [гл. 6 которая полностью апланатична. Однако форма зеркал у нее более сложная. Система Кассегрена получила широкое распространение в земных зрительных трубах, предназначенных для рассматривания ландшафтов, так как при невы- сокой стоимости, компактности и большом фокусном расстоянии она дает боль- шое увеличение, не уменьшав вместе с тем удаление выходного зрач.о. В менее известном телескопе Грегори вогнутое второе зеркало устанавли- вается позади фокуса главного зеркала. у У крупнейших рефлекторов с помощью второго зеркала легко получить очень большие фокусные расстояния, значительно превышающие фокусные расстояния наибольших рефракторов. В системе Куде свет отражается от треть- его (плоского) зеркала вдоль оси вращения инструмента, что позволяет напра- вить свет в неподвижный спектрограф. Одно из существенных преимуществ зеркального телескопа — полное отсутствие хроматической аберрации. Поскольку кривизна зеркальной поверхности может быть значительно меньше, чем у линз объектива, можно строить зеркальные телескопы с фокальным отношением много меньшим, чем у рефракторов, что в свою очередь обеспечивает более яркое изображение и приводит к большей компактности оптической системы. Кроме того, зеркало можно сделать больше линзы, так как оптические неоднородности в толще стек- ла для зеркала не имеют значения. Основными недостатками астрономических рефлекторов являются чувстви- тельность зеркальной поверхности и самой трубы телескопа к изменениям тем- пературы, малость углового ноля зрения и трудность осуществления достаточно жесткой механической конструкции. Последнее обстоятельство служило при- чиной наибольших затруднений, возникавших у конструкторов телескопа Хале. Успешное применение зеркального телескопа с фотографической регист- рацией вызвало стремление увеличить поле зрения телескопа. Один из методов, пригодных для увеличения полезного поля, заключается в том, что непосредст- венно перед фотопластинкой устанавливается полевая линза, рассчитанная так, чтобы вносимая ей внеосевая кома, компенсировала кому главного зеркала. Таким путем с зеркалом диаметром 80 см достигается поле зрения порядка 1,5° [18]. Значительное увеличение углового поля можно получить при фотографнро- 7 А Рис. 6.20. Камера Шмидта. нки значителык Рис. Кривизна корректирующей плас преувеличена 6.21. Сечение корректирую- щих пластинок Шмидга. Кривизны значительЕЮ преувеличены вании с помощью большой зеркальной системы, предложенной в 1930 г. Шмидтом и упоминавшейся в § 4.10 [19, 20]. Параболическое зеркало дает безу- пречное изображение в осевых лучах и плохое изображение из-за комы на небольших расстояниях от оси. Сферическое зеркало с апертурной диафрагмой в центре кривизны С даст однородные изображения с сильной сферической аберрацией на широкой тоже сферической поверхности с тем же центром кри- визны. Шмидт поместил в плоскости апертурной диафрагмы тонкую почти пло- скопараллельную пластинку. Одна ее сторона была плоской, другая имела
§ 6.41 ЗЕРКАЛЬНЫЙ ТЕЛЕСКОЦ 235 сложный профиль (рис. 6.20, 6.21). Такая пластинка называется корректирую- щей, и ее назначение заключается в предварительной коррекции входящего в си- стему плоского волнового фронта с целью полной компенсации сферической аберрации, вносимой сферическим зеркалом. Нетрудно вывести уравнение для асферической поверхности корректирую- щей пластинки камеры Шмидта. Для этого сравним уравнение сферического, и параболического зеркал. Уравнение сферического зеркала радиуса i? = 2jf имеет вид (рис. 6.22) т. е. ~4М тогда как для параболического зеркала того же па- раксиального радиуса {R = 2/) имеем Рис. 6.22 Сферическое зеркало. Поскольку пучок параллельных лучей, идущих в нап- равлении оптической оси, при отражении от парабо- лического зеркала остается стигматическим, в зоне радиуса у величина предварительной коррекции, которую нужно внести в вол- новые фронты, падающие на сферическое зеркало, приблизительно равна Мы пренебрегли здесь членами с у в шестой и более высоких степенях *). Пройдя корректирующую пластинку, лучи останутся почти параллельными, так что практически не важно, изменяется ли у на зеркале или на пластинке. Следовательно, если п—показатель преломления пластинки, то ее толщина Т(у) в зоне радиуса у должна превышать ее толщину на оси 7@) на величину —7@)] =2(zw)— т. е. A) Сечение такой корректирующей пластинки показано на рис. 6.21, а. Необходимое отклонение от сферичности очень невелико. Для примера рассмотрим камеру Шмидта //3,5 с апертурньш диаметром корректирующей пластинки 2г/0 = 40 см и, следовательно, фокусным расстоянием / — 140 см. При п= 1,5 максимальная асферичность IT (у)— Т@)]„лкс, согласно (I), равна 3^-^ = 0,0036 см. Дальнейшего улучшения можно добиться сравнением сферического зерка- ла с несколько иным «сравнительным параболоидом». Если f— фокусное рас- стояние параболоида, то г{1>) - г/2/4/', и вместо A) для поверхности пластинки получим */4*— Ayz /o\ = 32(п-1)/з' (Z> *) Можно показать, что это приближение допустимо, если фокальное отношение для камеры Шмидта не меньше чем приблизительно //3.
236 ОПТИЧЕСКИЕ ПРИБОРЫ, ФОРМИРУЮЩИЕ ИЗОБРАЖЕНИЕ [гл. 6 где 1 \ С корректирующей пластинкой B) лучи, параллельные оси, сойдутся после прохождения системы в точке, находящейся на расстоянии /' от осевой точки зеркала. Эту добавочною степень свободы (выбор величины f') можно исполь- зовать для уменьшения хроматической аберрации, вносимой пластинкой. Так как ?-0, когда yBif — Л) = 0, то луч, параллельный оси и отстоящий ог псе па расстоянии у — У* А/2, не отклоняется пластинкой. Зона радиуса у— У Л/2 называется нейтральной зо- ной. Для того чтобы хроматическая аберрация стала минимальной, нейтраль- ная зона должна доходить почти до края пластинки, как это показано на рис. 6.21. б Точнее, можно показать, что диаметр кружка смешанных цветов будет наименьшим, если радиус нейтральной зоны составляет приблизительно 0,87 радиуса пластинки. Это соответствует выбору А =''11у1 [21, 22]. Конечно, корректирующая пластинка отклоняет проходящие через нее косые пучки иначе, чем пучки, падающие на нес нормально; поэтому такая система не свободна от внеосевых аберрации. Следует подчеркнуть, что качество а) Рис. 6 23. Камера Шмидта — Кассегрена (а) и суперкамера Бекера — Шмидта (б) изображений, полученных на сферической поверхности, концентрической главному зеркалу, превосходно *). Это относится также и к камере Шмидта с малым фокальным огношсннем, работающей по полю, во много раз превышаю- щему поля, поручающиеся с обычными системами. Рассматривались и более сложные системы, использующие принцип камеры Шмидта "'), а некоторые из них были даже построены Наиболее ин- тересны камера Шмидта— Кассегрена, в которой используются два черкала (сферические или несферические) совместно с корректирующей пластинкой (рис. 6 23, а), и суперкамера Бекера — Шмидта, состоящая из сферического зеркала, двух менисков и корректирующей пластинки (рис. 6.23, б). К достоин- ствам первой следует отнести плоское иоле изображения, более удобное, чем в камере Шмидта, а также то, что ее общая длина меньше, чем у камеры Шмидта с тем же фокусным расстоянием. Суперкамера Бекера— Шмидта может рабо- тать с предельно малыми фокальными отношениями. *) Это отчасти связано с том, что кривизна поля, как можно показать является единст- венной первичион аберрацией [21] Аберрации пятого порядка в камере'Шмидта ис'следо вались Kdjvuco[t mi |23| ц Линфутом [22| *") Of к )i laivix систем см. в [24—26] Более полное описание суперкамеры Бекера—Шмид- T?l CM- 1^/J
6.61 МИКРОСКОП 237 § 6.5. Осветители Назначение осветителей — собрать как можно больше света от искусствен- ного источника и направить его с допустимым углом расхождения во входной фачок оптической системы. Источники света имеют конечные размеры, и по- этому конструкция осветительного прибора в такой же степени зависит от при- роды источника, как и от назначении требуемого освещения. На рис. 6.24 по- казан входной зрачок оптической системы, которая требует освещения по всем Осветитель Рис. 6.24. К работе осветительного прибора. а) ?) Рис. 6.25. Конденсоры. направлениям, образующим с осью углы, не превышающие значения ср. Диа- метр зрачка равен г. Пусть а — диаметр источника, кошрый мы считаем круг- льш. Для большей эффективности осветительной системы она должна давать увеличение rid, а ее апертура должна быть видна из центра входного' зрачка под телесным углом 2ф. Рабочее расстояние w должно превышать некоторую заданную величину. Из рассмотрения рис. 6.24 следует, что чем меньше d, тем больше угол охвата Щ и, следовательно, потери света малы. Большие углы освещения (большое ф) часто позволяют уменьшить отношение wlr, что ведет к более эффективному использованию больших источников. Таким образом оче- видно, что в каждом частном ел\чае существуют ограничения па величину источника, который еще можно удовлетворительно использовать, и эти огра- йичения становятся менее строгими при большчх допустимых углах освещения. В фотоувеличителе (ф«20°) Гюлыпие источники (матированные лампы или трубки с холодным катодом) часто обеспечивают хорошее освещение. Для кино- проектора (ерда 5°), от которого требуется максимальная освещенность, пригод- на нить электролампы. Если размеры прожектора, который должен обеспечить большой поток в угле !—2", не чрезмерно велики, то в нем могут применяться только очень яркие источники малых размеров. Очень часто осветитель может быть сконструирован просто из подходящего источника и конденсорной линзы. Для успешного использования малых источников эта линза должна быть по возможности свободна от аберраций. Каждый конденсор можно заменить «фокальной сферой», соответствующей ис- точнику минимального размера, с которым еще можно эффективно работать. Конденсор iu двух плоско-выпуклых линз (рис. 6.25, а) дает обычно вполне удовлетворительные результаты. Иногда предпочтение отдается более сложной трехлинзовой системе (рис. 6.25, б), тогда как в других случаях оказывается достаточной одиночная линза. Условия освещения в микроскопах требуют более полного обсуждения и будут рассмотрены ниже, в пи. 8.6.3 и 10.5.2. § 6.6. Микроскоп Кажущаяся величина предмета определяется величиной его изображения на сетчатке. В случае невооруженного глаза кажущийся размер зависит от утла, под которым предмет виден. Для нормального глаза наименьшее расстояние -отчетливого зрения, как указывалось в § 6.1, примерно равно 25 см, Это рас-
238 ОПТИЧЕСКИЕ ПРИБОРЫ, ФОРМИРУЮЩИЕ ИЗОБРАЖЕНИЕ [ГЛ. 6 стояние наиболее удобно для рассматривания деталей предмета. Если перед глазом поместить собирательную линзу, то рассматриваемый предмет можно значительно приблизить к глазу. И хотя такая линза образует мнимое увеличен- ное изображение на расстоянии, превышающем расстояние до предмета (рис. 6.26), рассматривать его удоб- нее, чем сам предмет. Увеличение приборов, служа- щих для рассматривания близких предметов, определяется как отно- шение углового размера изображе- ния, находящегося на расстоянии наилучшего зрения (обычно 25 см) к угловому размеру предмета, от- несенного на то же расстояние. Это эквивалентно определению обычного линейного увеличения М в том случае, когда изображение находится на рас- стоянии наилучшего зрения от выходного зрачка прибора. Для простой линзы (см. рис. 6.26) имеем где ?'= 25 см—-^расстояние наилучшего зрения. Согласно D.4.31) 1 ' -— B, Рис. 6.26. Лупа. в последнем выражении фокусное расстояние / измеряется в сантиметрах. Так как / обычно мало ио сравнению с 25 см, увеличение можно записать как _ М~-щ*. D) На практике различные типы луп, например простая двояковыпуклая лин- за и ахроматический дублет, очень часто используются в карманных лупах Объектив ОкУляР Глаз Рис. 6.27. Схема, Иллюстрирующая принцип устройства микроскопа. или в лупе часовщика. Часто встречается система из двух раздельных плоско- выпуклых линз, сходная с окуляром Рамсдена (см. рис. 6.13, б). Очевидно что при большом поле зрения и большом увеличении расстояние между предме- том и глазом становится недопустимо малым. По этой причине Галилей пред- ложил около 1610 г. конструкцию микроскопа, оптическая система которого состояла из короткофокусного объектива и окуляра-лупы. В такой системе увеличение осуществляется в две ступени (рис. 6.27). Объектив микроскопа образует увеличение изображения предмета в плос- кости, удобной для рассматривания через окуляр. Увеличение объектива рав- но ¦—t'jt«> где ?,„ и ?о— рабочие расстояния объектива, удовлетворяющие соотношению B). Если fi— фокусное расстояние окуляра, измеренное в сан- тиметрах, то его увеличение, согласно D), равняется 25/ |/i [, Следовательно,
§ 6.6) МИКРОСКОП 239 увеличение всей системы равно 25 l/il Отрицательная величина М указывает на то, что изображение получается пере- вернутым. Увеличения объектива и окуляра обычно даются в описании микро- скопа отдельно. Другая величина, представляющая интерес при описании микроскопиче- ского объектива,— это его числовая апертура (Ч, А.). Она была определена в п. 4,8.2 как произведение п sin G, где 0 — половина угловой апертуры в пространстве предмета (т. е. поло- вина угла при вершине конуса лучей, исходящих из осевой точки предмета и попадающих на объектив), а п — показатель преломления среды в про- странстве предмета. Эта величина служит мерой не только светосилы объектива, но, как будет показано в п. 8.6.3, и его разрешающей способ- ности, т. е. предельной четкости деталей, которую он дает. Здесь мы рас- скажем о способах получения наивысшей числовой апертуры. Объективы микроскопа, вообще говоря, должны быть хорошо исправлены на сферическую и хроматическую аберрации, а также на кому, так как они предназначены для работы с предельно большими апертурами. Для объектива с небольшим увеличением (~10х) можно воспользоваться системой из двух отдельных склеенных ахроматических лннз (рис. 6.28, а), исправленной на сферическую аберрацию и кому. Однако такая комбинация линз не годится для объективов с большим увеличением (~50х и больше). В этом случае приме- няются другие системы линз, в которых используется существование на сфери- ческих поверхностях апланатических точек (см. п. 4.2.3). Это осуществляется а) 6) е) Рис 6.28 Объективы микроскопов. а— малое увеличение, б —среднее увеличение; в — большое увеличение. Ф Рис 6.29. Уменьшение углового расхождения лучей в микроскопе. следующим образом. Предмет помещается в точке Р вблизи плоско-выпуклой линзы (рис. 6.29, й). Пространство между предметом и линзой заполняется маслом с показателем преломления п, очень блцзкьч к показателю преломле- ния линзы. Если С— центр кривизны исправленной поверхности линзы, а г-— ее радиус кривизны, то мнимое изображение Pi точки Р, отстоящей от С на расстоянии rjnu находится на расстоянии я,л1 от С и обе эти точки связаны ус- ловием апланатизма. Таким путем достигается большая числовая апертура и в системе уменьшается расхождение лучей, исходящих из Р, без внесения монохроматических аберраций. Однако при это»! возникает хроматическая аберрация и се следует скомпенсировать остальной частью ошичеекой системы.
240 ОПТИЧЕСКИЕ ПРИБОРЫ, ФОРМИРУЮЩИЕ ИЗОБРАЖЕНИЕ [ГЛ. 6 Можно еще уменьшить расхождение лучей'дополнительным положитель- ным мениском *) (рис. 6.29, б). Центр кривизны передней поверхности мениска находится в точке Р,, а радиус его задней поверхности выбирается так, чюбы Р была апланатическои точкой этой поверхности. Лучи, преломленные на задней поверхности мениска, образуют лшимое изображение в другой апланатическои точке />3. _ J Добавление других менисков дает последовательный ряд мнимых изоб- ражений Р3, Р*, ..., лежащих все дальше и дальше от Р. Таким образом, угловое расхождение лучей становится все меньше и меньше. Однако редко применяют больше двух линз, так как нельзя полностью скомпенсировать вно- симую ими хроматическую аберрацию. Описанные выше иммерсионные объективы позволяют работать с более ши- роким конусом лучей, чем сухие объективы такого же диаметра. В случае сухих объективов лучи, выходящие из покровного стекла, защищающего рассматри- ваемый предмет, попадают в воздух и, преломляясь, отклоняются наружу. Следовательно, расхождение лучей увеличивается. При использовании же объ- ективов с масляной иммерсией лучи, выходящие из покровного стекла, не пре- ломляются. Наибольшую числовую апер- туру (—'1,4) можно получить только у таких объективов. Значительно большие требования предъявляются к объективам микроско- на, предназначенным для работы в ближ- ОНъеюп \ z_ 4 ^Какуляру ней ультрафиолетовой ("к~ 2500\), види- мой и близкой инфракрасной областях спектра. Так, например, если микроскоп должен использоваться в сочетании со .спектрографом и фотометром, иеобходи- Рис. 6.30. Зеркальный объектив микро- 'ма высокая степень ахроматизации. скопа Ьурха. Расчетом ахроматических объекти- вов к микроскопам ннервые системати- чески занялся Бурх [29) **), взявший за основу аналитическое решение ШЕ*рц- шильда для двухзеркальной апланатической системы, о которой упоминалось в §4.10. Бурх нашел, что если числовая апертура превышает 0,5, то по крайней мере одно из зеркал должно быть асферическим. Тем не менее в зеркальных системах невозможно осуществить такие же большие числовые апертуры, как в хороших иммерсионных объективах. Типичный ахроматический объектив Бурха показан схематически на рис. 6.30. Не считая ахроматичности, его ос- новное достоинство заключается в большом рабочем расстоянии, т. е. расстоя- нии между предметом и ближайшей поверхностью объектива. Оно может быть столь же большим, как и фокусное расстояние объектива. Недостатком такой системы является присутствие второго зеркала, загораживающего часть света. В системах с малой числовой апертурой, использующих сферические поверх- ности, такое «загорагкивание» может превышать 45%. Рассматривались также и зеркально-линзовые объективы микроскопов. Так, была предложена система, в которой отражения происходят внутри стекла на концентрических сферических покрытых серебром поверхностях [30]. Се- ребро на второй поверхности нанесено так, что «загораживание» уменьшено до 20%. Двухзеркалъный объектив с относительно малым «загораживанием» описан Грейем 1311. Он применил кварцевые и флуоритовые компоненты с боль- шой кривизной, которые при условии обеспечения необходимой «цветовой» *) Этот истод предложен Лмвчи 128]. **) Б первой его статье содержится также обзор ранних исследований по ахроматичес- ким объективам для микроскопов,
ЛИТЕРАТУРА 241 коррекции в ультрафиолетовых и видимых областях спектра вполне заменяют поверхности сложной формы, Необходимые при работе с зеркалами. Обычно предметы, исследуемые под микроскопом, сами не светятся и, сле- довательно, нуждаются в постороннем освещении. Во многих случаях рассмат- риваемые предметы представляют собой тонкий срез прозрачного вещества и наблюдаются в проходящем свете. В системах с небольшой числовой апер- турой (Ч. А. до 0,25) вполне достаточно рассеянного дневного света, отражен- ного под углом от вогнутого зеркала. В других случаях необходимо пользо- ваться искусственными источниками. Для большей концентрации света приме- няется вспомогательная система линз, или конденсор. Существует много различ- ных способов освещения микроскопических объектов; два из них будут описаны в гл. 10. В настоящем параграфе содержались только основные сведения о микро- скопе. Полное обсуждение вопросов, связанных с формированием изображения в микроскопе, нуждается в более тонких методах (см. п. 8.6.3 и §§ 9.5 и 10.5), ЛИТЕРАТУРА 1. Dictionary of Applied Physics, ed. by Glazebrook, Macmillan, London, 1923, Vol. IV. 2. L. С Marti и, An Introduction to Applied Optics, Pitman, London, 1950, Vol. II. 3. G. Л. В о u t г у, Optique Instrumental. Masson, Paris, 1946. 4. D. A. J а с о b s, Fundamentals of Optical Engineering, McGraw-Hill, New York, 1943. 5. II. Helmholtz, Handbuch der Physiologischen Optik, L. Voss, Hamburg, Leipzig, Я Aufl., I A909), II A911), III A910). 6. J. P. С S о u t h a 11, An Introduction to Physiological Qptics, Oxford Univ. Press, 1937. 7 W. M e r t e, R. R i с h t e r, M. R о h r, Das Photographische Objecfiv, Springer, Vien- na, 1932. S. W. T а у 1 о r, H. W. L e e, Prac. Phys. Soc. 47, 502 A935). 9. II. W. Lee, в сб. «Rep. ProRr. Phys.», Phys. Soc. 1940, Vol. 7, p. 130. 10. R. К i n g s 1 a k e, в сб. «Proc. London Conf. on Opt. Instrum.», Chapman a. Hall, London, 1951, p. 1. 11. C. G. Wynne, в сб. «Rep. Progr. Phys.» Phys. Soc. 195S, Vol. 19, p. 298. 12. Л. О a n j о n, А. С о u d e r, Lunettes et Telescopes, Rev. d'Opt., Pan's 1935. 13. M. R о h r, Die Binokuiaren Instrumente, J. Springer, Berlin, 1920. 14. T. S rn i t h, в кн. «Dictionary ol Applied Physics», ed. by R. Glarebrook, Macrftillan, Lon- don, 1923, Vol. IV, p. 350. 15. F. E. Ross, Publ. Astr. Soc. Рас. 46, 342 A934). 16. J. A. Anderson, Puhl. Astr. Soc. Рас. 60, 221 A948). 17. В. Rule, Publ. Astr. Soc. Рас. 60, 225 A948). 18. F. E. Ross, Astrophys, J. 81, 156 A935). 19. B. Schmidt, Central-Zeilung f. Optik u. Mechanik 52, Heft 2 A935); Mitt. Hamburg. Stcrnw. Bcrgudorf 7, ЛГ» 36. 15 A932). 20. R. Schorr, Z. f. Instrkde 56, 336 A936); Mitt. Hamburg. Sternw. Bergedori 7, № 42, ' 175 A936); Astr. Nachr. 258, 45 A936). B. S t r 6 m g г e n, Vierteljahrsschrift der Astr. fies. 70, 89 A935). 22. E. H. L i n f о о t, Mo. Not. Roy. Aslr. Soc. 109, 279 A949); в сб. «Recent Advances in Optics», Clarendon Press, Oxford, 1955, mi. 182, 192. 23. C. Carat heodory, Elcmcntare Thcoric des Spiegel teleskops von B. Schmidt, Teubner, Leipzig, 1940. 24. H. Slevogt, Z. f. Instrkde 02, 312 A942). 25. H. Kohler, Astr. Nachr. 278, 1 A949). 26. E. H. Linfout, Mo. Not. Roy. Abtr. Soc. 108, 81 A948); в сб. «Recent Advances in Optics», Clarendon Press, Oxford, 1955. Ch. IV. 27. F. L. W h i p p 1 e, Sky a. Telescope 8, 90 A949). 28. G. B. Amici, Ann. de Chim. et Phys. 12, 117 A844). < 29. C. R. Burch, Proc. Phys. Sos. 59, 41, 47 A947). 30. А. В о u w e r s, Achievements in Optics, Elsevier, Amsterdam, 1946. 31. D. S. G г е у, в сб. «Proc. London Conf, on Opt. Instrum», Chapman a. Hall, London ,1951, p. 65.
ГЛАВА 7 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ § 7.1. Введение В гл. 3 из основных уравнений электромагнитной теории была получена геометрическая модель распространения света и было показано, что в некото- ром приближении изменение интенсивности в пучке света можно описать как функцию площади поперечного сечения трубки лучей. При суперпозиции двух или большего числа световых пучков распределение интенсивности в общем случае уже нельзя описывать таким простым способом. Так, если свет от одного источника разделить подходящим прибором на два пучка и затем наложить их друг на друга, то интенсивность в области суперпозиции пучков будет из- меняться от точки к точке, достигая максимума, превышающего сумму интен- сивностей пучков, и минимума, который может оказаться равным нулю. Это явление называется интерференцией. Ниже мы увидим, что при суперпозиция пучков строго монохроматического света интерференция возникает всегда. Однако свет от реальных физических источников никогда не бывает строго мо- нохроматическим, и, как мы знаем из теории атомного строения, его амплитуда и фаза флуктуируют непрерывно и так быстро, что ни глаз, ни обычный физиче- ский детектор не могут уследить за их изменениями. Если два световых пучка происходят от одного источника, то возникающие в них флуктуации, вообще говоря, коррелированы, и о таких пучках говорят, что они полностью или час- тично когерентны, в зависимости от того, будет ли эта корреляция полной пли частичной. В световых пучках от разных источников флуктуации совершенно независимы, и пучки, как говорят, взаимно некогерентны. При наложении таких пучков от независимых источников интерференция в обычных экспери- ментальных условиях не наблюдается, и полная интенсивность равна сумме интенсивностей отдельных пучков. Далее (см. гл. 10) мы увидим, что «степень корреляции» между флуктуациями в двух световых пучках определяет «чет- кость» интерференционных эффектов, возникающих при суперпозиции пучков, и наоборот, «степень корреляции» сама определяется этими эффектами. Существуют два общих метода получения интерферирующих пучков из одного светового пучка, и они лежат в основе классификации устройств, при- меняемых в интерферометрии. В одном из них пучок делится, проходя сквозь близко расположенные друг к другу отверстия. Такой метод — метод деления волнового фронта—пригоден только при достаточно малых источниках. В другом способе пучок делится па одной или нескольких частично отражаю- щих, частично пропускающих поверхностях. Этот метод—метод деления амплитуды—может применяться с протяженными источниками и обеспечи- вает большую интенсивность, чем первый метод. В любом случае удобно рас- сматривать отдельно явления, возникающие при суперпозиции двух пучков (двухлучевая интерференция), и явления, возникающие при суперпозиции большего их числа (многолучевая интерференция). Интерференционные явления, исторически послужившие доказательством волновой теории света (см. «Историческое введение»), и в наши дни имеют важ- ные практические применения, например в спектроскопии и метрологии. В на- стоящей главе мы коснемся главным образом идеализированного случая ин- терференции световых пучков от строго монохроматических источников. Зле-
§ 7.2] ИНТЕРФЕРЕНЦИЯ ДВУХ МОНОХРОМАТИЧЕСКИХ ВОЛН 243 ментарная теория монохроматических волн вполне достаточна для описания действия приборов, применяемых в подавляющем большинстве интерференци- онных исследований. В случае необходимости мы с помощью теоремы Фурье учтем, что реальные источники далеко не монохроматичны. Это обстоятельство всегда подразумевается в нашем представлении о протяженных источниках, которые мы считаем состоящими из большого числа взаимно пекогерентных точечных источников. В настоящей главе мы всегда (когда это возможно) будем предполагать, что поведение отдельных пучков лучей подчиняется зако- нам геометрической оптики и будем пренебрегать дифракционными явлениями, которые, как кратко указано в п. 3.1.4, возникают вблизи фокальных точек и границ тени. Эти явления будут подробно рассматриваться в гл. 8 дли случая монохроматического света. Общий случай интерференции и дифракции поли- хроматического частично когерентного света будет рассмотрен в гл. 10. § 7.2. Интерференция двух монохроматических волн Интенсивность света / определялась как усредненное по времени количе- ство энергии, пересекающее единицу площади, перпендикулярной к направле- нию потока энергии, в единицу времени. Для плоской волны, согласно A.4.8) и A^4.9), имеем <Н2>. A) В гл'. 3 мы видели, что эти соотношения справедливы, по крайней мере как приближения, и для волн более общего типа. Так как мы будем сравнивать интенсивности в одной и той же среде, можно считать величину <Е3> мерой интенсивности. Большей частью мы будем иметь дело с монохроматическим полем, и поэтому представим электрический вектор Е в виде ' Е(г, i) = Re{A(r)exp(—«coOHV, [A(r)exp(—jcoi) + A*(r)exp(icoO], B) Здесь А —. комплексный вектор с декартовыми компонентами Ax = al(r)exp[igl(r)], Ay=aa{r)cxp[ig,{r)], Az = a0 (г) exp [ig3 (г)], C) где а, и gj(j=l, 2, 3)—вещественные функции. Для однородной плоской волны амплитуды а; постоянны, тогда как фазовые функции gj имеют вид g i(r) ~к-т—S,-, где к—волновой вектор, a fi7—¦ фазовые постоянные, опре- деляющие состояние поляризации. Из B) имеем Е2=74(А2ехр [—2iW]-f-A*2exp [2Ш] + 2А-А*).- D) Отсюда, усредняя по времени в интервале, большом по сравнению с перио- дом Т = 2л/со, находим <Е*> = ЧгА.А* = Ч2(\Ах\* + \Ау\> + \Аг\*) = ЧЛа1 + а1+а1). E) Предположим теперь, что в некоторой точке Р происходит суперпозиция двух монохроматических волн Ег и Е2. Результирующее электрическое поле в Р имеет вид Е*=Е, + Е, F) и, следовательно, Е^=Е? + Е1 + 2ЕХ/Е2. G) Таким образом, полная интенсивность в точке Р равна - / = /1 + /, + /1„ (8) где h = <E}>, /8 = <E1> (9а) •— интенсивности каждой из волн, а /?2 = 2<Е1-Е2> (96) 16»
244 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 ¦— интерференционный член. Пусть А и В — комплексные амплитуды воле, причем ¦ A 't 5 V'4 ... A0) Вещественные фазы gj и hj обеих волн будут, вообще говоря, различны, так как волны приходят в Р разными путями, но если условия эксперимента та- ковы, что между соответствующими компонентами возникла одна и та же разность фаз б, то Здесь ДеУ— оптическая разность хода двух волн от общего источника до Р, а Ко—длина волны в вакууме. Выражая произведение Ei-E2 через А и В, найдем Ej • Е, = ги (А ехР (— tot) -'- А* ехр (Ш)) (в ехР (— '«0 + в* ехр (Ш)) =-= = V«(A-Bexp(—2t(»/) + A*B-expBjco/) + A-B*-f-A*-B), A2) и, следовательно, /12=2 <Е,-Е2> = Va(A- + аф% cos (g,—A,) + а3й3 cos (g,—ft8) = (аД + a2fr2 + a3bs) cos 6. A3) Это выражение показывает зависимость интерференционного члена от ампли- туд компонент и разности фаз обеих волн. При выводе)A3) мы не воспользовались электромагнитной теорией и, в част- ности, тем, что колебания поперечны. Как уже упоминалось в «Историческом введении», Френель и Араго показали, что два световых пучка, поляризованных под прямым углом друг к другу, не интерферир>;от и, следовательно, световые колебания должны быть поперечными. Это заключение легко вывести из A3), Предположим, что две волны распространяются в направлении г, и электриче- ский вектор первой волны лежит в плоскости хг, а второй — в плоскости г/г. Тогда С2= 0, йх= 0, и из A3) находим для интерференционного члена Так как наблюдения Френеля и Араго показали отсутствие интерференции при таких условиях, мы должны заключить, что as— й3— 0, т. е. электрические векторы обеих волн перпендикулярны направлению г. Следовательно, свето- вые волны должны быть поперечными, что полностью согласуется с нашими прежними выводами из электромагнитной теории. Рассмотрим распределение интенсивности в результате суперпозиции двух волн, распространяющихся в направлении оси г; пусть они линейно поля- ризованы и вектор Е направлен по оси х. Тогда <z3=a3 = 62 = 63=0, и, используя E), (9а) и A3), находим h=^a\, I2 = ~bl Jn = alb1cos8 = 2V7JzCos8. A4) Тогда полная интенсивность, согласно (8), имеет вид A5) Очевидно, максимумы интенсивности равны и появляются при I A6а) |б| = 0, 2я, 4л, ... I
§ 7.3] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ ВОЛНОВОГО ФРОНТА 245 а минимумы интенсивности равны ' Л,.к = /1 + / и появляются при = п, Зл, ... } В особом случае h~ /2, соотношение A5) переходит в / = 2/1(l+cos6)^4/1cos2|-, A66) A7) / 4L и интенсивность изменяется от минимального значения /мин= 0 до максималь- ного значения /макс= Ah (рис. 7.1). Эти формулы справедливы также и для естественного неполяризованного све- та, поскольку ниже (см. п. 10.8.9) б}дет показано, что пучок естественного све- та можно рассматривать как результат суперпозиции двух некогерентных пуч- ков, линейно поляризованных под пря- мым углом друг к другу (например, по направлению х и у). В этом случае интер- ференцию между х- и «/-компонентами сле- дует рассматривать отдельно, и полная интенсивность получается сложением отдельных интенсивпостей, а так как 6 Одинакова, в каждом; случае, то мы и находим приведенную выше формулу. О Рис. 7.1. Изменение интенсивности в зависимости от разности фаз при интерференции двух пучкоо равной интенсивности. § 7.3. Двухлучевая интерференция. Деление волнового фронта 7.3.1. Опыт Юнга. Первая экспериментальная установка для демонстра- ции интерференции света была осуществлена Юпгом. Свет от точечного моно- хроматического источника S падал на два небольших отверстия St и S2 в экране Л, расположенных рядом и нахо- дящихся на равных расстояниях от источника S (рис. 7.2). Эти от- верстия действуют как вторичные монохроматические точечные и син- фазные источники *), а световые пучки от них перекрываются по- зади экрана Л. Интерференция на- блюдается в области перекрытия световых пучков. Предположим, что интерферен- ционная картина наблюдается в пло- скости хОу, нормальной к перпендикуляру СО, восстановленному в середине отрезка, соединяющего точки Sr и S2, а ось х выберем параллельной Si52 (рис. 7.3). Пусть d— расстояние между отверстиями, а а— расстояние меж- ду отрезком SiS2 и плоскостью наблюдения. Для точки Р (х, у), лежащей в плоскости наблюдения, имеем Рис. 7.2. Опыт Юнга. д; — (la) A6) *) Такие источники создают направленное излучение, о чем подробно говорится в теории дифракции (см. гл. 8).
246 следовательно, ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [гл. 7 „2 ~2 О J ' О\ Разность геометрических путей света от S2 и Si до Р можно представить в виде л 2«г .„. Вследствие малости длин волн видимого света интерференционная картина У Рис. 7.3. Интерференция света от двух тачечных источников. будет наблюдаться, только если d значительно меньше а. Тогда при условии, что х и у тадже малы по сравнению с а, находим 52 + ?1-2а D) и, отбрасывая члены второй и высших степеней величин dla, xla и у/а, A$ = xd/a. E) Если п— показатель преломления среды (предполагается, что она однородна), в которой происходит опыт, то оптическая разность хода от S2 a S± до Р равна nxd ,а ' а соответствующая разность фаз ¦ _ 2л nxd К о- ' F) G) Так как угол SiPS% очень мал, то допустимо считать, что волны от St и S, движутся к Я по одному и тому же направлению, и интенсивность можно рассчитать но формуле G.2.15); согласно G) и G.2.16) максимумы интенсивно- сти будут при nd |m[=0, I, 2, ... а минимумы интенсивности при ~~шГ (8а) (86) Таким образом, интерференционная картина в непосредственной близости от О состоит из светлых и темных полос, называемых интерференционными поло- сами (рис. 7.4). Они находятся на равных расстояниях друг от друга и на- правлены под прямым углом к линии StS-z, соединяющей оба источника. Расстояние между соседними яркими полосами равно aXJnd. В любой точке
§7 3! ДВУХДУЧЕВ\Я ИНТЕРФЕРЕНЦИЯ ДЕЛЕНИЕ ВОЛНОВОГО ФРОНТА 247 интерференционной картины число т, определяемое соотношением 6 АУ (9) Рис 7 4 Интерференционные Юнга полосы в опыте называется порядком интерференции в этой точке; следовательно, светлым по- лосам соответствуют целые по- рядки 7.3.2. Зеркала Френеля и дру- гие аналогичные устройства. Ис- торически опыты Юнга сыграли важную роль в становлении вол- новой теории свега Они также дали метод (хоти и небольшой точности) измерения длины вол- ны монохроматического света с помощью исключительно простой аппаратуры Для этого необходи- мо только измерить d, а и расстоя- ния между полосами, которые в воздухе (п <— 1) равны dkjd Однако в таком опыте свет от первичного источ- ника S достигает области взаимодействия пучков не теми путями, которые опи- сываются законами геометриче- ской оптики, чтобы показать не- существенность =>того обстоя- тельства для осуществления ин- терференционных эффектов, впо- следствии бычо предложено мно- го других способов, позволяю- щих получать когерентные ис- точники В качестве одного из приме- ров назовем устройство, извест- ное под названием зеркал Фре- неля (рис 7 5) Свет от точечно- го неiочника S падает на два ппоских зерката ML и .'VI , распотоженные под небольшим \глом друг к другу и, отражаясь от них, образует два мнимых изображения источника St и S2, которые действуют как когерентные источники Плоскость SSiS2, очевидно, нормальна к линии пересечения зеркал и пересекает ее в точке А, Ве- ли SA =Ь, то и, значит, перпендикуляр к сере- дине отрезка S^SZ также прохо- <. __. дит через А. Расстояние между St *2_, и 52 равно d=2bsma, A0) Рис 7 5 Зеркала Френеля Рис 7 6 Зеркало Лло: где а — угол между зеркалами • Еще проще устроено зеркало Ллойда (рис. 7.6). Точечный источник Sx помещается на некотором расстоянии от плоского зеркала М очень близко к плоскости его поверхности, так что свет отражается зеркалом под углом, очень близким к скользящему Здесь когерентными источниками служат первичный источник Si и его мнимое изображение в зеркале S2 При этом перпендикуляр к середине отрезка SXS^ лежит в плоскости зеркала.
248 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 Можно упомянуть еще два других устройства подобного рода.' Бипризма Френеля (рис. 7.7) образуется двумя одинаковыми призмами с небольшим преломляющим углом, которые сложены основаниями и имеют параллельные преломляющие ребра. Пучок лучей от точечного источника S делится в резуль- тате преломления на два перекрывающихся пучка. Преломленные пучки не строго стигматичны, но вследствие малости преломляющего угла и ма- лости угловой апертуры пучков мы можем пренебречь этой аберра- цией и считать, что призмы образуют два мнимых изображения 5t и 52 источника S. Билинза Бийе (рис. Рис. 7.7. Бипризма Френеля. 7-8) состоит из выпуклой линзы, ра- зрезанной по диаметру на две части, немного раздвинутые в направлении, перпендикулярном к оптической оси; они образуют действительные изображения 5t и 52 точечного источника S. Во всех таких устройствах с первичным точечным источником интерферен- ционные полосы наблюдаются в монохроматическом свете в любой плоскости области перекрытия расходящихся пучков от источников S, и S2 (показано штриховкой на рис. 7.5—7.8). Про такие полосы говорят, что они не локали- зованы. Обозначая, как и раньше, расстояния S,P и S2P через st и s2, найдем,что геометрическое место точек Р, для которых разность фаз для волн, идущих от S2 и S,, постоянна, представляет собой поверхность, определяемую урав- нением ' sa—Sj = const. A1) Следовательно, максимумы и минимумы результирующей интенсивности об- разуют семейство гиперболоидов с осью вращения SiS.,, имеющих общие фокусы в Si и Sa. Интерференционные полосы в плоскости, нормальной к пер- пендикуляру СО, восстановленному к середине отрезка SiS2,— это сечения Рис. 7.8. Билинза Бийе. Рис. 7.9. Опыт Меслина. таких гиперболоидов, представляющие собой гиперболы.' Однако вблизи О они, как мы видели в п. 7.3.1, близки к прямым эквидистантным линиям, на- правленным под прямым углом к SiSa. В плоскости, нормальной к S^,, сече- ния гиперболоидов имеют вид концентрических окружностей, по такие полосы невозможно наблюдать с помощью описанных кьнме устройств. Однако их мож- но наблюдать в опыте Меслина, где половинки разрезанной линзы Бийе сме- щены вдоль оси, а не в поперечном направлении (рис. 7.9). В этом случае источники Si и S2 расположены в разных точках оптической оси, и соответст- вующие световые пучки перекрываются в области между ними. Полосы могут наблюдаться в плоскостях, нормальных к S1S2, в виде концентрических окруж- ностей с центром на оси. Так как область перекрытия пучков ограничена плоскостью, проходящей через оптическую ось, то видны только полуокруж- ности. 7.3.3. Интерференционные полосы в квазимонохроматическом и белом свете. До сих пор мы предполагали, что первичный точечный источник испус- кает монохроматическое излучение, Теперь мы .это ограничение снимем.
§ 7.3] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ ВОЛНОВОГО ФРОНТА 249 и предположим, например, что зеркала Френеля освещены полихроматическим светом от точечного источника 5 (см. рис. 7.5). Как мы увидим далее (см. п. 7.5.8), такой свет можно представить как совокупность иекогереитных моно- хроматических компонент, занимающих некоторый частотный диапазон. Каж- дая компонента образует свою интерференционную картину, аналогичную «писанной выше, а полная интенсивность в любой точке равна сумме интенсив- ностей в таких монохроматических картинах. Предположим, что диапазон длин волн источника равен А?.„, а средняя длина волны Хо. Центральные максимумы всех монохроматических интерференционных картин, соответствующие равен- ству путей от S, и S.,, совпадают в точке О, но в любом другом месте появляю- щиеся картины смещены друг относительно друга, ибо их масштаб пропорцио- нален длине волны. Максимумы т-го порядка займут в плоскости наблюдения участок Ах, равный, согласно (8), A2) Рассмотрим сначала случай, когда диапазон длин волн ДХ0 мал по сравне- , нию со средней длиной волны Ао, т. е. когда 4Ь<^1. A3) 1 Назовем свет, удовлетворяющий этому условию, квазимонохроматическим светом *). Если для поля наблюдения или, согласно (9), \^\<-щ, A5) -то можно пренебречь величиной Ах по сравнению со средним расстоянием akjnd между соседними максимумами и считать, что для всех компонент интер- ференционные картины совпадают. Тогда в плоскости наблюдения появляются такие же полосы, как и в случае строго монохроматического света с длиной волны Кц. Если свет квазимонохроматический, но условие A5) не выполняется, полосы будут менее отчетливы, чем в монохроматическом свете, и полная интенсивность будет зависеть от распределения интенсивпостей среди моно- хроматических компонент. Если свет не квазимонохроматичен, т. е. не выполняется условие A3), то наблюдаемая картина зависит также от спектральной чувствительности применяемого приемника излучения. В практически важном случае белого- света и визуального наблюдения эффективный диапазон длин волн прости- рается приблизительно от 4000 до 7000 А и А>.0/А,о примерно равно 1/2. В этом случае на том месте, где при монохроматическом освещении должна была бы , находиться полоса нулевого порядка, мы увидим центральную белую полосу; ¦ по обе стороны от нее располагаются окрашенные максимумы и минимумы, аза ними — пространство, которое кажется глазу равномерно освещенным белым светом. Однако это не обычный белый свет. Так, на расстоянии х от центральной •) Так как %0=2лс/ш0, tq A3) можно также записать в виде 4^i, где Дю0 — эффективный частотный диапазон, а ю0 — средняя частота.
250 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. Т полосы находятся, согласно (8), максимумы интенсивности для и минимумы интенсивности для . nd х .,135 Х« = ?^' l«l=y.y. у. --• Следовательно, если такой свет падает на щель спектрографа, параллельную интерференционным полосам в монохроматическом свете (т. е. х остается по- стоянным для света, прошедшего сквозь щель), то спектр будет пересекаться светлыми и темными полосами, параллельными щели. Это один из примеров так называемого канавчатого спектра;,расстояние между соседними светлыми полосами в нем равно al(nd\x\). Из дальнейшего станет очевидным, что картина интерференционных полос в белом свете может оказаться полезной при интерферометрии, так как в неко- торых особых случаях она позволяет обнаружить в монохроматическом свете полосу, соответствующую нулевой разности хода. Все, что мы говорили о цент- ральной полосе (как о максимуме интенсивности), полученной с помощью зер- кал Френеля, справедливо также для полос, создаваемых бипризмой Френеля, билинзой Бийе и устройством Юнга. Однако при использовании зеркала Ллойда полоса, лежащая в плоскости зеркала, соответствует минимуму интенсивности и в белом свете она кажется черной. Это объясняется тем, что при отражении от зеркала фаза волны независимо от ее длины меняется на п (см. п. 1.5 2). В опыте Меслина в центре картины также находится минимум интенсивности, так как (см. и. 8.8.4) после прохождения фокуса волна меняет фазу на л. 7.3.4. Источник в виде щели; видность полос. Все сказанное выше отно- силось к точечному первичному источнику. Однако все реальные источники имеют конечные размеры, и поэтому необходимо выяснить влияние размеров на интерференционную картину. Описание реальных физических источников требует привлечения теории атомного строения, выходящей за круг вопросов, рассматриваемых в настоящей книге, однако для наших целей можно пользо- ваться идеализированным представлением и считать, что источники состоят из большого числа точечных взаимно некогерептных элементов. Интенсивность в любой точке волнового поля равна тогда сумме интенсивностей от каждого точечного источника. В устройствах, описанных выше (исключая опыт Меслина), интерференци- онные полосы перпендикулярны к плоскости, в которой находятся первичный точечный источник S и вторичные источники Si и S2, и, следовательно, если S смещать перпендикулярно к этой плоскости, то полосы будут просто смещаться вдоль своих направлений. Таким образом, использование линейного источника (или на практике достаточно узкой щели), расположенного в этом направлении, не приведет к ухудшению четкости интерференционных полос, по крайней мере в тех случаях, когда их кривизна незначительна. Аналогично отверстия в опыте Юнга можно заменить узкими щелями, параллельными щели источника. Таким путем можно увеличить интенсивность интерференционной картины, хотя здесь и возникает дополнительная трудность, связанная с ориентацией источника. Для получения более яркой картины необходимо увеличить ширину щели источника, но это приводит к тому, что полосы станут менее четкими. Рассмот- рим в качестве примера зеркала Френеля. Если источник 5 сместить в положе- ние 5' под прямым углом к SA в плоскости SS^z (рис. 7.10), то и вторичные источники Si и Si переместятся в положение Si и Sj и с точностью до членов второго порядка расстояние d между ними и, следовательно расстояние между полосами, не изменккч; однако центральная полоса переместится из точки О
7.3} ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ ВОЛНОВОГО ФРОНТА 251 в точку О', так как она расположена в месте пересечения перпендикуляра к се- редине отрезка S[S'2, проходящего через А, с экраном. Если SS'~= t, (считая направление, указанное на рис, 7.10, положительным), то SiSi= SsS'2-= ? и 00' = ^^. A7) Следовательно, если оптическая разность хода в Р для света от источника S равна A!jf, то, согласно F), оптическая разность хода для света от источ- ника 5' составит — -00' = Atf где ?> = (a—b)nd ab Dt,, A8) A9) Соответствующая разность фаз запи- сывается в виде B0) Рис. 7.10. Зеркала Френеля, освещаемые ис- точником в виде щели. Пусть источником служит щель шириной е с центром в 5, и пусть число точечных источников, образующих щель, так велико, что ее можно считать непрерывным источником. Представим себе далее, что щель разделена на эле- ментарные полоски, перпендикулярные к плоскости SSi$2- Если i,dt,— ин- тенсивность в точке Р света, посылаемого элементарной полоской с помощью лишь одного зеркала, то интенсивность в этой точке света, посылаемого элемен- тарной полоской S', равна, согласно G.2.17), B1) B2) а полная интенсивность в Р— величине а/2 =2A \ Подставляя B0) в B1) и вычисляя интеграл, получим COS ?А*)}. где h-- he. Следуя Майкельсону, примем за меру четкости полос в точке Р их «вид- ность» If3, определяемую как ду/д =__ 'макс 'мин уг^о\ * макс ~|" ' мин где /макс и /мин—максимальная и минимальная интенсивности в непосред- ственной близости от Р. Очевидно, "У3 достигает максимальной величины, рав- ной единице при /MFI, ^-- 0, как и в случае интерференции света от двух одина- ковых монохроматических точечных источников, и уменьшается до нуля, когда и полосы исчезают. R нашем случае nDe\ 1+- B4)
252 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 и, значит, ~к aDe 17 B5) Из B5) следует, что видность ^зависит от ширины источника е (рис. 7.11). Мы видим, что видность превышает 0,9, еслие меньше XJ4D или, согласно B0), если разность фаз в точке Р ' - от элементов источника не больше я/2. Если с помощью этого несколь- ко произвольного условия опреде- лить максимальную ширину щели, при которой видность полос еще остается удовлетворительной, то на основании A9) получим e^St =Sj %oab!i (a—b)nd пли, используя (Ю). B6) О -8 (а—b) n sin a ' Рис. 7.11. Изменение видиости полос при уве- личении ширины источника в виде щели (зерка- -~. ла Френеля). где, как и раньше, а — угол меж- ду зеркалами. Разумеется, допустимая вели- чина е увеличивается с уменьшени- ем (а—Ь), т. е. по мере приближения плоскости наблюдения к линии пересече- нии зеркал. Например, в типичном случае а = 2', а = 120 см, Ъ = 100 см, Яц— 5500 А и п — 1 имеем е<;0,7 мм; расстояние между светлыми полосами, согласно (8) и A0), рассчитывается по формуле dkJ2bn sin а, и в нашем слу- чае оно равно 0,57 мм. Подобные же рассуждения' относительно ширины источника применимы к бипризме Френеля, билинзе Бийе, к устройству Юнга. С зеркалом Ллойда положение иное, так как смещение источника S в направлении, перпендику- лярном к плоскости зеркала, вызывает смещение его изображения в противо- положном направлении. Следовательно, с источником в виде щели конечной ширины в элементарных кар- тинах центральные минимумы в плоскости зеркала совпала- ют, но расстояние между мини- мумами различно, так что вид- ность полос уменьшается с увеличением расстояния от плоскости зеркала. 7.3.5. Измерение опти- ческой разности хода; интер- ферометр Рэлея. Воспользо- вавшись выводами теории дифракции, можно утверждать, что свет от вто- ричных источников Si hSj в опыте Юнга имеет наибольшую интенсивность в направлении геометрических лучей от первичного источника 5. В опыте Юнга эти лучи за экраном расходятся, но с помощью линзы, поставленной пе- ред отверстиями (рис. 7.12), их можно свести в точку О, сопряженную отно- сительно линзы с S. Тогда интенсивность интерференционной картины вблизи О увеличивается, и можно наблюдать интерференционные полосы при отверстиях 5! и S2, находящихся значительно дальше друг от друга. Расстояние между со- седними светлыми полосами по-прежнему равно aXjnd, и если линза дает стиг- матическое изображение точки S, то, согласно принципу равенства оптического О Рис. 7.12. Схеме, иллюстрирующая применение линзы в устройстве Юкга.
§ 7.3] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ ВОЛНОВОГО ФРОНТА 253 пути, полоса нулевого порядка будет располагаться в О. Если же линза не дает стигматического изображения, полоса нулевого порядка сместится из О на величину, зависящую от оптической разности хода от 5 до О через оба отвер- стия. При оптической разности хода ASf смещение будет в Дш раз больше рас- стояния между соседними светлыми полосами, где Am = -?-. B7) Очевидно, что такое устройство можно использовать для количественного испытания качества линз, как это было сделано Майкельсоном [1]. Если одно из отверстий неподвижно относительно центра линзы, то, измеряя Дт при раз- личных положениях другого отверстия, можно определить отклонение волно- вого фронта, идущего из S, от сферичности после прохождения линзы (волновая аберрация). Аналогично, если прозрачная пластинка толщиной / с показате- лем преломления га' помещена в пучок света, идущий от S2, то оптическая длина пути lSSaO] увеличивается на (п'— пI, и порядо^ интерференции в точке О изменится на величину Am — —jt—— . (/о) Измеряя Дот, I и Я„, можно определить разность (п'— п) между показателями преломления пластинки и окружающей среды. На этом основано устройство интерферометра Рэлея [2], приме- няемого для точных измерений по- с 7j f* казателей преломления газов. Схе- -fr f I ма современной модели этого при- ^^^~— 3- бора показана на рис. 7.13. Свет ?ЁТ от щели S коллимируется линзой Li и затем падает на две другие а} щели Si и 52, параллельные 5. » Ci г Параллельные пучки света от S, и I А | | (%>' 52 проходят через разные газовые кюветы 7\ и 1\ и собираются лин- зой L3, в фокальной плоскости ко- /?? i торой образуются интерференци- онные полосы, параллельные ще- Рис' 7!3- Схема интерферометра Рэлея. ЛЯМ *). Помещение Газовых КЮВет «-"Р™*™"™ сечение. S-вертикальное сечение. в пучки света заставляет значи- тельно увеличить расстояние между щелями SL и 52, вследствие чего интерфе- ренционные полосы располагаются тесно, и для их наблюдения требуется боль- шое увеличение. Ширина щели S также не может быть большой, и, следова- тельно, яркость картины невелика. Так как увеличение требуется только в на- правлении, перпендикулярном к полосам, то для этой цели хорошо подходит цилиндрический окуляр в виде тонкой стеклянной палочки с длинной осью, параллельной полосам. Картина, рассматриваемая таким образом, значительно ярче, чем при использовании сферического окуляра. Применение цилиндриче- ского окуляра имеет еще и другое важное преимущество, позволяя получить ьторую фиксированную систему полос с таким же расстоянием между полосами, как и у главной, но образованную светом от источников Sl и S2, прошедшим ниже газовых кювет. Вторая система полос может служить шкалой для отсчета. С помощью стеклянной пластинки G эту шкалу смещают по вертикали так, что- бы ее верхний край соприкасался с нижним краем главной системы. Резкая линия раздела между ними — это край пластинки G, наблюдаемый через линзу •) Точное распределение интенсивности в фокальной плоскости линзы L2 можно на.йти иа теории дифракции Фраунгофера (см. § 8.5).
254 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 2-2. Следовательно, определение смещения главной системы полос, обусловлен- ного изменением оптических путец в кюветах Тх и Тг, целиком зависит от ост- роты зрения глаза, которая, вообще говоря, велика, и таким способом можно обнаружить смещения, примерно равные 1/40 порядка. Случайные смещения в оптической системе также становятся менее существенными, так как сказы- ваются одновременно на обеих системах полос. На практике удобнее компенсировать оптическую разность хода, а не считать полосы. Это делается следующим образом: свет, выходящий из газовых кювет, проходит через тонкие стеклянные пластинки, одна из которых Ct неподвижна, а другая Са может вращаться вокруг горизонтальной оси, что позволяет плавно изменять оптическую длину пути света, выходящего из 52. Такой компенсатор калибруется в монохроматическом свете для того, чтобы определить величину поворота пластинки, соответствующую смещению на один порядок в главной системе полос. В этом случае система полос служит нуль-индикатором равенства оптических путей [SSiOl и [5S.0]. Обычно работа с прибором происходит следующим образом: газовые кюветы откачивают, и в белом свете с помощью компенсатора примерно совмещают полосы главной системы и шкалы; затем добиваются точного совпадения пулевых порядков в монохроматическом свете, после чего одну из кювет заполняют исследуемым газом и снова, сперва в белом свете, а йотом в монохроматическом совмещают, используя компенсатор, нулевые порядки. Разница между двумя установками компенсатора позволяет определить по его калибровке смещение порядка Д/я в главной системе полос, вызванное присутствием газа в кювете. Показа- тель преломления этого газа п' находят из B8), а именно: (п'-1)=?дт, B9) где / —> длина газовой кюветы. При обычных значениях / = 100 см, А.о= 5500 А. и точности установки в 1/40 порядка можно обнаружить изменение («.'—¦ 1) *) около 10 ~s. Оптические пути от St и S3 до места наблюдения интерференционной картины проходят среды с различной дисперсией; поэтому, в отличие от простого случая, рассмотренного в п. 7 3 3, нулевые порядки в свете разных длин воли, вообще говоря, не совпадают, и в белом свете отсут- ствует совершенно белая полоса. У наименее окрашенной полосы дт/дК0—0 для некоторой сред- ней длины волны Я,=?.о (в видимой области спектра), которая зависит от цветовой чувствитель- ности глаза. По аналогии с терминологией, принятой при описании линз, эта полоса называется ахроматической. Если компенсатор вводит оптическую разность хода Д^, то порядок интер- ференции в точке О равен Поэтому в точке О ахроматическая полоса будет тогда, когда При такой установке компенсатора нулевой порядок картины в монохроматическом свете может не попасть в точку О, так как для их совпадения требуется, чтобы &го несовпадение может оказаться достаточно большим, цтобы затруднить идентифи кацик) полосы нулевого порядка в монохроматическом свете, и поэтому приходится прибегать к пред- варительным измерениям при малом давлении или с короткой кюветой. Заметим также, что ахроматическая полоса хорошо распознается, только если в тех.точ- ках картины, где (дт/д?^)^ =0, область значений т для длин волн видимою спектра достаточно мала. При наблюдении в белом свете пути интерферирующих волн в средах с одинаковой дис- персией должны быть по возможности равными. *} Величина (п'—1) для обычных газов порядка Ю~* (см. табл. 1.1).
§ 7.3] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ ВОЛНОВОГО ФРОНТА 255 Большую чувствительность в принципе можно получить, увеличивая I, но этому препятствуют трудности контроля температуры. По той же причине в модели прибора, предназначенного для измерения разности показателей пре- ломления жидкостей, применяются только короткие кюветы. Кроме того, раз- ность хода, которую можно скомпенсировать, ограничена, и поэтому при боль- шой разнице показателей преломления в кюветах длина их должна быть про- порционально уменьшена. 7.3.6. Измерение угловых размеров источников; звездный интерферометр Майкельсона. Мы }же видели (п. 7.3.4), что в опыте Юнга четкость полос зависит от размеров источника в направлении, соединяющем от- верстия St и 5а. На этом эффекте основан метод измерения угло- вых размеров малых источников. Предположим, что в теле- скоп, объектив которого закрыт диафрагмой с двумя небольшими отверстиями St4 S» с расстояни- ем d между ними, рассыатри- рис. 7.14. Объектив телескопа, закрытый диафраг- ваются два удаленных квази- мой с двумя отверстиями и освещенный светом от Монохроматических точечных , ДВУХ Удаленных точечных источников. источника S и S', испускаю- щих свет с эффективной длиной волны Хе, причем угловое расстояние меж- ду ними равно 9 (рис. 7.14). Каждый из источников S И S'даст в фокальной плоскости объектива интерференционную картину с одинаковым расстоянием между полосами. Если источники S и S' некогерентны, то общая картина об- разуется суммированием в каждой точке интенсивностей каждой картины. Пусть ./V — основание перпендикуляра, опущенного из Sx на SS2; тогда SiN лежит в плоскости волнового фронта, идущего от источника S, так что в точке Р в фокальной плоскости оптическая разность хода для света от 5 равна Аналогично, если N'— основание перпендикуляра, опущенного из St на S'S2, то оптическая разность хода в точке Р для света от S' равна А <р t Г Л7' С 1 I ГС Р1 ГР р] /о t \ 1ЛоТ — I/V O2J -\- |iJ,/j 1 1 J ' \" / Следовательно, интерференционные картины от S' и S смещены одна относи- тельно другой на Am порядков, где 1 _ 1 [A"S,,l-{jysa] 1 _ 6rf An Лц Am — - >.„ C2) при п.- 1 и малом в. Когда Аш = 0, 1, 2, ..., C3а) максимумы интенсивностей в интерференционной картине, создаваемой источ- никами S и S', совпадают, и полосы в общей картине будут наиболее четкими, В другом случае, когда Am = V,, s/3, 'Д. •••> C36) максимумы интенсивностей в картине, получающейся от S, совпадают с ми- нимумами интенсивности в картине от S'; тогда полосы в общей картине ста- новятся наименее отчетливыми и исчезают при равенстве обеих интенсивностей (от S и S'). Таким образом, в изменении четкости полос наблюдается периодич- ность при увеличении расстояния между отверстиями от нуля. В частности, первый минимум отчетливости полос будет при rf = A,0/B0), C4) и, если он наблюдается, то отсюда можно определить 6, зная й и Х„,
256 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 Рассмотрим теперь более общий случай протяженного квазимонохромати- ческого первичного источника с центром в 5. Как и прежде, предположим, что такой источник состоит из взаимно некогерентных точечных источников. Мож- но представить себе, что он состоит из элементарных полосок, расположенных, перпендикулярно к линии, соединяющей отверстия Sj и S2. Найдем полную интенсивность в точке Р фокальной плоскости объектива, суммируя вклады интенсивности, обусловленные каждой такой полоской. Обозначая через t\?f оптическую разность хода в Р для света, идущего от элемента S источника, находим, что для данного d положение Р определяется величиной A?f. Оптиче- ская разность хода для света, идущего от элемента, расположенного под углом а. к S, равна, согласно C2), величине Ае^+ ad, а соответствующая разность фаз — величине б (а, A37) = ??(№+ad). C5) Допустим снова, что протяженный источник образован таким большим числом точечных источников, что мы можем считать его непрерывным. Тогда, согласно G.2.15), полная интенсивность в точке Р равна / (d, Дс5О = \ it da + $ i, da + 2 $ Videos 6 da, C6) где гг(а, A?f)da и it(a, A?f)da — интенсивности в точке Р от одной элементар- ной плоскости, когда свет приходит в эту точку только через одно отверстие. Интегрирование проводится по всем значениям а, соответствующим всем элементам источника. В п. 7.3.5 уже отмечалось, что вследствие дифракции вторичные источники, образованные отверстиями Si и S2, имеют свойства направленности, однако если этим можно пренебречь *) в области значений а, входящих в C6), то мы вправе написать tja, ДЛ = «,(<*. ДЛ = Ч«)/(Д<5Г), C7) где i (а.) пропорционально интенсивности соответствующих полосок источ- ника, а f (Agf) характеризует направленность излучения Sx (или S8). Исполь- зуя C7) и C5), получим из соотношения C6) / (d, Д<У) = Щ (ДсУ) \ i (а) {1 + cos 6} da = ^fiAtf) h + C(d)cos (~ ASP)— S(d)sin C^A<&>)\, C8) где P = 2\i(a)da, ) С (d) = 2 С ((a) cos (p ad) da, S (d) = 2 С i (a) sin (^ad) da. | J Чл<|/ J \.л0// Если допустить еще, что изменение величины f(A^) мало по сравнению с из- менением cos BяAqf'/?.„) и sin BлА!^/Х0), то положения максимумов и миниму- мов / будут определяться соотношением *) т. е. ^ёА<?) = -"§-• D0) *) Это приближение оправдано, если отверстия достаточно узки, что будет показано в § 8.5.
§ 7.3] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ ВОЛНОВОГО ФРОНТА 257 Из C8) и D0) находим дяч экстремальных значений/ и, следовательно, видность полос, определяемая B3), равна '(«0=-- D1) D2) Вид функции 9^(й) для нескольких различных зависимостей i (а) показан па рис. 7.15. Рис. 7.15, и соответствует случаю двух точечных источников, ко- торые мы кратко рассмотрели в начале этого раздела; рис. 7.15, б— однород- ному прямоугольному источнику со сторонами, параллельными линии, соеди- няющей отверстия Sj и S2; очевидно, в этом случае функция I'3 (d) совпадает л) Рис. 7.15. Изменение видности полос в зависимости от расстояния между отверстиями (см. рис. 7.14). с—два одинаковых точечных источника с углопым расстоянием В, б - однородный прямоугольный трешник углово;[ ширины 6 со сторонами, параллельньши линии, соединяющем отверстия в—источник ь виде круглого диска с угловым диаметром в=2р и распределением интенсивности / (Р)оо( Эу — Р2)* , где В — угловой радиус, отсчитываемый от центра [3] с функцией видности, показанной на рис. 7.11. На рис. 7.15, в источником слу- жит круглый диск с радиальной симметрией. Кривая / соответствует постоян- ной интенсивности, кривые // и /// — разным степеням ее убывания от центра к краю. Можно рассмотреть и обратную задачу; если известны положение полос и их видность в зависимости от расстояния между отверстиями d, то из D0) и D2) определяются функции С и 5, за исключением постоянного множителя пропор- циональности Р и его знака. Последний обычно находят из физических сооб- ражений. В таком случае распределение интенсивности i (а) по источнику получается из C9) с помощью обратной теоремы Фурье. Подобные измерения, хотя они принципиально и возможны, довольно трудны. Однако если заранее известно, что источник имеет одну из форм, соответствующих рис. 7.15, то его угловые размеры можно найти, просто определяя наименьшее значение й, при котором видность полос минимальная. Это условие осуществляется, когда d = Л?10/е, D3) где, как мы видели в C4), А — 0,5'для двух точечных источников с угловым расстоянием 9 между ними; Л = 1,22 для однородного круглого источника в форме диска с угловым диаметром 0 и А > 1,22, если у краев диск тем- нее, чем в центре. Описанный метод был предложен впервые Физо [141 и позднее Майкельсо- ном [5] для определения угловых размеров астрономических объектов, которые слишком малы или слишком далеки, чтобы это можно было сделать недиафраг- ыированным телескопом (см. п. 8.6.2). Такие объекты испускают белый свет, и поскольку его интенсивность очень мала, наблюдения должны проводиться 17 М кЛПп Ч RrtTit.fh
258 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 Рис. 7.16. Звездный интерферометр Майкель- сона. в белом свете *). Следовательно, необходимо предположить, что в D3) Я„— эффективная длина волны, зависящая от распределения интенсивности света по частотам и от цветовой чувствительности глаза. С такими ограничениями этим методом успешно пользовались для измерения угловых диаметров спут- ников планет FJ и угловых расстояний между компонентами двойных звезд, диаметры которых малы но сравне- нию с расстоянием между ними [7]. Однако попытки применить его для определения угловых диаметров одиночных звезд практически не удались, так как из-за малости этих диаметров полосы оставались четкими даже при наибольших рас- стояниях между отверстиями, еще допустимых с существовавшими тогда телескопами. Майкельсон [8] преодолел возникшие труднос- ти, построив свой звездный интер- ферометр (рис. 7.16). Отверстия St и S2, диафрагмирующие объектив телескопа, неподвижны, и свет до- стигает их, отразившись от симметричной системы зеркал Ми Мг, М3 иЖ,, установленных на жесткой ферме перед телескопом. Внутренние зеркалаМ3 и М4 неподвижны, а внешние Mt и М.2 могут симметрично смещаться в направ- лении линии, соединяющей Sl и S2. Если оптические пути [Л^/ИД] и [Л42Л1452] равны, то оптическая разность хода для света от удаленного точечного источ- ника одинакова как в St и 52, так и на ML и М.2, и, следовательно, внешние зеркала играют роль подвижных отверстий в методе Физо. Таким образом, наи- меньший угловой диаметр, который можно измерить подобным устройством, определяется не диаметром объектива телескопа, а максимальным расстоянием между внешними зеркалами. Другое достоинство данной системы заключается в том, что расстояние между полосами, которое зависит от расстояния между S, и 52, остается постоянным при изменении расстояния между подвижными зеркалами. Такой интерферометр бы,ч смонтирован на большом отражатель- ном телескопе (диаметр 2,5 м) обсерватории Маунт Вильсон, выбранном только из-за прочности своей механической конструкции. При расстоянии между отверстиями 5( и S2 в 1 !4 см расстояние между полосами в фокальной плоскости равнялось примерно 0,02 мм. Максимальное расстояние между внешними зеркалами составляло 6,1 м, наименьший измеримый угловой диаметр (при А,„= 5500 А) — около 0,02". Вследствие неизбежных механических дефектов понадобилось еще два вспомо- гательных устройства, обеспечивающих правильную установку внешних зеркал во всех положениях. Чтобы свести геометрические световые пучки от 5, и S2 в фокус, применялась плоскопараллельная стеклянная пластинка Сг, которую можно было наклонять в любую сторону. Другая плоскопараллельная стеклянная пластинка С? переменной точщины использоваласо для компенса- ции неравенства оптических путей iMiMgSJ и [M1MiS2i.3ra компенсация не- обходима, ибо полосы в белом свеге видимы только вблизи нулевого порядка. Ее контролировали, наблюдая канавчатый спектр в небольшой спектроскоп. Первой звездой, у которой удалось измерить угловой диаметр, была Бс- тельгейзе (а Ориона). Полученная величина равнялась 0,047". По расстоянию *) Обшая проблема наблюдения интерференционных полое от протяженного источника с бесконечным набором длигг оолн изящно разобрана в теории частично когерентного госта (см. гл 10). В рамках этой теории действие звездною интерферометра Майкельсона кратко рас- сматривается в § 10.4.
§ 7.4J стоячие волны 259 между этой звездой и Солнцем (определенному тригонометрически) был найден ее линейный диаметр, оказавшийся равным 4,1 • 108 км, что почти в 300 раз боль- ше диаметра Солнца A,4-10° км) и превышает диаметр земной орбиты C-108 км). Таким способом были измерены диаметры только нескольких звезд. Все они, подобно Бетельгейзе,— гиганты с линейными диаметрами во много раз боль- шими, чем у Солнца. Небольшое число измерений звездных диаметров частично объясняется трудностью наблюдений, связанной с турбулентным возмущением атмосферы, хотя М айкельсон и Пиз показали, что при наблюдении с интерферо- метром эти вреди ые влияния сказываются значительно меньше, чем при наблю- дении с обычным телескопом большого диаметра. Изменение показателя прелом- ления возд\ха перед небольшими отверстиями интерферометра смещает всюин- терференциоипю картину в целом и полосы остаются различимыми, если толь- ко это смещение происходит медленно. При наблюдении в таких же условиях в телескоп с недиафрагмированным объективом изображение звезды оказывает- ся сильно искаженным. Однако дело не только в трудности наблюдений; расстояние между внешними зеркалами в 6 ж совершенно недостаточно, так как подавляющее большинство звезд мало отличается по своему диаметру от Солнца. На расстоянии же ближайшей звезды солнечный диск был бы виден под углом лишь 0,007" и для наблюдения первого исчезновения полос расстоя- ние между зеркалами должно было бы равняться примерно 20 м. Постройка такого большого интерферометра трудна вследствие высоких требовании, предъявляемых к жесткости механических соединений между зеркалами и окуляром. Инструмент, подобный звездному интерферометру Майкельсопа, исполь- зуется в радиоастрономии для определения угловых размеров небесных радио- истечников [9]. Он состоит из двух разнесенных антенн, сигналы с коюрых подаются на сСщий детектор системы. Здесь технические трудности также воз- растают по мере увеличения расстояния между антеннами вследствие внесе- ния непостоянной рьзнссти фаз на пути от антенн к детектору. Браун и Твисс [10] создали другой ткп радиоинтерферометра, свободный от итого недостатка, В предложением ими устройстве сигналы, принятые антеннами, детекти- руются независимо, а углсоые размеры источника находят из измерений корре- ляции в флуктуации nmei <: п>ости сигналов как функции расстояния между антеннами. Они также пока^ь. ь 111], что аналогичное устройство может рабо- тать и в видимом свете. Свет от звезды собирается двумя вогнутыми зеркалами и фокусируется на два фотоэлемента: корреляция флуктуации фототоков изме- ряется в зависимости от расстояния между зеркалами. В таком устройстве (называемом интерферометром интенсивностей) большое расстояние между зеркалами не вызывает осложнений, и становится возможным измерение звезд значительно меньших диаметров. Принципы данного метода легче понять в рам- ках теории частичной когерентности (см. § 10.4). § 7.4. Стоячие волны В устройствах, о которых говорилось до сих пор, две интерферирующие волны распространялись вблизи точки наблюдения почти в одном направче- нии. Теперь мы рассмотрим интерференцию двух волн, распространяющихся в противоположных направлениях, например интерференцию падающем и от- раженной плоских монохроматических волн света при его падении па хорошо отражающую плоскую поверхность, Предположим, что такой поверхностью служит плоскость г = 0 с положительной осью г, направленной в сторону сре- ды, в которой распространяется падающая волна, и обозначим через пх и яа показатели преломления обеих сред (рис. 7.17). Пусть В,— угол падения, а хг— плоскость падения. Пусть далее Е"'> — электрический вектор падающей волны, а Аи и А±, как и в п. 1.5.2 —его
260 ЭЛЕМЕНТЫ ТЕОРИЯ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 параллельная и перпендикулярная компоненты относительно плоскости паде- ния. Декартовы компоненты вектора Е(/) можно получить из A.5.11), заменяя z на —г, т. е. используя, как обычно, только вещественные части. ?</> = ехр (— i%i), = — Л, sin в, ехр (— ixt), где A) B) a pi— скорость распространения в первой среде. Декартовы компоненты век- тора Е(г) отраженной волны получаются из аналогич- ных выражений (см. уравнение A.5.16), которые, если воспользоваться законом отражения A.5.7), принима- ют вид Е? = Ru cos 9, ехр (— (тг), Е'р = R_L cxp (— hr), Е'р = — #,, sin б,- ехр [ixr), - C) где Рис. 7.17. К отражению плоской^вслныо^шюской Щ 1 Амплитуды Rn и R± отраженной волны связа- А А у n ± р ны с амплитудами А п и А± падающей волны форму- лами Френеля A.5.21), т. е. пт _ n2cos9,-— nL cos 8t . _ _ nt cos 8,-— лг cos 8( , ... *•" n2cose, +«!cose, "• -^J- nicose4-)-i4cosei -1-- l°' Для упрощения предположим, что nj^ так велико, что отражательную спо- собность можно принять за единицу; тогда в пределе nJtix-^-oo последнее соот- ношение запишется в виде *) «п=Л||. #х = —Лх. F) Подставляя F) в C) и добавляя выражение для падающего и отраженного полей, получим полное поле. Следовательно, х-компонента электрического век- тора полного поля равна Аналогично ?=2Л, cose, {sin ехр{-/ sine,.{cos -*] } . Gа) Gб) Gв) Точно таким же образом мы получим из уравнений A.5.13) и A.5.16) следующие выражения для компонент магнитного вектора полного поля: (8а) (86) "*) Мы исключили случай скользящего падения (соз 0,--*О), для которого отражательная способность приближается к единице, даже когда njnx невелико; в этом случае E) дает /?ц = «=— А\ , Rx=—Ai,, что соответствует случаю зеркала Ллойда (см. п. 7.3.2).
§ ТА) СТОЯЧИЕ ВОЛНЫ 261 где использовано соотношение Максвелла п1 — У е,. Каждое из выражений G) и (8) представляет волну, распространяющуюся в направлении х со ско- ростью vjsin 6,. Амплитуда этой волны непостоянна и периодически изменяется и направлении г с периодом 2пи1/(шcos0 г) =Xo/(rtiCos0;), где ~Ка—длина волны в вакууме. Случай нормального падения (в,= 0) особенно интересен. Если Ах и Ау— амплитуды компонент электрического вектора, то, согласно A), можно напи- сать АХ[ =—Ах, Aj_= Av\ тогда из G) и (8) находим CJ) (-'("-*)]• ?-»J fi у. "^— (Ю) Мы видим, что в каждый момент времени в первой среде фаза всюду постоянна и не существует конечной скорости распространения волн. Такие волны назы- ваются стоячими. Амплитуды электрического и магнитного векторов представ- ляют собой периодические функции г. Плоскости нулевой амплитуды называ- ются узлами, а плоскости, где амплитуды экстремальны,— пучностями. Из (9) находим, что узлы электрического поля будут при ~2п. 2 (Па) а пучности — при 2л, ' 2 ' 2 ' 2 ' •** ^i0> Согласно A0) узлы магнитного поля совпадают с пучностями электрического поля, и наоборот, В частности, на отражающей поверхности находится узел электрического и пучность магнитного полей. Существование стоячих световых волн было впервые установлено экспериментально Вине- ром [12]. Его установка показана на рис. 7.18. Плоское зеркало М с наружным отражающим серебряным слоем освещалось нормально падаю- щим параллельным пучком квазимонохроматиче- ского света. Тонкий слой Р (толщиной меньше 1/20 длины волны света) прозрачной фотографи- ческой эмульсии, нанесенный на плоскую поверх- ность стеклянной пластинки G, помещался перед зеркалом М под малым углом к его поверхности. После проявления эмульсии были обнаружены черные эквидистантные полосы и прозрачные области между ними. Максимумы почернения располагались в местах пере- сечения эмульсии F с плоскостями пучностей как электрического, так и маг- нитного полей. Дальнейшие опыты с фотографической эмульсией, плотно при- жатой к вогнутой зеркальной поверхности, показали, что почернение отсутст- вует в местах, непосредственно соприкасающихся с зеркалом. Отсюда Винер сделал вывод, что почерневшие места соответствуют пучностям электрического поля, так как на поверхности зеркала находится пучность магнитного поля '¦) *) Здесь допускается, что уравнение F), полученное для диэлектрика, справедливо и ?т,\ поверхности, покрытой серебром. Теория отражения от непллов, разбираемая в гл. 13, пока- зывает, что это справедливо и в условиях опытов Винера. Рис. 7.18. Опыт Винера со стоя- чими волнами. Угол между пластипкон и зеркалом значительно преувеличен
262 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 Ртуть Прозрт/тя жограаиуеашя ' \ ' Стеклянная илаатшки Шпраслашс ff Рис 7.19. Схема ус- тройства Лмпгшана для цветной фотографии. Следовательно, фотохимическое действие прямо^связано с электрическим, а не с магнитным вектором. Такое заключение, конечно, вытекает из электронной теории. Фотографический процесс — это процесс ионизационный, при котором электрон удаляется из атомной связи галоидного серебра, а электромагнитная сила, действующая на заряженную частицу в покое, пропорциональна электри- ческому вектору (см. 1.1.34)). Аналогичные эксперименты проводились с флуоресцирующими Г13] и фо- тоэмиссионными пленками [14], служившими детекторами стоячих волн вместо фотографической эмульсии, применявшейся Винером. В обоих случаях, как и следовало ожидать на основа- нии электронной теории, максимальный эффект обнару- живался в пучности электрического поля. Применение стоячих световых волн лежит в основе способа цветной фотографии, разработанного Липпма- ноы [15]. Пластинка, покрытал прозрачной мелкозерни- стой фотоэмульсией, экспонируется в камере так, что эмульсия обращена в сторону, противоположную падаю- щему свету. Непосредственно к эмульсии прилегает от- ражающий слой ртути (рис. 7.19). Предположим для простоты, что пластинка освещается падающим нормаль- но квазимокохроматическим светом с длиной волны А.о. Так как фотохимическое действие максимально в пучно- стях электрического поля (см. уравнение A16)), то в проявленной пластинке серебро образует систему эк- видистантных слоев, параллельных поверхности эмуль- сии, с оптическим расстоянием между ними, равным Х0/2. Если теперь осветить пластинку падающим белым светом нормально к ее поверхности, то образовавшиеся слои серебра будут действовать как частично отражающие поверхности и отраженный свет будет состоять из ряда световых пучков с оп- тической разностью хода, равной целому числу, умноженному из \„. Ниже (см. § 7.6) мы рассмотрим интерференционную картину, возникающую в резуль- тате суперпозиции такого ряда световых пучков. Анализ показывает, что в этом случае при большом их числе наблюдается очень острый максимум результи- рующей интенсивности для длины волны >„0. Липпмановская пластинка дейст- вует, следовательно, как селективный отражатель света с такой же длиной волны, какой она была освещена при изготовлении. Винер [12] использовал свою установку и для исследования интерферен- ционных явлений в линейно поляризованном свете при угле падения 45°. Он нашел, что при направлении электрических колебаний в падающем свете, пер- пендикулярном к плоскости падения, темные участки в эмульсии образуют сис- тему эквидистантных параллельных полос: если же вектор электрических коле- баний в падаюшем свете лежит в плоскости падения, то почернение оказывается равномерным. Этот результат снова подтверждает, что фотохимическое дейст- вие прямо связано с электрическим, а не магнитным полем. Когда направление электрических колебаний перпендикулярно к плоскости падения, то А„ =0 и при б;- 45° получаем из G) У~2и1/ 2 I/ ' A2) следовательно, амплитуда электрического вектора, а также усредненная по времени плотность электрической энергии изменяются периодически в направ- лении оси г. Если направление колебания лежит в плоскости падение, то А х=0
§ 7.5] и из G) получим ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ АМПЛИТУДЫ 263 A3) Из A3) и A.4.54) следует, что усредненная по времени плотность электрической энергии в этом случае равна 2 2 2 til rj rj* ^1 / Е" I " и не зависит от г. Вместе с тем соотношение (8) указывает, что для магнитного поля положение оказывается обратным. Усредненная по времени плотность магнитной энергии периодически изменяется в направлении оси г, когда направ- ление магнитных колебаний в падающем свете лежит в плоскости падения, и не зависит от г, если направление магнитных колебаний в падающем свете перпен- дикулярно к плоскости падения. § 7.5. Двухлучевая интерференция. Деление амплитуды 7.5.1. Полосы, получающиеся с плоскопараллельной пластинкой. Предпо- ложим, что плоскопараллельная пластинка из прозрачного материала осве- щается точечным источником 5 квазимонохро- матического света (рис. 7.20). В любую точку Р, находящуюся с той же стороны пластинки, что и 5, приходят два луча—один, отразившийся от верхней поверхности пластинки, и другой, отразившийся от нижней ее поверхности. Интер- ферируя, эти лучи со стороны 5 образуют нело- кализованную интерференционную картину. Из соображений симметрии очевидно, что полосы в плоскостях, параллельных пластинке, имеют вид колец с осью SN, нормальной к пластинке, и при любом положении Р они перпендикулярны пло- скости SNP. Из п. 7.3.4 следует, что видность этих интерференционных полос уменьшается при увеличении размеров источника в направ- лении, параллельном плоскости SNP. Случай, когда Р находится в бес- конечности и наблюдение ведется либо глазом, адаптирована м на бесконеч- ность, либо в фокальной плоскости объектива телескооа, служит важным ис- ключением. В этих условиях оба луча, идущих от S к Р, а именно лучи SADP и SABCEP (рис. 7.21), происходят от одного падающего луча и после прохож- дения пластинки параллельны. Оптическая разность хода между ними равна № = п'(АВ + ВС)— nAN, A) где п' и п — показатели преломления пластинки и окружающей среды, а. N — основание перпендикуляра, опущенного из С на AD. Если h — толщина пла- стинки, а 8 и 9'— углы падения и преломления на верхней поверхности, то "" "" h B) N Рис. 7 20. Плоскопараллельная пластинка, освещенная точеч- ным источником света. А N = AC sin 6 = 2ft tg 0' sin 6, п' sine' =/ C) D)
264 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЬТРЫ [ГЛ 7 Из A), B), C) и D) долучаем а соответствующая разность фаз равна E) F) Следует также учитывать изменение фазы на л, которое, согласно формулам р Френеля A.5.21а), происходит при каждом отра- • жении от верхней или нижней поверхности. Пол- ная разность фаз в Р равна поэтому Gа) G6) --и Итак, 9 определяется только положением точ- ки Я в фокальной плоскости телескопа, и сле- довательно, б не зависит от положения источ- ника S. Отсюда вытекает, что при использовании протяженного источника полосы оказываются столь же отчетливыми, как и с точечным источ- ником. Так как это справедливо только для од- ной определенной плоскости наблюдения, то про такие полосы говорят, что они локализованы, а в данном случае — локализованы в бесконечности. Интенсивность в интерференционной картине меняется в соответствии с соотношением G.2.15), и из G) и G.2.16) находим, что светлые полосы распо- ложены при 2n'/icos9'±Y = m?"> л» = 0, 1. 2. •••» (8а) Рис. 7.21. Плоскопараллельная пластинка, возникновение интер- ференционных полос, локализо- ванных в бесконечности. а темные полосы при ^ |§7 (86) Таким образом, заданная полоса характеризуется постоянством величины в (а значит, и 8) и, следовательно, создастся светом, падающим на пластинку под каким-то определенным углом. Поэтому такие полосы часто называют полосами равного наклона. Если ось объектива телескопа нормальна к пластинке, то при нормальном отражении света (9 = 6' = 0) полосы имеют вид концентрических колец с центром в фокусе. Порядок интерференции максимален в центре кар- тины, где его величина т0 определяется соотношением 2n'h±^^m0X0; (9) /По не обязательно должно быть целым числом, и мы можем написать та = т1 + е, A0) где т.1— целое, кратное порядку внутренней наиболее светлой полосы, а е — меньше единицы и называется дробным порядком в центре. Для р-й от центра светлой полосы с угловым радиксом 9^ порядок интерференции тр равен, в со- ответствии с (8а), ^ A1) A2) ±^ = mpkll=[m1 — (p— а из (9) — A1) находим 2n'A(l— cos %) = </>—! +e)V
§ 7.5] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ ЛМПЛИТУДЫ 265 Итак, если Q'p мало, то по закону преломления n' 02/2 п?Щ/2п'*\ значит, согласно A2), имеем 0р2/2 У„ и 1 — cos 9:я# A3) Рис. 7.22. Плоскопараллельная воздуш- ная прослойка, возникновение полос, ло- кализованных в бесконечности. Таким образом, угловой масштаб наблюдаемой картины пропорционален V 1/А, и если е = 0, а значит, в ее центре имеется максимум интенсивности, то радиусы светлых полос пропорциональ- ны квадратному корню из положитель- ных целых чисел. Аналогичные полосы, локализован- ные в бесконечности, можно получить с воздушной плоскопараллелыюй пластин- кой, образованной внутренними плоско- стями двух прозрачных пластин (рис. 7.22). При использовании такого устрой- ства полосы наблюдают при постепен- ном изменении толщины h воздушной прослойки между пластинами. При уве- личении h полосы возникают в центре картины, и при каждом увеличении h на Хо/2 появляется новая полоса (предпола- гается, что для воздуха я.'— 1). Пластин- ки делают слегка клиновидными, для того чтобы избавиться от искажающих эффектов, связанных с отражением све- та на их внешних поверхностях. Оптическая разность хода лучей, идущих" от S до Р, для света, отраженного от внешних поверхностей, изменяется с по- ложением S так, что в случае протяженного источника получаегся в среднем равномерное освещение в фокальной плоскости. Полосы, образованные светом,, отраженным отвнутренних параллельных поверхностей, налагаются на этот фон. Если пластинка не очень тонка, то полосы соответствуют высоким поряд- кам интерференции и поэтому не видны в белом свете. Например, при h --¦ 1 см и п' = 1,5 = порядок интерференции в центре составляет примерно 75 000 для Яо= 4000 А и приблизительно 43 000 для Яо— 7000 А; следовательно, в види- мом спектре приблизительно 32 000 волн имеют максимум интенсивности в цент- ре. Как мы видим из E) и G.3.15), для того чтобы полосы были отчетливы, тре- бования к монохроматичности источника должны становиться тем строже, чем больше оптическая толщина пластинки. Ниже (см. п. 7.5.8) мы покажем, что су- ществует верхний предел оптической толщины пластинки, при котором с дан- ным источником полосы еще мог>т наблюдаться. До сих пор мы предполагали, что оптическая толщина пластинки повсюду одинакова. Практически это предположение можно считать справедливым, если воспользоваться диафрагмой, ограничивающей освещенную площадь пластин- ки. Из соотношения (8) следует, что изменение оптической толщины пластинки на Д (n'h) вызывает смещение картины на Дт порядков, где а в центре, где 0'= О . 2cos6' , , ... Дш = —г— Д (raft), = j- A (n'h). A4) A5) Таким образом, при движении пластинки относительно диафрагмы изменения n'h можно обнаружить по изменению порядк"а интерференции в центре, Подоб*
266 ЭЛЕМЕНТЫ ТГ.ОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 ный метод применяется в оптической промышленности для проверки качества пластин, от которых требуется постоянство оптической толщины 1161. Л'ы рассматривали пока только свет, отраженный от пластинки, но, конеч- но, подобные рассуждения применимы и для света, прошедшего сквозь пластин- ку. В этом случае (рис. 7.23) в точку Р фокальной плоскости зрительной трубы приходят от источника S два луча: один, прошед- ший прямо, и другой — после двух внутренних от- ражений. Оптическую разность хода этих лучей находят таким же образом, как и при выводе E), т. е. Д^ = 2n'ft cos 6', A6) а значит, соответствующая разность фаз равна 6 = !^n'ftcos6'. A7) Дополнительная разность фаз, вызванная отра- жением, здесь отсутствует, так как оба внутренних отражения происходят в одинаковых условиях. Ин- терференционная картина, создаваемая протяжен- Рис. 7.23, Пдоскопаралиель- ньш источником, и в этом случае локализована в ная пластинка; возпшшовс- бесконечности. Сравнивая A7) и Gа), мы видим, что теЛомТизованныГ'Гбеско- картины в проходящем и отраженном свете допол- нечьости. нительны, т. е. светлые полосы одной и темные по- лосы другой находятся на одном и том же угловом расстоянии относительно нормали к пластинке. Однако если отражательная способность поверхности пластинки мала (как, например, на границе стекло—• воздух, где при нормальном падении она примерно равна 0,04), то интенсивно- сти двух интерферирующих лучей, прошедших сквозь пластинку, очень сильно отличаются друг от друга. Поэтому (см. G.2.16)) различие в интенсивности максимумов и минимумов оказывается малым, а видность полос — низкой. Наше предыдущее рассуждение было не вполне строгим, так как мы пре- небрегли многократностью внутренних отражений в пластинке. В действитель- ности точку /' достигает не два, как мы предположили, а целый ряд пучков, идущих от S. Но если отражение на поверхностях пластинки мало, то наше приближение вполне удовлетворительно, так как пучки после первых двух от- ражений обладают ничтожной энергией. Из более точного рассмотрения, при- водимого далее (см. § 7.6), можно заключить, что положение максимумов и ми- нимумов точно определяется соотношением (8), но при значительной отража- тельной способности поверхностей пластинки многократные отражения сильно изменят распределение интенсивности в полосах. 7.5.2. Интерференция в тонких пленках; интерферометр Физо. Допустим, что прозрачная пленка с плоскими, но не обязательно параллельными отра- жающими поверхностями освещается точечным источником S квазимонохрома- тического света. Два луча *), исходящие от S, а именно SAP и SBCDP (рис. 7.24), приходят в какую-нибудь точку Р с той же стороны пленки, где находится и S; следовательно, в этой области интерференционная картина не локализована. Оптическая разность хода между двумя путями от S до Р равна A<S" = ft(SB-i-DP—SA — AP) + n'(BC^CD), A8) где п' и п — соответственно показатели преломления пленки и окружающей •среды. Точную величину Д^7 трудно вычислить, но если пленка достаточно тон- *) Мы снова пренебрегаем многократными отражениями; их влияние рассматривается ниже 1см. § 7.6),
7.5] ДВУХЛУЧЕВАЯ ИНТЕРФЕРРНЦИЯ. ЦЕЛЕНИЕ ЛМПЛИТУДЫ 267 ка, то В, А и D находятся на очень малом расстоянии друг от друга, и значит, ' nSA як nSB +- n'BN1, A9 a) а nAP^snDP + n'N,D, A9 6) где ANi, AN2— перпендикуляры к ВС и CD. Из A8) и A9) имеем Д# »ra'(iV,C + CiV2). B0) Кроме того, если угол между поверхностями пленки достаточно мал, то N1C + CN,mN\C + CN'l. B1) Здесь N[ nJVj— основания перпендикуляров, опущенных из Е на ВС и_СО, Пленка с р Рис. 7.24. Тонкая пленка, освещенная точеч- Рис. 7.25. Тонкая пленка; возникнове- ным источником света. • ние полос, локализованных в пленке. •а Е — пересечение верхней поверхности с нормалью к нижней поверхности в точке С. HOj N'?^CN\ = h cos 6', B2) где h = СЕ — толщина пленки вблизи точки С, измеренная по нормали к ниж- ней поверхности, 9:— угол отражения на внутренней поверхности пленки. Следовательно, для тонкой пленки, мало отличающейся от плоскопараллель- ной, можно написать, пользуясь B0), B1) и B2), hSf = 2ra7icos9', B3) а соответствующая разность фаз в Р равна б =-г-я Л cos 0 . Ло B4) В общем случае для данной точки Р обе величины Айв зависят от поло- жения S и даже при небольшом увеличении размеров источника область значе- ний 6 в Р становится столь большой, что полосы исчезают. Тем не менее сущест- вует специальный случай, когда Р находится в пленке, а наблюдение ведется с микроскопом, сфокусированным на пленку, или сам глаи аккомодируется на нее. Тогда h практически одинаково для всех пар лучей от протяженного источника, приходящих в точку Р', сопряженную с Р (рис. 7.25), и различие величин б в точке Р' вызывается главным образом различием значений cos 6'. Если интервал изменений cos 9' достаточно мал, то интервал величин б в точке Р' много меньше 2л, даже с источником значительных размеров, и полосы отчет- личо нщны. Очевидно, что они локализованы в пленке. Практически условие малости интервала изменений cos 0' можно выполнить при наблюдении в на- правлении, близком к нормальному, или при ограничении входного зрачка, хотя зрачок невооруженного глаза и сам по себе может быть достаточно мал.
268 ЭЛЕМЕНТЫ ТЕОРИЯ ИНТЕРФЕРЕНЦИИ И ИНТРРФРРОЧРЛРЫ [гл. 7 Учитывая изменение фазы на я при отражении на одной из поверхностей плен- ки, получим из B4) и G.2.16), что максимумы интенсивности в Р' (и, очевидно, в Р) находятся при ^ /и = 0, 1, 2, .... 2n'h cos 6' ± тг =' и минимумы интенсивности — при 2ft'h cos 0' ± -~ = /пЯ„ = V2. */a, V2 B5а) B56) где cos 6' — среднее значение cos 0' для точек источника, от которых свет до- ходит в Р'. Величина n'h, присутствующая в этих соотношениях, представляет собой оптическую толщину пленки в Я, и если наше приближение остается в силе, интерференция в Р не зависит от толщины пленки в других местах. От- сюда следует, что соотношения B5) остаются справедливыми даже при не- плоских поверхностях пленки при условии, что угол между ними остается малым. Тогда, если cos 0' достаточно постоянен, интерференционные полосы соответствуют совокупности мест пленки, где оптические толщины одинаковы. По этой причине такие полосы часто называют полосами равной толщины Рис. 7.26. Полосы равной толщины, полученные с тонкой стеклянной пластинкой. (рис. 7.26). Их можно наблюдать в тонкой воздушной прослойке между отра- жающими поверхностями двух прозрачных пластинок. Вблизи нормального падения условия B5) для темной полосы при соь 0' — 1 и длине волны в возд) хе к = ко/п имеют вид h=~, m = 0, I, 2, ... B6) Таким образом, полосы вырисовывают контуры слоев равной толщины, причем расстояние между полосами соответствует изменению толщины на Л/2. Если толщина слоя повсюду постоянна, интенсивность по всей его поверхности одинакова. Это широко используется для испытания качества оптических по- верхностей. При этом наблюдается прослойка воздуха между исследуемой по- верхностью и поверхностью эталона (пробной пластинки) равной, но противо- положной кривизны. При клиновидной воздушной прослойке между плоскими поверхностями полосы будут эквидистантны и параллельны pe6pv клина. Ли- нейное расстояние между соседними светлыми полосами равно А..2а, где а — угол при вершине клина. Так, например, при а= 1' и X = 5500А расстояние между полосами составляет примерно 1,9 мм; отсюда следует, что для достаточ- ного разделения полос угол клина должен быть очень мал. Полосы, получаю- щиеся с клином, используются для проверки концевых мер (калибров), служа-
5] ДВУХЛУЧРВА.Я ИНТЕРФЕРЕНЦИЯ ДЕЛГНИЕ АМПЛИТУДЫ 269 щих стандартами длин в механических цехах. Испытуемый калибр GL (рис. 7.27) представляет собой стальную колодку с двумя параллельными, полированными плоскостями с определенным расстоянием между ними. Одну из этих поверх- ностей и одну из поверхностей эталона G2 такой же поминальной длины плотно прижимают к плоской стальной поверхности; верхние поверхности обеих мер покрывают прозрачной пластинкой Т с плоской поверхностью Обычно между пластинкой и мерами образуются клиновидные воздушные прослойки, в кото- рых при освещении монохроматическим светом можно наблюдать интерферен- ционные полосы Зная расстояние между полосами и между калибрами, можно определить разницу ^ длинах послед- них *). Полосы, называемые кольцами Нью- тона (рис. 7.28), служат еще одним при- Юнтшдлые • прослойки. Рис 7 27 Интерферометрическое сравнение концевых мер Рис. 7 28. Кольца Ньютона. мером полос равной толщины. Кольца Ньютона представляют исторический интерес в связи со взглядами самого Ньютона на природу света. Они наблюда- ются в воздушном зазоре между соприкасающимися выпуклой сферической поверхностью линзы и плоской поверхностью стекла (рис. 7 29) Эти полосы име- ют вид окружностей с центром в точке касания С Пусть R — радиус кривизны ОС выпуклой поверхности, тогда, если пренебречь членами четвертого поряд- ка, толщина зазора к на расстоянии г от ОС равна = R—I B7) При нормальном падении условия для радиусов темных полос, согласно B6) и B7), имеют вид 2, B8) т. е радиусы темных полос пропорциональны квадрат- ному корню из положительных целых чисел. При уве- личении расстояния между линзой и пластинкой задан- ная толщина зазора h смещается по направлению к цен- тру, причем кольца сжимаются и каждый раз при уве- личении расстояния на Х/2 одно из них пропадает. Ин- тересно отметить, что это устройство, так же как и опыт Юнга, позволяет очень простыми средствами приближенно определить длину волны света Если толщина пленки достигает всего лишь нескольких полуволн, порядки интерференции в монохроматической картине очень низки, и полосы становятся видимыми в белом свете. Примерами таких полос могу г служить цвета мыльных Рис 7 29. К возникно- вению колец Ньютона. *) Изменение фазы при отражении от металлической поверхности не точно равно я, как , считается в B5), но это не влияет на расстояние между полосами.
270 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 Рис. 7.30. Схема интер- ферометра Физо. пузырей и масляных пятен на воде, видимые в отраженном свете. В устройстве для наблюдения колец Ньютона (см. рис. 7.29) в случае соприкосновения линзы и пластинки разность фаз в центре равна я для всех длин волн, и, следователь- но, в этом месте в белом свете всегда будет темное пятно. По мере удаления от центрального пятна интерференционные кольца от различных монохроматиче- ских компонент света значительно расходятся, и при визуальном наблюдении вблизи центра видны цветные кольца. Последовательность цветов этих колец вполне определенна и известна как цвета Ньютона. Дальше от центра кольца различных порядков начи- нают перекрываться и освещение кажется глазу рав- номерно белым (см. § 7.3.3). Аналогично в клиновид- ной воздушной прослойке в белом свете у ребра клина отчетливо может наблюдаться темная полоса. До сих пор мы говорили только об отраженном свете, однако интерференционная картина, локализо- ванная в пленке, видна также и в проходящем свете. Как и в случае плоскопараллельной пластинки, кар- тины в отраженном и прошедшем свете дополнительны, т. е. светлые полосы одной появляются в тех же местах пленки, что и темные полосы другой. При использова- нии мало отражающих поверхностей полосы в прохо- дящем свете плохо видны вследствие неравенства ин- теисивностей интерферирующих пучков. Мы показали, что необходимым условием отчет- ливости полос служит ограниченность диапазона ве- _, личин cos 9', соответствующих каждой точке пленки, и что полосы вырисовывают контуры слоев равной оптической толщины, только если cosO' fv 1. Оба условия одновременно выполняются па большой площади пленки в интерферометре Физо [17] (рис. 7.30). Пучок света от квазимонохро- матического источника S после отражения от маленького зеркала, превращается линзой L в параллельный и падает почти нормально на пленку F. Свет, отра- женный поверхностями пленки, снова проходит через линзу L и собирается в отверстие S' в фокальной плоскости линзы L. Глаз, помещенный сразу за S' и сфокусированный на пленку, видит полосы, вырисовывающие контуры слоев равной оптической толщины на всей поверхности пленки, освещенной линзой L. Эти полосы часто называют полосами Физо. Как мы увидим (см. п. 7.5.3), полосы Физо можно получить и в толстых пленках при условии, что источник достаточно мал. Такие интерферометры применяются в оптических мастерских для проверки постоянства оптических толщин плоскопараллельных прозрачных пластинок. В Англии они используются в Национальной физической лаборато- рии для измерения концевых мер или калибров [18]. Устройство такого прибора показано на рис. 7.31, а. Одна из поверхностей калибра G плотно прижата к плоской полированной поверхности стальной плиты В. Верхнюю поверхность G, параллельную плите В, покрывают прозрачной пластинкой Тс плоской ниж- ней поверхностью. Вообще говоря, между ГиСи между Т и В образуются кли- новидные воздушные слои и в каждом из них может наблюдаться интерферен- ционная картина, состоящая из прямых параллельных линий с одинаковым рас- стоянием между ними в обеих картинах. Изменяя наклон Т, можно установить полосы перпендикулярно к одному краю калибра (рис. 7.31, б). Пусть в ка- кой-то точке на краю калибра толщины воздушных клиньев над G и В состав- ляют соответственно hx и h2, а соответствующие порядки интерференции равны tnx и /в2; тогда, согласно B6), длина d калибра равна B9)
§ 7.5] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ АМПЛИТУДЫ 27Х где Д/я — смещение порядка обеих картин. Таким образом, мы можем написать- d = (x + e)~, C0) где х—неизвестное целое число, а е<1—дробная часть-порядка, которую можно определить интерполяцией. Величину х находят методом дробных ф Рис. 7.31. Интерферометр для измерения концевых мер, применяемый в английской Нацио- нальной физической лаборатории. а — схема установки, б--пш[е зрения. частей порядка, который был впервые применен в иптерферо.метрии Бенуа [19]. Дробные части порядка измеряются в свете четырех известных волн, которые (при использовании подходящего источника) удобно выделять по очереди вра- щением призмы постоянного отклонения D. Тогда мы получим соотношения с[=(х4-е)~>=(х-\-е)~=(х-{-е*\ — = (х4-е)— C1) где Xi, x2, х3 и xt— неизвестные целые числа; эти соотношения определяют «четверки» возможных значений величин хи х2, х3 и хх. Измеряя приближенно микрометром длину d, можно решить, какая из таких «четверок» правильна, и, следовательно, получить точную величину d. С надлежащими предосторож- ностями можно измерять калибры длиной до 10 см. Если дробная часть порядка определена с точностью до 0,1, то для X = 5000 Л точность в измерении калиб- ра составит ±2,5- 10~в см. Очевидно, что для устройства Физо существует предельный случай, когда ¦ источник S (см. рис. 7.30) уменьшается до точки и, значит, 0' принимает одина- ковые значения во всех точках пленки. В этих условиях, однако, если поверх- ность пленки плоская, полосы должны быть нелокализованными, т. е. в любой плоскости, в которой встречаются отраженные пучки, они будут так же от- четливы, как и в пленке. Мы, следовательно, вынуждены более тщательно выяснить вопрос о локализации полос и о ее связи с размерами источника. 7.5.3. Локализация полос*). Интерференционные устройства, рассмотрен- ные до сих пор, можно в общем охарактеризовать как устройства, в которых свет от источника достигает точек в области интерференции двумя различными путями. Пусть Р будет такой точкой, и предположим, что свет длиной волны •). Более полное рассмогренне вопроса о локализации полос ирьведено и [20J.
272 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ Рис 7,32. К интерференции двух пучков света от точечного источника. Хо испускается квазимонохроматическим точечным источником S. Если SA\В^Р и SAzB^P — два луча от S до Р (рис. 7.32), то разность фаз в точке Р равна Величина 60 зависит от положения Р, но она однозначно определена для всех Р, так что интерференционные полосы, являющиеся геометрическим местом точек, для которых б„ постоянна, образу- ются в любой плоскости той обла- сти, где встречаются оба луча от 5. >р Мы говорим, что такие полосы не локализованы. Они всегда наблюда- ются с точечным источником, и их видность зависит только от относи- тельной интенсивности обеих волн. Допустим теперь, что ква- зимонохроматический первичный источник занимает некоторое про- странство вокруг 5. Как и в п. 7.3.4, предположим, что такой источ- ник состоит из пекогерентных точечных источников, каждый из которых создает нелокализованную интерференционную картину. Тогда в каждой точке полная интенсивность равна сумме интснсивностсй таких элементар- ных картин. Если в точке Р разность фаз излучения от различных точек про- тяженного источника неодинакова, то элементарные картины смещены друг от*- носительно друга в окрестности Р и видность полос в точке Р меньше, чем в случае точечного источника. Вообще говоря, как будет видно из дальнейшего, взаимное смещение (а следовательно, и уменьшение видности) растет по мере увеличения источника, но зависит от положения Р. Таким образом, хотя мы имеем здесь дело с протяженным источником, видность полос в некоторых точ- ках Р может остаться такой же (или почти такой же), как и в случае точечного источника, тогда как в другом месте она упадет практически до нуля. Такие полосы характерны для протяженного источника и называются локализо- ванными. Уменьшение видности, связанное с заданными размерами источника, вообще говоря, трудно поддается расчету, так как оно зависит не только от от- носительной интенсивности элементарных картин, но и от их взаимного сме- щения. Однако здесь легко выделить два крайних случая. Взаимное смещение элементарных картин, малое по сравнению с одним порядком, очевидно, не- значительно влияет на полосы, и при определенных обстоятельствах (см. рис. 7.11) уменьшение видности остается незаметным, по крайней мере при ви- зуальном наблюдении, пока "ём„„5?-=- C3) Здесь 6макс и 6МИН — максимальная и минимальная разность фаз излучения в точке Р, приходящего от различных точек протяженного источника. Этот критерий справедлив также для источника с рассмотренным ранее распределе- нием интенсивности (см. рис. 7.15, б, в), и мы вправе предположить, что он всег- да выполняется. Вместе с тем, когда 6«кс-вы»>я. C4) взаимное смещение элементарных картин достигает многих порядков, и вид- ность полос становится очень малой. Исследуем теперь зависимость б для некоторой точки S' протяженного источника от ее положения относительно точки S. Точки 5 и Р являются «со- пряженными» в том смысле, что от точечного источника с длиной волиы Х„,
§ 7.5] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ АМПЛИТУДЫ 273 «аходящегося в Р, в точку S пришли бы две волны с разностью фаз б„. Пусть IFi и Wz— волновые фронты этих двух волн, проходящие через точку S и нор- мальные к 5ЛХ и SA2 соответственно (рис. 7.33). Их кривизны зависят от по- ложений S и Р и от оптических особенностей данного устройства. Пусть нор- мали, опущенные из точки S' на волновые фронты Wt и W2, пересекаются с ними в точках N± и N2 соответственно. Оптическая длина пути от Nt до Р равна ISAiBiP], а оптическая длина пути от N2 ДО Р равна \SA3BtP]. Разность фаз в точке Р, соответствующей S', составляет, следовательно, [SAtB,P]}, C5) или, учитывая C2), б — $0=-t-^-(S2—Si), C6) где Si= S'Nlt sa= S'Ni ига— показатель преломления среды, окружающей источник. Рис. 7.33. К интерференции двух пучков света Рис. 7.34. К исследованию локализа- от протяженного источника. НИИ полос в дяухлучевом интерферен- ционном устройстве. Пусть S — начало прямоугольных координат с осями SX, SY и SZ, причем SZ и SX — соответственно внутренняя и внешняя биссектрисы угла AiSA2 (рис. 7.34). Пусть далее радиусы кривизны волновых фронтов Wt и Wt в плоскостях S'SAi и S'SA2 равны соответственно R-, и R2\ тогда цент- рами их кривизны С] и Са служат точки {R1sin{^/2), О, /JjCos (|3/2)} и {—#2 sin (|3/2), 0, Ri cos (|3/2)} соответственно, где |3—угол A tSAs. Если (х, у, г)— координаты точки S', то СО' я _t D j.b — Sj -f- Ki — -Дх sin ? (г-Яг cos-|)' = y + zcos-L-j-r-' 4 C7) Если размеры источника малы по сравнению с Ru мы можем пренебречь степе- нями x/Ri, y/Ri и zlR-i выше второй; тогда Oil f П Л\а\ C8) Аналогично s, да хsin 4— 3—(xsin |- — (xsin|-— C9) В большинстве случаев, представляющих практический интерес, р4 мало, и можно отбросить члены в разложениях C8) и C9), содержащие р12 и $z/R. Тогда из C6), C8) и C9) мы получим A1) } 40) Если здесь можно пренебречь членом, не зависящим от р\ то
274 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. Т В таком приближении 6 =б0 при х = 0, так что разность фаз (и, следовательно, уменьшение видности) незначительна, если мы пользуемся источником, поотя- женным в плоскости YSZ. Согласно C3) и D1) уменьшение видности неощутимо, если размеры источника в направлении, нормальном к эгой плоскости, не пре- вышают %j4nf>. Итак, направления SAt и ЯАг и, следовательно, направления выбранных координатных осей, вообще говоря, зависят от положения Р. Если для всех точек Р плоскости YSZ имеют общую линию пересечения, то линейный источник (практически щель шириной, меньшей Xj4n$), вытянутый вдоль этой линии, дает в любой точке полосы такой же видности, как и точечный источник; полосы остаются нелокализованными. Все это относится ко всем случаям, описанным в п. 7.3.2 (исключая опыт Меслина). В случае зеркал Френеля, на- пример, при любом положении точки Р линия, проходящая через 5 и парал- лельная линии пересечения зеркал, лежит в плоскости YSZ, и при линейном источнике (щель), ориентированном также вдоль этой линии, наблюдаются, как было установлено в п. 7.3.4, нелокализованные полосы. Легко показать, что выражение G.3.26) для ширины щели эквивалентно условию е^.Х„/4гф. Однако, вообще говоря, плоскости YSZ для всех Р не имеют общего пересече- ния. Для получения картин в точках Р линейный источник должен находиться только в ограниченной области плоскости YSZ. F-Сли же протяженный источ- ник занимает область, границы которой отстоят от этой плоскости на расстоя- нии, большом по сравнению с А0/2яр\ то, согласно C4) и D1), видпость будет очень мала. При этих обстоятельствах полосы от линейного источника будут локализованы в области, положение которой зависит от ориентации источника. Величина {5 зависит от положения Р, и если мы пренебрежем зависимостью Rt и R2 от р, то, согласно D0), величина б — 60 для данного х уменьшается при уменьшении р\ Отсюда следует, что если размеры источника увеличиваются в направлении, нормальном к плоскости YSZ, то полосы локализуются в об- ласти, соответствующей достаточно малым значениям [i. В частности, |3 = О, если SAt и SA,, совпадают; в области локализации лежат и те точки Р (если они вообще существуют), которые находятся на пересечении обоих лучей, об- разованных из одного падающего луча, выходящего из S. В окрестности этих, точек р пренебрежимо мало, и мы получим из D0) (¦щ—$-)(х*+у*). D2> в-в„я Пусть Wi и W2—¦ сферические волновые фронты; тогда Ri и R2 не зависят от х и у, и уменьшение видности не зависит от направления, в котором источник вытянут в плоскости YSZ. Для источника в виде диска, лежащего в этой же плоскости, уменьшение видности, согласно C3) и D2), незначительно при усло- вии, что его радиус не превышает В случае плоскопараллельной пластинки, рассматриваемой в зрительную трубу (см. п. 7.5.1), |5 = 0, когда точка Р находится в фокальной плоскости объектива, а ??, и R2 бесконечны при всех положениях 5, так что в соответствии с D2) б —¦ 60 для любых хну. Следовательно, в фокальной плоскости объектива видность полос не зависит ни от положения, ни от размеров источника. На практике апертура объектива всегда ограничивает эффективный размер источ- ника. Следовательно, при наблюдении полос вне фокальной плоскости объек- тива (как, например, при неправильной установке зрительной трубы) уменьше- ние видности остается незначительным до тех пор, пока эффективный размер источника не превысит величины, допускаемой C3) и D0). В качестве примера рассмотрим полосы в отраженном свете от прозрачного клина с небольшим углом а; пусть его показатель преломления равен п', а сам он ограничен плоскими поверхностями и находится в среде с показателем
§ 7.5] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ АМПЛИТУДЫ 275 преломления *) я. Пусть 5 — точечный источник квазимонохроматического света. Рассмотрим луч, лежащий в главном сечении клина (сечение под прямым углом к ребру) и падающий на переднюю поверхность клииа в точке А (рис. 7.35). Этот луч вызывает появление отраженного луча АР я преломленного АВ. Преломленный луч А В после отражения в В от задней поверхности клина Рис. 7.35. Лучи, отраженные и преломленные на поверхностях плоского клина. и преломления в С на передней его поверхности, выходит в направлении СР и встречает отраженный луч АР в точке Р. Если источник занимает конечную область вокруг S, то полосы вблизи плоскости SAP локализованы в окрест- ности Р. Пусть р — расстояние между А и ребром клина О, 0 и 0' — соответственно углы падения и преломления в точке А, а ц> — угол A PC. Если В и О находятся по одну сторону от нормали, восстановленной в А, к задней поверхности клина, то точка Р оказывается действительной (рис. 7.35, а): угол отражения в В равен (9'—¦ ее), угол выхода луча в точке С равен (9— ф), и из элементарной геометрии следует, что D3) D4) D5) D6) D7) ВС Ж АС Ж АР "cos@'—a) ' cos 9' = cos (в' — 2а) ' sin 2 @'—а) = cos (9' — 2а)' cos (8 —ф) AC sin ф СР _ cos О AC sin ф " По закону Снеллиуса для преломления в точках А и С получим п' sin 6' = п sin 9, п' sin F' — 2а) = л sin F — ср). Вычитая однб иэ другого и пользуясь тождеством sin a — sin6 = 2 находим л' sin a cos (G' — а) 2'~ ncosfe-f- D8) D9) E0) и, если величина 6 не слишком близка к я/2, мы можем написать для малого ее 22^- E1) *) Более 1}олно этот вопрос рассмотрен в [21]. 18*
276 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [гл. 7 Из D3), D4) и D6) имеем АР = 2Psinasin(9' —a)cos (8 —Ф) ,со\ cos (В' — 2сс) sin ф " • "¦ ' При малом а последнее соотношение можно разложить по степеням а, исполь- зуя E1). Оставляя только главный член и принимая во внимание D8), получим рп2 sin & cos3 6 И'2 — Л25П1ае * АР; E3) Члены, отброшенные в E3), порядка ра, т. е. порядка толщины клина в точке А. Если В и О находятся по разные стороны от нормали к задней поверхности клина, восстановленной в точке А (рис. 7.35, б), то точка Р оказывается мни- мой, но приближенная формула E3) остается справедливой. Пусть клин представляет собой воздушную прослойку между двумя стек- лянными пластинками и мы вправе пренебречь эффектами, вызванными пре- ломлением в передней пластинке; тогда можно положить в E3) п = ft' — 1, АР& р sin 6 и угол ОРА « л/2. Геометрическое место точек Р имеет тогда вид sfl. Геометрическое место точек Р места точен Р Рис. / 3d. К, локализации полос в глав- ном сечении воздушного клина. Преломление на поверхностях клина не учитывается Рис. 7.37. К локализации полос, по- лучающихся с клином, от источника света, находящегося в бесконечности. окружности с диаметром 0Slt где Sx— зеркальное изображение S в передней поверхности клина (рис. 7.36). Если источник 5 находится так далеко от клина, что все падающие лучи можно считать параллельными *) SA, то 0, а значит, б' и ср не зависят от р, и из E2) следует, что АР пропорционально р. В этом случае геометрическое ме- сто точек Р—плоскость, в которой лежит ребро клина (рис. 7.37). Угол у между этой плоскостью локализации и плоскостью, нормальной к отраженному пучку, определяется из E3) и соотношения AN — ps'mQ в виде , AN — АР {gV= ON Очевидно, что т^О, если Э = 0, и при нормальном падении плоскость локали- зации полос совладает с передней поверхностью клина. Рассмотрим далее оптическою разность хода Aef в точке Р. Из рис. 7.35,о для действительной точки Р имеем \3'-=п'(АВ + ВС)+п(СР—АР). E5) Согласно D3) и D4) для малого а и величины 6', не слишком близкой к я/2, находим где E7) •) Это условие полностью удовлетворяется в устройстве Физо (см. и. 7.5.2,),
§ 7.51 ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ АМПЛИТУДЫ 277 — толщина клина в точке А. В этом приближении мы отбрасывали члены со степенями а. Аналогичным,'образом из D3), D5), D6) и D7) получим СР—АР = - —2p sin a sin ( 6 —2-) sin C' — a) cos -? cos F' — 2a) Следовательно, из E5), E6), E8) и D8) имеем и соответствующая разность фаз в точке Р равна 2h sin 0 sin О' cosG' бя^п1 = -F-Vn'*— и2sin2 в. E8) E9) F0) Подобным же способом мы найдем, что это приближение справедливо и для ус- ловий, показанных на рис. 7.35, б, когда Р — мнимая точка. Если учесть изменение фазы на я, происходящее при отражении на одной из поверхностей кля- на, то в соответствии с F0) и G.2.16) нахо- дим, что максимумы интенсивности в Р бу- дут при а минимумы интенсивности — при i_ ^» ™\ F16) ./р" Рнс. 7.38. Положение центров кривиз- ны волновых фронтов от точечного ис- точника света после отражения н пре- ломления на поверхностях плоского клина. Очевидно, что при постоянном угле 0' по- лосы в плоскости локализации эквидис- тантны и параллельны рейру клина. Наконец, определим, как велики мо- гут быть размеры источника, окружаю- щего точку S, при которых еще нет за- метного уменьшения видности полос в Р. Представим себе, что точечный источник помещен в точку Р, и определим ра- диусы кривизны Rx и Ri волновых фронтов Wt и Wit достигающих 5 после от- ражений на передней и задней поверхностях клина (рис. 7/38). Центр кривизны сферической поверхности Wi лежит в Рх на AS, где точка Pi— зеркальное изображение Р в передней поверхности клина. Таким образом, R1 = SPX = SA + А Р. F2) Волновой фронт W2, вообще говоря, отличен от сферического. Рассмотрим сна- чала его радиус кривизны в главном сечении клина. После преломления в С центр кривизны Р' лежит на продолжении ВС и его положение определяется формулой D.6.21). В обозначениях, принятых в § 4.6, имеем яо= га, ях-= п', гу= оо, 6„= 9 — ф, 0!= 0'— 2а, > df= CP, df= CP' и из соотношения D.6.21) получаем CP' n' cos2 (9' — 2a) ,ggv OP ncos2@ —ф) " ' ' После отражения в В центр кривизны окажется в точке Р" на продолжении АВ, где Р"— зеркальное изображение Р' в задней поверхности клина; после пре- ломления в А центр кривизны окажется в точке Рг на AS и, согласно D.6,21)
278 ЭЛЕМЕНТЫ TFOPHH ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 (при и„= я', П!= я, л,= то, е„=8', е1= в, d{i>= АР", d?' = АР), находим АР, п cos^ 6 /IP* п' cos^ в" Радиус кривизны R2 фронта TF2 в главном сечении клина равен R^SP^SA + AP,, @5) где, согласно F4), и соотношению ЛР"= А В + ВС + СР' ЛЛ = ?^т(ЛВ + ВС + СР'). F6) или, используя F3), Для малого а имеем Здесь мы воспользовались соотношениями E6) и E8). Из F2), F5) и F8) полу- чим окончательно J ' cos 0 V" 'cos!0 / * ' Аналогично можно вывести соответствующие выражения для сечения W2, перпендикулярного главному сечению клина. Вместо D.6.21) нужно пользо- ваться D.6.22), и тогда вместо F3) и F4) мы получим СР ~ л ' АР"~~ n' - (/а» Это приводит к следующей формуле для разности радиусов кривизны сечений Wi и П72, перпендикулярных к главному сечению клина: G1) Как уже отмечалось раньше, из C3) и D2) можно заключить, что уменьшение видности в точке Р незначительно, если радиальные размеры источника отно- сительно SA не превышают V\RlRjBn\Rl — Rt\). Из F9) и G1) следует, что при 0, не слишком близком к л/2, величина R%— Ri будет порядка h, и если Rt достаточно велико по сравнению с /г, как в случае устройства Физо, то можно принять RjRi— 1. В этом приближении допустимый угловой радиус источника, наблюдаемый из точки Рг, равен -L 1/ ^о^1^г ^ 1/ К R, У гл^-Д,^ V 2n\Rt- В частности, для почти нормального падения света из F9) и G1) следует, что R%— RjZz; 2hnln', и G2) принимает вид ?- G3) Для типичных значений для тонкого воздушного клина h = 0,01 см, п'= п~ 1, Хо= 5500 А выражение G3)_дает 8~-2°. Очевидно, допустимые размеры источ- ника пропорциональны У I/ft. Например, в только что разобранном случае при h — 1 см величина е, согласно G3), примерно равна 12'. Поэтому при ис- следовании интерферометра Физо мы говорили, что можно получить полосы с большой видностью с толстым клином, если источник достаточно мал. 7.5.4. Интерферометр Майкельсона. В устройствах, описанных в пп 7,5.1 и 7,5.2 суперпозиция обоих интерферирующих пучков происходит всюду_
¦§ 7.5] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ АМПЛИТУДЫ 279 кроме пространства, ограниченного поверхностями пластинки или пленки. Иногда это обстоятельство оказывается неудобным, и его можно устранить с помощью вспомогательной полуотражающей поверхности, на которой пучки полностью разделяются. Затем пучки опять сводятся. На этом принципе осно- вано устройство интерферометра Майкельсона [22]. Простейшая схема такого прибора показана на рис. 7.39. Свет от протя- женного источника S делится полупрозрачной поверхностью Л плоскопарал- лсльной стеклянной пластинки D на два пучка, на- правленных под прямым углом друг к другу. Отра- зившись от плоских зеркал Mi и Мг, они возвраща- ются к D, где вновь соединяются и попадают в зрительную трубу Т. Зеркало М2 неподвижно, то- гда как зеркало Ми установленное на столике, мож- но передвигать микрометрическим винтом в направ- лении пластинки D или от нес. Пучок, отраженный- •от Mi, проходит сквозь диспергирующую пластин- ку D три раза, прежде чем попадает в Т. Пучок, отраженный от Мг, проходит через пластинку D только один раз. Чтобы устранить это различие в оптическом пути, не позволяющее работать с поло- сами в белом свете, между D и М2 ставится ком- пенсирующая пластинка С из такого же материала и с такой же толщиной, как у пластинки D, и па- раллельная ей. Предположим, что Afj—изображение Мг поверх- Рис. 7.39. Интерферометр ностью, делящей пучок. Оптическая длина пути меж- Майкельсона. ду S и точкой Р вдоль луча SItJ12Р, отразившегося от Мг, равна оптической длине пути между S и Р вдоль луча SIiKhP, отра- зившегося от мнимой поверхности М'2. Следовательно, можно считать, что ин- терференционная картина, наблюдаемая в зрительную трубу, возникает из-за воздушного слоя, ограниченного действительной отражающей поверхностью М1 и мнимой отражающей поверхностью М'г. При этом мы должны связать с отра- жением от 7Й2 изменение фазы ср, равное разности между изменениями фаз при внешнем и внутреннем отражениях поверхностью Л. Величина ср зависит от природы полуотражающего слоя А. При параллельных зеркалах Мх и М'2 полосы в квазимонохроматическом •свете имеют вид окружностей и локализованы в бесконечности. Они отличаются от полос равного наклона, рассмотренных в п. 7.5.1, только тем, что здесь нет многократных отражений, и, значит, распределение интенсивности находится в полном согласии с G.2.15). Если Mt приближается к М'г, полосы стягиваются по направлению к центру, а угловой масштаб картины возрастает до тех пор, лока Mi не совпадет с ЛГ2; при этом освещенность поля зрения становится равномерной и ее уровень зависит от <р. Тогда говорят, что зеркала Мг и М\ находятся в оптическом контакте. Когда Мг и М'„ близки и образуют клин с небольшим углом, полосы локализуются либо на поверхности клина, либо вблизи нее. При достаточно малом расстоянии между Мг и М'% они являются полосами равной толщины и, следовательно, имеют вид эквидистантных прямых линий, параллельных ребру клина. При увеличении расстояния диапазон уг- лов падения, соответствующих каждой точке поля зрения, и вариации среднего угла падения по полю зрения перестают быть незначительными, видность полос уменьшается, и они искривляются, обращаясь выпуклостью в сторону ребра клина. ' ч Независимо от того, параллельны ли Мг и М'2 или наклонены друг к другу, изменение оптической длины пути в любом плече интерферометра на \т-Х0 вызывает смещение картины на Д/и порядков. Смещение можно оценить
280 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [гл. 7 визуально с точностью до 1/20 порядка, но в определенных условиях методом Кеннеди [23] удастся обнаружить смещения до 1/1000 порядка [24]. При расстоянии между Mi и М'„ не превышающем нескольких длин волнг полосы наблюдаются в белом свете. Они служат для распознавания нулевой полосы в монохроматической интерференционной картине. Если |<р| = п, центральная полоса картины в белом свете оказывается темной и соответствует пересечению Мг и М'2\ она находится в том же месте, где и полоса в монохрома- тическом свете с | m\ = Va. В общем случае ахроматическая полоса не совпадает со светлой или темной полосой монохроматической картины, но это не вносит дополнительных трудностей, если переход от картины в белом свете к картине в монохроматическом свете происходит постепенно. В настоящее время интерферометр Майкельсона устарел. Исключение представляет только его модификация, в которой используется освещение- параллельным пучком (см. ниже, п. 7.5.5). Несмотря на это, интерферометр та- кого типа широко известен, так как с его помощью Майкельсон провел три важ- нейших эксперимента—опыт Майкельсона—Морлея по увлечению эфира [25], первое систематическое изучение тонкой структуры спектральных линий, первое прямое сравнение длин волн спектральных линий с эталонным метром [26]. В нашей книге мы не затронем ни первой, ни третьей из названных работ, так как, во-первых, здесь мы занимаемся только вопросами оптики неподвиж- ных сред, и, во-вторых, после Майкельсона более точные измерения длин волн были выполнены другими методами (см. §7.7). Метод Майкельсопа, касающийся анализа спектральных линий, также был заменен позднее более прямыми ме- тодами, но вследствие его значительного теоретического интереса и вследствие- его связи с теорией частичной когерентности мы позже рассмотрим его подробно (см. п. 7.5.8). 7.5.5. Интерферометр Тваймана — Грина и другие аналогичные приборы. Если интерферометр Майкельсона освещается точечным источником S квази- монохроматического света, находящимся в фо- кусе хорошо скорректированной линзы Lu а выходящий из интерферометра свет соби- рается второй такой же хорошей линзой L2) то такой прибор становится эквивалентным интерферометру Физо, но в отличие от по- следнего здесь пути световых пучков полно- стью разделены (рис. 7.40). Пусть W1— пло- ский волновой фронт пучка, отраженного от Mi, Ws— соответствующий плоский волновой фронт пучка, отраженного от Мг, и W[— вир- туальный плоский волновой фронт, распро- страняющийся от М2, который должен был бы выйти из делителя пучка совпадающим и синфазным с Wx- Оптическая разность хода между выходящими после делителя лучами, имеющими виртуальное пересечение в точке? Р на W2, равна №P = nh, G4> Гт Рис. 7.40. Интерферометр Майкель- сона, освещенный параллельным пучком стета. где h = PN — расстояние по нормали от Wx до Р, а п — показатель преломле- ния среды между W\ и- Wj. Соответствующая разность фаз равна о = -г- nh . G5> В соответствии с последним соотношением и G.2.16) находим, что глаз, поме- щенный в фокальную плоскость линзы L, и сфокусированный на W% (в случае надобности с помощью вспомогательной линзы), увидит в Р светлую полосу,
§ 7.5] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ АМПЛИТУДЫ 281 если nh = m\, |m| = 0, 1,2,..-, ¦ G6а) ¦ли темную полосу, если nh = mX0, \т\ = V,, V,, 5/2,... G66) Таким образом, полосы, вообще говоря, имеют вид прямых линий, параллель- ных ребру клина, образованного W[ и №2- Если путем соответствующей ориен- тации Afi сделать параллельными фронты W\ и W2, то поле зрения будет осве- щено равномерно. При точечном источнике полосы не локализованы, но практи- чески из-за недостатка света размеры источника нельзя сделать очень малыми. Так как пути выходящих лучей соответствуют отражению от клина, обра- вованного М2 и М\, где М[— мнимое изображение Мг в делителе пучка, то- полосы с протяженным источником кажутся локализованными вблизи клина, так же как и полосы Физо (см. стр. 276), и допустимые размеры источника наи- более велики, если М[ и Мг совпадают. Вместе с тем вследствие неполной моно- хроматичности источника полосы будут наблюдаться только в случае прибли- зительного равенства оптических длин путей обоих пучков. Важно отметить, что условия равенства оптических длин путей и совпадения М'г и Af2, вообще говоря, не могут выполняться одновременно, если установка асимметрична от- носительно А. Такое видоизменение интерферометра Майкельсона было предложено Твайманом и Грином [27] для проверки качества оптических деталей. Послед- ние помещают в пучок, идущий к Ms, и, если они хороши, то отраженный вол- новой фронт Ws остается плоским. Так как, согласно G6), мы вправе считать, ff,< ¦<EZ ¦<Е с мг *) Рис. 7.41. Интерферометр Тваймаиа — Грина. «—устройство ДЛЯ испытания ^«изм; б - устройство для испытания фотографических объективов. что светлые полосы соответствуют контурам W% с интервалами Х„, определяе- мым плоскостями, параллельными W[, то (принимая для воздуха п— 1) можно обнаружить искажения W2, получившиеся в результате двойного прохождения света сквозь испытуемую деталь. «Знак» искажения определяется направлением смещения полос при увеличении расстояния между Мг и делителем пучка. Схе- ма прибора для испытания призм в минимуме отклонения показана на рис. 7.41, а [28]. Наблюдаются полосы, совпадающие с одной из поверхностей призмы, а по их положению можно указать те участки призмы, которые должны подвергнуться ретуши. Таким путем можно скомпенсировать внутренние неоднородности материала призмы. На рис. 7.41, б показана схема приспособ- ления для испытания фотографических объективов [29]. М2— выпуклое сфери- ческое зеркало с центром кривизны в фокусе испытываемого объектива С. Объектив может вращаться вокруг линии, перпендикулярной его оси, что позво- ляет проводить испытания при различных наклонах объектива. Механически© связи обеспечивают неизменность положения центра кривизны зеркала М3
282 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 в фокальной плоскости объектива при его вращении. Однако существует неко- торая неопределенность в определении по интерференционной картине дефект- ных мест в объективе, так как в случае несовершенства объектива прямой и v\ 6} Л J Рис. 7.42. Интерференционные картины Тваймана — Грина, получающиеся с линзой и пока- зывающие наличие первичных аберраций 130]. «й—сферическая аберрация, фм<-,К1.^0.4А0, фокальная параксиальная плоскость? 6— кома, Фм к -2?.», -фокальная параксиальная плоскость, в —астигматизм, фмакс=2,1Яо, центральная плоскость Фмакс— максимальная волновая аберрация в выходном зрг!чке. Вверху —наблюдаемые картины, внизу —рассчитанные. Рис. 7.43. Интерферометр Кюстерса. а —схема установки, б —поле зрения обратный пути света через него не совпадают. Можно уменьшить такую неопре- деленность, выбирая радиус кривизны зеркала М2 возможно большим и исполь- зуя для наблюдения виртуальной картины полос, возникающих па его поверх- ности, соответствующую оптическую систему. На рис. 7.42 приведены фотогра- фии таких картин и соответствующие рассчитанные картины. Принцип устройства Тваймана—Грина использован в интерферометре Кюстерса, предназначенном для измерения длин концевых калибров [31] .(рис, 7.43, а), Калибр G плотно прижимают к зеркалу Л4а; зеркало Мг распо-
§ 7.5] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ АМПЛИТУДЫ 283 Нулевой порядок лагают в таком месте, чтобы эквивалентная виртуальная отражающая поверх- ность М[ находилась примерно на половине пути от Мг до верхней поверхности О и была наклонена относительно G и Л12 на некоторый небольшой угол. В ква- зимонохроматическом свете будут видны параллельные эквидистантные по- лосы на" М2 и G, перпендикулярные к одному из краев G (рис. 7.43,6). Дли- на калибра G определяется методом дробных частей порядка, как и в слу- чае уже описанного интерферометра английской Национальной физической лаборатории (см. п. 7.5.2). Совершен- но очевидно, что между этими двумя приборами существует большое сход- ство *). Можно упомянуть еще один по- добный прибор для измерения кон- цевых мер — интерферометр Дауэлла [32] (рис. 7.44, а), позволяющий срав- нивать длины двух калибров без не- обходимости тщательного прижатия. Пусть А[ и А'г— мнимые изображе- ния в зеркале Mi поверхностей Лг и Л3 калибров Gi и G2, а В[ и В'2— мни- мые изображения в Л12 и в делителе пучка поверхностей калибров Bt и ?>2. Расположение деталей прибора тако- во, что мнимые изображения А[, А\ и В[, В1 отражающих поверхностей калибров представляются налагаю- щимися друг на друга (рис. 7.44, б), и можно считать, что интерферен- ционные полосы возникли в клинообразном воздушном слое между поверхно- стями А[, А\, В[ и В'2. Соответствующей установкой Gi получаем картину гори- зонтальных полос в монохроматическом свете / в области перекрытия А[ и В\, и полоса нулевого порядка, которую можно отождествить в белом свете, пере- мещается в центр ноля. Затем калибр G8 устанавливают таким образом, чтобы А'г было в одной плоскости с А[. Тогда, поскольку поверхность В'2 параллельна В[, образуются сходные картины горизонтальных полос // и /// в областях перекрытия В'2 с А[ и А'2 с совпадающими нулевыми порядками. При таких условиях расстояние d между В'г и В[, равное разнице в длинах калибров, определяется из соотношения d = Х0&т/2п, где Дот— смещение порядков в картинах / и //. С этим прибором, применяя метод дробных частей порядка, можно измерять и длины одиночных калибров. 7.5.6. Полосы, получающиеся с двумя одинаковыми пластинами; интер- ферометр Жамена и интерференционный микроскоп. Пусть свет от квазимо- нохроматического точечного источника S падает на две прозрачные плоскопа- раллельные пластинки (толщиной h каждая и с показателем преломления л'), расположенные друг за другом и образующие между собой небольшой угол а (рис. 7.45). Если пренебречь лучами, испытавшими более двух отражений от Рис. 7.44. Интерферометр Дауэлла для иэ- мерения концевых мор. а — схема установки, б—поле зрения. *) У обоих приборов существует предел в увеличении расстояний между отражающими поверхностями, до которого полосы еще удовлетворительно видны. Этот предел зависит от углового размера источника (см. п. 7.5.3) и от степени его немонохроматичности (см. п. 7.5.8). Так как в устройстве Кюстерса используется вспомогательная отражающая поверхность Mi , лежащая посередине калибра, то с его поисщью при данном источнике можно измерять ка- либры почти в два раза длиннее, чем с прибором английской Национальной физической ла« бораториа.
284 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 поверхностей пластинок, то останутся две группы параллельных лучей, обра- зовавшихся из падающего луча SA и прошедших сквозь пластинки. Первая группа состоит из прошедшего луча и лучей, отраженных обеими поверхно- стями каждой пластинки. Вторая группа-—SABDH, SABCFI, SABDEJ и SABCFGK — из лучей, отраженных от одной поверхности каждой пластин- ки; они три раза проходят промежуток между пластинками и образуют с лучами первой группы угол 2а. f - у Лучи второй группы собираются в п' \J> точке Р в фокальной плоскости линзы L. —*• Обозначив оптические длины путей от S до Р вдоль этих лучей через cfu Уг, и eft, получим, пользуясь G.5.5), —ffx = Д^21 = 2л'А cos 61, G7а) ¦—5°, = A$%,= 2rt'ft(cos Э2— cos 6i), G76) _ 3>z = Д<§3 = 2га'A cos Q[, G7в) Р где Q[ и 62— углы преломления в точке Рис. 7.45. Две одинаковые плоскопарал- в второй пластинки и в точке D первой пластинки соответственно; так как для данной точки Р углы Э; и 62 зависят только от ориентации пластинок, то оптические разности хода ДеУ не зависят от положения S, и интерференционная картина от протяженного источника образуется в фокальной плоскости линзы L. Если диапазон углов падения не слишком велик, эта картина не перекрывается картиной, создаваемой лучами первой группы. Далее, так как cos 9Х яг cos б2, а Ае/'л и Д^з велики по сравне- нию с Де^зг, при достаточно большом h мы можем использовать источник, для которого условие четкости полос G.3.15) справедливо по отношению к Д^зг. но не к Де^2] и Дь^4з. В этих условиях мы можем считать, что картина полос связана только с такими лучами как SABCFI и SABDEJ. Остальной свет соз- дает почти равномерный фон, просто уменьшающий видпость полос. Из G76) находим, что разность фаз в точке Р, соответствующая Д^зг, равна 5 = -^VA(cos92—cosej), G8) т. е. на основании закона преломления —п?тп* G2 — -j/V2—/zasins 0^ f G9) где 0! и 02— углы падения соответственно в точках В и D, a ft — показатель преломления среды, окружающей пластинки. Для того чтоб определить форму полос, рассмотрим прямоугольные оси координат OX, OY и OZ с началом в точ- ке О во второй узловой точке линзы L, причем ось 01 параллельна ребру клина, образованного пластинами (рис. 7.46). Пусть Nx в плоскости XOY — фокаль- ная точка для света, отраженного нормально в В Ft = 0), a Na (также в плоско- сти X0Y) — фокальная точка для лучей, отраженных нормально в D @, = 0) Пусть далее ОХ — биссектриса угла NiON^. Тогда, если клин «раскрыт» в на- правлении OY, направляющие косинусы прямых ONX и O7V2 равны соответст- венно {cos (a/2), sin (а/2), 0}, {cos (а/2),— sin (а/2), 0}. Пусть ОР составляет угол if с плоскостью XOZ, а проекция ОР на нее составляет угол q> с ОХ, Тогда
§ 7.5] ДВУХЛУЧЕВДЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ АМПЛИТУДЫ 285 направляющие косинусы прямой ОР равны (cosi|> coscp, sinty, costfsincp), и так как PON1= 91? PON2= ва, получаем cos 0j = cos -^- cos if cos ф + sin -j- sin ij>, (80a) cos 03 = cos 4p cos \$ cos <p—sin -^- sin i|>. (806) При малом а мы можем пренебречь членами, содержащими вторую и более высокие степени а в разложении cos (•?-)» sin Dr) t и из (80) находим cos2 0t = cos3 ф cos2 ф + a sin if cos ф cos q>, (81a) cos2 92 = cos2 ij) cos3 ф—a, sin ф cos i|) cos ф. (816) Тогда, учитывая G9) и последние соотношения, имеем $ = -?- {-у n'z — п2 A — cos2\pcos3ф + a simp cos т|) соэф)— —у п'% — п?{\ — cos2 ip cos2 ф—asirnf costf cos ф) | (82) я после разложения по степеням а, вновь отбрасывая члены с а в степени выше первой, получим 4irft п-а sin t|) cos -ф cos ф Р ( |9 (83) Поэтому, согласно (83) и G.2.16), светлые полосы в точке Р будут при sin \f cos if cos cp V«" — л2 A —c 1 COS3 ф) , 2, .... (84a) а темные полосы —-при sin ф cos if cos ф J/V2 — я2 О — cos3 4) cos2 < т\„ , Рич. 7.46. К исследованию локализо- ванных в бесконечности полос, полу- . las /ялйч чающихся с двумя плоекопараллелъ- рт|= /2, /2, /j, ... (о4б) ными пластинками, наклоненными друг _ к другу. Если точка Р находится близко к плос- кости XOZ, так что ф мало, порядок интерференции т низок, и в этой области полосы можно наблюдать в белом свете. Центральная светлая полоса (от = 0) лежит в плоскости XOZ и образуется лучами, для которых Эх= Э2. В особом случае наблюдения в направлении, близком к нормальному па- дению, 1)з и ф малы, и, отбрасывая члены со второй и более высокой степенью -ф и ф, мы сведем (84а) к * = № N1 = 0,1,2,... (85) Таким образом, полосы в квазимонохроматическом свете имеют вид эквидистант- ных прямых линий, параллельных ребру клина между пластинками. Угловое расстояние между соседними светлыми полосами пропорционально показателю преломления пластинок и обратно пропорционально их толщине и углу между ними. Эти полосы впервые наблюдались Брюстером и называются полосами Брюстера. Подобные полосы используются в интерферометре Жамена [33], широк» применявшемся одно время для измерений показателя преломления газов. Теперь этот прибор заменен интерферометром Рэлея (см, и, 7,3,5). Основные
286 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 части прибора — две стеклянные плоскопараллельные пластины одинаковой толщины с одинаковым показателем преломления. Поверхности пластин ЛЬ и Мг покрыты непрозрачным зеркальным слоем серебра; их расположение показано на рис. 7.47. Пучок света от протяженного источника падает под углом, близким к 45°, на одну из пластин. В результате отражений и преломлений возникают два пучка: один, отраженный от передней по- верхности первой пластины и зад- ней поверхности второй, и другой, отраженный от задней поверхности первой пластины и передней поверх- ности второй. Эти пучки образуют интерференционную картину в фо- кальной плоскости зрительной тру- бы Т. Толщина пластин выбирает- ся такой, чтобы при подходящем р диафрагмировании пучки между Рис. 7.47. Интерферометр Жамена. пластинами полностью разделя- лись и чтобы каждый пучок про- ходил через одну из газовых кювет Gu G3 и один из компенсаторов Си С2, подобных описанным в п. 7.3.5. В работе пластины слегка наклоняют, так что они образуют друг с другом небольшой клин с ребром, параллельным плоскости рис. 7.47, которую мы будем считать горизонтальной; поверхности пластин почти вертикальны, и, следовательно, пользуясь теми же обозначениями, что и на рис. 7.46, мы можем считать плоскость XOZ почти горизонтальной. Об- ласть наблюдения в этом случае соответствует малому т|), и положение светлых полос определяется, согласно (84а), соотношением __^L^_ 4» = -^, И = 0. 1, W (86> V пл—n2sin2<p 2n2ta Так как <р » 45°, то при угловом поле небольшого размера изменения члена с <р пренебрежимо малы. Следовательно, полосы соответствуют точкам с одинако- вым ф, т. е. они горизонтальны и эквидистантны. Эти полосы относятся к низ- ким порядкам интерференции; соответствующей установкой полосу нулевого порядка (г|з = 0), отождествленную в белом свете, можно сместить в центр поля зрения *). 'Метод измерения с интерферометром такого типа подобен уже описанному методу работы с интерферометром Рэлея. Разница заключается только в том, что здесь отсутствует вторая система полос, служащая неподвижными репе- рами, и установка ведется по кресту нитей в зрительной трубе. Вследствие этого прибор более чувствителен к нарушениям в оптической системе, чем интерферометр Рэлея, и точность получаемых с его помощью измерений меньше. Сиркс [34] и позднее Прингсгейм [351 предложили для измерения показа- теля преломления малых объектов видоизмененный интерферометр Жамена со слегка клиновидными, а не плоскопараллельными пластинами. Пластины устанавливают таким образом, чтобы ребра клиньев были антипараллельны, •} Если пластины наклонены так, что ребро образованного ими клина вертикально, то плоскость X0Y горизонтальна, и область наблюдения соответствует малому q>, а положение максимумов интенсивности определяется соотношением (84а), т. е. cos f sin Ц; =_gAp_ l/n|-0 1 2 ]/>* i 2>» Полосы соответствуют точкам с одинаковым \р и в нашем случае будут вертикальны. Однако при tf> ~ 45° порядок интерференции значительно отличается от нулевого и с таким расположением пластин полосы в белом свете не наблюдаются.
ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ АМПЛИТУДЫ 287 а внутренние несеребренные поверхности — почти параллельны (рис. 7.48).- и освещают параллельным пучком света. Падающему лучу SA, лежащему в главном сечении клиньев, соответствуют два луча: SABCG и SADEF, кото- рые после выхода из второй пластины пересекаются в мнимой точке Р, лежащей сзади нее. С квазимонохроматическим не очень большим источником интерфе- ренционные полосы, кажущиеся расположенными вблизи Р, можно наблюдать в микроскоп М. В этой области полосы направлены под прямым углом к пло- скости, определяемой обоими выходящими из пластин лучами, т. е. парал- лельны ребрам клиньев. Исследуемый объект О помещают между пластинами на пути луча CG. Изображение Р' точки Р передней поверхностью второй пла- стины также лежат на луче СО, а местоположение этого изображения зависит от наклона пластин. По Прингсгейму [35] точка Р' находится приблизительно на половине пути между пластинами, если их внутренние поверхности парал- лельны, но незначительный поворот любой пластины вокруг оси, параллельной ребру клина, вызывает заметное смещение Р'. Таким образом, точку Р' можно совместить с О, и в поле зрения микроскопа изображение объекта и система интерференционных полос наложатся друг на друга. Изменение порядка ин- терференции в точке Р', вызванное введе- нием объекта О, определяется компенса- тором. Отсюда, зная толщину объекта в Р', можно определить и его показатель преломления. Сравнительно недавно разработал аналогичную Дайсон [36] комбинацию I тш Рис. 7.48. Интерферометр Сиркса — Прингсгейма. Рис. 7.49. Интерференционный микроскоп Дайсона. микроскопа и интерферометра (рис. 7.49). Исследуемый предмет, находящийся на предметном стекле, помещают в О между двумя одинаковыми стеклянными пластинами Gi и G2. Пластины слегка клиновидны и их ребра антипараллельны. Верхняя поверхность нижней пластины Gx покрыта полупрозрачным слоем серебра, а ее нижняя поверхность на небольшом центральном участке С, не- много большем поля зрения микроскопа, покрыта непрозрачным слоем серебра. Верхняя пластина G2 покрыта частично прозрачным слоем серебра с обеих сто- рон. Пространство между пластинами (в том числе и область, где расположен исследуемый предмет) заполняется веществом с таким же показателем прелом- ления, как и у стекла. Свет проходит через конденсор микроскопа, фокусирую- щий изображение источника на плоскость О. Часть этого света — предметный пучок — проходит через О и выходит из G2 после отражения от его верхней и нижней поверхностей. Другая его часть — опорный пучок — отражается от верхней поверхности Gi и сходится на С, где он отражается, и, проходя вне предмета О, который находится в тени С, прямо проходит через G2. Стек- лянный блок со сферической верхней поверхностью R, покрытой (за исключе-
288 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 нием небольшого участка А на оси в верхней части R) непрозрачным слоем се- ребра, склеен с G2. Он рассчитан так, чтобы предметный и опорный пучки после отражения на R и на верхней поверхности G2 сходились в А. Опорный пучок образует действительное изображение <т, источника вблизи А, предметный пучок — наложенное друг на друга действительное изображение <т2 источника и действительное изображение предметной плоскости. Последнее рассматривают в обычный микроскоп *). Соответствующие точки на а, и а2 являются изображениями одних и тех же точек источника и поэтому ведут себя как взаимно когерентные вторичные источники. Прибор юстируют таким образом, чтобы эти точки совпали. В от- сутствие предмета оптические длины путей предметного пучка и пучка сравне- ния в любой точке Р на П равны и, пренебрегая небольшой разностью фаз, вызванной различием в отражениях на серебреных поверхностях, находим, что порядок интерференции па всем изображении П будет нулевым. Это можно про- верить в белом свете. В присутствии предмета в О оптическая длина пути пред- метного пучка до Р увеличивается приблизительно на (я'— пI, где я'— пока- затель преломления предмета, /— его толщина в точке Р', сопряженной с Р, п — показатель преломления окружающей среды. Вариации п' и / по предмету влекут за собой, таким образом, вариации интенсивности по П в квазимоиохро- матическом свете или изменение цвета в белом свете. При движении нижней пластинки Gx нормально к ребру клина и оптической оси длина оптического пути пучка сравнения изменяется, и таким способом можно компенсировать изменение длины оптического пути предметного пучка. Проградуировав такое перемещение Gx в монохроматическом свете и зная п и /, можно определить (п'— п) I, а значит, и га'. Однако в реальных условиях полностью совместить ot и о2 никогда не удается. К тому же присутствие преломляющего предмета и использование пластины 6\ в качестве компенсатора вызывает взаимное смещение ог и о*2, параллельное оптической оси. Удовлетворительное опи- сание интерференционных явлений в области а, и оя прн неточном совпадении соответствующих точек этих изображений нельзя сделать в рамках элементарного изложения, приведенного в настоящей главе. Его можно изящно рассмотреть с помощью теории частичной когерентности <см. гл. 10). 7.5.7. Интерферометр Маха— Цендера; интерферометр Бейтса со смещен- ным волновым фронтом. В интерферометре Жамена (см. п. 7.5.6) передние поверхности пластин, выполняющие роль делителей световых пучков, и зад- ние поверхности, служащие плоскими зеркалами, нельзя установить незави- симо и, следовательно, расстояние между пучками определяется толщиной пластин. Значительно большей гибкостью обладает прибор, в кагором делители пучков и зеркала представляют собой независимые элементы, а пучки можно широко развести. На этом принципе основано устройство интерферометра Маха— Цендера [37], применяемого для измерений изменений показателя преломления, а следовательно, и плотности потоков сжимаемого газа. Схема такого прибора показана на рис. 7.50. Свет от источника S, находя- щегося в фокальной плоскости хорошо коррегированной линзы Llt делится на полуотражающей поверхности А\ плоскопараллельной стеклянной пла- стинки Di на два пучка. Отразившись от плоских зеркал Мх и М2, они вновь соединяются на полуотражающей поверхности Л2 второй (идентичной DO плоскопараллелыюй пластинке ?>2 и выходят через вторую тоже хорошо корре- лированную линзу L2. Все четыре отражающие поверхности обычно устанавли- вают почти параллельно друг другу и так, чтобы их центры находились в вер- шинах параллелограмма. Предположим теперь, что S — точечный источник квазимонохроматического света. Пусть Wt— плоский волновой фронт пучка *) Для всех остальных пучков света, кроме упомянутых, несеребреный участок А пол~ а остью экранируется С, и свет этих пучков не может лопасть в микроскоп.
§ 7-5] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИИ. ДЕЛЕНИЕ АМПЛИТУДЫ" 289 между "Mi и D2, W2— соответствующий плоский волновой фронт пучка между М, и ZX и ft7!— виртуальный плоский волновой фронт между М2 и ?>2, который, выходя из D,, совпадает с Wr и спнфазен ему. В точке Р на волновом фронте W. виртуальная разность фаз между выходящими пучками равна s. 2п . ._ где h = PN — расстояние по нормали от Р до W{, a п — показатель преломления среды между №г и W[. Согласно G.2.16) в сопряженной с Р точке Р' в вы- ходящих пучках светлая полоса находится при nh = nu.o, |m|=0, 1, 2,... (88а) темная полоса — при nh = rrik,,, I) (886) Рис. 4 7.50. Интерферометр Маха •— Цен дер а. Если W[ и W2 параллельны, интенсивность во всех точках Р одинакова, и при этих условиях протя- женный источник даст полосы в бесконечности (т. с. в фокальной плоскости /,г),так же как и интерферо- метрЖамена. Однако в общем случае W[n W2 состав- ляют некоторый угол, и полосы имеют вид прямых, параллельных линии пересечения W[ и Wa. Именно такая установка применяет- ся при исследовании газовых потоков, где обычно ощущается недостаток света, и поэтому желательно применять наибольшие из возможных источников, обес- печивающих еще достаточную видность. Как мы видели в п. 7.5.3, полосы при этом локализуются в области, где пересекающиеся лучи имеют наименьшее уг- ловое расхождение при выходе из S. Положение области локализации изме- няется при повороте элементов системы, которые служат для изменения взаим- ного наклона W[ и W2- Например, если отражающие поверхности первоначаль- но были параллельны и если для простоты мы рассмотрим случай поворота вокруг оси, перпендикулярной к плоскости, в которой лежат все центры, то при повороте Л42 виртуальный район локализации находится вблизи М2 {рис. 7.51, а), а при повороте и Мг и D2— между АЛг и D2 (рис. 7.51, б). Эта особенность отличает полосы, возникающие в клине интерферометра Маха —' Цепдера, от полос, появляющихся в интерферометре Майкельсопа при освеще- нии его параллельным пучком света (см. п. 7.5.5/ с виртуальной областью лока- лизации близ зеркал. В техническом варианте прибора в одном плече интерферометра помещается камера С\ для исследования газового потока — обычно рабочая секция аэро- динамической трубы или трубы для изучения ударных волн. В другом его плече располагается компенсационная камера С.,, позволяющая получить полосы порядков, близких к нулю, желаемой ориентации, с удобным расстоянием и с виртуальной локализацией вблизи выбранной плоскости в Си нормальной к направлению падающего света. Эта плоскость изображается на фотографиче- ской пластинке посредством линзы L2 и хороню коррегиронанного фотографиче- ского объектива. Фотосъемка картины интерференционных полос производится как в присутствии газового потока, так и без него, и в выбранной точке Р' плоскости изображения измеряется смещение порядка Дот в двух картинах. Если нужно, то используются полосы в белом свете для идентификации соот- ветствующих порядков. Пусть п—показатель преломления невозмущепного газа в CV, а п'— показатель преломления текущего газа; тогда (89) Am = -г- \ (п' —-п) ds .
290 ЭЛЕМЕНТЫ таОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ Т Здесь интеграл берется вдоль пути лучей, проходящих через Сх и достигающих Р'. Пусть Ох, Оу, Ог— оси прямоугольной системы координат с началом О в выбранной плоскости в камере Си причем ось Ог совпадает с направлением падающего света, пусть далее Р с координатами (х, у, 0) — точка, сопряженная с Р' в отсутствие газового потока в С,. Тогда, если пренебречь отклонением лу- чей, возникающим вследствие преломления из-за наличия потока, то (89) можно переписать в виде у, z)—n\dz, (90> где s —. длина Си если поток удовлетворяет определенным условиям симметрии (см., например, [38]), (я'— п) в (90) можно выразить через измеренные величины Рис 7 51. К локализации полос в интерферометре Маха — Цондера Am. В таком случае можно определить изменение плотности Ар, вызванное по- током, так как оно пропорционально (я'— я). Видоизмененный Бейтсом [39] интерферометр Маха — Цендера можчо применить для измерения асферичности сходящихся волновых фронтов, ие прибегая к сравнению со свободным от искажений опорным волновым фронтом, как это необходимо в методе Тваймана—Грина (см. стр. 280;. Устройство, показанное на рис. 7.52, а, особенно подходит для испытания качества систем с большими апертурами. Подлежащий проверке сходящийся пучок с главной осью ОА, направленной горизонтально, делится в D± на два сходящиеся пучка, дающих изображения S, и S3 достаточно малого квазимоио- хроматического источника. В начале все четыре отражающие поверхности вер- тикальны, параллельны и расположены так, что на полуотражающеи поверх- ности ?»з изображения St и S, совпадают. Тогда соответствующие падающему волновому фронту W виртуальные волновые фронты W-i и W2 с главными осями OiSi и O2S2 тсчпо совпадут, и глаз, помещенный после D2, увидит равномерно освещенное поле зрения. Повернем теперь D± и Mi как целое вокруг оси, па- раллельной ОА; тогда OiSi и O2Sa немного сместятся друг относительно друга но вертикали. Это по существу равносильно повороту W2 относительно \V\ вокруг горизонтальной оси, и мы увидим, что поле зрения пересекается экви- дистантными горизонтальными полосами, видимыми в белом свете. Предположим теперь, что ?>» поворачивается вокруг вертикальной оси, проходящей через Si и S3; тогда ОА повернется около S, в горизонтальной плоскости и Wt сместится относительно Wt. При идеально сферических Wt и IFj на картину полос, наблюдающуюся в области, где перекрывание Wt и W3
§ 7.5] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ 291 еще сохранилось, не повлияет смещение полос. При наличии отклонений от сферичности полосы сместятся на расстояние, зависящее от степени асферич- ности W. Поэтому, если направление оси координат О»Х с началом в 0а сов- падает с направлением смещения, то смещение порядка Ат(х; а) в точке Р с координатой х равно Ат(х; a) = ±-{<Sr(x) — SP(x—a)\, (91) где zf— оптическая разность хода между W^ и сферой с центром в St и Рис. 7.52. Интерферометр Бейтса со смещенным волновым фронтом. а —схема установки, 0 — поле зрения со смещенными волновыми фронтами. радиусом O2S2, а а — величина сдвига {рис. 7,52, б). Так как Isf равно нулю в О2 (x = 0), имеем отсюда 1 гл'-л (92а) Am (а; а) = ~ и аналогично так что АтBа; а) =~ {& Bа) — 9" (а)}, Am (a; a) + Am Bа; а) = — &'Bа). (926) Подобным же образом нетрудно получить выражения для if (За), и т. д., и мы видим, что величину lif(x) можно определить с интервалом а из измерений А/я. В другом случае, когда а не слишком велико, мы получим из (91) соотношение Am [х; а) « ~- Щ^-, (93) Ло Ох \ > показывающее, что Am пропорционально угловой аберрации -^~ луча, выходя- щего из Р. Очевидно, что в отсутствие вращательной симметрии полный вол- новой фронт в принципе можно исследовать путем изменения направления сдвига. Когда волновые фронты смещаются друг относительно друга, выходящие лучи, виртуально пересекающиеся в Р, проходят делители пучков под разными углами, и если смещение полос зависит только от асферичности, то такое 19*
292 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [гл. 7 различие следует скомпенсировать. Для этой цели служат две компенсирующие пластинки, подобные пластинкам, используемым в качестве делителей пучков, и вводимые в оба плеча интерферометра. Одну из них, Сь укрепляют парал- лельно D2 и при сдвиге поворачивают одновременно с ней. Другую, С», соедч- няют с Ог механической связью и поворачивают в два раза быстрее, чем Оа в противоположном направлении. Сравнительно недавно Дрю *) разработал упрощенную модель интерферометра, в которой компенсирующие пластинки не нужны. 7.5В. Длина когерентности; применение двухлучевой интерференции к изу- чению тонкой структуры спектральных линий. Газ (например, пары кадмия), возбуждаемый в определенных условиях электрическим разрядом, испускает свет, спектр которого состоит из резких ярких линий, разделенных темными промежутками,— так называемый эмиссионный линейчатый спектр. Выделим снег одной из этих линий и осветим им, например, интерферометр Майкельсона, установленный так, чтобы образовались кольцевые интерференционные полосы; тогда мы увидим, что полосы становятся отчетливыми, если длины оптиче- ских путей обоих интерферирующих пучков примерно одинаковы. При возра- стании оптической разности хода видпость полос уменьшается (вообще говоря, немонотонно) и в конце концов они исчезают. Такое исчезновение полос можно объяснить, предположив, что свет спект- ральной линии недостаточно монохроматичен и состоит из цугов волн конечной длины, большое количество которых проходит за любой интервал времени, необходимый для наблюдения. Допустим теперь, что все эти волновые цуги идентичны. Каждый из них, попадая в интерферометр, делится на два цуга равной длины, и если оптическая разность хода в плечах интерферометра больше этой длины, один из цугов пройдет точку наблюдения Р раньше, чем другой дойдет до нес. В таком случае в точке Р интерференция двух волновых цугов, образовавшихся из одного, наблюдаться не будет. В Р в любой момент налагаются друг на друга волновые цуги, порожденные разными падающими волновыми цугами, и так как они приходят беспорядочно, быстро сменяя друг друга, то их вклад в интерференционный член за относительно большое время, необходимое для наблюдения, в среднем равен нулю. Можно представить наше объяснение в друюм виде, математически более удобном для описания изменений видности полос с разностью хода, применив интеграл Фурье, Пусть F (t) — световое возмущение в некоторой точке в момент времени t, вызванное одиночным волновым цугом, и пусть F равно нулю для \t\^U; представим эту функцию в виде интеграла Фурье во F(t)= jj f(v)exp( —2nlvt)d\, (94) где, согласно обратному преобразованию Фурье, f(v)= J F(t)expBnM)dt. /95) Если за время наблюдения эту точку минует N таких волновых цугов, то пол- ное световое возмущение можно записать в виде 2F(t-tn), (96) где величины tn— обозначают моменты прихода соответствующего волнового цуга. Средняя интенсивность света за временной интервал 271, необходимый *¦) См. [40]. Применение интерферометра со CMeiueHHbiMj волновым фронтом обсуждается в [40а].
§ 7.5] ' ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ АМПЛИТУДЫ 293 для наблюдения, равна Г га \±\dt, (97) если Т велико по сравнению с t0 (половино.й длительности волнового цуга). Из (94) и (96) следует, что V (t)= [v (v) ехр (—2пЫ) dv , (98) где N v(v) = f (v) 2 ехр BяЫ„). (99) Следовательно, в соответствии с теоремой Парсеваля имеем I \V(t)\«dt= J |u(v)pdv= 5l/(v)|aS 2 exp\2mv(tn-tm)]dv, A00) Мы можем написать 2 2 exp[2reiv(^-U]='V+ 2 ехр [2n<v «.-,/,.)] = = ^+2 2 cos2jtv(/n — U- A01) Однако, поскольку величины tn распределяются случа1":ным образом, вероятно- сти того, что члены с косинусом будут положительными или отрицательными, одинаковы. Следовательно, средняя величина двойной суммы в A00) при боль- шом числе таких опытов равна /V, и из (97) и A00) получим, что средняя интен- сивность равна 1=W\ If^ifdv, ' A02) т. е. пропорциональна интегралу от интенсивностей i(v) = |/(v) |2 (некогерент- ная суперпозиция) монохроматических компонент, составляющих одиночные волновые цуги *). В интерферометре каждая монохроматическая компонента дает интерференционную картину, описанную в п. 7.5.4, и так как оптическая разность хода увеличивается от нуля, смещения интерференционных картин, обусловленных разными компонентами, увеличиваются вследствие различия в длинах волн. Следовательно, видность полос уменьшается, и они полностью исчезают, когда оптическая разность хода становится достаточно большой. Эти две возможные интерпретации отсутствия полос при достаточно боль- шой разности хода — в рамках представления о хаотичной последовательности ограниченных волновых цугов или представления о суперпозиции монохрома- тических компонент, распределенных в некотором частотном диапазоне,— для большинства практических целей эквивалентны, и из предшествующего обсуж- дения мы можем заключить, что чем длиннее волновые цуги, тем уже частотные диапазоны, в которых фурье-компоненты имеют заметную интенсивность. Проиллюстрируем эту связь на простом примере. Предположим, что длитель- ность всех волновых цугов равна At а в течение этого времени F (t) есть простая *) Строгая формулировка найденного результата дается теоремой Кэмпбелла, хорошо известной в анализе случайных шумов, особенно в связи с дробовым эффектом (флуктуации в интенсивности потоки элсктропещ в вакуумных лампах) [41].
294 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ |гд. 7 периодическая функция с частотой v0>, т. е. F(t)-fvexp[—2jtivat], если |<| F@-0, если \t\>Ml2, где fc— постоянная. Tot-да из (95) и A03) находим (ЮЗ) A04) График функции [sin {jt(v— vt)&t}/(n(v—v0) A^)Ja, ответственной за распре- деление иытенсивностей фурье-компонент в A03), представлен на рис. 7.53. Частотный интервал v0—Av/2sg;v^vo-j-Av,2, в котором интенсивность можно считать зна- чительной, в известной степени произволен, но так как первый пуль (который появляется, когда аргумент члена с синусом равен я) со- ответствует v — г0 — ± 1/Д/, то ясно, что At A05) Рнс. 7.53. График функции v — v0) M Итак, эффективный частотный диапазон фурье-спектра равен по порядку обратной величине длительности одного волнового цуга. Данный пример, в котором все волно- вые цуги идентичны и имеют простую форму, дает лишь идеализироованное представление о свете реальных источни- ков. Согласно теории строения атома потеря энергии атомами при излучении вызывает затухание волновых цугов. Далее, атомы находятся в беспорядочном тепловом движении относительно наблюдателя, и поэтому наблюдающиеся спектры искажены эффектом Допплера. Кроме того, излучающие этомы возму- щаются соседними, и волновые цуги беспорядочно изменяются. По этим причи- нам нельзя ожидать, что изучение света реальных источников позволит придать простой смысл терминам «длительность волновых цугоз» или «частотный диапа- зон фурье-спектров». Однако для любого светового возмущения V (t) или его фурье.-образа v(v) можно определить величины At и Av, которые мы вправе рас- сматривать соответственно как среднюю длительность волновых цугов, состав- ляющих V, и как эффективный частотный диапазон фурье-спектра; можно показать, что эти средние всегда удовлетворяют соотношению ЫЬч>±. , A06) Последнее неравенство, по смыслу аналогичное соотношению неопределенности Гейзенберга в квантовой механике, выводится и обсуждается в п. 10.7.3. Здесь мы отметим только, что в большинстве практически интересных случаев знак неравенства в A06) можно заменить знаком, обозначающим порядок ве- личины. Промежуток времени Ai, входящий в A06), известен как время когерентно- сти света; если Хо—средняя длина волны, то длина Д/, определяемая соотно- шением известна как длина когерентности. Сравнивая A07) и G.3.15), мы видим, что наше прежнее ограничение, налагаемое на разность хода между квазнадонохро- матическими пучками означает, что она должна быть мала по сравнению с длиной когерентности света. Если оптическая разность хода того же порядка
§ 7.5] ДВУХЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ. ДЕЛЕНИЕ АМПЛИТУДЫ 295 или значительно больше длины когерентности, интерференционные эффекты становятся незаметными. Из предыдущего ясно, что наблюдения за изменением видности полос в зависимости от оптической разности хода в соответствующих интерференци- онных опытах должны содержать информацию о спектральном распределении интенсивности используемого света. Первые наблюдения такого рода были вы- полнены Физо [17]. Осветив свой интерферометр (см. п. 7.5.2) желтым светом натриевой лампы, он получил кольца Ньютона и наблюдал за ними при увели- чении расстояния между линзой и пластинкой. Физо нашел, что при контакте линзы с пластинкой кольца были четкими, почти исчезли вблизи 490-го кольца и снова приобретали приблизительно первоначальную четкость около 980-го кольца. Он смог проследить периодическое изменение видности полос в 52 пе- риодах из 980 колец каждый. Отсюда Физо сделал правильный вывод, что жел- тый свет натрия состоит из двух компонент приблизительно равной интенсивно- сти. Максимумы видности полос наблюдались там, где разность хода равнялась целому кратному длины волны каждой компоненты и, следовательно, эти длины волн относились примерно, как 981/980. Физо удалось подтвердить свое заклю- чение прямым наблюдением с призменным спектроскопом. Позднее более тщательные наблюдения были проведены Майкельсоном [42], определившим с помощью своего интерферометра видность кольцевых по- лос путем сравнения их с системой кольцевых полос с известной переменной видностью. Это позволило ему построить кривые видности полос как функцию разности хода для света целого ряда спектральных линий. Посмотрим теперь, как кривая видности связана со спектральным распре- делением интенсивности. Предположим для простоты, что интенсивности двух интерферирующих пучков одинаковы. Для оптической разности хода A?f раз- ность фаз равна b(ko,A&'1)=kl)AS', A08) где feo—2яА,|>— волновое число. Из G.2.17) найдем для интенсивности, обус- ловленной компонентами с волновыми числами в интервале dka, i (*„, Aff) dk0 = 2i, (k0) {1 + cos (k0A?)} dka, A09) где ti(fto) — спектральное распределение интенсивности в каждом пучке. Как уже было показано, отдельные спектральные компоненты складываются нскогерептно, и, следовательно, результирующая интенсивность в интерферен- ционной картине равна I(A9')^2]il(k,){\ \-cos{kaA&)}dka. (ПО) Для света спектральной линии i,(k0) пренебрежимо мало всюду, за исключе- нием небольшой области k0 около некоторого среднего волнового числа ka- Если теперь принять _ x = ko—ka, i(x)=i1(k0 + x), A11) -го вместо A10) можно написать I = 2^i(x){l+cos[(k0 + x)&S']}dx, A12) Дальнейший анализ будет вестись так же, как и на стр. 256. Следовательно, последнее соотношение можно переписать (см. G.3.38)) в виде I(A#>) = P + C(A?>)cos(kbA<$P) — S(A^")sin(ife0A#), A13) где A14) = 2\j(x)sin(xA?>)dx.
296 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ Н ИНТЕРФЕРОМЕТРЫ [гл 7 Так как для спектральной линии j(x) не равно нулю только при |дг|-^0, то изменения С и S пренебрежимо малы по сравнению с изменениями cos (k<fi.0f) /f Jo Ц ~Z О я 2я A3 О Ш J 0 JL ?S. AX ~~ r^ Ah Лк Ak MAS If \Ш\ x 0 Ah Ak Ak Ah 2S. A3 S) Рис. 7 54. Кривые видносги, соответствующие различным спектральным распределениям интенсивности -: 6) i^i0 exp (—a2**>. ]. в) /=/„ехр[-«хдг+ . exp [ fc -^- exp I — f -^— ) l/ 5 + 4cos ^ ~ tizP ) при ^ — 1 Аналитические выражения Для ^* выведены п предположении, что спет квязнмонохроматичен На рис б), в), s) Ak — 2 l^ln 2/a ~ 1,65/a. и sm(ft,,A?/'), и отсюда следует, что положение экстремумов / с хорошим при- ближением определяется соотношением -JL- = —к, [С sin (F0A#¦) + S cos (fi,ASf)] = 0, т. е. _ t 0 (h \ *f\ ^i /С л irv Из A13) и A15) для экстремальных величин / найдем Отсюда кривая видности описывается соотношением Отметим, что A13) можно также записать в виде -L?^±?lcos(q,-|-ft, A16) A17) A18) где tg ф = S/C. Таким образом, кривая видности представляет собой огибающую нормированной кривой интенсивности ПР. Рассчитанные кривые видности для нескольких возможных спектральных распределении интенсивности показаны на рис. 7.54. Однако на практике мы
§ 7.6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 297 встречаемся с обратной задачей, а именно с определением спектрального рас- пределения из наблюдаемой кривой видности. Если функция }(х) симметрична, то S — 0, и A17) сводится к r> = lQ-. A19) В таком случае кривая видности определяет С (не считая постоянного миои.и- теля пропорциональности Р и знака, который обычно находят из физических соображений) и j(x) получаются из A14) с помощью обратной теоремы Фурье, Однако в общем случае кривая видности позволяет найти только | | но згого, вообще говоря, недостаточно для определения j(x), и нужно знать отдельно и Си S. Рэлей [43] отметил (см. также 144]), что можно определить и С, и S, если измерять не только видность полос, но и их положение, так как последнее с помощью A15) дает отношение CIS; однако такие измерения очень трудны *). Несмотря на эти трудности, Майкель- сон смог выяснить структуру простых спектральных линий, получившую убе- дительное подтверждение в последующих исследованиях. В частности, он нашел, что красная линия кадмия (А = = 6438А) наиболее близка к мопохроматичной из всех исследованных им линий; ее кривая видности (рис. 7.55) соответствует симметричному спектраль- ному распределению гауссовой формы с полушириной, равной лишь 0,013 V, ему удалось также наблюдать интерференционные полосы с разностью хода, превышающей 500 000 длин волн (~30 см). Такой метод анализа спектров с помощью двухлучевой интерферометрии имеет исторический интерес как первое применение интерференции в спектро- скопии; позднее он был вытеснен методами многолучевой интерферометрии (см. § 7.6). Однако сравнительно недавно снова возродился интерес к двухлуче- вому методу в применении к инфракрасной области спектра (см., например, [47] и обзорную статью по Фурье спектроскопии [47а]), так как в этом случае он имеет ряд технических преимуществ. § 7.6. Многолучевая интерференция При падении пучка света на прозрачную пластинку на ее поверхностях происходят многократные отражения, в результате чего с каждой стороны пластинки выходит ряд пучков с убывающей амплитудой. Рассматривая интер- ференционные эффекгы, возникающие с такими пластинками (см. пп. 7.5.1, 7.5.2, 7.5.6), мы пренебрегали вкладом в результирующую интенсивность пуч- ков, испытавших больше двух отражений. Такое допущение оправдано при ма- лой отражательной способности поверхностей. Теперь мы учтем все отраженные пучки и покажем, что при большой отражательной способности поверхностей распределение интенсивности в картине полос изменяется. Именно поэтому многолучевая интерференция находит важное практическое применение. 7.6.1. Многолучевые интерференционные полосы, полученные с плоско- параллельной пластинкой. Рассмотрим шюеколараллельную прозрачную пла- стинку с показателем преломления п', находящуюся в среде с показателем преломления п, и предположим, что на эту пластинку под углом G падает пло- ская волна монохроматического света. Пусть луч SBi (рис. 7.56) представляет *) Большое число иких измерений описано в работе Иерарда [45].
298 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [гл. 7 направление распространения падающей волны. На первой поверхности эта волна разделяется на две плоские волны: одну, отраженную в направлении BtCu и другую, прошедшую в пластинку в направлении BiDx. Прошедшая волна падает на вторую поверхность под углом 9' и здесп снова разделяется на две плоские волны: одну, прошедшую в направлении DiE],, и другую, отражен- „ ную обратно в пластинку в направле- S 4 нии DtB2 Такой процесс деления вол- ны, остающейся в пластинке, продол- жается, как показано на рисунке. Пусть Л("— амплитуда электри- ческого вектора падающей волны, ко- торую мы считаем линейно поляризо- ванной либо параллельно, либо пер- пендикулярно плоскости падения. Как и н и. 1.5 2, мы полагаем, что Аиу комплексна и ее фаза равна постоян- ной части фазы соответствующей вол- новой функции. Для каждого члена совокупности отраженных или про- шедших волн переменная часть фазы волновой функции отличается от та- кой же части фазы предыдущего чле- двукратному прохождению луча в пла- Рис 7 56 Отражение плоской волны в пло- скопараллельной пластинке.. на на величину, соответствующую стинке. Согласно G.5.6) эта разность фаз равна o = -j— п /г cos 9 , (I) где h — толщина пластинки, а Ха— длина волны в вакууме. Пусть для волиы, идущей из окружающей среды в пластинку, г — коэффициент отражения (отношение амплитуд отраженной и падающей волн), а I — коэффициент про- пускания (отношение амплитуд прошедшей и падающей волн), пусть далее г' и /'— соответствующие коэффициенты для волны, идущей из пластинки в ок- ружающую среду. Комплексные амплитуды волн, отраженных от пластинки, запишутся тогда в виде rAu\ tt'r'exp(ib), tt'r'aAMexpBi6), э—1) 6). Аналогично комплексные амплитуды волн, прошедших сквозь пластинку (от- брасывая несущественный постоянный фазовый множитель), будут равны tt'Au\ «V'MU>ехр(гб), «V'M Величины г, г', t и V связаны с п, п', 6 и 0' формулами Френеля (см п. 5.2). Сейчас нам не нужны они в явном виде, а важно только существование таких связей. Таким образом, из соотношений A.5.20а) и A.5.35) видно, что для каждой поляризованной компоненты «'=<#"; B) аналогично из уравнения A.5.21а) получим г = —г', C) откуда, согласно A.5.33), 4 Г^г'* = .%, D) где И и еГ — соответственно отражательная и пропускательная способности поверхностей пластинки — связаны соотношением "=1. E)
§ 7.6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 299 При суперпозиции первых р отраженных волн амплитуда Air) (р) электри- ческого вектора отраженного света дается выражением { = {г + W г' ехр («б) A +• г'а ехр (i6) + ¦ • - exp [t{p—2) б]} Л"> = Если пластинка достаточно длинна, число отраженных волн велико, и в пре- деле при р^-оо мы получим из F) и C) Из B), D) и E) находим 1-е'» G) (8) и, следовательно, интенсивность /(г)= Air>Air> * отраженного света равна цп - B-2 cos 8)^ ,„:> _ 1 ' ' П2—2^ cos 5 ' "" 45? sin2 - (9) где /U)= Л^'Л5'"'*—интенсивность падающего света. Таким же путем получаетсячвыражение для амплитуды Ат прошедшего света, а именно Ат (р) -if (I -j->-'2exp щ q_ . .. "V7' + г'2 ^-" ехр [i (р—1N]) Л1'1 = '-^«fr^, (Ю) (И) 1 — /-'2ехр В пределе при р-^оо A0) сводится к Отсюда, используя B) и D), получим и соответствующая интенсивность ; прошедшего света (I— A3) Рис. 7.57. К возникновению много- лучевых интерфереицмошгых ]io;ioc равного наклона в случае плоскопа- раллельной пластинки. Формулы (9) и A3), известные под названием формул Эйри, находятся в со- гласии с результатами, полученными ранее из общей теории распространения волн в слоистой среде (см. § 1.6); если в уравнениях A.6.60) положить rl2= г, Гы~— г', t12= t, ttt>= t', 2f5 =б и использовать соотношения B) и C), то получим (9) и A3) *). Предположим теперь, что плоские волны равной интенсивности падают на пластинку под разными, мало различающимися углами и прошедший свет *) При этом сопоставлении следует помнить, что в отличие от обозначений, принятых п настоящей разделе, символы ?/( и ?Г в § 1.6 обозначают отражательную Е пропускательную способности всей пластинки.
300 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 собирается линзой L (рис. 7.57). В точке Р фокальной плоскостиZ- интенсивность прошедшего света относится к интенсивности в Р в отсутствие пластинки, как /"V/1"; следовательно, согласно A3), в присутствии пластинки максимумы интенсивности в Р будут тогда, когда порядок интерференции т, определяемый выражением S 2n'hcosd' (\л\ равен целым числам 1,2, ..., минимумы,— когда он равен полуцелым числам 13 5 i "о" i т > - т • ¦ • ¦ Очевидно, что в фокальной плоскости L появляются полосы АЛЛ равного наклона, соответствующие местам с постоянным В' (и, следовательно, в). Аналогично, если свет, отраженный от пластинки, собирается линзой L', то в ее фокальной плоскости также появятся линии равного наклона. Из (9) следует, что максимумы интенсивности в этой картине для отражен- ного света соответствуют полуцелым значениям порядка интерференции 13 5 , ,, „ ш =  , у, у , ..., а минимумы— целым числам 1, 2... Следовательно, по- ложение полос в обеих картинах совпадает с тем, которое получалось при при- ближенном рассмотрении в п. 7.5.1, где с каждой стороны пластинки мы учи- тывали только два первых пучка. Распределение интенсивности в ин- терференционных картинах в отражен- ном и прошедшем свете описывается (9) и A3) и с помощью E) их можно пред- ставить в виде ¦/ Л 2(пп1)к Рис. 7.58. Многолучевые интерференцион- ные полосы равного наклона а прошед- шем свете. Отношение 1^/1 интенсивности прошедшего ciuid, к интенсивности падающего как функция ра шости ф<ту б, гп — целое число 1) F=0 2, ^2 = 0,046; //) .F = 2, i/i = D,27; III) /¦'=20, 52=6,64; IV) F = 200, 5J = 0,S7. A5а) A56) где параметр F определяется соотноше- нием Очевидно, обе картины дополнительны в том смысле, что ? + ?=!¦ 07) График зависимости /<*>//1" от разности фаз 6 при разных значениях F показан на рис. 7.58. Когда 91 мало по сравнению с единицей, F также мало по сравнению с единицей, и мы можем разложить l/.(l (см. A5)) и сохранить члены с F только в первой степени. Это дает Fsin3-|-j в ряд /<¦¦> - = -V(l-cos6), fU) ' 1 — Fsin2 y= 1 —1"'<1 — cos б), A8a) A86) т. е. соотношения для изменения интенсивности имеют вид G.2.15), типичный для двух интерферирующих пучков. Если iA увеличивается, приближаясь к единице так, что и /•' становится большим, то интенсивность минимумов кар- тины в прошедшем свете падает и максимумы становятся резче. Интенсивность в прошедшем свете всюду, за исключением участков, находящихся в непосред-
§'7.6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ Я01 ствешюй близости к максимумам, очень мала. Таким образом, интерференцион- ная картина в прошедшем свете имеет вид узких светлых полос на почти совер- шенно темном фоне. В отраженном свете она имеет вид узких темных полос на почти равномерном светлом фоне. Резкость полос принято измерять полушири- ной интенсивности, или просто полушириной. Для картины в прошедшем свете она равна расстоянию между точками, лежащими по обе стороны максимума в том месте, где интенсивность уменьшается до половины максимальной вели- чины. Отношение расстояния между соседними полосами к полуширине мы назовем резкостью полос и обозначим буквой аГ. У полосы целого порядка т точки, где интенсивность равна половине максимальной величины, находятся при 6 = 2тл±в/2, A9) где в соответствии с A56) Когда F достаточно велико, е настолько мало, что в B0) мы можем принять sin (е/4) = е/4, и получим для полуширины ъ = -?=. B1) Так как расстояние между соседними цолосами соответствует изменению 6 на 2я, то для резкости находим W = — = 5J^. B2) До сих пор мы предполагали, что свет строго монохроматичен. В случае квазимонохроматического света распределение интенсивности равно сумме распределений интенсивностей типа A5), обусловленных каждой монохромати- ческой компонентой; если эти компоненты занимают область длин волн ЛХ0 вблизи средней длины волны %„, то максимумы порядка т распределены в об- ласти, соответствующей | Д8 | в картине, получающейся в длине волны Хо. Согласно A4) и пренебрегая зависимостью n'h от длипы волны, находим | Дб| = = 2шпАХ(,!%0; можно считать, что интерференционные картины, создаваемые этими компонентами, совпадают, а результирующее распределение интенсив- ности оказывается таким же. как и в случае строго монохроматического света с длиной волны">*,(,, если j Ло | пренебрежимо мало по сравнению с полушириной s монохроматической полосы. В соответствии с B2) последнее условие выпол- няется нри т^<^Х0/&Х0, т. е. при •™<ж;. B3) где А^=2^б = тХ0 B4) ¦— оптическая разность хода между соседними интерферирующими пучками. Неравенство B3) аналогично неравенству G.3.15), относящемуся к случаю ин- терференции двух пучков. Величина, стоящая в правой части неравенства B3), тождественна длине погрешности света (см. G.5.107)). Из предыдущего ясно, что при возрастании отражательной способности поверхностей и, следовательно, при увеличении <f распределение интенсивно- сти становится более благоприятным для определения положения полос. В ин- терференционной картине в проходящем свете полосы, принадлежащие раз- личным монохроматическим компонентам, разделяются более четко. По этим
302 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 причинам многолучевая интерференция имеет большое практическое значение. В оптическом диапазоне отражательная способность поверхности между двумя диэлектриками при нормальном падении мала; например, для границы воздух (м~1) — стекло (п'~ 1,5) находим из A.5.37) ?/l~0,0i. Отражение увеличн- пается при косом падении и, как мы видели в § 1.5, Э1 ->¦ 1, когда в оптически более плотной среде свет падает под углом, близким к критическому. Отража- тельную способность, мало отличающуюся от единицы, можно получить и при почти нормальном падении света, путем нанесения па поверхность диэлектрика многослойного покрытия из других подходящих диэлектриков (см. § 1.6) или путем нанесения частично прозрачного слоя металла. Теория отражения от ме- таллических пленок на диэлектрической подложке изложена в гл. 13, но здесь, забегая вперед, можно сказать, что такие слон поглощают свет, что сдвиг фаз при отражении не должен быть обязательно равен нулю или я и что отражатель- ные способности и сдвиги фаз на обеих поверхностях слоя различны, если у гра- ничащих с ними диэлектриков неодинаковые показатели преломления. Следо- вательно, приведенный выше анализ неприменим в случае пластинок, покрытых металлическими слоями. Однако при идентичных слоях на обеих поверхностях пластинки уравнения A2) и A3) остаются верными, если под 91 мы будем под- разумевать отран-сательпую способность при внутреннем отражении и заменим 6, определенную соотношением A), на величину i^ B5) где ц, — сдвиг фазы при внутреннем отражении. Полагая Я-*-?' + Л=1, B6) где Л-— часть света, поглощенная металлом, получим из A3) и A6) соотношение \ г \ ) I— m) l + FsinHb/2)- (ZI> Сравнивая B7) и A56), мы видим, что для данного F поглощение уменьшает интенсивность картины в проходящем свете па множитель *) [1—Л/(\—V)]. При падении света в направлении, близком к нормальному, изменение фазы <р при отражении эквивалентно увеличе- нию оптической толщины пластинки на срЯ,0/2я; при косом падении возникает и другое осложнение, а именно то, что сдвиг фаз зависит от поляризации свеи. 7.6.2. Интерферометр Фабри — Пе- „_-»... . , _ ро. Многолучевые интерференционные Рис. 7.59. Интерферометр Фабри - Перо. полжы^ сдаваемые плоскопараллель- ной пластинкой при почти нормальном освещении, используются в интерферометре Фабри Перо [49J. Основными час- тями его служат две стеклянные или кварцевые пластины Рг и Рг (рис. 7.59) с плоскими поверхностями. Внутренние поверхности пластин, покрытые час- тично прозрачными пленками с высокой отражательной способностью, парал- лельны, и воздух, заключенный между этими поверхностями, образует плоско- параллельную пластинку. Сами пластины делают слегка клиновидными, чтобы устранить вредное влияние света, отраженного внешними непокрытыми по- верхностями. В первых образцах прибора одна пластина была неподвижна, а другая устанавливалась на салазках, что позволяло перемещать ее с помощью винта относительно первой. Однако вследствие ненадежности механической конструкции такие системы вышли из употребления. В настоящее время пла- *) При многослойных диэлектрических отражающих покрытиях распределение интен- сивности в интерференционной картине в прошедшем свете тоже определяется B7), а уменьше- ние интенсивности в этом случае обусловлено в основном рассеянием света (см. [48]).
§ 7.61 МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 303 стины разделяют неподвижным кольцом D из инвара или кварца с тремя вы- ступами па торцах, к которым пластины прижимаются пружинами. Кольца обработаны с большой точностью, так что положение плоскостей, заданное вы- ступами, максимально близко к парал- лельному, а тонкая регулировка осущест- вляется изменением нажима пружин. Ин- терферометр такого типа с фиксирован- ным расстоянием между пластинами иногда называют эталоном Фабри — Перо. Как мы видели в п. 7.6.1', свет от протяженного квазимонохроматического источника 5, удовлетворяющий условию B3). образует узкие световые полосы равного наклона в фокальной плоскости линзы L. Согласно B5) порядок интерфе- ренции равен ~ 5 2n'h cos В' , ф оя Рис. 7.60. Полосы, полученные с интер- ферометром Фабри — Перо. где п'— показатель преломления возду- ха между пластинами, h — расстояние между отражающими поверхностями, 9'— угол отражения, а (р—сдвиг фазы. Ось линзы обычно нормальна к пластинам, поэтому светлые полосы, соответст- вующие целым значениям т для света, прошедшего в направлении нормали к пластинам, имеют вид окружностей с общим центром в фокусе лин- зы (рис. 7.60). В этой точке т имеет максимальную величину т0, равную 4- B9) .C0) В общем случае та отлично от целого числа, и мы можем написать от„ = тг + е. где mi— целый порядок внутреннего наиболее светлого кольца, а е — вели- чина, меньшая единицы,— дробный порядок в центре. Из B8) — C0) тем же путем, каким выводилось уравнение G.5.13), можно получить угловой радиус вр р-го светлого кольца от центра (если Qp не слишком велико) в виде C1) где п — показатель преломления воздуха вне пластин. Диаметр Dp этого коль- ца равен, следовательно, /у B/6 )а (р 1+eV C2) здесь f — фокусное расстояние линзы L. Важнейшими практическими характеристиками интерферометра Фабри —• Перо служат резкость ёГ, определенная выше как отношение расстояния между полосами к их полуширине, максимальное пропускание C3) \/*" / макс и контрастность C4)
304 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 где /1"— интенсивность в некоторой точке интерференционной картины, а /ш— соответствующая интенсивность при отсутствии интерферометра. Если мы допустим теперь, что внутренние поверхности пластин плоски и параллельны и пренебрежем отражениями на внешних поверхностях, то /"»//(" опреде- лится B7). Сравнивая B7) и A56), мы видим, что резкость задается выражением B2), а используя A6), найдем ^ = EJLiL. Cj) Согласно B7) максимум пропускания равен T-fl-^V. 136) согласно A6), B7) и C5) контрастность записывается в виде Как мы отмечали в п. 7.6.1, отражающими покрытиями пластин могут служить либо металлические пленки (чаще всего из серебра и алюминия), г . '508А фтористого магния [a9J Для диэлектрических плекок указаны число слоев и оптимальная длина волны либо диэлектрические пленки из чередующихся слоев материалов с высоким и малым показателем преломления (например, сульфида цинка и криолита) и с оптической толщиной Я0/4 каждый *). Пленки обоих типов наносятся терми- ческим испарением в вакууме. Для данной длины волны Ж, вообще говоря, возрастам с увеличением толщины пленки из металла и с увеличением числа слоев диэлектрика (см. табл. 1.3). Однако было установлено, что для покрытий обоих типов при больших величинах iA, представляющих практический ин- терес, увеличение Я сопровождается увеличением величины ,Л!{\—5?), т.е. согласно C5) и C6), т уменьшается с увеличением 3~. Таким образом, получить одновременно большие величины максимального пропускания и резкости (или контрастности) невозможно, и практически приходится находить какой-то компромисс в выборе этих величин. На рис. 7.61 приведены величины т и JF, полученные из измерения на типичных пленках. Как мы видим (исключая крайнюю красную часть спектра), наибольшие величины резкости при данном максимальном пропускании достигаются с диэлектрическими покрытиями. *) Применяется также комбинация металлических и диэлектрических пленок [50],
§ 7.6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 305 Следует отметить, однако, что коэффициент отражения многослойных диэлект- рических покрытий высок только в ограниченной области длин волн вблизи длины волны Х„, для которой оптическая толщина каждого слоя составляет XJ4, и поэтому диэлектрические покрытия не следует применять там, где один интерферометр используется для широкого спектрального интервала. В види- мом участке спектра серебряные покрытия дают более резкие полосы для данного максимального пропускания, чем алюминий, тогда как в области мень- ших длин волн (ниже 4000 А) алюминиевые покрытия лучше и могут при- меняться в ультрафиолете вплоть до 2000 А. Предыдущее обсуждение относилось к идеальному интерферометру с идеально плоскими и параллельными отражающими поверхностями *) Практически же поверхности интерферометрических пластин невозможно сделать абсолютно плоскими и, следовательно, расстояние h между ними всегда изменяется по площади пластин. Влияние такого непостоянства h рассматривалось Дюфуром и Пикка [54] и Шаббалом [55]. Они показали, что резкость и максимальное пропускание всегда меньше, чем это следует из C5) и C6), и что при Я -* 1 резкость приближается к пределу Wл, зависящему только от дефектов пластин, т. е. для данных пластин суще- ствует верхний предел резкости полос, который нельзя превысить ни при какой отражательной способности покрытий. Величина Wл зависит от формы и величины отступления от плоскопараллельности. В частности, когда дефект пластины заключается в небольшой ее сферичности, такой, что n'h изме- няется на XJq от центра отверстия интерферометра к его краю, то ffл~ ql2. В качестве примера рассмотрим интерферометр с q — 100 (т. е. o7d^ 50), пла- стины которого покрыты свежеприготовленными пленками серебра; пусть длина волны используемого Таблица 7.1 Резкость |Г и максимальное пропускание х для плоских пластин (а) и для пласшн со сферической кривизной (б), у которых различие величин n'h а центре и на краю составляет 52 А света примерно равна 5200 А. Сравнение резкости W и мак- симального пропускания т, получаемых с таким интерфе- рометром, с их величинами, указанными на рис. 7.61, про- ведено в табл. 7.1. Мы видим, что прн oF S tfd увеличение отражательной способности приводит к уменьшению мак- симального пропускания, слегка компенсируемому увеличением резкости. Этот пример показывает также, с какой высокой степенью точ- ности должна изготавливаться плоскость пластин, чтобы можно было использовать все преимущества вы- сокой отражательной способности. Величины для (а) взяты из рис. 7.61. Величины для (б) получены из теоретических кривых [551. 7.6.3. Применение интерферометра Фабри — Перо для изучения тонкой структуры спектральных линий. При освещении интерферометра Фабри--Пе- ро квазимонохроматическим светом, не удовлетворяющим условиям B3), распределение интенсивности в прошедшем свете отличается от даваемого а) Плоские У 25 50 75 100 125 пластины т 0,59 0,44 0,30 0,20 0,13 6) Пластины со сфериче- ском криви.шоп (^*^=50) У 22 36 42 45 46 0,55 0,34 0,20 0,11 0,06 *) Друг°й тип интерферометра Фабри — Перо, в котором плоские зеркала заменены сфе- рическими зеркалами с равными рлдиусами кривизны и установлены так, что их фокусы сов- падают, описан в [511. Интерферометры такого типа применяются, например, в качестве резо- наторов в лазерах [52, 53]. 20 м Кг,
306 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ выражением B7) и содержит некоторую информацию о спектральном распреде- лении используемого света. В частности, допустим, что свет состоит из дв\\ монохроматических компонент. Представим себе, что различие в их длинах волн постепенно возрастает, и если они не отличаются слишком сильно по интенсивности, наличие двух компонент в конце концов будет замечено, так как в интерференционной картине появятся две смещенные друг относительно друга системы максимумов. В таком случае говорят, что компоненты разрешены интерферометром. Подобным способом Фабри и Перо [491 удалось непосредст- венно наблюдать тонкую структуру спектральных линий, существование ко- торой Майкельсон только предполагал (см. п. 7.5.8). С тех пор в этой об- ласти спектроскопии интерферометр Фабри — Перо играет доминирующую роль. Для сравнения способностей различных приборов разрешать структуру спектров, удобно рассматривать линию, состоящую из двух компонент равной интенсивности, и установить, быть может несколько произвольно, величину смещения максимумов, при котором компоненты «начнут разрешаться». Пусть Д.0:±-о~Л^о— длины волн двух таких компонент; тогда величина Х„/АХ0 назы- вается разрешающей силой прибора. Такой критерий разрешения впервые введен лордом Р.здееи 160] для спектроскопов с призмой или решеткой, у кото- рых распределение интенсивности в монохроматическом свете имеет вид /макс- Рэлей предложил считать, что в этом случае две компоненты равной интенсивности начина- ют разрешаться, когда главный максимум интенсивности одной совпадает с первым минимумом другой (рис. 7.62). При таком комбинированном распределении отношение интенсивности в средней точке к интенсив- ности в максимуме равно 8<'jt.3— 0,811. Будем считать подобное отношение ин- тенсивности в седловине и в максимуме критерием разрешения в интерферометре Рис. 7.62. Две спектральные монохре- фабри — Перо*). Если отражающая спо- собность пластин не столь велика, чтобы начало сказываться их несовершенство, распределение интенсивности / (б), обусло- вленной одной монохроматической компонентой, можно записать на основании B7) в виде /F)= ?>__., C8) матические компоненты, которые на- тали разрешаться сшласно критерию Рэлея. а полную интенсивность 1тла (б, е), создающуюся в результате суперпозиции двух таких компонент, расстояние между которыми соответствует изменению й на величину е,— в виде 'ши.46, е) == -г + - <39> *) Критерию Рзлея нрлъззт приписать какой-либо специальный физический смысл, и время от временя предлагаются другие критерии разрешения. При сравнении различных ин- струментов специальный выбор критерия мало существен.
§ 7.6] t;Hoio;iy'iLBAfl шгсрфсркнция 307 Полная интенсивность в средней точке между максимумами интенсивности двух компонент равна fuomt2mn, е), где т— целое число; если (.при условии, что компоненты начинают разрешаться) мы считаем, что максимумы полной интенсивности совпадают с максимумами интенсивности компонент, то полная интенсивность в максимумах равна fnom Brrm ±-г>- 8, е) . Следовательно, ис- пользуя выбранный нами критерий, мы должны считать, что две линии начи- нают разрешаться, если 8 удовлетворяет соотношению ^ 0,81 jlo~\ ^—-I . D0) При большой резкости полос е в D0) мало по сравнению с я/2, и можно приня! ь sin e = e; тогда D0) сведется к F't*-— 15,5/V —30 -= 0, откуда, учитывая B2), находим 4,15 2,07л ,,,. е - —?=- = —— . D1) YF ? Далее из B8), принимая п' не зависящим от длины волны и полагая h столь большим, что можно пренебречь ср по сравнению с S, получим 1 Д6 I = 7г Д^о = 2лт —2-. D2) На пределе разрешения | Аб | равно величине г, определяемой D1), и, следова- тельно, для разрешающей силы интерферометра имеем -^-=0,97/пГ. D3) По аналогии с выражением (8.6.14) для разрешающей силы дифракционной решетки с конечным числом интерферирующих пучков равной интенсивности множитель 0,97 Ш иногда называют эффективным, числом пучков. При падении света, близком к нормальному, т я» 2n'h/X0, и можно считать, что разрешающая сила равна Итак разрешающая сила интерферометра пропорциональна резкости и оптиче- скому расстоянию между пластинами. В качестве примера возьмем ёГ=30 (Si~0,9), величину легко достижимую при работе в видимом спектре, и n'h — -^ Амм; тогда разрешающая сила для Я„— 5000 Л примерно равна f>-105, т. е. имеет тот же порядок, что и разрешающая сила наибольших штриховых дифрак- ционных решеток. Для спектроскопических целей удобно также ввести интер- вал Дк0 спектроскопических волновых чисел (ко= 1/?„<>), соответствующий наи- меньшей разрешаемой разности длин волн АЯ0 и определяемый как Величину Д/Со иногда называют пределом разрешения интерферометра. В пре- дыдущем примере предел разрешения составлял примерно 0,04 см'1. Если у двух компонент различие в длинах волн достаточно велико, сме- щение интерференционных картин друг относительно друга больше расеюнния между соседними максимумами каждой компоненты. Тогда мы говорим о «пере- крытии» порядков. Разность длин волн (ДХ„)„ д, соответствующая смещению на один порядок (|Дб| —2л), называется областью дисперсии интерферометра.
308 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 При падении света, близком к нормальному, находим из D2) (Д^о)о л = — « -^- . D6) Если область дисперсии выразить через спектроскопическое волновое число, то (Д,о)о.д = ^«-1_. D7) Как мы видим, размер области дисперсии обратно пропорционален расстоянию между пластинами, и значит, увеличение разрешающей силы, получающееся при увеличении лого расстояния, сопровождается пропорциональным умень- шением области дисперсии. Сравнивая D4) и DG), мы также видим, что область дисперсии (А>.0)о.д приблизительно в ? раз больше наименьшей разрешаемой разности длин волн. С практически достижимыми величинами SF область дис- персии при большой разрешающей силе очень мала. В типичном случае, рас- смотренном выше (аГ~ 30, n'h — 4 мм, Хо— 5000 А) имеем (ДЯ0)о,дл? 0,3 Л. В п. 7 6 8 мы увидим, что большую область дисперсии можно получить, поль- зу ясь двумя последовательно соединенными интерферометрами Фабри — Перо. Тем не менее при исследовании сложных спектров во всех случаях (кроме очень близких линий) требуется дополнительная аппаратура для разделения интер- ференционных картин; это будет описано ниже. Если две близкие линии разрешены, соответствующий им интервал спект- Р хгкопических волновых чисел легко определить из данных о диаметрах колец и расстоянии между пластинами. Согласно B9) и C0) для спектроскопических волновых чисел Ко и к'„ можно написать D8) где тх и т\— целые порядки первых светлых полос, ег и е\ — дробные порядки и центре картины, и мы предполагаем, чго «г постоянно в интервале от к0 до к,, Вычитая, получим к' к _ (mi—ж) (ег~е{) D9) Для каждой линии дробный порядок пол\чается из измерений диаметров двух светлых колец. Так, из C2) находим, что диаметры Df и Dq р-го и </-го ко- лец связаны друг с другом соотношением Г откуда > е = ^= т Р~ —'¦ №) Если измерения сделаны не с двумя, а с большим числом колец, то среднюю величину в находят методом наименьших квадратов. Разность целого числа порядков (т^—ffli) перекрывающихся картин определяется из наблюдений за изменением картин при уменьшении расстояния между пластинами. Обычно точность в определении величины (т\—mi)-| (ej—е,) не превышает l-10~J; так как редко работают с расстоянием между пластинами, меньшем 1 мм, то для измерения h достаточно точности микрометра, а п' воздуха можно принять за единицу. Мы уже говорили, что вследствие малости области дисперсии интерферо- метра все картины, за исключением картин от очень близких линий, следует разделить. При фотографическом методе регистрации такое разделение обычно успешно достигается «скрещиванием» интерферометра с дифракционным или иризменным спектрографом, исправленным на астигматизм. Одно из таких устройств показано на рис. 7.63, Интерферометр / освещается светом источника
§7 6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЬНЦИЯ 309 4> Щель спектрографа, S, находящегося в фокальной плоскости линзы Z.,, и интерференционная кар- rnna проектируется хорошо коррегированной линзой *) Л3 па плоскость щели спектрографа. Интерферометр устанавливают таким образом, чтобы ценгр картины совпал с центром щели. Тогда щель выделит диаметральное сечение из системы колец, создаваемом каж- дой присутствующей линией, и задача спектрографа состоит в том, чтобы разделить эти сече- ния. Если исследуемый спектр состоит из эмиссионных линий, то щель может быть относитель- но широкой Тогда в фокаль- ной плоскости спектрографа вид- ны изображения щели в свете каждой линии, пересеченные короткими дугами светлых полос (рис. 7.64). Схожая картина наблюдается и с абсорбционными линиями, если непрерывней фон, сопровождающий линии, захватывает область длин воли, меньшую обла- сти дисперсии интерферометра. Абсорбционные линии представляются темными линиями, пересеченными широкими светлыми полосами фона (рис. 7.65). г. . „ „ ?1, Если непрерывный фон захваты- ** „ .... **»•"/ вает широкую область длин волн, как, Рис. 7.63 Интерферометр Фабри — Перо, скрещен- ный о призмеиным спектрографом. Рис. 7.64. "Полосы, полученные с интер- ферометром Фабри — Перо, в свете эмиссионных линии гелия (фотографи- ческий негатив) [70]. Рис. 7.65. Полосы, полученные с интерферо- метром Фабри — Перо, в свете двух линий спектра неона (фотографический негатив) [711. а эмиссия 6 — лбе^рбцяя и центре линии с длиной волны 6402 А показана стрелками например, в солнечном спектре, ситуация становится более сложной**). Чтобы разобраться в ней, предположим, что ширина щели спектрографа пренебрежимо мала, а разрешающая сила спектрографа бесконечна. Пусть оси прямоуголь- ной системы координат Ох и Оу находятся в фокальной плоскости спектро- графа, начало координат О лежи! на линии, определяемой светом, прошедшим *) Возможны и другие комбинации интерферометра со спектрографом. Выбор того г щ иного устройства в каждом частном случае зависит ог таких соображений, как компактно! 1ь установки, ее стоимость, размеры, интенсивность и однородность источника, а также от при- сутствия едухов», которые возникают при нежелательных отражениях от поверхностей си- стемы (см [61]). •*) Впервые этот вопрос был разобран Фабри и Бюиссоном [62].
310 9ЛЕМ1НТЫ TFOPlffl ЧНТЕРФРРМИШИ И ИНТЕРФЕРОМЕТРЫ [1Л 7 через центр щели, ось Оу параллельна щели Вдоль линии х = cotrst длина вот- ны Хо постоянна, и положение максимумов интенсивности определяется B8), тогда можно написать l-V , m=\, 2, E1) Мы здесь предполагаем, что 9' мало и принимаем п'~ п— 1 для воздуха. Угол 6 — угол выхода лучей из интерферометра При малом 0 он связан с ко- ординатой у соотношением у — М[8, где /— фокусное расстояние линзы L». проектирующей полосы на щель, а М — увеличение спектрографа Далее, >.„ свячано с координатой х зависимостью F (х) - к„, где функция F характеризует дисперсию спектрографа Исключая с помощью этих соотношений Х„ и В из E1), мы получим для источника с непрерывным спектром геометрическое место точек максимумов интенсивное] и 2, E2) m= 1, Относительное распределение интенсивности между максиму - мами служит характеристикой интерферометра Спемр в фо- кальной плоскости спектрографа рассекается узкими светлыми полосами — каналами с широ кими темными промежутками между ними Эти каналы сим мстрйчны относительно линии //= 0 и обращены выпуклостью в сторону больших длин волн, при у = const различие межд> ними в длинах во1п, очевидно, равно области дисперсии иптер- феиочетра В специальном слу- чае, когда F (х)— линейная функ- циях, каналы имеют вид парабол. Если в спектре присутст- вуют линии поглощения, светлые каналы прерываются темными полосами в местах пересечения с линиями поглощения иными словами, эти темные полосы находятся па тех же местах, где били бы свет- лые полосы, образованные эмиссионными тиниями с тей же длиной волны, что и у линии поглощения Если щель раскрывается симметрично, темные полосы расширяются в направлении v To же происходит и со светлыми полосами, ко- горыс D конце концов соприкасаются и сливаются В лтчх условиях непрерыв- ный спектр представляется испещренным темными «почосами», обусловленными абсорбционными линиями (рис 7 66) Полученные картины могут измеряться таким же способом, как и светлые картины, создаваемые эмиссионными ш- пиями. Практически разрешающая сила спектрографа не бесконечна вследствие щ фракции и, следовательно, свет с любой дшшл волны растягивается на \о- шчное расстояние в направлении а Такн\, образом, влияние этого лкректа аналогично расширению щели г е ведет л чширению светлых кана юв в на- правлении х, и они начнут перекрываться, когда епек1рограф 'же не сможет полностью разрешить длины волн, расстояние между которыми равно расстоя- it» Рис / ЬЬ Полосы, полученный с интерферометром Фабри — Перо, обусловленные линиями поглоще ния в солнечном спектре 172]
§ 7.6) МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 311 иию между соседними светлыми полосами. Мы видели, что это расстояние равно области дисперсии интерферометра, которая уменьшается с увеличением рас- стояния между пластинами. Тем самым конечная величина разрешающей силы вспомогательного спектрографа ставит верхний предел расстоянию между пла- стинами, которым еще можно пользоваться. Интерферометр Фабри — Перо можно также использовать в спектроско- пии в комбинации с фотоэлектрическим детектором [63]. Свет исследуемой спектральной линии, выделенный предварительно монохроматором, направ- ляется в интерферометр. Получающаяся интерференционная картина проекти- руется на кольцеобразное отверстие, концентричное кольцам картины. Это от- верстие пропускает свет от небольшой частн порядка (кольца) па фотоэлемент. Изменяя оптическое расстояние между пластинами, можно увеличивать или уменьшать величину колец на отверстии и таким образом исследовать струк- туру интерференционной картины. Такое устройство имеет важное практиче- ское значение потому, что интерферометр Фабри—Перо, как показал Жакино IG4J, пропускает значительно больший световой поток, чем призменный или ди- фракционный монохроматор с той же разрешающей силой. 7.6.4. Применение интерферометра Фабри — Перо для сравнения длин волн. Измерения длин волн в спектрах, полученных с призменными или ди- фракционными спектрометрами, выполняются путем интерполяции, и длина волны любой линии определяется в зависимости от длин волн известных соседних эталонных линий. Так как с большим спектрографом гакое сопостав- ление можно сделать с точностью около 1-10~6, то необходимо знать относитель- ные длины волн эталонных линий по крайней мере с такой же точностью Число таких линий также должно быть достаточно велико, чтобы не затруднять ин- терполяцию. Далее желательно сопоставить длины волн с длиной метра. Та- ким образом, выбор рациональной системы длин волн для спектроскопических целей включает две операции; (а) сравнение длины волны выбранной первичной эталонной линии с длиной материального эталона метра и (б) сравнение длины волны первичной эталонной линии с длинами волн линий, которые будут слу- жить вторичными эталонными линиями, распределенными по всему спектру. В 1907 г. в качестве первичного эталона [65] была выбрана красная линия F438 А) кадмия, возбуждаемая в определенных условиях [G6]. Измерение длины волны этой линии в долях метра, является метрологическим процессом, требующим специальных методов, и оно будет описано в § 7.7. Измеренная дли- на волны, составляющая 6438,4696- 1О~1Олг, принята за 6438,4696 А. Это и есть определение ангстрема; он отличается от 10~10 м не больше чем на 3-10~6 "с. С этим первичным эталоном длин волн чисто оптическим методом сравниваются длины волн всех других линий. Такие измерения составляют важнейшее при- менение интерферометра Фабри — Перо. Интерферометр освещают (предпочтительно одновременно) светом первич- ной эталонной линии и светом неизвестной линии. Интерференционные картины разделяют и фотографируют соответствующим устройством. Пусть Xs— длина волны эталонной линии в воздухе с показателем преломления среды между пластинами интерферометра, равным л', и пусть ки Я,а, .. . — длины волн неиз- вестных линий. В таком случае, пренебрегая изменением <рХ с длиной волны, получим из B9) и C0) (mls + es)Xs = (т„ 4-е,) X, = (ти + ег) \,=....= 2Я, E3а) 2H=2h + ^, E36) где mls, /Пц, т12, ... — целые порядки первых светлых колец, а е„, elt е2, .,.— дробные порядки в центре картины. Для каждой линии дробные порядки можно найти из измерений диаметров колец (см. стр. 309); целые порядки mls, "tut т1г, .. • находят методом дробных частей порядка, о котором мы
312 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 коротко упоминали иа стр. 271. Для, этого вначалес помощью микрометра изме- ряют расстояние h между пластинами. Целое т'1$, ближайшее к 2hlXs, является приближенной величиной шь, и можно написать mls*=m'ls + x, E4) где х — неизвестное целое число. Если неопределенность измерения h состав- ляет Д/г, то 1*1<ТГ" ' E5) Например, при Д&~0,01 мм и Хв = 6438 А, имеем |а"|<30. Далее по извест- ным приближенным значениям Х\, X'it . .. длин волн Xlt Хг, ... из E3а) вычис- ляют приближенные порядки интерференции для неизвестных линий, соответ- ствующие порядку (ти г <?4) для Xs; имеем «;,+e; = (/n;s + e^)-f, \ ™2 Если принять А^= Я|+ ДА.1, то из E3а) и E4) находим (mu + е,) (Х; + ДА) = (т„ + е,) *., = (mi, + * + es) Х„ E7) откуда, используя E6), U (^\ х\ - (ти + ех) Щ-. E8) Дробная часть, содержащаяся в квадратиых скобках правой части E8), вычис- ляется далее для возможных величин х, допускаемых E5). При правильном значении х вычисленная дробь должна согласовываться с измеренной дробью е, в левой части E8) с неопределенностью (ти+ et)kX[lX[, которая мала по срав- нению с единицей, если расстояние между пластинами достаточно мало. На- пример, для приближенных значений длин волн, определенных по измерениям с решеткой, АЛ^/А.,—• 10~5; следовательно, (тп |- е,) АХ[/Х[я^ 0,1 для /мп~ Ш4,. что соответствует h « тиХ-,12я^З мм при работе в видимой области спектра. Сравнение вычисленных и измеренных дробных частей укажет на непригод- ность некоторых величин х. Такие же вычисления с приближенными длинами волн Х'„ Х'3, . . . дают возможность определить х однозначно; обычно достаточно трех линий, если их длины волн расположены соответствующим образом; чет- вертая линия может служить контрольной. По известному х определяют mXs, mlu т12< ... из E4) и E8), а из E3а> получим m+e Zbp E9) Так как целые порядки определяются точно, то величины ДАЬ АХ2, ... для этих длин волн обусловлены только ошибками в измерении дробей ее, еи е2, ..., и если последние не превышают +0,01 — точность, которую нетрудно достичь с высоко отражающими покрытиями, а т1а, ти, ш1г, ... порядка 10", как в только что приведенном примере, то hXJX\, !sXJX%, ... будут порядка 10~\ т. е. при таких измерениях точность, с которой известны X,,Хг, ... увеличилась примерно в 10 раз. Исправленные значения длин волн можно использовать для повторных опытов с еще большим расстоянием между пластинами, что в свою очередь даег еще большую точность для значений длин волн. Подобную процедуру можно повторять до те» пор, пока резкость линий оправдывает эти измерения.
§ 7.6j МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ- 313 Выше мы предполагали, что (не считая первичных эталонов) имеются лишь относительно неточные значения длин волн *). В свое время было изме- рено большое число вторичных эталонов с точностью, близкой к точности оп- ределения первичных эталонов, что значительно упростило дальнейшие изме- рения длин волн. Эталонные длины волн, а также метод дробных частей поряд- ка **) используются для определения 2//. Для однозначного определения по приближенным значениям длин воли К[, )•.'„, ... величин ти, ш]2, ... нужно только, чтобы величина 2# была достаточно мала. Так, из E3а) и E7) имеем niu+e^^r-im^ + e,)^-,, F0) a nix получается однозначно, если, например, (mn— e,) А\[/Х[х 0,3. Пусть, как и раньше, AXJ\'l~lQ~h, тогда тцЯ4 3- 10", что соответствует Я ft; 10 мм для длин воли видимого света; если измеряемая дробь е± лежит в пределах ±0,01, погрешность '\KJXi в длине волны X,— 2///(Шц-|- еу) примерно равна 3-Ю, i.e. однократное применение интерферометра увеличивает точность почти в тридцать раз. Практически предположение о независимости срХ от длины волны может оказаться неверным, если сравниваемые линии широко разнесены по спектру. Систематические ошибки, связанные с этим, устраняются, если измерения производятся с двумя значениями 1г, например с /г, и hn. Тогда, применяя те же обозначения, что и в E3), находим из B9) и C0) { Ц, + е,)„ -2f} X, = | (ти + е,)п -g }\ = ... = 2*„. откуда Длины волн, полученные после коррекции на изменение фазы, приводят к их величинам в нормальных условиях, при которых измерялся первичный эталон (сухой воздух при 15; С и давлении 760 мм рт. ст.). Для этого необхо- димо знать дисперсию воздуха. Если далее следует привести найденные длины волн к их значениям в вакууме, то нужно знать еще и показатель преломления воздуха. Величины показателя преломления и дисперсии воздуха с точностью, вполне достаточной для данной цели, можно получить с помощью многолучевых интерферометрнческих методов (см. п. 7.6.8). 7.6.5. Интерферометр Люммера — Герке. Мы уже упоминали в п. 7.6.1, что коэффициент отражения света на внутренней поверхности диэлектрика приближается к единице, когда угол падения в более плотной среде прибли- жается к критическому углу. Это обстоятельство использовано в многолучевом интерферометре, предложенном Люммером и Герке 1731, основная часть кото- рого представляет собой длинную плоскопараллельную пластинку из стекла или кристаллического кварца (рис 7.67). Пучок света от источника, лежащег0 *) В своих ранних работах по сравнению длин волн с длиной волны красной лийии кад- мия Фабри и Перо [67] пользовались интерферометром с подвижным зеркалом. Они использо- влли точные длины ноли зеленой E086 А) и голубой D800 А) линий кадмия, измеренные на двухлучевом интерферометре |2Gj. и определяли целые порядки с помощью Taw называемого «метода совпадений-). Принципиально этот метод не отличается от описанного выше метода дробных частей поридка, но более трудоемок и требует визуальных наблюдений. **) Если эталонные длины волк расположены достаточно часто, то можно быстро подсчи- тать приближенную величину ,т и тем самым сократить вычислении (см., например, [68]). Сле- дует упомянуть, что Гарригон [69] описал машину, с помощью которой длины волн определя- ются непосредственно по интерференционной картине, и все необходимые вычисления произ- водятся автоматически.
314 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТР» [ГЛ. 7 на продольной оси пластинки, входит в нее через призму Р, укрепленную на одном из концов пластинки, и падает на внутреннюю поверхность последней под углом, немного меньшим критического. В этом случае ряд световых пучков выходит с каждой стороны пластинки под углом, очень близким к скользящему; вышедшие из нее пучки собираются линзой L и образуют интерференционную картину в ее фокальной плоскости. Рис. 7.67. Пластинка Люммера — Герке. Для монохроматического света с длиной волны ?»0 разность фаз 5 между соседними пучками определяется выражением A), т. е. = !^ (/Уа—n2sin29, F2) где Лип' — толщина пластинки и ее показатель преломления, я— показа- тель преломления окружающего воздуха, 6'— угол отражения в пластинке, а 0 — угол выхода лучей из пластинки. Соответствующий порядок интерферен- ции от равен т = н- = s— ]/"п'г—я2 sin2 9. F3) Полосы, соответствующие постоянному 9, образуют семейство гипербол, кото- рые вблизи центра О картины имеют вид почти прямых линий, параллельных поверхностям пластинки. В соответствии с F3) для порядка интерференции т, в центре (9 = л/2) получим 2Л,у— - F4^ F5) Если мы положим х = (я'2)— 0, то х мало вблизи центра, и можно считать, что sin3 0 = 1 — х1. Тогда, разлагая в ряд F5) и отбрасывая члены с % в степени, большей второй, находим т ~ т, = — п'\ ,НЖ F6> Угол %г соответствующий q-й от центра светлой полосе целого порядка mq, определяется выражением h Vm — m — Я'2—П2 F7) где e— дробный порядок в центре. Следовательно, угловой масштаб картины пропорционален У k(,/h, и если е = 0, то расстояния светлых полос от оси про- порциональны квадратному корню из целых положительных чисел. Распределение интенсивности в такой картине отличается от распределе- ния, рассмотренного в п. 7.6.1, так как в данном случае отсутствует вклад света, вносимый первым отражением поверхностью пластины. Чтобы упростить здесь обсуждение, рассмотрим схему, показанную на рис. 7.68. Спет попадает в пластинку через отверстие JK, ограниченное диафрагмой ЛЗЗ, и преломляется
§ 7.61 МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 315 в пластинке. Очевидно, что пластинка, соединенная с призмой, изображенной на рис. 7.67, действует так же, как и пластинка с отверстием. Разница состоит только в том, что у пластинки с призмой коэффициент отражения для входя- щего луча ничтожно мал *). Пусть Р и Р'— фокальные точки L для света, вы- ходящего из нижней и верхней поверхностей пластинки под углом 0, и пусть А — комплексная амплитуда света в Р в отсутствие пластинки. Комплексные Р' Рис. 7.68. Многократное отражение в тоскопараллелькой пластинке при устранении отраже- ний первичного пучка света от ее внешней поверхности. амплитуды в Р в пучках нижней группы равны (см. п. 7.6.1), с точностью до не- существенного постоянного фазового множителя, величинам tt'A, ttVM ехр A6), ..., tt'r'^f"" А ехр (j (р — \)Ь), и, следовательно, для результирующей амплитуды в точке Р при суперпозиции р первых пучков имеем Л«> (р) = A +г'%ехр (»6) + ... + г'^-» ехр [i (р—1N] tt'A = = Lz^^P ii^l з~а. F8) В пределе, считая, что предельное число пучков р->оо, находим а интенсивность /ш= A(ttAm* в Р равна F9) G0), где / —АА*— интенсивность в Р в отсутствие пластинки. Аналогично для ам- плитуд в точке Р' в пучках от верхней поверхности имеем tt'r'A, W (r'Y ехр (гб) А, ... tt'r4'-!"" ехр [г (р— 1) б] А..., и, следовательно, при суперпозиции р первых пучков результирующая ампли- туда в точке Р' равна .. +г'2<''-1>ехр [((/»—1N] tt'r'A-^ _\—RP ехр (tpfi) ,/-^5 - VWTVЛ и в пределе, когда р—~>-оо, интенсивность в Р' запишется в виде G2) *) Подобное устройство реализуется на практике, если свет поступает а интерферометр Фабри — Перо череч прозрачное отверстие в одном из отражающих покрытий. Особенности такого устройства рассмотрены Дюфуром [74].
316 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 Из G0) и G2) очевидно, что максимумы в интерференционных картинах, лежа- щих под и над пластинкой, находятся на одинаковых угловых расстояниях от- носительно нормали к ней. • Выходящие друг за другом с одной стороны пластинки пучки разделены, очевидно, расстоянием 2/itg9' (считая вдоль пластинки) и при пластинке дли- ной / общее число пучков р равно G3) >ш*е 2- 1. G4) или для Qm я/2 и при п = 1 для воздуха При приближении 9' к критическому углу 5$—>- 1, а &1р перестает быть ничтож- но малым, и поэтому, использование предельных выражений G0) и G2) с р->оо становится неоправданным; в этих условиях распределение интенсивности в верхней картине получается из F8) в виде /«' (р)=^ipj2^p:°i^ s-ч = A— A -9if + Ш sin3 (-j р±\ 1 + F sin* A— 9^L, G5) где °р - (Г a Z7 задано A6). Итак, распределение интенсивности определяется функцией p () отличающейся or функции распре- деления при р-+оо добавочным чле- ном (G;,sin^ {рЫ2))!(\ + F sin2 F/2)). Последний не влияет на положение абсолютных максимумов, остаю- щихся при 6/2 — тп, где т—целое число, но так как (Орып2 (pbl'2))i(\ -f- ¦j-F sin2 F/2)) равно нулю при 6/2= = (т + qlp) я, q = 0, 1, 2, .... р и положительно в остальных случа- ях, то абсолютные максимумы ста- новятся шире, чем при р—>-оо, и между ними появляются вторичные максимумы (рис. 7.69). Пластинка Люммсра — Геркс сл\жнт исключительно для исследования тонкой структуры спектральных линии Применяется она, подобно интерферо- метру Фабри—Перо, в комбинации со вспомогательным диспергирующим прибором. Область дисперсии пластинки можно наиги из формулы F3), кото- рая, если считать п=1, запишется в виде ma^=4/ia(«'3 — sin2 9). G7) Таким образом, в данном угловом положении изменение порядка Дга, соответ- ствующее изменению длины волны па A),a, с точностью до члепоь первою по- рядка относительно малых величин равно Рис 7 69. Зависимости интенсивности в интерфе- ренционных полосах, полученных с пластьнкон Люммера — Герке, от разности фаз \У{ 0,87) G8)
§ 7.6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 317 Для области дисперсии, соответствующей изменению т на единицу, получим, следовательно, G9) или, подставляя т из G7) и полагая sin 9 - близким к скользящему, 1 для лучей, выходящих под углом, Мы видим, что величина | У кварца множитель но от 0,6 при Xo= 2000А до 0,8 при 1„= =- ооооА. Если считать SI постоянной, то точ- ки в интерференционной картине, где 1т (р) уменьшается до половины своей максимальной величины, соответствуют б — 2тл ± е/2 (т целое число), и из G5) находим Р V4/ _ 1 *"о)о. д. обратно пропорциональна толщине пластинки, изменяется приблизитель- -')] 1 -I-F sin2 'ffJt 1" 0 Рис. 7.70. Зависимость резкости ?Г от от- ражательной способности Щ и числа отра- жений р для пластинки Люммера — Герке. Для сравнения указаны величины угла х. (т*читывэемпгп от центра картины, и отношение длины кварцевой пластинки к ее толщине l[h. Очевидно, что резкость ? — 2л/е за- висит как от Я, так и от/?. На рис. 7.70 показана зависимость ее от iA для раз- личных значений р. Согласно G4) р определяется в основном отношением l!h. Л является, конечно, функцией О', а значит, и %; следовательно, при данном % значение .34х больше ,% „ (при п'>п); поэтому выгодно выделять поляризованную компоненту, колеблющую- ся перпендикулярно к плоскости падения. Предельный случай р->оо соответст- вует пластинке бесконечной длины, у которой распределение интенсивности та- кое же, как и в интерферометре Фабри — Перо (см. G0) и B7)). В этом случае резкость определяется из C5). Рис. 7.70 показывает, что при конечном р вели- чина W соответствует р=оо, пока ,°А не слишком велико. При таких значениях Zi можно пренебречь W (а значит, и Gp) и тогда, по существу, весь снег, во- шедший в пластинку, участвует в образовании полос. При больших значениях Я величина W меньше величины, соответствующей р=аа, и когда Si прибли- жается к единице, ? приближается к максимальной величине *"|=7Г. , (82) где предельную величину е, можно найти из (81). Н ь-1—<&", получим (допуская, что $~ мало) 1—-УР'ж - A— iAPY''9t"-\\~ЖУ^рЧ(\— <gry-i-+pz ПрИ ^г_^ когда <^"->- 0, (81) дает (?)-*¦"(*)"• пример, полг\гая Я~ р^Г, так что FIG == о. Поскольку 1/gAo, (83)
318 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. Т Отсюда для малого е( находим sin ,. —-7=-., -т- = 0,45я, еГ, --1,1 д. (84) рв(/4 |А2 '4 ' . ' к v ' Однако из G5) следует, что при Я—>- 1 интенсивность /">(/?) в интерференцион- ной картине стремится к нулю, ибо увеличивается доля света, который, войдя в пластинку, остается в ней после последнего отражения и теряется у ее даль- него конца. Если, как обычно, любые заметные потери света недопустимы, пластинка должна работать в той области, где величина W соответствует р — оо, и из рис. 7.70 следует, что тогда наибольшее значение W приблизительно равно 2еГ,/3«0,7р. В этой области относительное распределение интенсивности та- кое же, как и в интерферометре Фабри — Перо. Таким образом, как мы видели на стр. 307, можно принять, что наименьшая разрешаемая разность длин волн составляет приблизительно \/<F часть области дисперсии (ДЛ0)о.д. Из G-1) и (80) получим выражение для разрешающей силы, соответствующее JT» 0,7р, в виде - ч Xq ^ 0, 7рХ0 ^ „ у i . ,а ,- дп' * | /ft"v Разрешающая сила, определяемая последним соотношением, зависит только от длины пластинки и не зависит от ее толщины, но следует помнить, что она достигается при величинах 9, приближающихся к л/2 при увеличении /. Прак- тически длина / ограничивается техническими трудностями, возникающими при изготовлении пластинки. - . Пластинка Люммсра — Герке, сделанная из кристаллического кварца, прозрачна для длин волн вплоть до 2000 А, и в течение долгого времени она была наилучшим из доступных интерферометров с большой разрешающей силой для спектроскопии в ультрафиолетовой области. Однако получение отражаю- щих покрытий для .ультрафиолета, пригодных для использования в интерферо- метре Фабри — Перо, и успехи в изготовлении отражающих решеток типа эшелетов привели к тому, что теперь пластинка Люммера — Герке исполь- зуется в исследованиях крайне редко. 7.6.6. Интерференционные фильтры. Предположим, что параллельный пучок белого света надает нормально на плоскопараллельную пластинку с по- верхностями, хорошо отражающими свет. В соответствии с B7) мы видим, что в таком случае в прошедшем свете появляются максимумы интенсивности, если разность фаз ё равна целому числу, умноженному на 2л, или, согласно B5), если Яо= Xf°, где . ' ' . У = .¦ 2" h, ,, т=\, 2 (86) \Ш — (р/Я) ... \ / и по обе стороны от этих максимумов интенсивность прошедшего света быстро падает до малых величин. Таким образом, пластинка действует как фильтр длин волн с многочисленными полосами пропускания, получающимися при целых значениях порядка т. В частности, если оптическая толщина пластинки составляет лишь несколько полуволн видимого света, то полосы пропускания в видимой области принадлежат низким порядкам и широко раз- несены по длинам волн. Поэтому обычно можно не пропустить все эти полосы, кроме одной, либо при помощи вспомогательных абсорбционных фильтров, либо, воспользовавшись селективной реакцией детектора, применяемого для наблюдения. ¦ ¦ Фильтр подобного типа изготовляют, нанося на плоскую поверхность стеклянной пластинки две отражающие пленки, разделенные слоем диэлектрика (рис. 7.71). Если при нормальном падении фильтр должен пропускать полосу порядка т длины волны Х-"г\ то, согласно (86), оптическая толщина n'h промежуточного слоя должна равняться (т.— <р/я) Я?2. У металлических
§ 7.6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 31S Промежуточный слои /и д'итппщ Частично отражаю - щип ш/аши. ZZ2L Стеши Рис. 7.71. Интерференционный фильтр ти- па Фабри — Перо. отражающих пленок ф зависит от Яо и толщины пленки (и, следовательно, от отражательной способности .А). У многослойных диэлектрических отражаю- щих пленок Э1 (V™1) максимально, когда оптическая толщина каждого слоя равна Х@т|/4; в этом случае ф (Х(от>) равно нулю (см. § 1,6) и, следовательно, оптическая толщина промежуточного слоя должна составлять пЛ'(',:П12. Важными характеристиками тако- го фильтра служат максимальное про- пускание т., определяемое так же, как и у интерферометра Фабри — Перо (см. C3)), и полуширина полосы пропуска- ния (ДХ|))П,Ш., которая определяется как интервал между длинами волн в по- лосе пропускания, на котором отноше- ние /«>//<'"> уменьшается до половины своей максимальной величины. Если оптическое расстояние между отражающими поверхностями постоянно по всей рабочей поверхности фильтра, то т получается из C6), а согласно B1) (ДЯ.О)П ш. соответствует изменению б па величину 4/'У F при условии, что в области про- пускания фильтра мы вправе пренебречь изменениями Si и JT с длиной волны. Итак, если можно пренебречь дисперсией в промежуточном слое, то при нор- мальном падении света изменению длины волны на ДХ„ соответствует измене- ние 8 на До', равное с точностью до членов первого порядка относительно малых величин К, (87) и вблизи полосы пропускания порядка т мы получим, используя (86), 2п I 1 Г д Поэтому, учитывая B2), находим для полуширины фильтра, выраженной в длинах волн, которая, как мы только что показали, соответствует изменению в & на 4/)/ F; 2л „ (89) У металлических отражающих пленок д<р!дХ0 столь мало, что <Э(ф>.Г|)/ЗХода ф. Дюфур [75] исследовал влияние изменения фазы в том случае, когда в отражаю- щие пленки входит многослойный диэлектрик, и показал, что в видимом спектре у таких диэлектриков, как сульфид цинка и криолит, ^- (ц>Х0)/п находятся между*) —1,0 и —1,5. s Мы видели, что при имеющихся в нашем распоряжении отражающих плен- ках т уменьшается при увеличении Э~; следовательно, для фильтра заданного порядка, изготовленного из данных материалов, меньшей полуширине сопутст- вует меньшее пропускание. Практически, как н в случае интерферометра Фабри — Перо, верхний предел полезного отражения определяется изменения- ми оптического расстояния между отражающими поверхностями но рабочей площади пластин. Однако здесь отступление от идеальной плоскости стеклян- ной поверхности, на которой изготовляется фильтр, несущественно, так как нанесенная испарением пленка повторяет все неровности поверхности, на *) При исследовании разрешающей силы интерферометра Фабри — Перо мы пренебре- гали зависимостью ф от длины волны (см. D2) и (88)).. Это, очевидно, оправдано, когда т до- статочно велико. Г
320 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ Ггл. 7 которую она наносится. При соответствующем изготовлении фильтров неравно- мерность в оптическом расстоянии между отражающими поверхностями удается сделать значительно меньше, чем при двух независимо обрабатываемых рабо- чих поверхностях в интерферометре Фабри — Перо, и поэтому можно исполь- зовать соответственно большую отражательную способность. Типичные ха- рактеристики фильтров с металлическими и комбинированными отражающими Таблица 7.2 Характеристика интерференционных фильтров с металлическими отражающими пленками и пленками металл-диэлектрик [76] Тип фильтра M — 2L—M M — iL—M MLH — 2L — HLM MUHH — 2L-HLHLM ДЛИНЛ ВОЛНЫ ?Л максимума пропускания, А 5310 5350 5470 6050 Максимальное пропускание т 0,30 0,26 0,43 0,38 Полуширина (Д^-о) п ш, к 130 70 48 20 М — металлическая пленкл (серебро), /_.—четвертьволновой слой диэлектрика с малым показателем преломления (фюрисшй магний), И — четвертьволновой слой диэлектрика с большим показателем преломления (сульфид цинка). покрытиями металл — диэлектрик приведены в табл. 7.2, а с чисто диэлектри- ческими покрытиями — в табл. 7.3. Как мы видим, наибольшая величина про- текания при данной полуширине достигается с отражающими пленками, содержащими слои диэлектрика. Следует заметить, что отражающие свойства нанесенных пленок зависит от длины волны, и поэтому такие фильтры дают вто- ричные полосы пропускания, помимо тех, которые определяются выражени- ями (86). Таблица 7.3 Характеристика интерференционных фильтров из сульфида цинка — криолита [77} Тип фильтра Длина волны ?Л максимума пропускания, А Максимальное пропускание Полуширина <ДЛ«) п. ш, - HLH — 1L—HLH IILHLH — 2L—HLHLH HLHU/I. — 2H — LHLHLH HLHLHU1 — 2L -HLHL11LH HL11LHLHL~2H-LHU1LHLH HLHLHUILHL — 2H — LHI.HI.HLHLH 5185 4750 6565 5200 6500 Й600 0,90 0,85 0,90 0,70 0,80 0,50 380 ПО 65 40 35 20 L—четвертьволновой слой криолита, Н — четвертьволновой слой сульфида цинка. Так как фильтры должны пропускать только определенную длину волны, оптическую толщину промежуточного слоя следует тщательно контролировать. Согласно (86) изменению n'h на A(n'h) соответствует смещение AAj;*" полосы пропускания m-го порядка на величину AXj, V™!S.(n'h)ln'h. Например, к результате ошибки в оптической толщине промежуточного^слоя на 1% при Vo"" = 5000 А полоса пропускания фильтра сместится на 50 А, что превышает полуширину узкополосных фильтров. Удобные методы контроля толщины про-
7.6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 321 Слои из Йиэлектрцт с милым показателем преломления межуточного слоя во время его нанесения были описаны Гриндландом и Бил- лингтоном [78], Джиакомо и Жакино [791, и Лисбергером и Рингом 180]. Из B5! видно также, что полосу пропускания фильтра можно сместить ь сторону более коротких волн, наклоняя фильтр так, чтобы падение света не было нормальным. Однако качество фильтра ухудшается но мере увеличения наклона. В частно- сти, при металлических или отражающих плен- ках фазы фи ИфхДля света, поляризованного параллельно и перпендикулярно плоскости падения, становятся неравными, и полосы пропускания таких, по-разному поляризо- ванных волн будут находиться при разных длинах волн. Смещение полосы пропускания при заданном угле наклона зависит от угла отражения 6' в промежуточном слое таким об- разом, что меньшее смещение полосы соответ- ствует большему показателю преломления ве- щества этого слоя. Поэтому промежуточный слой выгодно изготовлять из материалов с большим показателем преломления, в особен- ности если фильтр должен работать в сходя- щемся пучке. В другом типе интерференционного филь- тра, называемом фильтром с нарушенным пол- ным внутренним отражением, впервые описан- ным в работе [81], тонкие отражающие слои из вещества с малым показателем преломления окружены веществом с большим показателем преломления. В п. 1.5.4 было по- казано, что при освещении такого достаточно тонкого слоя светом под углом, большим критического, отражение не будет полным, и некоторое количество света пройдет сквозь слой, который в этих условиях действует как непоглощаю- щий отражатель. Изменяя толщину слоя, можно получить любую степень от- ражения. Конструкция такого фильтра показана на рис. 7.72. У призмы из тя- желого стекла гипотенузную грань покрывают слоем вещества с малым показа- телем преломления, на который последовательно наносят промежуточный слой с высоким показателем преломления и слой с малым показателем прелом- ления; затем вторую призму, подобную первой, соединяют с первой веще- ством с таким же показателем преломления, как и у стекла. Угол призмы и показатели преломления выбирают так, чтобы свет, падаю- щий нормально основанию призмы, попадал на слой с малым показателем пре- ломления под углом, большим критического. Длины волн полос пропускания Таблица 7.4 Характеристики некоторых фильтров с нарушенным полным внутренним отражением с отражающими слоями из фтористого магния иа тяжелом флинте и с промежуточным слоем из сульфида цинка [82] рЩу из ваэлектрит с бол/чиим показателем преломления Рис. 7.72. Фильтр с нарушенным полным внутренним отражением. Порядок интерференции Поляризация Длина волны максимума про- пускания Х{,ш), А Максимальное пропускание т Полуширина |ДХ„ „ш А 1 II 4600 >0,93 66 ¦ х 5300 >0,93 120 2 II 4630 0,90 50 X 5080 . 0,90 49 ' 3 II " - 5110 Q.12 30
S22 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 фильтра зависят от оптической толщины промежуточного слоя, угла преломле- ния в нем и сдвига фаз при отражении. Отражательная способность (и, следова- тельно, полуширина для данного порядка) зависит от толщины слоев с низким показателем преломления. Сдвиг фазы зависит от состояния поляризации, и по- этому для данного порядка полосы пропускания компонент, колеблющихся параллельно или перпендикулярно плоскости падения, имеют разные длины волн. Характеристики типичных фильтров, работающих в видимом спектре, приведены в табл. 7.4. Фильтры такого типа изготовляются и для работы в сан- тиметровом диапазоне [83]. 7.6.7. Многолучевые полосы в тонких пленках. В п. 7.6.1 мы видели, что полосы равного наклона, создаваемые в плоскопараллельной пластинке, сильно сужаются при увеличении от- ражательной способности ее поверх- ностей. Подобное же действие оказы- вает увеличение отражательной спо- собности на распределение интенсив- ности в полосах равной толщины Физо (см. п. 7.5.2), наблюдаемых в тонких пленках. В результате такого- перераспределения интенсивности от- четливо выступают более тонкие изме- нения в толщине пленки. Для простоты рассмотрим сперва пленку в виде клина, образованного плоскими поверхностями с небольшим углом а. На пленку под прямым углом к ребру *) падает плоская волна мо- нохроматического света (рис. 7.73) - Вследствие многократных отражений от поверхностей прошедший свет со- п ,, ¦„ стоит из группы плоских воли, рас- Рис. 7.73. Многократные отражения в клине rJ r пространяющихся в различных нап- равлениях. Если прошедшая через первую поверхность волна падает на вторую поверхность со стороны нор- мали, ближайшей к ребру клина, под углом й', то р-я волна прошедшей, группы выходит из клина под углом 6^, и из законов преломления и отражения следует, что l)a], (90) где п' — показатель преломления пленки, а п — показатель преломления окружающей среды. Виртуальные волновые фронты прошедшей группы Wb Wz, ..., W ..., в плоскости которых лежат ребра клина, были бы синфазны, если бы при отражении не происходило изменения фазы. В точке Р на второй поверхности па расстоянии р от О оптическая разность хода между р-й волной. и волной, прошедшей прямо (р = 1), равна = п (PNp—PNt) = пр (sin в,—sin 9,), (91) где Np и А/( — основания перпендикуляров, опущенных из точки Р па Wp и W, соответственно. Если ф— изменение фазы при однократном отражении на любой поверхности клина, то для полной разности фаз 6р между р-й волной •) Приводимый ниже анализ принадлежит Бросселу [84].
§ 7.6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 323 и волной, прошедшей прямо, получим, учитывая (90) и (91), 8Р = ji &?Рр+2 (р— 1} ф = ^~ п'р {sin [9' + 2 (р— 1) а] — sin 6'} + 2 (р — 1) q> = = р- n'h cos 6' sin (.р~1} а {cos (р — 1) а—tg 9' sin (p— 1) а}+ 2 (р— 1) ф, (92) Лй Щ(Х где ft = p tg а — толщина пленки в точке Р. Когда прошедшая волна падает па вторую поверхность со стороны нормали, удаленной от ребра клина, волновой фронт W± действительный; в этом случае Ьр получается из (92), но знак члена с tg6' изменяется. В обозначениях, принятых в п. 7.6.1, амплитуды прошедших волн имеют вид К'Л<Лехр№), tt'r'»A(l>exp(«62), ..., «'г'2<^-«А1''ехр(?8р), ... Амплитуда в Р, получающаяся в результате суперпозиции бесконечного ряда таких волн, равна Aiti AH) ft* > r'a<f"^pvn^'fi 'i A^ iW > ^/?~1pvnf/fi ^ /"Q4"v а соответствующая интенсивность равна a 2 2 S4-''~1exp(i6Jl,) . (94) В дальнейшем исследовании сохраним только конечное число членов в рядах (93) и (94). |Л"М не может превышать |/lA)|i^"/(l—Э1) и, если учи- тываются только первые р членов, ошибка |AAlfl| в А<и не может превысить \Аи)\3~Э^г^1(\—Щ. Соответствующая относительная ошибка |A/"'|//li> удовлетворяет соотношению АЛ»' STfA? (95) Далее мы увидим, что в условиях, представляющих наибольший практический интерес, /lf> достаточно точно определяется формулой Эйри A3), согласно ко- торой минимум интенсивности соответствует \Ат\ — Аи%13~1(\ +31). Следова- тельно, если мы хотим, чтобы для этого частного значения \Ат\ величина |д/(«|//«) не превышала, например, 0,01, что даст относительную ошибку в определении интенсивности по соседству с максимумом [ш, значительно меньшую чем 0,01, то, согласно (95), число р членов, которые нужно оставить в ряде, получается из соотношения Например, если 34=0,93, то />«120. Только при конечном числе членов в ряду (94) и при достаточно малом а (92) можно разложить по степеням а. Сохраняя в этом разложении члены со степенью не выше второй, получим — (р—If a^nJh (p—l) Bр3 — 4р + 3) аг 4яп'1г cos 6' В частности, при нормальном падении F'= 0) имеем бр=(/,_])^ + 2ф)-^-'><^-4р+3)ст3-^. (98) 21*
324 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ 1ГЛ. 7 Можно пренебречь членом с а2, если он мал по сравнению с я, и считать раз- ность фаз Ьр—6p_i, следующих друг за другом волн постоянной и равной 6 ¦= 4яя'/г/ло+ 2ф. В таком случае /A) определяется формулой Эйри A3), и в плоскости клина наблюдаются полосы с таким же распределением интенсив- нее носки, как и у локализованных в беско- нечности полос, создаваемых плоско-па- раллельной пластинкой (см. рис. 7.58). Положения максимумов интенсивности, соответствующие 6 = 2тп, определяются из соотношения т=\, 2, (99) Ц6Я 11,874 12Я Ц4Я Рис 7.74. Сравнение распределения интенсивности в многолучевых интер- ференционных полосах Физо (сплошная кривая) с соответствующим распреде- лением интенсивности Эйри (пунктир) [85]. Следовательно, эти полосы параллельны ребру клина и находятся на расстоянии XJ'ln'a друг от друга. Если отражатель- ная способность велика (,54SrO,9) и, зна- чит, велико р, то мы вправе заменить (р—1) Bр2—4/э+З) на 2р3 и условие мало- сти члена с а2 в (98) по сравнению с я дает При величинах а, соответствующих рас- стоянию между соседними полосами по- рядка 1 см или меньше, это условие строго ограничивает n'h, и распределение интенсивности полос совпадает с распределением Эйри только вблизи ребра клина, где оптическая толщина составляет несколько длин волн. Например, при а«2,5-10~4 (что при л'<~ 1 и >.„-= 5500 А соответствует примерно одной полосе на 1 мм) р~50 (Я~ 0,9) и условие A00) дает н7г<^50Я0. При большем удалении от ребра клина член с а2 в (98) значительно возрастает и численный расчет показывает (рис. 7.74), что на значение /(г| это влияет следующим об- разом: интенсивность максимумов становится меньше, а их полуширина боль- ше, чем следует из формулы Эйри; максимумы смещаются от положений, опре- деляемых (99), в сторону от ребра клипа: полосы становятся асимметричными за счет появления вторичных максимумов на стороне, удаленной от ребра клина. Согласно (99) интерференционные полосы соответствуют линиям равной оптической толщины в случае плоских поверхностей пленки. Однако важное практическое применение интерференционных полос заключается в исследова- нии пленок с иеплоскимп поверхностями: поэтому сейчас мы должны выяснить, насколько строго в этих условиях формы полос соответствуют контурам рав- ной толщины. У полос, точно отражающих нарушения постоянства толщины пленки, интенсивность в каждой точке Р должна однозначно зависеть от тол- щины пленки h в Р, что обычно не имеет места. Луч, приходящий в точку Р после 2(р—1) отражений (рис. 7.75, а) входит в пленку в Ах и отражается в точках Ви С,, ..., В„_1, Cj,-i- Его вклад в результирующую амплитуду в точ- ке Р зависит от оптической толщины пленки между /ц и Р. Таким образом, полосы могут быть смещены относительно положения, соответствующего истинным очертаниям контуров равной оптической толщины, на величину, зависящую от формы пленки близ Р. Этот эффект, конечно, наиболее существен при высокой отражательной способности, но при данном отражении он мини- мален там, -где толщина пленки меньше всего и падение света близко к нор- мальному. Можно оценить размер участка пленкТи, который оказывает влия-
§ 7.6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 325 ние на интенсивность в Р, если предположить, что он имеет плоскую поверх- ность (рис. 7.75, б). Пусть Л г, Л1, ..., А'р_1, Л"р_!— изображения Аи соответ- ствующие ряду последовательных отражений на второй и первой поверхностях пленки. Эти изображения, находящиеся в главном сечении клина, проходящем через Л,, лежат на окружности с центром в О на ребре клина н радиусом ОАг = = р'. Угол АгОЛг равен 2(р—1)сс. Изображение А"р_1 связано с отрезком луча Ср_гР и поэтому лежит на его продолжении. Допустим, что луч, приходя- щий в j52, лежит в главном сечении клина и падает под углом б' с той стороны В, а) б) ' Рис. 7.75. Смещение многократно отраженного луча гк> клинообразной пленке. а — поверхности неправильной формы; б - плоские поверхности. нормали, где находится точка О; тогда угол падения этого луча, когда он до- стигает Р, равен 6'+2(р—1)а. В треугольнике А"Р^РО сторона ОАр_х=р', и мы можем написать следовательно, полагая ОР = р, получим p'/cos 16' + 2 (р Поэтому 1) а] = p/cos (9'— а). Полагая 6'= 0 и пренебрегая членами со степенью а, большей второй, получим Др= ——2 ha. A02) Следовательно, если существует р достаточно интенсивных пучков, то можно ожидать, что влияние толщины пленки будет сказываться на интенсивности в Р на расстояниях порядка 2p2ha от Р. Это расстояние мало даже при высокой отражательной способности поверхностей, если величина h достигает лишь не- скольких длин волн видимого света. Например, при р— 50, /г = 2,5-10~4 см (около 5 длин волн) и а — 2,5-10"" оно составляет около 3-10~3 мм. Если вни- мательно интерпретировать малые искажения полос, то можно считать, что по- лосы соответствуют контурам равных оптических толщин неоднородных пленок в тех случаях, когда толщина пленки достаточно мала. До сих пор предполагалось, что источник света точечный, но практически из-за недостатка света следует использовать источники максимально допу- стимых размеров. Отбрасывая в (97) члены с а и аа, получим для положения
326 . ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [гл. 7 максимумов интенсивности в свете, падающем не под прямым углом, соотно- шение 2n'hcose' = (m—2-W /л-1, 2, ... A03) Здесь мы пренебрегаем углом клина, и поэтому оно остается справедливым для любой плоскости падения. Следовательно, при работе с источником, про- тяженным в радиальном направлении, т. е. при углах падения, находящихся в пределах 0^9'^е', максимумы данного порядка занимают участок, соответ- ствующий Am порядкам, и, согласно A03), для малого 8' находим |Д (cose') 1 = ^-4 A04) Такое расширение, связанное е увеличением размера источника, зависит от резкости W полос, образованных единичным элементом источника; если п'Л.к'аА.(,<ё \1?, то увеличение е' влияет главным образом на увеличение ин- тенсивности максимумов; если же n'fte'2/?iOj>> 1/JF, то влияние 8' сказывается главным образом на ширине полос. Данный эффект формально очень напоминает расширение полос в интерферометре Фабри — Перо, связанное с наличием у пластин сферической кривизны (см. стр. 305), и это может помочь нам в его изучении. Соответствующая обработка результатов исследований Дюфура и Пикка [54] показывает, что если n'ft.e'VX0 превышает 1/JF, то наблюдается лишь небольшое увеличение интенсивности максимумов, и можно утверждать, что при достижении половины этой величины полосы будут примерно на 10% шире, чем при точечном источнике. Учитывая преломление лучей на первой поверхности пленки, можно определить допустимый угловой радиус е источ- ника соотношением ^i/V A05) Его можно сравнить с аналогичным соотношением G.5.73), относящимся к ин- терференции двух пучков. Если величина h составляет только несколько длин волн, е не очень мало; например, при hat5Xa, <?~-=30 (,й«0,9), л.'« ;г« 1, из A05) получим 8 «3й. Следовательно, падающий свет не должен быть строго параллельным, и для наблюдения полос с большим увеличением протяженный источник имеет преимущество. Если свет квазимонохроматичен и длины волн его компонент распреде- лены в области Д?.„ около средней длины волны а„, то максимумы данного по- рядка занимают участок, соответствующий Д/и порядкам. Пренебрегая зави- симостью п' и <р от длины волны, получим из (99) Am = 2п' hA}.Jk%. Полосы не- значительно расширяются при отступлении от строгой монохроматичности, если величина Am мала по сравнению с US', т. е. если Шт- (Ш6) Если n'h составляет несколько длин волн, последнееоусловие нельзя считать жестким; например, при я'/г»5Я0, W =30, Хо= 5500 А A06) дает ДЯ0<^ 18 А. Следовательно, источник не должен принадлежать к типу, применяемому в ин- терферометрии при больших разностях, и можно пользоваться обычным дуго- вым разрядом высокого давления, создающим большую яркость и позволяю- щим производить наблюдение при большом увеличении. До сих пор мы имели дело со светом, проходящим сквозь пленку, однако многолучевую интерференционную картину можно наблюдать и в отраженном свете. Она оказывается дополнительной к картине в проходящем свете, если на отражающих поверхностях не происходит поглощения. Такую дополнитель- ность надо понимать в том смысле, что для обеих картин сумма интенсивностей з каждой точке равна интенсивности падающего света. Влияние поглощения,
7.6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 327 которое практически всегда существует у отражающих покрытий, рассмотрено б работе [86]. В ней показано, что при использовании хорошо отражающих ж мало поглощающих покрытий из серебра интерференционная картина в от- раженном свете состоит из темных полос на почти равномерном светлом фоне, причем эти полосы уже соответствую- щих светлых полос в проходящем свете, но в отраженном свете ин- тенсивность в минимумах очень чувст- вительна к поглощающим свойствам покрытия на первой поверхности пленки, и если поглощение слишком велико, го полосы исчезают. Многолучевыми полосами Физо пользуются в оптических цехах для испытания высококачественных оп- тических поверхностей, например у пластин, применяемых в интерферо- метре Фабри — Перо; они широко использовались также Толанским и его сотрудниками лрн изучении то- пографии почти плоских кристалли- ческих и металлических поверхностей [87J. Испытуемая и оптически плоская эталонная поверхности, покрытые отражающими слоями серебра, плотно прижимаются друг к другу. Создаваемые воздушной прослойкой интерфе- ренционные полосы рассматриваются в микроскоп с большой угловой апер- турой, позволяющей использовать все полезные пучки. Если А. = Х0/п' — длина волны в воздухе, то полосы соответствуют контурам исследуемой по- верхности, определяемым плоскостями, параллельными эталонной поверхности и разделенными интервалами А/2. При достаточно большом клине между пла- стинами в поле зрения появляется большое число полос (см., например, рис. 7.76), и можно измерить неровности исследуемой поверхности, определяя отклонение полос от прямых линий; там, где неровности поверхности дости- гают А/г, полосы смещаются в сторону на Am порядков; так как Рис. 7.76. Многолучевые интерференционные полосы Физо на поверхности скола слюды в свете ^зеленой E4Ы А) и желтых E770 А. и 5790 А) линий ртутн (проходящий свет). (По Вилкоку). ДА =— Дш, A07) то можно определить А/г, если известно Am. Величина Am приблизительно рав- на отношению смещения данной полосы к расстоянию между соседними по- лосами. При большой отражательной способности покрытий таким способом можно измерять очень малые неровности исследуемой поверхности. Легко из- меряемое смещение на полуширину полосы соответствует А/г — X/2S"; при X -- = 5500 А и сУ =40 это составляет всего лишь 70А*). Наблюдая за направле- нием смещения полос при изменении расстояния между пластинами, часто можно решить вопрос о том, имеем ли мы на поверхности углубление или вы-' пуклость. Однако, вообще говоря, для этой цели необходимы наблюдения в нескольких длинах волн. При наблюдении в проходящем свете можно исполь- зовать одновременно несколько^длин волн; особенно удобны желтые линии ртути с длинами волн Я = 5770 А и А, = 5790 А. В этом свете полосы располо- жены тесными нарами, расстояние между которыми увеличивается по мере увеличения порядка интерференции; поэтому легко определяется тип неров- ности поверхности.. Если же наблюдаются разрывы полос, например, при на- ') Толщина серебряного покрытия достигает 500 А, однако установлено, что оно не изме- няет топографии поверхности, по крайней мере настолько, чтобы это удалось обиар}жить подобным методом.
328 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [гл. 7 личии ступеньки (плоскости скола) в кристалле, то по изменению порядка можно также определить характер поверхности кристалла. Если исследуемая поверхность близка к плоскости, го, уменьшая ее наклон относительно эталонной оптически плоской поверхности, можно добиться того, чтобы все поле зрения было занято только одной полосой (см., например, рис. 7.77). В этих условиях крайне малые изменения высоты приводят к за- метным изменениям интенсивности. Пусть /и / + А/— интенсивности участ- ков, обусловленные соседними площадками, отличающимися по высоте на ма- лую величину ДА, которым соответствует изменение б на До4. Контрастность, определяемая как | А/1//, максимальна, когда S выбрано таким, чтобы | дI/дё \11 было максимальным. Рассматривая г ** ¦> картину в проходящем свете, найдем из B7) Отсюда макс 1-г —Fsine Следовательпо, 1 7ш Р sm Ь A08} A09) (ПО) так что при максимальной контрастности имеем 2 (¦l+^snV'y'jcose—.Fsm26==0. (Ill) Рис. 7.77. Многолучевая иптер- ^ ' t^ При высокой отражательной способности F вели- ко, и значения о, удовлетворяющие A11), близки к целым кратным 2л; поэтому можно написать б = 2т.п± е, где т — целое, as —¦ малая величина по сравнению с л/2. В та- ком случае из A11), пренебрегая степенями s, большими второй, получим (По Вилкоку). и (ПО) сводится к 1 7ш A12) {113) Следовательно, в первом приближении максимум контрастности определяется выражением _ — — |Д6|«^-|А6|. A14) /(*> дб макс Так как в соответствии с (99) Д6 и Ah связаны соотношением | AS ] = 4л \Ah\X, то, используя B2), можно написать для максимума контрастности A15) При Х = 5500А и $"=40 последнее соотношение дает | А/'"// |макс»0,1, если Д/гда.3,54, что порядка молекулярных размеров. До сих пор мы рассматривали эффекты в квазимонохроматическом свете. Теперь предположим, что пленка освещается белым светом, падающим нор-
§ 7.6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 329 мально, и допустим, что в проходящем свете ахроматическая линза L дает изображение пленки на плоскости щели спектрографа (рис. 7.78). Для каждой спектральной компоненты фазовые соотношения пучков, приходящих в точку Р' на щели спектрографа, такие же, как и в точке пленки Р, сопряженной с Р'. Пленка спектрографа Рис. 7.78. Схема установки для наблюдения интерференционных полос, полученных с тонкой пленкой, в белом свете. Следовательно, если плёнка достаточно тонка и удовлетворяет условию A00), то, согласно (99), существуют максимумы интенсивности в точке /"'для тех длин волн X'™', которые удовлетворяют соотношению %Г=^~, т=1,2 A16) где n'h— оптическая толщина пленки в точке Р. Интенсивность для длин волн между этими величинами получается из формулы Эйри. Таким образом, при высокой отражательной способности пленки спектр в фокальной плоскости спек- трографа пересечен узкими яркими полосами, разделяю- щимися значительно более широкими темными проме- жутками, и различие в дли- нах волн соседних полос тем больше, чем тоньше пленка. В особом случае, когда величина n'h постоянна, Xf> также постоянна, и полосы представляют собой прямые линии, параллельные щели. Их иногда называют полосами Эдсера — Бцтлера. Если <р не зависит от длины волны, полосы располагаются через равные интервалы Дко= l/'2n'h (ко= 1/Х0). Эта особенность делает их полезными для калибровки спектрографов, особенно в инфракрасной области, где эталонные длины волн немногочисленны. Обычно Х1^" меняется вдоль полосы в зависимости от изменения оптической толщины вдоль сечения пленки, сопряженного со щелью. В частности, если пленка пред- . ставляет собой воздушный зазор между исследуемой и оптически плоской по- верхностями, такие полосы позволяют с большой точностью найти профиль выбранного сечения исследуемой поверхности. Эти полосы, впервые описанные Толанским [88], называют иногда полосами равного хроматического дорядка (рис. 7.79). Пусть толщины пленки в двух точках Р± и Р2 равны /i, и Л2, и пусть в со- пряженных точках Р[ и Р'г па щели имеются максимумы порядка т в длинах волн в воздухе Xf> и ?4т) соответственно. Так как ХШ) = Х^/п', то из A16) следует Рис. ...... i!-....^. раБнсло хроматического порядка, образованные на участке поверхности кристалла ал- маза (89J. Шкала показывает длины волн в сотнях ангстрем.
330 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [гл. 7 где а = И—22 , A1/6) а ф! и ф2— сдвиги фаз при отражении для длин волн Я,$т> и Xf". Величину т— ф]/я можно найги, измеряя расстояние в длинах волн между соседними полосами. Так, если для точки Р[ на щели имеется максимум порядка т-\- 1 в длине волны Ц"*^, то, учитывая A16), получим т. е. где A18а) . Ф1 ~ Ф1 л A186) аф, — изменение фазы при отражении волны длиной Х'™+1). В том случае, когда полосы прерываются, для идентификации соответствующих порядков нужно измерить расстояние в длинах волн между соседними полосами с каждой сто- роны от разрыва. Из A17) и A18) имеем = A + 6) n cm) I /2 — 1 (mi ( 1 IО V Можно пренебречь величинами а и Ь, появляющимися вследствие вариации сдвига фазы с длиной волны при отражении на серебряных покрытиях, если рассматриваемый интервал длин волн не слишком велик. В таком случае из- мерения Х[т>, ?4'"т1; и Xj дают Д/t, и так как по A19) Д/г пропорционально ?4"°—Я;™, то профиль выбранного сечения исследуемой поверхности опреде- ляет одна полоса. 7.6.8. Многолучевые полосы, получающиеся с двумя плоскопараллельными пластинками, а. Полосы в монохроматическом и квазимонохроматическом свете. две плоскопараллельные пластинки с хорошо отражающими поверхностями, расположенные друг за другом. На пластинки надают плоские волны монохроматического све- та (рис. 7 80). Воспользуемся обозначениями, принятыми в п. 7.6.1, и отметим пластинки индексами 1 и 2. Интенсивность света, прошедшего сквозь пер- вою пластинку, согласно урав- нениям B6) и B7), запишется в виде /[»= (Т^Ь1 ^~7о7/l" • Рис. 7.80 К возникновению интерференционных 2 полос, локалшовлниых в бесконечности, после мно- A20) гократных отражений в двух плоскопараллельных где /'" — интенсивность падаю- пластинках. щего света. Аналогично ин- тенсивность света, прошедшего гквозь вторую пластинку, соответствующая интенсивности падающего света /"', выразится соотношением /«> — <^~а J2 A ец 1 тг/?. A21)
§ 7.6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 33! Предположим, что свет, отразившийся от второй пластинки обратно и снова отразившийся вперед от первой, исключается. Это означает, что расстояние между пластинками достаточно велико по сравнению с их рабочей поверх- ностью, и если пластинки взаимно параллельны, то направление падения света не слишком близко к нормальному. Полная интенсивность 1т прошедшего света тогда равна /"\ и согласно A20) и A21) имеем Следовательно, в фокальной плоскости линзы L образуются полосы с отно- сительным распределением интенсивности, равным произведению относитель- ных распределений интенсивностей в полосах, создаваемых каждой пла- стинкой. Разности фаз 8i и ба, согласно B5), равны 61=^/iiA1cose;+291, 6a=^n;A2cose;+2<p2. A23) Рассмотрим случай, когда две пластинки взаимно параллельны, так что си- стемы колец, которые получались бы с каждой пластинкой отдельно, концент- ричны. Когда угол падения 0х= 92= в мал, cosOi» 1 — 6j2/2, cost)^ 1 — в'2'!2 и если п — показатель преломления окружающей среды, то по закону прелом- ления получим 6i«/i9/ni, в'2л:пв/п2. Следовательно, из A23) с точностью до второго порядка по 9 имеем Отсюда вытекает, что при изменении 9 соответствующие изменения 8t и б2 находятся в отношении причем ф считаеген не зависящим от 9. Если показатели преломления и тол- щины пластинок таковы, что в некотором направлении 0 = 0,,, порядок интер- ференции для каждой пластины равен целому числу, т. е. если в== в„, б1 = 2/п1я, ба = 2т3л (т, и тг—целые), A26) то оба члена с ft и f, в A22) достигают максимального значения, равного единице, и при 0 = 90 существует абсолютный максимум интенсивности про- шедшего света. Если, кроме того, ^Ф-=а, A27) яА а — положительное целое число, то из A25) видно, что целые порядки (т2— а), (т.,— 2а), ... для второй пластинки соответствуют тем же величинам 9, что и целые порядки (тх— 1), (т%— 2), ... для первой пластинки. Следовательно, и в этих направлениях также существуют абсолютные максимумы /ш//(|). Практически требуется только ограниченное число р совпадений, и тогда гс^/яА доста- точно близко к целому а, если взаимное смещение максимумов, обусловленных членами с f, и F2 при 61=2(ш1—р) я и 62=2(m2—ра)л, мало по сравнению с их полушириной. Используя A25) и уравнение B1), найдем для этих полуширин, выраженных через й2, величины 4%/1,,/я A Y~Fi и 4/ Y^F2~ Следовательно, необходимое условие имеет вид 4 , 4 '- 2рл—2рап 'Л YPx Y?* которое можно переписать для (nih^/^hi) и й в виде
332 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [гл. 7 Где Jfj и |F2 — резкости полос, получающихся с каждой пластиной в отдельности. Далее, до тех пор, пока р не слишком велико и порядок интерференции тг для первой пластины не слиш- ком мал, соотношения A2G) и A26а) мог\т практически удовлетворяться одновременно. Поэ- тому'при JFi=JF2=3O и а—\ A26а) требует, чтобы \{пгкг1пгк^) — а\ <i^ 1/15 р, тогда как A26) всегда может удовлетворяться при изменении n2h2 на Хо/4 и соответствующее изменение A// составит-около п^Мпа2^»"^^/»»!, так как п^аи 2 niftt До. -/V- Вид кривой интенсивности прошедшего света показан на рис. 7.81. Между последовательными главными максимумами находятся (а— 1) вторичных максимумов, соответствующих це- лым порядкам (т2— 1), (гщ—2), ... .. ., (т2—а+\), ..., от второй пластинки. Если Гг велико, а а не слишком велико, то соответствую- щие величины членов с FL малы по сравнению с единицей, и вторичные максимумы много слабее главных. Полосы такого рода, получен- ные с двумя интерферометрами Фаб- ри — Перо, используются для ис- следования тонкой структуры спек- тральных линий. Разделяющие кольца выбирают так, чтобы lujhi приблизительно равнялось подхо- дящему целому а, а точная установ- ка осуществляется изменением дав- ления воздуха (и, следовательно, его показателя преломления) в герметичном контейнере, в который помещен один из интерферометров *). При а, большем единицы, такая установка имеет преимущество перед оди- ночным интерферометром, так как при данной разрешающей силе обладает большей областью дисперсии •*). Изменение длины волны, необходимое для того, чтобы сместить картину на величину, равную расстоянию между сосед- ними главными максимумами, соответствует изменению на единицу порядка интерференции в первой пластинке и изменению на а порядка интерференции во второй пластине. Следовательно, область дисперсии, в которой не происхо- дит перекрывания главных максимумов, равняется области дисперсии интер- ферометра с меньшим расстоянием между пластинами ива раз больше, чем у интерферометра с большим расстоянием между пластинами (см. D6)). По- луширина главных максимумов соответствует 6,= 2т,л, + sJ2 или 62=2т2л;± dz?.2/2(mt, m2—целые числа), где, согласно A22), 2(т,Ь 2(ш2-4)п- 2(тг- Рис. 7.81. Отношение интенсивности прошедшего света к интенсивности падающего как функция разностей фаз б, и 6а. Многолучевые интерференционные полосы равного наклона в двух плоскопараллельных пластинках. 5Sl = 0,64, 5^2 = 0,64, о=4. 4 )-1' или в соответствии с A25) и A27) ¦1. A28) При достаточно большом F» величина s2 значительно меньше л/2 и можно при- нять sine2=s2. Тогда A28) сведется к -=о,- A29) ') Точную установку (хотя и менее совершенную) можно также осуществить, наклоняя един из интерферометров относительно другого ") Такое устройств? было впервые описано в [90],
§ 7.6J МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 333 откуда A30) Если удалить интерферометр с меньшим расстоянием между пласти- нами, то Fi= 0 и последнее соотношение сведется к е2 — А/]^Г'\ , что находится в согласии с B1). В других случаях е2 меньше A/VF2, поэтому полуширины главных максимумов меньше полуширины полос интерферометра с большим расстоянием между пластинами. Практически а берется равным 3 или боль- шему числу, и из A30) видно, что увеличение F2 вызывает значительно большее уменьшение е2, чем такое же увеличение Fi. Следует также помнить, что макси- мальное пропускание такой комбинации интерферометров равно произведению TjTj, т. е. величин максимального пропускания обоих интерферометров, как это следует из A22) и C3); в самом деле, мы видели в п. 7.6.2, что при исполь- зовании соответствующих отражающих покрытий увеличение Шу и 5?3 (а сле- довательно, Fi и F2) сопровождается уменьшением Tj и г.. Поэтому не следует делать /\ больше, чем это необходимо для подавления вторичных максимумов до приемлемой величины, и наоборот, F2 нужно делать как можно больше, пока уменьшение интенсивности не поставит этому предел. При таких условиях F-Ja? столь мало по сравнению с F2, что еа « AlY~Fl и разрешающая сила по- добной комбинации интерферометров почти равна разрешающей силе интерфе- рометра с большим расстоянием между пластинами. Присутствие вторичных максимумов неудобно, если спектральные компоненты исследуемого источника сильно различаются по интенсивностям, так как главные максимумы слабой компоненты можно принять за вторичные максимумы сильной компоненты. Такая неопределенность устраняется, если наблюдения ведутся с комбинаци- ями интерферометров с различными расстояниями между пластинами.. Если а—1, вторичные максимумы отсутствуют, и из A22) и C4) следует, что контрастность, достигаемая с комбинацией интерферометров, равна произ- ведению 'бх'бъ контрастпостей обоих интерферометров. Для данного макси- мального пропускания с такой комбинацией интерферометров достигается значительно более высокая контрастность, чем с одиночным интерферометром; поэтому подобное устройство особенно ценно при наблюдении слабых сателли- тов спектральных линий [50, 91]. б. Полосы суперпозиции. Большой практический интерес представляют полосы, получающиеся с двумя плоскопараллельными пластинками, накло- ненными под углом я друг к другу и освещенными светом, падающим почти нормально. Предполагается, что падающий свет столь сильно отличается от монохроматического, что с каждой отдельной пластинкой интерференционные полосы не наблюдаются. Чтобы разобраться во всех обстоятельствах, связан- ных с этим *), рассмотрим сначала прохождение монохроматической волны с волновым числом ?„=2л/л|) сквозь одну пластинку. Пусть AM(k0) иЛ1"D„) —• комплексные амплитуды соответственно падающей и прошедшей волн. Прини- мая во внимание все отражения, получим, согласно A0) и учитывая B) и D), Л СО IU \ Л (f) (U \ GT >^ @pr,Yn (ir\K\ /1 ^1 \ л \Л-о/ — Л \"^о/ ^ -4J -^ елр \ipv), \ioij р=0 а интенсивность /ш = Д<'!Л("* прошедшего света выразится соотношением /«> (ft0) = /«¦> (k0) $-* 2 2 SVW exp [I (p-p')b], A32) p=0 p' = fl где Iй' = AU)AU)* — интенсивность падающего света. Если мы примем *) Приведенный здесь анализ в основном пранадле'жиг Бенуа, фабри и "Шро'[92].
334 элементы теории интерференции и интерферометры [гл. 7 \р—р' \ = q, то A32) можно переписать в виде «> / СО \ /«> (й0) = /«> (К) &* 2 ®-2р \! + 2 ^* (ехр («<?«) + ехр (- i<?6) > = +2 ? Я» cos i/б). A33) Интенсивность монохроматического света, прошедшего сквозь две пластин- ки, поставленные последовательно (если пренебречь светом, отраженным в прямом и обратном направлениях между двумя пластинами), определяется выражением -Ail VI—. х (l +2? Sllcoss^) , A34) где индексы 1 и 2 относятся соответственно к первой и второй пластинке. Раз- ности фаз 6i и б2 находят из соотношений г1+2ф1=А(,2и;/11со8о;+2ф1, ¦) а + 2ф2=А02п;/г2со5е; + 2ф2, j где разные символы имеют то же значение, что и раньше. Однако если свет не монохроматичен, мы можем рассматривать его как суперпозицию монохроматических компонент с различными частотами. Со- гласно п. 7.5.8 отдельные компоненты некогерентны и результирующая интен- сивность равна сумме (интегралу) интенсивностей отдельных компонент. Таким образом, из A34) получается следующее выражение для полной интен- сивности света, прошедшего через обе пластинки: , A36) где t(" (fe0) —¦ спектральное распределение интенсивности падающего света. Величины сЯ и аГ, вообще говоря, являются функциями &„, но мы допустим, что в области, где iu'(k0) значительно, их изменения в зависимости от k0 ничтожны. Первый множитель в A36) можно тогда вынести за знак интеграла, и оконча- тельно это выражение можно переписать в виде A37а) — uii) U —УН/ где а, = 2 ^JcosrSj, cr2= 2 5J|coss62, '. A37б> '«=2 2 5i;^icos(r6,+s6,), ars= 2 2 /•=i s=i r—l s -г Если монохроматические компоненты занимают область длин волн ДЛ„ вблизи средней длины волныХ„, то соответствующая область к„ равна 2зтЛЯ,|Д;5 и при кУх и Де^2> достаточно больших по сравнению с длиной когерентности 'Дл, области изменения &i и б2 велики по сравнению *) с 2я. При таких уело- *) Интегрирование выражения A33) по всем спектральным компонентам ясно показы- вает, что в любой отдельной пластинке интенсивность прошедшего света практически не зави- сит от в, т. е. иолвсы отсутствуют.
§ 7.6] МНОГОЛУЧЕВАЯ ИНТЕРФЕРЕНЦИЯ 335 виях о,, а2 и crfa быстро изменяются в области интегрирования и многократно изменяют знаки. Следовательно, вклад этих членов в /|(< невелик, и A37) сводится к *) + 2SSЯГ54cos(г6'~'"¦Ол- A38) В общем случае величины r6t— s&2 по крайней мере такого же порядка, как и бц или 63, а, значит, интегралы от членов с косинусом в A38) также незначитель- ны, и поэтому /((> действительно не зависит от St и б2. Существует, однако, исключение, когда «(A*\ + T?)-4A* + !?)="'- 039) где а и Ъ — небольшие целые числа, не содержащие общего множителя, а | е | невелико по сравнению с А^/ДЛ,0. В этом случае при r = qa, s = qb W=l, 2, 3, ...) A40) получим r6l — s6a^qkoe, A41) и область значений | г6х—s82| равна \qsAko\, что невелико по сравнению с 2гцг; при таких значениях г и s интегралы членов, содержащих косинусы, в A38) не обязательно пренебрежимо малы, и мы получим 1+2 ? (^?^)?cos?V)^0. A42) Ряд под знаком интеграла в A42) идентичен ряду в выражении A33) для ин- тенсивности волны монохроматического света, прошедшей сквозь одиночную пластину. В п. 7.6.1 такой ряд был просуммирован (см. уравнение A3)). Сле- довательно, сумму ряда в A42) можно написать сразу в виде II О > (&7)& GD Ь\О ллр f]h р , \<st I /J2/ / 1 ДОЧ Из A42) и A43) находим '"¦' (К) где e=7T^b3F- A45) Сравнивая с A56), мы видим, что распределение интенсивности A44) эквивалентно суперпозиции распределений интенсивности монохроматиче- ских компонент. Форма распределения для каждой компоненты совпадает с показанными на рис. 7.58. Максимумы интенсивности в этих распределениях появляются при ков, равному целому кратному 2л, т. е. при в = тК, \т\ = 0, 1, 2, ... A46) Если предположить, что п\, щ, ф,/?0 и <fJkn постоянны в спектральной об- ласти, включенной в A44), то максимумы нулевого порядка (е = 0) в распре- делениях интенсивности для монохроматических компонент совпадают в цент- *) Строгое доказательство возможности перехода от A37а) к A42) требует более точного рассмотрения, чем это сделано здесь.
336 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 ральной полосе. Согласно A35) и A39) ее положение в фокальной плоскости линзы Ь (см. рис. 7.80) определяется соотношением %Aj COS 6i + C! * где Ci и сг обозначают cpi//e0 и ф.2/А0 соответственно. При увеличении [ е | с обеих сторон этой полосы интерференционные картины от компонент взаимно сме- щаются, так как размер каждой картины пропорционален соответствующей ей длине волны, и поэтому четкость полос уменьшается. В белом свете видна белая центральная полоса, положение которой определяется A47), окруженная с каж- дой стороны цветными максимумами и минимумами. По мере удаления от центра освещенность для глаза приближается к равномерной. Такие полосы называются полосами суперпозиции. Они представляют собой многолучевой вариант полос Брюстера (см. п. 7.5.6) и, подобно последним, имеют вид прямых линий, параллельных ребру клина, образованного пластинами. Расстояние между этими полосами обратно пропорционально углу клина а. Полосы суперпозиции можно использовать, как предложили Фабри и Бю- иссон [93], для определения разности оптических толщин двух эталонов Фаб- ри — Перо, отношение оптических толщин которых очень близко к целому чис- лу а. Для этой цели один эталон укрепляют неподвижно, а другой наклоняют по отношению к первому до тех пор, пока центральная белая полоса его интер- ференционной картины не пройдет через точк> О, т. е. фокус линзы L для света, прошедшего нормально через неподвижный эталон (см. рис. 7.80). При фикси- рованном первом эталоне Ьг= 6J— 0 и 9,^ а, где а — угол между эталонами. Для малого а по закону преломления имеем 6j«w naln\, где я — показатель преломления воздуха, окружающего эталоны; cos б,» 1 — 02а/2л;1 — n2aa//ti* и из A47), принимая b = 1, получим с точностью до второй степени а (n-Ji, + c2)—a(nX¦+ сх) = -^а\ A48а) Если же второй эталон неподвижен, то белая полоса проходит через точку О, когда ainA + cJ-in'A + cJ^-^aK (I486) Если эталоны эвакуированы (что иногда делается), то можно принять «J=» = «2~ п при условии, что разность |a(/ijfti+?ij—(nji2+c2) | достаточно мала; тогда измерения а дают эту разность, выраженную через оптическую толщину одного из эталонов. Таким способом были выполнены измерения при значениях а, равных 10. Сходное устройство, только с эталонами приблизительно равной толщины, было использовано для измерений показателя преломления и дисперсии воздуха [94]. Сначала эталоны эквакуировали и наклоном одного из них уста- навливали удобный интервал между полосами в почти монохроматическом свете со средней длиной волны ?„„. Затем заполняли воздухом неподвижный эталон толщиной /г, что приводило к изменению е на-2 (п—\)h, где п— показатель преломления воздуха. Подсчитывая соответствующее число Am полос, прошед- ших через О, имеем в согласии с A46) A49) отсюда, если известны h и Л,о, находим {п— 1),
§ 7.7] СРАВНЕНИЕ ДЛИН ВОЛН С ЭТАЛОННЫМ МЕТРОМ 337 § 7.7. Сравнение длин волн с эталонным метром Эталон длины представляет собой расстояние между двумя штрихами, выгравированными на стержне из сплава платина — иридий, при темпера- туре О СС. Этот стержень, хранящийся во Франции, называется международным эталоном метра. Как уже упоминалось в п. 7.6.4, соотношение между оптиче- скими длинами воли и фактическими длинами основано на сравнении длины волны красной линии F438 А) кадмия с длиной этого эталона. Первое сравне- ние было выполнено в 1892 г. Майкельсоном и Бенуа [26] с помощью видоизме- ненного интерферометра Майкельсона. В 1905 г. такое измерение было повто- рено с большей точностью Бенуа, Фабри и Перо [92]. Они воспользовались пятью эталонами Фабри — Перо с длинами, примерно равными 6,25; 12,5; 25; 50 и 100 см. Число длин волн красной кадмиевой линии, содержащихся в длине самого короткого эталона, определялось методом дробных частей по- рядка, который требует знания достаточно точного отношения длин волн (см. п. 7.6.4), а не самой их длины. Длина каждого эталона сравнивалась затем с длиной следующего по величине эталона с помощью интерференционных полос в белом свете. Для этого два эталона устанавливались параллельно и освеща- лись белым светом. Прошедший свет освещал тонкий воздушный клин, обра- зованный двумя полупрозрачными посеребренными плоскими поверхностями. При этих условиях возникали полосы, локализованные в клине, подобные описанным в п. 7.6.8. б. Центральная полоса располагалась вдоль линии, где толщина клина равнялась разности между длиной большего эталона и уд- военной длиной более короткого эталона. Эта разность была определена в длинах волн красной кадмиевой линии путем предварительной градуировки толщины клина. После четырех последовательных сравнений эталонов между собой было определено число длин волн, укладывающихся в эталоне длиной 100 см. Наконец, определялась разница между длиной этого эталона и длиной копии эталона метра. Эта часть эксперимента включала установку особо точ- ных подвижных измерительных микроскопов на градуировочные штрихи метра и на такие же градуировочные штрихи, нанесенные на боковые поверх- ности пластин эталона. Расстояние между последними штрихами и отражаю- щими поверхностями эталона определялось дополнительными опытами. Окон- чательный результат, полученный для длины волны красной линии кадмия в сухом воздухе при 15 °С и при давлении 760 мм рт. ст. равнялся 6438,4696-10~10 м. Возможная относительная ошибка в интерферометрических измерениях составляла около 1-10~?. Повторные определения (библиографию см. в [95]) соотношения между длиной волны красной линии кадмия и метром были выполнены в целом ряде лабораторий по стандартизации таким же методом, как и метод Бенуа, Фабри и Перо или в принципе схожим с ним. Интересны эксперименты Сирса и Бар- релла [96], так как в них сделаны прямые измерения длины волны в вакууме. Они воспользовались только тремя эталонами Фабри — Перо; самый большой имел в длину немного больше метра, другие -- приблизительно одну треть и одну девятую метра. Разделителями служили цилиндры из инвара с оптиче- ски плоскими хромированными торцами, к которым прижимались эталонные пластины. Эти соединения были герметизированы, и эталоны можно было эвакуировать. Было измерено число длин волн, укладывающееся в самом ко- ротком эталоне. Измерения делались методом дробных частей порядка, а для сравнения эталонов друг с другом применялись полосы суперпозиции, описан- ные в п. 7.6.8. Самый большой эталон имел достаточную длину, чтобы в нем могла поместиться стальная концевая мера номинальной длиной в 1 м. Рас- стояние в длинах волн менаду полированными торцами концевой меры и отра- жающими поверхностями эталона определялось путем наблюдения в отражен- ном свете полос, локализованных в бесконечности. Таким способом была
338 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 1 определена длина концевой меры в длинах волн красной кадмиевой линии с точностью около 2- 10~s. Окончательно концевая мера сравнивалась с копией метра хорошо разработанным методом сравнения концевых эталонов с штри- ховыми *). После того как результаты всех измерений были приведены к длине волны в воздухе при нормальных условиях (воздух при 15 еС и давлении 760 мм рт. ст., свободный от паров воды и содержащий 0,03% углекислого газа), было найдено среднее значение 6438,4696- 10~10 м, которое случайно совпало с величиной, принятой в качестве определения ангстрема. Наибольшее откло- нение в любом отдельном измерении от среднего составляло 3-10~5% от изме- ренной величины или около 3-10~4 мм на 1 м. Это значительно меньше, чем ширина градуировочных штрихов на эталоне метра и на его копиях, исполь- зованных в экспериментах. Несомненно, что это внесло неопределенность в из- мерения, сделанные с помощью микроскопа. Интерферометрические измерения можно осущ&л'влять со значительно большей точностью, и поэтому естественно предусмотреть замену материального эталона метра определением длины метра в длинах воли какой-то спектральной линии. Международное бюро мер и весов приняло в 1954 г. рекомендацию по этому вопросу [981 с оговоркой, что для сохранения преемственности эталона длины его новые определения должны быть согласованы с величиной 6438,4696-10~" м для длины волны красной линии кадмия. В 1958 г. Международное бюро по- становило [99], что лучше всего для этой цели подходит спектральная линия с длиной волны приблизительно 6056 А, соответствующая переходу между уровнями 2рло и Ы,: атома криптона с массовым числом 86; на основании изме- рений, сделанных в пяти различных лабораториях, бюро предложило, чтобы метр был определен точно в 1 650 763,73 длины волны в вакууме этого излуче- ния. Такое определение было одобрено в 1960 г. 11-й Генеральной конферен- цией по мерам и весам [100J). Следовательно, первичные эталоны длин волн и первичный эталон длины теперь идентичны и ангстрем точно равен 10~10 м. ЛИТЕРАТУРА 1. A. A. Michetson, Astrophys. J. 47, 283 A918). 2. R а у 1 е i g h, Proc. Roy. Soc. 59, 198 A896); F. H a b e r, F. Lowe, Z. angew. Chem. 23, 1393 A910). 3. A. A. M l che 1 son F. G. P e a s e, Astrophys. J. 53, 256 A921). 4. H. Fizeau, С R. Al-ad Sci 66, 934 A868). 5. A. A. Michel son, Phil Mag 30, 1 A890). 6. A. A. Michelson, Nature 45, 160 A891). 7. J. A. Anderson, Astrophys. J. 51, 263 A920). 8. A. A. Michelson, Astrophys. J. 51, 257A920); A. A. M I с h e 1 s о n, F. G. Pease. Astrophys. J. 53, 249 A921). 9. J. L. P a w s e y, R. N. В г а с e w e 1 1, Radio Astronomy, Clarendon Press, Oxford, 1955 R. N. В г а с e w e 11 з сб, «Encyclopedia of Physics», ed. S. Fliiggc, Springer, BerLn,; 1959, Vol. 54. 10. R. H. Brown, R. Q. Twiss, Phil. Mar. 45, 663 A954). 11. R. H. Brown, R. Q. Twiss, Nature 178, 1046 A956); Proc. Roy. Soc. A248, 199, 222 A958) 12 O. Wiener, Ann. d. Physik 40, 203 A890). 13. P. D r u d e, W. Nernst, Wiedem. Ann 45, 460 A892) 14. H. E. I ves, Т. С Fry, J. Opt. Soc. Amer. 23, 73 A933). 15. G. L i p p m a n n, C. R. Acacl. Sci. 112, 274 A891). 16. F. T w у m a n, Prism and Lens Making, Hilger a. Walts, Ltd, London 2nd ed., 1952, p. 388. 17. H. Fizeau, Ann, Chim. Phys. 66, 429 A862) 18. F. H. R о 1 t, Engineenng 144, 162 A937) 19. J. R. Be no it, J. de Phys. 7, 57 A898). 20. J. Mace, d e L ё p i n a w, С F a b г y, J. de Phys. 10, 5 A891), *) Более детально см. [97],
•¦ ЛИТЕРАТУРА ¦ 339 21. J. М а с ё de L ё р i п а у, J. de Phys. 9, 121 A890); W. Feussner, L. J a n i с к i, в сб. «Handbuch der physikalischen Optik», ed. E. Gchrcke, Barth, Leipzig 1927 Vol I p. 396; G. F. C. S e a r 1 e, Phil. Mag. 37, 361 A946). 22. A. A, Michelson, Amer. J. Sci. 22, 120 A881); Phil. Mag. 13, 236A882). 23. R. J. Kennedy, Proc. Mat. Acad. Sci. 12, 621 A926). 24. K. K. I 1 1 i n g w о г t h, Phys. Rev. 30, 692 A927). 25. A. A. M i с h e 1 s о n, E. W. M о r 1 e y, Phil. Mag. 24, 449 A887). 26. A. A. Michelson, J. R. В e n о i t, Trav. et Mem. Int. Bur. Poids et Mes. 11 1 A895). 27. F. T w у m a n, A. Green, British Patent № 103832 A916), 28. E. Twyman. Phil. Mag. 35, 49A918). 29. F. T w у m a n, Phil. Mag. 42, 777 A921). 30. R. К i n « s 1 а к e, Trans. Opt. Soc. 27, 94 A927). 31. W. Kosters, в сб. «Handbuch der Physikalischen Optik», ed. E. Gehrcke, Barth, Leipzig 1927, Vol. I, p. 484. 32. J. H. D owe 11, British Patent № 555672 A942). 33. J. J a m i n, С R. Akad. Sci. 42, 482 A856). 34. J. A. S i г к s, Hd. Ned. Nat. en Gcneesk. Congr., Groningcn. 1893, p. 92. 35. E. Pringsheim. Verb. Phys. Ges. Berlin. 17, 152 A898). 36. J. Dyson. Proc. Roy. Soc. A204, 170 A950). 37. L Zehnde r, Z. f. Ihstrkde 11, 275 A891); L. M а с h, Z. f. Instrkde 12, 89 A892). 38. R. Ladenburg, D. Bershader, в сб. «Inlerferometry in High Speed Aerodynamics and .let Propulsion», Vol. IX, Physical Measurements in Gas Dynamics and Combustion, Oxford Univ. Press, 1955, Art. Л. 3. 39. W. J. Bats, Proc. Phys. Soc. 59, 940 A947). 40. R. L. Drew, Proc. Phys. Soc. B64, 1005 A951). 40a. O. Brungdahl, в сб.: «Progr. in Optics», vol. 4, ed. E. Wolf. North Holland Publ Co Amsterdam, a. New York, J. Wiley a. Sons, N.Y., 1965, p. 37. 41. S. O. R ice, Bell. Tech. J. 23, 282 A944). 42. A. A. Michelson, Phil. Mag. 31, 388 A891). 43. Rayleigh, Phil. Mag. 34, 407 A892). 44. E. Wolf, Proc. Phys. Soc. 80, 1269 A962). 45. A. P ё r a r d, Rev. d'Opt. 7, 1 A928); Reunions l'Institut d'Optique Rev. d'Opt. 6me annee,. 10 A935). 46. A. A. Michelson. Phi!. Mag. 34, 291 A892). 47. P. F e 1 1 g e t t, J. de Phys. 19, 187, 237 A958). 47a. G. A. V a n a s s, H. S а к a i, в сб.: «Progr. in Optics», vol. 6, ed, E. Wolf. North Holland Publ. Co., Amsterdam, J. Wiley a. Sons. N. Y., 1967, p. 259. 48. P. G i а с о m о, Re\. d'Opt. 35, 442 A956). 49. С Fab ry, A. P e г о t, Ann. Chim. Phys. 16, 115 A899). 50. С D uf our, Ann. de Physique 6, 5 A951). 51. P. С о n n e s, Rev. d'Opt. 35, 37 A956); J. de Phys. 19, 262 A958). 52. A. G. Fa x, T. L i, Bell. Tech. J. 40, 453 A961). 53. G. D. Boyd, J. P. Gordon, Bell. Tech. J. 40, 489 A961). 54. С Dufour, R. Plcca, Rev. d'Opt, 24, 19 A945). 55. R. С h a b b a 1, J. Rech. Cent. Nat. Rech. Sci. № 24, 138 A953). 56. H. К u h n, B. A. Wilson, Proc. Phys. Soc. B63, 745 A950). 57. J. С. В u r r i d g e, H. К u h n, A. P e r y, Proc. Phys. Soc. B66, 963 A953). 58. P. G i а с о m о, Rev. d'Opl. 35, 317 A956); J. R i n g, W. L. W i 1 с о с к, Nature 171, 648 A953); 173, 994 A954). 59. S. Pen sc 1 i n, Л. S t e u d e 1, Z. Phys. 142, 21 A955). 60. Rayleigh, Phil. Mag. 8, 261 A879). 61. S. T о 1 a n s к у, High Resolution Spectroscopy, Methuen, London, 1947, Ch. 9. (С. Т o- л а н с к и й, Спектроскопия высокой разрешающей силы, ИЛ, 1955, гл. 9.) 62. С. F a b г у, Н. Buisson, J. de Phys. 9, 197 A910). 63. P. J а с q u 1 и о t, CD u f о u r, J. Rech. Cent. Nat. Rech. Sci. № 6, 91 A948). 64. P. Jacquinot, J- Opt. Soc. Amer. 44, 761 A954). 65. Trans. Int. Union for Co-operation in Solar Research, Manchester Univ. Press, 1908, Vol. 2, p. 17. 66. Proc. Verb. Corn. Int. Poids et Mes. 17, 91 A935). 67. С Fab ry, A. Perot, Ann. Chim. Phys. 16, 289 A899). 68. С V. Jackson, Phil. Trans. Roy. Soc.~ A236, I A936). 69. G. R. H а г r i s о n, J. Opt. Soc. Amer. 36, 644 A946). 70. K. W. Me issner, J. Opt. Soc. Amer. 31, 416 A941). 71. K. W. Me issuer, J. Opt. Soc. Amer. 32, 191 A942). 72. H. D. Babcock, Astrophys. J. 63, 140 A927). 73. O. L u m m e r, Verh. Deutsch. Phys. Ges. 3, 85 A901); O. Lummer, E. Gehrhcke, Arm. d. Physik 10, 457 A903). 74. С Dufou'r. Rev. d'Opt. 24, 11 A945). 75. С Dufour, Rev. d'Opt. 31, 1 A952).
340 ЭЛЕМЕНТЫ ТЕОРИИ ИНТЕРФЕРЕНЦИИ И ИНТЕРФЕРОМЕТРЫ [ГЛ. 7 76. A. F. Turner, J. de Phys. II, 457 A950). 77. P. H. L i s s b е г g е г, J. Ring, Optica Acta 2, 45 A955). 78. K. M. G г e e n 1 a n d, С. В i 1 1 i n g l о n, J. de Phys. II, 418 A950). 79. P. G i а с о m o, P. Jacquinot, J. dc Phys. 13, 59A A952). 80. P. L i s s b с г g e r, J Ring, Optica Acta 2, 42 A955). 81. P. L e u r g a n s, A. F. Turner, .1. Opt. Soc. Amer. 37, 983 A947). 82. A. F. Turner, J. de Phys. 11, 458 A950) 83. В. Н. В i 1 1 i n g s, J Opt. Soc. Amer. 39, 634 A949). 84. J. Brossel, Proc. Phys. Soc. 59, 224 A947) 85. К. К l n о s i t a, J. Phys Soc. Japan 8, 219 A953). 86. J. H о 1 d e n, Proc. Phys. Soc. B62, 405 A949). 87. S. T о 1 a n s к у, Multiple-beam Interferometry of Surfaces and Films, Clarendon Press, Oxford, 1948. 88. S. T о 1 a n s к у, Phil. Mag. 36, 225 A945). 89. S. T о 1 a n s ky, W. L Wilcock, Proc. Roy. Soc AI91, 192A947). 90. W. V. Houston, Phys. Rev. 29, 478 A927); E. G e h г с к e, E. Lau, Z. tech. Physik 8, 157 A927). 91. L. С Bra d ley, H. Kuhn, Nature 162, 412 A948). ¦92. J. R. В e п о i t, С F a b r y, A. P e г о t, Trav. et Mem. Bur. Int. Poids et Mes. 15, 1 A913). 93. С F a b г у, Н. В u i s s о n, J. de Phys. 9, 189 A919). 94. H. В а г r e 1 1, J. E. S e a r s, Phil. Trans Roy Soc. A238, 1 A939). 95. H. Barrell, Proc. Roy. Soc. A186, 164 A946) 96. J. E. S e a r s, H. В a r r e 1 1, Phil. Trans. Roy. Soc. A231, 75 A932); A233, 143 A934). 97. J. E. Sears, Proc. Roy. Soc. AI86, 152 A946) 98. Proc. Verb. Com. Int Poids et Mes. 24, 2 A954) 99. Proc. Verb. Com. Int. Poids et Mes. B), 26-B, M 30 A958). 100. С R. 11-me Conf. Gen. Poids et Mes., Gauthier-Villars, 1960, pp. 51, 85,
ГЛАВА 8 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ § 8.1. Введение Переходя от общего электромагнитного поля к оптическому полю, харак- теризующемуся очень высокими частотами (короткие волны), мы нашли, что в определенных областях простая геометрическая модель распространения энергии становится неверной. В частности, мы увидели, что отклонений от нее нужно ожидать в непосредственной близости к границам тени и в областях, где концентрируется большое число лучей. Подобные отклонения проявляются _Б появлении темных и светлых линий— дифракционных полос. Теория диф- ракции занимается главным образом изучением поля в этих особых областях, и естественно, что такие области, в которых лежит часть пространства, где образуется оптическое изображение (область фокуса), представляют большой практический интерес. Первое упоминание о дифракционных явлениях появилось в работе Лео- нардо да Винчи A452—1519 гг.). Однако впервые они были описаны детально только в книге Гримальди, опубликованной в 1665 г. спустя два года после его смерти. Корпускулярная теория, которую считали в то время правильно описывающей распространение света, не могла объяснить дифракцию. Гюй- генс, впервые обосновавший волновую теорию, очевидно, не знал об открытии Гримальди, иначе он несомненно сослался бы на него для подтверждения своей точки зрения. О возможности объяснить явления дифракции в рамках волно- вой теории нигде не упоминается вплоть до 1818 г., когда появился прекрас- ный мемуар Френеля (см. «Историческое введение»), где было показано, что явление дифракции можно объяснить с помощью построения Гюйгенса (см. п. 3.3.3) и применения принципа интерференции. Позднее Кирхгоф A882 г.) придал исследованиям Френеля строго математическое обоснование, и с этого времени началось широкое изучение дифракции *). Проблемы, возникающие при изучении дифракционных явлений, отно- сятся к наиболее трудным в оптике, и их редко удается довести до строгого решения. Первое такое решение было получено только в 1896 г. А. Зоммер- фельдом, рассмотревшим важный вопрос дифракции плоской волны на иде- ально проводящем полубесконечном плоском экране. С тех пор было найдено строгое решение только нескольких дифракционных задач, относящихся глав- ным образом к двумерным структурам (см. гл. 11). В большинстве же случаев, представляющих практический интерес, из-за математических трудностей приходится прибегать к приближенным методам, и тут теория Гюйгенса и Френеля служит чрезвычайно мощным орудием, позволяющим решить боль- шинство вопросов, встречающихся в инструментальной оптике. Эта теория и некоторые ее приложения составляют главное содержание настоящей главы. § 8.2. Принцип Гюйгенса — Френеля Согласно построению Гюйгенса (см. п. 3.3.3) каждую точку волнового фронта молено считать центром вторичного возмущения, которое вызывает элементарные сферические волны, а волновой фронт в любой более поздний мемеит времени—огибающей этих волн. Френель смог объяснить явление *) Более полное знакомство с историческим развитием этого-предмета можно получить в [1].
342 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [гл. 8 дифракции, дополнив построение Гюйгенса утверждением, что вторичные волны интерферируют между собой. Это сочетание построения Гюйгенса с прин- ципом интерференции называется принципом Гюйгенса—Френели. Прежде чем применить его к изучению дифракционных эффектов, следует проверить (с некоторыми простыми дополнительными предположениями), правильно ли он описывает распространение света в вакууме. Пусть S (рис. 8.1)—мгновенное положение сферического монохромати- ческого волнового фронта с радиусом /¦„, распространяющегося от точечного источника Ро; допустим, что требуется определить световое возмущение в Рис, 8.1. Построение зон Френеля. точке Р. Возмущение в точке Q волнового фронта можно представить (с точ- ностью до периодического по времени множителя ехр (—ie>t)) в виде А ехр A&Го)/г0, где Л — амплитуда на расстоянии единицы длины от источника. В соответствии с принципом Гюйгенса — Френеля каждый элемент волнового фронта рассматривается как центр вторичных возмущений, которые распро- страняются в виде элементарных сферических волн; вклад в возмущениеdU(P), вносимый элементом dS, находящимся в точке Q, запишется в виде du (Р) =* к (х) exp('fo) где s = QP, К (%) — коэффициент наклона, описывающий изменение ампли- туды вторичных волн в зависимости от направления, а % — угол (часто назы- ваемый углом дифракции) между нормалью в точке Q и направлением QP. Следуя Френелю, предположим, что К максимально в первоначальном на- правлении распространения света, т. е. при % =-- 0, быстро уменьшается с уве- личением % и равно нулю, когда QP становится касательной к волновому фронту, т, е, когда % — л/2; наконец, предположим, что в точке Р сказывается влияние только той части S' первоначальной волны, которая не загоражи- вается каким-либо препятствием, находящимся между Ра и Р. Поэтому полное возмущение в точке Р равно ro Г Г J J A) Для того чтобы вычислить (I), воспользуемся так называемыми зонами Френеля. Построим вокруг точки Р сферы с радиусами . ЗА , , /Я *, X 2Л * Ь + Т>
§8.2] ПРИНЦИП ГЮЙГЕНСА—ФРЕНЕЛЯ 343 где b = СР, а С— точка пересечения ЄРс волновым фронтом 5 (см. рис. 8.1). Сферы делят S на целый ряд зон Z,, Z.lt Zs, . . ., Z,, . . . ^ Пусть ru и Ь велики по сравнению с длиной волны; тогда можно предполо- жить, что в любой зоне величина К постоянна и в зоне / равна д"у. Из рисунка видно, что s2 =¦= г\ + (г0 -г by — 2r0 (r0 + b) cos 9. Следовательно, sds=--ro(ro+fc)sin9?ffi B) и, значит, dS = /•« sin 0d9 dw ^ —^_ s rfsdip, где ф— азимут. Следовательно, вклад зоны / в U (Р) равен U, (РУ= 2л Л e;^'f"' К, J exp (fAs) ds =* ft(V __ 2л. — k А ^ как k% = 2л, последние два множителя сводятся к ехр ('-^) (l - exp ( —^-) ) =ехр (w/) A ^ехр (- in)) =(_1)/-2 и, следовательно, и,(Р) = 21\(-\у"К1^-Щ^Ш^. C) Заметим, что вклады следующих друг за другом зон имеют разные знаки. Результирующий эффект в точке Р получается суммированием вкладов от всех зон, т. е. и (Р) = 2а А ехрУ;-""" g (-1У+1 /с7. D) Ряд 2= 2(-1)y+I^/=^-^+^---.+(-i)"+1^ E) 1 = 1 можно приближенно вычислить по методу Шустер а 12]. Перепишем вначале E) в виде Последний член равен 1/2 Кп или >/„ /Cn-i — Кп в зависимости от того, не- четно п или четно. Допустим теперь, что закон, определяющий изменение К с направлением таков, чш величина К,, больше среднего арифметического со- седних значений Kj_] и К!+1- Тогда каждый член в F), заключенный в скобки, отрицателен и, значит, У_, <-тг- + -s2-, если п нечетно, I v к- к , * {7) >^ < -тг1—[—Tr-i—An. если п четно. Теперь перепишем E) в виде Последний член этого ряда равен — -=- К„-1 + К„, если я нечетно, и —-=- Кп,
344 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 если оно четно. Следовательно, > К,—j2 '^"\-Кп, если п нечетно, | 2_ > А1 ^- -f-, если « четно. j Величина каждого /Q лишь немного отличается от величин соседних Kj-t и Kj+i, и поэтому правые части соотношений G) и (9) практически равны я приближенно можно считать, что 2_, =-g1-4-п2-, если л нечетно, 2^=-^ jr-i если ге четно. J Легко проверить, что соотношения A0) остаются справедливыми, если каждое К, меньше среднего арифметического соседних членов, и тогда члены в F) и (8), заключенные в скобках, отрицательны. Более того, можно ожидать, что A0) останется справедливым даже тогда, когда только часть членов в скоб- ках отрицательна, а другая часть положительна. В этом случае ряд можно разделить на две части в зависимости от знаков членов в скобках, и к каждой такой части применить предыдущие рассуждения. Итак, мы приходим к заклю- чению, что сумма ряда определяется выражениями A0), если члены в скобках в соотношениях F) и (8) не меняют знак так часто, что неточности, склады- ваясь, достигают значительной величины. Если исключить последний случай, то из D) и A0) находим здесь верхний знак берется при нечетном п, а нижний — при четном. Воспользовавшись C), уравнение A1) можно переписать в виде 1 Ft r r n\ i тт / п\1 / у лл Для последней зоны Zn, видимой из Р, QP становится касательной к вол- новому фронту, т. е. х = я/2, и, как говорилось выше, для такого % величина К, по предположению, равна нулю. Следовательно, ЛГп. = 0, и A1) сводится к выражению и(Р) = а/с, Аехр"*(;«+*>' = ' и,(Р), A3) показывающему, что полное возмущение в Р равняется половине возмущения, обусловленного действием первой зоны. Соотношение A3) находится в согласии с выражением, описывающим дей- ствие сферической волны, если «^, = 1, т. е. если Кг = —-^ехр(~'я/2). A4) Множитель ехр (—ш/2) можно объяснить, если предположить, что вторичные волны отстают по фазе на четверть периода от первичной волны. Присутствие др\гого множителя становится понятным, если допустить, что амплитуды вторичных и первичных волн относятся, как 1 : %. Таким образом, мы прихо- дим к заключению, что при этих допущениях относительно амплитуды и фазы вторичных волн принцип Гюйгенса — Френеля правильно описывает распро- странение сферических волн в свободном пространстве. Однако приведенные выше дополнительные предположения нужно рассматривать просто как удоб- ный способ интерпретации математических выражений; иными словами, они
§ 8.3] ТЕОРИЯ ДИФРАКЦИИ КИРХГОФА 345 не имеют какого-либо физического смысла. Истолкование множителя A4) станет очевидным позднее (см. § 8.3). Следуя и дальше Френелю, закроем несколько зон плоским экраном, перпендикулярным к Р0Р, с круглым отверстием, центр которого находится на этой линии, и рассмотрим действие оставшихся зон в точке Р. Теперь следует считать, что суммарное возмущение в Р обусловлено только волнами от не- закрытых зон. Если экран оставляет открытой только половину первой зоны, то из C), полагая /=1 и умножая на 1/2, получим U (Г) = 1А.К, Гд+Ь = ;rqrfc • A5) Следовательно, возмущение в Р оказывается таким же, как и в отсутствие эк- рана. Если закрыты все зоны, кроме первой, то из C) находим U (Р) _ 2i>.K А ехр ^ |r°+&I ^ 2 А ехр [t* <f°+&)l A6) и интенсивность / (P) = \U(P)\2 в четыре раза больше, чем в отсутствие экрана. При дальнейшем увеличении отверстия интенсивность уменьшится, так как первые два члена в D) имеют разные знаки. Больше того, Ki и Ki почти оди- наковы, и, следовательно, если отверстие приблизительно равно двум первым 'зонам, то в точке Р будет почти полная темнота. Поэтому при изменений размеров отверстия наблюдается периодическое изменение интенсивности в Р. Такой же результат получается и тогда, когда размеры отверстия и источника остаются постоянными, а точка наблюдения Р перемещается вдоль оси. В этом случае при постепенном приближении точки Р к экрану увеличивается число открывающихся зон. Все полученные выше результаты находятся в хорошем согласии с экспе- риментом. Одно из предсказаний теории Френеля произвело сильное впечат- ление на его современников и фактически положило конец долгому спору меж- ду сторонниками корпускулярной и волновой теорий света. Этот спор был решен в пользу волновой теории. Речь идет о явлении, наблюдаемом при за- крытии первой зоны маленьким круглым диском, помещенным под прямым углом к прямой Р„Р. Согласно E) комплексная амплитуда в Р равняется IIID\ ОЛ ^ехР 1'^(го + &)| г W i К К \ 1 C17V U (P)=2lK— у-щ [— Де-^Д3_Д4_|- ... J. (И) Так же, как и раньше, получим, что сумма ряда в скобках равна — Кг/2. Выше мы предположили, что Кг только немного отличается от /С, ¦= \НХ и, следо- вательно, в геометрической тени диска интенсивность света будет такой же,, как и в отсутствие диска *). § 8.3. Теория дифракции Кирхгофа 8.3.1. Интегральная теорема Кирхгофа. Основная идея теории Гюйгенса— Френеля заключается в том, что световое возмущение в точке Р возникает вследствие суперпозиции вторичных волн, испускаемых поверхностью, на- ходящейся между этой точкой и источником света, Кирхгоф [3] придал этой *) В 1818 г. Пуассон, будучи членом комитета Французской академии, рассматривавшего представленный па премию мемуар Френеля, показал на основании теории Френеля, что в центре тени маленького диска должно находиться светлое пягио Этот результат Пуассон счел противоречащим опыту и тем самым отвергающим теорию Френеля. Однако Лраго, другой член того же комитета, выполнил эксперимент, показавший, что это удивительное предсказание правильно. Такое же наблюдение, сделанное Маральди столетием раньще, было забыто.
346 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИЙ [ГЛ. 8 идее строгий математический вид *) и показал, что принцип Гюйгенса — Фре- неля можно считать приближенной формой определенной интегральной тео- ремы **). В этой теореме решение однородного волнового уравнения в про- извольной точке поля выражается через значения искомой величины и ее пер- вой производной во всех точках произвольной замкнутой поверхности, окру- жающей точку Р. Рассмотрим сначала строго монохроматическую скалярную волну V(x, у, г, t) — U(x, у, г)ехр(—Ш). A) В вакууме ее часть, зависящая от координат, удовлетворяет волновому урав- нению, не зависящему от времени, (У2 + &2)^=0, B) где k = ale. Уравнение B) называется также уравнением Гельмгольца. Пусть v — объем, ограниченный произвольной замкнутой поверхностью S, а Р— какая-нибудь точка внутри него; предположим, что U имеет непре- рывные частные производные первого и второго порядков внутри этого объема и на поверхности S. Если W — любая другая функция, удовлетворяющая таким же требованиям непрерывности, как h U, то по теореме Грина получим ~5 U'-z-)dS, C) где д/дп означает дифференцирование вдоль внутренней ***) нормали к по- верхности S. В частности, если W удовлетворяет также волновому уравнению, не зависящему от времени, т. е. если (V* + k*)U'=Q, D) то из B) и D) сразу же следует, что подынтегральное выражение в левой части {3) обращается в нуль в каждой точке объема v и, следовательно, ГГ I,,dV ,,,dU\ ,o „ J J \ дп дп ) w Рассмотрим функцию V (х, у, г)—е'кЧи, где s—расстояние от Р до точки (х, у, z). Эта функция имеет особенность при s — 0, и так как предпола- гается, что U' непрерывна и дифференцируема, то, следовательно, точку Р нужно исключить из области интегрирования. Поэтому окружим ее небольшой сферой радиуса в и произведем интегрирование по объему, заключенному меж- ду S и поверхностью этой сферы S' (рис. 8.2). Тогда вместо E) получим exp (Iks) 9U \ *) Теория Кирхгофа применима к дифракции скалярных волн. В § 8.4 будет показано, что скалярная теория обычно вполне пригодна при рассмотрении проблем инструментальной оптики. Векторное обобщение принципа Гюйгенса — Френеля предлагалось многими авторами. Первая удовлетворительная работа, посвященная этому вопросу, принадлежит Коттлеру D] <см. [5],' стр. 144). •*) Для монохроматических волн эта теорема была выведена раньше в акустике Гельм- гольцем [6]. "*) Теорема Грина обычно формулируется для внешней нормали, ио в данном случае более удобна внутренняя нормаль.
§ 8.3) ТЕОРИЯ ДИФРАКЦИИ КИРХГОФА 347 откуда д_ /exp (iks)\ exp (iks) dU \ ,„ On --Ш jj exp (iks) ! ., \\ exp (Iks) dU —H{' exp (ite) exp (ike) с где dQ — элемент телесного угла. Так как интеграл по S не зависит от е, можно заменить интеграл в правой части F) его предельным значением при е —>- 0. Первый и третий члены в нем не дают вклада в этот предел, а полный вклад второго члена равен AnU (Р). Следовательно, G) — , п Рис. 8,2. К выводу интег- Это одна из форм интегральной теоремы. Г ельмгольца pajIbIIOj теОремы Гель- U Кирхгофа *). мгольца — Кирхгофа; об- Заметим, что когда k-*-0, то ие зависящее от вре- ласть интегрирования, мени волновое уравнение C) сводится к уравнению Лапласа ?2?/ = 0, и G) переходит тогда в хорошо известную формулу тео- рии потенциала Если Р лежит вне поверхности S, но U — по-прежнему непрерывная н дифференцируемая до второго порядка функция внутри S и если, как и раньше, принять U' — exp (iks)/s, то уравнение C) остается справедливым по всему объему внутри 5. Тогда, согласно E), интеграл по поверхности равен нулю. Существует другая дополнительная форма теоремы Гельмгольца—Кирх- гофа для случая, когда функция U непрерывна и дифференцируема до второго порядка вне и на самой замкнутой поверхности S (источники внутри). Однако в таком случае, как и в задачах, связанных с распространением света в бес- конечной среде, одних граничных значений на 5 уже недостаточно для полу- чения однозначного решения. Здесь требуются еще дополнительные предпо- ложения относительно решения **) при s->-oo. До сих пор рассматривались только строго монохроматические волны. Теперь выведем теорему Кирхгофа в общем виде, пригодном и в случае немо- иохроматических волн. Пусть V(x, у, г, f) — решение волнового уравнения *) Эта теорема выражает U (Р) через U и dUldn на S. Тем не менее можно показать на основании теории функций Грина, что для определения U в каждой точке Р внутри .S доста- точно одной какой-нибудь величины, т. с. или U, или dUldn (см., например, [7]). Однако только в простейших случаях, например когда S — плоскость, можно найти соответствующую функ- цию Грина (см. [8]). **) Желающие более подробно познакомиться с этим вопросом могут воспользоваться, на- пример, [5].
348 ЭЛЕМРНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. S и его можно представить в виде интеграла Фурье + 00 V (х, у, г, t) = y=^Un (х, у, г) ехр (- Ы) da. A0) Тогда по формуле обратного фурье-преобразования иш(х, у, z)~pL J V(x, у, г, Оехр(/чО<И. A1) Так как предполагается, что V (х, у, г, t) удовлетворяет волновому уравне- нию (9), то Uw(x, у, г) удовлетворяет не зависящему от времени волновому уравнению B). Если, кроме того, V подчиняется соответствующим условиям регулярности внутри замкнутой поверхности 5 и на ней, то мы вправе приме- нить формулу Кирхгофа отдельно к каждой фурье-компоненте Um(,x, у, г) — == Um (Р), т. е. написать Изменяя порядок интегрирования и полагая й —ш/с, приведем A0) к виду V(P, t) = 1 У }г, d /exp[-i<fl(f-s/c))\ ехр [- »ш (t -s'c)] dUm \ , exp [— «о ((— s/c)] s или, используя A0) В квадратных скобках заключены «запаздывающие величины», т. е. значения функций, взятых в момент времени t—sic. Формула A3) представляет собой теорему Кирхгофа в общем виде. По аналогии с предыдущим случаем отметим, что если Р находится вне 5, то величина интеграла в A3) равна нулю. Последний член в A3) представляет собой вклад в решение, обусловлен- 1 dV яыи распределением источников с «силой» —4~а~ на ЗДинииУ площади, а первые два члена — вклад от диполей «силой» VIAn на единицу площади, направленных нормально к поверхности. Естественно, что эти источники и диполи фиктивные и, следовательно, в такой интерпретации ист глубокого физического смысла. 8.3.2. Теория дифракции Кирхгофа. Интегральная теорема Кирхгофа базируется на основной идее принципа Гюйгенса — Френеля. Однако законы, управляющие вкладами or различных элементов поверхности, значительно сложнее, чем предполагал Френель. Тем не менее Кирхгоф показал, что во многих случаях эту теорему можно свести к приближенной, но более простой форме, эквивалентной формулировке Френеля, и, кроме того, определить точ- ный вид коэффициента наклона, который в теории Френеля остается неопре- деленным.
§ 8.3] ТЕОРИЯ ДИФРАКЦИИ КИРХГОФА 349 Рассмотрим монохроматическую волну, идущую от точечного источника Ро сквозь отверстие в плоском непрозрачном экране. Пусть, как и раньше, Р — точка, в которой определяется световое возмещение. Допустим, что ли- нейные размеры отверстия велики по сравнению с длиной волны света, но малы по сравнению с расстояниями от Р„ и Р до экрана. Для того чюбы найти возмущение в точке Р, рассмотрим интеграл Кирх- гофа по поверхности S, образованной (рис. 8.3, а): 1) отверстием Л, 2) участ- ком 3d неосвещенной стороны экрана и 3) частью Й большой сферы с центром а) 6) Рис. g.3. К выводу дифракционной формулы Френеля — Кирхгофа. \в Р и радиусом R, которая вместе с Л к 33 образует замкнутую поверхность. ) Из теоремы Кирхгофа в форме G) имеем У где, как и раньше, s— расстояние между элементом dS и Р, а д/дп — обоз- начает дифференцирование вдоль внутренней нормали к поверхности инте- грирования. Здесь дело осложняется тем, что значения U и дШдп на Л, 3i и ё, кото- рые необходимо подставить в A4), никогда точно неизвестны. Однако разумно считать, что повсюду на Л, кроме мест, находящихся с непосредственной бли- зости к краю отверстия, U и дШдп мало отличаются от тех значений, которые они имели бы в отсутствие экрана, и что на S8 эти величины близки к нулю. Тогда, согласно Кирхгофу, имеем на®:?/ = 0. ^ = 0, J A5) где dJ^-^[^-~]cos{n,r) A6) ¦— величины, относящиеся к падающему полю (рис. 8.3, б), а Л — постоян- ная Приближения A5), называемые граничными условиями Кирхгофа, лежат в основе теории дифракции Кирхгофа Остается еще учесть роль части сферической поверхности %. Теперь оче- видно, что, беря радиус R достаточно большим, можно получить значения U и dUldn на <& сколь угодно малыми и, следовательно, можно пренебречь вкладом or %. Однако при неограниченном увеличении R площадь % также неограни- ченно увеличивается и условие 1/->0 и dUidn^O при R->-oo недостаточно для того, чтобы наш интеграл стремился к нулю. Таким образом, необходимы
350 ЭЛЕМЕНТЫ ТСОРИИ ДИФРАКЦИИ [гл. 8 более точные допущения относительно поведения волновой функции на боль- шом расстоянии от экрана. Этот вопрос уже обсуждался на стр. 347 в связи с вопросом об однозначности решений задач, рассматривающих бесконечную среду. Для нашей же задачи достаточно сделать физически очевидное допу- щение, что радиационное поле не существовало всегда, а начало создаваться источником в некоторый определенный момент времени *) t— t0. (Это, конечно, означает отступление от строгой монохроматичности, так как идеально моно- хроматическое поле существует неограниченное время.) Тогда в любой момент времени t>U поле заполняет некоторую часть пространства, внешняя гра- ница которой находится от Р„ на расстоянии, не превышающем c(l— t0), где с— скорость света. Следовательно, если радиус R выбирается столь большим. что в момент наблюдения в Р вклад в возмущение от % отсутствует (так как в этот момент поле еще не достигло столь удаленных областей), то интеграл по if равен нулю. Учитывая это и пренебрегая в производных по пормали чле- нами Mr и 1/s, малыми по сравнению с k, окончательно получим вместо A4) [cos(n, г) — cos (я, s)]dS. A7) А Это выражение называется дифракционной формулой Френеля — Кирхгофа. Очевидно, что вместо А мы вправе выбрать любую другую незамкнутую поверхность, границы которой совпа- дают с краем отверстия. В частности, вместо А можно взять часть W падаю- щего волнового фронта, которая при- близительно заполняет отверстие, и часть % конуса с вершиной в Ро и с образую- щими, проходящими через края отвер- стия (рис. 8.4). При достаточно большом радиусе кривизны волнового фронта Рис. 8.4. К выводу дифракционной фор- вкладом от %, очевидно, можно пре- мулы A8). небречь. Кроме того, на W имеем cos (я, го) = 1. Если еще положить % — п—(r0, s), то вместо A7) получим и ,т = l_ A exp (ikra) (• f exp (iks) 2A tn ¦A +cos X)dS, A8) где /•„—- радиус волнового фронта W. Этот результат находится в согласии с формулировкой принципа Гюйгенса Френелем, если вкладам от элемента dW волнового фронта считать — Si " A + cos y)dS. П9) Сравнивая A8) с (8.2.1), найдем для коэффициента наклона, фигурирующего в теории Френеля, выражение **) К (%) = — gfU+ C0SX)\ B0) Для центральной зоны х = 0 и B0) дает К1—К@)=—'А, что согласуется с (8.2.14). Видно, однако, что Френель неправильно предполагал, будто АГ(п/2)-0. Возвращаясь снова к дифракционной формуле Френеля — Кирхгофа A7), отметим, что она симметрична относительно источника аточки наблюдения. Это *) Это предположение несущественно, но сокращает обсуждение. Более формальную аргументацию см. в |9]. •*) Выражение B0) для коэффициента наклона впервые получено Стоксом [10].
§ 8.3] ТЕОРИЯ ДИФРАКЦИИ КИРХГОФА 351 означает, что точечный источник, находящийся в Ро, производит в Р такое же действие, какое производил бы точечный источник равной интенсивности, по- мещенной в Р. Этот вывод иногда называют теоремой взаимности (или теоремой обратимости) Гельмгольца. До сих пор мы предполагали, что свет на пути от источника до точки Р не встречает других поверхностей, кроме дифракционного экрана: в таком слу- чае падающие волны сферические. Легко распространить этот анализ и на более сложные случая, когда форма волны не столь проста. И тогда мы опять получим, что выводы теории Кирхгофа по существу эквивалентны предсказа- ниям, сделанным на основе принципа Гюйгенса— Френеля, при условии, что в каждой точке волнового фронта радиусы его кривизны велики по сравнению с длиной волны света, а углы достаточно малы. Из предыдущих рассуждений можно сразу же вывести заключение о рас- пределении света, дифрагировавшего на дополнительных друг другу экранах, т. е. на экранах, у которых отверстия одного точно совпадают с непрозрачными частями другого и наоборот. Пусть U, (Р) и f/2 (P) — комплексные возмущения, когда только один из экранов помещен на пути между источником и точкой наблюдения Р. Тогда, поскольку U, и U2 можно представить в виде интегралов по отверстиям, а отверстия в дополнительных экранах располагаются так, что полностью «открывают» весь волновой фронт, ч'о U. B1) Это так называемый принцип Бобине*) [11]. Из принципа Бабине можно вывести два заключения. Если Ux = 0, то i/2 = U, т. е. в точках, где интенсивность при наличии одного экрана равна нулю, в присутствии лишь другого экрана она будет такой же, как и в отсут- ствие экранов. Далее, если U = О, то U1 =— U2, т. е. в точках, где U равно пулю, фазы ?/, и U2 различаются на я, а интенсивности /т= |?/х|2 и /а =^ |?Л|3 одинаковы. Так, например, если точечный источник изображается хорошо кор- регированным объективом, распределение света U в плоскости изображений повсюду равно нулю, за исключением мест, находящихся в непосредственной близости от изображения О источника. Если дополнительные экраны поместить на пути между источником и изображением, то /]-- /г всюду, за исключением мест близ О. Выводы из основного приближения A5) теории Кирхгофа подвергались многим критическим замечаниям, из которых следует, например, что решение Кирхгофа не дает исходных значений интенсивности в плоскости отверстия [121 (см. также [5] стр. 71, 72 и [13]). Однако сравнительно недавно, Вольф и Марчанд [14] показали, что теорию Кирхгофа можно изложить полностью математически **). В таком виде теория дает точное решение некоторых иных краевых задач, чем A5) и A6), и полно- стью применима к основным проблемам инструментальной оптики. Это объяс- няется главным образом тем, что длины волн оптического диапазона малы по сравнению с размерами препятствий, на которых происходит дифракция 117] В других задачах, относящихся, например, к поведению поля в непосредс1 венной близости к экранам и другим препятствиям, нужно применять более •) В $ 11.3 приводится аналогичная теорема, которую можно считать строгой форму- лировкой принципа Бабине. В этой теореме рассматривается не только скалярная функция U, но и векторное электромагнитное поле. **) Коттлер [14а] также нашел, что теория Кирхгофа дает стротое решение определенной задачи, связанной с разрывом непрерывности (задачи с заданными разрывами, а не с заданными граничными значениями). Такая интерпретация представляет большой интерес в связи с зада- чей дифракции па черном (полностью поглощающем) экране (сч. также [51, стр. 98 и [151). В гтать.е [16] содержатся многочисленные ссылки на работы, касающиеся различных видоизменений теории Кирхгофа.
852 ЭДЕМРНТН ТЕОРИЯ ДИФРАКЦИЯ {г л тонкие методы. Такие задачи необходимо рассматривать как задачи электро- магнитной теории с граничными условиями и считать источники особыми точками волновых функций. Решения подобных задач найдены только для очень небольшого числа случаев; некоторые из них будут рассмотрены в гл 11. 8.3.3. Дифракция Фраунгофера и Френеля. Исследуем теперь подробно дифракционный интеграл Френеля — Кирхгофа A7) s]]dS. B2) Л Рис. 8 5. Дифракция иа отверстии в плоском экране Когда элемент dS пробегает область интегрирования, л+s в общем слу- чае будет изменяться на очень много длин волн; и поэтому множитель в ехр (ik (r-\-s)} будет быстро осцилли- ровать. Кроме того, если расстояния от точек Ро и Р до экрана велики по сравнению с линейными размерами ,р отверстия, то множитель [cos (я, г) —¦ — cos (ft, s)] изменяется по отверстию незначительно. Далее, предполагая, что О это любая точка отверстия и углы, образованные линиями РОО и ОР с Р„Р, не слишком велики, можно заменить этот множитель на 2cos6, где б — угол между линией Р0Р и нормалью к экрану И наконец, множитель Mrs можно заменить на Mr's', где /¦'is' — расстояния от точек Ро и Р до начала координат; тогда B2) све- дется к U (Р) « —J- c°s, I \ ехр [ik (r + s)] dS B3) J , Возьмем за начало декартовой системы координат точку О отверстия, а оси 0х и Оу выберем в плоскости отверстия. Будем считать, что ось г направлена в сторону полупространства, в котором находится точка наблюдения Р (рис, 8.5). Пусть (Хо, (/о. ?о) и (х, у, г) — координаты точек Рои Р соответственно, а {|, г|) — координаты точки Q отверстия; тогда 1 \ B4) B5) Следовательно, + if B6) ла = г'2—2(хо1 + ss = S's_2 (xl + г/т)) +12 + if. Мы предположили, что линейные размеры экрана малы по сравнению с г' и s'> и поэтому можем разложить г и s в степенные ряды по %1г', ц/r', g/s' и r|/s'; тогда получим Подстановка B7) в B3) дает i7 2s !ll J J exp [i* / F, r,)] d% dn, B7) B8)
•§ 8.3] теория дифракции кирхгофа 353 тде f/S v.1— ха1 + УаП *Е+У1 i Р + Г? , i"+rf (*п5+У(А1У (х$ + «Г]K ,„„. A IS, 'Ш— р р h—27 г—§р 27м — ^<j ••¦ l^aJ Если мы обозначим первые два направляющих косинуса через G0, пи) и (/, от), т. е. 'о — р7, * — ~г то B9) можно переписать в виде /F. 4) = ('»-Q l Мы свели задачу определения светового возмущения в Р к вычислению интеграла B8). Конечно, оно упростится, если в / пренебречь квадратичными членами и членами более высоких порядков относительно 5 и т). В этом случае мы имеем дело с дифракцией Фраунгофера; если же квадратичными членами пренебречь нельзя,— то с дифракцией Френеля. К счастью, более простой слу- чай дифракции Фраунгофера представляется в оптике значительно более важным. , Строго говоря, члены второго и более высоких порядков исчезают только в предельном случае г'->оо и s'-roo, т. е. когда и источник, и точка наблю- дения находятся в бесконечности (тогда надо допустить, что и множитель А перед интегралом стремится к бесконечности так же, как r's'. Однако очевидно, что вклад членов второго порядка в интеграл невелик, если }-k\ (jr f <2я. C2) Можно сразу же указать определенные условия, при которых C2) удов- летворяется. Для этого воспользуемся неравенством вида (/05 + ?7io'iJS^ t^(/J + ml) (g2 + r\z) и, вспомнив, что II, ml, P и т? не превышают единицы, по- лучим, что C2) удовлетворяется, если |/-'|>(?3+^)ма11С и ls'l>(?a+ff)M!"'c, C3) или если 1 + 1 = 0 и IK^^. C4) Условия C3) позволяют оценить расстояния г' и s', при которых применимо приближение Фраунгофера. Условия C4) означают, что дифракция Фраунго- фера имеет место и тогда, когда точка наблюдения находится в плоскости, параллельной плоскости отверстия при условии, что точка наблюдения и источник света достаточно близки к оси г. Здесь следует различать два сл\чая. Если г' отрицательно, то падающие на отвергтие волновые фронты имеют вог- нутость в направлении распространения и точка Ра является центром схож- дения, а не расхождения падающей волны. Этот случай очень важен для практики, так как осуществляется в пространстве изображений хорошо кор- регированной центрированной системы, изображающей точечный источник, расположенный недалеко от оси. Дифракционная картина Фраунгофера обра- зуется в параксиальной плоскости изображений и может рассматриваться как результат дифракции, дающей изображения волны на выходном зрачке. Если г' положительно, то волновые фронты имеют выпуклости в направлении рас- пространения; дифракционные картины оказываются мнимыми и кажутся образованными на экране, проходящем через источник Ро. Этот случай имеет место, например, тогда, когда отверстие в экране находится непосредственно
354 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [гл перед глазом или когда установка объектива зрительной трубы соответствует рассматриванию удаленного источника света. Чтобы составить ясное физическое представление о том, почему дифрак- ционная картина Фраунгофера наблюдается в фокальной плоскости хорошо коррегированного объектива, сравним сначала две ситуации, показанные на рис. 8.6. На рис. 8.6, а пучок лучей от бесконечно удаленной точки падает на отверстие в направлении, определяемом направляющими косинусами 10, пг0, п0. Можно считать, что дифракция, наблюдаемая в направлении I, т, пъ очень удаленной точке Р, возникла в результате суперпозиции плоских волн, ис- ходящих из каждой точки отверстия в этом направлении. Такие волны (не а) 0) Рис. 8.6. Сравнение двух случаев дифракции Фраунгофера. существующие в рамках геометрической оптики) можно назвать дифрагирова- вшими волнами, а соответствующие' волновые нормали — дифрагировавшими лучами. Если теперь поместить хорошо коррегированный объектив позади экрана (см. рис. 8.6, б), то весь свет, дифрагировавший в направлении (/, т, п), собе- рется в фокусе Р' в фокальной плоскости объектива. Так как длины оптических путей всех лучей, приходящих в Р' от волнового фронта дифрагировавшего пучка, равны, то по существу интерференционные эффекты остаются такими же, как и в первом случае, конечно, при условии, что объектив так велик, что не вносит дополнительной дифракции. Более общее ограничение, состоящее в том, что на отверстие должна падать плоская волна, также можно снять, если длины путей от источника до Р' примерно одинаковы для всех лучей. В случае дифракции Фраунгофера четыре величины 1„, т0, I, m входят в C1) только в комбинации р = 1—/„, q = tn—та. C5) Следовательно, в той области, где справедливо упомянутое выше прибли- жение, картина не изменится, если отверстие сместится в своей собственной плоскости. " [ Запишем интеграл, описывающий дифракцию Фраунгофера, в виде Л здесь С—величина, стоящая перед интегралом B8). С определяется через величины, связанные с положениями источника и точки наблюдения; однако на практике часто удобнее выражать ее через другие величины. Пусть ? — полная энергия, падающая на отверстие. По закону сохранения энергии вся энергия, достигающая плоскости наблюдения, должна равняться Е; поэтому
§ 8.3] ТЕОРИЯ ДИФРАКЦИИ КИРХГОФА 355 должно выполняться нормирующее условие ЭД|У(Р, q)\dpdq = E; C7) здесь интегрирование производится по всем возможным значениям величин р и q. Уравнение C6) можно записать теперь в виде интеграла Фурье . U (р, q) = JJG (E, t|) exp [-^ (pl+qrd] йЫц, , C8) где G—функция зрачка*), определяемая как G (?, T|) = const(C) в точках отверстия, 1 . ,щ G (|, ц) = 0 в точках вне отверстия, } а интеграл берется по всей (?, ^-плоскости. По теореме Парсеваля для фурье-преобразования [18] имеем JJ|G(E, t|)lIdEd4=(x)iJJl«/(/'. q)\2dpdq, D0) или, используя C7) и C9) и обозначая площадь отверстия через D, ±E = \C\*D, " D1) откуда **) 4/f D2) Тогда, основной интеграл, описывающий дифракцию Фраунгофера, прини- мает вид )=*. |/1 |J ех р [_ ik {pi + ^i)] dg d% D3) Следует обратить внимание, что интенсивность /0 =S [i/.@, 0)|3 в центре кар- тины, где р = ц = 0, равна При выводе D3) мы пренебрегли тем, что формула C6) была получена для ограниченной области величин р и q. Однако ошибка, вносимая при рас- пространении интегрирования в D0) на все значения р и q, ничтожна, так как величина U (p, q) очень мала всюду, за исключением области, находящейся в непосредственной близости от точки р = q = 0. Однако вернемся к основному интегралу B8) теории дифракции. Когда точка (|, т|) пробегает область интегрирования, функции Д|, г\) изменяется на очень много длин волн; поэтому вещественная и мнимая части подынтег- рального выражения многократно изменяют знак. В общем случае вклады от различных элементов фактически уничтожают друг друга (деструктивная ин- терференция). По для элементарного участка, окружающего точку (назовем ее критической точкой или полюсом), где f{%, т|) постоянна, положение другое. Здесь подынтегральное выражение изменяется значительно медленнее, и можно ожидать, что его вклад станет заметным. Поэтому, если длина волны достаточно мала, величина интеграла, по существу, определяется поведением f вблизи точек, где f постоянно. Это является основой метода стационарной фазы, позволяющего определить асимптотическое поведение интегралов опре- деленного класса (более подробно он разбирается в приложении 3). Ниже мы *) Более общие функции зрачка рассматриваются в § 8.6 и 9.5. **) Постоянный фазовый множитель опускается, так как он не вносит вклада в интенсив- нос! ь I=\U\\
356 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 используем предыдущие результаты для классификации дифракционных яв- лений. Сравнивая B2) и B8), мы видим, что r + s = r' +s' +f, и поэтому (см. рис. 8.5) [ = P<,Q + QP + const. D5) Очевидно, /, рассматриваемая как функция Q, постоянна, когда Q коллинеарно с Ро а Р. Следовательно, основной вклад в возмущение в точке Р поступает от точек, находящихся в непосредственной близости к точке Q, в которой линия, соединяющая источник с точкой наблюдения, пересекает плоскость отверстия. В частном случае дифракции Фраунгофера, Ро и Р находятся в бесконечности и особой точки Q не существует. Следовательно, в данном случае поведение дифракционного интеграла должно быть необычным. В § 8.5—8.8 мы рассмотрим наиболее важные случаи дифракции Фраун- гофера и Френеля. Но сначала следует убедиться, что при вычислении интен- сивности света мы вправе пользоваться скалярной волновой функцией U. § 8.4. Переход к скалярной теории*) При выводе интегральной теоремы Кирхгофа мы воспользовались только одним свойством функции U, а именно тем, что она удовлетворяет однородному скалярному волновому уравнению. Следовательно, эта теорема и заключения предыдущей главы применимы к каждой декартовой компоненте векторов поля, векторного потенциала, векторов Герца и т. д. в областях, где не существует ни токов, ни зарядов. Для того чтобы полностью описать поле, теорему Кирх- гофа следует применять отдельно к каждой декартовой компоненте. Однако в силу удачного стечения обстоятельств в большинстве оптических задач вполне достаточно приближенного описания поля одной комплексной скалярной вол- новой функцией. Для полного описания электромагнитного поля необходимо знать вели- чины векторов поля, а также их направления (поляризацию) как функции положения и времени. Но в оптическом поле вследствие его очень высокой ча- стоты (порядка 1014 сек'1) измеряются не мгновенные значения этих величин, а лишь значения, усредненные по времени в интервале, большом по сравнению с периодом световых колебаний. Более того, обычно имеют дело с естественным светом, где в наблюдаемом (макроскопическом) поле нет преимущественных направлений поляризации. В этом случае первостепенное значение имеет ин- тенсивность I, уже определенная в п. 1.1.4 как средняя повремени энергия, протекающая в единицу времени через единицу площади, содержащую элект- рический и магнитный векторы, т. е. Мы покажем, что интенсивность электромагнитного поля, связанного с про- хождением естественного света через правильно рассчитанные оптические приборы с отверстием средней величины, можно приближенно выразить через одну комплексную скалярную волновую функцию с помощью формулы **) и что функцию U можно вычислить, зная эйконал системы. 8.4.1. Поле изображения, создаваемое монохроматическим осциллятором. Рассмотрим симметричную оптическую систему, освещенную точечным источ- *) Здесь мы в основном пользуемся исследованием |19] **) Вольф [201 показал, что в более общем случае усредненные по времени плотность энергии и пток энергии в поле неполяризованиого квазимонохроматического излучения всегда можно получить из одной комплексной гармонической во времени скалярной^олновой функции.
§ 8.4] ПЕРЕХОД К СКАЛЯРНОЙ ТЕОРИИ S57 ником света, находящимся в Ро (рис. 8.7) и испускающим естественный ква- зимонохроматический свет с частотой ш0- Предположим, что угол наклона лу- чей, прошедших сквозь систему, к оси невелик, скажем, не больше 10° или 15°. Поместим начало декартовой системы координат (хи х2, х3) в точку Ро и будем считать, что ось х3 направлена вдоль главного луча. Можно рассматривать источник как диполь с моментом Q(t), у которого со временем t изменяется и \Щ hW Ц\ Входной зрачок Выходной зрачок Рис. 8.7. Распространение электромагнитной волны через оптическую систему. величина и ориентация. Запишем компоненты Q(t) по трем направлениям в виде интегралов Фурье, т. е. ~ Ш) d( /==!- 2, 3). Так как Qj(t) действительно, комплексные величины q} (со) удовлетворяют соот- ношениям Ы— «)= ?/(«>), B) где звездочка означает комплексное сопряжение. Следовательно, A) можно записать в виде J Я] (и) ехр (— Ш) dm { (/ = 1, 2, 3). C) Каждая компонента Фурье в C) представляет собой монохроматический ос- циллятор Герца с осью вдоль направления Xj. Пусть Iq'j(co) | и б; (со) — амплитуда и фаза <7;-(<»), т. е. 4} (») = I Я) (») I exp [i&j (to)]. D) Так как предполагается, что наш источник излучает квазимонохроматический свет, модуль | qt (со) | для каждого / заметно отличается от нуля только в узком интервале (соо—2^@. <»о+—А»). Предположение о том, что источник испу- скает естественный свет, означает, что функции б;-(ш) быстро и беспорядочно изменяются по частотному диапазону *). . Так как исследуемое поле можно рассматривать как суперпозицию строго монохроматических полей, то удобнее сначала исследовать вклад, вносимый в интенсивность каждым монохроматическим осциллятором Герца, находя- щимся в Р„. Поле такого осциллятора слабо вблизи его оси, и можно принять, что углы, под которыми из Ро видны диаметры входного зрачка, малы; поэтому существенный вклад в поле вносят только компоненты Q(/), а именно Qi(t) и Q2(f). Возьмем в качестве произвольного осциллятора такой, ось которого лежит в плоскости хгхг- *) Более подробное исследование этого вопроса можно найти у Планка J21],
358 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [гл. 8 Пусть Re{<7(co)p0(G>)exp(-- ко/)} E) ¦— момент такого произвольного диполя, а р0 (&>) — единичный вектор в на- правлении оси диполя. Поле этого диполя в точке Т в вакууме на расстоянии от точки Ро, большом по сравнению с длиной волны Я = Bяс/со), определяется (см, B.2.64)) выражениями ' 1 F) г/с)]] }¦ , где Го обозначает единичный радиальный вектор. Пусть W1 — произвольный геометрический волновой фронт в простран- стве предметов на расстоянии от Ра, большом по сравнению с длиной волны. Так как мы предположили, что углы, которые лучи составляют с осью системы, малы, то из F) непосредственно следует, что в любой данный момент векторы Еш и Н„, незначительно изменяются по величине и по направлению по всему фронту Wj. Первая поверхность *) at оказывает па падающее поле двойное действие. Во-первых, амплитуды векторов поля уменьшаются вследствие потерь при отражении и, во-вторых, изменяются направления колебаний. Формулы Фре- неля показывают, что оба эффекта зависят главным образом от величины угла падения. Если угол мал (около 10°), потери на отражение также малы (около 5%), а поворот плоскостей колебаний не превышает нескольких градусов (см. § 1.5). Кроме того, эти эффекты практически одинаковы по всей поверхности 01.. Так как независимые от времени части Е,„ и Нш незначительно изменяются по волновому фронту W-t, они столь же мало изменяются и по преломленному волновому фронту W[, распространяющемуся после at (см. рис. 8.7). Те же рассуждения применимы к обоим нолям и на любом другом волновом фронте, движущемся в пространстве между аг и второй поверхностью о,. В самом деле, в п. 3.1.3 было показано, что в однородной среде направление колебаний вдоль каждого луча остается постоянным и, так как волновые фронты близки к сферическим (с центром в параксиальном изображении точки Ро первой по- верхностью), то амплитуды уменьшаются почти в отношении параксиальных радиусов кривизны волновых фронтов. Повторяя те же рассуждения, мы в конце концов перейдем к волновому фронту W, проходящему через центр С выходного зрачка, и снова отметим, что независимые от времени части Еш и Нш не изменяются заметным образом по этому волновому фронту. Такой результат позволяет сразу написать прибли- женное математическое выражение для векторов поля в области изображения. Пусть начало прямоугольной системы декартовых координат (х, у, г) на- ходится в параксиальном изображении Рг точки Ро, а ось г направлена вдоль СРг. Поле во всех точках отверстия, за исключением точек, находящихся в непосредственной близости от его края, можно приближенно представить в виде выражений (см. гл. 3) Еш(*. У, z, t)= ) Н„,(х, у, г, 0= | 1$\,,(*, у, г)]}], J *) Здесь предполагается, что о1 — преломляющая поверхность. Если ах — зеркало, то необходимо только небольшое изменение наших рассуждений, что следует из рассмотрения фор- мул Френеля,
•§ 8.4] ПЕРЕХОД К СКАЛЯРНОЙ ТЕОРИИ 359 которые мы вправе рассматривать как обобщение F). Здесь SPa (x, у, г) — длина оптического пути от точки предмета до точки (х, у, г), а еш (х, у, г) и Иш (х, у, г) — взаимно ортогональные вещественные векторы *). В однородной немагнитной среде с показателем преломления п эти векторы удовлетворяют ¦соотношению (см. уравнения C.1.19) и C.1.20)) |hJ = »l<U- (8) Рассмотрим опорную сферу S с центром в Ри проходящую через центр С выходного зрачка, и обозначим ее радиус СРг через R. Практически расстоя- ние между S и W нигде не превышает нескольких десятков длин волн. Следо- вательно, па 5, так же как и на W, векторные амплитуды еш и hm практически постоянны по величине и по направлению. Пусть Р (X, Y, Z) — точка в области изображений, где определяется ин- тенсивность. Если углы, под которыми из Р видны диаметры выходного зрач- ка, малы, то, используя формулу Кирхгофа с теми же допущениями, как и в предыдущем параграфе, и интегрируя выражение G) по части 5' поверхности 5, приблизительно покрывающей выходной зрачок, найдем, пренебрегая из- менением коэффициента наклона на 5', (9) -?-to,(x', у', z' Здесь s— расстояние от произвольнойточки {х1, у', г') на опорной сфере до точки Р. Так как векторы еш (х', у', г') и Ьш (х', у', г') не меняются заметно по по- верхности интегрирования, можно заменить их значениями еш @, 0,— R) и Ьш @, 0, — R), которые они принимают в центре С выходного зрачка. Тогда, поскольку эти векторы взаимно ортогональны и удовлетворяют (8), можно принять, если вдобавок считать п — 1, что еш@, 0, — 7?)=а((й)а((оI \ МО, 0, — /?)=а(ц,)р(ш), / где a (to) и Р(ю)— ортогональнце единичные векторы, лежащие в плоскости перпендикулярной к направлению г. Соотношение (9) принимает вид ЕШ(Х, Y, Z, 0 = ^e^ S X ехрГ(^-[^ш(г', у', z') + s])dS, где ?/„ — скалярная волновая функция вида C/e(X,y,Z)_=^yi-exp [t± [&a(x',y',z') + s]]dS. A2) Вычисляя вектор Пойнтинга S-m = с [ Еш Х- Нш 1/4я и усредняя по вре- мени, получим непосредственно из A1), что интенсивность в точке Р(Х, Y, Z), обусловленная одиночным диполем (определяемым формулой E)), помещенным *) Вещественный характер еш и h^, следует из того обстоятельства, что в F) соответствую- щие векторы вещественны (линейная поляризация) и что поляризация остается линейной при каждом отражении. Кроме того, между любыми двумя последовательными поверхностями со- стояние поляризации постоянно вдоль каждого луча, как это показано в п. 3.1.3.
360 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 в Ро, пропорциональна квадрату модуля скалярной волновой функции UV,(X,Y, Z). Однако, чтобы использование одной скалярной волновий функции для расчета интенсивности было оправдано, усреднение по времени следует выполнять не для одной монохроматической компоненты, а для всего поля. 8.4.2. Полное папе изображения. Мы видели, что вклад каждой частотной компоненты в полное поле можно рассматривать как результат действия двух диполей, помещенных в Ро, с исями, направленными вдоль хг и х,. Таким обра- зом, из A) и A1) следует, что если мы с помощью соотношений типа B) опреде- лим также вклад от отрицательных частот, то полное поле в области изобра- жения приближенно можно представить в виде со + аа(со)а2((в)ехр [iSa(a>)]] exp(— ia>t)d<o, Н(Х, Y, Z, *) = —4=- \ ^-Ulo(X,Y,Z)[a1((o)pi(m)exp[i81(a>)}+ I — <х> ! + а.г (со) р, (со) ехр [762 (со)] ] ехр (— ia>t) da>. ) Здесь индексы 1 и 2 относятся к вкладам осцилляторов, оси которых направ- лены вдоль хх и х%. Для того чтобы определить интенсивность в области изображений, напи- шем отдельно выражения для каждой декартовой компоненты векторов Е и Н. Пусть 0! (со) и д2 (м) — углы, которые единичные векторы га, (со) и га2 (со) состав- ляют с осью х в пространстве изображений. Так как а,_(а), рх(оэ) и сс2(ь>), Рг (о>) — вещественные взаимно ортогональные векторы, лежащие в плоско- сти, перпендикулярной к оси г, то в соответствии с A3) получим, что компо- ненты векторов Е в Н приближенно ранны *) A4) f>F,Z)g(»)exp(—, E,(X>Y,Z,t)=Hz(X,Y,ZJ) = 0, где / (») = ^Г [<h («) cos S, (to) exp [tS, (a>)] + a2 (m) cos 02 (со) ехр [?8а (со)]], 1 g(») = 7F [«i (<») sin eit(o>) exp [i6! (со)] +д, (со) sin ва (<а) exp [F2 (со)]]. J J Из П4) следует, что величину вектора Пойнтинга S = c[E X Н]/4я приближенно можно представить в виде Теперь нужно определить среднее по времени этой величины **). *) Было бы неправильно делать из A4) вывод, что в области изображения наппавление потока энергии обязательно параллельно г. Относительные ошибки в A4) могут существенно повлиять на определение направления в областях, где интенсивность мала, например в обла- стях вблизи Teivinuv колец в картине Эйри. а Использованнь.н здесь метод вычисления среднего предложен Борном и Йор- даном 122].
§ 8.4] ПЕРЕХОД К СКАЛЯРНОЙ ТЕОРИИ 361 Учитывая требование сходимости, мы предполагаем, что поле излучения существуег только в промежутке времени между 1 = — Т и t=T, где Т^-> 2я/оо0. Теперь нетрудно перейти к пределу Т^-со. В силу обратной теоремы Фурье лолучим из A4) Ex{X,Y,Z,t)exp(tot)dt. A7) J Аналогичные выражения можно написать и для Еу, Н^ в Ну. Тогда в соответ- ствии с A4) имеем <Я?> = ^r j ?»Л = jjr J Ex dt y=r J ?/J (со) ехр (- /а>0 dec, A8) -Т -Т -оо или, меняя порядок интегрирования и учитывая A7), + 00 Т +«, -да -Г -ao так как U_u>~Ua, /(—ш)=/*(ш)- Аналогично <». B0) Следовательно, интенсивность /(х, ^, г), определенная как средняя по вре- мени величина вектора Пойнтинга, равна, согласно A6), A9) и B0), Если величина | Дю | достаточно мала, то | Uu, | практически не зависит от а> в диапазоне эффективных частот, и \(/ш\ можно заменить на | f/ulo | и вынеста за знак интеграла. Оставшийся член rfa), B2) не зависящий от X, Y и Z, также не должен зависеть от Т (неявно содержа- щегося в / и g на основании A7)), если наблюдается стационарное явление. Поэтому величина B2) постоянна (допустим равна С), и окончательно можно- написать выражение для интенсивности в виде HX,Y,Z)=C\Ua.(X,YtZ)\K B3) Постоянная С сложным образом зависит от характеристик источника и опти- ческого прибора. Однако в обычных условиях интерес представляет только от- носительное распределение интенсивности, а не ее абсолютная величина. В этом случае интенсивность измеряется просто величиной | t/,U|) p. Таким об- разом, комплексная скалярная функция A2) позволяет вычислять распреде- ление интенсивности в изображении, полученном с источником естественного света с помощью оптической системы при умеренной числовой апертуре,
362 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [гл. 8 § 8.5. Дифракция Фраунгофера на отверстиях разной формы Исследуем теперь картину дифракции Фраунгофера от отверстий разной формы. • v ' 8.5.1. Прямоугольное отверстие и щель. Рассмотрим сначала прямо- угольное отверстие со сторонами 2а и 2Ъ. Если начало координат О находится в центре прямоугольника, а оси 01 и On парал- лельны его сторонам (рис. 8 8), то дифракцион- ный интеграл Фраунгофера (8.3.36) принимает вид а Ь ' is U {Р) = С \ j ехр [—ik(p§ + qi\)] d\dx\ = -а-Ь а Ь ехр(—ikqx\)dr[. '2Ъ = с\ ехр(— ikpl)dl Рис. 8.8. Прямоугольное отвер- Тогда ¦ = - ^ [ ехр (- ikpa)-ехр (Игра)] = 2 ^ Такой же вид имеет и второй интеграл. Следовательно, интенсивность записы- вается в виде /sin kpa Y f sin kqb\* r m — t I —;—Г— I /g, ^1/ где, согласно (8.3.44), /„ = С2?>2 = EDIk2 — интенсивность в центре картины, Е — полная энергия, падающая на отверстие, а D=4ab—площадь прямоугольника. Таблица 8.1 *'° Пять первых максимумов функции 1 2 3 4 0 ,430л = 4, ,459л = 7, ,470л =10 ,47Sjt=14 493 725 ,90 ,07 0 0 0 0 / Sin X\2 \~ ) 1 ,04718 ,01694 ,00834 ,00503 График функции у ~ (s'mx/xI приведен на рис. 8.9. Она имеет главный максимум у = 1 при х = 0 2 и минимумы, равные нулю, при х — ±п, ± 2л, О 1 2к Sit a: Рис 8 9 Дифракция Фраун- гофера на прямоугольном от- верстии. График функции у— [ ] . ±3л, ... Зги минимумы разделяют вторичные максимумы, положение которых определяется кор- нями уравнения tgx—х — 0 (см. табл. 8.1). Зна- чения корней асимптотически приближаются к вели- чинам х—Bт-\- 1)я/2, где т—нечетное целое число. ч * J Очевидно, что интенсивность 1(Р) равна нулю вдоль двух рядов линий, параллельных сторонам прямоугольника. Положение этих линий определя- ется из соотношений kpa— ± ил, kpb—dzvn (ы, и—1, 2, 3, ...), B)
§ 8.5] ДИФРАКЦИЯ ФРАУНГОФЕРА НА ОТВЕРСТИЯХ РАЗНОЙ ФОРМЫ 363 или, так как р = j = m— mOt k = 2я/Я, - ^o— dz й^; ¦ tft ffto ^ dn or • C) Внутри каждого прямоугольника, образованного последовательными парами темных полос, интенсивности достигают максимумов, которые, однако, состав- ляют лишь малую часчь интенсивности центрального максимума и быстро уменьшаются по мере удаления от центра (рис. 8.10). Следует отме- тить, что большему размеру отвер- стия соответствуют меньшие эф- фективные размеры дифракционной картины. Переход от элементарней диф- ракционной картины,образованной когерентным светом точечного ис- точника, к дифракционной карти- не, обусловленной светом протя- женного источника, можно осущест- вить путем интегрирования. В слу- чае когерентного источника инте- грируются комплексные амплиту- ды, в случае же некогерентного источника интегрируются интен- сивности. Дифракционную картину, П О 1П I/ Д. УК т Рис. 8.10. Картина дифракции ФраунпхЬеРа на полученную с частично когерент- прямоугольном отверстии 8x7 мм(по ХГшну. ным Источником, можно найти та- Тейлору и Томпсону). КИМ Же Путем, еСЛИ при Иптегриро- Увеличение ЕОх, жсл-ая линия р^утч % = 5П<H А. и ними ЛПТО/-ГК епппвпапит „,„».. Для выделения слабых вторичных максимумов цен- ВЗНИИ учеСГЬ корреляцию, СуЩеСТ- тральная часть переэкагоиирешаиа? вующую менаду излучением от раз- личных точек источника (см. гл. 10). Особенно важен случай дифракции некогерентного света от линейного источ- ника (например, светящейся проволоки) па щели, параллельной источнику. Для простоты предположим, что как светящаяся проволока, так и щель бес- конечно длинны, и допустим, что ось у параллельна источнику. Так как q = т—¦ —-Шо, где т„ определяет положение точечного источника, то интенсивность /', обусловленная линейным источником, получается интегрированием A) по q, т. е. Как" известно (см., например, [23]), in A3 и, следовательно, где г, /sinkpa\ 'dt = П, 2b 2a? к ¦ D) E) Дифракционная картина снова описывается функцией (sin xlxJ и состоит из последовательности светлых а темных понос, параллельных линейному источ- нику и щели. Го — постоянная интенсивность в центре р = 0.
364 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. S 8.5.2. Круглое отверстие. Аналогичным образом можно исследовать дифракцию Фраунгофера на круглом отверстии. Для этого целесообразно ис- пользовать полярные координаты вместо прямоугольных. Пусть (р, G) —> полярные координаты произвольной точки отверстия, т. е. pcos0=g, psin0 = ti, F) и пусть (да, г|з) — координаты точки Р в дифракционной картине, относящейся к геометрическому изображению источника, т. е. wcosty — p, ш> sin 1|> = <?. G) Из определения р я q следует, что w = V Р2 + <72 равно синусу угла между на- правлением (р, q) и центральным направлением р = q = Q. В таком случае, если а—радиус круглого отверстия, то дифракционный интеграл (8.3.3G) принимает вид а 2п U{P) = C\ \ ехр [— ikpw cos (9—Щ р dp rfO. (8) о о Воспользуемся теперь хорошо известным интегральным представлением бесселевых функций *) /„ (г) 2л ^ С ехр [ix cos а] ехр (та) da = /„ (л:). (9) о Тогда уравнение (8) сведется к а U(P) = 2nC')J0(kpw)pdp. A0) 6 Существует также хорошо известное рекуррентное соотношение (см., напри- мер, [24] или [26]) |{^W,,+1 (*)} = *»«./„(*), A1) дающее после интегрирования для п — 0 <jjx'Jo(x')dx' = xJ1(x). A2) о Из A0) и A2) следует, что ЩР) = СОрв], A3) где ?>=па3- Следовательно, интенсивность определяется выражением 0, A4) где в соответствии с (8.3.44) /0 = С:Л2 = EDIX*. Эта широко известная формула в несколько ином виде впервые была получена Эйри [27]**). Распределение интенсивности в окрестности геометрического изображения описывается функцией у — BJr (x)lxJ, график которой приведен на рис. 8.11. Она имеет главный максимум у = 1 при х = 0 и с увеличением х осцил- лирует с постепенным уменьшением амплитуды подобно функции (sin х/х)'', *) См., например, [24] или [25]. **) Почти одновременно с Эйри, Шверд нашел приближенное решение, заменив кружок правильным многоугольником со 180 сторонами. Векторное рассмотрение дифракции сходящейся сферической волны на круглом отверстии с учетом поляризационных особенностей поля было опубликовано в [28].
§ 8.5) ДИФРАКЦИЯ ФРАУНГОФЕРА НА ОТВЕРСТИЯ» РАЗНОЙ ФОРМЫ 365 рассмотренной в п. 8.5.1. Интенсивность равна нулю (минимум) прн значе- ниях х, определяемых Jt (х) = 0. Минимумы уже не строго эквидистантны (см. табл. 8.2). Т а б л и и я 8 2 В Несколько первых максимумов и минимумов функции • У — 1 1 2 2 3 3 X 0 ,220я — 3, ,635я = 5 ,233ft = 7, ,679я = 8, ,238л, — 1С ,699я=11 832 136 016 417 1174 ,620 Г- 1 0 0. 0 0, 0 0, X J 0175 0042 0016 Максимум Минимум Максимум Минимум Максимум Минимум Максимум 0,8 -\ 0,7¦ 0,6 0,5 0,3 0,2 0,1 \ \ \ Г \ \ — Положения вторичных максимумов опре- деляются значениями х, удовлетворяющими уравнению или, пользуясь формулой *) (аналогичной (И)) О 123456780Я Рис. 8.П. Дифракция Фраунго- фера на круглом отверстии. График функции V Рис. 8.12. Картина дифракции Фраунгофера на круглом отверстии {картина Эйри) диаметром 6 мм (по Липсону, Тейлору и Томпсону). Увеличение 50х, желтая линия ртути ?и = 5790 Л Для выделения слабых вторичных максимумов центральная часть переэкспонирована. A5) — корнями уравнения J.2(x) =0. При увели- чении х расстояния между последовательны- ми минимумами или последовательными мак- симумами приближаются к я, как и в пре- дыдущем случае. Найденные результаты показывают, что наблюдаемая картина имеет вид светлого дис- ка с центром в геометрическом изображении источника p — q--O, окруженного светлыми и темными кольцами (рис. 8.11 и 8.12). Интен- сивность светлых колец быстро уменьшается с увеличением радиуса и обычно только одно или два первых кольца достаточно ярки, чтобы их можно было наблюдать невооруженным глазом. Из табл. 8.2 следует, что, поскольку х = 2nawi\, радиусы темных полос равны OJ=K'pi+?'=0,610-|, 1,11б|, 1,61V, ... A6) Расстояние между двумя соседними кольцами асимптотически приближается к величине %>2а. Здесь мы снова видим, что эффективные размеры дифракционной кар- тины обратно пропорциональны линейным размерам отверстия. *) См., например, [24] и [26].
366 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ 8 Представляет также интерес определить, какая часть полной падающей энергии приходится на центральное пятно дифракционной картины Обозна- чая через I(ffi'[>) ту часть полной энергии, которая приходится на кружок ра- диуса w0 в плоскости изображения с центром в геометрическом изображении, получим " "'"' ""¦'"" " ' ' 'dx, A7) iKL 11 0 0 Учитывая уравнение A5) для n = 0 и умножая на Ji(x), получим ~ ""о •'1 (х> ~fa •'г W = g" 5jc I i° Поскольку Уо(О) = 1, Л@)=0, выражение A7) сводится к L{wo)=l—Jl(kmo) — Jl(kaw0). A8) Эта формула была получена Рэлеем [29, 30] График функции L (а>0) показан на рис. 8 13. Для темных колец Ji{kawt) = 0, и следовательно, часть полной энергии вне любого темного кольца про- сто равна Jl(kaw0). Для первого, вто- рого и третьего темных колец Jl (kawu) равно соответственно 0,162, 0,090 и 0,062. Таким образом, более 90% света концентрируется внутри круга, ограни- ченного вторым темным кольцом. 8.5.3. Отверстия другой фомы. Ди- фракцию Фраунгофера на отверстиях другой формы можно изучать аналогич- ным образом. Вычисления значительно упроща'отся, если можно выбрать та- кие криволинейные координаты, чтобы одна из координатных осей совпадала с краем отверстия Мы не собираемся подробно рассматривать здесь другие случаи дифракции *), но выведем полез- ную теорему, касающуюся видоизмене- ния дифракционной картины при симмет- ричном расширении (или сжатии) отверстия в каком-нибудь одном направлении и, кроме того, рассмотрим дифракцию Фраунгофера на экране с большим чис- лом отверстий одинакового размера и формы Пусть, Ал и Аъ — два отверстия, причем в некотором направлении размеры itB[i раз больше, чем Лг. Для дифракции Фраунгофера на Ai имеем Рис 8 13 График функции 1— j\ (х) — —J\ (x), определяющей часть полной энер- гии, приходящейся на кружок заданного радиуса в картине дифракции Фраунгофе- ра на круглом отверстии Ui(P> q)=C\\ exp [— tk (pl + qr\)] dldr\. At Аналогично для дифракции Фраунгофера на Аг находим А, Заменяя здесь переменные интегрирования {%,, ц) на (?,', г\'), где Ч' = г|, 1 A9) B0> B1) *) Дифракция Фраунгофера на кольцеобразном отверстии кратко рассматривается в cbhsh с разрешающей силой в п 862 Фотографии каргин дифракции Фраунгофера на отверстиях разной формы можио найти в [31]. Фотографии дифракционных картин Френеля были опубликованы в [32].
.51 ДИФРАКЦИЯ ФРАУНГОФЕРА НА ОТВЕРСТИЯХ РАЗНОЙ ФОРМЫ 367 получим Ut (p, q) = ехр [- i Л\' dv[ = \ Я). B2)- Отсюда следует, что если отверстие симметрично расширяется в каком-либо направлении в \i раз, то дифракционная картина Фраунгофера сжимается в том же направлении в ц, раз, а интенсивность в некоторой точке новой картины становится в а2 раз больше интенсивности в соответствующей mow се первона- чальной картины. Используя этот ре- зультат, можно, например, сразу найти картину дифракции Фраунгофера от эл- липтического отверстия или отверстия в виде параллелограмма соответственно из картины дифракции от круга или прямоугольника. На рис. 8.14 показан случай дифракции на эллиптическом отверстии. Рассмотрим теперь важный случай экрана, состоящего из большого числа одинаковых и одинаково ориентиро- ванных отверстий (согласно принципу Отверстие Дифракцион- ная картина Рис. 8.14. Сравнение дифракции Фраун- гофера на круглом и эллиптическом от- верстиях. Бабине найденный результат будет также применим к дополнительному рас- положению препятствий). Пусть Оь 02, . . . , 0„ — ряд точек, одинаково рас- положенных по одной в каждом отверстии, и пусть их координаты относитель- но фиксированных осей, находящихся в плоскости отверстия, равны (?,, ) (I Фраунгофера можно записать в виде U{j>, <?) = < Тогда распределение света в дифракционной картине ехр [- ifc 11 [- ik (pi' +qv!))di'dvf, B3) где интегрирование ведется по любому отверстию Л из их совокупности. Ин- теграл выражает действие одиночного отверстия, тогда как сумма — супер- позицию когерентных дифракционных картин. Если /@> (р, q) —¦ распределе- ние интенсивности, обусловленное дифракцией на одиночном отверстии, то, согласно B3), полная интенсивность равна *Ь)])- B4) п т Простейший случай с двумя отверстиями рассмотрен в § 7.2 в связи с тео- рией интерференции. Но там мы пренебрегали зависимостью /@) от р и q (т. е. влиянием дифракции на каждом отверстии) и рассматривали только эффект ' суперпозиции. Легко показать, что прежний результат G.2.17) находится в согласии с соотношением B4). При N = 2 оно сводится к / = /• {2 + ехр {-ik [р (Ь-У + q Оъ-m)]} + где Рассмотрим теперь действие большого числа отверстий. Покажем, что ре- зультаты оадкутся совершенно разными в зависимости от того, правильно ли распределены отверстия по 'экрану или беспорядочно.
368 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 При беспорядочном расположении отверстий члены с тфп в двойной сумме быстро меняются в интервале от +1 до —1 по мере того, как ряд при- нимают различные значения, и сумма таких членов не достигает конечного среднего значения. Каждый член с т— п. равен единице. Поэтому, если исключить локальные флуктуации *), полная интенсивность в N раз больше интенсивности света, дифрагировавшего на одном отверстии, т. е. 1(р, q)&Nrm0>, q). B5) Дифракционные эффекты такого рода или чаще встречающиеся дополнитель- ные эффекты (в смысле принципа Бабнне) легко наблюдаются, если, например, стеклянную пластинку, посыпанную порошком ликоподия или другим порош- ком с частицами одинакового размера и формы, осветить пучком света от уда- денного источника. Кусок тонкой фольги, проколотый в случайно выбранных Рис. 8.15. Картины дифракции Фраупгофера от 56 одинаковых и одинаково ориентированных отверстий в плоском экране (по Липсону, Тейлору и Томпсону) « — беспорядочная ориентировка б —упорядоченная ориентировка Форма и ориентировка отверстий показаны в нижней части рисунка Освещение желтой линией ртути ^—5730 Д. местах булавкой, также действует как дифракционный экран рассмотренного выше типа. Совершенно иной результат получается при регулярном расположении отверстий. Тогда при некоторых значениях р и q члены с тфп могут внести заметный вклад в интенсивность. Например, если точки 0п расположены так, что при определенных значениях р л q фазы всех членов с тфп кратны точно 2л, то их сумма равна N (N— 1) и при больших N становится порядка N1. Такое большое увеличение интенсивности в некоторых направлениях, ясно видимое на рис. 8.15, имеет, как мы увидим ниже, важное практическое зна- чение. •) Флуктуации несколько другого рода возникают, если отверстия имеют не совсем оди- наковую форму, но расположены регулярно или согласно какому-то статистическому закону {см. [33])- Аналогичные эффекты наблюдаются при дифракции рентгеновских лучей в жид- костях (см. [34]).
¦§ 8.6] ДИФРАКЦИЯ ФРАУНГОФЕРА В ОПТИЧЕСКИХ ПРИВОРАХ 3Q9 § 8.6. Дифракция Фраун гофера в оптических приборах 8.6.1. Дифракционные решетки, а) Принцип действия дифракционной решетки. Дифракционной решеткой можно назвать любое устройство, обеспе- чивающее периодическую модуляцию падающей волны по амплитуде или фазе, или одновременно по обоим этим параметрам. Любую данную решетку можно охарактеризовать ее функцией пропу- скания, определение которой мы сейчас ? 1A т) дадим. / Пусть прозрачный или полупрозрач- ный предмет (не обязательно периодический) закрывает часть воображаемой коорди- натной плоскости \\\ и освещается пло- ской монохроматической волной, направле- ние падения которой определяется косинуса- ми 1а и/По. На рис. 8.1G, иллюстрирующем Рис' 8-16- К определению функции это расположение, ось ц перпендикулярна к пропускания, плоскости рисунка. В отсутствие предмета возмущение в плоскости |т] описывается функцией Vt>(?,, ч\) ~ Асхр {ik(lnc,-'r "l"'n«il)}i множитель ехр (—iwt), как обычно, здесь опущен. В присутствии предмета возмущение изменяется и описывается некоторой другой функцией, например К(§, rj). Тогда функция пропускания предмета определяется соотно- шением Вообще говоря, функция пропускания F зависит не только от ?и г\, но и от направления A0, т0) освещения; кроме того, в общем случае функции F ком- плексна, так как при прохождении сквозь предмет свет может менять и ам- плитуду, и фазу. В частности, когда предмет изменяет только амплитуду па- дающей волны, не изменяя ее фазу (т. е. если argF^sO), мы говорим об ам- плитудном объекте, если же он изменяет фазу, а не амплитуду (т. е. \F\ = 1), мы говорим о фазовом объекте. Если изучается свет, отраженный предметом, а не прошедший сквозь него, то рациональнее говорить о функции отражения, .определяемой так же, как и функция пропускания, но тогда координатная плоскость помещается с той же стороны предмета, с которой падает свет. Отношение |V'K0| практически равно единице для всех точек, находя- щихся вне геометрической тени (граница ее па рис. 8.16 обозначена точками А и В), отбрасываемой предметом. Закрывая область, лежащую за пределами тени, непрозрачным экраном, мы получим устройство, действующее как диф- ракционное отверстие Л с неоднородной функцией зрачка (см. (8.3.39)). Пусть линейные размеры >1 велики по сравнению с длиной волны, и пусть функция F остается в достаточной мере постоянной в областях, размеры которых срав- нимы с длиной волны света; тогда дифракционная формула (8.3.23) остается справедливой при тех же условиях, что и раньше, если подынтегральное выра- жение дифракционного интеграла умножено на F. Рассмотрим одномерную решетку, состоящую из /V параллельных штри- хов произвольного профиля, нанесенных на одну из поверхностей плоскопа- раллсльной стеклянной пластинки. Пусть плоскость |т] совпадает с плоской поверхностью пластинки, т) — направление штрихов, ad —- период решетки в направлении | (рис. 8.17). Предположим, что направление падающей на решетку волны лежит в плоскости рисунка и образует угол 90 с осью ОХ,, и пусть 0 — угол между осью 01 и линией, соединяющей очень удаленную точку наблюдения Р 24 М. boon. Э. Вольф
370 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. S с решеткой. Как и раньше, положим /0 = sin 90, / = sin 0, р = I—/0 = sin в— — sin 60. В таком случае из (8.5.23) сразу же получаем выражение для комп- лексной амплитуды в Р, если подынтегральное выражение умножается на Рис. 8.17. К теории дифракционной решетки. функцию пропускания F одного периодического элемента. Полагая q = 0 и ln=nd, т]„ = 0 (га = 0, 1, ..., N—\), B> находим U (р) = с/<°> (р) 2^ exp (—Urn dp) = ?/<•> (p) V-2 п=0 C) где *) Следовательно, /7 «•> (р) = С J F (?) exp (—tA Л __ A—ехр(—INkdp)) A—exp(i.YArfp)), „t где /(w (p) =|ty@) (p)\\ Если ввести функцию sinx F) то формула E) для интенсивности примет вид l(p)=H[N. Ц?- (р). Eа> Прежде чем обсуждать содержание этой основной формулы, отметим, что, со- гласно C), распределение интенсивности будет таким же, как и распределение, обу- словленное системой вторичных когерен- тных источников; каждый из них харак- теризуется одной и той же амплитудной функцией \Um (р)\, а их фазы отличаются на величину, кратную kdp. Чтобы понять значение этой разности фаз, рассмотрим две Рис. 8.18. К теории дифракционной соответствующие точки А и В в соседних решетки. J , Л ,п, ^ . штрихах решетки (рис. 8.18). 1ак как влия- ние решетки заключается в периодической! воздействии на падающую волну, то разность хода между световыми лучами, приходящими в А я В, такая же, как и в отсутствие решетки, т. е. равна АК = *) Так как F зависит от /0, то величины U1-0^ и /@* зависят и от I и от /0, а не только от разности /—/0. Поскольку пас интересуют только эффекты, возникающие при фиксированном направлении падения света, то мы можем считать @ постоянным и сохранить предыдущие обозначения.
§ 8.6] ДИФРАКЦИЯ ФРАУНГОФЕРА В ОПТИЧЕСКИХ ПРИБОРАХ 371 =dsin0o. Здесь точка К — основание перпендикуляра, опушенного из В на луч, падающий в А. Далее путь светового луча, выходящего из В в направ- лении 6, превышает путь луча, выходящего из Л в том же направлении, на BL--d sin 8; здесь L — основание перпендикуляра, опущенного из А на луч, дифрагировавший в В в направлении 8. Следовательно, полная разность хода между светом, приходящим в удаленную точку наблюдения о г соответствующих точек двух соседних штрихов, равна BL—AK=*d (sine — sin Q0) = G) а соответствующая разность фаз равна 2ndp/X=kdp. Формула Eа) выражает I (р) в виде произведения двух функций. Одна из них /10> определяет действие одного периода решетки, другая Н отражает эффект интерференции света от раз- личных периодов решетки. Функция Н (Л/', х) имеет максимумы величи- ной N2 во всех точках, в которых исчезает знаменатель sin2x, т. е. в тех точках, где х равно нулю или целому кратному п. Следова- тельно, функция И (N, kdp/2) имеет максимумы когда величиной г 0 ^ \ / (яг-О, ±1, ±2, ...), Целое число т, согласно G), пред- ставляет собой разность хода (в длинах волн) между светом, диф- рагирующим в направлении мак- симумов и распространяющимся от соответствующих точек дв^х соседних штрихов. В согласии с нашим прежним определением (см. п. 7.3.1) назовем т поряд- ком интерференции. В промежут- ках между этими главными мак- симумами находятся слабые вто- ричные максимумы (рис. 8.19, а). Когда N велико, первый вторич- ный максимум составляет лишь не- сколько процентов от главного мак- симума. Максимумы разделяются точками с нулевой интенсивно- стью при х =kdpl2 — ± nn'N, т. е. расположены в направлениях, определяемых соотношениями р = sine—sinе„=|^ (« = ±1, ±2, ...); Рис. 8.19. Графики интерференционной функ- ции и функции интенсивности. а) — нормированная интерференционная функция U (ЛГ, ft rfp/2)~ t ¦ I , о — нормиро- ванная функция интенсивности в случав щелн Г"п <lisp/l)~\2 /(°)(р)- —г—-р,— I : в - нормированная функ- ция интенсивности из /У одннак случае решетки, состоящей нидиеташных параллельные Показана только область р ~2> 0 wv.\t кривые сим- метричны относительно вертикальной оси р=0. (9) случай, когда nlN равно целому числу, исключается. Функция Iю (р) зависит от формы штрихов. Предположим, что она имеет главный максимум в некотором направлении р — р' и что с обеих сторон мак- симума она спадает медленно по сравнению с изменением Н, В таком случае 24*
372 • элементы теории дифракции [гл. 8 I (р) имеет общий вид интерференционной функции Я, но модулированной» функцией /"". Следовательно, у I(р) также существуют достаточно острые максимумы в направлении, близком к р= mX/d. Так как эти направления (исключая случай т = 0) зависят от длины волны, то очевидно, что решетка разлагает пучок немонохроматического света в спектры нескольких порядков. Для иллюстраций изложенного выше рассмотрим решетку, состоящую из ряда длинных эквидистантных щелей (рис. 8.20) шириной s и длиной L Рис. 8.20. Простая линейная решетка. в непрозрачном экране. Если решетка освещается очень удаленным линейным источником, расположенным параллельно щелям, то интенсивность /1о) опре- деляется выражением (8.5.4) (с 2а — s, 2b = L), и мы получим I (п) = — (sln(NkdPV)Y /sin (fop/2) у На ртяс. 8.19 приведены кривые, соответствующие обоим множителям в A0) и их произведению. Последний множитель в A0), представляющий действие одиночной щели, имеет главный максимум при р — 0 и минимумы при fop/2 — = тл, т. е. при p = nX/s (n = ±l, ±2, ...) A1) разделенные слабыми вторичными максимумами. .Если Us^-X/d, т. е. если ширина каждой щели нала по сравнению с d, то в дополнение к главному максимуму при р = 0 функция I(р) имеет с обеих сторон от него ряд резких, но постепенно убывающих максимумов, расположенных в направлениях, определяемых (8). Возвращаясь к общему случаю, мы видим, что при очень малой ширине каждого штриха — порядка длины волны (практически это часто бывает), выведенная в приближении Кирхгофа формула D) не будет справедлива. В та- ких случаях для установления детального распределения интенсивности тре- буется более тонкое исследование. Однако мы вправе ожидать, что основные качественные характеристики, указанные нашей элементарной теорией, а именно существование резких максимумов, положение которых по существу определяется интерференционной функцией Н, остаются правильными даже при очень юлкгх штрихах; конечно, при этом функция интенсивности для единичного периода должна мало изменяться в интервале порядка Ар — Kid. Выясним теперь, какова разрешающая сила дифракционной решетки. Рес- стояние между главным максимумом порядка от и соседним минимумом опре- делчется, согласно (9), как . ар==ш- (!2) Если длина ьолаы изменится на величину ДХ, максимум порядка m сместится, согласно (8), па величину . . Предположим, что линии с длинами волн ^, ±-g-Д^. начинают разрешаться, стр. A4) если максимум одной длины волны совпадает с минимумом другой (с.м. стр. 307); тогда для предела разрешения в порядке m получим &р — А'р, т. е.
§ 3.6J ДИФРАКЦИЯ ФРАУНГОФЕРА В ОПТИЧЕСКИХ ПРИБОРАХ 373 Следовательно, разрешающая сила равна произведению номера порядка т на число штрихов N. Для порядка т., согласно (8), u((sin9 — sin90) = тХ, и раз- решающую силу можно записать в виде _Х_ _,.Vrf|sin9 — sine0 | В соответствии с G) это означает, что разрешающая сила равна числу длин волн, укладывающихся в разность хода двух лучей, дифрагировавших от краев решетки (расстояние между ними составляет Nd) в направлении 9. Следует отмстить, что поскольку | sin В—sin й„ | не может превысить 2, разрешающая сила ре- шетки шириной w не может быть больше 2w!k. Для иллюстрации формулы A4) определим число штрихов, которое должна иметь решетка, чтобы разрешить две линии, отстоящие др>г от друга на 0,1 Л и лежащие в центре видимой области спектра. В этом случае Я,»5500 А, ДЯ = = 10 А, и при наблюдении во втором порядке (т = 2), согласно A4), получим JVS5 5,5- 10V2-10 — 27 500. Таким образом, решетка должна иметь по крайней мере 27 500 штрихов. Для сравнения рассмотрим разрешающих) силу призмы в положении наи- меньшего отклонения, освещаемую линейным источником, параллельным реб- ру А (щель спектрографа). Пучок параллельных лучей, падающий на призму, дифрагирует на прямоугольнике шириной /,= /2 (см. рис. 4.28). Согласно (8.5.2) первый минимум интенсивности находится на угловом расстоянии (предполагается, что оно мало) р = Х/1, A5) от геометрического изображения щели. Изменение угловой дисперсии, соответ- ствующее изменению длины волны на величину АХ, согласно D.7.36), равно Ае = j- -7г АХ, A6) где t— наибольшая толщина стекла, сквозь которую проходит один из край- них лучей, а п — показатель преломления материала призмы. Па пределе разрешения р я» Де, и поэтому разрешающая сила определяется соотношением X , dn\ Последнее соотношение показывает, что при данном сорте стекла разрешающая сила призмы зависит только от наибольшей толщины стекла *), которую лучи проходят в призме; в частности, разрешающая сила не зависит от угла призмы. Например, пусть длина основания призмы равна 5 см и сделана она из тяжелого флинта с dtildk —- 1000см'1 на длине волны X — 5500Л. Если работает вся приз- ма, то, согласно A7), в средней части видимой области спектра разрешаются линии,онаходящисся на расстоянии, не меньшем АХ, где к -—5,5-10"° см/5,10J = j= 1,1 А. Следовательно, у такой призмы довольно больших размеров разре- шающая сила в десять раз меньше, чем у решетки с 27 500 штрихами, о ко- торой мы говорили выше. До сих пор мы рассматривали только одномерную решетку, но наш анализ легко распространить на дву- и трехмерную периодические структуры, вызы- вающие дифракцию. Двумерные решетки (называемые пересекающимися) не нашли практического применения, хотя действие подобных решеток наблю- дается часто, например при рассматривании яркого источника света скеозь тонкую ткань (хотя бы носовой платок). Теория же трехмерных решеток пред- ставляет огромный практический интерес, так как такие решетки образуются в кристаллах благодаря правильному расположению атомов. Постоянная этой *) По существу разрешающая сила призмы зависит не от наибольшей толщины стекла, а от разности в длинах верхнего и нижнего оснований. (Прим. иерее.)
374 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 решетки (расстояние между соседними атомами) порядка 1 А(Ю~8 см), что сов- падает по порядку величины с длиной волн рентгеновских лучей. Следова- тельно, при прохождении сквозь кристалл пучка рентгеновских лучей возни- кает дифракционная картина, и, анализируя ее, можно получить информацию относительно структуры кристалла (см., например, [35J или [36]). Дифракция рентгеновских лучей в кристаллах, предсказанная в 1912 г. Лауэ, наблюдалась впервые Фридрихом и Книппингом [37]. Другим примером решеткоподобной структуры служат ультразвуковые волны в жидкости. Они представляют собой упругие волны, создаваемые пьезо- электрическим генератором, и отличаются от обычных звуковых волн только значительно более высокой частотой, лежащей существенно выше верхнего предела слышимости. Такие волны вызывают периодические разряжения и сжатия жидкости, действующие на проходящий свет, как решетка. Теория этого явления излагается в гл. 12. В заключение настоящего параграфа рас- смотрим одномерные решетки, которые применяются в спектроскопии. б) Типы дифракционных решеток *). Принцип действия дифракционной решетки был открыт в 1785 г. Риттенхаузом ([39], см. также [40J), но тогда его открытие не привлекло внимания, и решетка была изобретена вновь в 1819 г. Фраунгофером [41]. Первые решетки, изготовленные Франугофером, были вы- полнены из очень тонкой проволоки, навитой на два параллельных винта. Из- готовление таких проволочных решеток сравнительно несложно, и поэтому в некоторых случаях ими пользуются даже в наше время, особенно в длинно- волновой (инфракрасной) области спектра. Позднее Фрауигофер с помощью специальной машины прочерчивал штрихи на золотой пленке, нанесенной на стеклянную пластинку, или же, пользуясь алмазным резцом,— параллельные штрихи на самой поверхности стекла. Значительных успехов в технике изготовления решеток достиг Роуланд [42], который создал несколько превосходных гравировальных машин и, кроме того, изобрел так называемую вогнутую решетку (см. стр. 378, 379). При по- мощи машины Роуланда можно было наносить штрихи длиной более 10 см на решетку шириной 15 см. Первая машина Роуланда позволяла прочерчивать около 560 штрихов на 1 мм, что обеспечивало разрешающую силу решетки, превышающую 150 000. Позднее Майкельсон изготовлял решетки значительно шире 15 см с разрешающей силой, примерно равной 400 000. Большинство первых решеток гравировались на зеркальном металле или стекле, позднее появились решетки со штрихами, нанесенными на напы- ленный слой алюминия. Алюминий обладает хорошей отражательной способ- ностью в ультрафиолете и, кроме того, вследствие своей мягкости не вызывает быстрого износа чертящего острия (алмаза). У идеальной решетки штрихи должны быть строго параллельны и ими ь одинаковую форму. Однако на практике оба эти требования обычно не выпол- няются. Совершенно нерегулярные ошибки приводят к затуманиванию карти- ны и не так серьезны, как систематические ошибки, например в периоде ре- шетки. Последние приводят к появлению в спектре паразитных линий, назы- ваемых духами. Очень часто такие духи с большим трудом можно отличить от настоящих линий. Высокая разрешающая сила — не единственное серьезное требование, предъявляемое практической спектроскопией. В тех случаях, когда энергии недостаточно (с чем приходится сталкиваться, например, при изучении спектров слабых звезд и туманностей или при работе в инфракрасной области спектра) существенно, чтобы как можно больше света дифрагировало в определенном направлении. Кроме того, при точных измерениях длин волн применяемая ре- *) Подробное изложение методов изготовления решеток и их усовершенствования см. в [38].
3.6] ДИФРАКЦИЯ ФРАУНГОФЕРА В ПГТТИЧРОКИХ ПРИВОРАХ 375 шетка должна обладать большой, дисперсией. Согласно (8) угловая дисперсия .(при постоянном угле падения света) равна A8) dl cos 9 d •следовательно, для получения большой дисперсии расстояние d должно быть малым или наблюдения должны вестись в высоких порядках (большое т). При работе с решетками, имеющими вид последовательности непрозрачных и прозрачных (или отражающих) по- лосок, только малая часть падающего света попадает в какой-нибудь один порядок. Это недостаток устраняется у современных решеток тем, что иа- лосимым штрихам придают опреде- ленную форму Специальная решет- ка, форма штрихов которой показана Рис. 8.21. Отражательная решетка с задан ной формой штрихов. на рис. 8.21, позволяет направить большую часть света в один или два порядка, лежащие по одну сторону от центрального изображения. Решетки такого типа с довольно грубыми штри- хами называются эшелетами, так как они занимают промежуточное поло- жение между решетками более старых типов и так называемыми эшелонами, которые будут описаны ниже. Эшелеты были впервые изготовлены Вудом 143) на медных пластинках. В качестве резца он пользовался естественной гранью специально отобранного кристалла карборунда. Позднее такие решетки гра- Бировались алмазным острием, которому шлифовкой придавалась нужная форма. Эти решетки имели от 80 до 120 штрихов на 1 мм; при работе с види- мым светом они посылают большую его часть в спектры 15-го или 30-го порядка. Эшелеты представляют значительную ценность для инфракрасной спектро- скопии. Сравнительно недавно были разработаны методы нанесения штрихов за- данного профиля на решетки со значительно меньшим расстоянием между штрихами [44]. Такие «блестящие» решетки *), как их называют, со штрихами, похожими по форме на штрихи эшелета, образуют наиболее интенсивные спектры в очень низких порядках (обычно в первом или во втором). По-видимому, разрешающая сила решеток описанных типов достигает примерно 400 000 и ограничивается практическими трудностями изготовления. В некоторых случаях (например, при изучении эффекта Зсемана и дифракци- онной картины сверхтонкой или изотопической структуры) необходима разре- шающая сила, превосходящая эту величину. Такую высокую разрешающую силу имеют предложенные Гаррисопом [451 решетки, называемые эшелями. Эти решетки с широкими и неглубокими штрихами рассчитывают для работы при углах падения света, больших 45°, причем направление падения должно быть нормальным к узкой стороне ступеньки. При работе с эшелями используются •сравнительно высокие порядки (га~ 1000). Эшель длиной 25 см с 4 штрихами на 1 мм, рассчитанная для работы в 1000-м порядке, имеет разрешающую силу**) в 1000000. Изготовление решеток хорошего качества представляет значительные трудности, и поэтому часто используются реплики ***). Они изготовляются путем отливки матрицы с оригинальной гравированной решетки. *) В русский литературе такие решетки называются концентрирующими. (Прим. ред.) **) Теория и методы изготовления решеток с высокой разрешающей силой приведе- ны в [46]. *") Первые реплики были получены Торлом [47], а затем Уоллесом [48]. Улучшенные ¦способы изготовления реплик описаны в [49].
376 ЭЛЕМЕНТЫ TEOrtffl -ДИФРАКЦИИ [гл. Рис. 8.22. Эшелон Майкельсона. Необходимо упомянуть еще-об одной «решетке» совершенно другого типа, а именно об эшелоне Майкельсона [50]. Он состоит из ряда совершенно одина- ковых плоскопараллельных стеклянных пластинок, собранных в виде ступеней лестницы (отсюда и название), как показано на рис. 8.22. Каждая ступенька задерживает идущий сквозь нее пучок света, причем время задержки одного пучка относительно соседнего по- стоянно. Так как ширина каждой ступеньки велика по сравнению с длиной волны, влияние дифракции ограничено малыми углами, и боль- шая часть света концентрируется в одном или двух спектрах вблизи направления 0 = 0, соответствую- щих очень высоким порядкам, по- скольку разность хода между со- седними пучками достигает очень большого числа длин волн. Разрешающая сила эшелона Майкельсона зависит не только от разности хода между лучами от краев решетки, но и от дисперсии стекла (хотя и в значительно меньшей степени). Если я— показатель преломления стекла, t-— толщина каждой ступеньки и d — их ширина (см. рис. 8.22), то, считая р малым, находим, что разность хода между лучами, дифрагирующими от сосед- них ступеней, равна, очевидно, pd-\-(n—\)t. Отсюда для положения главных максимумов получим pd-\- (n — l)t = mk (m = 0, 1,2, ...). A9) Если длина волны изменится на величину АЯ, то максимум порядка т. сместится B0) Расстояние Ар между главным максимумом порядка т и соседним минимумом снова определяется соотношением A2), так что условие Ар= А'р для предела разрешения дает Л tin B1) Здесь т можно заменить величиной (п— 1) t/'k, полученной из A9), отбрасывая член pd; в самом деле, величины р, для которых интенсивность значительна,, порядка kid, т. е. pd порядка длины волны, тогда как (я— 1) / порядка многих тысяч длин волн. Отсюда находим следующее выражение для разрешающей силы эшелона: да ~ t. B2) Я & Отношение ¦?] (^—) мало. Для флинта его величина вблизи середины видимой области лежит в интервале от —0,05 до —0,1. Следовательно, при наблюдении в порядке т = (я— 1) tlk разрешающая сила эшелона в этих усло- виях превосходит на 5—10% разрешающую силу линейной решетки с /V штри- хами. Один из эшелонов Майкельсона состоял из 20 пластинок, каждая тол- щиной t= 18 мм и шириной d= 1 мм. Считая п~— 1,5, найдем для разности хода между соседними пучками, измеренной в длине волны зеленого света А = 5,,10-6 см, величину т«0,-5-1,8/5-10~6«20 000. Полагая 2x/(^r^) = = —0,1, получим разрешающую силу, примерно равную 20B0 000 4- 4-0,1-20 000)-440 000, К
§ 8.6] ДИФРАКЦИЯ ФРАУНГОФЕРА В ОПТИЧЕСКИХ ПРИБОРАХ 377 Более важное значение имеет отражательный иш.елон. У него каждая ступенька покрывается высоко отражающим металлическим слоем и спектры наблюдаются в отраженном свете. Разрешающая сила отражательного эшелона превосходит разрешающую силу пропускающего эшелона таких же размеров в 3—4 раза, так как каждая ступенька вносит запаздывание между соседними пачками на величину 2/ вместо (я— 1) /« г/2. Так же, как и у эшели, у отра- жательного эшелона разрешающая сила может превышать миллион. Другое преимущество отражательного эшелона перед пропускающим состоит в том, что его можно использовать в ультрафиолетовой области спектра, где стекло "не- прозрачно. Майксльсон отчетливо представлял преимущества, которые имеет отражательный эшелон перед пропускающим, но технические трудности долго препятствовали изготовлению хороших приборов такого типа. Только спустя почти тридцать лет эти трудности были успешно преодолены Виль- ямсом [51]. Серьезные трудности представляет точная сборка эшело- на, состоящего из большого числа пластинок одинаковой толщины. Поэтому число ступенек в эшело- нах лрактически не превышает 40. Наконец надо сделать несколь- ко замечаний относительно пере- 1-ппоряВок 3-й'Псрядок ,- 5-й нпрчдок 1 1,8 2 3 • 3,6 4 if j 1 ? s 7,2 \ 3-й поряЗвк 4-й ff-tl пиряНок р—*- Рис. 8.23. Перекрывании спектров разных по- рядков, полученных с решеткой. крывания спектров, принадлежа- щих разным порядкам. Ограни- чимся рассмотрением видимого спектра, т. е. области длин волн от 'кл= 0,4 мк до Х2= 0,75 мк. Мы ви- дим, что спектр первого порядка не налагается на спектр второго порядка, так как спектр первого порядка занимает участок от р = kjd до р = XJd — = 0.75 XjQ^d — \,8kjd, тогда как спектр второго порядка начинается при р = — 21.i/'d. Вместе с тем спектр второго порядка занимает область от р = 2%lld до р = 2'K.Jd, а спектр третьего порядка начинается уже при 2- l,8kjd, так что оба они частично покрываются. При увеличении порядка соседние спектры пе- рекрываются все больше и больше (рис. 8.23). Если линии с длинами волн X и X + 6Х налагаются в двух соседних порядках (т + 1) и т, то B3) Таким образом, свободная область дисперсии обратно пропорциональна порядку спектра. Перекрывание порядков в свое время применялось для сравнения длин волн в методе совпадений (см. стр. 313). Позднее для этой цели начали поль- зоваться простой интерполяцией между длинами волн эталонных линий, кото- рые определялись интерферометрически. В заключение подведем итог главным отличительным чертам решеток раз- личных типов. Напомним, что, согласно A4), высокая разрешающая сила достигается либо с большим числом периодов и относительно малыми поряд- ками, либо с умеренным числом периодов и высокими порядками. Обычно с гра- вированными решетками работают в очень низких порядках (т от 1 до 5), тогда как эшелоны используются в высоких порядках (т«20 000). В проме- жутках находятся эшелеты (шот 15 до 30) и эшели (от яг 1000). Для практиче- ских целей следует помнить, что угловая дисперсия прямо пропорциональна порядку спектра и обратно пропорциональна периоду, а свободная область дис- персии обратно пропорциональна порядку.
-378 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [гл. 8 в) Спектрографы с дифракционной решеткой. В спектрографах с дифрак- ционной решеткой цветное изображение щелевого источника воспроизводится в различных порядках, в которые решетка разлагает падающий свег. Простое устройство такого спектрографа показано на рис. 8.24. Коллимированный свет от щелевого источники .S, находящегося в фокальной плоскости линзы L, падаег на отражательною решетку G. Изображения 5, образованные дифраги- ровавшими лучами, наблюдаются в фокальной плоскости F зрительной грубы Т. Литров предложил более компактное автоколлимационное устройство Рис. 8.24. Дифракционный Рис. 8.25 Дифракционный спек- Рис.8 26 Фокусировка в спектрограф с решеткой. трограф по схеме Литрова. случае вогнутой решетки (круг Роулаида). (рис. 8.25), работающее только с одной линзой. В этом устройстве щель нахо- дится непосредственно под пластинкой Р, а линза расположена вблизи решетки, которая может поворачиваться на заданный угол относительно падающего пучка. Для устранения потерь света, возникающих при фокусировке линзой ди- фрагировавших лучей, Роуланд ввел в практику вогнутую решетку. В такой решетке штрихи гравируются на вогнутой хорошо отражающей поверхности металла, т. е. на поверхности вогнутого зеркала. Штрихи располагают гак, чтобы их проекции на хорду зеркальной поверхности были эквидистантны. Простая теорема геометрии определяет возможные взаимные положения щели и плоскости наблюдения относительно решетки. Предположим, что Q— средняя точка поверхности решетки, и С— центр ее кривизны, и опишем окружность К с центром в ючке О на QC и радиусом г — 0Q- ОС (рис. 8.26). Докажем теперь, что свет, идущий от любой точки 5 окружности К, отражается приблизительно в точку Р, а дифрагировавшие лучи собираются в точках Р', Р", ..., лежащих па нашей окружности, причем в каж- дую из них фокусируются дифрагировавшие лучи определенного порядка. Что- бы доказать это, построим отраженный луч QP, соответствующий падающему лучу SQ. Если а = SQC — угол падения, то угол отражения CQP также равен а; и, кроме того, дуга SC равняется дуге СР. Рассмотрим теперь другой луч, выходящий из S и падающий па решетку в точке R. Если диаметр окружности достаточно велик (обычно он равен по порядку величины 1 м), то, не делая за- метной ошибки, можно допустить, что R лежит на окружности К. Следова- тельно, так как С— центр кривизны решетки, то угол падения SRC, а значит, и угол отражения снова равны а. Кроме того, дуга СР равняется дуге SC, и поэтому луч, отраженный в точке R, также проходит через Р. Аналогичные рассуждения применимы и к дифрагировавшим лучам. Пусть р — угол, который дифрагировавший в Q луч составляет с QP. Соответст- вующий луч того же порядка, дифрагировавший в R, составит такой же угол
§ S.6] ДИФРАКЦИЯ ФРАУНГОФЕРА В ОПТИЧЕСКИХ ПРИБОРАХ 379 (Р) с RP. Таким образом, углы, образованные лучом, дифрагировавшим в Q, € SQ и лучом, дифрагировавшим в R, с SR, равны 2а + р. Следовательно, эти два луча приходят в точку Р', лежащую на окружности К. Итак, для полу- чения резких линий щель, решетку и плоскость наблюдения (фотографическую пластинку) нужно располагать на окружности с диаметром, равным радиусу кривизны вогнутой решетки. На этом принципе основано несколько схем различных установок дифрак- ционных решеток. Сам Роулаид использовал установку, схематически показан- Рис. 8 27. Схема Роу- лаида для вогнутой решетки. Рис. 8.28 Схема Пашенадля вогнутой решетки ную на рис. 8.27. Решетка G и кассета Рс пластинкой укрепляются на противо- положных концах подвижного стержня, длина которого равна радиусу кри- визны решетки. Оба конца стержня свободно перемещаются вдоль неподвижных направляющих, расположенных под прямым углом друг к другу. Щель S уста- навливается непосредственно над их пересечением таким образом, что свет, па- дающий нормально на щель, далее распространяется вдоль SG. Следовательно, щель располагается на круге Роуланда с диаметром PG и порядок спектров, образующихся на пластинке, зависит от положения стержня. Другое расположение, показанное на рис. 8.28, позволяет устранить подвижные детали. Здесь роль круга Роуланда играет стальной рельс в виде кольца, на котором неподвижно укреплены щель S и решетка G. Вдоль кольца установлен ряд кассет Ро. Pi, P-i, ¦ • •, что позволяет одновременно фотографи- ровать спектры разных порядков. Такая установка, называемая установкой Пашена, отличается, кроме того, и большой стабильностью. Схема, предложенная Иглом, напоминает по своей компактности, уста- новку Литрова с плоской решеткой. Щель можно располагать выше или ниже центра кассеты с пластинкой (рис. 8.29) или даже сбоку кассеты, а свет можно направить в нужном направлении небольшим зеркальцем. Для наблюдения различных участков спектра пластинку и решетку нужно одновременно поворачи- вать на один и гот же угол, но в противо- \J,ff ^* наложных направлениях, а расстояние c^^=====^=========^«==i между ними следует изменять так, чтобы ~"~—¦ -"~ их поверхности всегда были касательны рИс. 8.29. Схема Игла для вогнутой к кругу Роуланда. Наблюдается часть решетки. спектра, образованного лучами, дифраги- ровавшими обратно в направлении щели под углами, близкими к углу паде- ния. Чтобы это устройство было строго автоколлимационным, щель S должна находиться в центре пластинки. Изображения спектральных линий, полученные с вогнутой решеткой, обладают теми же аберрациями, что и изображения от вогнутого зеркала; среди них главная — астигматизм. Однако если вогнутая решетка освещается параллельным пучком света, то астигматизм можно уничтожить на нор-
380 - ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 мали к решетке и свести к очень малой величине по всему полезному спектру *). 8.6.2. Разрешающая сила систем, образующих изображение. Дифрак- ционная формула Фраунгофера (8.3.36) находит важное применение при вы- числении разрешающей силы, оптических систем. Понятие разрешающей силы было введено нами в п. 7.6.3 в связи с интерференционной спектроскопией. Выше мы оцепили разрешающую силу, которую можно достичь с решетками и призмами. Теперь мы распространим это понятие на оптические системы, об- разующие изображения. Для спектральных аппаратов (например, для линейной решетки или ин- терферометра Фабри — Перо) разрешающая сила служит мерой способности прибора разделять две спектральные линии со слегка различающимися длинами волн. Для систем, образующих изображения, разрешающая сила является мерой способности прибора изображав раздельно две соседние точки объекта. Согласно законам геометрической оптики в отсутствие аберраций каждая точка объекта должна изображаться резкой точкой. Однако в результате дифракции она всегда будет иметь вид светлого пятнышка конечного размера. Если два таких пятнышка в изображении (дифракционные картины) начнут перекры- ваться, то чем ближе друг к другу центральные максимумы, тем труднее распоз- нать наличие двух объектов. Предельное расстояние между двумя объектами, на котором глаз еще может обнаружить их существование, зависит в известной степени от опыти. Соответствующим проявлением фотографической пластинки можно увеличить контрастность изображения и тем самым увеличить предел разрешения. Тем не менее желательно иметь какой-нибудь простои критерий, позволяющий хотя бы грубо сравнивать относительную эффективность различ- ных оптических систем. Воспользуемся снова критерием Рэлея, о котором го- ворилось в п. 7.6.3. Согласно этому критерию два изображения начнут разре- шаться, если главный максимум одного совпадет с первым минимумом дру- гого. Для спектральных аппаратов, для которых пределом разрешения служит некая разность длин волн АХ, разрешающая сила определялась как величина МАХ. Для систем, образующих изображения, пределом разрешения является некоторое расстояние 6х или некоторый угол SO, а разрешающая сила опреде- ляется их обратной величиной (т. е. 1/бх или 1/69). Рассмотрим сначала предел разрешения телескопа. Для удаленного объек- та граница входного зрачка, совпадающая с круглой оправой объектива, дейст- вует как дифракционное отверстие. Если а — радиус апертуры объектива, ю, согласно (8.5.16), положение первого .минимума интенсивности относительно центрального максимума задается соотношением ?*) w = Q,6lX/a. B4) Здесь ш=К p'!+q* — синус угла <р между направлением (р, q) и центральным направлением p = q~Q. Обычно этот угол так мал, что его синус можно заме- нить самим углом, и тогда (на основании критерия Рэлея) получим, что угловое расстояние двух звезд, которые начинают разрешаться, равно 0,6Ша. При данном объективе угловой размер изображения, видимого глазом, за- висит от увеличения окуляра. Однако, применяя окуляр с большим увеличе- нием, нельзя выявить детали, которых нет в первичном изображении; в самом деле, каждый элемент такого изображения представляет собой небольшую ди- фракционную картину, а изображение, видимое и окуляр, является только уве- личенным изображением совокупности этих картин. *) Такая свободная от астигматизма установка описана Водсвортом [52]. Теория аберра- 1ШИ решетки и установок с решетками рассматривается в [531. **) Согласно п. 7.6.3 отношение интепсивностеи r седловине и в максимуме на пределе разрешения при дифракции па щели равно 8/«г ~ 0,811, Соответствующая величина в нашем случае (круглое отверстие) составляет 0,735.
§ 8.6] ДИФРАКЦИЯ ФРАУНГОФЕРА В ОПТИЧЕСКИХ ПРИБОРАХ 381 Наибольший из существующих телескопов (в обсерватории Маунт Пало- мар) имеет зеркало диаметром 2а « 5 м. Если пренебречь небольшим экраниро- ванием в центре телескопа, то для света с длиной волны, соответствующей центральной части видимой области (А, = 5,6-10~3 см), получим предел разре- шения, равный „ п, 5,6-10~" см , . ,„., Ф«0,61Х5ТТ()Г^-«1,4.10 г, или угловое разрешение (в секундах) Ф « 0,028". В § 6.1 в качестве предельного разрешения глаза была принята величина в Г. Теперь можно оценить эту величину более точно. В зависимости от ин- тенсивности света диаметр зрачка глаза изменяется примерно от 1,5 до 6 мм. Следовательно (снова принимая Х = 5,6-10 см), предел разрешения глаза находится в пределах „ с, 5,0 10-5 5,610-» °'61 0Д5Л0^ > Ф > °-61 3.10-1 . т. е. 4,55-10-">ф> 1,14-10-*, или (в минутах и секундах) i,34">cp>0'24". До сих пор мы считали, что дифракционное отверстие имеет круглую форму. Значительный интерес представляет также кольцевое отверстие, так как во многих телескопах центральная часть круглого отверстия часто за- крыта вторичным зеркалом. Предположим, что кольцевое отверстие ограни- чено двумя концентрическими окружностями с радиусами а и га, где s — некоторое положительное число, меньшее единицы. Распределение света в дифракционной картине Фраунгофера определяется интегралом вида (8.5.8), где интегрирование по р производится только по области га *S p S^а. Тогда вместо (8.5.13) получим [4?2] P«] B5) а интенсивность задается соотношением — lY^tW ,/2А (*«¦»)>I», A— е2J Ц kaui ) 8 V къат )\ '¦>' где 10— |С|2л2а4A — е2J— интенсивность в центре w -- 0 картины. Положе- ние минимумов (нулей) интенсивности здесь определяется корнями уравнения J! (kaw) — e,J1 (kzaw) =0 (w^O), B7) тогда как положение максимумов — корнями уравнения J2(kaw)— e2J2 (беаш) = 0. B8) При выводе последнего соотношения использовалось (8.5.15), как и в слу- чае круглого отверстия. Для пеэкранированного отверстия (е = 0) первый ко- рень B7), конечно, равен величине, определяемой выражением B4), а именно ay — 3,83'ka — 0,61 'к/а. При увеличении s первый корень B7) уменьшается*); так, например, если е = 1/2, то он становится немного меньше 3,15/ка = 0,50 Xia. Так как главный максимум независимо от s остается при ш = 0, то очевидно, что при загораживании центральной части отверстия разрешающая сила *) С помощью простых вычислений находим из B6), что если 8—»-1, то ///0—> J\(kaw). Так как первый нуль уравнения Л»(-^)~0 получается при л:—2,40, то, следовательно, с увеличе- нием g радиус первого темного кольца приближается к величине, задаваемой w --2,\Qlka - =0,38 ila.
382 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [гл. 8 1 -1 .& \ \ i возрастает. Ее увеличение сопровождается, однако, уменьшением яркости изображения; кроме того, в этом случае вторичные максимумы становятся более отчетливыми, что ведет к уменьшению контрастности. При s = 1/2 первый вторичный максимум (при w = 4,8/ka) равен 0,10 главного максимума, тогда как для круглого отверстия он равен 0,018 (про w -= 5,14,'fea) (рис. 8.30). Экранирование центральной части круглого отверстия соответствует за- мене функции зрачка (см. (8.3.39)) G(|, 11), равной С или 0 в соответствии с 0<1 ig^p^a или р>а, на G(?, т|), равной С или 0 в соответствии с Kuscjps^a или p<sa, p>a. Конечно, можно изменить функцию зрачка и другим путем. Общий метод ее изменения состоит в том, что на одну или несколько поверхностей системы наносит- ся тонкая полупрозрачная пленка подходящего ве- щества. Такого же эффекта можно достичь с по- мощью специально сконструированных «филыров», например полой линзы соответствующей формы, наполненной поглощающей жидкостью. Здесь воз- никает задача определения вида функции зрачка, которая в некотором условном смысле давала бы наилучшее возможное изображение. Этот вопрос исследовался рядом ученых (см., например, 155]; хороший обзор исследований в этой области содер- жится в статье Вольфа [56]). Особый интерес пред- ставляет работа [57], где показано, что функцию зрачча можно выбрать так, чтобы радиус первого темного кольца был как угодно мал и в то же вре- мя темная зона, окружающая центральное кольцо, Z 3 4 5 В 7 8 910каш была бы сколь угодно велика. Однако постепенное уменьшение радиуса первого темного кольца при- водит к постепенному уменьшению яркости цен- трального диска; отсюда следует, что наименьшие возможные размеры, а следовательно, и разрешаю- щая сила ограничены количеством поступающего света. Частичное подавление вторичных максимумов разумно выбранной функцией зрачка называется аподизацией *). В спектроскопии это облегчает обна- ружение сателлитов спектральных линий, а в астрономии — разрешение двой- ных звезд с сильно различающейся видимой яркостью. Принятая теория разрешающей силы, кратко изложенная в настоящем разделе, особенно применима к прямым визуальным наблюдениям. При дру- гих методах наблюдения (например, при фотометрическом методе) часто удается обнаружить существование двух объектов с угловым расстоянием, значительно меньшим указанного критерием Рэлея. В связи с этим интересно также срав- нить разрешающие силы телескопа и звездного интерферометра Майкельсона (см. п. 7.3.6). Если о существовании двух звезд судят но первому исчезновению полос, образованных в интерферометре, и если максимальное расстояние между внешними зеркалами последнего равно d, то, согласно G.3.42), пользуясь та- ким прибором, можно обнаружить двойные звезды с угловым расстоянием между ними вплоть до (psa-^-Vd. Сравнение найденной величины с B4) показы- вает, что для обнаружения двойных звезд с таким разделением при визуальном наблюдении в телескоп необходимо, чтобы диаметр его объектива 2 а примерно равнялся 2,4d. Wo, 1,0 0,3 0,8 DJ це 0,3 о,г 0,1 Рис. 8 30. Влияние диафраг- мирования центральной части отверстия на разрешающую силу (по [54]) Нормированные кривые интен- сивности в дифракционном кар- тине Фраунгофера / — круглое отверстие, 2 -кольцевое отвер- стие с E=l/2, ,i —кольцевое от- верстие с е -* 1 •) Полный обзор такого рода исследовании дан в [58].
§ 8.6] ДИФРАКЦИЯ ФРАУНГОФЕРА В ОПТИЧЕСКИХ ПРИБОРАХ 383 8.6.3. Образование изображения в микроскопе*). В нашем элементарном изложении теории разрешающей силы предполагалось, что свет от двух точек предмета некогерентсн. Это предположение справедливо, если оба объекта са- мосветящиеся, как, например, звезды, наблюдаемые в телескоп. Получающаяся интенсивность в любой точке плоскости изображения равна тогда сумме ин- тенсивностей, обусловленных каждой точкой предмета. Как правило, при работе с микроскопом ситуация оказывается значительно сложнее. В большинстве случаев рассматриваемый предмет не является само- светящимся и, следовательно, должен освещаться с помощью вспомогательного устройства. Вследствие дифракции па отверстии осветительной системы (кон- денсора) каждый элемент источника создаст в предметной плоскости микро- скопа дифракционную картину. Дифракционные картины с центрами в доста- точно близких друг к другу точках частично перекрываются и, следовательно, в соседних точках плоскости предмета световые колебания в общем случае час- тично коррелированы. Часть этого света проходит сквозь предмет с изменением фазы или без него, тогда как оставшаяся его часть рассеивается, отражается или поглощается. Поэтому, вообще говоря, невозможно посредством одного наблюдения или, даже используя одно какое-то устройство, получить правиль- ное увеличенное изображение всей микроструктуры объекта. По этой причине были разработаны различные методы наблюдения, пригодные для изучения определенных типов объектов или для выявления у них тех или иных харак- терных особенностей. Изложим коротко теорию образования изображения в микроскопе, огра- ничиваясь двумя крайними случаями, а именно полностью некогерентным ос- вещением и идеально когерентным освещением. Освещение частично когерент- ным светом рассматривается в п. 10.5.2. а. Некогерентное освещение. Рассмотрим сначала самоейет'ящийся объект,, например накаленную пить электрической лампочки. Пусть Р — осевая точка объекта, a Q — соседняя точка в плоскости предмета, находящая- ся на расстоянии Кот Р, и пусть Р' и Q'— изображения этих то- чек (рис. 8.31). Далее пусть 0 и 6'— углы между крайними лу- чами осевых пучков и осью. Если а'— радиус площадки (предполагается, что она круг- лая), которую образует сходя- щийся в Р' пучок лучей при пе- ресечении с задней фокальной плоскостью W, a D'—расстоя- ние от выходного зрачка до плоскости изображения, то, поскольку 9' мало, можно написать д'=а'/ГУ. B9) Далее, если ш —]/ p^ + q2— расстояние от Q' до Р', выраженное в «дифракцион- ных единицах» (см. (8.3.35) и (8.5.7)), т. е. это синус угла, под которым из цен- тра дифракционного отверстия видна прямая, соединяющая эти точки, то с хо- рошим приближением мы"можем написать Y'=wD'. C0} Пусть п и п'— показатели преломления, а X и V— длины волн в пространстве предмета и в пространстве изображения, а Хо— длина волны в вакууме. Тогда, Рис. 8.31. К теории разрешающей силы микроскопа. *) Подробное изложение теории образования изображения в микроскопе дано в работаж Л, И. Мандельштама и Д. С. Рождественского [119*1. (Прим, ред.)
384 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 согласно (8.5.16), первый минимум дифракционной картины от Р определяется величиной a; = 0,61V/a', и мы получим на пределе разрешения Y' = 0,61V 51 = 0,61^1 = 0,61 ~±,. C1) Само собою разумеется, микроскоп рассчитывается так, чтобы он давал резкое изображение не только какой-либо осевой точки, но и соседних с ней точек, лежащих в плоскости предмета. Поэтому, согласно п. 4.5.1, должно удовлетворяться условие синусов *) nY sin 9 = —- n'Y' sin 9'. Так как угол 9' мал, можно заменить sin 0' на 0' и, подставляя найденное от- сюда значение V в C1), получим окончательно |К|« 0,61V» sine. C2) Эта формула дает расстояние между двумя точками объекта, которые при осве- щении некогерентным светом начинают разрешаться микроскопом с круглым отверстием объектива. Величина п sin б, входящая в C2), называется числовой апертурой (см. D.8.13)). Она должна быть большой, если необходима большая разрешающая сила. Пути достижения большой числовой апертуры рассматривались в § 6.6. б. Когерентное освещение; теория Аббе. Ниже рассматривается другой крайний случай, а именно случай, когда свет, идущий от объекта, можно счи- тать строго когерентным. Это положение приблизительно осуществляется при освещении тонкого предмета со сравнительно простой структурой светом не- большого источника, проходящим через конденсор с малой апертурой (см. ниже, п. 10.5.2). Первая удовлетворительная теория разрешения при когерентном освеще- нии была сформулирована Аббе ([59, 60]); хорошее изложение теории Аббе дано в [611. Ему же принадлежат и прекрасные опыты, наглядно подтверждающие эту теорию. Согласно Аббе, предмет ведет себя как дифракционная решетка, и поэтому при определении комплексного возмущения в любых точках плоско- сти изображения должны учитываться не только все элементы отверстия объек- тива, но и все элементы самого предмета. Выражаясь математическим языком, можно сказать, что переход от предмета к изображению совершается с помощью двойного интегрирования: одного по предметной плоскости и другого по пло- щади отверстия объектива. В теории Аббе в первую очередь рассматривается дифракция на предмете, а влияние апертуры учитывается во вторую оче- редь. Возможен также и обратный порядок, приводящий, естественно, к та- ким же результатам **). Для иллюстрации теории Аббе рассмотрим вначале образование изображе- ния предмета в виде решетки, на который перпендикулярно его плоскости па- дает плоская волна (центральное освещение по Ке'леру). В результате дифрак- ции волны на такой решетке (см. п. 8.6.1) на задней фокальной плоскости W объектива возникает дифракционная картина Фраунгофера. На рис 8 32 максимумы спектров последовательных порядков этой картины обозначены ... S_i, S_i, So, Si, Si, ... Каждую точку в фокальной плоскости можно рас- сматривать как центр вторичного когерентного возмущения, величина кото- рого пропорциональна амплитуде в этой точке. Световые волны, идущие от та- ких вторичных источников, интерферируя между собой, образуют изображение предмета в плоскости изображения П' объектива. Для получения точного изо- бражения предмета необходимо, чтобы все спектры участвовали в формирова- *) Знак минус появился потому, что 6' соответствует величине — 7i в ^ 4 5. '*) Теория формирования изображения в микроскопе, эквивалентная такому подходу, ¦была сформулирована Рэдеем в [62, 63].
§ 8.6] ДИФРАКЦИЯ ФРАУНГОФЕРА В ОПТИЧЕСКИХ ПРИБОРАХ 385 нии изображения. Строго говоря, это невозможно, так как отверстие объектива всегда имеет ограниченный размер. Ниже мы увидим, что исключение некоторых спектров может привести к искажению вида изображения. Для практических целей, очевидно, совершенно достаточно отверстии такого размера, чтобы оно пропустило все спектры, несущие заметное количество энергии. Представим эти соображения в более точном виде и не будем более огра- ничиваться предметом в виде решетки. Если хку— координаты произвольной точки в плоскости предмета, / — расстояние между фокальной плоскостью W и объективом, то возмущение в точке с координатами l = pf, n = qf, C3) лежащей в плоскости W (см. рис. 8.32), определяется формулой Фраунгофера U (Е, г,) = С, j j F (х, у) ехр | ~ik [f x+f y] } dxdy, C4) где F — функция пропускания предмета, d— постоянная, и интегрирование производится по площади Л, занятой предметом в плоскости предмета II. Рис. 8.32. К теории Аббе образования изображения в микроскопе при освещении когерентным светом. Рассмотрим теперь переход от задней фокальной плоскости f' к плоскости изображений П'. Обозначим, как и прежде, через ?>' расстояние от ?' до П', а через V(x', у') — возмущение в произвольной точке x'=p'D', y'=q'D' C5) плоскости изображений. Тогда для дифракции Фраунгофера на отверстии ЗВ в плоскости $ ' имеем, предположив, что а'Ю'<^. 1 (см. рис. 8.31), & C6) Подставляя сюда C4), получим V(x'. if'J-C C7) Итак, если F (х, у) считается равной нулю во всех точках плоскости предмета, лежащих вне Л, то интегрирование по х и у можно формально производить от — оодо +оо. Подобным же образом, если отверстие S3 так велико, что |с/(Е, i^) I пренебрежимо мало для точек плоскости оТ' .лежащих Biie.fi, то интегрирование по I и Г| также можно производить от —оо до +оо. Отметим, кроме того (см. 2Ь м. Берн, Э. Вольф
386 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ 8 D.3.10), где /' и 2' соответствуют нашим —f и ?>')> что ]_ J_ D' М 1 C8) где М (<0) увеличение П' относительно П, применяя интегральную теорему Фурье (см , например, L64J), получим ), C9) где (х, у) — точка предмета, изображение которой находится в (х', у'), а v С = CjC,A.2/a — постоянная Следовательно, с принятой здесь точностью *) изображение будет полностью подобно предмету (но перевернуто), если апертура достаточно велика. Нетрудно показать, что в изображении могут появляться совершенно искаженные детали, если исключены некоторые спектры, несущие заметную долю энергии Для этого рассмотрим предмет в виде решетки с периодом d, состоящей из N эквидистантных конгруэнтных щелей шириной s, разделенных непрозрачными промежутками. Для простоты предполагается, что диафрагма имеет прямоугольную форму, и две ее стороны параллельны щелям. Согласно (8.6.3) находим где Um заменено выражением, относящимся к дифракции па прямоугольном отверстии (см. п. 8 5.1). Если прямоугольное отверстие занимает в направлении ? область то в соответствии с F) и D0) возмущение в плоскости изображений равно Г sinSl-exp( V (Я = С,Сг \ —Л ex p (r-ikx'HW) <%. D1) Положение главных максимумов интенсивности определяется корнями урав- нения 1 — ехр[—ikdt,i{}~0, т.е. \-mfkld, где т — целое число. Между этими главными максимумами находятся слабые вторичные максимумы. При большом .V главные максимумы очень остры и по сравнению с ними вторичные максимумы пренебрежимо малы. В таком случае с хорошим приближением можно заменить этот интеграл суммой интегралов, каждый из которых берется от средней точки Qm интервала между соседними главными максимумами до средней точки Qm + l следующего такого же интервала В каждом интервале мы можем заменить аргумент его значением в центре | =mf%/d—2nmf/kd, *) Как отмечалось выше, использованное здесь приближение Фраунгофера ограничи- вается случаем, когда точки предмета и точки изображения лежат достаточно близко к оси.
§ 8.6] ДИФРАКЦИЯ ФРАУНГОФЕРА В ОПТИЧЕСКИХ ПРИБОРАХ 387 Здесь m = 0, d' = Md=—jd, D3) a Vo— интеграл V»=CA J 1-exp (->"?//) *• <44> который, не считая небольшого поправочного члена в высоких порядках, прак- тически не зависит от от. Ряд D2) можно переписать в действительной форме, а именно Предположим сперва, что длина а диафрагмы очень велика. Тогда сумми- рование формально можно распространить на весь бесконечный ряд (т =<»); УУУУУУУУУУУЛ ХУУУУУУуУУуУА fy'i Т^Л \/УУ~'Л/У/УЛ ХУУУУУУУУУУЛ , ~S/2 ily/i'fj -V Рис. 8.33. Объект типа решетки. легко доказать, что при таких условиях изображение точно подобно предмету. Для этого разложим функцию пропускания^-' предмета типа решетки (рис, 8.33) ^F0, когда 0 < |х| <-^ , F(x) = Q, когда ±- D8) ¦ С точностью до постоянного множителя этот ряд не отличается от D5), Предположим теперь, что длина о диафрагмы уменьшается. Если а так мале, что в образовании изображения участвует только спектр нулевого по- рядка, т. е. еэли rn=ad/Xf — правильная дробь, то, согласно D5), V(x') — = const, и плоскость изображений освещена равномерно. (Последний вывоч, конечно, не совсем правилен, так как мы отбросили некоторые остаточные чле- ны; на самом же деле наблюдается небольшое падение интенсивности в на- правлении края изображения.) Если, кроме спектра нулевого порядка, сквозь диафрагмы проходят еще два спектра первого порядка (S^ S_l), т. е. если т=ай[Ц немного больше 25*
388 ЭЛЕМЕНТ*! ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 единицы, то из D5) находим V(x') , , oSln 1 2л*' .п, d Теперь изображение имеет правильную периодичность х'— d', но значительно сглаженное распределение интенсивности. При увеличении диафрагмы изобра- жение становится все более и более похожим на предмет. Совершенно искаженное изображение наблюдается в том случае, когда в его образовании спектры низших порядков совсем не участвуют. Если, на- пример, исключены все порядки, кроме второго, то и изображение имеет период х' — d'/2, т. е. в таком «изображении» наблюдается вдвое больше линий, чем действительно есть у предмета. Определим теперь разрешающую силу микроскопа. Вернемся опять к рас- смотрению рис. 8.31, по допустим, что свет, идущий из Р и Q, когерентен. В этом случае распределение интенсивности в плоскости изображений определяется в основном когерентной суперпозицией двух дифракционных каргин Эйри с центром одной в Р', а другой в Q'. Комплексная амплитуда в точке, находя- щейся межцу Р' и Q' на расстоянии тг (измеренном в «дифракционных едини- цах») от Р' определяется соотношением где w — расстояние между Р' и Q'\ другие обозначения имеют такой же смысл, как и раньше. Следовательно, для интенсивности имеем - E2) В случае некогерентного освещения Р' и Q' считались разрешенными, если главный максимум интенсивности одной картины совпадал с первым минимумом другой. Интенсивность в средней точке (а1 л; 1,92) между двумя максимумами равняется тогда 2 [2У, A,92)/1,92]-«0,735 от интенсивности каждого максимума, т. с. кривая суммарной интенсивной и спадает на участке между двумя глав- ными максимумами примерно на 26,5%. (Это соответствует 19% для отверстия в виде щели, см. рис, 7.62.) Если мы снова примем, что такое уменьшение ин- тенсивности по существу определяет предел разрешения, то критическое рас- стояние г?> = 2ш1 находится из соотношения ^ Первый корень этого трансцендентного уравнения равен w,.^i2,A\lka, и, следо- вательно, для критического расстояния, измеренного в обычных единицах, имеем Y'-W^fL-bJ™^. E4) Для того чтобы перейти от У к соответствующему расстоянию Y между точ- ками предмета, используем условие синусов (допуская, что sin Q'ta 6') и получим окончательно, что предел разрешения при когерентном освещении равен 1^1 = 0,77-^. E5)
§ 8.6] ДИФРАКЦИЯ ФРАУНГОФЕРА В ОПТИЧЕСКИХ ПРИБОРАХ 389 Не считая несколько большего численного множителя (который всегда до из- вестной степени произволен, так как он зависит от формы предмета и отверстия и от чувствительности приемника), мы получим то же выражение, что и в случае некогерентного освещения (см. уравнение C2)). Таким образом, разрешающая сила для света определенной длины волны по существу зависит только от чис- ловой апертуры объектива. в. Когерентное освещение; фазо-контрастный метод наблюдения Цер- нике *). Мы определили фазовый объект как объект, который изменяет фазу,а не амплитуду падающего света. Объектом такого тина служит неоднородный по оптической толщине и вместе с тем совершенно не поглощающий света предмет. Такие объекты часто встречаются в биологии, кристаллографии и других об- ластях науки. Из предыдущего очевидно, что обычные методы наблюдения дают мало информации о таких фазовых объектах. Комплексная амплитудная функ- ция, определяющая возмущение в плоскости изображения, в этом случае по- добна функции пропускания объекта **). Поскольку глаз (или другой регист- рирующий прибор) способен отмечать только изменение интенсивности, можно делать выводы об изменении амплитуды, но не об изменениях фазы, вызванных объектом. Для получения данных о фазовых объектах следует применять специаль- ные методы наблюдения, например так называемый метод темного поля, где с помощью диафрагмы устраняется центральный порядок, или метод свилей, в котором исключаются все спектры по одну сторону от цешрального порядка. Однако наиболее эффективным является метод, предложенный Цернике [67], впервые описанный им в 1935 г. и известный под названием метода фазового контраста. Его преимущество заключается в том, что распределение интенсив- ности в изображении прямо пропорционально изменению фазы, вносимому со- ответствующими точками объекта. Чтобы объяснить принцип метода фазового контраста, рассмотрим сначала прозрачный объект в виде одномерной фазовой решетки. Функция пропускания такого объекта по определению (см. стр. 369) имеет вид F (X) = ехр [щ (х)], E6) где <р(х) — вещественная периодическая функция с периодом (например, d), равным периоду решетки. Предположим, что величина ср мала по сравнению с единицей, и поэтому можно написать F{x)xl-ricp(x). E7) Разлагая F в ряд Фурье ± №) E8) и учитывая, что F имеет вид E6), а ф — вещественная, но малая по сравне- нию с единицей величина, получим с„ = 1, с_т=—с*т (тфО). E9) Интенсивность спектров порядка т пропорциональна |ст|2. В методе фазового контраста в заднюю фокальную плоскость W объектива помещают тонкую пластинку из прозрачного вещества, называемую фазовой пластинкой. Такая пластинка вызывает отставание или опережение фазы в ну- левом порядке (So на рис. 8.32) относительно фазы в дифракционных спектрах *) Более подробное изложение фазо-контрастного метода приведено, например, в [65]. **) Точное подобие достигается только при бесконечно большом отверстии объектива. Так как оно всегда конечно, можно увидеть некоторые детали фазовой структуры. Ино1да при небольшой расфокусировке прибора видность таких «изображений» улучшается за счет разре- шения (см. [66]).
390 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 (Si, S_i, So, S_2, ...) на четверть периода. Это значит, что распределение ком- плексной амплитуды в фокальной плоскости будет отличаться от распределении, хараюерилующеюся коэффициентами ст, И станет распределением, характери- зующимся коэффициентами с'т, где ±'\ с'т=ст {тфО). F0) Положительный или отрицательный знак берется в зависимости от того, полу- чается ли отставание или опережение, фазы в нулевом порядке. Теперь резуль- тирующее распределение света в плоскости изображений представляет не фазо- вую решетку E7), а фиктивную амплитудную решетку '0(х) = ±1 + щ{х). F1) Следовательно, пренебрегая <р2 по сравнению с единицей, находим, что интен- сивность в плоскости изображения пропорциональна l(x')^\G(x)Y=\±24>(x), F2) где, как и раньше, х' — Мх, а М — увеличение. Отсюда следует, что в случае наблюдения методом фазового контраста, изменение фазы, вносимое объектом, превращается в изменение интенсивности, а последняя в любой точке плоскости изображений прямо пропорциональна (с точностью до аддитивной постоянной) изменению фазы, вызванному соответствующим элементом объекта '"). При отставании фазы в нулевом порядке относительно фазы дифракционных спект- ров (верхний знак в F1)) области объекта с большей оптической толщиной ка- жутся ярче мест со средней освещенностью. Это светлый фазовый контраст. Если фаза в нулевом порядке опережает фазы дифракционных спектров, об- ласти больших оптических толщин кажутся темнее общего фона. Это так назы- ваемый темный фазовый контраст (рис. I и рис. II на вклейке). Часто для получения хорошего разрешения отверстие осветительной сис- темы делают кольцевым, а не круглым (см. п. 8.6.2). В таком случае роль спект- ра нулевого порядка 5» на рис. 8.32 играет кольцевая область 5~', сквозь кото- рую проходит прямой (не дифрагированный) свет, причем фаза именно этого света должна отставать или опережать на четверть периода фазы дифракцион- ных спектров. Фазовую пластинку можно изготовить, нанося испарением тонкий слой со- ответствующего диэлектрика на стеклянную подложку. Есля свет, прошедший сквозь пластинку, должен отставать по фазе на четверть периода, то толщина нанесенного на пластинку слоя d должна составлять d~V4(«—1), где п—¦ показатель преломления диэлектрика. Отставание по фазе на четверть периода нулевого порядка, конечно, эквивалентно опережению по фазе дифракционных спектров на три четверти периода и наоборот. Чувствительность метода фазово- го контраста можно увеличить, если применять слабо поглощающие покрытия вместо диэлектрических. К этому вопросу мы еще вернемся позднее. Остается показать, что применение метода фазового контраста не ограни- чивается только фазовыми объектами периодической структуры. Для этого разделим интеграл C4) на две части, а именно U(l, i\) = Ut(l, ч)+ !/,(?, г,), F3) где и„ = Сх Jj ехр {- j [1х + щ] | dxdy, Ul = Cl Я[F (x' y) -[ ] exp {- T[lx + w]} dx d *) Приближения, принятые а элементарно?* теории метода фазового контраста рассмот- рены в [68, 69].
§ 8.6] ДИФРАКЦИЯ .ФРАУНГОФЕРА В ОПТИЧЕСКИХ ПРИБОРАХ 391 ио представляет распределение света в плоскости JF' в отсутствие объекта, a Ux— влияние дифракции. «Прямой свет» Uo (соответствующий нулевому порядку So на рис. 8.32) концентрируется только в небольшой области ЗЗо плоскости §~' вблизи осевой точки ё, ^ц — 0. Вместе с тем в общем случае только очень небольшая часть дифрагировавшего света попадает в эту область; боль- шая его часть окажется к других местах *) этой плоскости W. Предположим, что область 33„, через которую проходит прямой свет, за- крыта фазовой пластинкой. Действие последней описывается функцией пропу- скания А = ае'\ <65> Для пластинки, вызывающей только изменение фазы проходящего света, а — 1, а для пластинки, еще и поглощающей свет, а< 1. Для света, прошедшего сквозь отверстие объектива, можно написать w (ъ, r,) — AU0{i, n)+ ?/,(?. ri); F6) поэтому, согласно C6), распределение комплексной амплитуды в изображении1 имеет вид V(jc', y') = V0{x', у')+Уг(х', у'), F7) где 'H.-Cjjf/^S. 4)exp l-%[x'l + y'- Так как отверстие 33 значительно превышает размеры участка ЗЗо, a Uo вне 33« практически равно нулю, то, не вводя заметной ошибки, можно распространить область интегрирования в выражении для 1'0на всю плоскость 3~'. Кроме того, если допустить, что 33 велико и пропускает все дифрагировавшие лучи, несущие заметную энергию, то у интеграла V, также можно написать бесконечные пре- делы. Наконец, если, как и раньше, функция пропускания F (х, у) определена как нуль в точках плоскости предмета, лежащих вне области, занятой объек- том, то интегралы F4) также можно взять с бесконечными пределами. Тогда, подставляя F4) в F8) и используя интегральную теорему Фурье и соотношение C8), получим V0(x',y') = CA, ) vax', y')=c [>(?, j?)-i] =c[fu. у)—ij. j F9) Из F7) и F9) следует, что интенсивность в плоскости изображений опреде- ляется выражением /(*'. y') = \V(x', y')\* = \C\*\A + F(x, y)-i\\ G0) При наличии фазового объекта имеем F(x, г/) = ехр[/Ф(х, у)], G1) и G0) сводится -к **) 1(х!,'у') = \С\Цаг + 2{1— a cos a— coscp(;t, у) +acos (а—<р(ж, у))}]. G2) Так как мы предположили, что ф мало, последнее соотношение можно перепи- сать в виде ' , ; / (*', У') = \С f [а3 + 2аФ (х, у) sin а], G3) *) Этот вопрос подробно рассмотрен в [68]; см. также [72], где он исследовался в другой связи. *•) Особый случай, ктда й=0, соответствует наблюдению в темном поле. Согласно G2) распределение интенсивности тогда определяется выражением Цх', у') = 2Сг[\ — cosipOt, y)\.
392 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [гл. 8 и если разность фаз, вносимая пластинкой, соответствует отставанию или опе- режению на четверть периода, то а — ± л/2, и G3) сводится к I (Х\ у') = \С\2[а2 ±2ац>(х, у)]. G4) Если пластинка не поглощает света (а - 1), мы снова получим выражение F2). В этом случае изменения интенсивности прямо пропорциональны изменению фаз, вносимому объектом. Для пластинки, поглощающей долю всего прямого света, равную а2, отношение второго члена к первому в G3) равно ±<р/я, что указывает на увеличение контрастности изображения. Например, ослабление прямого света в девять раз повышает чувствительность этого метода в три раза. § 8.7. Дифракция Френеля на прямолинейном крае 8.7.1. Дифракционный интеграл. После того как мы рассмотрели различные случаи дифракции Фраунгофера, займемся более общим случаем, а именно ди- фракцией Френеля. Основной дифракционный интеграл (8.3.28) можно записать в виде U(P)^=B(C+iS), A) где -pWr'+s')! ^ B) sin {kf (l, ц)}dldn. С = [\ cos {kf (I, $ $ Л Л Тогда интенсивность / (Р) = | U (Р) |2 в точке наблюдения Р равняется C) D) Теперь в разложении /(?, ц) (8.3.31) мы должны сохранить члены с | и т| по крайней мере до второго порядка. Как it раньше, мы считаем, что плоскость отверстии . / совпадает с плоскостью ху.Для упро- щения расчетов направим ось х вдоль проекции линии ЄРна плоскость отверстия (рис. 8.34). Следовательно, при заданном положении источ- ника система координат, вообще говоря, будет различной для различных точек наблюдении. Согласно (8,3.30) / = l0, m — т„, и линейные члены в /(|, г]) исчезают. Направляющие коси- нусы лучей Р„О и ОР равны / = /„==.sine, т = то = О, п = п„ ^cos8, E) где, как и прежде, 8 — угол между линией ЄРи осью г. Выражение (8.3.31) для /(?, ц) сво- дится к Рис. 8 34. К дифракции Френе- ля на отверстии в плоском не- прозрачном экране. /(?, т,) -y{t'+T' F) Отбрасывая члены с ? и т] в третьей и более высоких степенях, мы приведем интегралы C) к виду С= JJcos {у (?"+?- Л S =_ jjsin {^ (^+7) Й2cos + rf)} d%di,. G)
§ 8.7] ДИФРАКЦИЯ ФРЕНЕЛЯ НА ПРЯМОЛИНЕЙНОМ КРАЕ 393 Для удобства введем новые переменные интегрирования кип, определяемые соотношениями «(i- + i-)^os^ = |-«*, ?A+1)^-^. (8) Тогда X du dv -;— Г COS О \Г S J н наши интегралы принимают вид где Здесь интегрирование производится по области Л' плоскости (и, v), в которую подстановкой (8) преобразована область Л отверстия. 8.7.2. Интегралы Френеля. П\сть Л'—прямоугольник со сторонами, па- раллельными осям uhv; тогда интегралы (9) можно упростить еще больше, ис- пользуя следующие тождества: i cos [¦?(«'+»•)] = cos (? )(|)(|)(|) sin [|-B + ^)]i(f «j(i'j+(|»)i(f 2) j В этом случае для вычисления (9) мы должны рассмотреть интегралы J о о Интегралы % (ш) и cf(w) называются интегралами Френеля. Оли имеют боль- шое значение при решении многих дифракционных задач и хорошо изучены. Мы должны кратко познакомиться с некоторыми их особенностями *). Сначала получим выражения для #(ш) и ofiw) в виде рядов. Для этого разложим косинус и синус под знаком интеграла в степенные ряды и, интегри- руя почленно, найдем Эти ряды сходятся при всех значениях ю, однако для вычислений они пригодны только при малом w. Когда хю велико, интегралы можно вычислить, пользуясь разложением в ряды по отрицательным степеням w. Перепишем A2) р виде Интегрируя по частям, получим 25. *) Из большего числа таблиц интегралов Френеля можно рекомендовать, например, [24, '. 73),
394 Элементу теории дифракции [гл. 8 Снова интегрируя по частям и продолжая этот процесс, получим и аналогично у A5) где Для вычисления интегралов #(oo) и af(oo) объединим их в один комплекс- ный интеграл ¦e(oo)-i-iff'(oo)=l\exp(i~jAdT A7) и введем новую переменную интегрирования in i—! ,/— „ /4-1 Вещественный путь интегрирования О^т^оо переходит в комплексной пло- скости I, а путь, лежащий вдоль линии, проходящей через начало координат под углом 45° к вещественной оси. Далее, легко заметить, что если интеграл берется вдоль линии, параллельной мнимой оси, то с увеличением расстояния от начала координат он начинает стремиться к нулю. В этом случае из теоремы о вычетах Коши следует, что интеграл, взятый вдоль любой наклонной линии, проходящей через начало координат, равен значению интеграла, взятого вдоль вещественной оси. Таким образом, , «Г (оо) 4- i^(«>) = Щ- Г ехр (-?*) dt = i±i. о {Вещественный интеграл по ? является хорошо известным интегралом ошибок Гаусса *), и его величина равна У л/2.) Следовательно, »(oo)=(cos(yT«)dT = i, <SF (со) ={ sin (^xAdx = ±. A8) с -о Соотношения A5) вместе с A6) и A8) выражают интегралы Френеля в виде рядов по отрицательным степеням w. Если w велико, эти расходящиеся (асимп- тотически) ряды обеспечивают хорошую аппроксимацию интегралов при учете небольшого числа членов разложения (см. приложение 3). Поведение интегралов Френеля хорошо иллюстрируется изящным геомет- рическим построением Корню I75J. В качестве декартовых координат точки Р берутся % и of. Переменная w принимает все возможные значения, и поэтому точка Р описывает некую кривую. Поскольку о/'ф) -"= 8" @) =0, кривая прохо- дит через начало координат, и поскольку #(—а>) = —# (ш), , if(—W) = — <У{ю), A9) она антисимметрична относительно обеих осей. Если dl — элемент дуги нашей кривой, то [(^J[^?J] f[f ^ (f )] (dw)\ т. е. (dl)* = (dw)\ B0? *) См., например, [74J,
8.7] ДИФРАКЦИЯ ФРЕНЕЛЯ НА ПРЯМОЛИНЕЙНОМ КРАЕ 395 Следовательно, если / измеряется в направлении увеличения w, то параметр w представляет длину дуги кривой, измеряемую от начала координат. Пусть 0 —• угол между касательной к кривой и осью ё. Тогда w-%= - &% f n , \ ¦ -r- cos — to2 dm \ 2 } -W (.21) Следовательно, 6 возрастает монотонно с увеличением \w\. Так как 0=0, когда w = 0, то в начале координат касательная к кривой совпадает с осью %. Когда w1=\, то 0 —л/2, и каса- тельная перпендикулярна к оси %. Еслик,":=2, то 6= — л, и каса- тельная к кривой снова параллель- на оси if, но ориентирована в от- рицательном направлении. Соглас- но соотношениям A8) и (Ш)Й(оо) = = — '€(— оо) = 1/2, ^(оо) = ¦-—<§?(—оо) = 1/2, и обе ветви кривой приближаются к точкам Р* и Р~ с координатами A/2, 1/2) и (—1/2,—1/2). Такая кривая назы- вается спиралью Корню (рис. 8.35); она полезна при рассмотрении vj—1- общих свойств дифракционных кар- тин Френеля. 8.7.3. Дифракция Френеля на прямолинейном крае. Рассмотрим - теперь дифракцию Френеля на полубесконечной плоскости, ог- раниченной острым прямолиней- ным краем. Это особенно важно для выяснения поведения поля вблизи границы геометрической тени. Ограничимся только случаем, когда линия РпР, а также ее проекция (здесь ось х) на полуплоскость перпендикулярна краю (рис. 8.36). Если X — расстояние от края полуплоскости до начала коор- динат (которое лежит на линии РеР), то интегрирование производится по об- ласти — оо < g < X, —сю<Т)<оо, или, переходя к переменным и и v — — оо < и < да, — оо < у < оо, B2) где , /~ 2 ,' \ ГТ ,, ш^ У T{7r + lr)Xcos8- B3) Точка наблюдения Р в зависимости от того, положительно ли X или отрица- тельно, лежит либо в освещенной области, либо в области геометрической тени. Дифракционные интегралы (9) принимают тогда вид Рис. 8.35. Спираль Корню. du _J« du _- —sin ~ do |sin у«аЬ(т< l+cos (fu' 51П -rr sin B4)
396 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 Здесь нарушено условие, принятое при выводе (9), а именно условие, требую- щее, чтобы линейные размеры области интегрирования были малы по сравне- нию е расстояниями Р„О и ОР. Поэтому для обоснования приближенной при- менимости этих формул и в данном случае необходимо более тщательное обсуж- дение остаточных членов. Однако сейчас мы не будем заниматься этим вопросом, так как в дальнейшем дифракация на по- луплоскости будет разбираться более стро- гими методами (см. § 11.5). Рис. 8.36. К дифракции Френеля на прямолинейном крае. Рис. 8 37 Распределение интенсивности в карти- не дифракцш* Френеля на прямолинейном крас. Из соотношений A8) и A9) имеем 4- СП I cos (у та ) dx==-l и аналогично J sin(f ¦*•)*:—J.+.S'fKi), J - ОС — ГД Следовательно, B4) принимает вид 5 = ь \Ц + % и] + [у + 9 и]}, B5) 126) B7) B8) B9) Поведение функции интенсивности B8) можно установить, исследуя спи- раль Корню. Как мы видим, величина 2///1 равняется квадрату расстояния от точки w спирали Корню до «асимптотической» точки Р~ (— -^ , —-5-). Таким образом, если точка наблюдения находится в освещенной области (ш>0), то ///@) осциллирует с амплитудой, уменьшающейся но мере увели- чения расстояния от края тени и, как это следует ожидать на основании гео- метрической оптики, асимптотически приближается к единице. Интенсивность максимальна не на границе геометрической тени, а на некотором расстоянии и подстановка в D) дает окончательно выражение для интенсивности . " где Ml / ~ . /
§ 8.8] ТРЕХМЕРНОЕ РАСПРЕДЕЛЕНИЕ СВЕТА ВБЛИЗИ ФОКУСА 397 от нее в освещенной области (рис. 8.37). На границе теии (w — 0)< имеем ///"" = = 1/4. В области тени ///"" монотонно уменьшается до нуля. Эти выводы хо- рошо согласуются с экспериментальными результатами. § 8.8. Трехмерное распределение света вблизи фокуса В п. 8.3.3 было показано, что распределение света в фокальной плоскости хорошо коррегированной линзы обусловлено по существу дифракцией Фраун- гофера на ее оправе. В §8.5 были подробно изучены картины дифракции Фраун- гофера от отверстий различных форм. Для того чтобы получить более точное представление о структуре оптического изображения, следует изучить распре- деление света не только в геометрической фокальной плоскости, но и вблизи этой плоскости. Представление о трехмерном (Френель) распределении свега вблизи фокуса имеет особенно важное значение для оценки величины допуска в требуемом положении плоскости изображения систем, формирующих изобра- жение. Особенности внефокальных монохроматических изображений точечного источника, полученных с помощью круглого отверстия, были впервые подробно рассмотрены в классическом труде Ломмеля *) 1761. Пользуясь интегралом Гюй- генса — Френеля ему удалось представить комплексное возмущение в виде сходящегося ряда функций Бесселя, а также экспериментально подтвердить явления, предсказанные на основании этих расчетов, Почти одновременное Ломмелем Струве 178] опубликовал подобное, хотя и менее исчерпывающее ис- следование, посвященное дифракции на круглом отверстии. Он не получил та- ких подробных численных решений, но дал полезный метод приближенного расчета интенсивности вблизи границы геометрической тени, где ряды сходятся довольно медленно. Несколькими годами позже Шварпшильд [79] вывел асимп- тотическое приближение для точек наблюдения, находящихся на расстоянии многих длин волн от фокуса. Исследования Ломмеля и Струве не привлекли особого внимания, и в 1909 г. эта задача снова была исследована Дебаем [80]. Дебай установил опреде- ленные общие особенности дифракционного поля и вблизи и вдали от фокуса. Сравнительно недавно исследования перечисленных выше авторов были рас- ширены и были опубликованы диаграммы, показывающие подробную структуру поля в этой комплексной области. Результаты проведенных исследований получили широкое экспериментальное подтверждение как в оптическом, так и в микроволновом (короткие радиоволны) диапазонах. , Рассматривая распределение света вблизи фокуса, мы будем основываться на исследованиях Ломмеля и Струве, но для удобства и наглядности начнем с интегрального представления поля в виде, предложенном Дебаем. 8.8.1. Вычисление дифракционного интеграла й функциях Ломмеля. Рас- смотрим сферическую монохроматическую волну, выходящую из круглого от- верстия и сходящуюся в осевой фокальной точке О. Рассмотрим возмущение U (Р) в произвольной точке Р близ О. Положение точки Р относительно О определяется вектором R. Предполагается, что расстояние R — ОР и радиус аф>Х) отнерстия малы по сравнению с радиусом / = СО волнового фронта W, который в какой-то момент заполняет это отверстие (рис. 8.38). Обозначим через s расстояние от точки наблюдения Р до точки Q на W, а через Л// — амплитуду в точке Q падающей волны; тогда, применяя принцип Гюйгенса — Френеля, получим _ | А е*Р t~**» Г j е*Р У**) ^ A) *) Более поздняя статья [77] касается, дифракции на щели, на непрозрачной полоске и . прямолинейном крае.
398 ЭЛРМШТЫ TFOPHM ДИФРАКЦИИ [ГЛ 8 Поскольку рассматриваются лишь небольшие углы падения, вариации коэф- фициента наклона по волновому фроьту пренебрежимо малы Обозначая через q единичный вектор в направлении 0Q, находим с хорошим приближением s-f = -q.R. B) Далее элемент dS волнового фронта равняется dS = pdQ, C) где clii — -элемент телесного угла, под которым dS виден из точки О Без замет- ной ошибки можно заменить в знаменателе подынтегрального выражения s на/, и тогда уравнение A) запишется в виде jjexpf—tkq R)dQ. D) о Теперь интегрирование производится по всему телесному углу Я, под которым отверстие видно из фокуса Урав- нение D) представляет собой интеграл Дебая и выражает поле как результат суперпозиции пло- !b ских волн, распространяющихся f^jj- во всех направлениях (опреде- ли . *~ ляемых векторами q), попадаю- Lw щих в Я. у Перед тем как вычислять ин- теграл Дебая, отметим интерес- пое обстоятельство, буду чи с\ м- шяаерстия -, MOg элемснтарНЫХ решений (п, ю- Рис в 38 К дифракции „а круглом отверстии схо- Ских волн), он представляет стро- дящрися сферической волны /> к « v гое решение волнового урав- нения и в предельном случае f^-oo (отверстие на бесконеч- ном расстоянии) справедливо во всем пространстве. Конечно, D) нельзя считать строгим решением нашей исходном задачи, так как здесь не уч- тена природа экрана, а точные граничные условия аппроксимируются гранич- ными условиями дифракционной теории Кирхгофа. Точное решение нашей задачи должно содержать не только вклады от плоских волн, распространяю- щихся в направлении падающих геометрических лучей, но и вклады от волн, распространяющихся во всех возможных направлениях*). Однако при выпол- нении упомянутых выше условии (f^>a:p%, f^>R) значительны только вклады от волн, учтенных в уравнении D). \ Для вычисления D) представим подынтегральное выражение в более явном виде Примем за начало декартовых координат точку О и за ось г — линию Ог. Пусть (х, у, г) — координаты точки Р, а E, r\, Q — координаты точки Q. Положим, кроме того, что | = ар sin 6, T] = apcos9, x = г sin if, r/ = rcosi|j. E) Так как точка Q лежит на сферическом волновом фронте W, имеем гк(а\ v~ Т\Т) ,, Следовательно, ^l±^ «Pl?«^S')[^] G) *) Это cooTBercTBjeT представлению поля через так называемый угловой спектр плоских волн (см. п. 11.4 2).
§ 8.8] ТРЕХМЕРНОЕ РАСПРЕДЕЛЕНИЕ СВЕТА ВБЛИЗИ ФОКУСА 399 Полезно на этом этапе ввести безразмерные переменные и и у, которые вместе с г|) определяют положение Р, а именно Заметим, что точка Р лежит в прямом пучке света или в геометрической тени, смотря по тому, будет ли \v/u |=gs 1. Из G) и (8) следует, что если члены с р// в степени, превышающей вторую, пренебрежимо малы по сравнению с единицей, то J + ^-upK (9) Кроме того, элемент телесного угла равен dQ = f = a-$f^. A0) Поэтому D) принимает вид тт^ехр ['№)'"] И exp{-f' f"pcos(e-^) + -i-up«] Jpdpde. (in Интеграл по 9 мы уже встречали, рассматривая дифракцию Фраунгофера на круглом отверстии (см. п. 8.5.2). Он равен 2яУ„(ур), где J0(vp) — функция Бсс- селя нулевого порядка. Следовательно, последнее соотношение можно записать как 1 A2) Рассмотрим по отдельности вещественную и мнимую части интеграла. Положим, что 2 w0 (ир)ехр ( — y 'ЫР2) pdp — С (и, v) — iS(u, v), A3) о где J \ U4) S(«, v)=--2 Г Уо (op) sin (-i up2) pdp. ¦ ' ) Эти интегралы можно вычислить в функциях Ломмеля — 1 Jn+2s(v) A5) введенных им для этой цели *)„ Используя соотношение (8.5.11) (JX ") Полное обсуждение этих функций приводится в [76, 77], а также в книгах [25, 81, 82].
400 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 можно записать С (и, v) после интегрирования по частям в виде 1 С (и, v) — — \ -г- [p^i (VP)] cos (Va мр2) dp = v J яр — — J, (t>) cos Vs и + и \ р3А(ф) sin (Ve ира) ф . A6) L о i Используя опять соотношение (8.5.11), интегрируя по частям и продолжая этот процесс, получим = ,' '*"'¦ U, (и, v) + ™"^lu> U, (и, и). A7а) Таким же способом найдем О/ \ Sill (Vj U) г . . ч COS (V2 «) ГГ у ч /1-7е-\ o{utv) — —j-/ UivM* v) т"* ^г(^* ^)* (*'О) Эти формулы справедливы во всех точках близ фокуса, но удобны для вы- числений, только если | u/v j< 1, т. е. когда точка наблюдения лежит в геомет- рической тени. При \ulv |> 1, т. е. когда точка наблюдения находится в осве- щенной области, более целесообразно применять разложения, содержащие положительные степени v/u. Их можно вывести аналогичным способом с по- мощью интегрирования по частям относительно тригонометрического члена. Первый этап дает i С (и, v) = 4 J У„ (»р) L [Sin (V, ар8)] dp = о 2 Г С П = — 70(u)sinl/2M— v j У, (ф) sin (»/г ар2) р dp : A8) L_ 0 _ здесь использовано соотношение (8.5.15) ^ [x'"Jn{x)\ =—x~nJn+l (x). Снова интегрируя по частям и используя последнее соотношение совместно с хо- рошо известной формулой (которая выводится из разложения в ряд Jn{x)) ""„ х» 2» и! получим ^ , ч sin f1/., С( v) )'- ,) 1 /и2 у Ряд, написанный в первых двух строчках, содержит две функции Ломмеля Vn, ¦л третья строчка представляет собой разложение в ряд sin (v"!2u). Следова- тельно, С (и, v)^smv~+^flvAu, v)-^^VAu, v). B0a) Аналогичным образом получим для другого интеграла выражение S(». °) = l"»&-JSZ?!!*Vt<ku. v)-^lVl{u, v). B06)
§ 8.8] ТРЕХМЕРНОЕ/РАСПРЕДЕЛЕНИЕ СВЕТА ВБЛИЗИ ФОКУСА 401 Этим завершается формальное решение нашей задачи. Далее мы обсудим неко- торые выводы из него. 8.8.2. Распределение интенсивности. Согласно A2), A3), A7) и B0) ин- тенсивность / = | U |г близ фокуса определяется двумя эквивалентными выра- жениями, а именно 4)'[(/!(«'") +tfi(«. о)]/о B1а) где г (ла' "\ (991 0 — \ ХН ) *¦ ' •—интенсивность в геометрическом фокусе u = v = Q. Из A5) следует, что Ut(—и, v) =—?Л(и, v), U2(—и, v) = U2(u, v), Vo(—и, o)=V,,(m, о), V1 (—и, v) = — V^m, v). Таким образом, I (и, v) остается неизменной при замене и на—и. Значит, близ фокуса распределение интенсивности симметрично относительно гео- метрической фокальной плоскости. Конечно, распределение интенсивности симметрично также и относительно оси v = 0. По формулам B1) Ломмель рассчитал распределение интенсивности для ряда выбранных плоскостей, находящихся вблизи фокуса; он экспериментально подтвердил также некоторые свои расчеты *). Линии равной интенсивности (называемые изофотами) вблизи фокуса, построенные по данным Ломмеля, приведены **) на рис. 8.39. Особый интерес представляет «трубчатая» структура светлой центральной части дифракционного изображения, хорошо заметная на рисунке; ее существо- ванне посг\ лировалось на основании экспериментальных данных еще в 1894 г. Тейлором [921. Именно этой структурой изображения определяется допуск в положении плоскости изображения в системах, формирующих изображение. Ниже рассматриваются несколько интересных частных случаев. а. Интенсивность в геометрической фокальной плоскости. Для точек, лежащих в геометрической фокальной плоскости, и ~ 0, и уравнение B1а) приводится к /@, f)=4lim[^("' ">+Ц|<", "Я/ B3) Из уравнений, определяющих функции Un, следует, что lim |~l/, (и, а)] _ Jj_ (v) t Hm [Uj(u, v) поэтому B5) *) Сходные эксперименты описаны также в [83, 84]. Аналогичные опыты с микроволнами изложены в [85! для отверстия круглой формы и в [86] — для прямоугольного отверстия **) Похожие, но менее детальные графики опубликованы в [87] Они воспрои.чветспы в некоторых книгах с ошибками (неправильное положение геочетричеекон тени и перепутанные оси} Другой тип графикой, по существу соответствующий рис 8 39, приведен Ценнике и Ниж- бе-роч в |89] Они исходили из другого, но эквивалентного разложения (см (9 4 121) дифоак- циочного интеграла Графики, рассчитанные иа основе электромагнитной теопии и показываю- щие распределение зн!ск1ричсскои энергии и потока энергии, приведены в [89а]. А' алог 'чпые диыгра?Мы для кольцевого отверстия опубликованы Линфутом и Вольфом [90]. HcKOTopi.R применен! я исследовании Ломмеля к дифракции на системе концентрических кольцеобразных отверстий приведены в [91]. 26 М. Ьорн, d. Вольф
402 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 Как и следовало ожидать, мы получили формулу Эйри (8.5.14) для дифракции Фраунгофера на круглом отверстии. б. Распределение интенсивности вдоль оси. Для точек," лежащих на оси, с = 0, и обе функции Vn, входящие в выражение B16), запишутся в виде У„ (и, 0)^=1, Vt(u, 0) = 0. Следовательно, /@, ,) = ;1[2-2созG3«)]/„.=.(?^)г/0. B6) Таким образом, интенсивность вдоль оси характеризуется функцией (sin xix)*. Рис. 8.39. Изофоты (линии интенсивности /(«, у)) в меридиональной плоскости вблизи фокуса сходящейся сферической волны, дифрагировавшей на круглом отверстии (из [87]). Интенсивность в фокусе нормиоована к единице. Пунктирные линии показывают границу геометри- ческой тени. При вращении рисунка вокруг оси и минимумы на оси v вырисовывают темные кольца Эйри. рассмотренной нами в п. 8.5.1 в связи с дифракцией Фраунгофера на прямо- угольном отверстии. Первый нуль интенсизности на оси получается при и/4 = 2ла3гД/2= ±я, т.е. на расстоянии г = ±/2Я/2а2 от фокуса. Обычно потеря интенсивности в центральном пятне изображения, дости- гающая 20%, считается допустимой. Так как Р'"ц"; М уменьшается на эту величину при смещении плоскости изображения от положения u — Q до положения и « 3,2, то, следовательно, допуск на П9ложение фокальной пло- скости Дг равен приблизительно AKA)Ч. B7) Например, при использовании пучка //10(J/a = 20) для света с длиной волны Х = 5-10~6 см этот допуск составляет около ±0,5-202-5-10~5 ли = ±0,1 мм. в. Интенсивность вдоль границы геометрической тени. Для точек на гра- нице геометрической тени и = ±v. Распределение интенсивности симметрично относительно геометрической фокальной плоскости, и поэтому, не теряя общ- ности, можно считать и положительным. Тогда функция Un сведется к U4 {и, ц) = 2 {-\У J2S+1 (и), ?/, (и, и) = 2 (-1)» У„+, (и). S=0 S=0 Напомним хорошо известное тождество Якоби (см., например, [25]) да cos (и cos 6) = Jo (и) + 2 2 (— 1У Jus («)cos 2s6> s=l sin (u cos 6) = 2 2 (—l)s ^2s+i («) cos Bs+ I) 6. B8) B9)
8.8] ТРЕХМЕРНОЕ РАСПРЕДЕЛЕНИЕ СВЕТА ВБЛИЗИ ФОКУСА 403 Полагая 6 = 0, из сравнения с B8) находим ?/,(«. «) = V, sin и, Ua(u, u)=*llt[Ja{u) — cos u], и B1а) сводится к U C0) — /о- C1) График этой функции показан на рис. 8.40. 8.8.3. Суммарная интенсивность. Представляет интерес определить часть L от усредненной по времени полной энергии, проходящей через небольшое круглое отверстие заданного радиуса г0 около осевой точки плоскости и — const изображения. Если C2) — полная энергия, падающая на отвер.- стие в единицу времени, то искомая часть энергии равняется L(u, vo)= / (и, v) rdrdty — I (и, v)vdv, 08 OS 0,2 О \ \ \ \ 4 4 S 8 а где C3) C4) Рис. 8.40. Изменение интенсивности вдоль границы геометрической тени. График функции I-2J» (и) cos и + Л (и) р („)= »— Подставив выражения B1) Ломмеля для интенсивности в C3), можно разложить интеграл в ряд, содержащий функции Бесселя. Так как эта процедура слишком длинна, мы приведем только окончательный результат, полученный Вольфом [931. Асимптотические приближения для Ци, v) получены Фокке [94]. Здесь мы снова получим два формально различных выражения, одно, удобное для вычислений, когда граница маленького круглого отверстия нахо- дится в геометрической тени, другое — удобное при расчете, когда это отвер- стие находится в прямом пучке света. Отбрасывая индекс нуль, т. е написав v вместо va, получим в первом случае (\v/u\^l) I (и, v) = 1 — X JTTT (tY* Qis (t))> C5a) as p=0 p s p Во втором случае (|о/и|^ 1) находим где величины Q задаются C6), а У, и Fa определяются выражениями C7> 26'
404 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [гл 8 На рис.8 41 показано семейство кривых L(u,v), рассчитанных по этим форму- лам. В известном смысле эти кривые можно считать аналогами лучей в геомет- рической оптике 20 30 40 и Рис 8 41 Семейство кривых Ци, v), показывающих часть полной энергии, попадающей внутрь небольшого кружка с центром на оси в выбранной плоскости изображения и =const [93J Следует отметить, что в частном случае, когда плоскость изображения сов- падает с фокальной плоскостью (и — О), соотношение C5а) принимает вид что находится в согласии с формулой Рэ- лся (8 5 18) Особый интерес представляет случай, когда кружок, по которому берегся интег- рал C3), совпадает с сечением геометри- ческого конуса лучей Тогда |vhi \ =\, ряды в C5а) и C56) можно просуммиро- вать, и мы получим [93] Ци, и) = 1 — ¦ ./„ (и) cos и—Jх (и) sin и. C9) Следовательно, выражение е (и) = Л (и) cos и+./,(«) sin u DQ) дает часть полной энергии, попадающую в геометрическую тень, в плоскости и = — сонь! График функциие(ц) приведен на рис 8 42, она уменьшается не монотон- но, а имеет максимумы (кроме «= 0) при J,(u)=0 и минимумы при smM = 0(«#0). 8.8.4. Фазовые соотношения. Рассмотрим, наконец, поведение фазы возмущения в области близ фокуса Согласно A2) и A3) фаза (не считая адди- тивного члена (—wt)) определяется выражением *) ср(и, v)^=(f/aJu—x(u< f)—я/2 (mod2л), D1) где с . s О 2 4 6. 8 10 0 "гО 30 40 50 —"и Рис 8 42 Часть г(а) от полной энер- гии, приходящейся на область, зани- маемую геометрической тенью [93] В D2) квадратный корень берется со знаком плюс. *) Символ mod 2и справа от уравнения означает, что обе части уравнения определены с точностью до аддитивной постоянной 2 тя, где т — целое число.
§ 8.8] ТРЕХМЕРНОЕ РАСПРЕДЕЛЕНИЕ СВЕТА ВБЛИЗИ ФОКУСА 405 Заметим, что, в отличие от распределения интенсивности, распределение фаз нельзя выразить только через аи», так как оно имеет структуру, завися- щую от угловой апертуры геометрического пучка лучей. Далее каждая «ветвь» многозначной функции <р (и, v) непрерывна по и и v во всех точках, где интен- сивность не исчезающе мала, а в точках с нулевой интенсивностью она неопре- деленна. В фокусе, где и ¦— v -¦= 0, одно из ее значений равно —л/2. Синфазные поверхности (поверхность, где ср — const) — это, конечно, по- верхности вращения относительно оси и. Покажем, что такие поверхности об- ладают еще и другой симметрией, определяемой соотношением v) = —я (mod 2я). ф(—и, Из A4) имеем: С(—и, и) = Тогда из D3) следует, что cosj((—и, w) = cos%{«, о), а из уравнения D2) с учетом D3) и cos[q>;(—и, 1>) + ф(и, u)]=cos[—-%( = — cos[x( и, v)cosx( v), S(—и, v) = —S(u, v). D5) и, к, %(—и, v) находим —sin%{u, о), л] D3) D4) D5) v)\ = —и, =' — cos*%(u, v)—sin2x(u, u) = —1. D6) Следовательно, «зеркальное изображение» плоскостью и—О любой синфазной поверхности ф = ф0 также является синфазной поверхностью ф= — я—ф0. На рис. 8.43 показаны профили синфазных поверхностей гомоцентриче- ского пучка лучей с //2. Вдали от фокуса синфазные поверхности совпадают 42 40 38 36 к 32 30 28 26 24 22 2в' 18П16151413121110Э8 7654 зЩо 12 3 в№ Расстояние в длинах ваян 3я Рис. 8.43. Профили синфазных поверхностей ip (и, o)=const вблизи геометрического фоку- са [95] X—-10~6 см, а=2,5 см, f^=10 см. Кппстаптыдля поперхпостей отличаются на и пт величин, приведен- ных в статье Флрнелла. йто сдельно для того, чтобы согласовать рисунок с нашим текстом, где. согласно E1). фаза в фокусе принята за -я/2, тогда как у Фарнелла она принята за +я/2. со сферическими волновыми фронтами геометрической оптики, но все сильнее и сильнее деформируются по мере приближения к фокальной области. В непо- средственной близости от геометрической фокальной плоскости они показаны на рис. 8.44. Как мы видим, вблизи фокуса синфазные поверхности достаточно плоски, но расположены в 1 — а"/4/2 раз дальше, чем это было бы в параллель- ном пучке света с такой же длиной волны. Более того, на каждой синфазной поверхности интенсивность непостоянна (см. рис. 8.39). В непосредственной близости к темным кольцам Эйр и (обозначенным на рис. 8.44 через Ri и R2) поведение синфазных поверхностей более сложно. При перемещении точки на- блюдения в направлении v от геометрического фокуса фаза остается постоянной в промежутке мсжд\ любыми двумя соседними темными кольцами, но при пере- сечении каждого кольца внезапно изменяется на я. Справедливость последнего
406 элементы теории дифракции [гл. 8 утверждения вытекает из выражения B4) для комплексного возмущения в гео- метрической фокальной плоскости, т. е. ' ) = ±QMVT,. D7) Так U(О как последнее выражение чисто мнимое при всех значениях v, то фаза ', и) может равняться только—л/2 или +я'2 (mod 2я), и поскольку ее знак изменяется при пересечении каж- дого темного кольца, то фаза из- меняется па я скачком. Такой же скачок наблюдается и при переходе через каждую осевую точку с нулевой интенсивно- стью. Интересно также рассмот- реть изменение фазы поля при движении точки наблюдения вдоль каждого луча, проходяще- го через фокус. Это удобно сде- лать, сравнивая такие изменения с изменениями фазы сферической волны, сходящейся в фокус в полупространстве г<0 и расхо- дящейся затем в полупростран- стве г>0. Приняв фазу ср этой волны сравнения в фокусе за нуль, получим Ф(и, о) =—kR, если и г^О, Ф(ы, v) = -{-kR, если ы>0, D8) где, как раныце, R = = Кх2+г/'2-Ьг2>0— расстояние между точкой наблюдения и фо- кусом. Разность , v) — c v) D9) называется аномалией фазы. Из D3), D8) и D9) следует, что 6(—и, v)-\-6(u, t)) = = —л (mod 2л), E0) тогда как в самом фокусе 6@, 0) = ф@, 0)--= = —- (mod 2л). E1) Аномалия фазы вдоль выбранных лучей гомоцентрического пучка с //3,5, про- ходящих через фокус, показана на рис. 8.45 Как видно на рисунке, при прохождении через фокус вдоль любого луча, кроме аксиального, 6"испытывает быстрое, но непрерывное изменение на я. Этому эффекту, наблюдавшемуся много лет тому назад Гуи [96], были посвя- Рис. 8.44. Профили синфазных поверхностей в не- посредственной близости от геометрической фокаль- ной плоскости гомоцентрического пучка с f/3,5 [87]. ORt и ОЯа—радиусы первого и второго темных колец Эйри
§ 8.9] ГРАНИЧНАЯ ДИФРАГИРОВАВШАЯ ВОЛНА 407 щены многочисленные исследования (обзор литературы приведен в [97], ссылки на более поздние исследования можно найти в [87]). Вдоль оси, однако, анома- лия фазы ведет себя особым образом, она изменяется периодически от 0 до —я. Рассматривая асимптотическое приближение интеграла Гюйгенса ¦— Фре- • неля при больших k (коротких длинах волн), нетрудно показать, что фаза скач- ком меняется на л/2, когда свет проходит через каждый из двух главных цент- ров кривизны соответствующих волновых фронтов [12, 82]. Разобранный выше Рис 8.45. Аномалия фазы _8 вдоль геометрических лучей, проходйцих через фокус гомоцентри- ческого пучка с //3,5 |87]. 6 —угол наклона луча к оси. случай соответствует особому положению, когда оба центра кривизны совпада- ют. Поэтому изменение фазы на половину периода соответствует решению в рамках геометрической оптики (обсуждение этого вопроса см. в [98]). На рис. 8.45 показано, как разрывы в геометрической оптике превращаются в не- прерывные переходы, если учитывается конечность длин волн. Наконец, со- шлемся на статью Фарнела 199], в которой описано экспериментальное исследо- вание структуры распределения фазы в области фокуса линзы. Это исследова- ние, проведенное в микроволновом диапазоне, дало очень хорошее совпадение с предсказаниями теории. § 8.9. Граничная дифрагировавшая волна Если рассматривать край дифракционного отверстия (или препятствия из точек, лежащих внутри геометрической тени), то он кажется светящимся. Это было известно уже Юнгу [100], пытавшемуся еще до Френеля теоретически объ- яснить дифракцию, исходя из волновой теории. Юпг полагал, что падающий свет испытывает род отражения па краю дифрагирующего тела и рассматривал дифракционную картину как результат интерференции падающей волны и
4Q8 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 отраженной «граничной волны». Однако представления Юнга были выражены только качественно и пе получили широкого признания. Наличие элементов истины в теории Юнга стало очевидным только после того, как Зоммерфельд получил в 1894 г. строгое решение задачи о дифракции плоских волн на плоском полубесконечном отражающем экране (см. § 11.5). Это решение показывает, что в геометрической тени свет распространяется в виде цилиндрической волны, которая кажется исходящей от края экрана, тог- да как в освещенной области она представляется суперпозицией цилиндриче- ской и исходной падающей волн. Возникает вопрос, можно ли и в более общем случае объяснить дифракцию как совместное действие падающей и граничной волн. Этот вопрос был иссле- дован Магги [101] до появления работы Зоммерфельда. Но его результаты, Рис 8.46. К выводу выражении для граничной дифрагировавшей волны. по-видимому, были забыты *). Позднее независимое и более полное исследова- ние было выполнено Рабиновичем [105J (см. гакже 1106]; исчерпывающий обзор исследовании граничной волны дан в [107]). Теория Магги—Рабиновича в дальнейшем была развита Миамото и Вольфом [107] (см. также [109]). Рассмотрим монохроматическую световую волну, распространяющуюся от точечного источника Р„ через отверстие в плоском непрозрачном экране. Как и раньше, предположим, что линейные размеры отверстия велики по срав- нению с длиной волны, но малы по сравнению с расстояниями от Ро и точки на- блюдения Р до экрана; допустим также, что углы падения света и углы дифрак- ции малы. Тогда в приближениях, принятых в теории Кирхгофа (см. п. 8.3.2), имеем д где jl — дифракционное отверстие, а другие символы имеют такие же значения, как и раньше. Построим замкнутую поверхность, ограниченную отверстием <//, поверхностью усеченного конуса 3d с вершиной в Ро и образующими, про- ходящими через край отверстия, и частью % большой сферы с центром в Р (рис. 8.46). Если через R обозначить расстояние от Р0ДО Р, то получим строго из интегральной теоремы Кирхгофа 33 3 IT" а» _ejks_ a ,*__,, dS==s__ иди Qj B) в зависимости от того, находится ли точка Р внутри выбранной поверхности или вне ее. Теперь таким же путем, как и в п. 8.3.2, можно сделать вклад от i? *) Работа Магги обсуждается также в [5, 102]. Экспериментальное подтверждение «су- ществования» граничной волны можно найти в 1103] (см. также [104]).'
§ 8.9] ГРАНИЧНАЯ ДИФРАГИРОВАВШАЯ ВОЛНА 409 пренебрежимо малым, взяв радиус сферы достаточно большим. Тогда из A) и B) получим U (Р) = ?/<*> (Р) + ?/«*> (Р), C) где rng)(n\ е'*^ - если точка Р находится и ("> /j ' в прямом пучке, ) (p-j _ Q; если точка Р находится в области геометрической тени t/'г1 представляет возмущение, предсказанное геометрической оптикой, поэтому Uw> должно представлять влияние дифракции. Теперь покажем, что (/"" можно преобразовать в криволинейный интеграл по краю отверстия. Отметим сначала, что сферы г—const пересекают под прямым углом усе- ченный конус 33. Поэтому на ЭЗ Кроме того» Следовательно, E) сводится к t/uo (p.) = _^_ , s) = f — e'*s cos(n, 6). _2.) cos ( i?) (8) Можно взять в качестве элемента dS площадь ABB'А', ограниченную участками двух соседних образующих и дугами окружностей, по которым Рис. 8.47. К выводу выражения для граничной дифрагировавшей волны. Р„А = г, PaQ=rt, PA = s, PQ = st. сферы г = const и r+dr = const пересекают конус (рис. 8.47). Если dep — угол между выбранными двумя образующими, то dS = rdrdy. (9) Пусть Q и Q'— точки пересечения двух образующих с краем Г отверстия, и пусть dl —- длина элемента Г между этими двумя точками. Если dl'— соот- ветствующий элемент дуги окружности, по которой сфера радиуса гх= P0Q пересекает кон.»с, то dl' = r1dy=dlcos(dl, cM'J-.-d/sin^!, dl). A0)
410 ЭЛЕМЫПЫ ТЕОРИИ ДИФРА1ШИИ [ГЛ. S Из (9) и A0) имеем dS.-—sin (/¦„ dl)drdl. A1) Далее, беря проекцию на нормаль к конусу в A mQ (нормали в этих точках параллельны), находим SCOS(ll, s) = SjCOS(n, !>,). A2) Подставляя A1) и A2) в (8), получим , ^.Lsin^, dt)drill- jd/!Lcos(n, s,)sin(r,, dZ)jexp[tt(r + s)](^-^-)dr. A3) Далее покажем, что подынтегральное выражение второго интеграла в A3) представляет собой полный дифференциал, т. е. Ш?&} A4) Выполнив дифференцирование в правой части A4), получим схр [ik (fTs)| I exp [ik (r-\-s)} dr\s[S-\-r — Г1 + Sj COS (S,, Л,)] / S[s-f/- — /•] 4-S] COS (S,, Tj)] X1 Теперь из треугольника APQ имеем S! = s* + (r—rly+2s1(r—r1)cos(s1, /4); A6) отсюда, дифференцируя по г и считая гх и Si постоянными, находим ST-=r —Л,+S1COS(S1, /¦(). A7) Подставляя это в A5), получим,тождество A4). Следовательно, 1 S+r — fj-rS] CDS(i1; r,)j Jr, si |1 + COS (s,, Г! и окончательно A3) принимает вид sm (rn Л)Л. A9) Это выражение совместно с C) и D) называется «.представлением Рабиновича» дифракционного интеграла Кирхгофа и может рассматриваться как математи- ческая формулировка теории Юнга. В ней дифракция рассматривается как взаимодействие падающей волны, распространяющейся по законам геометри- ческой oi тики, и граничной дифрагированной волны, которую можно считать возникшей вследствие рассеяния падающего света на границе отверстия. Поскольку U—непрерывная функция положения, из соотношения D) следует, что граничная волна Uul] испытывает разрыв на границе геометриче- ской тени, который компенсирует разрыв «геометрической волны» l/<s>. Разрыв в Uld) обусловлен наличием в знаменателе A9) множителя [1 +cos(sT, r,)]. Воспользовавшись аргументацией, совпадающей с доводами, выдвинутыми в связи с классификацией дифракционных явлений (см. стр. 355) и иллюстри-
§ 8.10] МЕТОД ГАВЬРА ЯОССТАНОВЛЕНИЯ ВОЛНОВЫХ ФРОНТОВ 411 рующими физический смысл принципа стационарной фазы (см. приложение 3), находим, что только те точки в области интегрирования вносят существенный вклад в ?/"", для которых в подынтегральном выражении фаза постоянна, т. е. ?1*0-1 + *)] =0. B0) Это соотношение можно также записать в виде «закона отражения» cos(/-1P dl) = — coB(slt dl). B1) а) ОВражание голограммы §8.10. Метол Габора получения изображения восстановлением волновых фронтов J) Исследуя пути, позволяющие улучшить разрешающую силу электронного микроскопа, Габор [ПО] создал новый двуступенчатый метод получения опти- ческого изображения. На первой ступени объект освещается коге- рентной электронной или свето- вой волной. Предполагается, что значительная часть волны про- никает в объект без возмуще- ния **). Дифракционная карти- на, образовавшаяся в резуль- тате интерференции вторичных волн, возникающих в присутст- вии объекта, с сильной опорной волной (когерентный фон), заре- гистрированная на фотопластин- ке, называется голограммой. Ес- ли такую пластинку, надлежа- щим образом обработанную, по- местить на место объекта и осве- тить только когерентной опор- ной волной, то прошедшая сквозь эту пластинку волна будет нести информацию об исходном объ- екте, которую можно извлечь из фотографии оптическими мето- дами. Для «восстановления» объ- екта по этой «замещающей» вол- не необходимо только направить последнюю в подходящую систему, образующую изображение, и тогда изобра- жение появится в плоскости, сопряженной с плоскостью, в которой находился объект. Здесь мы только коснемся оптических принципов этого метода***). 8.10.1. Изготовление позитивной голограммы. Рассмотрим монохромати- ческую волну, идущую от небольшого источника 5 и падающую на полупро- зрачный объект а (рис. 8.48, а). Пусть Ж — экран, находящийся на некотором Б) Восстановление изображения в) Эквивалентное оЗнаступенчатае отИраженяе Рис. 8.48. Метод Габора получения изображения путем восстановления волновых фронтов. *) Подробное изложение теории голографии дается в работах [120*—122']. (Прим. ред.) ••) Это означает, что если волну представить в виде суммы падающей и вторичной диф- рагировавшей волн, то рассеянием вторичных волн можно пренебречь. Указанное пренебреже- ние известно как первое борцовское приближение и находит широкое применение в теории рассеяния рентгеновских лучей и электронов. Границы применимости этого приближения в электронной микроскопии и интерферометрии рассмотрены в [111]. **") Для детального изучения этого метода и его вариаций, а также для ознакомления с возможными применениями голографическоЗ техники см., например [112].
412 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. 8 расстоянии за объектом, и пусть U = Аеш — комплексное возмущение в произ- вольной точке Ж; здесь А —амплитуда (вещественная) hi|) — фаза возмуще- ния. Будем считать U суммой двух членов, а именно U — (/u>+ Uis) = ехр(й|О [Au) -+- Ли>ехр [i (i|)j—ЧО]]* (D Здесь С/1" = Л(Л exp(iij3i) — падающая волна (или когерентный фон); это поле, которое имелось бы на Ж в отсутствие объекта. Другой член ?/"' = = Аш ехр (ii|;s) представляет вторичную, или дифрагировавшую волну; именно она несет информацию относительно объекта. Согласно A) амплитуду полного возмущения U можно выразить через амплитуды и фазы этих волн в виде А = VUU * = У(А^у -р (ДМ)' + 2Аи>А«> cos (ips — ip,.). B) Как обычно, мы опустили временной гармонический множитель ехр (— iat) и, следовательно, подразумеваем, что вторичные волны, исходящие от объекта, имеют частоту падающей волны. Такой объект называется рассеивагпелем Рэлея; почти все нефлуоресцирующие объекты можно с хорошим приближением отнести к этому типу. Предположим теперь, что в плоскость Ж поме- щена фотографическая пластинка. Пусть а.— ко- эффициент пропускания пластинки, определяемый аналогично функции пропускания F п. 8.6.1 как отношение комплексной амплитуды волны, про- шедшей сквозь пластинку, к комплексной амнли- 1дЕ туде волны, падающей на нее. Соответствующий Рис. 8.49. Кривая Хертера - коэффициент пропускания для интенсивности ра- Дриффмьда (характеристи- вен т=оих*. Величина D, определяемая соотноше- ческая кривая). нием D = — lgx = — Igcccc*. C) называется оптической плотностью (или почернением) пластинки. Произведе- ние Е интенсивности /— А1 света, падающего на пластинку, и времени вы- держки t, т. е. Ц>=П, D) называется просто экспозицией (или световой суммой). График зависимости D от lg ? называется кривой Хертера—Дриффельда (характеристической кривой); типичная форма такой кривой показана на рис. 8.49. В области между точками Р и Q кривая имеет вид практически прямой линии, и если се наклон равен Г, то, очевидно, для почернения негатива имеем E) где Do я Ео— постоянные. Используя C), получим При поглощении без изменения фазы а — вещественное число, равное квад- ратному корню из коэффициента пропускания для интенсивности, т. е. У т. Следовательно, в этом случае амплитудный коэффициент пропускания <хп «негативной голограммы» определяется соотношением вида ап = (КпА)-?«, G) где Кп пропорционально квадратному корню из времени экспозиции. Предположим теперь, что изготовлен позитивный отпечаток негативной голтраммы. Тогда амплитудный коэффициент пропускания а.р позитива будет
§ 8.101 МЕТОД ТАБОРА ВОССТАНОВЛЕНИЯ ВОЛНОВЫХ ФРОНТОВ 413 равен гjy- , ту- лх-ГпТ-Г» [S AT fg\ где Г —Т-пТр — «общая гамма» негативно-позитивного процесса, а К ~ KJTnKTn- 8.10.2. Восстановление. В процессе восстановления (см. рис. 8.48, 6) позитивная голограмма Ezf+), у которой амплитудный коэффициент пропуска- ния определяется (8), освещается одним только когерентным фоном с/. Ко- герентный фон осуществляется просто удалением объекта или иным способом с сохранением геометрии первоначальной схемы. Замещающая волна U', прошедшая сквозь пластинку, выражается, согласно B) и (8), соотношением U' --= apUi!> = К А™ ехр (tip,.) [(Л1/>J + (Au Если выбрать Г = 2, то + 2 A W > cos (% —- (9) * I Сравнивая A0) и (I), можно показать, что при постоянном Л(Л, т. е. при одно- родном когерентном фоне, замещающая волна V содержит компоненту, назы- ваемую восстановленной волной, пропорциональную U (первый и третий члены в A0)). Остаток A0) состоит из двух членов. У одного из них фаза такая же, как у опорной волны, а амплитуда к (Als)J/Aa) раз больше. Этот член можно сде- лать очень малым, применяя достаточно сильный когерентный фон *). У дру- гого члена амплитуда (К(A{t))iA(s)) такая же, как и у восстановленной волны, а сдвиг фазы имеет знак, противоположный знаку фазы опорной волны. Этот член представляет сопряженную волну; можно считать, что она обусловлена воображаемым объ- ектом, аналогичным истинному, но находящимся в другой пло- скости. Для того чтобы показать это, вернемся ненадолго к схеме,. Рис. 8.50. Схема, иллюстрирующая положение со- пряженного объекта. приведенной на рис. 8.48, а; обо- значим через Oi какую-нибудь точку объекта а, а через Р — какую-нибудь точку плоскости Ж (рис. 8.50). Можно допустить, что при осве- щении объекта точечным источником S свет приходит в точку Р двумя путями, а именно по прямому пути SP (соответствующему опорной волне) и вдоль пути дифрагировавшего вторичного луча ОгР (соответствующему вторичной волке). Предположим сначала, что при дифракции на Oi не происходит сдвига фаз. Тогда дифрагировавший свет в Р отстаег от прямого света, и разность хода рав- на OiP— О-iA, где А — точка пересечения; линии SOX со сферой радиуса SP и с центром в S. Сопряженная волна опережает прямую волну на такую же величину, на которую вторичная дифрагировавшая волна отстает от нее, так что сопряженная волна догоняет прямую в точке О2 на продолжении линии SOlt где О.Р—О.А^РО.—АО,. A1) Пусть ru R и г2— расстояния от точек Ох, А и О2 до 5, а а — угол между SP *) Сильный когерентный фои использован также в методе, предложенном Цернике [113] для выявления слабых вторичных интерференционных полос.
414 ЭЛЕМЕНТЫ ТЕОРИИ ТИФ'МСЦИН [ГЛ. 8 и линией SOiAOz (см. рис. 8.50); тогда уравнение A1) можно переписать в виде V{R cosa — rj-1 + R" sin2 а—-(Я — rt) = Vr(ri — /? cos aK + i? sin2 а — (гг— R). A2) Разлагая обе части A2) в ряд по степеням а и оставляя только первые члены, получим 4 Если бы голограмма была изогнута по сфере радиуса R, то тогда последнее со- отношение осталось бы справедливым для любой точки на ней. Следовательно, в таком случае можно считать, что сопряженная волна обусловлена мнимым объектом, который в свою очередь является изображением первоначального объекта в сферическом зеркале радиуса R с центром в 5 (см. D.4 16)). Очевидно, что этот результат как хорошее приближение справедлив н в случае плоской голограммы, если лучи составляют с осью небольшие углы Если, кроме того, rJR мало по сравнению с единицей, то, согласно A3), гг?к—гь и значит, сопря- женный и истинный объекты располагаются симметрично относительно источ- ника S. До сих пор предполагалось, что дифракция на объекте не изменяет фазы падающей волны. Если же фаза изменяется, то предыдущее рассмотрение, ка- сающееся положения сопряженного объекта, остается в силе при условии, что сопряженный объект вызывает такое же изменение фазы, как и истинный, но имеет противоположный знак. Возвращаясь к уравнению A0), мы видим, что если когерентный фон одно- роден и достаточно силен по сравнению с рассеянной волной, то восстановлен- ная волна U' оказывается точно такой же, как и первоначальная, за исключе- нием вклада, который можно рассматривать как результат действия сопряжен- ного объекта. Следовательно, помещая линзу L позади позитивной голограммы, освещенной лишь сильным когерентным фоном (см. рис. 8.48, б), мы получим изображение а' первоначального объекта в сопряженной плоскости, в которой лежит а. Вообще говоря, это изображение искажается вкладом, обусловленным сопряженным объектом. Однако можно найти условия, при которых искажаю- щий эффект мал. Грубо говоря, можно ожидать, что он будет невелик тогда, когда расстояние между изображениями первоначального и сопряженного объ- ектов превышает определяемую (8.8.27) величину допуска на положение фо- кальной плоскости для пучка, образующего изображение. Недавно Лейт и Упатникс [114] значительно улучшили технику восстанов- ления волнового фронта, изменив способ наложения когерентного фона па пу- чок, прошедший сквозь объект. В их установке, в которой использовался свет лазера, опорный пучок направлялся с помощью призмы или зеркальной сис- темы под углом на плоскость голограммы. Сопряженное изображение в этом случае образуется в другом направлении и, следовательно, высококачествен- ное изображение восстанавливается без всяких помех. Голограмма содержит трехмерную информацию. Это также было показано Лейтом и Упатпиксом и иллюстрируется рис. IV (см. вклейку). На рис. 8.48, в приведена эквивалентная схема одноступенчатого процесса образования изображения, а на рис. III (см. вклейку) показаны увеличенный объект, голограмма и восстановленное изображение, полученное в одном из первых экспериментов такого рода. Эти результаты подтверждают наш вывод о том, что, используя когерент- ный свет, можно восстановить изображение объекта с высокой степенью точ- ности юлько по зарегистрированному распределению интенсивности в какой- нибудь плоскости, находящейся позади объекта.
! § 8.10} метод гавора восстановления волновых фронтов 415 Для успешного применения этого метода совершенно не обязательно, чтобы волновые фронты от источника S были строго сферическими. Необходимо только, чтобы геометрическая форма волновых фронтов опорной волны в схе- мах, изображенных на рис. 8.48, an б, была одинаковой. Не обязательно также применение того же источника света или излучения с теми же длинами волн. В этой связи очевидны перспективы применения данного метода в электронной микроскопии. Одним из основных факторов, ограничивающих разрешающую силу электронного микроскопа, служит сферическая аберрация объектива; как отмечал Габор, влияние сферической аберрации в принципе можно устра- нить, или, лучше сказать, скомпенсировать с помощью метода восстановления. Для получения голограммы следует воспользоваться электронным пучком, для восстановления — видимым светом. При этом надо имитировать сферическую аберрацию электронного объектива, используя световые волны со сферической аберрацией такой же величины *) (конечно, измененной в отношении ^„1С,'Кжк,^т)- Хотя в те годы, к которым относится это изобретение, трудности i технического характера помешали использовать метод Габора в электронной ¦ микроскопии, правильность его основных принципов была проверена в экспе- риментах со светом. Восстановление волнового фронта как метод двуступенчатой фотографии имело важного предшественника. Речь идет здесь о методе оптического фурье- , анализа, применяемом для восстановления кристаллической структуры по ее (Дифракционной картине. Этот метод был впервые предложен Бэршом I116J . и независимо от него Брэггом [117] (см. также [118]), который назвал свое уст- ройство рентгеновским микроскопом. При освещении кристалла параллельным пучком рентгеновских лучей угловое распределение интенсивности дифраги - , ровавшего света, зарегистрированное на фотопластинке, пропорционально, по крайней мере для малых углов отклонения, квадрату модуля фурье-образа проекции распределения электронной плотности в кристалле, спроектирован- ной на плоскость, расположенную под прямым углом к первоначальному пуч- ку **). То обстоятельство, что в этом опыте регистрируются только интенсивно- сти, тогда как фазы остаются физически неопределенными, вообще говоря, мршает прямому восстановлению. Недостающие величины следует получать из других фотографий, из предшествующего изучения химической структуры и предварительных работ. Обработка измерений сравнительно проста, если направление освещения совпадает с осью кристалла; тогда можно показать, что при строго когерентном освещении фазы всех дифрагировавших волн либо совпадают, либо противоположны, и, значит, каждый наблюдаемый дифракци- онный максимум соответствует только двум возможным фазам. Во всяком слу- чае, это обстоятельство значительно сокращает число комбинаций, которые следует испытать. Существуют, однако определенные кристаллы, у которых каждая ячейка содержит тяжелый атом; тогда амплитуды волн, дифрагировавших на решетке из тяжелых атомов, столь велики, что результирующие амплитуды могут иметь только один знак. Можно-сказать, что в этом случае тяжелые атомы служат при- чиной возникновения когерентного фона. Следовательно, при исследовании таких редко встречающихся кристаллов требуется только извлечь квадратный корень из интенсивностей дифрагировавшего света для того, чтобы получить фурье-образ проекции распределения плотности на плоскость, перпендикуляр- ную той оси кристалла, которая параллельна направлению освещения. Итак, распределение амплитуд, пропорциональных квадратному корню из интенсивности, получается из анализа фотографии (с общей гаммой, равной *) Световые волны с заданной величиной сферической аберрации можно получить с по- мощью соответственно выбранных асферических поверхностей. **) См. любой учебник по теории дифракции рентгеновских лучей, например [35, 36].
416 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [гЛ. 8 единице, см. уравнение (8)) дифракционной картины. В рентгеновском микро- скопе на эту фотографию падает плоская волна и свет, прошедший сквозь фото- графию и дифрагировавший на ней, фокусируется линзой. Согласно теории дифракции Фрауигофера (см. § 8.3) распределение амплитуд в плоскости изо- бражения есть фурье-образ их распределении в плоскости пластинки и, следо- вательно, оно получается из первоначального распределения плотности двумя последовательными фурье-преобразованиями; из теоремы Фурье следует, что распределение амплитуд в фокальной плоскости есть точное изображение ис- ходного (в общем случае комплексного) распределения плотности. Конечно, предполагается, что отверстие линзы достаточно велико и пропускает все дифрагировавшие лучи, несущие заметное количество энергии, и что удовлет- ворено требование синфазности волн всех длин. На самом же деле последнее условие выполняется редко. В методе восстановления волнового фронта ис- кусственно добавляется когерентный фон. Однако не существует условий, обес- печивающих его симметрию или даже периодичность. Кроме того, этот метод не годится для рентгеновского анализа, так как там практически невозможно получить строго когерентный фон. Тем не менее он может найти успешное при- менение в будущих электронографических исследованиях. ЛИТЕРАТУРА 1. С. F. МеуеГ, The Diffraction of Light, X-rays, and Material Particles, Univ. Press, Chicago, 1934. 2. A. Schuste r, Phil. Mag. 31, 77 A891) , 3. G. К i г с h h о f f, Berl. Her., 641 A882), Ann. d. Physik 18, 663 A883); Ges. Abh. Nachtr. 22. 4. F. К о 11 1 e r, Ann. d. Physik 71, 457 A923); 72, 320 A923). 5. B. B. Baker, E. T. Copson, The Mathematical Theory of Huygens Principle, Clarendon Press. Oxford 2nd ed., 1950. 6. Fl, Helmholtz, J. Alath. 57, 7 A859). 7. F. Pockets, 0ber die Partielle Differsntialgleichung (\72+&3) ?/=0 Teubner, Leipzig, 1891. 8. A. S о m m e r i e 1 d, Optics, Acad. Press, N, Y. 1954, p. 199. (A. 3 о м м е р ф е л ь д, Оптика, ИЛ 1953.) 9. М. Born, Optik, Springer, Berlin, 1933, p. 149. (M. Бори, Оптика, ГНТИУ, Харьков- Киев, 1937.) 10. G. G. Stokes, Trans. Cambr. Phil. Soc. 9, 1 A849). И. А. В a b i n e t, С R. Acad. Sci. 4, 638 A837). 12. H. P о i n с a r e, Theorie inathematique dc la lumiere, Paris, 1892, Vol. II, p. 187. 13. G, T о r a 1 d о di F r a n с i a, Atti Fond Giorgio Ronchi 11, § 6 A956). 14. P.. W о 1 f, E. W. M а г с h a n d, J. Opt. Soc. Amer. 5B, 1712 A966). 14a. F К о 11 1 e r, Ann. d. Physik 70, 405 A923). 15. F, К о t t 1 e г, в сб.: «Progr. in Optics», vol. 4, ed. E. Wolf, North Holland Publ. Co., Amsterdam, J. Wiley a. Sons, N. Y., 1964. 16. C. J. В о u k w k a m p, в сб. «Rep. Progr. Phys.», London, 1954, Vol. 17, p. 35. 17. S. S i 1 v e r, J. Opt. Soc. Amer. 52. 131 A962). 18. I. N. Sned don, Fourier Transforms, McGraw-Hill, NT. Y., 1951, pp, 25, 44. 19 O. T h e i m e r, G. D. W a s s e r m a n n. E. Wolf, .Proc. Roy. Soc. A212; 426 A952). 20. F..W о 1 f, Proc. Phys. Soc. 74, 269 A959). 21. M. Planck, Ann. d. Physik I, 61 A900) 22. M. Born, P. Jordan, Z, f. Phys. 33, 479 A925). 23 W. Grobner, N. H о f г e i t с r.'lntegralU.fel, Wien, 1950, Vol. II, p. 333. 24. E. J a h n k e, F. E m d e, Tables of Functions with Formulae and Curves, Teubner, Leipzig, 1933. (E. Я к к е, Ф. Эйде, Специальные функции, формулы, графики и таб- лицы, «Наука», 1964.) 25, G. N. W a t s о n, A. Treatise on the Theory of Bessel Functions, Cambr. Univ. Press, 1944. (Г. Н. В а т с о н, Теория бесеелсвых функций, ИЛ, 1949.) 26 Е. Т. W h i t t a k e r, G. N. Watson, A Course of Modern Analysis, Cambi. L'niv. Press, 4th ed., 1952. (Э. Т. У и т т е к е. р, Г. И В я т с о и, Курс современного ана- лиз?, Физматгиз. 1962,) 27. Q. В. Airy, Trans. Cambr. Phil. Soc. 5, 283 A835).
ЛИТЕРАТУРА 417 ,28. В. Игнатовский, Труды Оптического института, Петроград, 1, IV A919); В. А. Ф о к, Труды Оптического института 3, 24 A924); А. В о i v i n, E. 'W о 1 f, Fhys. Rev. 138В, 1561 A965), А. В о i v i n, J. Dow. E. Wolf, J. Opt. Soc. Amer., 57, 1171 A967). 29 R ay 1 e i gh, Phil. Mag. 11, 214 A881). 30. R а у 1 e i g h, Scientific Papers, Cambr. Univ. Press, 1899, Vol. 1, p. 513. .31. J. Scheingr, S. Hirayma, Abh. d. Konigl. Akad. Wissensch., Berlin, 1894, Anhang I. 32. J. V. К a t h a v a t e, Proc. Indian Acad. Sci. 21, 177—210 A945). 33. M. Laue, Bed. Ber., 1144 A914). 34. J. A. Prins, Naturwiss. 19, 435 A931). 35. M. Laue, Rdntgenstrahl-Interferenzen, Akad. Verlagsgesellschaft, 2 Aufl, 1948. .36. В сб. «The Crystalline State», ed. L. Bragg. Bell a. Sons, London, Vol. 1, W. L. Bragg,] A. General Survey, 1933, Vol. II, W. R.James. The Optical Principles of the Uiffra- j ction of X-rays, 1948; Vol. Ill; H. L i p s о n, W. С о с h r a n, The Determination of Crystal Structures, 1953. 37. \V. Friedrich, P. К n i p p i n g. M. Laue, Miinchener Sitzungsber., 1912, p. 303; Ann. d. Physik 61, 971 A913). •38. G. R. Harrison, J. Opt. Soc. Amcr. 39, 413 A949). 39. D. Rittenhouse, Trans. Amer. Phil. Soc. 2, 201 A786). 40. T. D. Cope, J. Franklin Inst. 214, 99A932). 41. J. Frannhofer, Denkschr. Akad, Wiss. Mflnchen 8, 1 A821—1822). Ann. d. Physifc 74, 337 A823). 42. H. A. Rowland, Phil. Mag. 13, 469 A882); Nature 26, 211 A882). Phil. Mag. 18, 297 A883). 43. R. W. Wood, Phil. Mag. 20, 770 A910); Phil. Mag. 23, 310A912); A. Trowb r id ge, R. W. Wood, Phil. Mag 20, 886, 898 A910). 44. R. W. Woo d, Nature 140. 723 A937); J. Opt. Soc. Arner. 34, 509 A944); H. В a b с о с к, J. Opt. Soc. Amer. 34, 1 A944). 45. G. R. H a r r i s о n, J. Opt. Soc. Amer. 39, 522 A949). 46. G. W. S t г о k e, в сб.: «Progr. in Optics», vol. 2, ed. E. Wolf, North Holland Publ. Co., Amsterdam, J. Wiley a. Sons, N. Y., 1963, p. 1. ,47. T. Thorp, British Patent № 11460, 1899. 48. R. J. Wallace, Astrophys, J. 22, 123 A905); 23, 96 A906). 49. T. M e r t о n, Proc. Roy. Soc. A201, 187 A950). 50. A. A. M i с h e 1 s о n, Astrophys. J. 8, 37 A898); Proc. Amer. Acad. Arts Sci. 35, 109 A899). 51. W. E. Williams, British Patent, № 3 12534 1926 Proc. Opt. Conv. 2, 982 A926). Proc. Soc. 45. 699 A933). 52. F. L. О Wadswortli, Astrophys. J. 3,, 54 A896). 3. W. T. W e 1 f о r d, в сб.: «Progr. in Optics», vol. 4, ed. E. Wolf, North Holland Pub|. Co., Amslerdam, J. Wiley a. Sons, N. Y., 1965, p.241. 54. G. C. Steward, The Symmetrical Optical System, Cambr. Univ. Press, 1928, p. 89-. 55. R. S t r a u b e 1, P. Zeeman Verh., Martinus Nijhoff , 1935, p. 302; R. K. L u n e b u r g, Mathematical Theory of Optics, Brown Univ., Providence, R 1. A944), p 391, печатное издание Univ. of California Press, Berkeley a Los Angeles, 1964, § 50; H. Osterberg, J E. W i 1 k i n s, J. Opt. Soc. Amcr. 39, 553 A949), G. Lansraux, Rev. d'Opt. 32, 475 A953). 56. E. W о 1 f, в сб. «Rep. Progr. Phys.» Phys. Soc, London, 1951, Vol. 14, p. 109. 57. G. T о r a I d о di F r a n с i a, Suppl. Nuovo Citnento 9, 426 A952). 58. P. J а с q u i n о t, В. К о i z e n-D о s s i e г, в сб.: «Progr. in Optics», vol. 3; ed. E. Wolf, North Holland Publ. Co., Amsterdam, J. Wiley a. Sons, N. Y., 1964, p. 29. 59. E. Abbe, Archiv f. Mikroskopische Anat. 9, 413A873). SO. E. Abbe, Gesammelte Abhandlungen, G Fischer, Jena, 1904, I, p. 45; O. Lummer, F. R e i с h e. Die Lehrc von dcr Bitdtslehung im Mikoskop von Ernst Abbe, Vievveg, Braunschweig, 1910. 61. A. B. Porter, Phil. Mag. 11, 156A906). 62 R а у 1 e i g h, Phil. Mag 42, 167 A896). 63. R а у 1 e i g h. Scientific Papers. Cambr Univ. Press; 1903, Vol. 4, p. 235. 64. R. Courant, D. H i 1 b с r t. Methods r< Mathematical Physics, Intorsci. Publ., N. Y., 1953, vol. 1, p. 79. (P. Кура н'т, Д. Гильберт, Методы математической физики, Гостехиздат. 1945.) 65. М, Franco n, Le contrasts de phase en optique et en microscopie. Rev. d'Opt. 1950; A. H Bennett, H. Jupnik, H. Osterberg, O. W. Richards, Phase Microscopy, J. Wiley a. Sons, N. Y., 1952. • 66. H. H. H о p k i n s, в кн. М. Franco n,Le contraste de phase et le contraste pat interferences, Rev. d'Opt., 1952, p. 142,
418 ЭЛЕМЕНТЫ ТЕОРИИ ДИФРАКЦИИ [ГЛ. S 67. F. Z е г n i к е, Z. Tech, Phys. 16, 454 A935); Phys. Z. 36, 848 A935); Physlca в, 686, 974 A942). 68. J. P i с h t, Z. f. Instrkde 56, 481 A936): Z. f. Instrkde 58, 1 A938). 69. F. D. Kahn, Proc. Phys. Soc, B68, 1073 A955). 70. A. H. Bennett, H, Jupnik, H. О s t e г b e r g, O. W. Richards, Trans. Arocr. Micruscop. Soc. 65, 126 A946). 71. Л. П. Bennett, H. Jupnik, H. О s t e r b e r g, O. W..R ichards. Trans. Amer. Microscop. Soc. 65, 119 A946). 72. F. Z e r n i к е, Mo. Not Roy. Astr. Soc. 94, 382—383 A934). 73. British Association Report. Oxford, 1926, pp. 273—275. Т. Р е а г с е у, Tables of Fresnel Integrals to Six Decimal Places, Cambr. Univ. Press, 1956- 74. R. С о u r a n t, Differential and Integral Calculus, Blackie a. Sons Ltd, 2nd ed., 1942, vol. 1, p. 496. (P. Курант, Курс, дифференциального и интегрального исчис- ления, «Наука», 1967.) 75. Л. С о г п u, J. de Phvs. 3, 5, 44 A874). 76. Е. Lommel, Abh. "Bayer. Akad 15,, Abth. 2, 233 A885) 77. E. Lommel, Abh. Bayer. Akad. 15, Abth. 3, 531 A886). 78. H. Struve, Mem. de 1'Acad. d^ St. Petersbourgh G), 34, 1 A886). 79. K. Sch war zsch i 1 d, Sitzb. Miinchen. Akad. Wiss., Math-Phys., Kl. 28, 271 A898). 80. P. Deb ye, Ann. d. Physik 30, 775 A909). 81. 4. G r a y, G B. Maithe-vs, T M. M а с R о b e г t, A Treatise on Bessel Functions, Maemillar), London, 2nd ed., 1922, Ch. XIV. 82. J. Walker, The Analytical Theory of Light, Cambr. Univ. Press, 1904, p. 396. 83. M. E. Hiiiford, H. T. Davis. Phys. Rev. 33, 589 A926). 84. C. A. Taylor, B. J. Thompson. .1. Opt. Soc. Amer. 48, 844 A958). 85. M. P. Bachynski, G. В e ke f i, J. Opt. Soc. Amer. 47. 428 A957). 86. P. A. Ma thews, A. L. Cullen, Proc. IEE, PI. С 103,, 449 A956). 87. E. H. Lin foot, E. W о If, Proc. Phys. Soc. B69, 823 A956). 88. M. В e r e k, Z. Phys. 40, 421 A926). 89. F. Z e r n i k e, П. R. A. N i j b о е г, в сб. «La Theorie des Images Optiques», Rev. d'Opt. Paris, 1949, p. 227. 89a. А. В о i v i n, П. Wolf, Phys. Rev. 138B, 1561 A965); А. В о i v i n, J. Dow, E. Wolf, J. Opt. Soc. Amer. 57, 1171 A967). 90. E. H. Linfoot, E. W о 1 f, Proc. Phys. Soc. B6S, 145 A953). 91. А. В о i v i n, J. Opt. Soc. Amer, 42, 60 "A952). * 92. H. D. Taylo r, Mo Not. Roy. Astr. Soc. 54, 67 A894). 93. E. Wolf, Proc. Roy. Soc. A204, 533 A951). 94. J. F о с k e, Optica Ada 3, 161 A956V 95. G. W. F a r n e 1 1, Canad. J. Phys. 35, 780 A957). 96. L. G. Gouy, С R. Acad. Sci. 110, 1251 A890); Ann. Chim. (Phys.) F), 24, 145 A891). 97. F. R e i с h e, Ann. d. Physik 29, 5G, 401 A909). 98. A. R u b i n о w i с z, Phys. Rev. 54, 931 A938); C. J. В о u w k a m p. Physica 7 485 A940). , 99. Farnell, Canad. J. Phys. 36, 935 A958). 100. T. Young, Phil. Trans. Roy. Soc. 20, 26 A802). 101. G. A. M a » S i, Ann. di Matem. 16, 21 A888). 102. F. Kottfer, Ann. d. Physik 70, 413 A923). 103. W. W i e n, Inaug. Diss., Berlin, 1886; E. M a e y, Ann. d. Physik 49, 69A893); А. Калашников, Ж. Русск. физ.-хим. об-ва, Физ. часть 44, 133 A912). 104. S. В a ne r j i, Phil. Mag. 37, 112 A919); S. К. M i t r a, Phil. Mag. 38, 289 A919) 105. A. R в b i и о w i с ?,, Ann. d. Physik 53, 257 A917); 73 A924); 81, 153 A926); Acta Phys Polon. 12, 225 A953). 106. G. N. Ramachadran, Proc. Indian. Acad. Sci. A21, 165 A945)- L. С Martin Proc. Phys. Soc. 55, 104 A943); 362, 713 A949); Y. Y. К a t h a v a t e, Proc. Phvs Soc A21, 177 A945); R. S. I n g a r d e n, Acta Phys. Polon. 14, 77 A955); O. L a p'o r t e J. M e i x п е г, Z. f. Phys. 153, 129 A958). 107. A. Rubinowicz, Die Beugungswelle in der Kircjihoffschen Theorie der Beusung Polska Akad. Nauk, 1957. " 108. K. Miyamoto E. Wolf, J. Opt. Soc. Amer. 52, 615, 626 A962); K.Miyamoto Proc. Phys. Soc. 79, 617 A962). 109. E. W. Marchand, E. W о If, J. Opt. Soc.. Amer. 52, 761 A962)- .A. R u b i n o- wicz.J. Opt. Soc. Amer. 52, 717 A962); Acta Phys. Polon. 21, 61, 451 A962); сб.: «Progr. in Optics», vol. 4, cd. E. Wolf, North Holland Publ. Co., Amsterdam, J. Wiley a Son» N. Y. 1965. p. 199. 110. D. Gabor, Nature, 161, 777 A948); Proc. Roy. Soc. A197, 454 A949); Proc. Phys Soc. B64, 449 A951). (Русские переводы последних статей опубликованы в I12Q!) 111. D. С a b о г. Rev. Phys. 28, 260 A956).
ЛИТЕРАТУРА 419 112. J. В. DeVelis, G. О. Reynolds, Theory and Applications of Holography, Reading Mass Addison Wesley Publ., Co., 1964; H. M. S m i t h, Principles of Holography J. Wiley a. Sons, N. Y., 1969. 113. F. Z e f n i к e. Proc. Phys. Soc, 61, 158 A948) 114. E. N. L e i t h, Upatnieks, J. Opt. boc. Amer. 52, 1123 A962); 53, 1377 A963)- 54, 1295 A964). . 115. E. N. L e i t h, U p a t n i e к c, J. Opt. Soc. Amer. 54, 1297A964). 116. H. В о е г sc h. Z. techn. Phys 19,337A938). 117. W. L. Bragg, Nature 149," 470 A942). 118. M. J. В uerger, J. Appl. Phys. 21, 909 A950). 119*. Л. И. М а н д е л ь ш т а ы, Aim. d. Physik 35, 881 A911); 39, 493 A912); Полное собра- ние трудов, т. I, Изд. АН СССР, 1948, стр. 211, 226, 229; Д. С. Рождественский ЖЭТФ 10, 305 A940). 120*. Д ж. Ст р о у к, Введение в когерентную оптику и голографию, «Мир», 1967. 121*. Л. М. С о р о к о, Лекции по голографии. Препарат ОИЯИ .ЧЬ 2587. 122*. Ю. Н, Д е и и с ю к, Об отображении оптических свойств объекта в волновом поле рассеянного им излучения, ДАН СССР 144, 1275—1278 A962).
ГЛАВА 9 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ В гл. 5 мы изучали эффекты аберраций, пользуясь приближением геомет- рической оптики. Изображением считалась размазанная фигура, образованная точками пересечения геометрических лучей с плоскостью изображения. По- скольку геометрическая оптика дает хорошее приближение в предельном случае очень коротких волн, естественно ожидать, что геометрическая теория аберраций постепенно перестает быть справедливой при уменьшении величины аберрации. Например, в предельном случае идеально сферической сходящейся волны, выходящей из круглого отверстия, геометрическая оптика предсказы- вает бесконечную интенсивность в фокусе и нулевую интенсивность на всей остальной фокальной плоскости, тогда как на самом деле изображение (см. п. 8.5.2) состоит из яркого центрального пятна, окруженного темными и свет- лыми полосами (картина ЭГфи,1. Было показано также, что распределение света в непосредственной близости от фокальной плоскости значительно сложнее (см. рис. 8.39), чем следовало бы ожидать на основании предсказаний геометри- ческой оптики. Поэтому эффекты аберраций необходимо исследовать на основе теории дифракции. Первые работы в этой области принадлежат Рэлею [1]. В них наибольшее значение имеет формулировка критерия (рассмотренного в § 9.3), который в расширенной форме получил широкое применение для определения макси- мальной величины аберраций, допустимых в оптических приборах. Исследова- ниям в этой области посвящены работы многих ученых, изучавших эффекты различных аберраций *); отметим, в частности, наиболее крупные из таких ра- бот [3—9]. Очень обширное исследование по дифракционной теории формирования изображения при наличии аберраций принадлежит Нижберу **) [10]; оно час- тично выполнено им совместно с Церпике ***) [131. Эта работа посвящена эф- фектам малых аберраций, при которых отклонения волновых фронтов от сфери- ческой формы составляют доли длины волны. Ван Кампеи [17—19] рассмотрел эффекты больших аберраций, пользуясь асимптотическими приближениями в теории дифракции; его исследование основано на формальном переходе к функциям двух переменных в методе стационарной фазы, впервые строго сформулированном Фокке (см. приложение 3). Основная часть настоящей главы посвящена обзору теории Нижбера — Цернике и рассмотрению структуры дифракционных изображений, искаженных первичными аберрациями. В последнем параграфе (см. § 9.5) мы перейдем от точечных предметов к протяженным и исследуем изображения, получающиеся при когерентном и некогерентном освещении. Отображения при частично когерентном освещении будут рассмотрены в гл. 10. *) Исторический обзор дифракционной теории аберраций написан Вольфом [2]. **) Основная часть этой работы опубликована также в [И, 12]. ***) Обобщение этой теории на случай больших аберраций содержится в [14]. Отметан также работу [!5), которая в основном пссвяшена экспериментальному изучению эффектов аберраций. В § 9.4 приведено несколько прекрасных фотографий, полученных Нинуисоч. В статье Бачинского и Бекефи, ссылка на которую имеется в гл. 8, а также в [16] со- держится описание экспериментального исследования структуры области изображения при наличии аберраций в микроволновом диапазоне частот.
§ 9.1] ДИФРАКЦИОННЫЙ ИНТЕГРАЛ ПРИ НАЛИЧИИ АБЕРРАЦИЙ 421 § 9.1. Дифракционный интеграл при наличии аберраций 9.1.1. Дифракционный интеграл. Рассмотрим центрированную оптическую систему с точечным источником монохроматического света Р„ (рис. 9.1). Вы- берем декартову систему координат, начало которой находится в месте парак- сиального изображения Р[ точки Ро, а ось г направлена вдоль СР\, где С — центр выходного зрачка. Ось у лежит в меридиональной плоскости (плоскости, в которой лежит точка Р„ и ось системы). Обозначим через Ya и Y\ расстояния от точек Ро- и Р{ до оси. Как и в гл. 5, деформацию волновых фронтов в области выходного зрачка опишем функцией аберраций Ф. Пусть Q и Q —¦ точки пересечения луча в про- странстве изображения с волновым фронтом, проходящим через С, и опорной ~р* у' Волновой. франт " Опорная • сфера Гаусса Рис. 9.1. Выбор системы отсчета и принятые обозначения. сферой Гаусса соответственно. Если предположить, что показатель преломле- ния среды в пространстве изображения равен единице, то Ф (на рис. 9.1 Ф>0) является расстоянием QQ, измеренным вдоль луча. Пусть R — радиус опорной сферы Гаусса СР\, s— расстояние между Q и произвольной точкой Р, расположенной вблизи изображения. Возмущение в точке Q описывается величиной А ехр [ik (Ф — R)]IR, где AIR — амплитуда возмущения в точке Q. Согласно принципу Гюйгенса — Френеля возмущение в точке Р равно ) J j1 где интегрирование проводится по той части опорной сферы Гаусса, которая примерно закрывает выходной зрачок. При написании A) предполагалось, что входящие в это выражение углы малы, так что можно пренебречь изменением коэффициента наклона лучей по опорной сфере Гаусса: кроме того, предпола- галось, что амплитуда волны практически постоянна вдоль волнового фронта, т. е. коэффициент А можно вынести из-под знака интеграла. Пусть (|, т), Q и (х, у, г) — координаты точек Q и Р, и а~ радиус выход- ного зрачка. Как и в §8.8, где рассматривалась волна, свободная от аберраций (Ф = 0), положим 5 = ар sine, х = г sin if, I тогда *), как и в (8.8.2) и (8.8.9), имеем k{s-R)~ —tip cos (9—t")—4 «P2 + (f)'«. C) *) Здесь R соответствует величине f из § 8.8. Интересно отметить, что дифракционный интеграл можно слова представить в виде разложения по угловым гармоникам, если восполь- зоваться уравнениями (8.8.2) и (8.8.3) [20].
422 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 9 где и я v — «оптические координаты» точки Р, т. е. Величину Ф удобно рассматривать как функцию Y\, p и 9 ф = ф(У', р, 9). E) Элемент поверхности опорной сферы Гаусса dS равен a'pdpdd, и если угол, который СР{ составляет с осью системы, мал, то областью интегрирования в A) может служить 0<р<; 1, 0<б<2я. Кроме того, для точек наблюдения, находящихся вблизи изображения, величину 5, стоящую в знаменателе подын- тегрального выражения, можно заменить на R. Таким образом, соотношение A) после подстановки в него C) принимает вид 1 2л X С [ exp \i \кФ (Y{, p, 6)—ypcos(9— ip)—\ щА Xpdpdb, F) и интенсивность в точке Р равна exp h h<D{Yl, p, 9)— op cos (в—$) —-up'AlpdpdQ . G) о 5 Удобно выразить I (P) в виде доли интенсивности /*, которая получалась бы в точке параксиального изображения Р[ в отсутствие аберраций. Соглас- но G) ,4а3 тогда нормированная интенсивность *) запишется в виде *, р, 9)— t>pcos(9—if)—y«p2| \pdpdQ (9) В отсутствие аберраций интенсивность максимальна в точке параксиаль- ного изображения. При наличии же аберраций максимум интенсивности распо- ложен, в общем случае, в другой точке, которую можно назвать дифракционным фокусом **). Часто интерес представляет лишь максимальная интенсивность, получающаяся в определенной плоскости наблюдения; эта величина (если она нормирована, как и (9Н называется интенсивностью Штреля ***). Из (9) можно сразу же получить несколько простых результатов, которые понадобятся позднее. 9.1.2. Теорема смещения. Изменение опорной сферы. Пусть Ф и Ф' — две функции аберраций, причем Ф'=Ф-|- Яр'2 + Кр sin 9 + Lp cos 9 + М, A0) ^*)_Символ i для нормированной интенсивности нельзя спутать с таким же обозначением для У—1, поскольку первый всегда пишется с аргументами, например ЦР), i(", a, t|>) и т. д. **) Вообще говоря, конечно, может быть несколько дифракционных фокусов, однако если аберрации достаточно млль;, имеется только один дифракционный фокус. **') Это понят;,с ввел Штрель [21], который назвал его «Definitionshelligkeiti». В анг- лийской литературе часто используется менее подходящий термин «definition» (определение).
9.1] ДИФРАКЦИОННЫЙ ИНТЕГРАЛ ПРИ НАЛИЧИИ АБЕРРАЦИЙ 423 где Н, К, L, М — постоянные порядка X. Далее пусть ((и, v, if>) и i'(u, v, соответствующие нормированные ивтенсивности* Тогда из (9) имеем V, 1|))=- ехр[г'/(и, v, if; p, Q)]pdpdQ (И) где f(u, v, if>; р, 9)=АФ—ypcos(9—if>)—1/%up*. A2) Аналогичное выражение справедливо и Для V. Согласно A0) последнее выраже- ние можно представить в виде /(«, v, if>; р, 9) = АФ'—А [Яра + Кр sin 9 + Lp cos6 + М] — —up cos (9—ij;) —Vs «P2 = АФ' —v'p cos (9—if')—V8 «'p2 —^jW = =/'(«'. p'. ^'; p. в)—AAf, A3) где и' —u-\-2kH. v' sin *' = v sin ip-j- A/C, 1 ? A4) A5) В соответствии с B) и D) уравнения A4) описывают преобразование -г)*- A6) Из A1) и A3) вытекает, что г (а, о, г)з) = «'(м' Таким образом, мы доказали следующую теорему смещения. Добавление к функ- ции аберраций члена Яр3+ /fpsin 9 -|- LpcosO + Л1, где Я, /С, ^-, М—по- стоянные порядка "к, не изменяет трехмерного распределения интенсивности света близ фо- куса, а только смещает его как целое в соот- ветствии с преобразованиями A5), иными сло- вами, происходит смещение на величину 2{RiaYH вдоль главного направления СР* от выходного зрачка и на величины (R,'a) К и (R'a) L вдоль положительных направлений осей х и у соответственно. Аддитивные члены в правой части A0) можно рассматривать как величины, харак- теризующие изменение опорной сферы Гаус- са. Предположим, что мы выбрали новую опорную сферу с центром в точке Р'(х', у', г') вблизи изображения и радиусом R', причем ее расстояние до опорной сферы Гаусса не превы- шает нескольких длин волн. Пусть ЛГ — точка пересечения луча QQ с этой новой опорной сферой Тогда функция аберрации Ф', отнесенная к новой сфере, имеет вид (см. рис. 9.2) O'=,QN = QQ—NQ^QQ — NG, A7) где G — точка пересечения линии NP' с опорной сферой Гаусса, а показатель преломления среды в пространстве изображения считается, как и раньше, равным единице. Величина QQ = *X> есть волновая аберрация, отнесенная к опорной сфере Гаусса, a NG — NP'—GP'~R'—s, г-де s— расстояние от G до Р'. Следовательно, A7) можно переписать в виде A8) ^ Новая опорная сфера 4 Опорная сфера Гаусса. Рис. 9.2. Изменение опорной сферы.
424 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ [гл- где было использовайо соотношение C). Здесь и, v и ty определяются C) и D), где координаты х, у, г нужно заменить на х', у', г'. Соотношение A8) можно представить в форме A0), есди положить L =-[ 9.1.3. Соотношение между интенсивностью и средней деформацией волно- вы>. фронтов. Если аберрации достаточно малы, то интенсивность в центре опорной сферы можно выразить через среднеквадратичное значение волновой аберрации. Пусть Фр—волновая аберрация, отнесенная к опорной сфере с центром в точке Р вблизи изображения. Тогда, согласно уравнениям (9) и A8), нормированною интенсивность в точке Р можно записать следующим образом: Г Г ехр (ИгФр) р dp dB ...] pdpdQ • B0> Пусть Ф'р— среднее значение n-й степени Фр, т. е. ] 2я г * 1 р dpde B1) Если считать аберрации настолько малыми, что в B0) можно пренебречь третьей и более высокой степенями кФр, то выражение .для интенсивности в точке Р можно представить в форме i (Р) • ) Величина в скобках в правой части B2) является «среднеквадратичной дефор- мацией» (ДФK волнового фронта, т. е. 1 8я B3> и, следовательно, B2) принимает вид ( B4) Отсюда следует, что в случае малых аберраций значение нормированной интенсивности в центре опорной сферы вблизи фокуса не зависит от природы аберраций и отличается от единицы, соответствующей идеальному случаю, на величину, пропорциональною среднеквадратичной деформации волнового, фронта.
§ 9.2] РАЗЛОЖЕНИЕ ФУНКЦИИ АБЕРРАЦИИ 42S § 9.2, Разложение функции аберрации 9.2.1. Круговые полиномы Цернике. При изучении эффектов аберраций в рамках геометрической оптики (см. гл. 5) мы разлагали функцию аберраций Ф в степенной ряд. Здесь же, поскольку интегрирование производится по еди- ничному кругу, удобнее разлагать Ф по полной системе полиномов, ортого- нальных внутри единичного круга *). Существует много систем полномов, обладающих таким свойством; однако одна из них, введенная Цернике [23]> обладает еще и простыми свойствами инвариантности. В приложении 7 дан вывод круговых полиномов Цернике и обсуждаются некоторые их свойства; здесь мы приведем лишь те формулы, которые потребуются в настоящей главе. Круговые полиномы Церпике представляют собой полиномы Vln(X, Y) от" двух действительных переменных X, У; если выразить X, Y в полярных ко- ординатах (X^psinQ, У ^рcos6), то полиномы имеют вид где/<0 и гС^О—целые числа, я> | / |, а п—\1\ — четное число. Ортогональ- ность и нормировка полиномов выражаются формулами [vn(X, Y)]*vl;.(x где 6jj— символ Кронекера, а звездочка обозначает комплексное сопряжение. Радиальные функции ^'„(р) являются полиномами по р, содержащими степени р", р"~а, ..., p]ii, и, как показано в приложении 7, они тесно связаны с поли- номами Якоби (вырожденными гипергеометрическими функциями). Как видно- из A) и B), радиальные полиномы удовлетворяют соотношениям ?!, (Р) R'n- (р) Р dp = ^~Т)Ьпп" <3> Они определяются следующими формулами (т=|/[): п —т Нормировка выбрана так, чтобы при всех возможных значениях пит Ля=мA) = 1. F) Радиальные полиномы имеют образующую функцию При т=0 правая часть G) превращается в образующую функцию полиномов^ Лежандра **) от аргумента 2ра— 1, т. е. /?.2,Up) = /'n(V — О- (8> В табл. 9.1 приведены в явном виде радиальные полиномы для нескольких первых значений индексов. *) Термин «полная снетемй» означает, что любая, достаточно гладкая функция разла- гается в ряд по функциям данной системы. Более точное определение этого термина приводится,, например, в книге [22]. **) См., например, [221.
426 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ Радиальные полиномы R1" (р) для tn ^ 8, [ГЛ. 9 Таблица 9.1 0 1 2 3 ' 4 5 6 7 8 0 1 1 Р 2 2р'-1 Р2 3 ЗрЗ-2р Р3 4 -6р3+1 4р4—Зр2 Р4 5 Юр5— — 12р3+ i Зр 5р&—4р3 20р°—30р»+ 15ое— —20р4-|-6р2 6р«—5р4 5 ! Р6 ! i 7 35р'—60р5+ -1-30р3— 4р 21о'— — 30р5-(-10рз 7p7-6ps Р7 S 70р8—140рб + +90р*-20ра+1 56р8—105рв-|- H-GOp4—Юр2 28р8- —42р<Ч-15р* 8р8—7р° Р8 В теории Нижбера — Цернике важную роль играет следующее соотно- шение (также доказанное в приложении): Я? (Р)/„@Р)РФ =(-1 (9) где / — функция Бесселя первого рода. Вместо комплексных полиномов V можно использовать вещественные полиномы UH = 4- Vnm] = RZ (p) cos me, Vnm=¦% Wz-V7m] = /гг(р) sin«e. j Мы будем в дальнейшем применять только полиномы I/™ = ?"„" (р) cosm9, так как волновые искажения симметричны относительно меридиональной пло- скости 9=0, и, следовательно, функция аберраций является четной функ- цией в. 9.2.2. Разложение функции аберраций. Следуя Нижбсру, разложим функ- цию аберраций Ф по круговым полиномам Цернике Ил симметрии задачи вытекает, как и в § 5.1, что разложение содержит лишь комбинации перемен- лых, а именно Y\2, p2 и VJpcosO, так что оно должно иметь вид
9.2] РАЗЛОЖЕНИЕ ФУНКЦИИ АБЕРРАЦИИ ' 427 где I, п и т— неотрицательные целые числа, п~^т, "п—т—четное число и а1пт— постоянные. Поскольку нас будет интересовать главным образом дифракционное изо- бражение фиксированной точки предмета {Y\ = const), удобно не выделять явную зависимость Ф от У* и переписать A1) в виде эо at п ф = Аоа + ~ 2 A"».Rn (Р) + 2 2 АптЯп (Р) cos тб. A2) Коэффициенты Апт зависят от У\, а множитель 1/|/ введен перед вторым чле- ном для упрощения окончательных формул. Если аберрации достаточно малы, то с помощью коэффициентов А можно выразить нормированную интенсивность в параксиальном фокусе в просшй форме. Подставляя A2) в (9.1.21) и используя условие ортогональности C), получим \ п- I #ге=0 П~Г Из первого соотношения следует, что А„„ характеризует среднее запаздывание волнового фронта относительно опорной сферы Гаусса. Riopoc соотношение представляет собой «формулу Парсеваля» для ортогональной системы функций R"J} (p)cos/n(). Подставляя A2) в уравнение (9.1.22), получим для нормирован- ной интенсивности в параксиальном фокусе iW) = l-^XIri- A4> ч = 1 т - С "*" При решении важной проблемы «сбалансирования» аберраций различных порядков друг относительно друга с целью получения максимальной интен- сивности проявляются преимущества разложения но круговым полиномам. Предположим, что аберрация описывается одним членом «степенного ряда», а именно Ф = Л;„р"со5и6, A5) где А'— малая постоянная (порядка длины волны или меньше). Спрашивается, можно ли увеличить интенсивность i(P\), если ввести аберрации более низких порядков. Или, более точно, можно ли так подобрать постоянные А'щ в выра- жении Ф' = А'Пт р" cosm 9 + 2 2 Л'рчРр cosg 9> A6) Р < п q < р чтобы интенсивность в параксиальном фокусе была как можно больше. При любом выборе постоянных А'т функцию аберрации A6) можно также представить с помощью круговых полиномов ф' — Ё,шЛ,шК^(р) cosmO-i 2 2 ep<iA'p<iRp (p) cos qB, A7) P < n q <* p где 1 \ enm — ~7^~ > когда т = 0, пфО, f 2 A8) enm = 1 в остальных случаях. ) Коэффициент при наивысшей степени р в A6), т. е. при р", равен, согласно E), п\1 у (п + т) ! у(« — т)\\; тогда, сравнивая коэффициенты при р" в A6) и A7), получим ^^ir™ -^ - A9)
428 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. Э Если коэффициент А'пт, а следовательно, и- Апт фиксирован, то, согласно A4), максимальная интенсивность в точке Р\ получается, когда все коэффициенты иод знаком суммы в A7) тождественно равны пулю. Тогда функция аберраций принимает вид <t)' = enmAnmR>»{p)cosme, B0) а интенсивность в Р\ становится равной где Апт выражается через А'птс помощью A9). Теперь очевидно, что в одном аберрационном члене AnmR1}(p)cosтд разложения A2) несколько членов вида А'рцр'-'ахчд с р = п, п— 2, ..., т, и q — т, т— 2, ... 1 или 0 скомбинировалось таким образом, что при данном (достаточно малом) значении коэффициента при p"cos">0 нормированная интенсивность в параксиальном фокусе макси- мальна. Проиллюстрируем полученный результат простым примером. Предполо- жим, что оптическая система создает небольшую сферическую аберрацию шестого порядка [Ф — А'в„р*\, но мы можем ввести контролируемые величины сферической аберрации четвертого порядка WioP4! и дефокусировки W^p']. Требуется найти значения A't0 и A'Wl при которых интенсивность в дифрак- ционном фокусе максимальна. Задача такого рода была впервые рассмотрена Рихтером [24J, который показал, что максимум интенсивности достигается при Ди> 3_ Ail) __ 3 Лео 2 Лео ^ Если взглянуть на табл. 9.1, то мы увидим, что эти отношения в точности равны отношениям соответствующих коэффициентов полипома R°e(p), т. е. /?»(р)=20рв—30р4+12р2 — 1. B3) Таким образом, в случае достаточно малых аберраций введение круговых полиномов Цернике автоматически решает задачу «сбалансирования» аберра- ций в указанном смысле; более того, с помощью теоремы смещения можно опре- делить положение дифракционного фокуса. § 9.3. Допустимые величины первичных аберраций Прежде чем исследовать сложную проблему нахождения распределения интенсивности в дифракционном изображении при наличии аберраций, рас- смотрим более простую задачу оценки максимальной величины аберраций, допустимой в оптической системе. , Из предыдущего обсуждения следует, что при наличии аберраций макси- мальная интенсивность в дифракционном изображении меньше интенсивности в параксиальном фокусе (центре картины Эйри) оптической системы с теми же апертурой и фокусным расстоянием, но свободной от аберраций. Рэлей til впервые показал, что интенсивность света в параксиальном фокусе падает меньше чем на 20% (такая потеря обычно допустима), если первичная сфериче- ская аберрация в системе такова, что волновой фронт в выходном зрачке отстоит от опорной сферы Гаусса на расстоянии, меньшем четверти длины волны. Более поздние исследователи установили, что качество изображения при наличии других обычно встречающихся аберраций существенно не ухудшается, если деформация волнового фронта не превышает четверти длины волны. Получен- ный результат известен как правило четверти волны Рэлея, служащее полезным критерием допустимой величины аберраций в оптической системе, формирую- щей изображение. Это правило служит, конечно, лишь грубым указанием на необходимость коррекции системы, поскольку распределение света в изображе-
§ 9.3J допустимые величины первичных аберраций 429 нии зависит не только от максимальной деформации волновых фронтов, но и от их формы (типа аберрации). Более того, допустимое количество потерь света зависит также от назначения оптических инструментов, и поэтому в некоторых случаях приходится вводить более строгие допуски. , Если условие |Фма|сс| —/ь/4 применить к аберрациям разного типа, то получающиеся значения интенсивности в дифракционном фокусе окажутся различными. Поэтому удобнее сформулировать такой критерий, который соот- ветствует заданному значению интенсивности в дифракционном фокусе. Кри- терий подобного типа рассмотрел Марешаль [25], воспользовавшись соотноше- нием между интенсивностью в центре опорной сферы и среднеквадратичным отклонением волнового фронта от сферической формы. Если аберрации достаточно малы, то, согласно (9.1.24), для интенсивности в точке Р в области изображения имеем A) Следуя Марешалю, мы будем считать, что система хорошо скорректирована, если нормированная интенсивность в дифракционном фокусе F больше или равна 0,8. Из A) следуег, что i(F)^ 0,8, когда | ДФ^!5^ Я/14, т. е. приведенное выше условие эквивалентно требованию, чтобы среднеквадратичное отклонение вол- нового фронта от опорной сферы, центр которой находится в дифракционном фокусе, не превышало XI14. Фактически условие Марешаля вытекает из несколько иного неравенства. Из (9.1.20) следует, что 1 2л С С @ ехр {ОгФР) pdpdB 2л cos о о Если к\ФР\<_п12, т. е. \Фр<Х/4, то в этом неравенстве величину cos (&Ф^)_можно заменить на 1 — Vs (k1Wa- Если, кроме того, выбрать радиус опорной сферы так, чтобы Ф^=0, то (ДФ^)а= =Фр, и неравенство примет внд ('(Р) ~Si I —rg-'(ДФ/?J I . (la) Критерий Марешаля следует нз неравенства Aа), однако если аберрации малы, то он практи- чески не отличается от приведенного выше критерия. Для наших целей удобнее пользоваться соотношением (i), а не Aа), поскольку первый более прямым образом связан с экстремальными свойствами круговых полиномов Цернике. Определим теперь положение дифракционного фокуса и допуски для пер- вичных аберраций (аберраций Зайделя). В обозначениях, принятых в настоя- щей главе, каждая первичная аберрация представляет собой деформацию вол- нового фронта вида *) Ф —а'[тп (F1*K'+rap"cos"!0, B) где 11 -\- т + п = 4. Удобно положить А] — й\ (Y*Jl+m C) и тогда B) принимает вид ttnn г ¦ \"/ Постоянные А' легко выразить через коэффициенты Зайделя В, С, D, Е и F, введенные в гл. 5. Если произвольную постоянную Я,о, входящую в E.2.7) и E.2.8), положить равной единице, то Хх обозначает увеличение плоскость входного — плоскость выходного зрачков; далее, если вспомнить, что коэф- фициент пх равен теперь единице, то переменным р и уй из E.3.7) соответствуют *) Штрихами отмечаются коэффициенты степенных рядов, а нештрихованные коэффи- циенты относятся к разложению по полиномам Церпике.
430 ДИФРАКЦИОННАЯ ТЕОРИЯ АБРРРАЦИЙ [ГЛ 9 величины арАх и —KY'JR из настоящего раздела. Сравнивая D) и E.3.7), получим on— \ \] \ о I г > R E) Е. В выражении через круговые полиномы типичный , член, описывающий аберрацию, имеет вид *) F) В последней колонке табл. 9.2 выписаны члены с индексами /, m и п, удов- летворяющими равенству 21 + m + п = 4 (первичные аберрации) Как мы ви- дим, некоторые члены Зайделя сопровождаются теперь членами более низкого порядка, чго в соответствии с теоремой смещения (см. п. 9.1.2) вызывает сдвиг распределения интенсивности как целого Согласно теореме, приведенной в п 9 2 2, максимальная интенсивность в изображении, искаженном аберрацией типа F), достигается в параксиальном фокусе. Следовательно, сравнивая соответствующие члены в двух последних колонках табл. 9.2, можно сразу же определить координаты дифракционного Таблица 9.2 Представление первичных аберраций Тип аберрации Сферическая абер- рация Кома Астигматизм Кривизна поля Дисторсия 1 0 0 0 1 1 Я 4 3 2 о 1 m 0 1 2 0 1 Представление в форме D) А' о* A'^p^cosQ К p2cos2e С22К /l'ujpcos 6 Представление в форме F) ^оч1^з (Р) cos 6 = лоз1 (Зр2 — 2р) cos 6 Ло22«1 (Р> с°5 26 = Л022р2 Beos2e — 1) у= All0Rl (р) = у= А110 Bр2 - 1) ^111 ^'(Р) COS 6 = /l111pCOS 6 фокуса изображения, искаженного первичной аберрацией. Проиллюстрируем последнее утверждение, подробно рассмотрев случай сферической аберрации. Эта аберрация описывается членом Ф = А'оыР** G) *) Для обеспечения единообразия с формулами, приведенными в § 9 2, здесь оставлен множитель гпт, равный \[Y 2 при т=0, пф 0 и 1 при остальных значениях яи.
§ 9.3] ДОПУСТИМЫЕ ВЕЛИЧИНЫ ПЕРВИЧНЫХ АБЕРРАЦИЙ 43t Соответствующее выражение в форме F) имеет вид Ф = -^ЛО4О««(р)=-^=-Л4оFр4-6Р2+1), (8> Если положить АыО = ^—i ™(Ш>> (9) то распределения интенсивности в обоих случаях будут, согласно теореме смещения, одинаковы; однако распределение, соответствующее G), будет сдви- нуто относительно распределения, соответствующего (8), на расстояние, опре- деляемое из уравнения (9.1.15) с т. е. х'=х, у'=у, z'=z + 2(R/a)iA'M0. A0) Так как максимум интенсивности в дифракционном изображении, соответствую- щем (8), находится в начале координат х -- у — г = 0, то дифракционный фокус F при наличии первичной сферической аберрации типа G) расположен в точке хг = № = 0, гР=2(Я/сJЛ;10. (И) Координаты точки F, определяемые A1), допускают простое геометриче- ское истолкование Пусть АУ и AZ— поперечная и продольная сферические аберрации, считающиеся положительными, если луч пересекает ось с положи- тельной стороны от параксиального фокуса. Из E.1.16) при Ф = Л'^р4, р = Yla, D1x — Rx—-R', A0=X==0, я!-=1 имеем (^KЛ;10, A2а) следовательно, на основании элементарных геометрических соображений и предыдущего соотношения | D)a(^)a A26) Для краевого луча (Y = a) это дасг (AZ)M1Kt~4 (R/ayAm. Тогда из A1) сле- дует, что *) дифракционный фокус при наличии малой первичной сферической аберрации расположен посередине между параксиальным и краевым фокусами. Определим теперь максимально допустимую величину сферической абес- рации. Согласно (9.2.14) нормированная интенсивность в параксиальном фо- кусе для любой аберрации типа F) больше или равна 0,8, если A3) В частности, для первичной сферической аберрации имеем или с учетом (9) — \а;ш |sso,94 а,. A4) Это и есть требуемое условие, определяющее максимально допустимую первич- ную сферическую аберрацию, согласно которому максимальное отклонение волнового фронта от опорной сферы Гаусса должно быть меньше 0,94 X. Совершенно таким же способом можно найти координаты дифракционных фокусов и максимально допустимые первичные аберрации других типов. *) Здесь мы пренебрегаем теми небольшими эффектами, которые связаны с разным выбо- ром направлеьня г в настоящем разделе и в § 5.1.
432 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. Э В частности, дифракционный фокус при наличии небольшого первичного астиг- матизма расположен в точке с координатами -J'A^. A5) Этот результат также допускает простое физическое истолкование. Согласно E) и E 3 18) радиксы тангенциальной и сагиттальной фокальных поверхностей J?t и Rs определяются из выражений (Hi снова полагается равным единице) _1_ ^023. — = 0, так что абсциссы zt и zs двух фокальных линий равны A6) A7) Таким образом, из A5) следует, что дифракционный фокус при наличии неболь- шого первичного астигматизма находится посередине между тангенциальной и сагиттальной фокальными линиями. Поскольку первичные кривизна поля и дисторсия описываются членами, содержащими соответственно р3 и р, их эффект, согласно теореме смещения, состоит лишь в смещении как целого трехмерного распределения интенсивности в свободном от аберраций изображении. Итак, при наличии небольшой первич- ной кривизны поля или первичной дисторсии нормированная интенсивность t в дифракционном фокусе равна единице, но сам дифракционный фокус не сов- падает с параксиальным фокусом. В табл. 9 3 приведены результаты, относящиеся к первичным аберрациям. Таблица 93 Координаты дифракционных фокусов и условия, определяющие максимально допустимую величину первичных аберраций Тип аберрации Сферическая абер- рация Кома Астигматизм Кривизна поля Дисторсия Координаты дифракционного фокуса F 0 0 0 0 0 0 3 V a j л««1 0 0 DК '(?)Ч„ 0 ¦DК 0 Условие [> (F) > й,В] \А' \^0,94Х 1 0401 ^ 1 08ll ^ - -
§ 9.4] ДИФРАКЦИОННАЯ, КАРТИНА ПРИ НАЛИЧИИ ОДНОЙ АБЕРРАЦИИ 433- § 9.4. Дифракционная картина, получающаяся при наличии одной аберрации Рассмотрим теперь дифракционное изображение при наличии аберрации, которая описывается одним членом разложения (9.2.11), а именно Ф=а,„„(К*)8г+"!/?^(р)со8/и9. A) Как и раньше, избавимся от явной зависимости Ф от Y\, положив «м- = х «'» W " +т = Т в--4«— B) Введем обозначение C) Тогда дифракционный интеграл (9.1.6) принимает вид U (и, v, if) ^ 1 2л; = —Г f exp /t" Г—ypcos(e—1|>)— 4-ира + а,„т/?^ (p)cosmel ipdprfG. D) Интеграл D) можно представить в виде бесконечного ряда, если разложить ехр[—iypcos(9—i|j)J и ex<p[i<xlnmRZl(p)cosm()] с помощью тождества Якоби (см. (8.8.29)) 2 sWy E) Перемножая оба ряда, получим exp {i [—vp cos <в—if) + a*™ «(р) cos от9]} = 00 00 ' ' [s' (в—f)J, F) где штрихи при символах суммы означают, что члены с индексами 5=0 и s' =0 следует брать с коэффициентом Чг. Подставив F) в D) и проинтегрировав почленно по углу G, находим U (и, v, $) = -4СХГ(-*')ш-1Мсозт8ф Гехр f—1-top'l /,[«««.*?(РI -^-.(ор)Р*. G) s = 0 0 . где член с индексом s=0 снова надо брать с коэффициентом V2. Поскольку нас интересуют только малые аберрации (а мало), можно раз- ложить член Jslo.[nmR'n{p)] под знаком интеграла в степенной ряд, а затем расположить его члены по возрастающим степеням а1пя. Тогда имеем U(u,v,$)=C[U0 + ialnmUl + Aо.ШшГU, + (ialttmf Ua + (ialamf Ut+...}, (8а) 28 М. Ьорн, Э- Вольф
434 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ [|Л. 9 где Г Г 1 1 ! Ua = 2 \ ехр —s" {иРг Jo №) Р Ф1 ! У, = 2 (— 0™ cos<Щ J ехр [—у шр2j R!S(p) /и (up)pdp, о t/, =¦- fH \ ехр — 4- t«Pa {Rn (р)Г J, (vp) pdp + la i f* Г I It > \ exp — -я- wp- {ВД(р)}2 JM (up) p dp, о l — -к-1мра \ {R% {p)\3 Jm (vp) pdp + К (86) v e J I j L ^ 0 / 1 7« = 2Щ I 3 J eXP [~ T teP'] ^ (P)^ /o (Ур) Р * + l о l 4- 4iaa cos 2даф f exp [—4- шр2 {Rn (p)}4 /M (op) p Ф -I- Г 1 1 I + iim cos 4/mj) exp — -5- iup* \R"nl (p)}4 J\m (up) pdp \ . i L г -I U3 = 23- ] 3 (- Ои cos mtp J ехр [— у wpa] {Я? (р)} J Как показал Нижбер, если и и ainm равны по порядку величины единице, то первых четырех членов разложения (8а) достаточна для получения интенсив- ности с точностью до нескольких процентов. Для вычисления интегралов в (86) можно поступить следующим образом. Выразим множитель ехр 1—1/t iups\ через радиальные полиномы с помощью хорошо известной формулы Бауэра *) в виде где Ps— полиномы Лежандра. Полагая coscp ^=2р3—• 1 и используя соотноше- ние РеBр-—1)=/^,(р) (см. (9.2.8)), получим ехр (—'/г шр2) = ехр(—V4 ш)ехр(—V4 шBр2—1)) = = ехр(—V,i" Если подставить A0) в (86), то в правые их части будут входить интегралы, каждый из которых состоит из функции Бесселя, >множенной на произведение радиальных полиномов. Эти интегралы можно вычислить с помощью формулы (9.2.9), а именно ^. (И) *) См., например, [261.
§ 9.4] ДИФРАКЦИОННАЯ КАРШНА ПРИ НАЛИЧИИ О1НОЙ АБЕРРАЦИИ 435 при условии, что каждое произведение радиальных полиномов выр'ажается в виде линейной комбинации членов вида ^ЛрЯ'р(р) с индексом т, равным р порядку функции Бесселя, на которую умножается данное произведение. Общее выражение для коэффициентов Ар получить довольно трудно, но если т и п не очень велики, то требуемые линейные комбинации строятся довольно просто с помощью табл. 9.1, что будет показано ниже на нескольких примерах. Для ознакомления с методами, применяемыми в более общих случаях, мы от- сылаем читателя к работе Нижбера. В частном случае волны, свободной от аберраций, подстановка A0) в G) дает с учетом A1) U {и, v, ц>) = 2Сехр(—V, ш) }/~ X(-i)*Bs + 1) Js+vA1/, ")x = 1С exp (-i/4 ш) Г/ Щ X </)' Bs + I) Js+1/2 e/. и) ^iii3 . A2) Полученное разложение, несмотря на формальное различие, эквивалентно рядам Ломмеля, описанным в п. 8.8.1. Из соотношений (8) можно сразу же получить некоторые общие свойства дифракционного изображения. Как мы видим, величина U не изменяется при замене 1|з на \|5 Н-2ji[a/j?i (jt=l, 2, ..., т)\ следовательно, ось г является осью симметрии т-го порядка. Более того, плоскости, проходящие через ось г и со- ставляющие с плоскостью х = 0 углы itjx/m, служат плоскостями симметрии. При т = 0 система обладает, конечно, вращательной симметрией. Рассмотрим теперь симметрию относительно плоскости 2=0. Отметим,что при замене и на — и все интегралы в (8) превращаются в комплексно сопряжен- ные. Если т— нечетное число, то все коэффициенты при интегралах вещест- венны. Поэтому U (и, V, гр) в этом случае заменяется на комплексно сопряжен- ную величину и, следовательно, интенсивность не изменяется. Иными словами, распределение интенсивности симметрично относительно плоскости 2=0, если т — нечетное число. Если же т — четное, но не равное нулю число, то коэффициенты, содержащие множитель cos2jxm.\|) (здесь ji—целое число), оказываются вещественными, а коэффициенты, содержащие множитель cosB|j. + \IЩ,— чисто мнимыми. Поэтому величина U превращается в комп- лексно сопряженную при одновременной замене и на—¦ и и г|) на ф + я/т. Следовательно, если т — четное, но отличное от нуля число, то интенсивность в любой точке, плоскости г = const равна интенсивности в точке, получающейся при згркальном отражении исходной точки относительно плоскости г =0 с по- следующим поворотом на угол л/т вокруг оси г. Таким образом, ось г, которая в общем случае, как отмечалось выше, служит осью симметрии т-го порядка, является при четном т осью симметрии 2m-ro порядка относительно дифрак- ционной картины в плоскости г =0. При т = 0 (сферическая аберрация) диф- ракционное изображение несимметрично относительно плоскости 2=0. Наконец отметим, что распределение интенсивности сохраняется при из- менении знака коэффициента аберрации аг„т и одновременной замене и на —м, когда т. четно, или при замене ф на \\> +я, когда пг нечетно. Рассмотрим теперь кратко структуру изображения, получающегося в сис- теме при наличии небольшой первичной аберрации. 9.4.!. Первичная сферическая аберрация. В этом случае 1=п—0 и т—4. Функция аберраций не зависит от 0, и трехмерное дифракционное изображение
436 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 9 обладает вращательной симметрией относительно главного направления v = 0. Согласно (8) разложение дифракционного интеграла по степеням а имеет вид U (и, v, ф) = С [?/. +*<а,„) У,+ (fa040)» ?/,+ ...]. A3) где Uo характеризует возмущение свободного от аберрации изображения, a Uу, V%, ... определяются другими соотношениями (86) при т - п — 0. В част- ности, 1 U, = 2 J ехр (—V, wp=) R°AP)Jo(vp)pdp. A4) о Подставляя вместо ехр (—7» i«p2) выражение A0), получим « U,= 2 ехр (-7. ш) Л/ 2| X l-'У Bs+ 1) Л+1/, (V. «) X s 0 A5) Чтобы вычислить интеграл, стоящий в правой части, заменим, как уже объяснялось раньше, произведение радиальных полиномов их линейной ком- бинацией, причем их верхние индексы равны порядку функции Бесселя (в дан- ном случае нулю). Линейную комбинацию легко получить, если воспользо- ваться выражением (9.2.8) и некоторыми хорошо известными соотношениями для полиномов Лежандра. Имеем Rls(p) Rl(p) = PsBp2— l)P2Bpa— 1). A7) Далее Р2 (t) = -^ Ct2—1); следовательно, правую часть A7) можно предста- вить в виде Применяя дважды рекуррентную формулу *) tPs(t)^—±-r [(s+1) Ps+i(t) + sPs-i(t)], A9) получим Р2 (t) Ps (t) =asPs+2 {t) + bsPs (t) +csPs_2 @, B0) где 3(s+2)(s+l) . (s+\)s 3 s(s-l) *"~2B5+3)Bв+1)' s Bs + 3)Bs—1) ' s ~ 2 B Bs + 3)Bs—1) ' s ~ 2 Bs+ 1) Bs — I) ' Следовательно, A7) принимает вид Rl* (P) Rl (P) = asRls+4 (p) + b,^»s (p) 4 c^t-4 (P). B2) Подставляя последнее соотношение в A5) и используя A1), окончательно на- ходим ее ?/,= 2 ехр (-7. ш) |/^ у 21 «s Bs + 1) Л+1/2 G. «) х X [asJ2S + b (v) + bsJ2S+l (v) + csJzs-3 {v)]¦ B3) *) См , например, [27],
§ 9.4] ДИФРАКЦИОННАЯ КАРТИНА ПРИ НАЛИЧИИ ОДНОЙ АБЕРРАЦИИ 437 Таким же образом *) можно разложить в ряд U2, U3, Используя полученные ряды, можно вычислить значения интенсивности / = | U г в ряде точек изображения и построить затем изофоты (линии равной интенсивности). Рис 9 3. Изофоты в меридиональной плоскости при наличии первичной сферической аберрации Ф=0,48Яр* (из [ 1315 Жирная линия обозначает геометрическую каустику Интенсивность нормирована на 100 в центре изображения, свободного от аберраций Интенсивность Штреля в плоскости наилучшего изображения равна 0.95 , В любой плоскости, перпендикулярной к главному направлению и=0, изо- фоты, конечно, имеют вид окружностей. На рис. 9.3 изображены изофоты в меридиональной плоскости при нали- чии первичной сферической аберрации Ф =0,48Ар4, а на рис. 9.4 и 9 5 воспро- изведены фотографии изображений в различных пло- скостях яр» наличии несколько большей сферической аберрации **). 9.4.2. Первичная кома. В этом случае 1=0, п=3 и т=1. Согласно табл. 9.3 дифракционный фокус находится в плоскости г = 0, а возмущение в этой плоскости описывается выражением U @, v, г|)) = С [Uo @, v, ia031) Ut @, v, U2@, v, B4) При и = 0 интеграл Ua, определенный (86), характе- ризует возмущение 2J,(v)/o в фокальной плоскости свободной от аберрации системы (картина Эйри), а Ut легко вычислить с помощью A1). Для нахождения Рис. 9 4. Изображения в плоскости красво1 о фоку- са (а) и в плоскости гео- ., г г метрического кружка паи- 11г, ия, ... мы должны снова выразить произведения меиьшего круговых полиномов через соответствующую их линей- при ную комбинацию. В частности, с помощью табл. 9.1 можно доказать, что рассептия {б) личин пор 1 ичнои сфергческой аберрации Ф16Х4 [15J 1 1 B5) Используя эти соотношения в выражении для с/2 (86) и применяя A1), легко •) Подробности см. в [131 *"*) Разло/чсиис A3) непригодно для вычисления интенсивности, если аберрации немалы по сравнению с длиной волны. При наличии первичной сферической аберрации, равной не- скольким длинны волн, итофоты в меридиональной плоскости были вычислены с помощью механического интегратора Марешалем; его результаты опубликованы в [20, 28, 29] (см. также [5]).
438 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ [гл. 9 ™лда^йлкй*№-ка Рис. 9.5. Изображения в параксиальной фокальной плоскости (я) и в плоскости геометрического кружка наименьшего рассеяния (<5)при наличии первичной сферической аберрации Ф= 17,5" 8,4>.р4, 3,7Ар4 и 1,4>.р4 [15] Масштаб в б втрое больше масштаба в а Рис. 9.6. Изофоты в плоскости г—0 при наличии первичной j комы. Пунктиром показаны линии нулевой интенсивности Покаяана так/гес граница изображения в ппн ближенви геоыь1рической оптики Интенсивность нормирована на J000 в центре изображения, сво бодного от аберраций, а) Ф=О,48яГр3—g-*>) cos 0. интенсивность Штреля рзана 0 879 UOJ б) Ф= 1,4А, ( р3—^-pjcos0, интенсивность Штреля равна 0,306 [14].
§ 9.4] ДИФРАКЦИОННАЯ КАРТИНА ПРИ НАЛИЧИИ ОДНОЙ АБЕРРАЦИИ 439 вычислить интегралы, входящие в U2, в результате чего окончательно получим , v , ^ j B6) Л,(О,с,Ч>) = ™. На рис. 9.6 и 9.7 показаны изофоты, соответствующие разным величинам первичной комы. Данные на рис. 9.6 получены с помощью разложения в ряды. а) Рис. 9.7. Изофоты в плоскости г=0 при наличии первичной комы [30]. Интенсивность нормирована на 100 в центре изображения, свободного от аберраций, а) Ф=*3.2 Хр1 б) Ф = 0А Хр1 cos 6 Рис. 9.8. Изображения в параксиальной фокальной плоскости при наличии комы [15]. Ф=0,3?*о3 cos G, Я.ря cos 6; 2.4Я,ра cos 6; 5Я.Р* cos 6 и !Op3X.cos0 на рис. 9.7 — с помощью численного интегрирования. На рис. 9.8 помещены фотографии изображений, искаженных первичной комой. Приведенные ри- сунки показывают, что при аберрации порядка длины волны изображение
440 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 9 непохоже ни на картину Эйри, ни на изображение, предсказываемое геометри- ческой оптикой. При увеличении аберрации истинное изображение быстро принимает вид, получающийся в геометрической оптике, однако его пересе- кает ряд темных полос; можно показать, что они возникают из-за интерферен- ции лучей, дифрагировавших на концах диаметра отверстия. , Рис. 9.6 иллюстрирует также общий результат, установленный в § 9.2 и состоящий в следующем: если малая аберрация описывается членом, выражен- ным через круговой полином, то распределение интенсивности смещается так, что ее максимум попадает в начало координат. С.4,3. Первичный астигматизм. Аналогичным образом можно исследовать эффект малого первичного астигматизма. В этом случае /---0, я = /и=2, и, Рис. 9.9. Изофоты в центральной плоскости при наличии первичного астигматизма. Пунктирные окружности показывают границу изображения г. приближении геометрической оптики. Иитенсннпость нормирована mt 1000 в центре изображения, свободного от аберрации, о) ф = = 0,113Хр3 cos 29. Интенсивность Штрелл равна 0,84 []0|; б) ф = 0,04лр2 cos 26; интенсивность Штреля равна О.Обй [15]. как было показано в § 9.3, дифракционный фокус находится посередине между двумя фокальными линиями. Рассмотрим распределение, света в центральной плоскости, т. е. в плоскости, проходящей через указанную точку перпенди- кулярно к главному направлению. Если аберрация описывается с помощью соответствующего кругового полинома [Л022/^1(р)соя2В], то центральной плоскостью служит плоскость и = 0. Возмущение в центральной плоскости описывается выражением ?/@, v, 1H = С[?/о(О, v, v, ...].B7) где Ua@, v, if>) определяет, как и раньше, распределение интенсивности в кар- тине Эйри, a /7i@, v, i|:) легко вычисляется с помощью A1). Для нахождения U% используем тождества I 1 1 В результате получим B9)
§ 9.5] ИЗОБРАЖЕНИЕ ПРОТЯЖЕННЫХ ПРЕДМЕТОВ 441 На рис. 9.9 показаны диаграммы изофот изображений, искаженных астиг- матизмом. Данные, приведенные на рис. 9.9, а, были рассчитаны с помощью Рис. 9.10. Изображения в центральной плоскости при наличии пердичиого астигматизма [15]« Ф= 1,4,W cos 2в 2,7Яр2 cos 26, 3,5^р'cos 20. 6,5?.os cos 29. разложения B7), содержавшего члены вплоть до четвертого порядка по га. На рис. 9.10 и 9.11 показаны фотографии искаженных астигматизмом изобра- жений. Как мы видим, при наличии неболь- шого астигматизма изофоты в центральной плоскости имеют вид окружностей лишь вбли- зи центра и более сложную форму на краях изображения. При увеличении астигматизма изображение становится подушкообразным и пересечено интерференционными полосами. Что касается двух оставшихся типов пер- вичной аберрации (кривизны поля и дистор- сии), то мы уже показали, что они не наруша- ют структуру трехмерного изображения, а только смещают положение дифракционного фокуса. Поэтому диаграммы изофот вблизи фок\са при наличии таких аберраций не от- личаются от соответствующих диаграмм для свободных от аберраций изображений (см. рис. 8.39), а лишь смещаются относительно личины, указанные в табл. 9.3. Рис. 9 11. Изображение в плоскости, в которой лежит фокальная линии, при наличии первичного астигма- тизма Ф=2,7^ра cos 29 [15]. параксиального фокуса на ве- § 9.5. Изображение протяженных предметов До сих пор мы изучали только изображения точечных источников. Опишем теперь некоторые общие методы, основанные на фурьс-прсобразованиях, при- меняемых при исследовании изображений протяжениых предметов. Эти методы были развиты, главным образом в работах Дюффье [31], частично в сотруд- ничестве с Лансро [32]; в дальнейшем они были развиты и применены к реше- нию частных задач многими исследователями (см., например, 133—371). Мы рассмотрим отображения когерентным и некогерентным светом раз- дельно. 9.5.1. Когерентное освещение. Обозначим декартовы координаты точек в плоскостях параксиального изображения и выходного зрачка соответственно через (х-,, г/i) и (?, ц) и будем считать, что оси выбранных систем координат взаимно параллельны, а их начала расположены на оси. Точки, лежащие в плоскости предмета, удобно характеризовать такими нормализованными коор- динатами (Хо, i/o), ЧТО AX Ув=- MYa, A)
442 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 9 где (Ко, Yo) ¦— декартовы координаты произвольной точки предмета, а М —• поперечное увеличение; в результате численные значения координат точки предмета и ее параксиального изображения будут одинаковыми *). Оптическую систему можно охарактеризовать с помощью функции про- пускания K(x0, у о', Xi, j/i), которая определяется как комплексная амплитуда вомущения (рассчитанного на единицу площади в плоскости (ао(/о)) в точке (хи tli) в плоскости параксиального изображения, обусловленного возмущением с единичной амплитудой и нулевой фазой в точке предмета (х„, уа). Функция пропускания зависит, конечно, и от длины волны X, однако эта зависимость учитываться не будет, поскольку мы рассматриваем только монохроматический свет. Пусть ио(хо, (/о) — комплексное возмущение в точке, находящейся в плос- кости предмета. Элемент поверхности, содержащий точку (х0, у0), вызывает возмущение сШг(хг, уг) = ?/о(дс0, У о) К(хо, У о', хъ yjdxodyo в точке (хи уг) плос- кости изображения. Следовательно, полное возмущение в точке (xlt yt) равно CG СП Ui (*1> Уг) = \ \ Uо (*о> У») К (хо, Уо> *i> Vi) dxo &Уч- B> Бесконечные пределы интегрирования играют чисто формальную роль, по- скольку вне области, которая посылает свет в пространство изображений системы, величина U0K равна нулю. При рассмотрении точечных источников свойства системы описывались комплексным возущением в плоскости выходного зрачка, которое характери- зовалось функцией аберраций и амплитудным множителем, причем послед- ний считался постоянным в системах с умеренной апертурой. Функцию про- пускания нетрудно выразить через эти величины. Для этого рассмотрим сна- чала соотношение B) в предельном случае, когда источник становится точеч- ным, имеет единичную «силу» и нулевую фазу и расположен в точке xv = x't, у„ = у'„, т. е. когда ^о (*о> Уо) = s (*<> —*оN (г/о—у'<>)> C) где б — дельта-функция Дирака (см. приложение 4). Тогда B) дает ^o; хи уг), D) т. е. функция пропускания К описывает возмущение от точечного источника, задаваемого C). Выберем центр опорной сферы Гаусса в точке параксиального изображения х\ =х'о, у\—у\. Пусть R — радиус этой сферы, а , У',; I, -П) = у в (х'о, у;; g, т|) ехр (~tkR) E) ¦— возмущение ог точечного источника C) в ее произвольной точке (|, л). Тогда фаза функции G равна (с точностью до аддитивного члена л/2) функции абер- раций Ф системы, а амплитуда G служит мерой неоднородности амплитуды волны, формирующей изображение. Множитель i'X в правой части E) введен для упрощения окончательных формул. Согласно принципу Гюйгенса — Фре- неля возмущение в плоскости изображения связано с возмущением на опорной сфере Гаусса формулой (углы дифракции считаются малыми) У г (Xt, ft) = - у JJ Я W, У»\ 1,4)*^-dl йц, F) где s —• расстояние между точкой (|, t\) на этой сфере и точкой (Xi, у,} на плос- кости параксиального изображения, а интегрирование проводится по той чэсти *) (*о> Уа) и (хъ Уг) можно считать переменными Зайделя, введенными в § G.2, если поло» жить li—C—l.
§ 9.5] ИЗОБРАЖЕНИЕ ПРОТЯЖЕННЫХ ПРЕДМЕТОВ 443 опорной сферы, которая приблизительно закрывает апертуру. Если в уравне- ниях (8.8.2) и (8.8.7) положить х = х1—х'о, у = Уг— у'о, г =0 и/ = R, то найдем с ~ р (%—*o)l+(yi —»Л)ч ,7\ »»Д р ~~ • \i 1 Из формул D) — G) получим СЮ СП J J > Л)ехр {—^-[(л:, — где G=0 в точках (?, i\), находящихся вне отверстия. Это и есть требу* емое соотношение между функцией пропускания К и функцией зрачка G си- стемы. Поскольку функцию К можно рассматривать как возмущение в точке изображения точечного источника, то она (рассматриваемая как функция хг, уг) имеет резкий максимум в точке параксиального изображения или вблизи от нее х-1 = х0, У\ = Ув и быстро спадает, хотя, как правило, немонотонно, с уве- личением расстояния до этой точки. В хорошо скоррегированной системе функция К имеет заметную величину лишь в области, размер которой порядка диаметра первого темного кольца в картине Эйри. Как функция координат (х0, уа) К изменяется очень слабо при перемещении точки по поверхности пред- мета. Точнее, рабочее поле можно разделить на несколько областей так, чтобы каждая из них была больше самой мелкой детали, которую система способна разрешить, причем в каждой из этих областей А величина К является в хоро- шем приближении функцией вектора отклонения точки (хи уг) от точки парак- сиального изображения, но не зависит от координат самой точки изображения. Например, в хорошо скоррегированпой системе функция К (л0, уа; хи у±) описы- вает с точностью до постоянного множителя картину Эйри, центр которой на- ходится в точке параксиального изображения (х0, у0), В этом случае можно написать К(хо,уа; х„ у1)=Кд(х1—ха, yl—y0). (9) Область А, обладающая такими свойствами, называется изопланатической областью системы. Ограничимся рассмотрением предметов, малых по сравне- нию с изопланатической областью *). В этом случае уравнения B) и (8) можно заменить на l—xQ, y1—ya)dx<,dy(t Bэ) и К(х1—х0, у1—уа) = I J 0E ) {^ [( ) ()] }dg rf (8a) где функция G уже не зависит от координат точки предмета. в работе [38] !) Подробное обсуждение условий, при которых выполняется соотношение (9), изложено утр ГЯЯ1 '
444 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 9 Разложим [/о, Ui и К в интегралы Фурье: и,(х„уа)=] ] %(f,g)expi-2ni[fXt+gy.]}dtJis, (Юа) *оо со $ A06) — 03 — СЮ СО 00 3tf(/,g)exp{— 2ш [/* + &/]}#<*?. (Юв) Тогда обратное преобразование Фурье дает $ ] y0, (Па) /1, ,A16) J $ (Ив) — СО —CD Согласно уравнению Bа) t/i является сверткой Uo и /^; тогда на основании теоремы о свертке 1391 получим после обратного преобразования Фурье прос- тое соотношение , A2) Отсюда следует, что если возмущения в плоскости предмета и в плоскости изо- бражения представлены в виде суперпозиций пространственных гармоник всех возможных «пространственных частот» /, g, то каждая компонента возмущения в изображении зависит только от соответствующей компоненты в предмете, и их отношение равно У?. Таким образом, переход от предмета к изображению эквивалентен действию линейного фильтра. Более того, сравнение (Юв) с (8а) дает т. е. при когерентном освещении функция частотного отклика (называемая также коэффициентом пропускания) Ж (/, g) равна значению функции зрачка G в точке 1 = %Щ, n^XRg A4) опорной сферы Гаусса. Поскольку G равна нулю в точках плоскости %, г\, лежащих вне отверстия, амплитуды разложения, которые соответствуют частотам, превышающим опре- деленное значение, не пропускаются системой. Если отверстие имеет вид окруж- ности радиуса а, то, очевидно, амплитуды, соответствующие частотам, для которых не пропускаются системой. Чтобы проиллюстрировать этот результат, рас- смотрим одномерный предмет, свойства которого не изменяются в направле- нии х. Пусть Д(/о — период, соответствующий частоте g". Тогда из A5) следует, что система может пропускать информацию только о тех спектральных компо- нентах, для которых к где sin9j,wa//? — половина угловой апертуры со стороны изображения, ко-
§ 9.5] ИЗОБРАЖЕНИЕ ПРОТЯЖЕННЫХ ПРЕДМЕТОВ 445 торая считается малой. Тогда у„=МУ„, где М—линейное /увеличение, и если предположить, что система подчиняется условию синусов, то (см. п. 4.5.1) iQJiQi =M, и A6) можно переписать в виде где Яо = п±Х — длина волны в вакууме, a n0sin90— числовая апертура систе- мы. Таким образом, если возмущение в плоскости предмета меняется синусои- дально в зависимости от положения, то информация о нем в плоскости изобра- жения появится лишь в том случае, если период возмущения превышает зна- чение правой части A7). 9.5.2. Некогерентное освещение. Рассмотрим теперь случай, когда свет, испускаемый различными участками плоскости предмета, некогерентен, на- пример, когда предмет служит первичным источником. Пусть /„(.t,, у„) — интенсивность в произвольной точке плоскости предмета (здесь используются те же координаты, что и раньше). Интенсивность смета, достигающего точки (хи tji) в плоское™ изображения и выходящего из элемента dxadya с центром в точке предмета (ха, у0), равна dh(xu ух) = /о(х0, у„) \К(ха, у0; х±, у±) {'dxady,,, где К—снова функция пропускания системы. Поскольку предполагается, что свет, исходящий из предмета, некогерентен, интенсивности, обусловленные различными элементами плоскости предмета, складываются, так что полная интенсивность в точке (xlt у,) равна t(xl,yl)=§ I Л>(*о.' М>) !#(*„, уп\ хг, y1)\idx,,dytt. A8) — GO — ОС Если снова ограничиться рассмотрением достаточно малых предметов, то можно заменить A8) на М*Г. &)=$ I IAxo,yo)\K(xl—xo,y1—ya)\*dxodyo. A9) — 05 — 00 Отмстим, что замена A8) на A9) не обязательно требует, чтобы функция К удовлетворяла полному условию изопланатичности (9); достаточно, чтобы только модуль К удовлетвор 1л ^му, т. е. чтобы во всей области Л, занятой предметом, выполнялось с хорошей точностью соотно- шение Исследование Дюмонте [38] показывает, что это условие, как правило, выполняйся до- вольно точно в значительно большей области плоскости предмета, чем определяемо.: соотно- шением (9). Следовательно, заменой оптической системы линейным фильтром можно пользо- ваться шире для некогерентного, чем для когерентного освещения. Однако для нахождения связи функции частотного отклика с функцией зрачка системы в виде относительно простой формулы (см. ниже формулу B2)) мы ограничимся рассмотрением предметов, размеры которых настолько малы, -что выполняется полное условие изопланатичности. Соотношение A9) показывает, что при некогерентном освещении рас- пределение интенсивности в изображении является сверткой распределения интенсивности в предмете, в которое входит квадрат модуля функции пропу- скания. Представим эти функции в виде интегралов Фурье A0) и обозначим их «пространственные спектры» через ^о(/, g), ^i(/, g) и J2'(f, g). Тогда с помощью обратного преобразования Фурье получим вместо A1) соотношения $ (/o, B0а) — ао — да fi(f,8)=] ] h(x1,yi)exp{2nl[fxl + gy1]\dxldyl, B06) — 00 — 00 ( СО 00 2 (/, g) - \ J | К{х, у) |»ехр {2т [fx + gy])dxdy, B0в)
446 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ [гл. 9 Из A9) на основании теоремы о свертке имеем fi(f,g) = f,V,g)#(f,g)- B1) Таким образом, переход от предмета к изображению снова эквивалентен действию линейного фильтра, однако в этом случае преобразованию подвер- гается не пространственный фурье-образ комплексной амплитуды, а фурье- образ интенсивности. Функцией частотного отклика системы служит функция ¦2A, g), которую с помощью B0в), (Юв) и теоремы о свергке можно записать в виде g')df'dg'. B2) \Ч Интеграл в правой части B2) называется автокорреляционной функцией ^функции Уъ)', он часто встречается при исследовании многих физических задач статистического характера. Мы с ним еще будем иметь дело позже при изложении ча- стичной когерентности. Ранее было показано, что Ж(f, g) есть значение функции зрачка Gb соответствую- щей точке опорной сферы Гаусса. Подста- вив A3) в B2), получим /W Рис 9 12. Область интегрирования (за- штрихована), относящаяся к вычи- слени--о функции частого отклика X (/",/?) при некогеречтном освещении для пары частот /=5Ai? и g=t\/XR. XR ' XR +6 G'(E', ti')«W. B3) таким образом мы установили, что при неко- герентном освещении функция частотною отклика системы J?(/, g) равна с точностью до постоянного множителя автокорреляционной функции зрачка системы. Пусть Л — площадь выходного зрачка. Поскольку функция зрачка G(?\ т|') равна нулю за границами отверстия, то площадь участка плоскости \\ ц', на котором подынтегральное выражение в B3) не обращается в пуль, равна площади области, общей для отверстия ,1 и такого же отверстия, но сме- щенного относительно первого на расстояния | и ri в направлении отрицатель- ных 5' и т]' (см. рис. 9.12). Когда величины \ и т) настолько велики, что эти две области не перекрываются, функция частотного отклика равна, очевидно, нулю; таким образом, как и при когерентном освещении, система пропускает лишь ге пространственные гармоншш, частота которых не превышает опредеч«.нноп максимальной величины. В частности, в случае отверстия в виде круга риди>са а эти области не перекрываются, если g2+rJ^BoJ или если /¦ + «¦> (& B4) Проводя те же рассуждения, что и при выводе A7) из A5), нетрудно показать, что при использовании некогерентного освещения апланатическая система мо- жет пропускать информацию только о таких компонентах, для периода кото- рых справедливо неравенство .,, ^ O,53w, * и, sin Во * i \^°) Как мы видим, предельное значение в этом случае точно равно половине соот- ветствующей величины, получающейся при когерентном освещении. Хотя функция частотного отклика J? системы зависит от двух переменных / и g, в принципе можно получить полную информацию о ней с помощью экспе- риментов с одномерными пробными предметами. Рассмотрим для этого пару
§ 9 5] ИЗОБРАЖЕНИЕ ПРОТЯЖЕННЫХ ПРГДМЬТОВ 447 1,0 \ 0,2 'о 0,2 0,5 1,0 ДО О 0,1 02 0,3 0,4 Рис 9 13 Нормированные кривые частотного откчика при искогсрсыч ом освещении несколько расфокусированной системы, свободной от геометрических аберрации 1351 ф=— р*, | G |=1. Числа у кривых указывают значения параметра fn—-^y { ~Tf ) г где г-расстоянш «ежду плоскостью наблюдения и параксиальной фокальной плоскостью Рис 9 14 Нормированные кривые частотного отклика при некогерентном освещении несколько расфокусированной системы, своГюччои от геометрических аберраций, в зависимости от прост- ранственной частоты / и расфокусировки г, \G\ — 1 ?40] Кривые на рис. 9 13 являются сечениями данной поверхности плоскостями, перпендикулярными is оси г»
448 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 9 10 0,8 о,в 0,4 0,3 7 0,2 0,4 0?--' 0,8 1,0 12 1,4 ' 7,в Is г,° a) A=1 'B=-f 1,0 1,2 1,4 /,6 7,8 2,0 6) A = 2 1,0 0,8 0,6 0,4 0,2 10,2 " 0,4\-0,6\ '0,в 1,0 1,2^jf(r~W~zd~ '"ya/ B=-2 B=-1 B=0 e) A = 4 Рис 9.15. Нормированные кривые частотного отклика при некогерентном освещении и выб- ранных положениях фокуса системы, обладающей небольшой первичной сферической аберра- цией ф=л (р4—Яр2)?ь, |q=i[4i]. Значение jB=0 соответствует параксиальной фокальной плоскости, В= —2-плоскости изображения проходящей через краевой фокус.
9.5] ИЗОБРАЖЕНИЕ ПРОТЯЖЕННЫХ ПРЕДМЕТОВ 449 v> частот (f, g) и введем полярные координаты в пространстве частот /=ftsin8, g=/icos0. Предположим теперь, что оси повернулись в своей плоскости на угол 0 в положительном направлении 9. Тогда fug преобразуются в 7"= ,= /(bin @—9) и g-=ftcos@—0), но_величина J? остается, очевидно, неизменной. Мы можем выбрать угол поворота 9 равным arctg (fig), при котором новая ось ц(Оц) б\дет лежать вдоль линии 00 (см. рис. 9.12). Тогда /=0, g ~V f-\-g\ и можно заключить, что значение функции частотного отклика $ опти- ческой системы для пары частот (/, g) равно значению функции частотного отклика одномерной структуры с частотой Уf* +?2 u направ- лением периодичности, состав- ляющим угол a.'ctg (fig) с меридио- нальной плоскостью 0=0. Этот результат существенно упрощает получение аналитических выра- жений для функции частотного отклика для любой системы. Ана- логичный результат справедлив, конечно, и для функции частот- ного отклика dfij, g) в случае ко- герентного освещения, однако он имеет значительно меньшее практическое значение. Рассмотрим теперь частот- ный отклик свободной от абер- раций, но слегка расфокусиро- ванной центрированной системы. Из обсуждения, изложенного в п. 9.1.2, следует, что смещение плоскости изображения на не- большое расстояние г в положи- тельном направлении оси г фор- мально эквивалентно введению волновой аберрации, равной 1 R -if B6) Рис. 9 16 Нормированные кривые частотного откли- ка для некогерентого освещспия при наличии пер- вичного астигматизма Ф=—р2 cos2 6, | G \ = 1 [42]. Плпскость изображения расположена писс-редине между тангенциальной и сагиттально и фок ы и Jim и линиями. Линии па а периодичны пдоль меоидиаиа 0=я/4 а на €-вдоль меридианов 8-0 или 0~п/2 Числа на кривых указывают значении параметра m таким образом, если на опорной сфере Гаусса амплитуда волны постоянна, то с точностью до постоянного множителя функция зрачка запишется в виде G (I, ц) = ехр [ЙФ (|, п)] = ехр ']¦ B7) Функцию частотного отклика можно найти из B3) и B7); полученные таким способом графики представлены на рис. 9.13 и 9.14. Из них видно, что при боль- ших частотах отклик системы быстро спадает, если смещение фокуса превышает значение, соответствующее Ф = — р2, т. е. значение г — — I —-) . На рис. 9.15 и 9.16 показаны кривые частотного отклика для систем с пер- вичной сферической аберрацией и первичным астигматизмом Обзор технических средств, использующихся для измерения частотного отклика, приведен в [43J. 29 м
450 ДИФРАКЦИОННАЯ ТЕОРИЯ АБЕРРАЦИЙ [ГЛ. 9 ЛИТЕРАТУРА 1. R а у 1 е i g h, Phil. Mag. 8, 403 A879). 2. E. W о I [, в сб. «Rep. Progr. Phys.», Phys. Soc, 1951, Vol. 14, p. 95. 3. G. C. Steward, Phil. Trans. Roy. Soc. A225, 131 A925). 4. G. C. Steward, The Symmetrical Optical System, Cambr. Univ. Press, 1928. 5. J. P i с h t, Ann. d. Physik 77, 685 A925). 6. J. Picht, Ann. d. Physik 80, 491'A926). 7. J. Picht, Optische Abbildung, ViewMj, Braunschweig, 1931. 8. M. В о г n, Naturwissensch. 20, 921 A932). 9. M. В d r n. Optik, Springer Berlin 1933, p. 202. (M. Б о р н, Оптика, ГНТИУ Харьков — Киез, 1937.) 10. Б. R. А. N ifboer, Thesis, University of Groriingen, 1942. И. В. R. A. N ijboer, Physica 10, 679 A943). 12. B. R. A. N ijboer, Physica 13, 605 A947). 13. F. Z e г n i k e, B. R. А. К i j b о е г, в сб. «La Theorie des Images Optiques», Rev. • d'Opt., Paris, 1949, p. 227. 14. K. Nienhuis, B. R. A. N f j b о е r, Physica 14, 590 A949). 15. К N i e n h u i s. Thesis, University of Groningen, 1948. 16. M. P. В а с h у n s k i, G. В e k e f i, Trans. IRE AP-4, 412 A956). 17. N. G. van К a m p e n, Physica 14, 575 A949). 18. N. G. van К a m p e n, Physica 16, 817 A950). 19. N. G. van К a m p e n, Physica 24, 437 A958). 20. J. F о с k e, Optica Acta 3, 110 A956). 21. K. S t r e h 1, Z. f. Instrumkde 22, 213 A902). 22. R. CoErant, D. H I 1 h e г t. Methods of Mathematical Physics, Intersci. Publ., I953> vol. 1. (P. Курант, Д. Гильберт, Методы математической физики, Гостехиздат М.— Л., 1951, т. 1.) 23. Zernike, Physica I,' 689 A934). 24. R. R i с h t e r, Z. f. Instrumkde 45, 1 A925). 25. A. M а гё с h a 1, Rev. d'Opt. 2fi, 2.57 A947). 26. G. N. \V a t s о n, A Treatise on the Theory of BpsspI Functions, Cambr. Univ. Press, 2nd ed., 1944, p. 368. (Г. В а г с о н, Теория бесселевых функции, ИЛ, 1949.) 27. Е. Т. W h i I t a k e r, G. N. Watson, A Course of Modern Analysis, Cambr. Univ. Press, 4th ed. 1940. (Э. У и т т е к е р и Г. В а т с о н, Курс современного анализа, Физматгиз, 1963.) 28. Е. Н. L i n i о о t, Recent Advances in Optics, Clarendon Press, Oxford, 1955 pp. 60—61. 29. M. F r a n с о n, в кн. «Encyclopedia of Physics», ed. S. Fliigge, Springer, Berlin, 195G, Vol. 24, pp. 321—322. 30. R. К i n g s 1 a k e, Proc. Phys. Soc. 61, 147 A948). 31. P. M. Duf lieu x, L'Infegrale de Fourier et ses Applications a l'Optiquc, Reimes, 1946. 32. P. M. Duffieux, G. Lansraux, Rev. d'Opt. 24, 65, 151, 215 A945). 33. А. В 1 a n с - L a p i e r r e, Ann. de l'Inst. Henn Poincare 13, 245 A953). 34. H. H. Hop kins, Proc. Roy. Soc. A217, 408 (:953). 35. H. H. Hopkins, Proc. Roy. Soc. A23I, 91 A955) 36. H. H. Hopkins, Proc. Phys. Soc. B69, 562 A956). 37. K. Miyamoto, в сб.: «Progr. in Optics», vol. 1, ed. E. Wolf, North Holland Publ. Co., Amsterdam, J. Wiley a. Sons, N. Y., 1961, p. 41. 38. P. Dumontet, Optica Acta 2, 53 A955). 39. I. N. S n e d A о n, Fourier Transforms, McGrow-Hill, New York, 1951, p. 23. 40. W. H. S t e с 1, Optica Acta 3, 67 A956). 41. G. В 1 а с k, E. H. L i n f о о t, Proc. Roy. Soc. A239, 522 A957). 42. M. D e, Proc. Roy. Soc. A233, 96 A955). 43. К. М u r a t а, в сб.: «Progr. in Optics», vol. 5, ed. E. Wolf, North Holland Publ. Co., Amster- dam, J. Wiley a. Sons, N. Y., 1965, p. 199;
ГЛАВА 10 ИНТРРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА § 10.1. Введение До сих пор мы имели дело главным образом с монохроматическим светом, излучаемым точечным источником. Свет от реального физического источника никогда не бывает строго монохроматическим, так как даже самая узкая спект- ральная линия обладает конечной шириной. Кроме того, физический источник имеет конечные размеры и состоит из огромного числа элементарных излучате- лей (атомов). Согласно теореме Фурье возмущение, создаваемое таким источ- ником, можно выразить в виде суммы строго монохроматических и поэтому бесконечно длинных волновых цугов. В элементарной теории, оперирующей с монохроматическим светом, по существу рассматривается одна компонента такого фурье-представления. В монохроматическом волновом поле амплитуда колебаний в любой точке Р постоянна, тогда как фаза линейно меняется со временем. В отличие от этого в волновом поле, создаваемом реальным источником, амплитуда и фаза претер- певают нерегулярные флуктуации, частота которых существенно зависит от эффективной ширины спектра Av. Комплексная амплитуда остается более пли менее постоянной лишь в течение промежутка времени М, малого по сравнению с величиной, обратной эффективной ширине спектра Av. Изменение разности фаз любых двух фурье-компонент за этот промежуток значительно меньше 2л, и поэтому сумма таких компонент представляет собой возмущение, которое в течение указанного промежутка времени ведет себя подобно монохроматиче- ской волне со средней частотой. Однако для более длинного интервала времени это несправедливо. Характеристическое время Д? — 1/Av равно по порядку величины времени когерентч с/"и, введенному в п. 7.5.8. Рассмотрим световые возмущения в двух точках Рг и Рг в волновом поле, создаваемом протяженным киазимонохроматическим источником. Для простоты предположим, что волновое поле создается в вакууме, а расстояние от источника до точек Pi и Р2 составляет много длин воли. Можно ожидать, что при достаточной близости Pi и Р2 друг к другу флуктуации амплитуд и фаз возмущения в этих точках не будут независимыми. Если Рг и Рг так близки друг к другу, что разность между расстояниями до любой точки5источника A?f = SPi—SP2 мала по сравнению со средней длиной волны X, то разумно предположить, что флуктуации амплитуд и фаз в Pi и Л одинаковы. Можно также считать, что между этими флуктуациями будет существовать некоторая корреляция даже при большем удалении Рх от Ps при условии, что для всех точек источника разность расстояний Д^3 не превышает длину когерентности cAi-~c/Av =^3/ДХ. Таким образом, мы приходим к понятию области когерент- ности вокруг любой точки Р волнового поля. Для адекватного описания волнового поля, создаваемого конечным поли- хроматическим источником, желательно ввести некоторую меру корреляции, существующей между колебаниями в различных точках Pi и Р2 поля. Естест- венно полагать, что такая мера будет тесно связана с резкостью интерференци- онных полос, которые получились бы при сложении колебаний в этих точках. Нужно ожидать резких полос при сильной корреляции (например, когда свет приходит в Pi н Рц из очень маленького источника, испускающего излучение 29*
452 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 в узком спектральном интервале) и полного отсутствия полос в отсутствие кор- реляции (например, когда каждая из точек Рх и Рг получаст свет от различных физических источников). Для описания таких ситуаций мы использовали соот- ветственно термины «когерентный» и «некогерентный». В общем случае не реа- лизуется ни одна из этих ситуаций, и нужно говорить о частично когерентных колебаниях. По-видимому, первые исследования, относящиеся к вопросу о частичной когерентности, были выполнены Верде [1], который изучал размеры области когерентности для света от протяженного первичного источника. Позже в ис- следованиях Майкельсона была установлена связь между видностью интерфе- ренционных полос и распределением яркости по поверхности протяженного первичного источника 12] (см. п. 7.3.6), а также между видностью и распределе- нием энергии в спектральной линии 13] (см. п. 7.5.8). Фактически результаты Майкельсопа были интерпретированы на языке корреляций лишь значительно позднее, однако его исследования внесли существенный вклад в формулировку современных теорий частичной когерентности (см. [4]). Первую количественную меру корреляции световых колебаний ввел Лауэ L5J при исследованиях по тер- модинамике световых пучков. Дальнейший вклад в теорию был внесен Бере- ком *) [6], который использовал понятие корреляции при исследовании обра- зования изображения в микроскопе. Новый этап в развитии этого вопроса начался после опубликования статьи Ван-Циттерта [8], который определил совместное распределение вероятностей для световых возмущений в двух любых точках экрана, освещенного протя- женным первичным источником. В следующей статье [Э] (см. также [10]) он определил распределение вероятностей для световых возмущений в одной про извольной точке, но в два различных момента времени. В пределах точное'.и его расчетов распределения вероятностей оказались гауссовыми, и он опреде- лил соответствующие коэффициенты корреляции. Новый, более простой подход к проблеме частичной когерентности был предложен Цсрникс в важной работе [11], опубликованной в 1938 г. Его опре- деление «степени когерентности» световых колебаний прямо связано с экспери- ментом. Он получил также ряд ценных результатов, относящихся к этой вели- чине. Хотя степень когерентности, введенная Цернике, для большинства прак- тических случаев эквивалентна коэффициенту корреляции Ван-Циттсрта и близка к аналогичной величине, предложенной Лауэ, его методы, по-види- мому, особенно хороши для решения практических задач инструментальной оптики. Гопкинс [12] значительно упростил эти методы и применил их к изу- чению формирования изображения и разрешающей силы **). Перечисленные выше исследования связали два крайних случая, а именно случаи полной когерентности или полной иекогерентности. Однако полученные результаты страдали некоторой ограниченностью, так как они относились главным образом к квазимонохроматическому свету и к случаям с достаточно малой разностью хода интерферирующих пучков. Для рассмотрения более сложных ситуаций и формулировки теории на строгой основе было необ- ходимо дальнейшее обобщение. Оно было выполнено Вольфом [15, 16] и неза- висимо Блан-Лапьерром и Дюмонте [171; в этих работах были введены бо- лее общие корреляционные функции. Оказалось, что такие функции строго удовлетворяют двум волновым уравнениям; отсюда следует, что не только оптическое возмущение, но и корреляция между возмущениями распростра- няются в форме волн. В свете этого вывода многие из ранее выведенных теорем получают относительно простое истолкование. *) Эксперименты, относящиеся к исследованиям Берека, описаны в [7]. **) В сходных исследованиях Д. Габор и Г. Гамо использовали понятие частичной коге- рентности при рассмотрении оптической передачи в рамках теории информации [13, 14].
§ 10.1] ВВЕДЕНИЕ 453 Названные выше корреляционные функции характеризуют корреляцию между световыми колебаниями в двух пространственно-временных точках. Такие корреляционные функции «второго порядка» позволяют провести полный анализ обычных оптических экспериментов, в том числе по интерференции и дифракции света от постоянных истопников *). Аналогичные корреляцион- ные функции можно применить и для анализа нестационарных полей, по тогда эти функции необходимо определять через величины, усредненные по ансамблю, а не по времени. (Для стационарного поля усреднения обоих типов обычно приводят к одинаковому резулыату.) Однако мы ограничимся обсуждением лишь стационарных полей, поскольку анализ нестационарных полей требует значительного усложнения математического аппарата и пока нет никаких экспе- риментов, относящихся к эффектам когерентности при нестационарных свето- вых полях. Для анализа более сложных экспериментов могут потребоваться корреляционные функции более высокого порядка, т. е. такие, для которых сумма степеней величин, характеризующих поле, больше двух. Однако до сих пор подобные корреляционные функции практически не использовались. Когда свет излучается тепловым источником, например раскаленным веществом или газо- вым разрядом, мы можем предположить, что совместное распределение вероятностен для поля в п пространственно-временных точках с хорошим приближением будет гауссовым. Как хо- рошо известно (см , например, [18]), такие распределения полностью определяются корреля- ционными функциями второю порядка Это означает, что для света от теплового источника все корреляционные функции более высокого порядка можно выразить через корреляционные функции второго порядка. Однако для света нетепловых источников, например лазера, послед- нее несправедливо Ряд лрф'-'ктов когерентности более высокого порядка и соответствующие корреляционные функции кратко оассмотрепы в работах [)9, 20[ (см также работу Вольфл (|21|, стр. 29), где проведена систематическая классификация эффектов ко|ерентностн). Глаубер [22] ввел аналогичные квантовомеханические корреляционные функция, а Су- даршан [23] рассмотрел связь между классическим и квантовым описаниями (см также [24], где содержится обзор эффектов когерентности второго и более высокого порядков). Теория частичной когерентности привлекательна тем, что она оперирует с величинами (а именно с корреляционными функциями и с усредненными по времени интенсивностями), которые в принципе можно определить из экспери- мента- В этом она является полной противоположностью элементарной опти- ческой волновой теории, где из-за очень большой частоты оптических колебаний основную величину невозможно измерить. В настоящей главе мы будем иссле- довать свойства частично когерентных волновых полей и проиллюстрируем результаты рядом примеров, представляющих практический интерес. Мы кос- немся лишь случая светового поля, но наш анализ годится и для других полей. В частности, подобный подход может использоваться в связи с корреляционной методикой, применяемой для изучения радиозвезд [25] и для исследования ионо- сферы с помощью радиоволн [26J. Математический аппарат, используемый при рассмотрении частичной ко- герентности, применим также для анализа частичной поляризации. Здесь мы коснемся явлений, которые можно интерпретировать через корреляцию между ортогональными компонентами электромагнитных векторов поля. Первые ис- следования в этом направлении проведены Дж. Дж. Стоксом [27] (см. также [28!). Современные теории, в которых применяются понятия корреляционных функций и корреляционных матриц, развиты главным образом Винером [29, 30], Перреном 131], Вольфом [16, 32, 33] и Папхаратнамом [34]. Эта пробле- ма будет рассмотрена в заключительном разделе (см. § 10.8) настоящей главы **). •) Точнее, от источников, создающих стационарное поле, определенное ниже, на стр 460. **) Новые результаты, относящиеся к частичной когерентности, изложены в [89*, 90*] (см. также [91*—93*}). (Прим. перее.)
454 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 § 10.2. Комплексное представление вещественных полихроматических полей Изучая монохроматические волновые поля, мы установили, что полезно рассматривать каждую вещественную волновую функцию как вещественную часть соответствующей комплексной волновой функции. В настоящей главе мы займемся полихроматическими (т. е. немонохроматическими) полями. Здесь также полезно использовать комплексное представление, которое можно счи- тать естественным обобщением представления, применявшегося для монохрома- тических полей. Пусть Vir} (f) (— oos^i^oo) — вещественное возмущение, например де- картова компонента электрического вектора, в фиксированной точке простран- ства. Предположим, что V~n (t) квадратично интегрируемо. Его можно выразить в виде интеграла Фурье V(r» (t) = la (v) cos [ф (\)—2nvt] dv, A) о Свяжем с Vln комплексную функцию со V (t) = I a(v) exp {i [q>(v) — 2n\t]} dv. B) о Тогда имеем где 9» V (t) = J a (v) sin [<p (v) — 2nvt] dv. D) о Функции \ni)(t) и V(i) однозначно определяются функцией V{r)(t), поскольку Vl"(^) получается из V{n(t) при замене фазы tp(v) каждой фурье-компоненты на <p(v) — я/2. Интегралы A) и D) называют сопряженными интегралами Фурье или сопряженными функциями. Можно показать *), что они получаются друг из друга с помощью преобразований Гильберта, т. е. ipj^)*'. E) где Р — главное значение интеграла по Коши при t'-^t. Таким комплексным представлением часто пользуются в теории связи, где V называют аналитическим сигналом **), связанным с V{rK Он получил это название потому, что при V-r), удовлетворяющем определенным обшим условиям непрерывности, функции У (г), рассматриваемая как функция комп- лексной переменной г, аналитична в нижней полуплоскости г (см. [35]). Для дальнейшего укажем переход от V(n к V, когда Vm представлено ин- тегралом Фурье вида У<г>@— 5 v{v)&xp(-~2ntiv)dv, F) Так как функция Vir) вещественна, то • »(— v) = o*(v). G) *) См., например, [35], гл. 5. *•) Понятие аналитического сигнала было введено в работе [36] (см. также [37—391). Комплексные функции действительной переменной, вещественная и мнимая части кото- рых связаны преобразованиями Гильберта, играют важную роль во многих разделах физики и техники. В физике преобразования Гильберта часто называют дисперсионными соотношениями, так как впервые они появились в теории дисперсии света, вызываемой атомами [40] (см. также [411)
§ 10.2] КОМПЛЕКСНОЕ ПРЕДСТАВЛЕНИЕ ПОЛИХРОМАТИЧЕСКИХ ПОЛЕЙ 455 Используя последнее соотношение, мы можем переписать F) в форме A) и после сравнения получим D(v)=-i-a(v)exp[f(p(v)], v>0. (8) Интеграл B), выраженный через v, запишется в виде $(— 2nivt)dv. (9) о Следовательно, V{t) можно вывести из Vm(t), представляя Vin как интеграл Фурье в виде F), пренебрегай амплитудами, связанными с отрицательными частотами, и удваивая амплитуды, связанные с положительными частотами. По этой причине функцию V называют также связанной с Vin комплексной функцией, спектр Фурье которой не содержит отрицательных частот. Оче- видно также, что если спектр Фурье комплексной функции V не содержит амплитуд, связанных с отрицательными частотами, то вещественная и мнимая части V являются сопряженными функциями. Отметим следующие соотноше- ния, которые вытекают из F), G) и (9) на основании теоремы Парсеваля н со- отношения C): ОС СО 0Q Г (Vin{t)fdt= { (VU)(t)ydt=±Y Г V(t)V*(t)dt = — ш — аэ — эз с» (о = С |t)(v)[3dv = 2 C|o(v)|adv. A0) -о» О В большинстве рассматриваемых нами приложений спектральные ампли- туды заметно отличаются от нуля лишь в частотном интервале шириной Av, малом по сравнению со средней частотой v. В этом случае аналитический сигнал допускает простую интерпретацию. Запишем V в виде V{t) = A @ exp {i [Ф (t)-2nvt]\, A1) где А (^0) и Ф вещественны. Согласно (9) и A1) где _ A2) A3) По предположению, спектральные амплитуды заметно отличаются от нуля только вблизи v =v, и поэтому \g(\i) | будет заметной величиной лиль около [i~ 0. Следовательно, интеграл A2) представляет собой суперпозицию гармо- ник низких частот, а так как Av/v<^c 1, то Л (t) и Ф (t) будут медленно меняющи- мися *) (по сравнению с cos 2n,vt и sin 2nvi) функциями t. Выразим Vir) и VU)—¦ вещественную и мнимую части V — через А и Ф: -2nvf]. \ = A (t) sin [<S(t) — 2nvt]. I ( ' *) Очевидно, что, согласно A4), при этих предположениях мы можем написать
456 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 В этих формулах Vln и V<n выражены в виде модулированных сигналов несу- щей частоты v. Мы видим, что комплексный аналитический сигнал тесно связан с огибающей реального сигнала *). Огибающая A (t) и соответствующий фа- зовый фактор Ф (t) выражаются через аналитический сигнал V следующим об- разом: A (t) = V(VWY + (V'"K = VVV* = \V\, Таким образом, A (t) не зависит от точного выбора v, а зависимость Ф@ otv представлена только аддитивным членом 2n\t. Конечно, мы могли бы выбрать в A4) вместо v любую другую частоту v', не изменяя значения А; выражение для нового фазового множителя отличалось бы от выражения A5) лишь тем, что вместо v стояло бы v'. При выводе A4) и A5) мы не пользовались тем, что сигнал узкополосный (Av/v<^ 1), так что эти соотношения являются общими. Однако понятие огибающей полезно лишь при условии Av/v<ic]. Мы предполагали, что «возмущение» Vir)(t) определяется для всех значе- ний t. Практически же возмущение существует лишь в течение конечного ин- тервала времени—T^t^T, по, как правило, он значительно превышает интервал, имеющий в данном случае физический смысл масштаба времени (сред- ний период 1/v и время когерентности 1/Av); поэтому можно считать, что Т—>-оо. Такая идеализация желательна с математической точки зрения из-за пред- положения о стационарности поля (см. п. 10.3.1). Очевидно, в этом случае необходимо также предположить, что средняя по времени интенсивность (про- порциональная (Vrl)-) стремится к конечному значению, когда интервал вре- мени, по которому производится усреднение, неограниченно увеличивается, т. е. что г lira 4f [ (Vln @)a dt A6) конечен. Если этот предел конечен и не равен нулю, то ясно, что интеграл \ (Vlr)'(<))'dt расходится. Тем не менее и здесь можно воспользоваться аппа- ратом анализа Фурье**). Определим «обрезанные» функции следующим об- разом : V<p(t) = V«>(t), когда \t\^T, \ Vp{t) = O, когда \t\>T. | A7} Так как каждую такукиобрезанную функцик>мы«вправесчитать интегрируемой С квадратом, ее можно выразить через интеграл Фурье, например в виде = 5 t.r(v)exp(—2mv0dv. A8a) *) Свойства аналитических сигналов как огибающих изучались в работе [42]. •*) С проблемой анализа функций времени, которые не исчезают при t, стремящемся к бес- конечности, столкнулись на пороге XX века физики, занимавшиеся изучением природы белого света и шума (особенно Л. Гуи, лорд Рэлей и А. Шустер). Строгий математический аппарат был развит главным образом Н. Винером в его работе по обобщению гармонического анализа /43], где изложена также история проблемы и приведена обширная библиография.
§ 10.2] КОМПЛЕКСНОЕ ПРЕДСТАВЛЕНИЕ ПОЛИХРОМАТИЧЕСКИХ ПОЛЕЙ 457 Пусть Vt — сопряженная функция, a VT— ассоциированный аналитический сигнал, т. е. VT(t)^Vp(.t) + iVit>(t)=2\vT(v)zxP(—'2nivt)dv. A8б> о При этом соотношения A0) будут выполняться, если Vir) заменить на Vri и т. д„ Следовательно, разделив каждое выражение на 2Т, получим *} 1 1 (* С С 2 2TJ т J J т ( — со — ое О где Казалось бы естественным перейти теперь к пределу Т—>-во. К сожапению, во многих случаях, представляющих практический интерес, функция G7 (v), известная как периодограмма, не стремится к пределу, а флуктуирует с увели- чением Т (см., например, [44]; см. также 145]). Однако эту трудность можно преодолеть соответствующей процедурой «сглаживания». Например, будем считать, как принято в теории случайных процессов, что функция Vu'(t) является произвольным членом ансамбля функций, характеризующего стати- стические особенности процесса Тогда при соответствующих предположениях о природе ансамбля (стационарный он или эргодический) й|~) можно показать, что флуктуации среднего значения Gj-(v), взятого по ансамблю функций Vlr>(i), стремятся к пулю при Т-^оо. Таким образом, обозначив среднее по ансамблю- чертой, получим для предела «спаженной периодограммы» B1) выражение ***) G (v) = lim G[ (v) = lim vT}1 . B2) Если < > означает усреднение по времени, т. е. <F(t)>= lim ~ f FT(t)dt, B3) •) Подвергая преобразованию Гильберта «обрезанную» функцию, мы не обязательно- снова получим «обрезанную» функцию; поэтому в общем случае F*/' и VT nc равны нулю вне- интервала — Г=С t < Т. По этой причине, а также для того чтобы избежать определенных мате- матических ухищрений, в качестве пределов интегрирования по времени в A9) и B3) берется ^оо, а не ± Т. **) Эти понятия рассматриваются, например, в D4, 46, 47]. ***) Здесь невозможно привести строгое доказательство существования такого предела и вывести некоторые соотношения, введенные эвристически в настоящем разделе, поскольку это завело бы пас слишком далеко б эргодическую чеорию (ем. [48], гл. 11; см. также [46], § 8.4 или [47], стр. 38-44). Вместо усреднения по ансамблю можно использовать и другие операции «сглаживания* (см. [46] или [49], стр. 280—284). Другой способ определения спектра мощности G(v), не связанный с понятием ансамбля,, указан в подстрочном примечании на стр. 462.
458 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 то в предельном случае Г-ьоо получим следующие соотношения, аналогич- ные A9): оэ ее <(Vir>{t)J> = <(F"> @J> = у <У @ V* {f)> = J G (v) dv = 2 ^ С (v) dv. B4) -os 0 В теории стационарных случайных процессов функция G(v), определяемая соотношением B2), называется спектром мощности случайного процесса, ха- рактеризующегося ансамблем функций Vir)(t). Поскольку в наших рассужде- ниях V{r)(f) представляет световое возмущение, величина G(v) dv пропорцио- нальна вкладу в интенсивность, обусловленному частотами в интервале {v,v +dv). Мы будем называть G(v) спектральной плотностью световых коле- баний. Так как Vif1— вещественная часть VT, во всех расчетах, в которых произ- водятся линейные операции над У(/\ можно пользоваться величиной VT и вы- делять вещественную часть только в конечном результате. Более того, так же как ивслучае монохроматических полей, соотношение <(V"°J>=^-g-<l<V*> позволяет выразить среднее но времени значение квадрата вещественного возмущения непосредственно через комплексное возмущение, которое мы свя- -зали с вещественным. § 10.3. Корреляционные функции световых пучков 10.3.1. Интерференция двух частично когерентных пучков. Взаимная ¦функция когерентности и комплексная степень когерентности. Для удовлетво- рительного решения проблем, в которых фигурирует излучение с конечным набором длин волн, испускаемое конечным источником, необходимо, как мы указывали в § 10.1, установить возможную корреляцию между колебаниями в двух произвольных точках волнового поля. Подходящую меру этой корре- ляции можно предложить, исходя из анализа эксперимента по интерференции двух пучков. Рассмотрим волновое поле, образованное протяженным полихроматиче- ским источником а. Вначале пренебрежем эффектами поляризации и будем счи- тать световое возмущение вещественной скалярной функцией положения и вре- мени V{n(P, t). Функции Vl/)(P, t) поставим в соответствие аналитический сиг- нал V (Р, t). Конечно, невозможно наблюдать, как эти величины меняются со временем, поскольку любой детектор регистрирует лишь средние значения за промежутки времени, в течение которых возмущение очень много раз меняет знак. Наблюдаемая интенсивность I (P) пропорциональна среднему значению (V<r) (P, t)J, и, следовательно, с точностью до несущественной постоянной получим, используя A0.2.20), I(P) = 2<(VW(P, t))*> = <.V(P, t)V*(P, i)>. A) Рассмотрим теперь две точки Я, и Рг в волновом поле. Можно эксперимен- тально определить не только f(Pt) м /(Р2)>нои интерференционные эффекты, возникающие при суперпозиции колебаний, исходящих из этих точек. Предста- вим себе, что в исследуемое поле помещен непрозрачный экран Л с небольшими отверстиями в Рг и Р2, и рассмотрим распределение интенсивности па втором экране ?8, находящемся на некотором расстоянии от Л в направлении, проти- воположном направлению на источник (рис. 10.1). Для простоты будем счи- тать, что показатель преломления среды между двумя экранами равен единице. Пусть Sx и s2 — расстояния от произвольной точки Q экрана Ш до Рх и Рг. Точки
§ 10.3) КОРРЕЛЯЦИОННЫЕ ФУНКЦИИ СВЕТОВЫХ ПУЧКОВ 459 Pi и Pi можно считать центрами вторичных возмущений, так что комплексное возмущение в точке Q запишется в виде V(Q, t) = K1V(P1, t—Q + K^(P%, t—t2). B) Здесь tt и U — времена распространения света от Рх до Q и от Ра до Q соответ- ственно, т. е. t^sjc, t,= sjc, C) где с — скорость света в вакууме. Коэффи- циенты Ki и Кг обратно пропорциональны si I и s2 и, кроме того, зависят от размера отвер- <? стий и геомегрии всего устройства (углов па- дения и углов дифракции в точках Рх и Р.2). Так как фаза вторичных волн, распростра- няющихся ОТ Pi и Рг, отличается от фазы рис. 10.1. Интерференционный экс- первичной волны на четверть периода (см. пеР"мснт с полихроматическим све- jcr о г, о о\ тг is том °т протяженного источника ст. §§ 8.2 и 8.3), Кл и К% являются чисто мни- ' мыми величинами. Из A) и B) следует *), что интенсивность в точке Q равна KV1(t—ti)VAt-tt)> + KtK\<VtV-tt)V1{t-t1)>. D) Поскольку предполагается, что поле стационарно **), во всех этих выражениях можно изменить начало отсчета времени. Тогда получим, например, Если использовать также C) и вспомнить, что Кг я Кг— чисто мнимые вели- чины, то D) можно свести к nQ) = \K1\41 + \K2\4, + 2\KiK2\r['l(^=±), F) где Г^(т) — вещественная часть функции Понятие, определяемое выражением G), служит основным в теории частичной когерентности. Мы будем называть его взаимной когерентностью световых колебаний в точках Рг и Р2, причем колебания в точке Pt рассматриваются в мо- мент времени, запаздывающий на величину т по сравнению с моментом времени колебаний в точке Р2. Мы будем называть функцию Г12(т) взаимной функцией когерентности***) волнового поля. Когда обе точки совпадают (Pi=P2), получим и тогда мы говорим об автокогерентности световых колебаний в Pt. При т = 0 это соотношение сводится к выражению для обычной интенсивности Гп@) = /„ Гю@) = /,. *) В дальнейшем там, где это удобно, мы будем пользоваться более короткой записью, а именно Vl{l) вместо ?{РЪ f), Г12(т) вместо V(Pi, Рг, т) и т. д. **) Необходимое здесь предположение о стационарности равносильно утверждению, что (Vi (t)y не зависит от выбора начала отсчета времени и что корреляционные функции T;j(t J")~{Vi (t-\-t')Vj {t-\-t")y (i, /=1, 2) зависят лишь от разности t —t". В этом случае мы часто говорим о «стационарности в широком смысле* (см. [47]). ***) В общей теории стационарных случайных процессов Г12 (т) называется взаимной кор- реляционной функцией величин Vi(t) и V2@. a Гц(т) — автокорреляционной функцией вели- чины V(i)
460 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [тц. 10 Очевидно, что член |/Ci|3/i в F) представляет интенсивность, которая наблюдалась бы в Q, если бы открытым было лишь отверстие Я,(/Сг=О); ана- логичный смысл имеет и член \Kz\42. Обозначим эти интенсивности соответст- венно через 7'U(Q) и 1W{Q), т. е. а также нормируем Г^т), положив V(т) По причинам, которые вскоре станут ясными, назовем величину Viz(T) комплекс- ной степенью когерентности световых колебаний. С помощью выражений (9) и A0) формулу F) окончательно можно переписать в виде () A1) где 7E— вещественная часть у. Последнее соотношение выражает общий закон интерференции для стацио- нарных оптических полей. Оно показываег, что для определения интенсивности, возникающей при суперпозиции двух пучков света, необходимо знать интенсив- ность каждого пучка и значение вещественной части у\г1 комплексной степени когерентности. flojjKe мы покажем, как можно найти у'Л, зная характеристики источника и пропускание среды. Выражение A1) остается справедливым при условии, что s2—St заменено на разность хода P2Q — PtQ, если свет от Pi и Р, попадает в Q не прялю, а че- рез промежуточную оптическую систему, и если можно пренебречь эффектами дисперсии. При таком обобщении формула A1) выполняется и в том случае, когда дна интерферирующих пучка получаются из первичного пучка не путем «деления волнового фронта» в Pi и Р2, а путем «деления амплитуды» в непо- средственной близости к одной точке Ри например в интерферометре Майкель- сона. В последнем случае, в соотношение A1) будет входить у'{((т) вместо В отличие от возмущения Vm, корреляционные функции т?в и Г',^ пред- ставляют величины, которые можно определить из эксперимента. Чтобы найти значение ¦у'й для любой данной пары точек Pt и Рг и для любого заданного значения т, помещают в световой пучок непрозрачный экран с небольшими отверстиями в ?! и Рг, как показано на рис. 10.1, и измеряют интенсивность I(Q) в некоторой точке Q позади экрана, для которой P2Q—PiQ=cx. Затем отдельно измеряют интенсивности ltu(Q) и lu){Q) света, прошедшего через каж- дое отверстие. Выразив 7i» через три найденные величины, получим, согласно (И) „<о = /(Q)-/">(Q)-/'2'(Q) П2 2]//<»(Q) VlU){Q.) ' ' Для определения ГЦ следует также измерить интенсивности I(Pi) и ЦР2) в каждом отверстии. Тогда, согласно A0) и A2), получим для Г^1 Возвращаясь к A0), нетрудно увидеть, что при нашей нормировке Iviafa) K1. Чтобы показать это, введем, как в A0.2.17), обрезанные функции V<p(P, t) = V^(P, t), когда |*|<7\ \ V<p(P, 1)^-0, когда \t\>T, / A4) и обозначим через VT(P, i) ассоциированный аналитический Сигнал, Согласно
§ 10.3] КОРРЕЛЯЦИОННЫЕ ФУНКЦИИ СВЕТОВЫХ ПУЧКОВ 461 неравенству Шварца (см., например, 150], стр. 131) имеем > а VT(Pi, t + T)V'r(Pt, t)dt < СО OS < ]vT(Plt t + x)V'T{Pu t + T)_dt I VT(PS, t)V'T(P2, t)dt. A5) В первом интеграле правой части t -\-% можно заменить на t. Тогда, разделив обе части на 4Т2 и переходя к пределу при Т—>-оо, получим |12()|<п()га(О)( A6) или, учитывая A0), lYuWKl- A7) Смысл Via легче всего понять, если выразить A1) в несколько иной форме. Обозначим через v среднюю частоту света и запишем Vis W = iTu (т) |ехр {» К8(т) — 2IXVT]}, A8) где al2(t) = 2;tvT + argVi2(T). A9) Тогда A1) перейдет в / (Q) = lw(Q) + Iti4Q) + 2VrTE4Q)V'T^4ffi\y12(x)\Cos[an(-i)-b\, B0) где параметр т и разность фаз б равны T = sX=il, в = 2ягт = ^ (8,-sJ, . B1) а Я.— средняя длина волны. Если \уц{%) | достигает своего максимального зна- чения, равного единице, то интенсивность в точке Q будет совпадать с интен- сивностью, которая получилась бы со строго монохроматическим светом с дли- ной волны X и разностью фаз между колебаниями в Рг и Ръ равной а12(т). В таком случае можно сказать, что колебания в Р, и Р2 (при соответствующем времени задержки тмежду ними) когерентны *). Если Yi2(t) имеет другое экстре- мальное значение, а именно нуль, последний член в B0) исчезает. Тогда не воз- никает никаких интерференционных эффектов от этих пучков, и можно ска- зать, что колебания некогерентны. Если |yi2(t) | не совпадает ни с одним из двух экстремальных значений, т. е. если 0< Iyi2(t) |<1, то говорят, что колебания частично когерентны, причем IfjaMI представляет степень их когерентности. При любом значении |yial интенсивность I (Q) можно также представить в виде /(Q) = |T12W|{/<1)(Q) + /B)(Q) + 2J/7^4Q))/7^(Q)X ¦ XCOs[a12(T)-8]} + {l-|Vl2(T.)|}{/H)(Q) + /'3)(Q)}- B2) Можно считать, что члены в первой строчке возникают из-за когерентной суперпозиции двух пучков с интенсивностями |Vi2(t)| /A)(<Э) и lTi2(t)|/<2|(Q) и относительной разностью фаз а,2(т) — б; члены во второй строчке -- из-за некогерентной суперпозиции двух пучков с интенсивностями II— lYiaWll /ll)(Q) и [1—|у)г(тг)|]/<2>(Q)- Таким образом, свет от обоих отверстий, достигающий точки Q, можно считать как бы состоящим из смеси когерентной и некогерент- ной частей с отношением интенсивностей ^КОГ I Yl2 (Т) | *) 0бщи4 свойства когерентного света исследованы в работе E11,
462 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 ИЛИ -Г3*- = I Vi, I. (/пол, = '«or + /„еког) • B36) ' ноли Мы видели (см. уравнение A2)), что у<? можно найти, измеряя интенсив- ности в соответствующем интерференционном эксперименте. Ниже (см. п. 10.4.1) мы покажем, что для большинства случаев, представляющих прак- тический интерес, из таких экспериментов можно найти также и модуль (а в принципе и фазу) у12. 10.3.2. Спектральное представление взаимной когерентности. Пусть V1/» (Р, t)= ) vT(P, v)exp(— 2ni\t)dv B4) •— интегральное фурье-представление вещественной обрезанной функции V*fl. Тогда обратное фурье-преобразование дает B5) откуда следует, что , 0 I МЛ. v)exp[—2 Оехр(— 2яМ)dt \vT(Plt v)exp (— = ] vT(Px, v)v'T(P,, v)exp(—2ntvr)rfv. B6) Разделим обе части последнего соотношения на 2Т и применим к величине Vj(Pi, у) v'r(P^, \')/2Т «операцию сглаживания» по ансамблю случайных функ- ций Vм. Такое усреднение по ансамблю (обозначавшееся чертой) было описано выше в связи с уравнением A0.2.20). Наконец, переходя к пределу Т-*-<х>, мы можем ожидать, что *) <Vln(Pi, t+-x)Vlr)(P2, t)>= ) G,2 (v) exp (—2jmvt) dv, B7) — CO где G12 (v) = lim J il_ T- " , . . B8) Функцию G12(v) можно назвать взаимной спектральной плотностью световых колебаний в точках PL и Р„. Она представляет собой обобщение спектральной плотности, введенной ранее (см. A0.2.22)), и переходит в нее при совпадении обеих точек. Понятие взаимной спектральной плотности является оптическим аналогом понятия взаимного спектра мощности в теории стационарных слу- чайных процессов. Уравнение B7) показывает, что вещественная корреляцион- ная функция <.V0)(Pi, ? + т.) У("(Ра, t)y и взаимная спектральная плотность Gls.(v) образуют пару, связанную фурье-преобразованием **). *) Здесь справедливо то же примечание, что и на стр. 457. **) Когда P-l—P,, этот результат является оптическим эквивалентом хорошо известной теоремы Винера — Хинчина [43, 52J. Вместо процедуры сглаживания для определения взаимной спектральной плотности С1г (v) можно использовать обратное фурье-преобразование от B7). Для настоящей главы такой подход полностью эквивалентен процедуре, указанной в тексте.
§ 10.4] ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ КВАЗИМОНОХРОМАТИЧЕСКОГО СВЕТА 463 Перейдем теперь к комплексному представлению. Пусть V(P, 0 = 2$y(v)exp(— 2nM)dv ' B9) о о •— аналитический сигнал (см. § 10.2), ассоциированный с Vm(P, f). Пользуясь теми же приемами, при помощи которых мы перешли от B4) к B7), можно по- казать,- что Т12 (т) = <У (Р„ t +i) V* (Р„ t)> = 4] Gla (v) exp (— 2nivT) d\. C0) Так как величина Г12 не содержит спектральных компонент, принадлежащих отрицательным частотам, она представляет собой аналитический сигнал. Следовательно, если через Т\Г1 и Г$ обозначить ее вещественную и мнимую части, т. е. считать, что Ги(т) = Г«й(т) + ДГ8(т), C1) то эти функции будут связаны преобразованиями Гильберта, а именно Отсюда вытекает, что величина |Г12|, рассматриваемая как функция т, яв- ляется огибающей Т[г> (см. A0.2.10)—A0.2.15)), а из C0), C1) и B7) следует, что *) , P2, 0> = 2 J G12(-v)exp(—2rovT)dv. C3> — да Кроме того, \у1й] служит огибающей вещественного коэффициента корреляции Tg(T) r^W = <У<"(Р,.<4.т)Уи>(/Чф_ C4> /Г1г@) 1^Г22@) У <(!/"¦> (Ръ 0)J> jA<(V(n (P2, t)f> Уравнение C0) служит спектральный представлением взаимной функции когерентности Г12(т). Уравнение C3) показывает, что вещественная часть Г12(т) равна удвоенному значению взаимной корреляционной функции вещественных функций Vlr> (Plt t) и У<г>(Ра. t), a C2) определяет связь между вещественной и мнимой частями Г,а(т). § 10.4. Интерференция и дифракция квазимонохроматического света Как мы видели, для адекватного описания интерференции частично коге- рентного света, вообще говоря, необходимо знать взаимную функцию когерент- ности Fi2(t) или, что эквивалентно этому, обычные интенсивности /х и /2 и комп- лексную степень когерентности уц(т). Здесь мы ограничимся важным случаем квачимонохроматического света, т. е. света, состоящего из спектральных компонент, которые занимают частотный интервал Av, малый по сравнению со средней частотой v. Мы покажем, что в этом случае теория принимает более простой вид. В частности, мы найдем, что при определенном дополнительном предположении, которое выполняется во многих приложениях, вместо Fi2{t) и уц(х) можно применять корреляционные функции, не зависящие от пара- метра т. *) Нетрудно показать, чтофуйкция Г'Л (т) равна также 2<К«(Рг, <Ю (См., например, [53] или [54], стр, 241—242).
464 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 10.4.1. Интерференция квазимонохроматического света. Взаимная ин- тенсивность. Обратимся вновь к интерференционному эксперименту, изобра- женному на рис. 10.1. Согласно уравнению A0.3.20) интенсивность в точке Q интерференционной картины задается соотношением ¦«г). B) где Допустим, что мы имеем здесь дело с квазимонохроматическим светом. Тогда из уравнения A0.3.18) следует (аналогично тому, как это было показано в связи с уравнением A0.2.11)), что по сравнению с cos 2л vt и sin 2jivt величины IYi2(t.I и ais(x) будут медленно меняющимися функциями т. Более того, если отверстия в Pi н Л достаточно малы, интенсивности /[1)(<2) и /C)(Q) света, дифрагировавшего на каждом отверстии по отдельности, сохраняются в доста- точной степени постоянными в области, в которой cos 2ял>т и sin 2jtvt много- кратно меняют знак. Отсюда следует, что распределение интенсивности в окрест - лости любой точки Q слагается из почти однородного фона IU)(Q) + /I2)(Q) К Рис. 10.2. Распределение интенсивности в интерференционной картине, образованной двумя квазимонохроматическими пучками равной интенсивности /A> со степенью когерентности h>|- &- когерентна я суперпозиция (]у) = 1), б-частично когерентная суперпозиция @ <Jy] < 1); е—неко- герентная суперпозиция (у=0). и наложенного на него синусоидального распределения с почти постоянной амплитудой, равной 2 |/"/A) (Q) У IB) (Q) \у1а (т) |. На рис. 10.2 показано рас- пределение полной интенсивности для трех типичных случаев. Максимумы и минимумы интенсивности вблизи Q с хорошей точностью определяются выра- жениями Следовательно, видность полос в точке Q равняется 2 \'г1Щ0) У (Q) VII <4\ ¦'„акс+/„ип~ /«"(Ql + ^UQ) lfI2lT^- Kf Эта формула связывает видность полос с интепсивностями двух пучков и их степенью когерентности. Если, как часто бывает, интенсивности обоих пучков равны [/ш = I'2'], то D) переходит в V {Q) = | "Via (х) !> E) т. е. в этом случае видность полос равна степени когерентности. Согласно A) и B) положения максимумов интенсивности вблизи Q опре- деляются выражением Э, ±1, ±2, ...).
§ 10.4-1 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ КВАЗИМОНОХРОМАТИЧЕСКОГО СВЕТА 465 Таким же выражением определялись бы положения максимумов при освещепии отверстий строго монохроматическим светом с длиной волны Я., если бы фаза колебаний в Рг отставала относительно фазы в Р2 на те12(т). Согласно G.3.7) отставание фозы на величину 2я соответствует смещению интерференционной картинг i в направлении, параллельном РгРг, на величину aXld, где d— рас- стояние между 1\ и Р2, а а— расстояние между экранами Л и 33. Следова- тельно, полосы, полученные с квазилшнохроматичгашм светом, смещены отно- сительно полос, которые образовались бы при синфазном освещении точек Pi и Рг монохроматическим светом на величину x-JLl-a м F) е направлении, параллельном линии, соединяющей, отверстия. Мы ьидим, что из измерений видности и положения интерференционные полос можно определить амплитуду и фазу комплексной степени когерент- ности квазимонохроматических пучков света. Метод их определения тесно свя- зан с описанным в и. 7.5.8 методом Майкельсона для определения распределе- ния интенсивности в спектральных линиях из измерений кривых видности. Из уравнений A0.3.10) и A0.3.30) следует, что \ G (v) ехр (— 2nivx) dv Tn W = -—— С G (v) dv 0 где G(v) — спектральная плотность. Следовательно, согласно обратной тео- реме Фурье, G(v) пропорциональна фурье-образу величины Vu(T)- Но мы толь- ко что видели, что модуль Yii(t) по существу равен вищюсти полос, образую- щихся в соотзетстсуюцем интерференционном эксперименте, а фаза уц(т) связана с их положением простым соотношением. Таким образом, мы прихо- дим к такому же способу расчета О, каким пользовался Майкельсон. Очевидно, можно считать, что кривые видности, приведенные на рис. 7.54 и 7.55, пред- стазляют JVn[ как функцию разности хода двух интерферирующих пучков. На практике время задержки т одного интерферирующего пучка относи- тельно другого часто довольно мало, и тогда приведенныг вышг формулы легко упростить. Согласно уравнениям A0.3.10), A0.3.18) и A0.3.30) имеем i Г12 (т>| ехр [ia12 (т)] = Vh Vh I Yu W I exp [fau (г)] = =* 4 \ G%i (v) ехр [— 2я1 (v — v) т] dv. G) о Если модуль |т| так мал, что \(у — v)t-|<^1 для всех частот, при которых |Gi2(v)| имеет заметную величину, т. е. если то, очевидно, мы внесем лишь небольшую ошибку, если заменим экспоненци- альный член подынтегрального выражения в G) единицей. Условие (8) озна- чает, что, согласно G.5.105), |т| должен быть мал по сравнению с временем ко- герентности света. При этом условии |Г12(т)|, lyiaWI и ап(т) незначительно 30 М Ьоон. Э. 1>ол„Л
466 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 отличаются от |Г12@)|, b>i2(O)| и а.ц@) соответственно. Удобно положить*) Ji,= Tu(fi) = <Vl(t)V;(f)>, (9a) »*»=т»@) = FCTFfcw = VTrfTT, = /fcr (S6> Р12 = «12 (Ф = arg vM @) = arg ц12. (9в> Теперь уравнения A0.3.10) и A0.3.18) дают при выполнении условия (8) Yi» 00 « IMu 1ехР [* (Р12—2itvx)] =ц12ехр (—2?uVr), A0а) Г12 (т) да | /121 ехр [г (Рц — 2лл>т)] = Jl3 eip( — 2nivT). A06) Таким образом, при выполнении условия (8) во всех наших формулах мы можем заменить уг2{т) и Г12(т) на величины, стоящие в правых частях соотношений A0а) и A06) соответственно. В частности, закон интерференции A) примет, вид Он будет выполняться до тех пор, пока разность хода |s2—- Si\ — с |т| между интерферирующими пучками будет мала по сравнению с длиной когерентно- сти c/Av, т. е. до тех пор, пока |A^| = |s2-Sl|=|o<J, A2) где использовано соотношение c/Av — X4SX. Уравнение A1) является основной формулой элементарной (квазимоно- хроматической) теории частичной когерентности. Эта теория составит предмет рассмотрения в оставшейся части настоящего параграфа; в § 10.5 будут рас- смотрены некоторые ее приложения. Если справедливо уравнение A1) (т. е. выполнены неравенства (8) или A2)), то корреляция между колебаниями в лю- бых двух точках Рг и Р2 волнового поля характеризуется не Гп(т), а У12, т. е. величиной, которая зависит не от разности времен т, а от положения этих точек. В пределах применимости элементарной теории мы можем написать, как видно из A0а), lYiaWI«IHi.l. A3) так что | |ii9|@^ IHizl^l) представляет степень когерентности колебаний в точках Pi и Рг. Из уравнения A1) следует, что фаза |512 величины }х,2 представ- ляет собой эффективную разность фаз этих колебаний. Величину [i12 (так же, как и 71г(т)> частным случаем которой она является) обычно называют комплекс- ной степенью когерентности (иногда комплексным коэффициентом когерент- ности), величину Ji2—взаимной интенсивностью. 10.4.2. Расчет взаимной интенсивности и степени когерентности для све- та от протяженного некогерентного квазимонохроматического источника. а. Теорема Ван-Циттерта — Цернике. Определим взаимную интенсивность J-12 и комплексную степень когерентности ц12 для точек Pi и Р2 экрана -Л, осве- щаемого протяженным квазимонохроматическим первичным источником а. Для простоты в качестве а возьмем часть плоскости, параллельной „1, и пред- положил!, что среда между источником и экраном однородна. Допустим также, что малы как линейные размеры а по сравнению с расстоянием ОО' между ис- точником и экраном (рис. 10.3), так и углы между ОО' и линиями, соединяющи- ми произвольную точку S источника с точками Ръ и Р2- Вообразим, что источник разделен на элементы dau da2, ... с линейными размерами, малыми по сравнению со средней длиной волны X, и центрами, на- ") Мы вновь пользуемся сокращенным обозначением, т. е. пишем Jl2 вместо J (Рх, Рг} т. д.
§ 10.4] ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ КВАЗИМОНОХРОМАТИЧЕСКОГО СВЕТА 467 ходящимися в точках Su S3, ... Если Vml(r) и Vms(t) — комплексные возму- щения в точках Pt и .Р2, обусловленные элементом dom, то общее возмущение в этих точках равно Следовательно, J(PU Р2) = Световые колебания, создаваемые раз- Рис_ 1аз. к теореме Ван-Циттерта—Церникё. личными элементами источника, мож- но считать статистически независимыми (взаимно некогерентными), причем среднее значение поля равно нулю; тогда *) ' <VMJ(OV^@> = <KM1(OXV;,(*)>=0. когда т^л. .A6) Если Rmi и Rms— расстояния точек Л и Рг до элемента источника dom, то 1 \ A7) где |Лт| характеризует силу, a arg Лт — фазу излучения от от-го элемента**), a v — скорость света в среде между источником и экраном. Следовательно, / x \ V ехр •_ A8) Если разность хода Rm2—Rml мала по сравнению с длиной когерентности света, в аргументе А"т можно пренебречь запаздыванием (Rm^— Rml)/v. Тогда из A5), A6) и A8) получим hniv(Rml—Rm2)\ ^e^ ^5 -• A9) Величина <Am(f)A"m(f)> характеризует интенсивность излучения, испускае- мого элементом источника dom. В любом практически интересном случае число элементов источника можно считать настолько большим, что мы вправе рассматривать источник как непрерывный. Обозначая через / (S) интенсивность на единицу площади источника, т. е. I(Sm)dom—<Am(t)A'm{t)>, получим***) •) О некогерентности можно говорить лишь при наличии конечного (хотя не обязательно широкого) спектрального интервала; поэтому уравнение A6) неверно для идеализирован- ного случая строго монохроматического света. Для монохроматического света Vml (t)— — Uml ехр (—2nivf), Vm @== Un2 ехр (—2mV), где Uml и Um не зависят от времени, так что (УшгфУпг W}~ ^mifn2, а эта величина в общем случае отлична от нуля. *¦) В общем случае Ат зависит также от направления, но для простоты мы пренебрежем втой зависимостью. ***) В дальнейшем мы будем часто пользоваться обозначениями dS, dPt, ... для элемен- тов поверхности с центрами в точках S, Р1г ... 30*
468 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 вместо A9) / (РА) =¦ J/ (S) «*Р{'^Д,-*.)} dS, B0) где /?а и J?z— расстояния между произвольной точкой S источника и точками Ях и />2, a fe"-—2nv/u = 2пД—волновое число в среде. Комплексная степень когерентности ц( Ри Р2), согласно B0) и (96), равна '^1 dS, B1) §]dS B1a) a г— интенсивности в точках Р, и Р2. Мы видим, что интеграл B1) совпадает с интегралом, который появляется в другом случае, а именно при вычислении на основе принципа Гюйгенса — Френеля комплексного возмущения в дифракционной картине, возникающей при дифракции сферической волны на отверстии в непрозрачном экране. Точ- нее, B1) означает, что комплексная степень когерентности, которая описывает корреляцию колебаний в фиксированной точке Р2 и переменной точке. Рг плоско- сти, освещенной протяженным квазимонохроматическим первичным источни- ком, равна нормированной комплексной амплитуде в соответствующей точке Pt некоторой дифракционной картины с центром в точке Р2. Эта картина получится, если заменить источник дифракционным отверстием такого же размера и формы и заполнить его сферической волной, сходящейся в Р2, причем распределение амплитуд по волновому фронту в отверстии должно быть про- порциональным распределению интенсивности по источнику. Этот результат впервые был получен Ван-Циттертом [8], а позднее, более простым способом, Цернике fll]. Мы будем именовать его теоремой Ван-Циттерта—Цернике. В большинстве приложений можно считать, что интенсивность / (S) не зависит от положения точки S на поверхности (постоянная интенсивность). Тогда соответствующая дифракционная проблема совпадает с проблемой дифракции сферической волны постоянной амплитуды на отверстии такого же размера и формы, как и источник. Пусть E, г\) — координаты произвольной точки S источника в системе с началом в точке О, и пусть (Хг, У\) и (Х2, У2) — координаты точек PL и Рг в системе с началом в точке О' и осями, параллельными осям первой системы {см. рис. 10.3), Тогда, если R — расстояние 00', то Ш^. B2) Здесь оставлены лишь основные члены относительно XJR, YJR, %IR и t\/R. Для R2 получается точно такое же выражение и, следовательно, В знаменателе подынтегральных выражений B0) и B1) Rt и fi2 с достаточно хорошей точностью можно заменить на R. Положим также — Р> яр
§ 10.4] ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ КВАЗИМОНОХРОМАТИЧЕСКОГО СВЕТА 469 Тогда B1) примет вид в**ЭД ' (Е- V) ехр [ - ik {Pg + яц)) dl drj ц12 = —f~ — . B6)' ]] HI. r\)dld4 Следовательно, если линейные размеры источника и расстояние между Pt и Рг малы по сравнению с расстоянием чтих точек от источника, степень когерент- ности | |i121 равна абсолютному значению нормированного преобразования Фурье от функции, описывающей интенсивность источника. Величина i|), определяемая B5), допускает простую интерпретацию. Согласно B3) она представляет собой разность фаз 2л (ОР1—ОР2I%, которой, очевидно, можно пренебречь, когда B7) Для однородного источника в виде круга радиуса р с центром в точке О, интегрируя B6), получим (см. п. 8.5.2) где a Ji— функция Бесселя первого рода первого порядка *). Согласно п. 8.5.2 величина \2Jl(v)Iv\ монотонно уменьшается от значения, равного единице при v=0, до нулевого значения при v =-3,83. Таким образом, степень когерент- ности монотонно уменьшается, когда точки Р^ и Р2 удаляются друг от друга. При удалении Рг и Р2 на расстояние C0) достигается полная некогёрентность. При дальнейшем увеличении v вновь воз- никает небольшая когерентность, но степень ее остается меньше 0,14. Полная пекогерентность вновь наступает при v — 7,02. Проходя через нуль, функция Ji(v) каждый раз меняет знак, т. е. фаза р\2= ai"g(.i]2 при этом изменяется на я. Следовательно, после каждого исчезновения полос яркие и темные полосы меняются местами. Функция l'2J1(v)/v\ монотонно уменьшается от значения, равного единице при v-=0, до 0,88 при v — 1, т.е. при Считая отклонение в 12% максимально допустимым отклонением от идеаль- ного значения, равного единице, получим, что квазимонохроматический одно- родный источник углового радиуса а = p/R почти когерентно освещает пло~ щадку в виде круга диаметром **) 0,16 К/а. Этот результат полезен при оценке *) Никакой путаницы не должно возникать оттого, чти символ / используется также для обозначения взаимной интенсивности, так как последняя встречается всегда с двумя индексами или с несколькими аргументами, **) Верде еще в 18G5 г. иашел, что диаметр «кружка когерентности» несколько меньше 0,5 ЯЯ/р [1].
470 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 размеров источника, требуемых при проведении экспериментов по интерферен- ции и дифракции. В качестве примера рассмотрим размеры «области когерентности» вокруг произвольной точки экрана, освещаемого непосредственно Солнцем. Угол 2гх, под которым солнечный диск виден на поверхности Земли, составляет около 0г32'«0,018 рад. Следовательно, если пренебречь изменением яркости по по- верхности солнечного диска, диаметр d области когерентности приблизительно равен 0,1бХ/0,009»18Х. Для средней длины волны Я = 5,5-10 см получим d да 0,01 мм. В связи с изложенным выше предстает в новом свете метод Майкельсона измерения угловых диаметров звезд (см. п. 7.3.6). Согласно E) и A3) видиость полос равна степени когерентности световых колебаний на двух внешних зер- калах {Мг и Ms на рис. 7.16) звездного интерферометра Майкельсона. Для звездного диска в виде круга постоянной яркости с угловым радиусом а наи- меньшее разделение зеркал, при котором степень когерентности обращается в пуль (первое исчезновение полос), равно, согласно C0), 0,6Ша, что соответ- ствует G.3.42). Более того, из измерений видности и положения полос в прин- ципе можно определить не только диаметр звезды, но и распределение интен- сивности по ее диску. В самом деле, согласно п. 10.4.1, измерения видности и положения полос эквивалентны определению как амплитуды, так и фазы ком- плексной степени когерентности \ils, а согласно B6) распределение интенсив- ности пропорционально обратному фурье-преобразованию ц12. В п. 7.3.6 мы упоминали о важной модификации звездного интерферометра Майкельсона, предложенной Брауном и Твиссом. В разработанной ими сис- теме свет от звезды фокусируют на два фотоэлектрических детектора Р1 и Р3, и информация о звезде получается путем изучения корреляции флуктуации их выходных токов. Полный анализ характеристик такой системы должен учи- тызать квантовую природу фотоэффекта *); он требует также определенных знаний по электронике и поэтому выходит за рамки настоящей книги. Однако нетрудно понять принцип метода. При идеальных условиях эксперимента (от- сутствие шума) ток на выходе каждого фотоэлектрического детектора пропор- ционален мгновенной интенсивности / (() падающего света, а флуктуация этого тока пропорциональна А 1A) —1A)—</(/)>. Следовательно, в интерферометре Брауна и Твисса измеряется величина, пропорциональная 013 = <Д/1Д/5>. Простой статистический расчет показывает [591 (см. также [60]), что Q,2 про- порционально квадрату степени когерентности и, значит, величина Q,2, так же как и |ц12|, дает информацию о размере звезды. б. Формула Гопкинса. При выводе формулы Ван-Циттерта — Цернике B1) мы считали, что среда между источником а и точками Р,_ и Р2 однородна. Нетрудно обобщить эту формулу на другие случаи, например на случай неодно- родной среды или среды," состоящей из ряда однородных областей с разными показателями преломления. Вновь представим себе, что источник разделен на небольшие элементы dau do2, ... с центрами в точках Si, S2) ..., причем линейные размеры этих элементов малы по сравнению со средней длиной волны X. Если, как и раньше, Vmx(t) и Vml(t) — возмущения в точках Рх и Р2, обусловленные элементом dam, то уравнения A5) и A6) остаются по-прежнему справедливыми, но в A7) каждый множитель (exp ikRmJ)/Rml (/ -- 1, 2; k — 2nv7i>) необходимо заменить более общей функцией. Введем функцию пропускания среды K(S, P, v), опре- деляемую так же, как это было сделано в п. 9.5.1. Она представляет комплекс- ное возмущение в точке Р, обусловленное монохроматическим точечным ис- точником с единичной силой и нулевой фазой, испускающим излучение частоты v и расположенным в точке 5 элемента do. Для однородной среды из принципа •) См. [55]. См. также [54, 56—58].
§ 10.4] ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ КВАЗИМОНОХРОМАТИЧЕСКОГО СВЕТА 471 Гюйгенса — Френеля находим, что K(S, Р, v) =—(texp ikR)l'KR, где R— расстояние SP; при этом предполагается, что угол между SP и нормалью к da достаточно мал. В более общем случае множитель exp ikRm;IRmj необходимо заменить па iXK(Sm, PJt v), и тогда, переходя к непрерывному распределению, вместо B0) мы получим следующее соотношение: $ Л- v)/t*(S, Р2, v)dS. C2) а Согласно C2) и (96) имеем ji(Рх, /»,) = уТ(^уГГЩ)§1(S)K(S, Л. у) 1С(S, Р2, v)dS, C3) где /(Рг) = / (Plt Рх) и / (P3) — J (Р2, Р2)— интенсивности в точках Рг и Р2 соответственно. v Для дальнейшего полезно представить последние два соотношения в не- сколько иной форме. Положим Ри v)VT(S) = U(S, Pt), ilK{S, Р2, v) VT(S) = U(S, Р2).C4) Тогда формулы C2) и C3) примут вид /(/>„ PJ=$U{S, PJU4S, P2)dS, C5a) C5б) Отметим, что определяемая соотношением C4) величина U(S, P) пропорцио- нальна возмущению, которое возникало бы в точке Р от строго монохроматиче- ского точечного источника, испускающего излучение частотой v (с силой V1 (S) и нулевой фазой) и расположенного в точке S. Таким образом, можно рассматривать формулы C5) как соотношения, выражающие взаимную интен- сивность J (Pi, P2) и комплексную степень когерентности \i,(Pu P2), обуслов- ленные протяженным квазимонохроматическим источником, через возмущения, создаваемые в Рг и Р2 каждой точкой ассоциированного монохроматического источника *). Выражение C56) было впервые предложено Гопкинсом [12], исходившим из эвристических предположений. Оно чрезвычайно полезно при решении про- блем когерентности в инструментальной оптике. Основная ценность этой фор- мулы состоит в том, что так же, как и теорема Ван-Циттерта — Цсрникс, она позволяем рассчитать комплексную степень когерентности света, испускаемого некогерентным источником, без явного использования процесса усреднения, 10.4.3. Пример. В качестве иллюстрации к предыдущим рассуждениям рассмотрим такой эксперимент. Первичный источник а0 с помощью линзы Ь„ изображается на небольшое отверстие ах. Пучок света, выходящий из этого отверстия, превращается в параллельный линзой L,. Вторая линза L2, в точ- ности подобная Llt сводит интерферирующие пучки в фокусе /-' своей фокаль- ной плоскости <Т. Плоское зеркало М служит для уменьшения общей длины прибора (рис. 10.4.). *) Нельзя предположить, что для такого воображаемого источника взаимная интенсив- ность и комплексная степень когерентности света также будут определяться формулами C5). Как отмечалось выше, соотношение AG), использованное при выводе этих формул, несправед- ливо в предельном случае монохроматического излучения; степень когерентности монохромати- ческого света фактически всегда равна единице.
472 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 Рис. 10.4. Схема дифрактометра. Если в параллельном пучке между линзами Lt и L2 расположить дифрак- ционную маску (темный экран Л, например, кусок равномерно почернев- шей пленки) с отверстиями любого желаемого размера и формы и с любым их распределением, то в фокальной плоскости ? получится ее фраунгоферовская дифракционная картина. Обычно оператор может смещать маску, рассматри- вая в то же время дифракцион- ную картину в микроскоп *). Если в качестве 0„ исполь- зовать квазимонохроматический точечный источник, то вблизи его геометрического изображения в плоскости ог получилось бы ко- герентное освещение. Размер такой когерентно освещаемой области порядка эффективного размера дифракционной картины Эйри аА, образуемой линзой Lo и соз- даваемой одной точкой источника. Можно считать, что распределение света в плоскости о\, обусловленное конечным первичным источником, возник- ло в результате некогерентной суперпозиции ряда таких картин. Если, мы предположим, что изображение этого протяженного источника, образуемое Lo. и отверстие а, велики по сравнению с аА, то освещенное отверстие at само служит некогерентным источником**). Согласно теореме Ван-Циттерта — Цернике при таком источнике будет существовать корреляция между колеба- ниями в любых двух точках на первой поверхности линзы Lx (или, для боль- шеи общности, в плоскости Л). При обычных приближениях находим, что комп- лексная степень когерентности определяется формулой B8), т. е. C6а) v = = ??:, n, = =:iii-], C66) где d = PiPi, Pi— радиус ai, R — расстояние между <Ji и Llt rt и r2— расстояния ОТ Pi И Р2 ДО ОСИ. Если дифракционная маска Л содержит два небольших круглых отверстия с центрами в точках Рх и Р2, то получающаяся картина, наблюдаемая в фокаль- ной плоскости W, обусловлена суперпозицией двух выходящих из этих отвер- стий частично когерентных пучков со степенью когерентности |nia|. Рассмотрим изменения в структуре этой карти- ны при постепенном увеличении расстояния между Pt и Рг, т. е. при изменении степени когерентно- сти между двумя интерферирующи- ми пучками. Предположим, что точки Рг и Рг расположены симметрично отно- сительно оси. Тогда ф =0, а интен- сивности fU)(Q) и /("'(Q) в точке Q фокальной плоскости, связанные с каждым из двух пучков, равны и выражаются с помощью формулы Фраунгофера для дифракции на круглом отверстии (8.5.14). Если точка Q Рис. 10.5. К расчету распределения интенсив- ности в фокальной плоскости дифрактометра. *) Этот прибор известен как дифрактометр и используется главным образом в оптиче- ских дифракционных методах для решения проблем реитгеноетруктурного-анализа (см. [61— €3]) ""*) Этот вопрос рассматривается количественно в п. 10.5.1 (см. также [64]),
§ 10.4] ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ КВАЗИМОНОХРОМАТИЧЕСКОГО СВЕТА. 473 служит фокусом для лучей, дифрагировавших в направлениях, которые образуют угол ц> с нормалью к Л, и если а—радиус каждого отверстия (рис. 10.5), то с точностью до нормирующего множителя имеем C7) Разность фаз 8 для пучков, дифрагировавших к Q, равна ' 6 = = PJV = = dsmq> = Ctt», C = ^ —, C8) ЛЯ ZK PiO где N — основание перпендикуляра, опущенного из Pi на луч, идущий из точки Р2. Подставляя C6), C7) и C8) в A1), окончательно получим для-интен- сивности в точке Q(cp) фокальной плоскости, когда отверстия Рг и Р, раз- делены расстоянием d, соотношение / (Ф, d) = 2l—S-i—i 1 H ^-i cos(pla(t))—Сгда) , C9) где 6,„ (v) — 0, когда —— > О, I D0) = я, когда На рис. 10.6 показаны фотографии картин, пблученных с помощью такого устройства для различных расстояний d. Приведены также соответствующие теоретические кривые, рассчитанные по формуле C9). Пунктиром показаны огибающие >• ) Интересно отметить, что при $ — п (случаи (Г) и (Д)) интенсивность в центре каждой картины имеет в соответствии с нашими общими выводами относитель- ный минимум, а не максимум. Изменение степени когерентности при взаимном удалении обоих отверстий показано на рис. 10.7. Соответствующими буквами там указаны те шесть положений, к которым относятся фотографии на рис. 10.6. 10.4.4. Распространение взаимной интенсивности. Рассмотрим П}чок квззимонохроматического света от протяженного первичного источника сг и предположим, что взаимная интенсивность известна для любой пары точек на воображаемой поверхности Л, пересекающей пучок. .Мы покажем, что в этом случае можно определить взаимную интенсивность для каждой пары точек на любой другой поверхности 53, освещаемой светом от Л либо непосредственно, либо через оптическую систему. Предположим, что среда между 4иЗ однородна и ее показатель прелом- ления равен единице. Пусть U (S, Qi) и U( S, Q2) — возмущения в точках Qi и Qi па поверхности S3 (рис. 10.8), обусловленные произвольной точкой S ассоциированного монохроматического источника. Тогда, согласно C5), взаим- ная интенсивность J (Qt, Q2) определяется выражением J(Qi, Q?) = $^(S, Qi)U*(S, Q2)dS. D2) a Величины U(S, Qi) H V(S, Q2) на основании принципа Гюйгенса — Френеля можно выразить через возмущения во всех точках поверхности Л в виде U(S, Q1)=[U{S, руЛ^.А.ёРг. D3) Л 1
474 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 tew. .Л
§ 10 4] ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ КВАЗИМОНОХРОМЛ.ТИЧЕСКОГО СВЕТА. 475 I -si ггк ее ? к к 5OI м u й- <= ЯР о ^ ^ о о la 2 1.2 & ¦s
476 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 Здесь Sj— расстояние между точкой Qi и произвольной точкой Pi на поверхно- сти Л, Ai— коэффициент наклона в точке Рх (в гл. 8 он обозначался буквой К), k — 2nv/c—среднее волновое число. Для небольших отклонений от нор- мали к поверхности Л Л»—i/K. Используя D3) и аналогичное выражение для U(Qi), получим U(S, QJU4S, Q,)=HU (S, P.) V* (S, P.) exp Л.Л; dP, dPt. D4) Ы г» 0,6 0,4 0,2 0 12 3 4 d,cn Рнс. 10.7. Интерференция двух пучков частично когерентного света. Степень когерентности как функция расстоянии d между диумя освеща- емыми отверстиями в дифрактомегре р, = 0,45^10-s см. R=152 см, 5= = 5790 А, предполагается некоге- рентное освещение ffi. В специальном случае, в следующее выражение для \ A A причем точки Рг и Р2 независимо друг от друга пробегают всю поверхность интегрирования Л. Подставим теперь D4) в D2) и изменим порядок интегрирования. Интегрирование по а дает точно J (Р Р*)> и мы получим D5) JJ ¦ЛЛ Эта формула, предложенная Дерните [66], описы- вает распространение взаимной интенсивности. При ее выводе мы неявно предполагали, что свет от каждой точки поверхности Л достигает точек Qj и Q2. Наличие любой диафрагмы между обеими поверхностями можно учесть, если ограничиться интегрированием лишь но тем частям поверх- ности Л, которые посылают свет к Qx и Q2. Такой способ приводит к неверному результату, если диафрагма столь мала, что нельзя прене- бречь дифракционными эффектами на ее краях. Дифракцию можно учесть, выполняя переход от А к 33 в два этапа, сначала от Л к плоскости диафрагмы, а затем от плоскости диафрагмы к поверхности Si. когда точки Qx и Q2 совпадают, D5) переходит интенсивности: ехр s, — s3)] A.AldP.dP,. D6} ЛЛ Здесь мы выразили J(P±, Я2) через интенсивности /(Pi), /(P2) и комплексную •Л Рис. J0.8. Распространение взаимной интенсивно- сти. К выводу формулы D5). Рис. 10.9. К выводу форму- лы D6). тепень когерентности n(Pi, P2). В этой формуле интенсивность в точке Q представлена в виде суммы вкладов от каждой пары элементов dP,, dP2 произ- вольной поверхности Л, пересекающей пучок (рис. 10.9). Вклад от каждой
§ 10.5J НЕКОТОРЫЕ ПРИЛОЖЕНИЯ 477 пары элементов зависит от интенсивности в точках Pi и Р2 и содержит в качестве весового множителя соответствующее значение комплексной степени когерент- ности \i.(Pi, Pi). Соотношение D6) можно считать выражением принципа Гюй- генса — Френеля для распространения интенсивности в частично когерентном поле. Сходство только что выведенных формул с формулами более элементар- ной теории Гюйгенса—Френеля имеет глубокий смысл, который выяснится при строгой формулировке теории частичной когерентности (см. ниже, § 10.7). Если на пути света от А до 59 находится оптическая система, нужно, очевидно, заменить множитель (Лехр (iks))/s соответствующей функцией про- пускания К(Р, Q). Тогда вместо D5) мы получим более общую формулу, а именно J(Q» Q,) = JS.4Pi. Р*)К(Р„ QJK4P*, Qa)dPtdPs. D7) лл § 10.5. Некоторые приложения 10.5.1. Степень когерентности в изображении протяженного некогерентного квазимонохроматического источника. Прежде чем переходить к изучению образования изображения в частично когерентном свете, полезно рассчитать степень когерентности в изображении протяженного некогерентного источника, полученном с помощью центрированной оптической системы. Конечная степень корреляции между колебаниями в плоскости изображения возникаег из-за того, что свет от каждой точки источника не собирается в одну точку, а распре- деляется по конечной площадке, вследствие дифракции (а в общем случае и абер- раций). Некоторые из таких «площадок» перекрываются, поэтому в интенсив- ности в достаточно близких друг к другу точках в плоскости изображения вно- сится как когерентный, так и некогерентный вклад. Предположим, что о — однородный квазимонохроматический некогерент- ный источник в виде круга радиуса р, излучающий свет со средней (в вакууме) длиной волны Хо и расположенный в пространстве предмета в однородной среде с показателем преломления п. Пусть далее D — расстояние между плоскостью предмета и плоскостью входного зрачка. Соответствующие величины в про- странстве изображения мы будем обозначать теми же символами со штрихом. Обозначим через d расстояние между двумя точками Pt и Р2 входного зрачка. Предположим, что p/'D<S:l, d/D<^l и 0Рг—ОР2<5?^о, где О--цент- ральная точка источника *). В этом случае комплексная степень когерентности (Р Ра) в соответствии с A0.4.28) равна MJY я,) = 2^2, (D ^dsma, S?dsma, B) Л. ?^0 где ос «sin аягр/D — угол, под которым радиус источника виден из центра входного зрачка (рис. 10.10). Комплексную степень когерентности для любой пары точек в плоскости выходного зрачка мы могли бы определить, применяя закон распространения A0.4.47). Однако здесь мы рассматриваем специальный случай распростране- ния от одной плоскости к сопряженной ей плоскости, и этот закон принимает более простую форму, которую можно получить следующим образом. Пусть U(S, Pi) и U(S, P2) — комплексные возмущения в точках Pt и Р2, обусл пленные возмущением в точке 5 ассоциированного монохроматического *) Величина ]|i(Pi, Рг)\ не изменится, если последнее условие не выполняется, но фаза |i (Рь Р2)> согласно A0.4.28), увеличится на величину if—2я 1ОР±— ^
478 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 источника (см. стр. 473); тогда возмущения, обусловленные возмущением в точ- ке 5, в точках выходного зрачка, сопряженных* Pt и Р2, определяются форму- лами u(s, p;)=kuu(s, рг) U(s, p',)=kZ2u(s, pj. <з> Здесь Ки — К(Ри Р[) — соответствующая функция пропускания для распро страпения возмущений между сопряженными точками Pi и Р[ плоскостей зрач- ков. По формуле Гопкинса A0.4.356) имеем Интенсивности / (PI) и / (PJ в плоскостях обоих зрачков связаны соотношением /(Pi)= \ | U (S, Pi) |2 dS = |/Сп |а J I ^ (Si Ях) |3dS = | ^Сц |* / (Pi). E) а а Аналогичным соотношением связаны 1(Р'^ и /(Р2). Из C), D) н E) получим W V * 1 Г = ехр [» (Фц—Ф22)] ц (Р,, Рг), F) где Фи и Ф22— фазы Ки и /Сгг соответственно. Это соотношение означает, что _ Р,.1 Плоским» Плоскость ехоЯного зрачка еыхоЗнаго зрачка. Рис. 10.10. К вычислению степени когерентности в изображении некогерентиого источника света. степень когерентности \ [г | для любых двух точек выходного зрачка равна сте- пени когерентности для сопряженных точек входного зрачка, а фазы соответст- вующих значений комплексных степеней когерентности для соответствующих пар точек отличаются на величину Фп— Ф22, от. е. на геометрическую раз- ность фаз 2n{[P1P'l] —iPzP'Ji/Xo. Пусть v'^^-d'sma'. G) Так как точка Р[ сопряжена с Р1у а точка P's— с Р2, то в рамках параксиальной оптики из теоремы Смита— Гельмгольца (см. D.4.49)) следует, что *) v'= v. Саедовательно, комплексную степень когерентности для пары точек в выходном зрачке можно, согласно A) и F), записать в виде 1-Фг2)}. (8) Если, как и в A0.4.31), считать значения \\к 1^0,88 достаточно хорошими при- ближениями к полной когерентности и вспомнить, что 12J (v)lv \~^s 0,88, когда •) Это означает, что оно' соответствуют особому выбору переменны* Зайделя (см. § 5.2).
§ 10.5] НЕКОТОРЫЕ ПРИЛОЖЕНИЯ 479 , то окажется, что некогерентный квазимонохроматический однородный круглый источник будет когерентно освещать в выходном зрачке площадки диа- метром где 2<x'«;2p7D'—угол, под которым диаметр изображения источника виден из центра выходного зрачка и %Jn' = V— средняя длина волны света в простран- стве изображения. Запишем (9) в несколько иной форме. Пусть г а обозначает радиус первого темного кольца в картине Эйри, связанной с системой, т. е. о^ v A I» SUlO где п' sinQ'fii n'a'/D'—числовая апертура со стороны изображения. Тогда, согласно (9) и A0), (йог/^л^ОДб sin 970,61 since', и, следовательно, (П) В этоц! формуле размеры когерентно освещаемых областей выходного зрачка выражены через «физические параметры», а именно: радиус г'А первого темного кольца соответствующей картины Эйри, радиус р' геометрического изображе- ния источника и радиус а' выходного зрачка. Выходной зрачок и, следовательно, плоскость изображения освещаются почти когерентно, если а"К0Т^а', т. е. если р'<0,26г'л. A2) Когда dkor<^ а', т. е. когда p'^>0,26rk, A3) когерентно освещаемые площадки выходного зрачка будут малы по сравнению с самим выходным зрачком, так что в этом случае выходной зрачок фактически освещается некогерентно. При этом комплексная степень когерентности для пар точек Q\, Q'2 в плоскости изображения будет совпадать со степенью когерент- ности, обусловленной некогерентным источником, расположенным там же, где и выходной зрачок, п обладающим теми же размерами и формой, причем рас- пределение интенсивности вдоль источника и выходного зрачка одинаково. Следовательно, согласно теореме Ван-Циттерта — Церникс A0.4.21), имеем MQ1, Q;) =,.—4 ^ \ 1 (Пехр {l\{sr4)] ЧР', (i4) C^-W. (is) 65 А Л Интегрирование проводится по выходному зрачку Л', а через Sn и я, обозначают расстояния от произвольной точки Г" на Л' до точек Q{ и Qj, соответственно (рис. 10.11, а). Интенсивность I (P') можно рассчитать, зная интенсивность /(Р) в сопряженной точке входного зрачка, посредством соотношения E). Поскольку в это соотношение не входит фаза функции пропускания, величина fi (Q;, Qj) не зависит от аберраций системы. Как правило, интенсивность 1(Р') практически постоянна; кроме того, если точки Q[ и Q'2 достаточно близки друг к другу, выражение A4) принимает вид (и') - , 2яп' а' ... "=^-77 где К— расстояние между Q[ и Q'2.
480 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 В общем случае, когда не выполняется ни условие A2), ни условие (L3), выходной зрачок освещается частично когерентным светом, который характери- зуется комплексной степенью когерентности (8). Тогда значение комплексной степени когерентности для пары точек в плоскости изображения нужно рассчи- тывать с помощью закона распространения A0.4.45), что приводит к выражению VJTKWTJK) А'А" X X exp Пользуясь им, можно также рассчитать интенсивности I{Q't) и I{Q'%), если Плоскость JTrnc/focmh Плоскость Пласкоспь выходного зрачка изображения выходного зрачка изображения а) б) Рис 10.11. К вычислению комплексной степени когерентности к плоскости изображении. а-некогерецтное освещение выходного зрачка; б —частично когерентное освещение выходного зрачка. учесть, что |г (Q[, Q[) = ц (Qi,, Q3) = 1. Отметим, что в этом случае комплексная степень когерентности зависит от аберраций системы, поскольку подынтеграль- ное выражение содержит фа,;ы Ф,, и Ф22 функции пропускания. 10.5.2. Влияние конденсора на разрешающую силу микроскопа. Для того чтобы исследовать под микроскопом небольшой несветящийся объект, его необ- ходимо осветить. Если объект почти прозрачен, как это обычно бывает, он осве- щается снизу, т. е. освещается проходящим светом, и свет, прошедший через Источник Т паяя зрения , < Рис. 10.12. Критическое освещение. объект, фокусируется в плоскости изображения объектива микроскопа. Для получения достаточной освещенности обычно используют вспомогательную систему линз — конденсор. Существуют различные методы освещения. Здесь г.;ы кратко опишем два широко распространенных метода, так называемое кри- тическое освещение и освещение по Келеру, и рассмотрим разрешающую силу, которую можно достичь с их помощью. а. Критическое освещение. В этом методе равномерно яркий источник рас- полагается непосредственно за диафрагмой поля зрения и с помощью конден- сора изображается на плоскость предмета объектива микроскопа (рис, 10.12),
§ 10.5] НЕКОТОРЫЕ ПРИЛОЖЕНИЯ 483 Размер диафрагмы поля зрения подбирается так, чтобы ее изображение конде»* сором точно покрывало поле зрения. Размер освещенной области в плоскости изображения конденсора (плос- кость предмета объектива) значительно больше, чем эффективный размер диска Эйри, создаваемого одной точкой источника (в обозначениях, принятых в п. 10.5.1, р'5>>/"л). Согласно п. 10.5.1 при таких условиях комплексная сте- пень когерентности для любой пары точек в плоскости предмета объектива совпадает со степенью когерентности, обуслов.генной некогерентным источни- ком, заполняющим конденсор. Кроме того, степень когерентности не зависит от аберраций конденсора. Очевидно, что разрешающая сила микроскопа зависит только от степени когерентности света, падающего на предмет и от свойств объ- ектива. Следовательно, аберрации конденсора совершенно не влияют на разре- шающую силу микроскопа. Этот важный результат, впервые полученный другим способом Цернике [671, показывает ошибочность широко распространенного мнения, согласно которому хорошо скорректированный конденсор обладает преимуществами при получении высокой разрешающей силы. Для оценки влияния размеров конденсора на разрешение рассмотрим два небольших отверстия Рг{Хи У г) и Р-г{Х,_, Y,) в плоскости предмета. Комп- лексная степень когерентности света, достигающего этих отверстий, при тех же предположениях, что и прежде, определяется формулой типа A6), а именно М- <Р„ P.t) = 2J^ . и» = f1 ViXt-Xp + lYt-Ytfni! sin в;. A8) где n'csin %— числовая апертура конденсора со стороны объектива микро- скопа. Пусть Р(Х, Y) — любая другая точка в плоскости предмета, а Р'—ее изображение объективом. Предположим, что объектив практически свободен от аберраций. Тогда распределение интенсивности в плоскости изображения; объектива для света, приходящего только от Ри представляет собой картину Эйри, центром которой служит изображение Р\ точки Рх. Следовательно, если nosin 90— числовая апертура объектива, то интенсивность /A1 (Я')> обусловлен- ная светом, который приходит в точку Р' только из Ри с точностью до постоян- ного множителя равна iy 2LY A9a) Интенсивность fm(P'), обусловленная светом, который попадает в эту точку от отверстия Р2, определяется аналогичным выражением |V(XX1) + Oryi)n,sine,. A96) Таким образом, если два отверстия освещаются через конденсор, то интенсив- ность / (/") в плоскости изображения объектива микроскопа обусловливается суперпозицией двух частично когерентных пучков. Интенсивность каждого из пучков определяется выражениями A9), а комплексная степень когерентно- сти— соотношением A8). Подставляя указанные соотношения в формулу A0.4.11), сразу же получим выражение для / (Р'). Если предположить также, что точка F" достаточно близка к геометрическим изображениям точек Р1 и Р2 (тэчнее, что 6 = [Р1Р'] — 1Р2Р')<^К), то формула для 1{Р') примет вид (^)(^) (^^)(^)(^) B0) где ii ' v" = ^ = Т /(X, -X,)» + (Yг -YSY щ sin %, B1) Из соотношения (?0) можно вывести ряд, интересных заключений. Если
482 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА {ГЛ. 10 tnvu является отличным от нуля корнем уравнения Ji(mv12) = 0, то в соотнсК шении B0) отсутствует член, содержащий произведения, и оно принимает вид Г(Р'Л (^Ji (pi)V | (^^i(vi) \ IOO\ \ vi J \ «s / Распределение интенсивности в плоскости изображения оказывается тогда таким же, как и при некогерентном освещении отверстий Р, и Я3. Это осуще- ствляется, например, когда т = 1, а л18— отличный от нуля корень уравнения JiiVm) =0, т. е. когда числовые апертуры равны, а расстояние между геомет- рическими изображениями отверстий равно ра- диусу одного из темных колец картины Эйри, создаваемой объективом. Если числовая апертура конденсора очень мала (/и-*-0), то 21 (mt>12)/my12?K 1 и B0) сводит- ся к L(m) го 0,8 ЦВ 0,4 0,2 B3) При этом для любого расстояния между отвер- стиями распределение интенсивности остается таким же, как и в случае полностью когерент- ного освещения. Формула B0) позволяет изучить зависимость распределения интенсивности в плоскости изо- бражения объектива микроскопа от отношения числовых апертур т. В частности, определим интенсивность в точке, находящейся посере- дине между Р[ и Pj. Будем считать, что изо- бражения отверсти начинают разрешаться, интенсивность в этой точке на 26,5% меньше, чем интенсивность в Рис. 10.13. Влияние апертуры конденсора на разрешение изоб- ражений двух небольших отвер- стий равной яркости [68]. когда каждой из наших двух точек. Величина 26,5% соответствует критерию Радея для круглого отверстия при некогерентном освещении (см. п. 8.6.2). Выразим предельное разделение (P-iPt)nV№, соответствующее этому критерию, в одина- ковом виде как для иекогерентного (см. (8.6.32)), так и для когерентного (см. (8.6.55)) освещения (Л^пред^Ит^- B4) На рис. 10.13 изображена кривая L(m), рассчитанная из B0) на основе указан- ного критерия. Как мы видим, наилучшее разрешение получается при ш» 1, 5, т. е. при числовой апертуре конденсора, примерно в полтора раза превышаю- щей числовую апертуру объектива. Величина L в этом случае несколько меньше значения 0,61, получающегося при некогерентном освещении. б. Освещение по Кёлеру. В предложенном Кёлсром [691 методе освещения, схема которого приведена на рис. 10.14, собирательная линза располагается рядом с диафрагмой поля зрения и образует изображение источника а в фокаль- ной плоскости конденсора (где расположена диафрагма конденсора). Тогда лучи, исходящие из каждой точки источника, образуют после прохождения конденсора параллельные пучки. Преимущество такого устройства заключается в том, что неравномерность в распределении яркости по источнику не вызывает неравномерности в освещенности поля зрения. Чтобы оценить предельное разрешение, достигаемое при освещении методом Кёлера, необходимо прежде всего определить комплексную степень когерентности ji для пар точек в плоскости предмета объектива микроскопа. Пусть U (S, Р.) = Ах€хр (Ар,), U(S, Р2) = Л2 exp <i<p2) B5)
§ Ю.5] НЕКОТОРЫЕ ПРИЛОЖЕНИЯ 483 ¦— комплексные возмущения в точках Pi(X,, Yt) и PaiX^, Y2) плоскости пред- мета объектива микроскопа, обусловленные возмущением в точке 5 монохро- матического источника, ассоциированного с а. Очевидно, <p.-q>. = |LHX.-Xi) + ?(i'i-*'.>]. B6) л» где р и q — первые две лучевые компоненты двух параллельных лучей, ис- пускаемых точкой S источника и проходящих через точки Рг и Р.. При наличии аберраций в конденсорной системе два луча не будут строго параллельны, однако такой непараллелыюстью вполне можно пренебречь, поскольку мы Конденсор источник / Т вспомогательная линза. Апертурная (ирисовая) диафрагма Плоскость предмета Рис. 10.14. Освещение по Келлеру. рассматриваем лишь точки, близкие друг другу. Подставляя B5) и B6) в фор- мулу Гопкинса A0.4.356), получим B7) 7_ГIтЛ7Т_|л|Лгехр{г-йЛ/о(^-^) + '7(П-^K}^, I^^ AldS. Так как каждой точке S(?, r\) источника соответствует пара лучевых ком- понент (р, q), мы можем от интегрирования по а перейти к интегрированию по телесному углу P1 + q'i^n'c"sin2d'c, B8) образуемому лучами, падающими на предмет. В приближении параксиальной оптики соотношения ?=|(р, q) и "<\~r\(p, q) линейны. В самом деле, как легко показать из формул D.3.10), ?,—fp, т\ =fq, где f — фокусное расстояние кон- денсорной системы. Следовательно, якобиан 5A, г\)/д(р, q) равен постоянной величине. Вне рамок геометрической оптики якобиан в общем случае изме- няется по области интегрирования, однако этим изменением можно пренебречь, поскольку оно достаточно мало но сравнению с изменением экспоненциального члена. Если пренебречь также медленным изменением AL и Л2, то B7) примет вид , [р (Xt — XJ + q (Y1 — Yt}]\ dp dq B9) ^ J exp {t где Q означает область B8). Вычисляя B9), получим "is «и = т1 У(Хг -Х2у + (Y, - Y,Y п'е sin %. C0)
484 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 Эта формула идентична формуле A8) в случае критического освещения. Сле- довательно, комплексная степень когерентности света, падающего на плоскость предмета микроскопа, одинакова как при критическом освещении, так и при освещении пи Кёлеру. Этот результат показывает, что часто употребляемые на- звания «некогерентное» для критического освещения и «когерентное» для освещения по Кёлеру нужно считать неудачными. Как мы видим, формула B0) справедлива для обоих типов освещения, а рис. 10.13 одинаково применим к обоим случаям. 10.5.3. Получение изображения при частично когерентном квазимонохрома- тическом освещении*), а. Распространение взаимной интенсивности через оптическую систему. В § 9.5 было описано несколько общих методов изучения отображения протяженных объектов. Рассматривались случаи полностью ко- герентного (п. 9.5.1) и полностью некогерентного (п. 9.5.2) освещения. В первом случае рассматривалось распространение через систему комплексной ампли- туды, во втором — интенсивности. Сейчас мы исследуем более общий случай частично когерентного квазимонохроматпческого освещения. Изучаемой ве- личиной здесь является взаимная интенсивность. Как и в (9.5.1), используем нормализованные координаты Зайделя, так что точка предмета и се параксиальное изображение имеют одинаковые чис- ленные значения координат. Пусть Ja (х„, у0; х„, у'„) — взаимная интенсивность для точек (х„, у„), (х'е, у'^ в плоскости предмета. Если К(х0, у0; хи yj — функ- ция пропускания системы (см. п. 9.5.1), то взаимная интенсивность в плоскости изображения, согласно закону распространения A0.4.47), определяется вы- ражением C1а) Интегрирование лишь формально производится по бесконечной области, так как для всех точек в плоскости предмета, от которых свет не попадает в плос- кость изображений, величина Уо равна нулю. Как и в § 9.5, мы предположим, что предмет так мал, что служит изопла- натической областью системы, т. е. что для всех его точек величину К(х0, уи; х±, J/J с хорошей точностью можно заменить функцией, зависящей лишь от разностей хх—х„ и уг—у0 (скажем, К(хг—-х0, у^.—у„)). Уравнение C1а) тогда примет вид #i(xi> Уг, x'i. г/ЩН ¦xK*(x'i—x'a>yi—y»)dxadyadxldyl. (ЗТб) Представим /,„ Jl и произведение КК* в форме четырехмерных интегра- лов Фурье, а именно J'o (-*¦<>• Уо'< xt>< Уо> — Л/> Я'Г' q!t) 6XPl~2ni^ + Syo + f'x;+g'y'o)]d[dgdrdg', C2a) JAxlt уi, х?, yi) = i(?> S; /'. g') exp [-2nt(fxi+gyi+fX +g'yi)] dfdgdf'dg', C26) *) Содержание настоящего раздела частично основано на исследованиях Гашшнса [12] и Дюмонте [70],
§ 10.5] некоторые придамкмия ' 1485 К(х, у)К*(х', у')=, = llll Л(/' g; Г• 8>) ехр Г*"'^+ 89 + f *'+*V)] df «*<Г<%'. C2В) Тогда на основании обратного преобразования Фурье находим C3) Совершенно аналогичные соотношения можно написать для ^ и а&. Применяя теорему свертывания к C16), получим соотношение Ъ(/, g; Г, g') = t» (/. e; Г, g')oMif, g\ Г, g1). C4) Отсюда следует, что если взаимную интенсивность в плоскостях предмета и изображения представить суперпозицией четырехмерных пространственных гармоник всевозможных пространственных частот (/, g, /', g'), то каждая такая компонента взаимной интенсивности в изображении будет зависеть лишь от ее соответствующей компоненты в предмете, а их отношение окажется равным.. аЛ. Таким образом, в пределах применимости настоящего приближения влияние оптической системы на взаимную интенсивность эквивалентно действию четы- рехмерного линейного фильтра. Функция <М называется функцией частотного отклика для частично когерентного квазимонохроматического освещения. Функция частотного отклика связана с функцией зрачка системы простым еоотношением. Если, как и в (9.5. Юв), мы представим К в виде двумерного интеграла Фурье К (х, у) = J J X (f, g) ехр [-2ж- (fx + gy)\ df dg, ЭД и подставим его в соотношение, обратное преобразованию C2в), то найдем, что «* (Л Я; Г, g') - Ж IS, g) Ж* (-Г. -?')- C6) Согласно (9.5.13) величина X(f, g) равна значению функции зрачка Gil,, Щ системы в точке l = %Rf, 11==Х^ C7) на опорной сфере Гаусса (радиуса R). Следовательно, для частично когерент- ного квазимонохроматического освещения функция частотного отклика связана с функцией зрачка системы формулой (-г, -ч'). (зз) Так как для точек, находящихся вне выходного зрачка, функция зрачка равна нулю, то система не пропустит спектральные компоненты, соответствую- щие частотам, превышающим определенные значения. Если выходной зрачок имеет форму круга радиуса а, то величина G(g, tj)G* (—?', —г\') равна нулю при !3 + т]г>«3 или |'3 + т]'2>о2. Следовательно» не будут пропускаться спектральные компоненты взаимной интенсивности, соответствующие часто- там (/, g, f, g'), для которых *) teI или г+ё'2 Здесь % — средняя длина волны в пространстве изображения. **) Если угловая апертура системы мала и выполняется условие синусов, то, как и в § 9.5, afkRx(n0 sin в„)/(МХ„), где п„ sin 9„ — числовая апертура системы, М — гауссово уве- личение н Х# — средняя длина волны в вакууме.
486 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 В табл. 10.1 приведены основные формулы, относящиеся к отображению при частично когерентном освещении, а также соответствующие формулы из §9.5 для когерентного и некогерентного освещений. Выражения, относящиеся к некогерентному освещению, можно получить из общих формул C4), C6) и C8), предполагая, что Jo имеет вид Ja (х0, у0; х'о, у'„) ~1 (х0, у„) б (х'о— х„) 6 {у'„—</„), где 6 — дельта-функция Дирака (см. приложение 4). Мы не будем при- водить здесь этот вывод, поскольку он, хотя и достаточно прост, но довольно громоздок. Таблица 10.1 Отклик оптической системы на пространственные частоты. (Предполагается, что предмет служит изопланатической областью системы.) Освещение Когерентное Некогерентное Частично когерент- ное Основная величина Комплексное возмуще- ние U (х, у) Интенсивность / (х, у) Взаимная интенсив- ность J (х, у; х', у') Переход от предмета к изображению -«о (/, g) X if. S) 3iQ,g) = = 3,(f, g)#(f, g) fx(!. g; f, g') = = fM, g; /', g')x XeStf, g; /', g) Функция частотного отклика x a. g) = ]]^,(f'+f,g'+s)x ~XX*(f',g')df'dg' cM(h g; f, g')= = Sf(f,«)X xxu-f'.-g1) "% (/. g)—обратное преобразование Фурье от функции пропускания К (х, у) системы, связанное с функцией зрачка О Q, г)) формулой Ж (?/XJ?, »)A#) = GA, i)), где k. — радиус опорной сферы Гаусса и ?.¦—средняя длина волны в пространстве изображения. Формулы для специального случая идеально монохроматического (и, следовательно, полностью когерентного) освещения можно вывести не- сколько проще, так как в этом случае имеем для взаимной интенсивности J«(xo, Уа\ х'о, у'„) = V'(х„, г/о) U% (х'„, у'о). Величина f-0, являющаяся Фурье-об- t разом Ja, также приобретает вид произведения двух множителей. Применяя далее выражения C4) и C6), легко показать, что каждая спектральная компо- нента комплексного возмущения ?/<> распространяется через систему в соответ- ствии с формулами, приведенными в первом ряду табл. 10.1. б. Изображения объектов, освещаемых проходящим светом. Предполо- жим, что часть плоскости предмета занята прозрачным или полупрозрачным объектом, который освещается частично когерентным квазимонохроматическим светом. Будем считать, что этот свет испускается первичным источником и достигает плоскости предмета, проходя через некоторую осветительную систему (конденсор). Как и в п. 8.6.1, введем для объекта соответствующую функцию пропус- кания Foixs, г/о)- Если через U^(S; x0, у0) обозначить возмущение в точке (%„, г/„) плоскости предмета, обусловленное возмущением в точке S ассоцииро- ванного монохроматического источника (см. стр. 471), то после прохождения через предмет возмущение, создаваемое этой точкой источника, определяется
§ 10.5] НЕКОТОРЫЕ ПРИЛОЖЕНИЯ 487 соотношением Uo (S; х„, у0) = U7(S; х„, у„) F (х„, уа). D0) Взаимная интенсивность света, падающего на предмет, согласно A0.4.35а), запишется в виде J7(x0, у0; К, yl)-=[Uv(S; x0, y,)U^(S; x?, yi)dS, D1а) о а взаимная интенсивность света, выходящего из предмета, в виде •/„(*„. У,: <> У'о)=^ ^оE; х„ yo)U'(S; х-„ y'0)dS; D16) о следовательно, в соответствии с D0) имеем Л to» Уъ, х'о, У«) = F (*„, у„) F* (х'в,'y'0)Jv too. Уо\ х'„, у'„). D2) Мы ограничимся важным случаем зависимости взаимной интенсивности J^ падающего свеаа лишь от разностей х0—х'о, у0—у'„ координат хс, у0, х'„, у'о, т. е. случаем, когда J^ имеет вид Jo(x0, у0; х'„, yi)^Ju(Xo—x'o, Уо—У'о)- D3) В п. 10.5.2 было показано, что это справедливо как для критического освеще- ния, так и для освещения по Колеру. По-прежнему будем считать предмет на- столько малым, что он служит изопланатической областью системы. Тогда из C16) следует, что интенсивность /i(xx, y±) ~Ji(xu уг; хи ух) в плоскости изо- бражения определяется выражением xK(xt—x0, y1~yo)K*(x1—x'o, y1—yi)dxodyodx^dy'o. D4} Представим F и J^ в форме двумерных интегралов Фурье i ]] /; g) exp [—2я» (fx + gy)} df dg, D5a) to. У) = \\ f о (/. g) exp \—2ni (fx+gy)} df dg. D56) Если мы подставим F и F* из D5а) в D4), используем тождество f'x0—f"x'Q — = (f—f")xx—f'(Xi—xo)-hf"(Xi — x'o), аиалогич:ное тождество для g и у и введем новые переменные интегрирования и'=х1 — х0, и" — хг — х'о, то полу- чим следующее выражение для Д: . §'; Г, g")^(f', g')^*(f", g")x xexp {~2я^ [(/'-f")x1 + {g'-g')yl\}dfdg'df"dg", D6) где f', g'; f". *") = X exp {2ni [(/'«' + g'&) — (f"u" + g"v")] }Au' dv' du"do" = n (f. 8) К («'. »') К* (""- О х xexp {2я/ [(/ + /') «' + te+e')»'-(/' + Г) «"-(g-' +e*)^]f X ^|J '. D7)
4S8 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [>Л. 10 При переходе от четырехкратного интеграла к шестикратному мы подставили для JV выражение из D56), а при переходе от шестикратного к двукратному использовали преобразование, обратное C5). Как мы видим, в D6) влияние предмета (характеризуемого функцией аГ) и комбинированное влияние освещения (^;г) и оптической системы (Ж) раз- делены. При равномерном освещении (/j" = const) интенсивность света, вы- ходящего из объекта, пропорциональна (Т71- и в случае совершенного отобра- жения интенсивность в плоскости изображения выражается (с точностью до постоянного множителя) формулой хexp {-2m [(/'-f) x, + fe'-g")y,}}df dg'df"dg". D8) В соотношениях D6) и D8) истинная интенсивность /i и идеальная интенсив- ность /j выражены в виде суммы вкладов, вносимых всеми парами частот (/'. g'), if", S") пространственного спектра объекта. В первом случае каждый вклад в оГ раз больше, чем во втором. Отсюда следует, что если #" не постоян- но для всех значений /', g', /", g", для которых обе спектральные компоненты 3~(f> ?') и 5"(/", g") отличны от нуля, то некоторая информация об объекте бу- дет теряться или искажаться. Функция#" называется взаимным коэффициен- том пропускания системы, работающей при данном освещении проходящим светом. Рассмотрим теперь вместо самой интенсивности ее пространственный спектр 3 (/, g). Для получения соответствующего выражения умножим обе части D6) на ехр [2ш"(/хг + glli) 1 и проинтегрируем по х1 и уи Используя ин- тегральную теорему Фурье (или, короче, представление дельта-функции Ди- рака в виде интеграла Фурье (см. приложение 4)), найдем 3Af,g) =]l<$~ (f + f, ё' +8, /'. Л? (Г +f. ё' +g)?*{f', g')df dg'. D9) Для идеального случая, которому соответствует выражение D8), получим \(f, 0 = 11 & if' + f, 8' + S) Г® (Г, g')df dg'. E0) — со В этих формулах 3t и Э^ выражены в виде сумм вкладов от каждой пространст- венной гармоники (/', g') структуры объекта. Как мы видим, оГ играет ту же роль, что и прежде. Эта величина характеризует изменения, возникающие в каждом вкладе и связанные со способом освещения объекта и характеристи- ками пропускания системы, формирующей изображение. Так как функция отклика X(f, g) равна пулю, когда точка | =\Rf, ц = = XRg лежит вне выходного зрачка, то из D7) следует, что для достаточно вы- соких частот JT обращается в нуль. Если выходным зрачком служит круг ра- диуса а, то произведение X(f+f, g + g') X* (/-f/', g + ff') и, следовательно, величина аГ(/', g'\ f",g") могут отличаться от нуля только при условии, что в плоскости /, g отлична от нуля область наложения кругов С и С" с центрами в точках О'(—р, —g'}, О" (—/", —g") и одинаковыми радиусами Vf^+g* — — a/XR (рис, 10,15). Чтобы проиллюстрировать влияние освещения, предпо- ложим, что применяется критическое освещение или освещение по Кёлеру и что числовая апертура n'csin (Yc конденсорной системы в т раз превышает чис- ловую апертуру rtosineo системы, отображающей объект. Тогда, согласно A8)> или C0), взаимная интенсивность освещающего пучка равна Jo (*о -х;, у0-yi) = рУ^ ) /Г, E1)
§ 10.6] НЕКОТОРЫЕ ТЕОРЕМЫ, КАСАЮЩИЕСЯ ВЗАИМНОЙ КОГЕРЕНТНОСТИ 489 где E2) a I7— интенсивность падающего света (она считается постоянной). В правой части выражения E1) стоит (см. п. 8.5.2) фурье-образ функции . . m-'nl sin2 90 / У2 \ = const = (——;"¦, 11-, когда /2 -f = 0, когда P+g2>- 1,? 3nn sin3 в„ E3) На рис. 10.15 крут, вне которого ^ обращается в нуль, обозначен через С Ясно, что для данных (/', g') и (/", g") вклад в интеграл D7) для $~ вносят лишь те точки плоскости /, g, кото- рые лежат внутри области перекрытия кругов С, С и С" (на рис. 10.15 она за- штрихована). § 10.6. Некоторые теоремы, касающиеся взаимной когерентности В §§ 10.4 и 10.5 мы рассматривали интер- ференцию и дифракцию квазимонохроматиче- ского света и ограничивались случаем време- ни задержки т., малом по сравнению с време- нем когерентности света. Мы показали, что при этом с хорошей точностью зависимость корреляционных функций от -с представлена только гармоническим членом, т. е. что Г (Р^ Р8, т) « / (Plt Р,) exp (—2nhn), Y(Pj, Pa)»^^!, Pa)exp(—2nivi). Элементарная теория, использующая это при- ближение, позволяет учесть уменьшение вид- ности в «центре» картины (т = 0), обуслов- ленное конечными размерами источника све- та. Однако она не принимает во внимание из- менения видности с увеличением разности хода. Для правильного описания явлений в случае, когда временем задержки т нельзя пренебречь по сравнению с временем коге- рентности, необходимо использовать более точные выражения для корреляционных функций. Ниже мы рассмотрим соответствующее обобщение некоторых формул. 10.6.1. Расчет взаимной когерентности для света от некогерентного источника. Пусть Vt (t) и F2 (t)— возмущения в точках Рх и Р2 волнового поля, созданного протяженным (не обязательно квазимонохроматическим) первич- ным источником а. Вначале будем считать, что среда между а и точками Р\ и Рг однородна. Как и в п. 10.4.2, предположим, что источник разделен на элементы dau do-i, ..., линейные размеры которых малы по сравнению с эффективными дли- нами воли, а центры находятся близ точек Su S2, ... Если V,,a(t) и Vmt(f) —• вклады в Vi и Vi,, вносимые элементом dam, то M0-2v.i@. МО=2^@, ш С Рис. 10.15 Эффективная область интегрирования (заштрихована) для взаимного коэффициента пропуска- ния <0~(l',g'; f",g") отображающей системы с круглым выходным зрач- ком радиуса а. Предполагается, что объект освещается проходящим к в аз к монохроматическим светом со средней длшюп волны }.о че- рез конденсор с числовой еше;пурой адп sin 0„, где па sin Bt,—числовая апер- тура отображающей системы, С и С"— i;p>гп радиуса a'}.R ~ я0 sm 00/ЛГАв с центрами п точках O'( — f, —g'\ и О" (— I", —й") спотпетстненно, С — крур радиуса тпц sm 0и/А.и с центром к нача- ле координат, Ц—раднус опорной сферы Гаусса, М — гауссово увеличение.
490 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 и взаимная функция когерентности определяется выражением Г (Рх, Р„ х) = <у% (t + т) VI (<)> = 2 <Уmi (t + т) V-m, (t)>, B) m В правой части B) мы пренебрегли членами типа <Fmi(? + x) У„г так как можно полагать, что вклады, вносимые различными элементами источника, взаимно иекогерентны. Мы поступим далее несколько иначе, чем в § 10.4. Согласно A0.3.30) каж- дый член под знаком суммы в B) можно представить в виде <Vml(t+i)V"ms(t)> = <l]Ga(P1, Pt, v)exp(-2juvT)dv, C) о где ¦—взаимная спектральная плотность возмущений Vml — Vm(Pi, t), Vm2 — = Vm(Ps. 0- Здесь l/m — вклад соответствующей частоты в возмущение, созда- ваемое элементом dom. Этот вклад распространяется в виде сферической вол- ны, поскольку предполагается, что среда однородна. Следовательно, vmT (Pi' v) = атТ (v) -i^—^ , ml /^л где Rml и i?m2 —расстояния между точкой 5т источника и точками Pi и Р2 (предполагается, что эти расстояния велики по сравнению с эффективными длинами волн), а А = 2я\7г> = 2яЛ. Амплитуда |am(v)| величины am(v) опре- деляет «силу» компоненты с частотой v от элемента dom, а argam(v)— се фазу. Из D) и E) следует, что Om (Plt Р„ v) = { Ш Щ!^\ ^Ё^] ¦ F) Величина, стоящая в фигурных скобках в правой части, является спектраль- ной плотностью света, идущего от элемента dam источника. Предположим, как и в п. 10.4.2, что число элементов источника настолько велико, что его можно считать непрерывным. Следовательно, если I(Sm, v)damd\ = 4 lim [|amr(v)j2/2T], т. е. если I(S, v)— интенсивность на единицу площади источника в еди- нице частотного интервала, то, согласно B), C) и F), имеем p.. *)= О а где 0)== f (8) ft I / С ..\ dv — интенсивности в точках Р, и Р2, а Ri и й, — расстояния от этих точек до точки S источника Уравнения G) служат обобщенной формой формул Ван- Циттерта — Цернике A0.4,20) и A0,4.21),
§ 10.6] НЕКОТОРЫЕ tEOPEMbl, КЛСЛЮЩИЕСЯ ВЗАИМНЦЙ КОГЕРЕНТНОСТИ 491 Если среда между источником и точками Pi и Р2 неоднородна, мы можем поступить так же, как в § 10.4, а именно заменить множители (expikR,)!Rj на icK(S, Pj, v)/v, где К — соответствующая функция пропускания среды. Тогда вместо G) мы получим р„ т)=КЛл)К7(рЛ ?(Л. р., т)= = с* J^ехр (— 2гоЧт) \ 1 (S, v) К E, Р±, v) К* (S, Р2, v) dS, (9) 0 а где f|$ , Pt, v)|»dS, По аналогии с преобразованиями, используемыми в § 10.4, перепишем (9) или A0) в несколько иной форме. Пусть Тогда (9) и A0) примут вид Р„ г) = VI (Р,) К / (Р.) V (Р„ Р,. т) = = J d\ ехр (— 2juvt) J I/ (S, Р„ v) f/s (S, P2, v/dS, A2) 0 а где х, v)|'dS, ДР2)= Jdv J | ?/(S, Р„ v)|»dS. A3) 0 В формуле A2), которая является обобщением формулы Гопкннса A0.4.35), взаимная функция когерентности и комплексная степень когерентности выра- жены через распределение света, создаваемое ассоциированным воображаемым источником. В самом деле, согласно A1) величину U(S, P, v) можно рассмат- ривать как возмущение в точке Р, обусловленное находящимся в точке 5 моно- хроматическим точечным источником с частотой v, нулевой фазой и «силой», пропорциональной У I E, v). 10.6.2. Распространение взаимной когерентности. Как и в п. 10.4.4, вообразим, что поверхность Л пересекает пучок света от протяженного первич- ного источника ет (см. рис. 10.8). Мы покажем, как, зная взаимную когерент- ность для всех пар точек на поверхности ,./, можно определить ее значение на любой другой поверхности S3, освещаемой светом от „I. Для простоты предпо- ложим, что между Л и 33 находится среда с показателем преломления, равным единице. Взаимную когерентность для любой пары точек Q{ к Q2 на S можно рас- считать с помощью A2). В этой формуле U представляет собой монохромати- ческое возмущение, и следовательно, его можно определить на основе принципа Гюйгеиса — Френеля при условии, что известны возмущения во всех точках поверхности Л; имеем l/(S,Qx, v) = Jl/(S,P1IvM^sb)A1dP1. A4)
492 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА |ГЛ. 10 Здесь si означает расстояние между произвольной точкой Рг на А и точкой Qu а Лх —- обычный коэффициент наклона. Совершенно аналогичное соотношение справедливо и для U(S, Q3> ¦")• Подставляя эти формулы в A2) и изменяя по- рядок интегрирования, получим для взаимной когерентности следующее вы- ражение: АЛ ° где °i. Л. ¦»> = J C/ (S, Яд, т) ?/• (S, P2, y) dS. A6) Двойное интегрирование в A5) означает, что точки Рх и Р2 пробегают поверх- ность А независимо. Здесь коэффициенты наклона Ax(v) и A.j(v) зависят от частоты и медленно изменяются с v по сравнению с изменением остальных членов. Если ширина эффективного спектрального интервала света достаточно мала, эти коэффициенты можно заменить на Ai—Ai(v), A2=A2(v), где v—•. средняя частота света. Согласно A2) интеграл по v равен Г(Р1з Рг, т—(st—s2)/c). Таким образом, окончательно получим ^d^s- (.17) A A Это и есть искомая формула, в которой взаимная функция когерентности точек Qi и Qa поверхности 3d выражена через взаимную интенсивность всех пар точек поверхности А. Особый интерес представляет случай совпадения точек Qt и Q2 и т = 0 (общую точку обозначим через Q). Тогда левая часть соотношения A7) превра- щается в интенсивность I(Q). Если, кроме того, мы подставим в правую часть функцию Г, выраженную через интенсивности и коэффициент корреляции у, то формула A7) примет вид В этом соотношении интенсивность в произвольной точке Q выражена в виде суммы вкладов, вносимых всеми парами элементов произвольной поверхности А Каждый вклад пропорционален среднему геометрическому из интенсивпос- тей н двух элементах, обратно пропорционален произведению расстояний этих элементов до Q и входит с весом, равным соответствующему значению коэф- фициента корреляции у- Соотношения A7) и A8), предложенные Вольфом, обобщают закон рас- пространения, найденный Церпике A0 4.45), и формулу A0.4.46) для .интен- сивности в частично когерентном волновом поле. § 10.7. Строгая теория частичной когерентности *) 10.7.1. Волновые уравнения для взаимной когерентности. Некоторые тео- ремы, выведенные выше и относящиеся к корреляционным функциям, во мно- гих чертах подобны теоремам, относящимся к самому комплексному возмуще- нию. Например, формула Ван-Циттерта —• Цернике A0.4.21) для комплексной *) Материал, изложенный б этом параграфе, в основном базируется иа исследованиях Вольфа [15, 71].
§ 10,7] СТРОГАЯ ТЕОРИЯ ЧАСТИЧНОЙ КОГЕРЕНТНОСТИ 493 степени когерентности в плоскости, освещаемой протяженным квазимонохро- матическим первичным источником, оказывается идентичной формуле для комплексного возмущения в дифракционной картине, возникающей при диф- ракции на отверстии, размеры и форма которого совпадают с размерами и фор- мой источника. Другим примером служат законы распространения взаимной интенсивности (см. A0 4.45)); как мы видим, они похожи па принцип Гюйген- са — Френеля. Теоремы, относящиеся к комплексному возмущению, можно рассматривать как приближенные положения, вытекающие из некоторых строгих теорем, а именно формул Гельмгольца и Кирхгофа (см. (8.3.7), (8.3.13)). Последние вытекают из положения, согласно которому световое возмущение распространяется, как волна. Указанная аналогия наводит на мысль, что корреляция также распространяется, как волна и что наши теоремы являются приближенными формулировками каких-то соответствующих теорем типа Гельмгольца — Кирхгофа. Нетрудно показать, что это действительно так. Рассмотрим стационарное волновое поле в вакууме. Пусть V(PU t) и V(Pt, t) — возмущения в точках Р± и Р2 соответственно Удобно вначале вы- разить взаимную функцию когерентности в более симметричной форме Г(РХ, Р9, tu Q . =, Km gL \vT(Pl,t + t1)VT(P2,t + t.i)dt. A) — CO Далее пусть dxi dyi dz{ — лапласиан по декартовым координатам точки Рь Действуя этим оператором jia соотношение A) и изменяя порядок различных операций, получим t» *2)= Вещественная часть V*p величины VT представляет истинное физическое вол- новое поле (например, декартову компоненту электрическом векторной волны) и, следовательно, удовлетворяет волновому уравнению = -Lg V<p (Plt t + tj. Da) Мнимая часть Vt* величины VT, а значит и VT также удовлетворяет волновому уравнению; последний результат получается сразу же, если применить преоб- разование Гильберта к обеим частям Dа) и использовать следующее утвержде- ние: если каждая из двух функций получается одна из другой преобразованием Гильберта, то та же зависимость справедлива и для их производных. Следова- тельно *), VJMPi, <-M.)=4rJ|Fr(P1, t + tj. D6) Отсюда следует, что в правой части C) VI можно заменить на дг1сШ\. Вновь *) Здесь мож«о привести и другое доказательство. Так как V(p удовлетворяет волно- вому уравнению, то каждая из его спектральных компонент vT(v)(—w=sv=Soo) удовлетво- ряет уравнению Гельмгольца. Но соглагно уравнению A0.2.186) спектр Kr=Vr</1 +iV%} равен 2vT(v) при v> 0 и нулю при v < 0. Следовательно, каждая спектральная компонента функции VT также будет удовлетворять уравнению Гельмгольца, а значит и сама функция VT удов- летворяет волновому уравнению,
494 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 изменяя порядок операций, получим СО VlT(Plt pt, tlt у = -1^. Hn^gL j Vt(Pv t + WriP,, t + Qdt, т. e. r2, ilt i%)^ з Совершенно аналогичным образом находим где V|— лапласиан по координатам точки Ps. Для стационарного поля Г зависит от tl и t.. лишь через разность ti—1% =т. Поэтому, как и раньше, можно записать Г (Pi, Рг, tlt t.) —T(PU Яа, т). В этом случае d"-ldl\ ~ д*1д1\=дг1с1л1, и вместо E) мы получим Pt,<) = ±*W%M, Fa) Таким образом, в вакууме взаимная функция когерентности удовлетворяет двум волновым уравнениям *). Каждое из них описывает изменение взаимной когерентности, когда одна из точек (Яг или Р,) фиксирована, а другая точка и параметр т меняются. Величина т представляет собой разность времен между моментами, в которые рассматривается корреляция в этих двух точках. Во всех экспериментах т входит только в комбинации сх = A?f, т. е. как разность хода. Таким образом, само время исключено из окончательного описании поля. Эта особенность теории частичной когерентности весьма привлекательна, так как в оптических волновых полях истинные временные изменения совершенно невозможно обнаружить. Основную величину в предложенной теории, взаим- ную функцию когерентности Г (Pi, P2, т), можно непосредственно измерить, например, с помощью интерференционных экспериментов, описанных в §§ 10.3 и 10.4. 10.7.2. Строгая формулировка закона распространения взаимной когерент- ности. Обратимся вновь к стационарному волновому полю в вакууме. Пусть Qi и Q2 — любые две точки поля и Л — любая воображаемая поверхность, окружающая эти точки. Если V?— лапласиан по координатам точки Qlt то, согласно Eа), мы получим it Vat 'it li) —~& TTi • V) Отсюда следует, что мы вправе использовать для Г интегральную формулу Кирхгофа (8.3.13). Таким образом, функцию V(Ql, Q2, tu t2) можно выразить через значения [Г(РЬ Q., tL, 4)Ii, где Рх принимает все положения на поверх- ности Л, а квадратные скобки с индексом 1 (I... ]0 означают запаздывание от- носительно ti, т. е. [Г (Plt Q,, ti, Ql = Г (Ра> Q2> ti -i, *,) , (8) *) Когда т мало по сравнению с временем когерентности, то, согласно A0. 4.10), Г (Pi, Рг, т) я* J (Pj, Pe)exp(—2nivx). Из F) следует, что в рамках теории, оперирующей с квазимонохроматическими пучками, взаимная интенсивность Jxi в вакууме с хорошей точ- ностью подчиняется уравнениям Гельмгольца (PXt Pa)=0, vlV (Pi, P*)+&J (Pi, Pa) = 0.
§ Ю.7] СТРОГАЯ ТЕОРИЯ ЧАСТИЧНОЙ КОГЕРЕНТНОСТИ 495 Здесь %— расстояние между Pt и Qx (рис. 10.16). Выписывая формулу Кирх- гофа в явном виде, получим ..<..у=-5Г5</лг(р1,е„/х.«].+ Рх- О) Здесь д/drii означает дифференцирование вдоль внутренней нормали к А в точ- ке Pi И , д {_}_\ _ 1 3s, , 1^ Согласно E6) мы получим также 1, Va. *i. 'a) — -g где Va— лапласиан по координатам ТОЧКИ Q2- Рис. 10.16. Обозначения, исполь- Следовательно, величину Г(РЬ (?«, ^, ^), ко- торая появляется в правой части (9), можно выразить в форме интеграла Кирхгофа, содер- жащего значения [Г^,, Я2, tlt 1гI2, где Р2 при- нимает все возможные положения на поверхности Л, а скобки с индексом 2 ([... ]2) означают запаздывание относительно tit т. е. зуемые при строгой формулировке закона распространения взаимной КОРРПРНТНОРТИ [г (л, р„ tlf О].= A2) Здесь s2 — расстояние между Р2 и Q2. Соответствующая формула в явном виде запишется следующим образом: Г (Л, (?„ /„ «=^ a, tu Здесь д/дп2 означает дифференцирование вдоль внутренней нормали в точке Р-2> а /2, g, Л2 — те же величины, что и в A0), но с индексом 2. Продифферен- цировав A3) по tx и Hi, получим (Plt *,, /J = ^ j{/, [| Г (Л, P., tu /, ^ г (р,, ра> /,, q ]а+л2 [^ , л, /х. A4) + 8» Подставляя A3), A4) и A5) в (9), найдем следующее выражение для A6,
496 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 Первыми двумя аргументами функции Г, стоящей в правой части A6), яв- ляются Рх и Р2, а скобки L.Ji,2 означают запаздывание относительно обеих переменных t, например, Наконец, используем предположение о стационарности, которое означает, что Г зависит лишь от разности временных аргументов. Запишем, как и рань- ше, Г(РЬ Р2, U, h)=T(P1,P2, г), % = U — U_. Тогда dldil=—didti=dldx, и выражение A6) примет вид*) АЛ Первыми двумя аргументами функции Г, стоящей в правой части A8), яв- ляются PL и Р2, а скобки I...] означают «запаздывание» на величину (si—s2)ic, например, '- Формулу A8) можно считать строгой формулировкой закона распространения взаимной когерентности A0.6.17). Она выражает значение взаимной функции когерентности для любых двух точек Qi и Q2 через значения этой функции и некоторых ее производных для всех пар точек на произвольной замкнутой поверхности, окружающей обе эти точки. В специальном случае совпадения точек Qx и Q2 и т = 0 мы получим из A8),, подставляя Г]2 (т) = l^7i V I2 7i2(T) > следующее выражение для интенсивности: Здесь /, и /а — интенсивности в точках /^ и Яа соответственно, \у] = = Y(Pi,P2, fe — $i)/c) и т. д. Формулу B0) можно считать строгой формулировкой теоремы, выражаемой уравнением A0.6.18). Она определяет интенсивность в про- извольной точке Q через распределение интенсивности и комплексную степень когерентности (и некоторых производных от этих величин) на произвольной поверхности, окружающей Q. 10.7.3. Время когерентности и эффективная ширина спектра. Понятие времени когерентности, которое оказалось полезным при рассмотрении многих проблем, относящихся к полихроматическому свету, было введено в п. 7.5.8 при изучении возмущения, возникающего вследствие суперпозиции идентич- ных волновых цугов конечной длины. На простом примере (случайная после- довательность периодических волновых цугов) мы показали, что время ко- *) Уравнение A8) применимо к случаю распространения от замкнутой поверхности Л произвольной формы. Для распространения от плоской поверхности формулы значительно упрощаются [72].
§ 10.7] СТРОГАЯ ТЕОРИЯ ЧАСТИЧНОЙ КОГЕРЕНТНОСТИ 497 герентности *) Дт и эффективная ширина спектра Av = cAX/№ получающегося возмущения связаны по порядку величины соотношением AtAv«1. B1) Мы упоминали также, что подобное соотношение выполняется и при более общих условиях, если под Дт и Д\- понимать соответствующие средние величи- ны. В настоящем разделе мы определим эти величины и строго установим иско- мое соотношение взаимности. Предположим, что пучок света в точке Р делится на два пучка, которые сводятся вновь после того, как между ними возникла разность хода ст. Полу- чающиеся интерференционные эффекты характеризуются функцией автоко- герентности Г (г) = <У (t + тЛ V* @> = 4 J G (v) exp (—2juvt) dv, B2) о где V(t) — комплексное возмущение в точке Р, a G(v) — спектральная плот- ность. " > Так как степень когерентности двух интерферирующих пучков выражается в виде |7(т) I -— |Г(т) |/Г@), разумно (и с математической точки зрения удобно) определить время когерентности Дт света в точке Р как нормированную сред- неквадратичную «ширину» **) функции |Г(т) |2, т. е.***) \ т*|Г(т)|*<*г (Дт)'-Ч; -• B3) \ \Т(х)\Чх Определим далее эффективную ширину спектра Av света в точке Р как нор- мированную среднеквадратичную ширину спектра Г, т. е. как нормированную среднеквадратичную «ширину» квадрата спектральной плотности G(v) в об- ласти v^O. Таким образом, ^ (V — v)a GaCv)dv CvC3(v)dv (Av)»=2-^ , v='- , B4) о о Чтобы установить требуемое соотношение взаимности, положим | = v—v, _ (a) <D(|) = 4G(v + 5), когда 1 >—v, \ ,,. . .„,. ФF) = 0, когда ?<-v, ( (б) > B5) (в) *) В соответствии с обозиачениямн, принятыми в настоящей главе, вместо At мы здесь пишем Ат. **) Здесь и ниже авторы определяют нормированную среднеквадратичную «ширину» функции через дисперсию аргумента при функции распределения, совпадающей с нормирован- ным квадратом данной функции. (Прим. ред.) + 03 + да ***) Среднее значение т= J х | Г (х) |2 dxj \j |r(t)|2dx равно нулю, так как |Г(т)|—. -со '- оо четная функция т. Другое определение времени когерентности дано в работах [731.
498 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [РЛ. 10 Предположим, что функция ФE) непрерывна всюду (—оо<?<;со); следовательно *), Ф (—v) — G@) = 0 Из B2) вытекает, что W и Ф служат фурье- образами друг друга, т. е. ос ж J Ф(Ю- $ Т(т)ехр Bл;|т)Л. B6> B7) B8) ?(т) = J ф (у ехр (— 2 -ОС Выражения для Дт и Av принимают вид со (Дт)» = -1- J тЧ?( где B9> Выразим далее интеграл B8) через функцию х?. Используя второе из со- отношений B6), получим N J \ 2ki J д%* IIP дъ -^ J C0) При переходе от второго выражения к третьему использовано первое из со- отношений B6), а также соотношение 1F(—т) =гР*(т). Последнее выражение получается из предыдущего при интегрировании по частям, если учесть, что \Р^"-0 при т.—>-droo; это справедливо, так как, по предположению, интеграл I | Ч*" (т) |а cfx в B9) сходится. Из B7), B9) и C0) следует, что (ДтJ 1 :Тбл^ dx | W (%) P di C1) В приложении 8 с помощью простой алгебраической аргументации показано, что член в квадратных скобках в правой части C1) больше или равен единице для любой функции Y, для которой существуют интегралы Таким обра- зом, мы установили следующее неравенство взаимности **) для времени *) Фактически это условие необходимо для сходимости интеграла в числителе B3) Если, как здесь предполагается, око выполняется, то вслш-ша B3) не изменяется при замене Г(т)~ -- (V(t-[- x)V* @) на вещественную корреляционную функцию Г(п (т) = КеГ(т) - =- 2{Vin(t |-t)V<r>(f)> (см. [71, 74]). Более общий случай G@)#0 исследовался в работах [75, 76]. См также [77]. **) Наш вывод аналогичен выводу соотношения неопределенности Гейзенберга, пред- ложенному Вейлем и Паули [78J.
§ 10.7] СТРОГАЯ ТЕОРИЯ ЧАСТИЧНОЙ КОГЕРЕНТНОСТИ 499 когерентности и эффективной ширины спектра: 1 1. C2) Напомним, что согласно A0.4.5) степень когерентности \Уп(т:)\ = = |ГХ1(т) |/Гц@) для двух интерферирующих пучков квазимонохроматиче- ского света с одинаковой интенсивностью равна видности ^(т) полос в точке, соответствующей разности хода ст между этими пучками. Следовательно, B3) можно переписать в виде оо да Г fS^ia (Т) dx \ т2^2 (Т) dx (Дт)« = —„ — = ^ . C3) { fb* (т) Л \ fv* (т) Л -о» О Таким образом, время когерентности Лт для интерферирующих пучков с оди- наковой интенсивностью равно нормированному среднеквадратичному значению «ширины» квадрата функции видности. Данное определение времени когерентности является более удовлетвори- тельным, чем определение, приведенное в п. 7.5.8, поскольку мы здесь не де- лали специальных предположений о природе элементарных полей, вызываю- щих возмущение. В самом деле, мы больше не требуем знания деталей поведе- ния быстро флуктуирующей функции V(t), а наше определение основывается на поддающейся измерению корреляционной функции Г (т.). Если бы мы хоте- ли сохранить описание интерференционных явлений с помощью элементарных волновых цугов, нам нужно было бы рассматривать Дт как длительность сред- него волнового цуга; однако такую интерпретацию следует применять с осто- рожностью. Возвращаясь к соотношению C2), мы видим, что знак равенства получается лишь тогда, когда член в квадратных скобках в правой части C1) равен еди- нице; согласно приложению 8 это возможно только в том случае, если Y(t) — функция Гаусса. Но так как фурье-образ функции Гаусса тоже является функ- цией Гаусса, а эта последняя отлична от нуля при всех значениях ее аргу- мента (—оо<|<оо), то она не удовлетворяет второму условию B56). Таким образом, знак равенства в C2) никогда не достигается. Однако если частота, соответствующая максимуму функции Гаусса, велика по сравнению со средне- квадратичным значением «ширины» этой функции, то вкладом в v и Av, обу- словленным отрицательным частотным интервалом, можно пренебречь, и оче- видно, что для высокочастотного спектра, встречающегося в оптике, величина произведения ЛтЛу не может заметно отличаться от значения, которое соот- ветствует всей кривой Гаусса. Таким образом, знак неравенства в C2) можно заменить знаком порядка величины, т. е. AtAv~1. C4) Приведенное выше определение времени когерентности пригодно, если два интерферирующих пучка получаются из одного делением в точке Р. Однако его легко распространить на случаи, когда два интерферирующих пучка обра- зуются делением в двух точках Рх и Рг, как, например, в интерференционном эксперименте Юнга. При этом вместо функции автокогерентности Г(т) = = Т(Р,Р, т) следует использовать взаимную функцию когерентности Ti2(t)== = Г(ЯЬ Р2, т), а вместо обычной спектральной плотности G(v) — взаимную спектральную плотность Gi2(v). Единственное различие возникает из-за того, •что величина G12(v) комплексна, а Г18(т) — не обязательно четная функция т. 32*
600 HHTF РФРРЕНЦШГ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 и, следовательно, т не обязательно равно нулю. Соответствующие выражения имеют вид C5) |г1; J v | О,, adv —• C6) о I GtJ(v)P dv \j | 0,,(v)P dv о Величину Дт12"можно назвать взаимным временем когерентности, a Avia —¦ взаимной эффективной шириной спектра светового возмущения в точках />, и Р2. Изменяя очевидным образом аргументацию, приводившуюся для вывода C2), легко показать, что эти величины удовлетворяют неравенству взаимности (Дт18) (Avla) > 1/4я. C7) Наконец, обобщая соотношение C3), для квазимонохроматического света получим (з8) Здесь'^¦'la (т) — видность полос, образованных интерферирующими световыми пучками одинаковой интенсивности, идущими от точек /\ и Рг. § 10.8. Поляризация квазимонохроматического света В предыдущих разделах настоящей главы мы рассматривали световое воз- мущение как скалярную величину. Ниже мы кратко рассмотрим некоторые векторные свойства квазимонохроматической световой волны. В § 1.4 мы указывали, что строго монохроматический свет всегда поля- ризован, т. е. что конец электрического (а также магнитного) вектора в каждой точке пространства движется периодически, описывая эллипс, который, ко- нечно, в особых случаях переходит в круг или прямую линию. Мы рассмат- ривали также неполяризованный свет. В этом случае можно считать, что конец вектора движется совершенно нерегулярно, и такие световые колебания не имеют никаких преимущественных направлений в плоскости, перпендикуляр- ной к направлению распространения. Подобно случаям полной когерентности и полной некогерентности, указанные два случая также относятся к экстремаль- ным. В общем случае изменение векторов поля не является ни вполне регуляр- ным, ни вполне нерегулярным, и можно сказать, что свет частично поляри- зован. Обычно такой свет получается из неполяризованного при отражении (см. п. 1.5.3) или рассеянии (см. п. 13.5.2). Здесь мы исследуем основные свойст- ва частично поляризованной световой волны Мы покажем, что для такой волны все наблюдаемые явления зависят от интенсивиостей двух произвольных вза- имно ортогональных компонент электрического вектора, перпендикулярных к направлению распространения, и от существующей между ними корреляции.
§ 10.8] ПОЛЯРИЗАЦИЯ КВАЗИМОНОХРОМАТИЧЕСКОГО СВЕТА 501 10.8.1. Матрица когерентности квазнмонохроматической плоской волны *). Рассмотрим квазимонохроматическую световую волну со средней частотой v, распространяющуюся в положительном направлении оси г. Пусть Ex(t)=a1(t)exp{i[4,1(t)-t2nvt]}, Еу @ = аг (Оехр \i [<p4 (t)—2nvl]\ A) — две взаимно ортогональные компоненты электрического вектора в точке О, перпендикулярные к направлению распространения. Вновь воспользуемся комплексным представлением, рассмотренным в § 10.2; при этом Ех и Еу являются «анали- тическими сигналами», ассоциированными с истинными (вещественными) компонентами ?<;> = at(t) cos [ ф!_@— ^nvt], E'p - а.г (t) х X cos [ф2@ — 2л\п. Если бы свет был строго монохроматическим, то аи ait ц>! и ф2 были бы постоянными. Для квазимонохроматической волны эти величины зависят также от времени t, но, как мы видели, за любой интервал време- ни, малый по сравнению с временем коге- рентности, т. е. малый по сравнению с вели- чиной, обратной эффективной спектральной ?ис- 1017- Обозначения, исполь- к . тт г зуемые при вычислении матриц ко- ширипе света Av, их изменение относитель- г гереншости. но невелико. Предположим, что запаздывание г/-компоненты электрического вектора относительно х-кошюненты равно г (это можно осуществить, например, с по- мощью одного из компенсаторов, описанных в п. 14.4.2), и рассмотрим интен- сивность /F, б) световых колебаний в направлении, которое образует угол G с положительным направлением оси х (рис. 10.17). Такие колебания можно вы- делить, пропуская свет через соответствующим образом ориентированный поля- ризатор (см. п. 14.4.1). Компонента электрического вектора в указанном направлении после введе- ния запаздывания е запишется в виде Е (t; 6, 6) = Ех cos 6 + ?/(8 sin 9, B) так что /(9, в) = <?(*; 9, е)?*(*; 6, е)> = = Jxx cosa 6 + Jyy sin2 6 + Jxye-h cos В sin 9 + Jvxeu sin в cos G, C) где Jxx, ... — элементы матрицы REXEX> <ExE'u>]f <ap <a>aexp [t (Ф1-фа)]>1 - ~ [<EyEx> <EyEp\ ~ [<аЛехр [—i (фх—tp8)]> <a%> ¦ J " D) Диагональные элементы матрицы J вещественны н, как мы видим, представляют собой интенсивности х- и (/-компонент электрического вектора. Следовательно, шпур Sp J нашей матрицы (т. е. сумма ее диагональных элементов) равен пол- ной интенсивности света Sp l = Jxx + Jyy=<E1.E'x> + <:E1,E;>. E) Недиагональные элементы в общем случае комплексны, но они являются сопря- женными. (Такая матрица, для которой Jц = J^ при всех (' и /, называется армитовой.) Как и раньше (см. A0.4.06)), нормируем смешанный член Jхи, полагая М'ху = I M^v I ex'p (i?Jxy) = ху . F) V <! XX V Jуу •) Результаты, изложенные в пп. 10.8.1 и 10.8.2, основаны на исследованиях Вольфа [33]. Дальнейшее нх развитие изложено в работе [79].
502 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 Тогда из неравенства Шварца тем же способом, что и при выводе A0.3.17), получим 1Ле,1<1- G) Комплексный коэффициент корреляции ц,тй играет примерно ту же роль, что и комплексная степень когерентности [j,1a, введенная в п. 10.4.1. Он служит мерой корреляции между х- и ^-компонентами электрического вектора. Модуль | цх!/1 служит мерой их «степени когерентности», а фаза $ху этого коэффициен- та — мерой их «эффективной разности фаз». Матрица J называется матрицей когерентности световой волны. Так как Jxx и Jyv не могут быть отрицатель- ными, F) и G) означают, что определитель матрицы когерентности неотрица- телен, т. е. что \i\^JxxJyy-JxyJ,x>0. (8) Если использовать соотношение Jyx — Jxy и обозначить символом Re вещественную часть, то C) примет вид 1 @, е) = Jxx cos2 9 + Jyy sina 0 + 2 cos 9 sin G Re (Jxy exp (— ie)) = = Jxx cos3 e + Jyy sin2 e + 2 VIZ VTy'y cos В sin 01 )xxy I cos [р,у-e], (9) при переходе от первой ко второй строке сделана подстановка F). Если по- ложить /aKcos20 = /U), /j^sir^S = /B>, то последняя формула становится иден- тичной основному закону интерференции A0.4.11) для квазимонохроматических волновых полей. Как и функции когерентности, которые мы рассматривали ранее, элементы матрицы когерентности заданной волны можно определить посредством отно- сительно простых экспериментов. Это можно сделать различными способами. Необходимо лишь измерить интенсивность для нескольких различных зна- чений 0 (ориентации поляризатора) и е (запаздывания, обусловленного компен- сатором) и решить соответствующие соотношения, полученные из C). Пусть {9, е} обозначает результаты измерений, соответствующие определенной паре значений Э, в. Удобно использовать следующие их значения: {0°, 0}, {45°, 0}, {90°, 0}, {135°, 0}, |45°, -yl, Il35°, -f-}. A0) Из C) вытекает, что элементы матрицы когерентности выражаются через ин- тенсивности, полученные в результате измерений при шести указанных зна- чениях в виде JXX = I,(Q°, 0), Jyy = I(9Q°, 0), 0)}--i; Как мы видим, для определения Jxx, Jyy и вещественной части Jху (или J,JX) необходим лишь поляризатор. Величины Jхх и JV4 можно определить из изме- рений с поляризатором, ориентированным так, чтобы пропускать компоненты с азимутами 0=0° и 0=90° соответственно. Для получения вещественной части Jху необходимы измерения с поляризатором, вначале ориентированным так, что он пропускает компоненту с азимутом 0 =¦ 45°, а затем — компоненту с азимутом 9 = 135°. Для определения мнимой части Jху (или Jyx) требуется также, согласно двум последним соотношениям в A1), компенсатор, который вносил бы разности фаз в четверть периода между х- и (/-компонентами (напри- мер, четвертьволновая пластинка, см. п. 14.4.2). Поляризатор при этом вна- чале ориентирован так, что он пропускает компоненту с азимутом 9 = 45D, а затем — компоненту с азимутом 0 = 135°. В п. 14,4.2 мы покажем, что послед- ние два измерения нужны для идентификации правой и левой круговой поля- ризации.
¦§ 10.8] ПОЛЯРИЗАЦИЯ КВАЗИМОНОХРОМАТИЧЕСКОГО СВЕТА 503 ) - Из выражения (9) безусловно следует, что два пучка света с одинаковыми матрицами когерентности эквивалентны в том смысле, что в ряде аналогичных экспериментов с поляризатором и компенсатором получаются одинаковые (усредненные, по времени) интенсивности *). Посмотрим теперь, как меняется наблюдаемая интенсивность /@, е) дан- ной волны, когда один из аргументов F или е) фиксирован, а другой изменяется. Предположим вначале, что мы фиксируем 0 и изменяем е. Из (9) следует, что интенсивность при этом будет меняться синусоидально между значениями ('(е))макс = /л, cos2 0 + Jyys\n*S+2\JXi,\ sin 9 cos 6, Следовательно, (/ (е))„а„с-(/ (?))„„„ = I Jxy I sin 2a Уравнение A3) открывает другой путь определения абсолютного значения J\у (а следовательно, и |цЖ7/ I) Оно показывает, что эту величину можно по- лучить, измеряя Jxx, Jyy, (/(е))макс и (/(е))мин; фазу величины JX!I легко найти, измеряя значения г, при которых наблюдаются максимумы и минимумы ин- тенсивности. Так, согласно (9), I = (I (е))„а„с. когда е--Рлу±2/пя (т = 0, I, 2, ...), \ , когда е-р„ ±B/п+1)я (т = 0, 1, 2, ...). ] Чтобы выяснить, как изменяется интенсивность при фиксированном е и переменном 9, удобно переписать (9) в несколько иной форме. Легко показать, что /(в, e) = y(/^ + /w> + /?cosB9-a), A5) где | cos (PXJ,-e u X X и у у "Из A5) видно, что при изменении 0 интенсивность также меняется синусои- дально. Ее экстремумы равны В правой части A7) только величина /? зависит от г. Она достигает максималь- ного значения, когда cos2(Pi!; — е) -=-- 1, т. е когда г принимает одно из значе- ний, указанных в A4). При этом величина R равна (R (е))макс = уК(У^-^K + A/xyJyx=-L (Jxx + /„ где |J| — детерминант (8) матрицы когерентности. Отсюда следует, что абсо- *) Это утверждение справедливо только в рамках приближения квазимонохроматической теории, поскольку лишь в области ее применимости справедливо выражение (9) для интенсив- ности Поведение двух пучков может оказаться совершенно различным, если фазовой за дез не- кой е двух перпендикулярных друг другу компонент нельзя пренебречь по сравнению с длиной когерентности, измеренной в единицах средней длины волны X, Для более полного описания наблюдаемых свойств пучка необходимо вводить более общие матрицы когерентности, характе- ризующие корреляцию между компонентами в различные моменты времени, а также в раз- личных точках (см [16], а также [32, 80, 81 j).
504 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 1(У лютные максимум и минимум интенсивности (при изменении и 6 и е) запишутся в виде " (/(9, е))_ = 1(^+ /„ (/F, e))m = l(J,,+ /y Следовательно, (/(О, <0)ма-с-(^в. е))мя„_^ ,/. 4|J[ (xe, t))MaKC f(/(9, Ь))ми„ К Позже мы увидим, что эта величина имеет простой физический смысл. До сих пор мы относили колебания электрического вектора к произвольной, но фиксированной прямоугольной системе координат хОу. Ниже мы рассмот- рим, как преобразуется матрица когерентности при изменении положения осей. Пусть в плоскости, перпендикулярной к направлению распространения, новая прямоугольная система координат х'Оу' выбрана так, что ось Ох' об- разует угол в с Ох (см. рис. 10.17). В новой системе координат компоненты электрического вектора выражаются через Ех, Еу следующим образом: Ex. = Excosв + Eysin в, \ Ey = —Essm@+Eycos@.( l ' Элементами трансформированной матрицы когерентности У служат , /*.,.=<.?*-?/•>. " B2) где каждый из индексов k' и Г принимает значения х' и у'. Из B1) и B2) сле- дует, что ~' где с — cosO, s = sin6. B4) Как мы видим, шпур этой матрицы инвариантен относительно вращения систе- мы координат. Легко показать, что ее детерминант также инвариантен относи- тельно такого преобразования. Оба эти результата следуют и из хорошо из- вестных теорем матричной алгебры. Рассмотрим далее форму матрицы когерентности для некоторых случаев> представляющих особый интерес. а. Неполяризованный (естественный) свет. Свет, с которым мы чаще всего сталкиваемся в природе, обладает тем свойством, что интенсивность любой его компоненты, перпендикулярной к направлению распространения, одинакова. Более того, на эту интенсивность не оказывает влияния никакое предыдущее взаимное запаздывание перпендикулярных друг другу компонент, на которые можно разложить свет. Другими словами, /F, е)^ const B5) для всех значений б и е. Такой свет называется полностью неполяризованным; часто его называют естественным светом. Из (9) очевидно, что /(9, е) не зависит от г и Э тогда и только тогда, когда И-*, —0 и Jxx=Jyy. ~ B6а> Первое условие означает, что Ех и Еч взаимно некогерентны. На основании F) и соотношения Jvx = Jxy условия B6а) можно также записать в виде Jxy = Jyx = O, Jxx = Jyy. B66) Отсюда следует, Что матрица когерентности для естественного света с
4-Л! j]. B7> § 10.8] поляризация квазимонохроматического Света 505 интенсивностью /И+Л»~/ равна м: б. Полностью поляризованный свет. Рассмотрим вначале случай строго монохроматического света. Тогда пи аг, cpi и <р2 в A) не зависят от времени, и матрица когерентности имеет вид Lai-'» aiaf}' B8> где *) б = ф1—ф2. B9> Мы видим, что в этом случае \i\ = JxxJyy — JXyJyx--=Q, C0> т. е. детерминант матрицы когерентности равен нулю. Тогда для комплексной степени когерентности компонент Ех и Еу имеем т. е. ее абсолютное значение равно единице (полная когерентность), а ее фаза равна разности фаз обеих компонент. В специальном случае линейно поляризованного света (см. A.4.33)) 6 = = тл(/тг = 0, ±1, +2, ...). Следовательно, матрица когерентности для ли- нейно поляризованного света имеет вид П* I 1 \тЛ П 1 ;-i)'4«2 < \- C2> Электрический вектор колеблется в направлении, задаваемом соотношением. Еу/Ех = (—1)та.Л/аг. В частности, каждая из матриц Г1 0] ГО 0] [о о| • ' [о ij C3> соответствует линейно поляризованному свету интенсивности / с электрическим вектором, направленным по оси х (ог = 0) и оси у (а, = 0) соответственно. Матри- цы П , Г 1 -П C4) соответствуют линейно поляризованному свету интенсивности / с электрическим вектором, направленным соответственно под углами 45° и 135° к оси х(аг = аг, т = 0 и al=a2, m — 1). Для света, поляризованного по кругу (см. A.4.35) я A.4.36)), аг=аг, 6= =тя/2 (т=±1, ±3, ,,.), и, значит, матрица когерентности имеет вид ! ±'1 ,- ij- C5) где /—интенсивность света. На основании A.4 38) и A.4.40) верхний или нижний знак соответствует правой или левой поляризации. Условие C0) может выполняться и для немонохроматического света, если зависимость величии аь а,, ср! и ср2 от времени такова, что отношение амплитуд и разность фаз не зависят от времени, т. е. ' ЙН 4>i@-«p.@=-x. C6) *) Чтобы в дальнейшем использовать некоторые результаты, изложенные в § 1.4, заме- тим, что'q>i и <р2соответствуют—61п—62, введенным в п. 1.4 2, так чго B9) сотласуегся с более- ранним определением A.4.16), а именно б=б2—в1%
506 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 где q и % — постоянные; тогда }> } C7) ->Х). /,, = <?2<«?>, и условие C0) выполняется. Матрица когерентности с элементами C7) совпа- дает с матрицей для строго монохроматического света с компонентами Ех =К"<о?>ехр {i [a—2nvl]}, Ey = qy<a*>exp {i [— % + а—2nvt}\, C8) где а — произвольная постоянная. Отсюда следует, что в эксперименте с по- ляризатором и компенсатором поведение квазимонохроматпческой волны, подчиняющейся условиям C6), в точности совпадает с поведением строго моно- хроматической и, следовательно, полностью поляризованной волны C8). (Предполагается, конечно, что разность фаз, вносимая компенсатором, мала по сравнению с длиной когерентности света, измеренной в единицах средней длины волны.) Поэтому можно сказать, что условие C0) характеризует пол- ностью поляризованную световую волну. 10.S.2. Некоторые эквивалентные представления. Степень поляризации световой волны. При суперпозиции нескольких независимых световых волн, распространяющихся в одном направлении, матрица когерентности резуль- тирующей волны равна сумме матриц когерентности для отдельных волн. Чтобы доказать это, рассмотрим компоненты электрических векторов (в обычном комп- лексном представлении) отдельных волн Ef, Uf>{n=-l, 2, ..», N). Компо- ненты электрического вектора результирующей волны равны N N а значит, элементы матрицн когерентности для этой волны определяются выра- жениями Л, = <?*?/> =2 2 <?Г?/т)*> = 2<?*1)?/и)*>+ 2 <ЕрЕГ>'>. D0) л— 1 т~ I n n =^ m Так как предполагается, что волны независимы, каждый член последней суммы равен нулю и, следовательно, где J)"t' — <,Е'%>Е'-р*у — элементы матрицы когерентности п-й волны. Урав- нение D1) показывает, что матрица когерентности для сложной волны равна сумме матриц когерентности для всех составляющих волн. Вместе с тем любую волну можно рассматривать как сумму независимых волн, которые, очевидно, можно выбирать различными способами. Ниже ми кратко остановимся на одном специальном способе такого выбора. Покажем, что любую квазимонохроматическую световую волну можно рассматривать как сумму полностью неполяризованной и полностью поляри- зованной волн, не зависящих друг от друга, и что такое представление единст- венно. Для этого необходимо лишь показать, чго любую матрицу когерентности J можно единственным образом выразить в виде j = j<D_t_jB)i где в соответствии с B7) и C0) JA1=[o л]- JW=U* с причем Л>0, ?>0, С>0 и ВС—DD*=0. D4) Если JXXI Jjfj,, ,.,,— элементы матрицы когерентности, характеризующей
§ 10.8] ПОЛЯРИЗАЦИЯ КВАЗИМОНОХРОМАТИЧЕСКОГ0" СВЕТА 507 исходную волну, то на основании D2) и D3) имеем A + B = JXX, D = Jxy, \ C = Jyy. f Dэ> Подставляя D5) в D4), мы получим следующее уравнение для А: {jxx-A)(Jyy-A)-JxyJyx = 0; D5) таким образом А явтяется характеристическим корнем (собственным значе- нием) матрицы когерентности J. Два корня уравнения D6) равны А = ~ {Jxx + Jyy) ± у V(Jxx+JyyY-b\l\, D7) где, как и раньше, |J| — определитель (8). Так как Jyx = J"!/, произведение Jхц-1'ух неотрицательно и из (8) следует, что значит оба корня D7) вещественны и неотрицательны. Рассмотрим вначале решение со знаком минус перед квадратным корнем. Имеем , \ D9) * = V C = ^(Jyy-Jxx)+^V(Jxx + Jyyr-i\i\. J Поскольку P«^||xxyyxyyx >! и „ | В и С также неотрицательны, как и требуется. Второй корень D7) (со знаком плюс перед квадратным корнем) дает отрицательные значения В и С, и поэтому его следует отбросить. Таким образом, мы получили единственное разложение требуемого вида. Полная интенсивность волны равна 'non« = SPJ = Jxx + Jyy, E0) а полная интенсивность поляризованной части — /По.тяР = SP J"' - В + С = V{Jxx + Jyyy—^\T\. E1) Отношение интенсивности поляризованной части к полной иптенсивпости на- зывается степенью поляризации Р волны; согласно E0) и E1) она определяется соотношением /»=^i=yri__Uil . E2) 'ноли ' W xx~rJyy) Это выражение содержит лишь два инварианта вращения матрицы когерент- ности, и поэтому, как и следовало ожидать, степень поляризации не зависит от выбора осей Ох, Оу. Из E2) н неравенства, предшествующего D8), вытекает, что 0<Р<1. E3) Когда Р = 1, неполяризованная компонента отсутствует и, значит, волна полностью поляризована. При этом | J | — 0, так что | \ixy | = 1 и, следователь- но, Ех и Еу взаимно когерентны. Когда Р=0, отсутствует поляризованная компонента. Волна тогда полностью неполяризована. В этом случае (Jхх + + ^H)a = 4|Ji, т.е. VxX~J,yy-i-iJxyJyx = O. E4а)
508 ИНТЕРФГРЕНЦИП И ЛИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 Так как Jyx — Jxy, то находим, что равна нулю сумма квадратов двух величин, а это возможно лишь в том случае, когда каждая из них равна нулю, т. е. когда J хх = Jyy и J ху = 1 ух — 0, E4б> что соответствует B66). Тогда Ех и Еу взаимно некогерентны (|ххч=0). Во всех других случаях @<-Р<1) мы говорим, что свет частично поляризован. Сравнение E2) и B0) показывает, что величина LL' ™*-~7,, ,Q' s ? ¦ в точ- ности равна степени поляризации Р. Выражение для степени поляризации принимает простую форму, когда Ех и Еу взаимно нскогерептны (но свег не обязательно естественный). Так как в этом случае Jxs—JyX~O, то |J| =JXXJVU id E2) переходит в *) Hfe^l- <55> Это выражение согласуется с формулой A.5.42), используемой для определения поляризации естественного света при отражении. Укажем несколько полезных представлений естественного света. Матрицу когерентности B7) для естественного света всегда можно записать в виде П от , Г1 01 1 ю о 1 П г [ ] от т'[о iJ-T'lo oJ+Ио ij' E6) а это означает, согласно C3), что волна естественного света интенсивности / эквивалентна двум независимым линейно поляризованным волнам с интенсив- ностью каждой, равной -^ 1, и электрическими векторами, колеблющимися в двух взаимно перпендикулярных направлениях, нормальных к направлению распространения. Другое полезное представление естественного света имеет вид п о] 1 Г 1 +П I Г 1 — Л i п ] 1 Г 1 +П I Г 1 Л т'[о iJ-T'U iJ+^U+f- ij- E7) Согласно C5) оно означает, что волна естественного света интенсивности / эквивалентна двум независимым циркулярно поляризованным волнам с ин- тенсивностью каждой, равной -j I, причем одна из волн поляризована по правому кругу, другая — по левому. Возвращаясь к общему случаю (частично поляризованный свет), следует отметить, что, в отличие от степени поляризации Р, степень когерентности |р,Ж!,| зависит от выбора осей х и у. Однако легко показать, что | \ьху \ не может превышать Р. Действительно, если в E2) мы запишем полное выражение детер- минанта | i\ и используем F), то найдем, что JJ -I^H- F8) "Так как среднее геометрическое любых двух положительных чисел не может превышать их среднего арифметического, то 1 — Р3<11—Ip-^l2, т.е. P>\\lx,\. E9) *) Поскольку каждую эрмитову матрицу можно привести к диагональному виду с по- мощью унитарного преобразования, причем JJJ и Sp J инварианты при таком преобразовании» степень поляризации всегда можно представить в виде где Аг и Аг — два собственных значения (определяемых выражениями D7)). Однако, вооб:де говоря, унитарное преобразование не представляет действительного вращения осей вокруг направления распространения волнь1. Интересно отметить, что собственные значения А^ и At равны значениям (/(9) е))мак(.-и (/(9, е))миш определяемым выражениями A9),
¦§ 10.8] поляризация квазимонохроматичесйого света 509 Знак равенства в E9) справедлив тогда и только тогда, когда J xx = J,lv, т. е. когда интенсивности (средние по времени) х- и «/-компонент электрического вектора одинаковы. Ниже мы покажем, что всегда существует пара направле- ний, для которых это справедливо. При повороте осей х и у в плоскости, в которой они лежат, на угол 0 про- тив часовой стрелки, Jхх и Jvy переходят соответственно в 1Х,Х, и Jи<у,, при- чем на ¦основании B3) \ — (Jxy + Jyjc) cos 0 sin 0. f * ' Из F0) следует, что J'х,к. = J'y-y>, если оси поворачиваются на угол 0 =в, задаваемый соотношением Так как Jyx = Jxyi а Jxx и J ну вещественны, уравнение F)) всегда имеет ве- щественное решение для В. Таким образом, всегда существует пара взаимно ортогональных направлений, для которых интенсивности равны. Для этой пары направлений степень когерентности \\1ху | электрических колебаний при- нимает максимальное значение, равное Р — степени поляризации полны *). 10.8.3. Параметры Стокса квазимонохроматичаской плоской волны. Как мы видели, для характеристики квазимопохроматической плоской волны, вообще говоря, необходимы четыре вещественные величины, например Jxx, JV4, вещественная и мнимая части J„, (или J,,x). В своих исследованиях, от- носящихся к частично поляризованному свету, Стоке [27] ввел **) несколько отличное представление с четырьмя параметрами, тесно связанное с рассмот- ренным выше. Мы уже сталкивались с ним (в частном случае) в п. 1.4.2 при изучении монохроматического света. Параметрами Стокса общего вида являют- ся следующие четыре величины: 6>, } F2) ss = 2<a1a2cos6), s3 = 2 <.агаг sin 6> где, как и прежде, аг и а2 — мгновенные амплитуды двух взаимно перпенди- кулярных компонент электрического вектора Ех и ?,„ а б — фг—ср2—раз- ность их фаз. Для монохроматического света аг,а, и б не зависят от времени, и выражения F2) переходят в параметры Стокса монохроматической волны, определенные в A.4.43). Из F2) и D) следует, что параметра Стокса и элементы матрицы когерент- ности связаны соотношениями /Т/"+j"' 55г-~ш~''У\- \ F3а) уу j^S0 Sl, I ^^ Как и элементы матрицы когерентности, параметры Стокса любой плоской квазимонохроматической волны можно определить с помощью простых экспе- риментов. Как и раньше, обозначим через 7@, с) интенсивность световых коле- баний в направлении, образующем угол 0 с осью Ох, когда их (/-компонента *) Геометрическая интерпретация этой специальной пары направлений рассмотрена Вольфом [82]. **) См. также [16, 28, 31, 34, 83, 84]. Параметры Стокса применяются и при квантовоме- ханическом рассмотрении поляризации элементарных частиц [85—88}, см. также [30].
510 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 запаздывает на величину е по отношению к х-компоненте. Тогда на основании соотношений A1) и F3а) имеем 0), % = /@°, 0)—/(90°, 0), | ] F4> sa=/D5°, 0)-/A35°, 0), s,= /D5е, •?-)- Параметр s0, очевидно, представляет полную интенсивность. Параметр st равен разности интенсивностей линейно поляризованного света, прошедшего через поляризаторы, с азимутами й=0" и 6—90J. Так же интерпретируется и параметр s2, но для азимутов 6 =45° и fl = 135°. Наконец, параметр s3 равен разности интеисивпостей света, прошедшего через прибор, пропускающий коле- бания с правой круговой поляризацией, и света, прошедшего через прибор, пропускающий колебания с левой круговой поляризацией. Если использовать соотношения F36), то все приведенные выше резуль- таты можно выразить не через матрицу когерентности, а с помощью параметров С В (8) JJJJ^ примет вид F5) Для монохроматического света имеем, согласно C0), JXXJV4—J'xyJj,x=0, и тогда в соответствии с A.4.44) в соотношении F5) мы получим знак равенства. Рассмотрим теперь разложение данной волны на взаимно независимые поляризованную и неполяризованную части, используя представление через параметры Стокса. Из D1) и F3) следует, что параметры Стокса системы не- зависимых волн равны сумме соответствующих параметров Стокса отдельных волн. Из B7) и F3а) вытекает, что для неполяризованной волны (естественный свет) справедливо соотношение Si=Sj=s.) = O. Обозначим четыре параметра Стокса Sn, St, 4=, s3 одним символом s. Тогда, очевидно, для волны, характери- зующейся параметром s, требуемое разложение запишется в виде s = sA» + sC>, F6) где - s^^So—Ksf + sf + s;, 0, 0, 0, F7а) sC'=Ksf + sM-s*,Sl, s2,s3. F76) Параметр sA) соответствует неполяризованной, a so)— поляризованной части волны. Следовательно, с помощью параметров Стокса степень поляризации исходной волны можно выразить в виде „ 1 поляр V Si + sl+Sa ,Co-v ? = -, = — ¦. (Ьб) 1лоли йо То же выражение нетрудно получить, подставляя F36) в E2). Легко также записать выражения, определяющие форму и ориентацию эллипса поляриза- ции, связанного с поляризованной частью волны (см. F76)). Если, как и в A.4.28), соотношение lg%=±b/a (—я/4<%<Гя/4) определяет отноше- ние малой и большой осей и направление, в котором описывается эллипс (%>0 соответствует правой, а %<0— левой поляризации), то на основании A.4.45в) и F76) имеем sin 2 у = .. S3 . F9) Угол i|i@s^i|)< л) между большой осью и Ох определяется в соответствии с A.4.46) и F76) соотношением ¦ tg21|1 = s2/s1. - G0) Итак, мы видим, что параметры Стокса, как и матрица когерентности, слу- жат полезным инструментом для систематического анализа состояния поляри- зации квазимонохроматической волны.
ЛИТЕРАТУРА 511 ЛИТЕРАТУРА 1. Е. V е г d e t, Ann. Sci. Ecole Normale Superieure 2, 291 A865); Lecons d'Optique Physique» L'Imprimerie Imperiale, Paris, 1869, vol. 1, p. 10S. 2. A. A. M i с h e 1 s о п, Phil. Mag. 30,1 A890); 31, 256 A891), Astrophys. J. 51, 257 A920). 3. A. A. M i с h e 1 s о n, Phil. Mag. 31, 338 A891); 34, 280 A892). 4. F. Zernike, Proc. Phys. Soc. 61, 158 A948). 5. M. Lane, Ann. d. Physik 23, 1, 795 A907). 6. M. В е г e k, Z. Phys. 36, 675, 824 A926); 37, 387 A926); 40, 420 A926). 7. C. Lakeman, J. Th. Groosmuller, Physica 8, 193, 199, 305 A928). 8. P. H. van С i 11 e r t, Physica 1, 201 A934). 9. P. H. van С i t t e r t, Physica 6, 1129 A939). 10. L. Janossy, Nuovo Cimcnto 6, 111 A957); 12, 369 A959). 11. F. Zernike, Physica 5, 785A938). 12. H. H. Hopkins, Proc. Roy. Soc. A208, 263 A951); A217, 408 A953). 13. D. G a b о г, в сб. «Proc. Symp. Astr. Optics», ed. Z. Kopal, North Holland Publ. Co., Amsterdam, 1956, p. 17; в сб. «Proc. Third Symp. Inform. Theory», ed. C. Cherry, Buttcrworths Sci. Publ., London, 1956, p. 26. 14. H. G a m o, J. Appl. Phys. Japan 25, 431 A956); веб.: «Progr. in Optics», vol. 3, ed. E. Wolf, North Holland Publ. Co.', Amsterdam, .1. Wiley a. Sons, N. Y., 1964, p. 187. 15. E. Wolf, Proc. Roy. Soc. A230, 246 A955); A225, 96 A954). 16. E. Wolf, Nuovo Cimento 12, 884 1954). 17. А. В 1 a n c- L a p i e г г e, P. Dumontet, Rev. d'Opt. 34, 1 A953). 18. J. J. F г ее m a n, Principles of Noise, J. Wiley a. Sons, Inc., N. Y., 1958, p. 245—247. 19. E. Wo 1 f, в сб. «Quantum Electronics», .3rd Congress, ed. Pv. Bloembergen a. P. Grivet,. Columbia Univ. Press, N. Y., Dunod, Paris, 1964, p. 13. 20. L. M a n d e 1, в сб.: «Quantum Electronics», 3rd Congress, ed. N. Bloembergen a. P. Grivet,. Colubmia Univ. Press, N. Y., Dunod, Paris, 1964, p. 101. 21.E. Wo 1 f, в сб.: «Proc. Symp. on Optical Masers», Brooklyn Polytech. Press, J. Wiley a. Sons, Inc. N. Y., 1963. 22. R. J. Gl a u b e г, в сб.: «Quantum Electronics», 3rd Congress, ed. N. Bloembergen a. P. Grivet, Columbia Univ. Press, N. Y., Dunod, Paris, 1964, p.,Ill; Phys. Rev. 130, 2529- A963). 23. E. С G. Sudarsha n, Phys. Rev. Lett. 10, 277 A963); J. R. К 1 a u d e г, Е. С J. S u- d a r s h a n, Fundamentals of Quantum Optics, \V. A. Benjamin, Inc., N. Y., 1968. (Дж. Клаудер, Э. Сударшан, Основы квантовой оптики, «Мнр», 1971.) 24. L. М а п d е 1, Е. W о I f, Rev. Mod. Phys. 37, 231 A965). (Э. Вольф, Л. Маи- д е л ь, УФН 87, 491 A965); 88, 347, 619 A966).) 25. R. N. Bracewell, Radio Astronomy Techniques, в сб. «Encyclopedia of Physics», ed. S. Flflgge, Springer, Berlin, 1959, vol. 54. 26. J. A. R a t с 1 i f f e, в сб. «Rep. Progr. Phys.», Phys. Soc. London, 1956, vol. 19, p. 188. 27. G. G. S t о k e s, Trans. Cambr. Phil. Soc. 9, 399 A852); Mathematical an4 Physical Papers, Cambr. Univ. Press, 1901, vol. Ill, p. 233. 28. P. S о I e i 1 1 e t, Ann. dc Physique 12, 23 A929). 29. N. Wiener, J. Math. Phys. 7, 109 A928); J. Franklin Inst. 207, 525 A929). 30. N. W i e n e r, Acta Math 55. § 9 A930). 31. F. P e r r i n, J. Chem. Phys. 10, 415 A942). 32. E. W о ] f, в сб. «Proc. Symp. Astr. Optics», ed. 2. Kopal, North Holland Publ. Co., Amster. dam, 1956, p. 177. 33. E. Wolf, Nuovo Cimento 13, 1165 A959). 34. S. Pancharatna m, Proc. Indian Acad. Sci. A44, 398 A956); 57, 218, 231 A963). 35. E. С Titchmarsh, Introduction to the Theory of Fourier Integrals, Clarendon Press, Oxford, 2nd ed., 1948. (E. T и т ч м а р ш, Введение в теорию интегралов Фурье, Гостех- издат, 1948.) 36. D. G a b о г, J. IEE 93, Pt. Ill, 429 A946). 37. В. И. Б у н и м о в и ч, ЖТФ 19, 1231 A949). 38. J. V 1 1 1 е, Cables et Transmission 2, 61 A948); 4, 9 A950). 39. J. R.Oswald, Trans. IRE, CT-3, 244 A956). 40. H. A. Kramers, Atti Congr. Intern. Fisici, Como (Sept. 1927), (V), N. Zanichelli, Bologna, 1928. 41. J. S. Toll, Phys. Rev. 104, 1760 A956), J. Hilgevoord, Dispersion Relations and Causal Description, North Holland Publ Co., Amsterdam, 1960. 42. L. M a n d e 1, J. Opt. Soc. Amer. 57, 613 A967). 43. N. W i e n e r, Acta Math. 55, 117 A930). 44. W. B. Davenport, W. L. R о о t, An Introduction to the Theory of Random Signals and Noise, McGraw-Hill, N. Y., 1958. (В. Б. Д а в е н п о р т, В. Л. Рут, Введение в теорию случайных сигналов и шумов, ИЛ, 1960.) 45. D. М i d d 1 е t о п, Trans, IRE CT-3, 299 A956).
512 ИНТЕРФЕРЕНЦИЯ И ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА [ГЛ. 10 46. S. Goldman, Information Theory, Prentice-Hall, Inc., N. Y., 1953. (С. Г о л д м а н, Теория информации, ИЛ, 1957.) 47. А. М. Я г л о и, Введение в теорию стационарных случайных функций, УМН 7, 3 A952) 48. J. L. D о о b, Stochastic Processes, J. Wiley a. Sons, Inc., New York, 1953 49. M. S. В a r t 1 e t t, An Introduction to Stochastic Processes, Cambr. Univ. Press, 1955. 50. H. Margenau, G. M. Murphy, The Mathematics of Physics and Chemistry, D. van Noslrand Co., Amsterdam, 1947. 51. L. M a n d e 1, E. W о 1 f, J. Opt. Soc. Amer. 51, 815 A961). -52. А. К h i n t с h i n e, Math. Ann. 109, 604 A934). (А. Я. X и н"ч и и, УМН выи 5 42 A938).) 53. P. Roma n, E. W о 1 f, Nuovo Cirnento 17, 474—476 A960). 54. L. M a n d e 1, в сб. iProgr. in Optics», ed. E. Wolf, North Holland Publ. Co., Amsterdam 1963, vol. 2, p. 181. 55. R. H. В г о w n, R. Q. a. T w i s s, Proc. Roy. Soc. A242, 300 A957); A243, 291 A957). 56. E. M. Purcell, Nature 178, 1449 A956). 57. F. D. К a h n, Optica Acta 5, 93 A958). 58. L. M a n d e 1, Proc. Phys. Soc. 72, 1037 A958). 59. E. Wolf, Phil. Mag. 2, 351 A957). 60. J. A. R a t с 1 i f f e, в сб. «Rep. Progr. Phys.», Phys. Soc, 1956, vol. 19, p. 233 61. C. A. Taylor, R. M. H i n d e, H. L i p s о n, Ada Cryst. 4, 2S1 A951) 62. A. W.Hanson, H. L i p s о п. С A. Taylor, Proc. Roy. Soc. A218, 371 A953). 63. W. Hughes, С. А. Т а у 1 о г, J. Sci. Inslr. 30, 105 A953). 64. A. T. Forrester, Amer. J. Phys. 24, 194 A956). 65. J. T h о m p s о n, E. W о 1 f, J. Opt. Soc. Amer. 47, 895 A957). 66. F. Z e r n i k e, Physica 5, 791 A938). ' ' 67. F. Z e r n i k e, Physica 5, 794 A938). 68. H. H. Hopkins, P. M. В а г h a m, Proc. Phys. Soc. 63, 72 A950). 69. А. К о h 1 e r, Z. f. wiss. Mikrosk. 10, 433 A893); 16, 1 A899). 70. P. Dumontet, Publ. Sci. Univ. d'Alger Bl, 33 A955). 71. E. Wolf, Proc. Phys. Soc. 71, 257 A958). 72. M. J. В e r a n, G. В. Р а г г е n t, Theory of Partial Coherence, Englewood Cliffs N. Y., 1964, § 3.3. 73. L. Man del, Proc. Phys. Soc. 74, 233 A959); L. M a n d e 1, E. Wolf, Proc. Phys. Soc. 80, 894 A962). 74. R. S i 1 v e r m a n, Trans. IRE CT-5, 84'A958). 75. А. Г. М а й e p, E. А. Леонтови ч, ДАН СССР 4, 353 A934). 76. 1. Kay, R. S i 1 V с r m a n, Information and Control 1, 64. 396 A957). 77. A. A. X a p к е в н ч, Спектры и анализ, Физматгиз, 1962, § 12. 78. Н. We у 1, The Theory of Groups and Quantum Mechanics, Methuen, London, 1931. 79. G. В. Р a r r e n t, P. R о m a n, Nuovo Cimento 15, 370 (I960). 80. P. Roma n, E. W о 1 I, Nuovo Cirnento 17, 462, 477 A960). 81. P. Roman, Nuovo Cimento 20, 759 A961); 22, 1005A961). 82. E. Wolf, Nuovo Cimento 13, 1180—1181 A959). 83. S. С h a n d r a s e k h a r, Radiative Transfer, Clarendon Press, Oxford, 1950, § 15 84. M. J. W a 1 k e r, Amer. .1. Phys. 22, 170 A954). 85. U. F a n o, J. Opt. Soc. Amer.9, 859 A949); 41, 58 A951); Phys. Rev. 93, 121 A954). 86. D. L. F a 1 k о f i, J. E. Mac D о n a 1 d, J, Opt. Soc. Amer. 41, 861 A951). ST. W. H. M а с М a s t e r, Amer. J. Phys. 22, 351 A954). 88. J. M. J a u с h, F. R о h r 1 i с h, The Theory of Photons and Electrons, Addison-Wesley Publ. Co. Inc., Cambridge, 1955, § 2.8. 89'. T. Y a m a m о t o, Opt. Acta 12, 229 A965). 90*. Y. O' h m e n, Appl. Opt. 4, 1660 A965). 91*. E. L. O'N с i 1 1, Introduction to statistical Optics, Addison-Wesley Publ. Co., London, 1963. (Э. О'Нейл, Введение в статистическую оптику, «Мир», 1966.) 92*. С. М. Р ы т о в, Введение в статистическую радиофизику, «Паука», 1966. S3*. Р. Глаубер, в сб. «Квантовая оптика и квантовая радиофизика», «Мир», 1971.
ГЛАВА It СТРОГАЯ ТЕОРИЯ ДИФРАКЦИИ § 11.1. Введение Если исходить из уравнений Масквелла и обычных граничных условий, то проблема дифракции электромагнитного излучения на некотором теле сво- дится к строго определенной краевой математической задаче. В настоящей главе некоторые аспекты теории дифракции монохроматических волн обсуждаются именно с этой точки зрения. В частности, здесь подробно и строго решается классическая задача дифракции на идеально проводящей полуплоскости. В ранних теориях, принадлежащих Юнгу, Френелю и Кирхгофу, дифрак- ционное препятствие предполагалось абсолютно «черным»; иными словами, считалось, что все излучение, падающее на препятствие, полностью погло- щается, не отражаясь. Это предположение послужило источником внутренних противоречий, так как такое понятие абсолютной «черноты» нельзя было точно определить и оно явно было несовместимым с электромагнитной теорией. Случаи, когда тело, на котором происходит дифракция, имеет конечную диэлектрическую проницаемость и конечную проводимость, исследовались теоретически; одно из первых исчерпывающих исследований такого рода для дифракции на сфере, выполненное в 1908 г. Ми, рассматривается в гл. 13, по- священной оптике металлов. Вообще говоря, предположение о конечной про- водимости приводит к очень большому усложнению математического аппарата, и поэтому часто желательно принять концепцию идеально проводящего (и, следовательно, идеального отражающего) тела. Это, конечно, идеализация, но совместимая с электромагнитной теорией; кроме того, поскольку проводимость некоторых металлов (например, меди) очень велика, подобное представление может служить хорошей аппроксимацией, если частота не слишком велика. Однако следует подчеркнуть, что такая аппроксимация на оптических частотах никогда не является полностью адекватной. Упрощающее предположение о бес- конечной проводимости дифракционного препятствия принято в большинстве работ, основанных па строгих математических выводах; наши последующие рассуждения также ограничиваются этим случаем. Первое строгое решение такой дифракционной задачи было дано в 1896 г. Зоммерфельдом [1] при рассмотрении двумерного случая падения плоской волны на бесконечно тонкую идеально проводящую полуплоскость. Широкая известность его результата основана частично на том искусстве, с которым была решена задача, а частично на том, что найденное им решение можно было вы- разить точно и просто в виде интегралов Френеля, столь характерных для прежних приближенных теорий. Многие математики последовали по пути Зоммерфельда. Ранние решения дифракционных задач, относящиеся к точечному и линейному источникам, а также интересные обобщения при рассмотрении дифракции на клине, а не на полуплоскости, связаны с именами Карслоу [2], Макдональда 131 и Бромвича [41. Были решены также и другие задачи. В последнее время предложены новые методы, применение которых было стимулировано успехами ультракоротковол- новой радиотехники. Прежде чем перейти к основному содержанию настоящей главы, упомянем очень коротко о некоторых из этих исследований. Если существует такая ортогональная система координат щ, щ, и3, в ко- торой поверхность дифракционного тела совпадает с одной из поверхностей
514 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИИ [ГЛ, 11 Ui — const, то для решения дифференциальных уравнений в частных производ- ных можно использовать классический способ разделения переменных. Таким методом фактически и воспользовался Ми для решения упоминавшейся выше задачи о сфере, обладающей конечной проводимостью. В этом случае решение краевой задачи имеет вид бесконечного ряда и его ценность зависит от легкости вычисления необходимых функций, а также, от скорости, с которой ряд схо- дится. Этот метод применялся в различных случаях (помимо задачи со сферой); особенно надо отметить его использование в случае дифракции на круглом диске или отверстии [5]. Следует, однако, замерить, что лишь некоторые из этих работ относятся к чисто скалярным задачам типа задач, встречающихся в теории звуковых волн малой амплитуды; дальше будет показано, что дву- мерные задачи в электромагнитной теории принадлежат в основном к этому типу, но в других случаях векторная природа электромагнитного поля при- водит к дополнительным осложнениям. Другой метод с использованием интегральных уравнений, по-видимому, впервые рассматривался Рэлеем [6]. Некоторые задачи (простейшие из них относятся к полуплоскости) приводят к таким интегральным уравнениям, ко- торые можно точно решить методом, развитым Винером и Хопфом *). Его ис- пользование Копсопом [81, Швингером и другими, дало ряд новых решений в замкнутой форме [9—11] (более подробная библиография указана в [12, 13J). В этой связи следует упомянуть также о мощном, хотя и несколько слож- ном вариационном методе, которым можно воспользоваться при расчете энер- гии, дифрагирующей через отверстие [141. Из-за ограниченности места мы рассмотрим в Настоящей главе только один метод **). Сначала мы изложим некоторые соображения общего харак- тера, имеющие значение в теории дифракции электромагнитных волн на иде- ально проводящих структурах. Далее введем представление произвольного поля в виде интеграла по спектру плоских волн и покажем, что это ведет к фор- мулировке некоторых дифракционных задач через «дуальные» интегральные уравнения ***). При этом задача Зоммерфельда с полуплоскостью легко ре- шается; это решение приводится здесь и достаточно подробно исследуется вместе с некоторым числом побочных вопросов. В настоящей главе рассматривается также несколько смежных вопросов. § 11.2. Граничные условия и поверхностные токи Хорошо известно, что электромагнитное поле только незначительно про- никает в глубь хорошего проводника. Понятие бесконечной проводимости, при которой полностью отсутствует проникновение электромагнитного поля в глубь проводника, приводит, как покажут приведенные ниже аргументы, к понятию электрического тока, существующего исключительно на поверхности провод- ника. Согласно уравнениям Максвелла (см. § 1.1.3) тангенциальная компонента Е непрерывна при пересечении бесконечно тонкого листка электрического тока, тогда как аналогичная компонента Н испытывает разрыв. Более точно, раз- рывна тангенциальная компонента Н, нормальная к вектору поверхностной плотности****) J тока, и величина разрыва составляет 4nJ/c. Относительное рас- положение этих векторов показано на рис. 11.1. Кроме того, в соответствии •) Метод Винера и Хопфа разбирается в [7]. **) Изложение других методов дано в статье Вольфсона в [15] и гл. 4 н 5 книги [16] и в статье [17]. В обзоре [13] приведена наиболее полная сводка методов и формул. ***) «Дуальные» интегральные уравнения (они определяются ниже на стр. 520) рассмат^ риваются в книге Титчмарша [7]. ****) Поверхностный ток в п. 1.1.3 обозначен через j.
' § 11.2] ГРАНИЧНЫЕ УСЛОВИЯ И ПОВЕРХНОСТНЫЕ ТОКИ 515 с поведением тангенциальных компонент Ей Н нормальная компонента Н непрерывна при пересечении листка тока, тогда как нормальная компонента Е разрывна и величина этого разрыва равна произведению поверхностной плот- ности зарядов на 4я. Таким образом очевидно, что поле в вакууме вне идеально проводящего тела таково, что на поверхности проводника имеем: а) тангенциальная компонента Е равна нулю; б) тангенциальная компонента Н перпендикулярна к вектору поверхност- ной плотности J электрического тока и равна 4aJ/c; в) нормальная компонента Н равна нулю; г) внешняя нормальная компонента Е равна произведению 4я на поверх- ностную плотность заряда. Действие излучения, падающего на идеально проводящее тело, удобно интерпретировать, выражая его через индуцированные поверхностные токи. Если Е(|) — электрический вектор падающего поля, а Е(" — электрический вектор «рассеянного» поля, обусловленного индуцированным током, то полный электрический вектор повсюду равен Е'+ Ей>. Сле- довательно, теперь дифракционную задачу можно сформулировать следующим образом: дано Е(", тре- буется найти поле Е(я, создаваемое током, распре- деленным по поверхности проводника, которое имеет Рис. 11.1. Взаимное рас- такую величину, что его тангенциальная состав- положение векторов ляющая на поверхности равна тангенциальной состав- Н-— и J. „ „/,, „ ^ Ш1) и п*. ) — магнитные поля ляющеи h(", взятой со знаком минус, Стоит подчерк- па перлон и п-орои сторонах путь, что приведенное выше граничное условие a) T-HS'op™ 'поверхностной ЯВЛЯеТСЯ ОСНОВНЫМ И Вместе С Тем ДОСТаТОЧНЫМ уСЛО- плотности тока. вием единственности решения вопроса лить в том виде, как он сформулирован *). Что же касается других условий; то б) связы» вает поле с индуцированным током, а условия в) и г) не представляют осо- бого интереса. Следует отметить, что из равенства ЕD) — — Е(" во внутренних точках проводника вытекает существование па любой замкнутой поверхности S единст- венной плотности тока, которая обусловливает во всех точках внутри Л поле, создаваемое источниками, находящимися вне S. Аналогично из рассмотрения случая, когда граница идеального проводника, на которую падает излучение, является бесконечной плоскостью, следует, что в любой плоскости существует единственная плотность тока, которая обусловливает на одной стороне этой плоскости поле, создаваемое источниками, расположенными на другой ее стороне. В задачах о дифракции на идеально проводящих экранах существенно предположение, что они бесконечно тонки; если такое предположение не де- лается, то математические трудности значительно возрастают. Конечно, не- прозрачность экрана по-прежнему подразумевается, причем это означает, что экран — идеальный проводник, толщина которого стремится в пределе к нулю. Из всего сказанного выше можно сделать вывод, что действие такого экрана мы вправе уподобить действию листка электрического тока, с той разницей, что теперь этот листок уже не является замкнутой поверхностью. Особый интерес представляет относительно простой случай плоского листка. В этом случае сразу же можно вывести некоторые важные соотношения, которым удов- летворяют излучаемые этим листком поля Е№ и Ны. Полученные соотноше- ния приведены ниже. *) Доказательство единственности представляет некоторые трудности и откладывается до § 11.9.
516 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИИ [ГЛ. \\ Допустим, что листок тока занимает часть плоскости у = 0. Тогда из со- ображений симметрии ясно, что ?»(*, у, z) =.??(*, -у, г), Н?(х, у, z) = -#«{*, -у, z), \ Ef{x, у, z) = -Ef{x, -у, г), Hf(x, у, z) = Hf{x, -у, 2), \ {\) ?»(*, у, z) = ?«(*, —у, г), Hf(x, у, z) = -Hf(x, -у, г). ) Кроме того, если компоненты плотности тока в листке обозначить через Jx и Jх, то, очевидно, при у — 0 имеем tf? = =Ff-y,, Hf--=±^JX. B) Верхний или нижний знак берется в зависимости от того, обращается ли у в нуль со стороны положительных или отрицательных значений. В следующем параграфе рассматриваются приложения эгих простых соотношений к инте- ресной задаче дифракции на плоском экране и выводится полезная формула, которая, в частности, служит доказательством существования точной электро- магнитной аналогии принципа Бабиие. § 11.3. Дифракция на плоском экране; электромагнитная форма принципа Бабине Предположим, что электромагнитное поле Е(", Нн> падает на систему бесконечно тонких идеально проводящих пластинок, лежащих в плоскости у = д. Пусть М обозначает часть этой плоскости, занятую металлом, & А — оставшиеся «отверстия». Таким образом, М и А вместе составляют полную плоскость. Как каждая часть (М или А), так и обе они могут иметь бесконечные размеры. Как указывалось выше, ищется дифрагировавшее поле, которое удовлет- воряет определенным граничным условиям на М. Однако из A1.2.1) следует, что если известно в явном виде условие непрерывности при переходе через А, то необходимо рассмотреть дифрагировавшее поле только в одном из полу- пространств у'^0 или у^О. Следовательно, нашу задачу можно сформулиро- вать так: в полупространстве г/^0 (или г/^0) требуется найти электромагнит- ное поле E(s), Hl4), создаваемое токами в плоскости у ~ 0, для которого (а) ?? + ?<?> = ?<.'>+ ?<*> = 0 на Л/1; (б) Я? = Я?> = 0 на А. Здесь (а) — основное граничное условие для идеального проводника, тогда как (б), следующее из A1.2.2),— удобный способ выразить отсутствие в А индуцированных токов. Если (б) удовлетворяется для дифрагировавшего поля в области г/^0, а для его определения к области г/г^О используется A1.2.1), то выполняется условие непрерывности при переходе через А. Теперь легко вывести принцип Бабине для электромагнитных волн и иде- ально проводящих экранов в точном виде [18, 19]. Как и при классическом изложении принципа (см. п. 8.3.2), здесь устанавливается соотношение между соответствующими полями в присутствии основного экрана и «дополнительно- го» экрана, полученного путем замены проводящих топких пластинок отверс- тиями; различие заключается в том, что падающее на дополнительный экран ноле отлично от того, которое падает на основной экран, и получается из него преобразованием Е—> Н,
§ 11.4] ДВУМЕРНАЯ ДИФРАКЦИЯ НА ПЛОСКОМ ЭКРАНЕ 517 Пусть при у>0 поле (индекс 1), падающее на основной экран, равно E<f> = F">. Тогда из (а) и (б) находим: (а') ?й = — F$, ?<й = — F'J> на М, (б') Я(» = Я'Й = 0 на А. Пусть поле (индекс 2), падающее на дополнительный экран, равно Hf=s — Fi0. Теперь выразим граничные условия через полное поле: (а") ?м = ?22 = 0 на А, (б") Я« = ^*, H2z = Ff на М. Так как уравнения Максвелла в вакууме инвариантны относительно пре- образования Е—> Н, Н->- — Е и так как имеется единственная поверхностная плотность тока в плоскости у — 0, которая вызывала бы падающее поле во всех точках г/^0, то из сравнения (а') и (б') соответственно с (б") и (а") ясно, что в полупространстве позади экрана Н, = -Е?>. A) Используя полное поле Еи получим из A) El + H2 = F«>. B) Это и есть электромагнитная форма принципа Бабине, § 11.4..Двумерная дифракция на плоском экране 11.4.1. Скалярная природа двумерных электромагнитных полей. Двумерной задачей называется такая задача, которая совершенно не зависит от какой- нибудь одной декартовой координаты, например от г. Как отмечалось выше, такие задачи в электромагнитной теории существенно скалярны, так как в них входит одна переменная. Сейчас это будет показано. i Отбросив временной множитель ехр (—1ш() и написав k = со/с, можно привести уравнения Максвелла в вакууме к виду rot H = — ikh, rot E = iktt. Приравнивая нулю все частные производные по г, разделим эти уравнения на две независимые группы, а именно «. = **„ %.— ш„ ^ и -3-^ = — ikEx, s^ — ikE,., ~ ^ — ikff,. B) ду х дх У дх ду г *• ' В первую группу входят только Нх, Hv и Ег, во вторую — только Ех, Ev и Н2. Поэтому можно добиться упрощения, разделяя произвольное решение на линейную комбинацию двух решений, у которых каждый член одной из ука- занных выше групп равен нулю. Охарактеризуем эти два типа полей следую- щим образом: Е-поляризация р /г__д/'_п и L d?z и __ _I_ dEz * У г ' " ik ду ' У ik дх ' и, как очевидно, подставляя Я, и Я, в третье уравнение A)-, получим
518 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИИ [ГЛ. 11 Здесь полное поле выражается через компоненту Ez, которая, конечно, удов- летворяет двумерному виду обычного волнового уравнения, Н-поляризация и дх ' х ik ду ' У ik Здесь полное поле выражается через Нх. 11.4.2. Угловой спектр плоских волн. Как было показано выше, в случае двумерных задач, которыми мы ограничиваемся, декартовые компоненты век- торов Ей Н удовлетворяют уравнению дх* Это уравнение должно решаться при соответствующих граничных условиях. _ Основное элементарное решение О4 а) В) Рис. 11.2. Плоская волна, описываемая соотноше- нием D). а—однородная плоская волна при ^ шсстреином а, пунктирные линии обо пачгют плоскости равных ампли- туд и равных фа.ч 6-неоднородная к ^ск^я нолпа при КОМПЛеКСНОМ U СИ К ШНЬЮ „-ЦШП1 4 Г ! I' I .И I ЛОСКОСТН равных амплит>д, пунктирппе juihui -плоскости равных уравнения C) имеет вид exp [ikr cos (8—ос)] =. =¦ exp [ik (х cos а, + у sin a)], D) где г и 0 (Osg: 6 < 2я)—полярные координаты, связанные с х и у уравнениями x=rcos9 и у — =r sin 0,а а—угол между направ- лением распространения волны и осью л; (рис. 11.2, а). При вещест- венном а выражение D) представ- ляет плоскую однородную волну, т. е. такую волну, у которой пло- скости равных амплитуд и равные фаз совпадают. Если же ее ком- плексно, выражение D) пред- ставляет неоднородную плоскую волну, т. е. такую волну, у которой плоско- сти равных амплитуд и равных фаз не совпадают. Действительно, обозначив а= «1 + Ю2> гдессх и <ха вещественны, получим вместо D) exp [ikr cos (в—а.}] =ехр [ikr ch cc8 cos F—at)] exp [—kr sha2sin@—at)]; E) отсюда следует, что плоскости равных амплитуд и плоскости равных фаз вза- имно перпендикулярны (рис. 11.2,6). Направление распространения фазы составляет с осью х угол аь причем фазовая скорость уменьшается в seen аг раз. В перпендикулярном направлении имеет место экспоненциальное ослаб- ление, определяемое коэффициентом &slitx2. Теперь покажем [20], что при соответствующем выборе пути интегрирова- ния и подходящем выборе функции /(а) любое решение C) можно представить в виде углового спектра плоских волк С / (a) exp [ikr cos{6-^a)] da. Такое представление тесно связано с представлением произвольной функции с помощью интеграла Ф^рье и подобно последнему широко используется в при- ложениях. Без значительной потери в общности можно задать некоторый фик- сированный путь интегрирования и тем самым свести любую задачу к отыска- нию соответствующей функции Да). Представим сначала таким образом элект- ромагнитное поле, создаваемое плоским листком тока, а затем покажем, что
"•§ П.4] ДВУМЕРНАЯ ДИФРАКЦИЯ НА ПЛОСКОМ ЭКРАНЕ 519 это приведет нас к формулировке задачи дифракции на плоском экране в виде дуальных интегральных уравнений. Рассмотрим двумерный листок тока в плоскости у = 0. Как уже отмеча- лось выше, удобнее иметь дело отдельно с Е-полярм.чацией и Я-поляризацией. Сначала рассмотрим первый случай, когда плотность тока имеет только г-ком- поненту, допустим J%. Попытаемся выяснить, при каком особом распределении появляется f-поляризованная плоская волна Е = @, 0, l)exp[(?rcos(9—ее)], Н = (§та, —cosa, 0}ехр [ikr cos(9 — a)] F) в полупространстве.!/ >0. Из первого соотношения A1.2.2) сразу же видно, что в точке (|, 0) J^(|) = — -|^ exp (Щ cos a) sin a. G) Это конечно, можно проверить обычным методом потенциа- лов Герца, находя поле, создаваемое данным распределе- нием тока, но тогда придется вычислять достаточно слож- ный интеграл. Итак, вообще говоря, можно создать любое распреде- ление тока путем соответствующей суперпозиции выраже- ний G) для разных значений а, а возникающее поле мож- но получить соответствующей суперпозицией плоских волн F). Более точно, допустим,что плотность тока можно записать в виде интеграла Фурье Рис. П.3. Путь ин- тегрирования С а комплексной а-пло- ско^ти. = — ?; J Замена переменной \i = cosa дает Jzi%) — ^Л sinаР (cosа) ехР ('*?cosa (8) (9) где С—путь в комплексной а-плоскости, вдоль которого cos а изменяется {принимая только вещественные значения) от оо до —оо (рис. 11.3). Результи- рующие не равные нулю компоненты поля равны, следовательно, у Ef = \р (cosa) exp {ikr cos (9 =F a)] da, A0) с Hf = ± J sina.P (cos a) exp [ikr cos (9 =F a)] da, A1) Hf = — \ cos aP (cos a) exp [i?r cos (9 =F a)] da. A2) аПраВС Верхний знак берется для г/^0, нижний — для Уравнения A0), A1) и A2) представляют поле в виде спектра плоских волн, определенного с помощью пространенияоднород™х Функции Р (cosa). Отдельные плоские волны, соответ- воли, излучаемых в полупро ствующие части пути С вдоль вещественной оси, одно- странство {/>0 (сплошные родиы и излучаются в области г/>0 и </<0; в каж- линии) и в полупространство дой обЛасти направления их распространения лежат и у<0 (пунктирные линии). предслах угла я ^рис. 1L4). Плоские волны, соответ- ствующиедвум частям С, для которыхес = г|5 па = я—ф (от р ^-Одо р =со), неоднородны; для них распространение фазы происходит вдоль положительного или отрицательного направления осих, н имеет место экспоненциальное ослабле- ние волны в направлении, нормальном к плоскости -у = 0, Легко показать.
520 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИИ [ГЛ. 11 исследуя поведение вектора Пойнтинга, что в среднем ни одна из этих исчезаю- щих: волн не переносит энергии от плоскости у = 0. Наличие таких волн необ- ходимо для учета структуры в распределении тока, которая мельче длины волны. В случае Я-поляризации поле, созданное током с плотностью тока Jх на у = 0, можно аналогично записать в виде $()p[()]cfct, A3} с Ef =— J sin aP (cos a) exp [ikr cos@ 4=a)] da, A4) с E^> = ± J cos aP (cos a) exp [tfo- cos (9 =F ra)] «(a. A5) с Верхний знак берется для г/^0, нижний — для у^.0, причем 11.4.3. Формулировка задачи через дуальные интегральные уравнения. Теперь мол-ню сформулировать двумерную задачу дифракции на плоском экране через дуальные интегральные уравнения. +f Допустим, что электромагнитное- О "О* поле Еш, Но> падает па систему беско- нечно тонких идеально проводящих полосок, лежащих в плоскости г/ = 0; Рис 11.5. Путь интегрирования от—оо до обозначим через Л1 область изменения + оо в комплексной и-шюскости. F л л -i-^ojw г ^ занятую металлом, а через Л — об- ласть, свободную от металла. Если рассеянное поле EKS), Hu> представить с виде углового спектра плоских волн в форме A0), A1) и A2) или A3), A4) и A5) в соотвегствии с типом поляризации, то условия (а) и (б)„ ьрнведенные в § 11.3, дают следующие интегральные уравнения: Е -поляр изация = — Ef на М, ^ Р(ц) exp (ikx\i)dp = 0 на Л. A8) — СО И-поляризация (О \ Ef на М, A9) со J ~j°(M) &хр(<&сц)Ф=° на Л. B0) Анализ отображения части комплексной плоскости а от Rea - 0 до Rea = п на всю комплексную плоскость |х (jx — cosa) показывает, что плть интегриро- вания вдоль вещественной оси огибает возможные точки ветвления при \i = +1 (рис. 11.5). Интегральные уравнения такого типа, в которых одна неизвестная функция Р(р-) удовлетворяет различным уравнениям в двух разных областях изменения параметра х, называются «дуальными» 17]. Методы Копсона, Швингера и др , о котором упоминалось в § 11.1, отли- чается от приведенного выше только тем, что в нем используется одно интег-
§ 11.5] ДВУМЕРНАЯ ДИФРАКЦИЯ ЦЛОСКОЙ ВОЛНЫ НА ПОЛУПЛОСКОСТИ 521 ральное уравнение. Хотя их метод здесь и не применяется, следует отметить его связь с предлагаемым методом. Например, в случае ^-поляризации реше- ние A8), полученное с использованием преобразования-Фурье, можно записать в виде Р(ц)= J- Гу,(Е)ехр(—ift|*g)d?, B1) м конечно, в согласии с уравнением (8) и с тем, что /г-A) =0 на А. Подставляя это значение Р (\х) в A7) и интегрируя по \i, получим интегральное уравнение на М, B2) содержащее функцию Хенкеля Я(ох) первого рода нулевого порядка; оно долж- но быть решено относительно /г(|). Очевидно, левую часть B2) можно вывести непосредственно из соотношения для дифрагировавшего поля, выраженного через плотность индуцированного тока. § 11.5. Двумерная дифракция плоской волны на полуплоскости 11.5.1. Решение дуальных интегральных уравнений для случая ?-поля- ризации. На нескольких последующих страницах дифракция плоской волны на полубесконечном плоском листке рассматри- вается строго с помощью простого точного реше-) ння соответствующих дуальных интегральных- уравпений. Рассмотрим сначала 5-поляризованную пло- скую волну Ef = ехр [— ikr cos F—се0)], A) падающую на идеально проводящую полуплос- кость у — 0, х>0, где для удобства предпола- гается, что к„ вещественно и 0<ас<л (рис. 11.6). Уравнения A1.4.17) и A1.4.18) запишутся тогда в виде О p,1IA Щоская дающая на идеально провд щую полуплоскость. ехр (i/гхц) d\K = — ехр ( при х> 0, B) P ((i) ехр (ikx\x) d\i—Q при х < 0, C) где p,0=cosa0. Воспользуемся для их решения обычной техникой контурного интегрирования. В интеграле в левой части уравнения C) х отрицательно. Следовательно, согласно лемме Иордана [201 и при условии, что Р(ц)->0, когда [|а|->оо и ССЗ= arg \C$i—л, мы можем замкнуть путь интегрирования бесконечной полу- окружностью ниже вещественной оси, не внося никакого дополнительного вклада в интеграл. Таким образом, дальше необходимо только потребовать отсутствия у Р (|х) сингулярностей в полуплоскости ниже пути интегрирования, чтобы уравнение C) удовлетворялось, так как в этом случае интеграл берется по замкнутому контуру, внутри которого подынтегральное выражение ре- рулярно. Аналогично в интеграле левой части уравнения B) х положительно и можно замкнуть путь интегрирования бесконечной полуокружностью выше вещественной оси, не внося дополнительного вклада в интеграл при условии»
522 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИЙ [гл. 11 что P(\i)lV\—ц2->0, когда |ц|->оо и n^arg^t^O. Тогда, если U(\i) — произвольная функция, свободная от сингулярностей в полуплоскости выше пути интегрирования, с соответствующим поведением там при |[г|->-оо, то, очевидно, B) удовлетворяется при 1 U (ц) 1 2» У (—Но) (f*+f«o) Dv если путь интегрирования огибает полюс [х =—ца снизу, как показано схема- тически на рис. 11.7. Действительно, единственная возможная сингулярность функции в правой части уравнения D) — это полюс при \х = —[х0 с вычетом, ран- ным— 1/Bш), а по теореме вычетов Коти это как раз дает в интеграле B) член —• +1 ехр(—г/Ьф.о). . ,-+-, Переписав теперь D) в виде Рис. 11,7. Путь интегрирования в ком- плексной A-плоскости. можно доказать, что правая и левая ча- сти E) постоянны. Левая часть свободна ¦от сингулярностей в полуплоскости ниже пути интегрирования и по абсолют- ной величине возрастает там до бесконечности, тогда как правая часть ведет себя таким же образом в полуплоскости выше пути интегрирования. Следова- тельно, функция, с которой совпадают обе части, свободна от особенностей и > абсолютная величина ее возрастает до бесконечности на всей комплексной ^.-плоскости, значит, такая функция должна быть полиномом, а так как для некоторых значений arg|x величина Р(ц)-> 0 при ][х |—>-оо, этот полином может содержать только постоянный член. Значение его сразу же можно найти, если положить ц-—ц0 в правой части E); тогда "' —¦ F) или P(cosa) sin — <х0 s- 4 cos а 4- cos а0 G) О значении симметрии G) относительно а и а0 говорится в конце п. 11.7.1. Используя величину P(coscc), определяемую G), найдем из соотношени . A1.4.10), A1.4.11) и A1.4.12) компоненты дифрагировавшего поля и, следова- тельно, для полного поля получим ?g == ехр [— ikr cos (б—a0)] — [ikr cos (вц: a)] da. (8) -ja<>) sm( Y cos a -|- cos a0 Верхний знак берется при у>0, нижний—¦ при y<iO, Теперь остается придать полученному решению более удобную форму. 11.5.2. Выражение решения через интегралы Френеля. Если kr велико, т. е. если расстояния от начала координат порядка длины волны или больше нее, можно попытаться вычислить интегралы общею вида P (cos a) ехр [ikr cos (9 — a)] da (9) методом наибыстрейшего спуска (см. приложение 3). Предварительная проце- дура в этом методе заключается в замене пути интегрирования (сейчас в подын-
§ 11.51 ДВУМЕРНАЯ ДИФРАКЦИЯ ПЛОСКОЙ-ВОЛНЫ НА ПОЛУПЛОСКОСТИ 523 тегральном выражении допускается существование любых сингулярностей) на путь наибыстрейшего спуска, например S F), проходящий через седловую точку при а = 9. Путь 5(9) показан на рис. 11.8. Вдоль него новая переменная T = J/Texp D-»'")sin-|-(a — 9) A0) пробегает все вещественные значения от —сю до +оо. Тогда интеграл (9) при- нимает вид Р(соза) - exp (—in;') dx. A1) V2 exp ( — -j т \ exp (tkr) Отсюда можно получить асимптотическое приближение для Применение такого метода к специальному интегралу в (8) позволяет фак- тически без приближений получить его , выражение через интегралы Френеля. Сейчас это будет показано. Рассмотрим сначала случай 0<6< <я. Так как G) можно ^представить в виде .P(cosa) = <= -;— tsec-^-ia—а.)—sec ¦*¦(а4-а„)\ , A2) то достаточно вычислить \ sec-2"(a—а„) exp (ikr cos (8—a))da, 5 <8' Рис. 11.8. Путь наибыстрейшего спуск» A3) S (в) в комплексной а-плоскости. поскольку вклад от sec -j (а + а0) можно затем найти, изменяя знак а0. Простое преобразование A3) дает I sec-g-(a—cso + 6)exp (ikr cos a) da =, = j \ |sec-2-(a— ao + 6) + sec -g-(a + a0— S) > exp (йг cos a) da— 1 f l \ _"' \ Li L exp (('A/- cos a) da; — " J cosa+cos(a0—6) SCO) 5@) S@) применив подстановку получим где Но -2ехр(|«я)ехр(^)т, A5) -i-(e— a0). exp (-
524 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИИ [гл. И откуда, умножая на ехр (гт|2!) и интегрируя по | от kr до бесконечности, по- лучим ] A6) Обозначая через ™ F (а) = ^ ехр (,>•) й!ц A7) а одну из форм комплексного интеграла Френеля *), находим Л j ^Е^ Л = ± 2 Кя ехр (- ttn,») ^ {± т) /М- A8) Верхний знак берется при т]>0, нижний — при т)<0. Объединяя эти результаты, имеем окончательно для exp[ifercos(8 — a)]da = Г sin T L \ ^ SF) expf — — ш __.- |exp[—^ cos F—«<,)]/=' [K*rcosi-(e—a0)] q= Texp[— ikr cos (e + ao)]f [± K^F cos 1F + oto)j J-, A9) где верхний знак берется для 6+ао<я, а нижний — для 0 + ао>л. Для того чтобы получить из (8) полное поле, остается только учесть простой полюс при а = л — а0. Поскольку О^О^я, легко показать, что при замене пути С на путь S F) части на бесконечности не вносят вклада б поле, и из рис. 11.8 ясно, что полюс захватывается тогда и только тогда, когда я—ссо>9. Его вклад, полученный по теореме вычетов, равен ехр [— ikr cos (d+aj]. B0) Другими словами, он представляет отраженную волну геометрической оптики, разрыв которой при переходе через 9 = л — аа точно уравновешивается разры- вом в дифрагированном поле A9). В самом деле, применяя соотношение F(a) + F(— a) = J/?exp (\i*)-> B1) мы можем записать полное поле (8) в виде mj \ cos у (9- | mj ^ ^ в^ (е_дЛ] р \- — ехр[—(^cos(e + a0)]y;'[-j/2^:cosi-F+a())]|, B2) что совпадает с известным результатом Зоммерфельда. Когда z/<0, вычисляемый интеграл равен С sin ( ^-a»j sm(T a) *) Эта форма интеграла Френеля здесь более удобна, чем форма (8.7.12) Следует отметить изменение пределов интегрирования.
§ 11.5J ДВУМЕРНАЯ ДИФРАКЦИЯ ПЛОСКОЙ ВОЛШД НА ПОЛУПЛОСКОСТИ 525 Соответствующий путь наибыстрейшего спуска теперь имеет вид SBn—-9), и захват полюса при а —я — а„, который имеет место только при 9>л + а„» приводит к выражению, соответствующему падающей волне со знаком минус. Полное поле опять определяется выражением B2). Соответствующие соотношения для компонент Н получаются просто диф- ференцированием, как показано в п. 11.4.1. Представляют интерес как де- картовы компоненты Нх и Нч, так и полярные компоненты Нг и Не. Ввиду того, что B2) выражено через г н 0, удобно сначала получить Нг и П% из урав- нений Максвелла а затем найти Нх и Ну из соотношений Нх = cos %Hr — sin 9//„ Я„ = sin QHr -f cos Aff0, Для получения более компактных результатов введем следующие обозна- чения: и = — У2k? cos -i- (9—а„), о = — V2krcos-L (9+«0), B4) G(a) = exp(— ia?)F(a). B5) Заметим, что Выражение B2) тогда принимает вид ехр ( —— in J ?г = v¦ * J exp(ikr){G(u)-G(v)}; B6) У я отсюда следует, что Нг = у= i- ехр (ikr) |sin (в—а„) G (и) - — sin (9+ ao)G (»)—( j/^-sin (y / 1 . \ — -j 1Л I ехр ( 1 {- 1 1 ¦ \ \ sin a0 [G (и) + G (»)] + cosa, [G (m)—G (v)] B8) 11.5.3. Характер решения. Теперь исследуем подробнее характер резуль- татов, полученных в п. 11.5.2. Из приведенного там вывода очевидно (и это можно прямо проверить), что G(u) exp (ikr) есть решение двумерного волнового уравнения при любом значении а0; здесь интересно отметить, что оно имеет
526 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИИ [гл. П периодичность 4я и, следовательно, G(u) — G(v) исчезает при 0 =0 и 6 = 2я, т. е. на обеих поверхностях экрана, но не исчезает при 9 — л. Зоммерфельд пришел к своему решению B2), пытаясь найти соответствующее решение вол- нового уравнения с периодом 4я и объединяя это решение с его «изображени- ем» *), Кстати, из B8) вытекает, что выражения COS. ir exp [ikr) Sin ( у I exp (ikr) также служат решениями двумерного волнового уравнения, и этот результат хорошо известен. Следует исследовать еще поведение B6) при г->оо. Это очевидно и будет в дальнейшем главной темой, обсуждаемой в данном разделе. Привлекательной чертой задачи с полуплоскостью является то, что в лю- бой точке поле можно найти, пользуясь таблицей интегралов Френеля **). Кроме того, в двух особо интересных случаях, а именно при kr^-l и kr^.1 при- годны простые приближения к интегралам Френеля (см. п. 8.4.2). Первое усло- вие, без сомнения, всегда выполняется в оптических экспериментах, где точка наблюдения находится, вероятно, на расстоянии миллионов длин волн от дифракционного края; второе условие выполняется при изучении поведения поля вблизи острого края. Этот случай можно изучать на сантиметровых радио- волнах (см. п. 11.5.6). Случай 1гф>\. В данном случае \и\ и |у| велики по сравнению с едини- цей, за исключением значений 9, достаточно близких к я+ а„ и я—а0 соответ- ственно. Для определенности введем пять областей, как показано на рис. 11.9. Отражение I Рис 11.9. Пять областей, в которых описы- вается поведение поля при дифракции плоской волны на идеально проводящей полуплоско- сти. Теш Рис 11.10 Три области геометрической оп- тики при дифракции плоской волны на иде- альна проводящей полуплоскости. За уравнения кривых, ограничивающих области // и IV, примем соответст- венно и2 — 1 и v2 — 1. Следовательно, эти кривые имеют вид парабол с фокусами в начале координат и осями 9 —я + об„ и 6 — я — сс„. В глубине области // (т. е. внутри параболы и2 = е, где е<5с;1) |«!<<:1; далеко от области //(т. е. вне параболы и-—у, где у^>1) |и|^>1. Аналогичные соотношения получим и для \v | и области IV. Кроме того, при 0<9<я—сс0 как к, так и v отрица- тельно; при я — ао<0<я+аом отрицательно, но v положительно; при я + ао<9<2я как а, так и v положительно. Области /, /// и V, очевидно, тесно связаны с теми областями, которые появились бы в рамках геометрической оптики, где свет распространяется по прямым линиям. Перечислим их: область тени позади экрана, где поля нет совсем, освещенная область, где существует только падающая плоская волна и область отражения, где одновременно присутствуют падающая плеская волна и отраженная плоская волна, соответствующая отражению от бесконечного экрана (рис. 11.10). Вообще говоря, в областях // и IV осуществляется плавный переход от точного решения в одной области геометрической оптики к решению в соседней области. Прежде чем показать это более подробно, мы должны за- *) Хорошее представление об этом подходе можно получить из гл. 4 книги [16]. **) По-видимому, лучше всего "подходят для этой цели таблицы, приведенные в [21)>
§ 11.5] ДВУМЕРНАЯ ДИФРАКЦИЯ ПЛОСКОЙ ВОЛНЫ НА ПОЛУПЛОСКОСТИ 527 держаться, для того чтобы вывести асимптотическое приближение для интеграла Френеля при больших значениях аргумента. Если а положительно, можно написать дважды интегрируя по частям, получим Продолжая этот процесс и дальше, можно получить полное асимптотическое разложение для G(a), но сейчас нам важно заметить только, что модуль ин- теграла в последнем члене B9) меньше чем Отсюда имеем Здесь интересно отметить, что этот результат можно было получить и общим методом, описанным в н. 11.5.2, который в данном случае сводился бы к раз- ложению множителя (т.*— а]2) в подынтегральном выражении A8) в ряд по- степеням тик интегрированию каждого его члена. Если а отрицательно, то левая часть C0) расходится, но этот случай легко рассмотреть, используя B1) совместно с результатом, полученным для поло- жительных значений аргумента. Таким образом, ^ + 0(JL) . C2> То обстоятельство, что асимптотическое приближение C1) для положительного а и C2) для отрицательного а различны, есть частный случай явления Стокса [22]. Напишем теперь E где Е'Р — поле геометрической оптики, определяемое как ехр [— ikr cos (Э—сс„)] —ехр [— ikr cos (Э -\-а„)\ , Для 0<е< ¦°z | ехр [—ikr cos (в—а0)] для я—а0 < 8 < О для a ?'/' — поле дифракции, представляющее собой просто то поле, которое сле- дует добавить к полю геометрической оптики, чтобы получить полное поле. Теперь при kr^>l находим из B6), используя C1) и C2), — C4> в точках, не слишком близких к областям // и IV (в смысле, указанном выше). Легко видеть либо из B3), либо из B7), что в том же приближении, как и в C4), компоненты Н* равны #j>* =—E'zd> и Я<<° =0. Очевидно, C4) означает, что поле дифракции ведет себя так, как будто оно порождается линейным ис- точником, расположенным вдоль дифракционного края, с «полярной диаграм- мой», изменяющейся с углом, как было определено выше, Это находится в
528 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИИ [ГЛ. П согласии с экспериментальным фактом, что дифракционный край кажется светящимся, если он рассматривается из области тени. Когда cosO + cosa0 приближается к нулю, соотношение C4) становится неверным, и нужно обратиться к точному решению. Так как G@)= exp(«|i! = у V я ехр то из B6) следует, что при 6 = л + а„ а при 0 =л — а0 — Ег = ехр [ikr cos Bсс0)] —у ехр {ikr) + О C5) C6) C7) Следовательно, вблизи 0 = я ы. М°- и 9 = л — а0 поле дифракции имеет тот же порядок, что и падающее поле. В частности, в бесконечности переход между полями геометрической оптики в соседних областях происходит через их среднее арифметиче- ское. Интерференция йоля геометрической оптики с полем дифракции в областях, где они сравнимы, вызывает возникновение по- лос. Они видны на рис. 11.11, который будет обсуждаться ниже. Случай kr<^. 1. В данном случае \и | и \v ! малы по сравнению с единицей, и полезно использовать разложение в ряд интеграла Френеля. Напишем ~5 -4 -3 -г -1 О 1 2 3 4 Расстояние по оси ев в длинах вали Рис. ll.ll. Дифракция нормально па- вающей ^-поляризованной плоской долны единичной амплитуды на иде- ально проводящей полуплоскости. изменение f F.z \ в ^;j u йен мости от х на рас- стоянии трех длин волн позади экрана. разлагая экспоненту в подынтегральном выражении второго интеграла, получим 1 /— (\ \ ¦¦-w-y п ехр [-г- in —а 4- О (а2). {a)=\ ехр ((>3 i — ) ехр | о C8) - \. - / Таким образом, из B6) и B8) находим, пренебрегая членами с kr в степени, •большей половины, Et= 2 j/i- ехр (-^ы^УТг s\n (i-a.) sin (ye) , Bx = —sina,— у —ехр (—j- Ы sin (-g- \_L У kr C9) \ sin | yet,) sin I — ( x i — -(l4-2co5a0)j/*ri Необходимо отметить, что Ег конечно и непрерывно при г = 0, но Нх и Ну расходятся как /¦"'¦'•; исключение составляют случаи в— л, когда Вх = = — sin a0 ехр (ikr cos a0), а также 6 = 0, 0 = 2л, когда Я„= 0, Такое гюве-
§ 11.5] ДВУМЕРНАЯ ДИФРАКЦИЯ ПЛОСКОЙ ВОЛНЫ НА ПОЛУПЛОСКОСТИ 529 дсние функции, необычное для физических задач, является, конечно, след- ствием идеализированного представления о бесконечно остром крае. В этом случае существование сингулярностей у компонент поля должно быть учтено при формулировке любой теоремы, относящейся к единственности решения (см. ниже, § 11.9). Мы закончим наше исследование решения рассмотрением плотности тока, индуцированного в дифракционном экране. Она ривна произведению -—с/4л на разность значений Нх при 8 = 0 и 0 = 2л. Таким образом, из B8) находим „ exp I —j-1 — Jz = sin a0 exp (— ikx cos a0) ~=—- exp {ikx) x X J2 sin a0G [Vita cos (д <*„)] — j-j/j-sin (усе0)} . D0) При ]^2kx cos \-g a0 J §j> 1 последнее соотношение принимает вид ^ = ~sinaoexp(— (foe cosao)-f О {(kx)-''•}. D1) Полученный результат интересен тем, что он показывает ту степень прибли- жения, с которой величину плотности тока можно считать совпадающей с вели- чиной, получающейся в рамках геометрической оптики; это обычный метод в задачах, которые невозможно решить точно. Очевидно, что введенное выше допущение (т.е. V2kx cos (-g- a0 J ^> lj разумно только для значений сс„, не близких к я; оно имеет смысл потому, что при х-у<х «остаточный» член в D1) стремится к пулю, как х~"'', а не как х~ч Вместе с тем при \^2kx cos ( ехр (— | in усс0) \-j~ + 4 cos2 A аЛ Vkx\ exp {ikx) D2) и расходится на дифракционном крае. 11.5.4. Решение для Н-поляризации. Случай //-поляризации, когда па- дающее поле определяется выражением Я? = exp [— ikr cos (9—a0)], D3) можно рассматривать таким же способом, как и случай ^-поляризации; дей- ствительно, анализ оказывается практически идентичным. Вместе с тем пер- вый случай можно вывести из последнего с помощью точной электромагнитной Формы принципа Бабине, полученного в § 11.3, так как дополнительным экра- ном к полуплоскости Служит также полуплоскость. Очевидно, что полное поле определяется выражением ехр (— — Ы) . г , _ t = ^1 ' {ехр [- ikr cos (e-a,)] F \ — Vikr cos| @-ao)J + + exp[—i*rcos(9 +ao)]f[—]/2EFcos 1(9+ «,,)]}. D4) #*¦= Оно отличается от соответствующего выражения для Ег в случае поля с ?-поля- ризацией B2) только знаком второго члена.
530 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИИ [ГЛ. 11 Применяя обозначения, введенные в п. 11.5.2, получим для компонент поля, не равных нулю, выражения ехр ( — -г in ] Нг = yi ; ехр {ikr) {G (a) + G(v)\, ?,== у!—i- ехр (Йг) | sin ao[G («)—G(ti)] — ехр (¦—-г- Й1 ) / ,= у! ; ехр {ikr) {cosa0 [G («) + G (о)] — Несомненно, Ех исчезает при в = 0 и 9 = 2я, и для интерпретации поведе- ния поля при kr^> 1 снова можно воспользоваться полем дифракции (которое должно создаваться линейным источником, расположенным вдоль дифрак- ционного края) для точек, достаточно удаленных от 8= я—а, и 9=я-)-ао. Прн г-+ 0 Hz остается конечным и непрерывным, тогда как Ех и Еу рас- ходятся как г~ч'% исключением являются Ех= 0 при 6 = 0, 2s н Еу~ *=— cos а0 ехр {ikr cos а0) ири в —п. к Плотность тока определяется выражением 2ехр (— 4-i«) , ._ — Jx = ехр [—ikx cos «„] Ц= — ехр (ikx) G ( К2?лГ cos (-^ се0) ) . __ D6) При \f2kx cos (Ya») ^ ^ имеем * это выражение приближается менее быстро к плотности тока, определяемой геометрической оптикой, чем в случае ^-поляризации. При Y^2kx cos(-^aa j <^ 1 имеем ^х==~я V 7ГехР(—Т'11) cos \~2а<ч К^*ехр Это выражение обращается в нуль при ^ — 0, так что, как следовало ожидать, на самом крае не существует тока, нормального к краю. 11.5.5. Некоторые численные расчеты. Типичная теоретическая кривая, полученная из B6), приведена на рис. 11.11. Она построена для случая нор- мального падения f-поляризованной плоской волны единичной амплитуды и представляет собой график изменения амплитуды Ег в зависимости от х на расстоянии трех длин воли позади экрана {ky — — 6я). На рисунке отчет- ливо видны дифракционные полосы в освещенной области и постепенное ос- лабление поля в глубине области геометрической тени. Несколько интересных расчетов было выполнено Браунбеком и Лаукие- ном [23]. Они построили кривые разных амплитуд (рис. 11.12) и кривые рап- ных фаз (рис. 11.13) компоненты Нг для нормально падающей //-поляризо- ванной плоской волны единичной амплитуды на расстоянии от дифракционного
§ 11.5] ДВУМЕРНАЯ ДИФРАКЦИЯ ПЛОСКОЙ ВОЛНЫ НА ПОЛУПЛОСКОСТИ 531 края, приблизительно равной одной длине волны. Они рассчитали также линии среднего потока энергии (рис. 11.14), ортогональные к линиям равных фаз. Рис. 11.12. Линии равных амплитуд компоненты Hz при дифракции нормально падающей й-поляризованной плоской волны на идеально проводящей полуплоскости [23]. Амплитуда падающей волны принята за единицу. Легко показать, что наеденные результаты справедливы для любого двумер- ного поля с //-поляризацией. Надишем Hz= he'f, где h и tp вещественны; тогда, используя соотношения Р ^ дН z jr. I dHg х ik ду ' У ik дх ' волучим, что усредненный вектор Пойнтинга (см. A.4.56)) -ЕХЩ,О), равный 8я k \дх ' ду' D9) перпендикулярен к поверхности <р = const. Аналогичный результат получается и для поля с ^-поляризацией. 11.5.6. Сравнение с приближенной теорией и с экспериментальными ре- зультатами. Для точек, находящихся на большом расстоянии от дифракцион- ного края в освещенной части области // (см. рис. 11.9), там, где видны поло- сы, можно пренебречь вторым членом в каждом из решений B2) и D4). Таким образом, интенсивность как при ?-полярнзации, так и при Я-поляризации, а
s о Рис 11.13. Линии равных фаз компоненты// z при дифракции нормальна падающей Я-поляризованной плоской волны на идеально проводящей по- луплоскости [23]. Рис. 11.14. Линии среднего потока энергии при дифракции нор- мально падающей Я-поляризованной плоской волны на идеально проводящей полуплоскости [23].
§ 11.6] ТРЕХМЕРНАЯ ДИФРАКЦИЯ ПЛОСКОЙ ВОЛНЫ НА ПОЛУПЛОСКОСТИ 533 следовательно и интенсивность неполяризованного света, запишется в виде т{т+*[ С04(еЧГ+{+^ [2 / 2 /гС04(е-ЧГ+т{т+^ [2 /т <50) где X — длина волны света, а % и <?f— интегралы Френеля с косинусом и си- нусом, определенные (8.7.12). Это следует сравнить с аналогичным результатом (8.7.28) для черной полуплоскости в теории Френеля — Кирхгофа. Отсюда действительно можно сделать вывод *), что первый член точного решения для дифракции на идеально проводящей полуплоскости можно считать решением для черной полуплоскости. Далеко от границы в области тени / поле с ^-поляризацией определяется выражением C4), т. е. Аналогично можно показать, что поле с .Я-поляризацией имеет вид Я,,- /Г еХр (U») C°S ^") C°S ^ -^ . E2) г г л F V4 / cos а0 + cos 6 Ykr Следовательно, соответствующее отношение «силы» полей равно Е-поляризация , /^ 1 ^ , / 1 «N Н-аоляризация = 8 ^Та° J g I.T / ' и, значит, падающий неполяризованный свет также становится при дифракции частично поляризованным. Этот результат находится в хорошем согласии с оптическими экспериментами [15, 24]. Развитие микроволновой радиотехники открыло широкие возможности для экспериментального изучения дифракции электромагнитных волн. В част- ности, появилась возможность использовать дифракционный экран, значи- тельно лучше приближающийся к идеализированной идеально проводящей полуплоскости, чем те, которые удается реализовать в оптических измерениях. Кроме того, в микроволновой области легко исследуются поля в непосредст- венной близости к краю дифракционного экрана. Был проведен ряд измерений, главным образом на длине волны около 3 см, которые показали хорошее сог- ласие теории и эксперимента [25, 261. § 11.6. Трехмерная дифракция плоской волны на полуплоскости В § 11.5 была решена задача дифракции на полуплоскости произвольной плоской волны, было введено одно только ограничение, а именно, волна долж- на была распространяться в направлении, нормальном к дифракционному краю. Сейчас будьт показано, как простой прием позволяет paenpociранить полученные выше результаты па полностью произвольно падающ)ю плоск\ю волну. Допустим, что падающая плоская волна характеризуется фазовым мно- жителем ехр (— ikS) = ехр [— ik (x cos a cos р + у sin а cos $ -\~ г sin |3)], A) где, как и раньше, идеально проводящий экран занимает полуплоскость у — О, х>-0. Углы « и р, определяющие направление распространения волны, по- казаны на рис. 11.15. *) См. обзор [161,
534 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИИ [гл. И Отметим, Ч1о соотношение A) получается из двумерной формы, соответ- ствующей р = 0, при замене k на k cos р1 и умножении на схр (—ikz sin f>). В самом деле, этог метод, применимый к любому двумерному решению волно- вого уравнения dxi B) очевидно, позволяет получить решение и трехмерного волнового уравнения где г входит только через множитель ехр(—ikz sin ft). Кроме того, если U — такое решение C), то легко показать, что два электромагнитных поля, удовлетворяющих уравнениям Максвелла, имеют вид D) E) Pec 11.15. Направление рас- пространения падающей плоской волны. При р = 0 D) определяет двумерное поле с ^-поляризацией, E) — поле с .Я-поляризацией. Если мы будем считать, что U имеет вид A), то D) и E) дадут соответст- венно две плоские волны Е = (— cos a sin р, Н = (— sin а, cos а, sin а sin p\ cos P) exp (—ikS), О)ехр (— ikS), в E = (sinqc, —cos а, 0) exp (—ikS), \ Н=(—cosa'sinp, —^sinptsinp, cosP)exp(—ikS). j О Здесь множитель cos |3 везде опущен. Итак, любая плоская волна, изменяюща- яся в пространстве в соответствии с A), определяется двумя компонентами Е (или Н), так как третья компонента определяется уравнением div E — 0 (или div H=0). Следовательно, любую плоскую волну можно получить соответ- ствующей суперпозицией полей F) и G); поэтому в дифракционных задачах без потери общности можно ограничиться двумя случаями, относящимися к таким падающим полям. Теперь должно быть ясно, что решение дифракционной задачи определяет- ся соотношениями D), если падающая волна определяется уравнениями F); ври этом U получается из известного выражения для Ег sec C в двумерном слу- чае заменой k на k cos р и умножением на ехр (—ikz sin P). Действительно, условие U = 0 на полуплоскости у = 0, х>() предполагает также, что там и oUldx = 0; следовательно, из D) находим, что на экране ЕХ= Ez= 0, как к 1>ебуется. Используя A1.5.24) и A1.5.26), получим в явном виде ехР — т' secpexp [«/fe(rcosP—zsinP)] \0(p)—G (q)}. (8)
§ 11.7] ДИФРАКЦИЯ ВОЛН НА ПОЛУПЛОСКОСТИ 535 = —l/2ftrcospcosy@—a), q = — у 2kr cos р cos у (в + а% (9) Таким образом, согласно D) имеем 4") ехр I Ег= Цп?—^cospexp [/*(/¦ cosр—2 sin p)] {G(p) — G(q)}, ( l • ехр I —Tln Я, = —=—^-exp \ik (r cos в—2 sin Р)] х Г я X ехр (—-гin) {sine [G (p) + G (</)] + i |/i7|FpSin 4-a cosl в} , ехр [гй(/-cos р—2sinP)] х (•10) При р = 0 выражения A0) сразу же превращаются в соответствующие выра- жения A1.5.26) и A1.5.28). Аналогичный результат можно получить таким же образом и в том слу- чае, когда падающая волна определяется G). Соответствующим двумерным решением при этом является решение для Я-поляризации, а именно выражение A1.5.44) для Hz. Поэтому, как уже отмечалось, можно получить решение для совершенно произвольной падающей плоской волны. Кроме того, простое обобщение аргументов, приведенных в п. 11.5.2, показывает, что поле, возни- кающее при любом распределении источников, можно представить в виде спектра плоских волн. Следовательно, в принципе, решение дифракционной задачи при любом распределении источников можно найти из решений задач для отдельных плоских волн. Ниже рассматриваются два интересных случая; линейный источник, расположенный параллельно дифракционному краю {двумерная задача), и точечный источник. § 11.7. Дифракция волн, испускаемых локализованным источником, иа полуплоскости 11.7.1. Линейный ток, параллельный дифракционному краю. Рассмотрим линейный источник, находящийся в точке Т с координатами (г0, 0„), где 0^ ^905Сл,, и излучающий в вакууме ^-поляризованную цилиндрическую волну вида Е? = /f ехр(i-te) Я?' Здесь Н^— функция Ханкеля первого рода нулевого порядка, a R —¦ рас- стояние, измеряемое от Т (рис. 11.16). Фактически источник представляет собой электрический ток, протекаю- щий через Т параллельно оси г и осциллирующий везде с одинаковой фазой. Хорошо известно, что A) является основным решением двумерного волнового уравнения, определяющим расходящуюся волну, зависящую только от ради- ального расстояния. Записывая A) в виде углового спектра плоских волн, мы в сущности ис- пользуем интегральное представление функции Ханкеля (см., например, [27]).
536 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИИ [ГЛ. 11 предложенное Зоммерфельдом. Так как мы требуем, чтобы каждая плоская волна спектра достигала экрана, то следует рассматривать это представление в полупространстве у<.г„ sin Эо, т. е. - J exp[tfw0cos(eo—a)]exp[—f*rcosF—a)]da. B) Здесь выбран специальный путь интегрирования S( у л j, так как (помимо того, что он справедлив для всех точек (/<Л> sin 0„) он параллелен пути наибыстрей- шего спуска, что удобно в последующем исследовании Фазовый множитель ехр {jfer0(cos9o— а)} появляется в подын- тегральном выражении B) потому, ч^о все плоские волны спектра должны иметь пулевую фазу в Т Таким образом, очевидно, что реше- ние дифракционной задачи для падаю- щего поля A) получается из решения для падающего поля ехр {—ikr cos @— а)} умножением на множитель ехр (-? ш) — \ ехр [ikra cos @0 —a)] C) Рис. II 16 Взаимное расположение линей- ного источника Т и дифракционного экра- на, занимающего полуплоскость. и интегрированием по а по пути S[ -к я I • Теперь, как уже было показано в § 11.5, решение для падающего поля ехр {—ikr cos (Q—ее)} можно записать в виде (индекс р указывает на то, что падающая волна плоская), где Е'?ю дается вы- ражением A1.5.33), а (см. A1.5.19)) -ехр (iftrcosp)dp. S@) cos a+cos (9 + E) Преимущество такого представления Е(грЛ (вместо представления в виде ин- тегралов Френеля) состоит в том, что, как мы скоро увидим, здесь отчетливо проявляется симметрия относительно а и J3. Решение для падающего поля A), таким образом, имеет вид •~' ехр (i- ?'"«> ехр [ikra cos (90—a)] da + - (И С V~2n J Efd)exp[ikr cos(80—a)] da. F> Для того чтобы отделить здесь члены геометрической оптики от дифрак- ционных членов, путь инте! рирования по а во втором интеграле следует изме- нить на S(90). При таком изменении пути нужно учесть полюсы величины Ef', рассматриваемой как функция а; согласно E) они существуют при cos a = — cos (О 4- р1) для всех р на S@), Легко показать, что вклад вычетов,
§ 11.7] ДИФРАКЦИЯ ВОЛН НА ПОЛУПЛОСКОСТИ 537 комбинируясь с первым членом в F), даст члены геометрической оптики, т. е_ f j/i-л ехр (| in) {Н? (*Д)-Я« [kR')} | при 0 < в < я — 60> при я—е0 <е <я + о„, *. О при я + 9„ <6<2я, где R'— расстояние, измеренное от Т— изображения Т в плоскости у = 0 (см. рис. 11.16). Дифракционный член можно записать в виде У'™ г пУ~2я J J ее S<0) S@) X ехр [ik (г0 cos a + /• cos p)] da dp. (8) Его удобно представить следующим образом: ?<<" = <у. @U) — -^ (—gu)) /д\ где in.Ybt S@>s(O) Cos —(a+p + eo+6) 2 Окончательное преобразование должно свести ¦f (80) к однократному ин- тегралу. Умножая числитель и знаменатель подынтегрального выражения A0) на 4 cos у (а — р+0о+6) и отбрасывая часть, являющуюся нечетной функцией р, имеем _1 1 ехр (~ )/й sJ0) (Т) Г Г ( 1 т\—rl Заменим а во втором члене подынтегрального выражения A1) на — аи объ- единим два члена. Это дает I 1 ехр i — ТР- И г{с°4<е°+е)со5(-Нсоз(т^ S@)S@) X ехр [ik(r0cosa-i-r cosp)]\ dadp, A2) где JV = (cosa— l) + (cosP— 1) 4sin Произведя в A2) подстановки, применяемые в методе наибыстрейшего спуска & = yTexp(i.iji)sin(ia), т, = /Fexp ({ Ся) sin (lp),
538 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИЯ [ГЛ. 1 1 и написав i?i= ro+ r, получим { 1 • N ехр —т»я , )= \.rlz- ехр (ад,) cosf@o X Г f ¦ J^i2+2+2i (e+e)i2osi 2( cos2 —(9 8) Далее введем полярные координаты Тогда ехР( —"г1 Р. (И) О где ^ф. A5) Л"(р) можно вычислить обычным способом, полагая г = ехр((ф), когда путь интегрирования становится окружностью единичного радиуса и необходимо только найти вычеты окруженных полюсов. Таким образом, получим <г где ветвь квадратного корня лежит (для вещественных значений р) в четвертом квадранте комплексной плоскости. Следовательно, A0) принимает вид - (8„) =± у ~ ехр ( —-j- «я )ехр (i^) x pexpf- "'<17) Верхний знак оерется для cos ^(9о+9)>О, нижний — для cos-^- @о+в)<(Х Окончательно подстановка приводит к искомому результату, а именно да J ^^. A8) где верхний знак берется для cos-^-@o+0)>O, нижний — для cos-2-@o+6)<0. Так как падающее поле A) можно записать в виде член геометрической оптики G), комбинируясь с дифракционным членом
§ 11.7] ДИФРАКЦИЯ ВОЛН НА ПОЛУПЛОСКОСТИ 539 {19), даст для полного поля соотношение Е,= Т/Техр(—4-( где ' f г.__ 1 ¦(в.-в) = cos 1(9,— B1) | =F для cos -j<60 + 9)^0. j Это решение в виде B0) впервые дано Макдональдом f28], получившим его с помощью преобразования предыдущего решения, предложенного Карслоу [2]. Оно очень близко к решению, найденному Зоммерфельдом для падающей плос- кой волны, с которым оно совпадает, если после умножения на J/?roexp(—ikra) положить, что го-> оо. Решение для Я-поляризации отличается от предыду- щего только тем, что в уравнении B0) два члена складываются, а не вычита- ются. • Если kRt^>\, то в неэкспоненциальном множителе подынтегрального вы- ражения A8) \х можно заменить величиной его нижнего предела, после чего мы получим приближенный результат R')]. B2) Таким образом, используя соответствующее приближение для '%¦(—0„), можно представить поле дифракции в виде интегралов Френеля. Однако точность такого приближения недостаточна, если как источник, так и точка наблюдения находятся в пределах длины волны от дифракционного края. Далее, если k(Ri— R')^> 1» то можно воспользоваться асимптотическим приближением A1.5.31) для B2), и мы получим B3) аналогично, если k(Rt—R)^>\, то 1. . B4) Поэтому для всех точек, лежащих вне двух гипербол k (Rt— R') = 1 я k(Rt— R) = 1 с осями 0+00— я и 0— 0„= я соответственно, поле дифрак- ции совпадает с полем некоторого линейного источника, находящегося у диф- ракционного края. Эти гиперболы эквивалентны параболам для случая пада- ющей цилиндрической волны, которые рассматривались в п. 11.5.3 в связи с решением для падающей плоской волны. Наконец, следует обратить внимание на то обстоятельство, что решение B0) «обратимо» в том смысле, что оно не изменяется при взаимной замене переменных г0, 9„ и г, в. Это, конечно, частный случай общей теоремы взаим- ности [19], неявно содержащейся^ в уравнениях Максвелла. Проведенный
540 Строгая теория дифракции [гл. 11 анализ показывает, что в настоящем случае это связано с тем, что спектраль- ная функция A1.5.7) симметрична относительно а и а„. 11.7.2. Диполь. Простейшим точечным источником электромагнитных волн является электрический или магнитный диполь. Задачу о диполе в при- сутствии полуплоскости можно решить, представляя невозмущенное поле диполя как спектр (трехмерный) плоских волн и применяя результаты, найденные в § 11.6, к каждой плоской волне. Случай электри- ческого диполя с осью, перпендикулярной дифракционному экрану, разобран таким методом Сениором [29] и кратко анализи- руется здесь; другие методы разобраны в 130]. На рис. 11.17 показано (как и раньше в декартовых х, у, г и цилиндрических г, в, г координатах) взаимное расположение диполя и дифракционного экрана, занимаю- щего полуплоскость у=0, х>0. Диполь, находящийся в Г, с координатами (ха, у0, г0) или (Го, Эо, г0) параллелен оси у; Т'— изображение Т в плоскости у = 0, a R и R' — расстояние точки наблюдения Р от Т и 7" соответственно *). При подходящем выборе величины дипольного момента невозмущенное поле диполя (см. § 2.2) можно представить в виде Рис. 11.17. Взаимное расположение ди- поля, находящегося в точке Т, и диф- ракционного экрана, занимающего по- луплоскость. \дхдуду> JyOzJ' '°- —t B5) где п ехр(»Д) 11 —к 1П ¦ Требуемое решение "B5) в виде плоских волн получается из формулы**) J cospexp[—tt{(x-jOcosacosp + -f (t/—t/0) sin a cos p — (z — 2,) sin ft}] da dp. B7) Теперь поступают следующим образом: сначала записывают поле, возникшее в присутствии дифракционного экрана в результате падения на пего отдель- ных плоских волн, определяемых подынтегральным выражением в B7), а затем выполняют интегрирование. Учитывая последующее интегрирование, удобно использовать (см. E)) основные решения для падающих плоских воли в виде A1.5.8) (для ?'-поляри- зации) и соответствующий вид решений для //-поляризации. Эти выражения видоизменяют так, чтобы способом, изложенным в § 11.6, получить трехмерные решения, соответствующие падению плоских воли типа B7). Тогда компонента вектора Е, параллельная диполю, имеет вид B8) здесь Ef — поле геометрической оптики, а ?<«>=|-{Л(ео) + Л(-С -- (-. \дудуи \дуду„ B9) *) Р' — проекция точки Р на плоскость, проходящую через Т и 7" перпеБдикулярно границе дифракционного экрана. (Прим. ред.) **) Это непосредственно следует из формулы, приведенной в [31].
§ 11.7) ДИФРАКЦИЯ ВОЛН НА ПОЛУПЛОСКОСТИ 541 где 1 III S @) /1 \ S @) s(t») х exp [ik{r cos 7 cos Р +''о cos a cos E+ B—zo)sin{}}] dadfidy, C0) В(е°) = Е I S@) X exp [ik { r cos у cos p + r0 cos a cos p" + (z—zo)sinP}] dadfidy. C1) С помощью анализа, аналогично данному Карслоу [2] и Макдональдом [28], можно показать, что А (90) = -Д=. cos 1 (9 - 9.) Я?» (А/?,), C2) V "о J где г—г.)'; C3) ± для 9 — ео^я, C4) B( — е„) = ±яй ^ Wil>(Wch(x)d(x, ± для -е + О^я, C5) ±m' yF —eo)|, m' = Arsh {й-^р- cos -i (в + 90)| . C6) Эти результаты вместе с формулой =^2^ C7) позволяют переписать B8) в виде T(as&) C8) где Ф т ?= \ HFikRchtfdp, f'= I Hp(kR'ch\i)dp. C9) - m ~m' Остальные компоненты поля точно выражаются через f- и f- следующим об- разом: ^, D2) D3)
642 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИИ [ГЛ. Н Интересно отметить, что полное поле имеет не равную нулю компоненту вектора Н, параллельную диполю, так что результат анализа нельзя выразить через один вектор Герца. Здесь опять можно (при обычных ограничениях) представить решение в виде интегралов Френеля. Если kR{5>>l, то нетрудно получить следующее асимптотическое приближение: 2ехр — i V« /_ ,/ -__ ..._ х D5) Аналогичный результат можно получить и для f-'. § 11.8. Другие задачи В настоящем параграфе коротко рассматривается несколько других диф- ракционных задач. 11.8.1. Две параллельные полуплоскости. Задача о дифракции света на краях двух параллельных полуплоскостей, перпендикулярных к плоскости, проходящей через их края, разбирается с помощью метода, изложенного в настоящей главе для случая одиночной полуплоскости *). Рассмотрим .Е-поляризациюдля точно такого же случая, какив§ 11.5.1, но теперь дифракционное препятствие состоит из двух экранов. Пусть один из иих (экран 1) занимает полуплоскость у— 0, х>0, другой (экран 2) — полу- плоскость у = — а, *>0. Удобно ввести дополнительные координаты г' и Q', измеряемые от края @, —а) экрана 2. Дифрагированные поля, вызванные индуцированными токами в экранах 1 и 2, можно записать соответственно в виде Е(гг) = ] Pi (cos a) exp [ikr cos F q= a)] da, ^для g^.0, (I) с ?<?» ^ J Рг (cos a) exp [ikr' cos @' q= a)] da., =F для y^—a, B) с Непрерывность Н} и Я' при переходе через области у = 0, х<0 и у = — а, х<10 обеспечивается, если предположить, что /\(р.) и Ps(p.) свободны от сии- гулярностей в области ниже пути интегрирования, показанного на рис. 11.7. Кроме того, граничное условие, требующее исчезновения Ez на обоих экранах, приводит к интегральным уравнениям " 40HLex C) CD 00 Г ^iigL exp (ika Kiq?) exp (i/up) dp + Г Р1^} г exp (ikxp) ф = — e» — ao = — exp (ika V\ — af) exp (— ikxy,a), D) которые должны быть справедливыми для х>0. Положив E) *) Решения для падающей плоской волны сначала были получены методом, предложен- ным Швингером (он упоминается в § 11,1), Хсйнсом [10] и Вайнштейном [321.
§ 11.8] ДРУГИЕ ЗАДАЧИ 543 получим, складывая и вычитая C) и D), ее j p—j {1+ ехр (ika К7=^)} ехр (Йхц) ф = = — {1 + ехр (ika КП=й*)} ехр (— ikxpj, F) J J:1^L {1 -ехр (Ika КТ=^)} ехр (г*^) dn = = — {1 — ехр(//еаКГ=^)}ехр(— /йхц„) G) 0 — 05 для х>0. Уравнения F) и G) сходны с уравнением A1.5.2), и для получения решений, аналогичных A1.5.4), пути интегрирования следует замкнуть бесконечной полуокружностью выше вещественной оси. С этой целью выбирается та ветвь У 1—|л2, у которой мнимая часть положительна. Тогда требуемое решение уравнения F) примет вид ¦ где U(\i) — произвольная функция |i, свободная от сингулярностей в полупло- скости выше пути интегрирования и стремящаяся к нулю при \\i |-*-oo. Остается показать, как следует выбрать <?i((i) и U(\i), чтобы они удовлет- воряли (8). Напомним, что у Qi(jj-) нет сингулярностей ниже выбранного пути интегрирования. Задача сводится к тому, чтобы представить коэффициент при Qj.(j-i) в соотношении (8) в виде i где Ut(n) не имеет сингулярностей и нулей в полуплоскости выше пути ин- <¦ тегрирования и по абсолютной величине возрастает там до бесконечности; Li.(yi) должна обладать такими же характеристиками в полуплоскости ниже пути интегрирования. О возможности подобного представления известно иа общей теории Винера и Хопфа 171. Хейнс [10] получил выражения для ИЛ(ц) 1 и Li(n) в явном виде. В таком случае имеем где использовано соотношение i/i((i)=Li(—р.), входящее в неявном виде в (9) (с точностью до произвольного постоянного множителя). Аналогично, если Полное дифрагированное поле находится сложением A) и B); так, напри- тмер, при у > 0 имеем ч {Pj(cosa) + P3(cosa)exp (Hasina)}ехр [ikr cos(9—a)]«fa = ~2 HQi(e0Sa)(^ -f exp((teSina)) + Qj(cosa)(l—exp (ika sin a))} x xexp [ikrcos(Q—a)]rfa = ^-p(cosa)exP [ikrzos(Q—a)]da, A3)
544 СТРОГАЯ ТЕОРИЯ ДИФРАКЦИИ [ГЛ. 1 1 где = 4л" И-»»—~ ^» W^»^+^«(f*e)^s(^)}- 04) Здесь снова следует отметить симметрию Р (fi) относительно (i и (а0. Кроме того, когдаа = 0, имеем ?/,'(ц) = ]/j^p-, c/2(u.) =0, и A4) сводится к A1.5.6). 11.8.2. Бесконечный набор параллельных полуплоскостей, расположенных ¦ступеньками. В этой задаче [9] рассматрияается бесконечный ряд дифракцион- ных экранов, причем я-й экран занимает полуплоскость у=па, x^>nb, где л-=-0, ±1, ±2, ... Как и раньше, для падающей ^-поляризованной плоской волны дифраги- рованное поле, обусловленное индуцированным током в т-и экране, имеет вид Е<*т = J Pm (cos а) ехр [— ikm (a cos adtbsin а)] ехр [г'&г cos @ =F а)] da, A5) с где верхний знак берется для у>та, а нижний — для у<Ста. Все функции F'т(и) должны быть свободны от сиигулярностей ниже пути интегрирования в плоскости u. = cos a. Из граничных условий на л-м экране следует интегральное уравнение 00 № ^ Г -у^Ь ехр (ijfea | n —m | ^1=]^) ехр [tfe (х— тб) ц] dp = т—— до ^ ' г* j — » = — ехр (— г"*А:ц0) ехр (— ikna V\ — Ц?), A6) которое должно выполняться для х>пЬ. Из периодичности задачи ясно, что аКТ^}]; A7) полагая /г — т ~ q, приведем A6) к виду X Г -^Texp[iA<y{up,+aKrT=iIj}]exp(<te|9|VNri?)X — со Xехр (ik (qb + х) \х) ф = — ехр (— ikx\i0) A8) для Бесконечную сумму по q можно представить в замкнутой форме, если снова написать интегральное уравнение, решаемое при помощи теоремы вычетов Коши. Как и в предыдущей задаче, необходимо представить некоторую функцию в виде двух множителей. Один из них должен быть свободен от сингулярио- стей и нулей в верхней полуплоскости и по абсолютной величине возрастать там до бесконечности, а другой должен обладать такими же характеристиками в нижней полуплоскости. Более подробно с этими множителями можно позна- комиться в статьях Карлсона и Хейнса, на которые мы уже ссылались. 11.8.3. Полоса. Другая интересная задача, вводящая в заблуждение своей кажущейся простотой, относится к дифракции на бесконечно длинной, идеально проводящей плоской полосе с параллельными краями или к дифрак- ции на «дополнительном экране» в виде щели в бесконечной плоскости. Было предложено несколько способов решения этой задачи [6, 16, 33—36], по ни один из них не давал решения в замкнутом виде. Ниже показано, как в случае нормального падения плоской волны метод дуального интегрального уравне- ния [37, 38] использовался для получения в решении первых двух членов разложения в степенной ряд по ka, где 2а — ширина полосы.
¦§ 11.8] другие задачи 545 Для полосы, занимающей область г/=0, |#|<а, при нормальном падении Я-поляризованной плоской волны интегральные уравнения A1.4.19) И A1.4.20) принимают пид JJ Р(ц)ехр((йх(*)ф1 = 1 для \х\<а, A9) — СО 00 Г /P(ft) exp (ikxu.) da = 0 для \х\> а, B0) J F I —М-2 — да или, поскольку из симметрии задачи следует, что Р(а) = Р{—и), Р (ц) cos (kx\i) dp =.у для | х |< а, B1) I* —р-^ 7 cos (fex^t) dn = 0 для |х|>а. B2) о Будем искать решение в виде так как B2) удовлетворяется каждым членом этого ряда. Подстановка в B1) показывает, что ст должно быть таким, чтобы у^стФга=— для \х\<Са, B4) т =-0 где j СО Фот = \ ——-J— /2m+i (kw) cos (йхц) rffi. B5) Теперь можно показать, что для \ka\ <^ 1 оо Г г! )"¦ i cos Bm+1) arcsin — | /Sffl+i(ton)cos(/sx(i)<i(i + O(/sa)^ — —~ +O(ka). B6) о Отсюда в первом приближении получим вместо B4) угТЩр ? Ст cos [Bm +'] arcsin ^"] = т Ь> <27) что дает С"=Т' с™ = 0 для '«=1. 2. 3, .., B8) Таким образом, в этом приближении и плотность" тока, выведенная из A1.4.16), равна о Следующее приближение, учитывающее члены (toK, значительно слож- нее. Различные авторы независимо получили для него одинаковые выражения A35. 38], см. также [13]), 35 М Rnnu
546 СТРОГАЯ' ТЕОРИЯ ДИФРАКЦИИ [ГЛ. 1 1 11.8.4. Другие задачи. Существует • еще целый ряд интересных задач, близких к рассмотренным нами, и они также допускают решение. Однако мы вынуждены только упомянуть здесь о них. Задача о дифракции на двумерном клине, который превращается в полу- плоскость, если внешний угол клина равен 2л, решена много лет тому назад 13, 39]. В это решениевходиг угловой спектр периода 2п1п, где я/и — внешний угол клипа. Задача о дифракции на полуплоскости, находящейся между двумя раз- личными однородными средами, была впервые рассмотрена Хансоном [401. Задача решается методом, изложенным в настоящей главе; она используется в теории распространения радиоволн над поверхностью Земли [41]. Были выполнены два исследования дифракции на полуплоскости в менее идеализированных условиях. В 'первом [42! была введена конечная, хотя и большая проводимость, что вынуждало использовать приближенные граничные условия; во втором [43] предполагалось, что плоскость является идеально проводящей, но имеет конечную, хотя и малую толщину. § 11.9. Единственность решения Мы видели в § 11.2, что общую задачу о дифракции, которой мы касались, можно сформулировать следующим образом: дано поле Ей, падающее па идеально проводящую поверхность S, требуется найти поле Е, обусловлен- ное электрическим током, распределенным по S, которое имеет такую величи- ну, что и его тангенциальная составляющая на S,равняется тангенциальной составляющей Еш, взятой со знаком минус. Конечно, существенно необходимо, чтобы этой формулировке соответ- ствовала единственность решения*). Однако показать, что действительно не существует другого поля E<s\ удовлетворяющего поставленным условиям, сов- сем не просто, особенно когда допускаются бесконечные размеры 5 и учитыва- ются поля, содержащие плоские волны. По-видимому, только сравнительно не- давно появились удовлетворительные доказательства единственности 146] (см. также [45, 47J), хотя она давно молчаливо принималась. Дополнительные трудности векш икают в особом, хотя и наиболее общем случае дифракционной задачи, в которой можно предположить, что дифракци- онное препятствие имеет бесконечно острый край. (Фактически гакой задачей и ограничивалось содержание настоящей главы.) Причина возникновения до- полнительных сложностей заключается в том, что это решение содержит, как мы видели, сингулярности на краю и тем самым нарушается предположение, . необходимое для только что упомянутого доказательства единственности ре- шения. Легко видеть, что если допускаются произвольные сингулярности по краю, то можно получить бесконечную последовательность решений путем дифференцирования 148]. Например, дифференцирование по х решения для ?-поляризации к задаче с полуплоскостью (см. A1.5.22)) дает по существу но- вое выражение, также удовлетворяющее волновому уравнению и обращающееся в нуль на экране. Дифференцирование A1.5.22) по у дает выражение, которое, очевидно, служит решением для //-поляризации, но отличается от A1.5.44). Каждое дифференцирование вносит сингулярность более высокого по- рядка в pf щение для дифракционного края. Очевидно, для обеспечения един- ственности решения следует точно определить некоторые ограничения, нала- гаемые на характер сингулярности. Целесообразные ограничения и различные способы, которыми их можно сформулировать, явились предметом целого ряда статей [49]. Со всеми деталями, относящимися к этому вопросу, читатель *) Установить существование решения, вероятно, менее важно, так как такое заключение делается, когда решение найдено в любом частном случае (см. также [44, 45]).
ЛИТЕРАТУРА • 547 может познакомиться непосредственно по оригинальным статьям. Однако, вообще говоря, решения, содержащие сингулярность наинизшего порядка, следует считать ответом на физическую задачу, и это значит, что в действитель- ности исключаются любые сингулярности более высоких порядков, чем г~Ч* при г-+0 на дифракционном крае. В частности, можно утверждать, что ре- шение будет единственным, если имеет место интегрируемость индуцирован- ного тока по дифракционной поверхности и исчезновение у края соответствую- щей компоненты, нормальной к краю. Поведение компонент векторов Е и Н вблизи края можно вывести из этих условий. , Наконец, убедившись в возможности получить бесконечное число «реше- ний», можно задать вопрос, почему метод, использованный в настоящей главе, приводит к единственному решению, которое к тому же, если применять упо- мянутый выше критерий, оказывается правильным. Это объясняется допуще- нием, что компоненты поля в плоскости экрана можно выразить в виде сходя- щихся интегралов Фурье, вследствие чего они не имеют также спнгудярно- стей слишком высокого порядка. ЛИТЕРАТУРА 1. Sommerfeld, Math. Ann. 47, 317 A896). 2. Н. S. Carslaw, Proc. Lond. Math. Soc. 30, 121 A899). 3. H. M. M а с d о n a 1 d, Electric Waves, Cambr. Univ. Press, 1902. 4. T. J. ГА. Brom w i с h, Proc. Loud. Math. Soc. 14, 450 A916). 5. C. J. Bouwkamp, Dissertation, Groningen, 1941; J. M e i x n e r, W. Andrei- e w s k i, Ann. d. Physik 7, 157 A950). 6. R а у 1 e i g h, Phil. Mag. 43, 259 A897). 7. E. С Titchmarsh, Introduction to the Theory of. Fourier Integrals, Clarendon Press, Oxford, 1937. (E. T и т ч м а р ш, Введение в теорию интегралов Фурье, Гостехиздат, 1948 ) 8. Е. Т. Copson, Quart. J. Maths 17, 19 A946). 9. J. F. С a r s l'o n, A. E. Heins. Quart. Appl. Maths 4, 313 A947); 5, 82 A947). 10.. A. E. Hein s, Quart. Appl. Maths 6, 157. 215 A948). 11.-H. L e v i n e, J. Sthwinger, Phys. Rev. 73, 383 A948). 12. J. W. Miles, J. Appl. Phys. 20, 760'A949). 13 С J. В о u w k a m p, в сб. «Rep. Progr. Phys.», Phys. Soc. London, 1954, Vol. 17, pp. 35, 73. 14. H. L e v i n e, J. SchwinRer, Phys. Rev. 74, 958 A948); 75, 1423 A949). 15. G. W о 1 f s о h n, в ка. «Handbuch der Physik», Springer, Berlin, 1928, Vol. 20, p. 263, 273. 16. В. В. В a k e г, Е. Т. С о р s о n. The Mathematical Theory of Huygens' Principle, 2nd ed. Clarendon Press, Oxford, 1950. 17. H. Hohl, A. W. M a u e, K. Westpfahl, в кн. «Handbuch der Physik», Springer, Berlin, 1961, Vol. 25/1. 18. H. G. В oo ker, J. IEE 93, Pt. IIIA, 620 A946). 19 L. G. H. H u x 1 e y, The Principles and Practice of Waveguides, Cambr. Univ. Press, 1947, p. 284, § 7.17. 20. E. T. W h i 11 a k e r, G. N. Watson, A Course of Modern Analysis, Cambr. Univ. Press, 1927, p. 397. (Э. Уиттекер, Г. Ватсон, Курс современного анализа, Гостех- издат, 1933.) 21 R. A. R a n k i n, Phil. Trans. Roy. Soc. A24I, 457 A949). 22. G. G. Stokes, Trans. Cambr. Phil. Soc. 10, 105 A864). 23 W. В r a u n b e k, G. I. а и к i e n, Optik Я, 174 A952). 24 J Savornin, Ann. de Physique 11, 129 A939). 25. С \V. П о г t о n, R. B. W a t s о n, J. Appl. Phys. 21, 16 A950). 26. B. N. H a r d e n. Proc. IEE 99, Pt. Ill, 229 A952); R. D. К о d i s, J. Appl. Phys. 23, 249 A952); R. V. R о w, J. Appl. Phys. 24, 1448 A953). 27. J A. S t r a 11 о n, Electromagnetic Theory, McGraw-Hill, N. Y., 1941. (Дж. Стрэттон, Теория электромагнетизма, Гостехиздат, 1948.) 28. Н. М. М а с d о n a I d, Proc. Lond. Math. Soc. 14, 410 A915). 29. Т. В. A. S e n i о r, Quart. J. Mech. Appl. Maths 6, 101 A953). Ж). A. E. He ins, Trans. IRE, AP-4, 294 A956); B. D. Woods, Quart. J. Mech. Appl. Maths. 10, 90 A957); W. E. Williams, Quart. J. Mech. Appl. Maths 10, 210 A957). 31. H. Weyl, Ann. d. Physik 60, 481 A919). 32. Л. А. В а й н ште й и, Известия АН СССР, Сер. физ., 12, 144, 166 {1948). 33. К. Schwarzchild, Math. Ann. 55, 177 A902); P. M. Morse, P. J. Ruben- stein, Phys. Rev. 54, 895 A938); A. Sommerfeld, Optics, Acad. Press, N. Y., 1954. (A. '3 о м м е р ф е л ь д, Оптика, ИЛ, 1953.)
548 строгая теория дифракции [гл. 11 ч 34. S. S к a v 1 е m, Arch. Math. Naturvid.- 51, 61 A951), Е.В. Moiilli n, F.> M. P h i 1- 1 i p s, Proc. IEE 99, Pt. IV, 137 A952). 35. R. M u 1 1 с г, К. Westpfahl, Z . Phys. 134, 245 A953). 36. P. С Clem mow. Trans, ШГ, AP-4, 282 A956), S. N. К a r p, A. R u s s e k. J. Appl. Phys. 27, 880 A956,); R. F . Millar, Proc. Cambr Phil. Soc. 54, 479, 497 A958) 37. E. G г о s c'h w l t z, H. Нол 1, Z. f. Phys. 131, 305 A952); H.Honl, E. Z i m щ е г Z. f. Phys. 135, 19C A953). 38. С J. Tranter, Quart. J. Mech. Appl. Maths 7, 317 A954). 39. H. S. С a r s 1 a w, Proc. Lond. Math. Soc. 18, 291 A919). 40. E. T. H a n s о n, Phil. Trans. Roy. Soc. A237, 35 A938). 41. P. С. С 1 e m m о w, Phil. Trans. Roy. Soc. A246, 1 A953). 42. T. B. A. S e n i о r, Proc. Roy. Soc. A213, 436 A952). 43. D. S. Jones, Proc. Roy. Soc. A217, 153 A953). 44 С Mtiller, Math, Ann. 123, 345 A951). 45. \V. K. Saunders, Proc. Nat. Acad. Sci. USA 38, 342 A952). 46. Г-. R e 1 1 i с h, Jahr, Deut. Math. Ver. 53, 57 A943). 47. A. S о m m e r f e i d, Partial Differential Equations in Physics, Acad. Press, N. Y., 1949, § 29. (А. Зоммерфельд, Дифференциальные уравнения в частных производных физики, ИЛ, 1950.) 48. С. J. Bouwkamp, Physica 12, 467 A946). 49. J. M e i x n e r, Ann. d. Physik в, 1 A949); A. W. Май е, Z. f. Phys. 126, 601 A949); E. Т. С о p s о n, Proc. Roy. Soc. A202, 277 A950); D. S. J о n e s, Quart. J. Mech. Appl. Maths 3, 420 A950); A. E.Heins,S. Silver, Proc. Cambr. Phil. Soc. 51, 149 A955); 54, 131 A958).
ГЛАВА 12 ДИФРАКЦИЯ СВЕТА НА УЛЬТРАЗВУКОВЫХ ВОЛНАХ В гл. 1 и 2 было показано, что распространение электромагнитных волн можно изучать либо с помощью уравнений Максвелла, дополненных материаль- ными уравнениями, либо с помощью некоторых интегральных уравнений, учи- тывающих поляризационные свойства среды. В частности, каждый из этих методов можно применять также для изучения распространения света в среде, плотность которой зависит ог пространственных координат и от времени. Пер- вый метод широко применялся в прошлом, тогда как последний только срав- нительно недавно стал использоваться в таких исследованиях. В настоящей главе мы воспользуемся методом интегральных уравнений для решения задач, связанных с дифракцией света в прозрачной однородной среде, возмущенной проходящими ультразвуковыми волнами. Однако сначала полезно дать ка- чественное описание этого явления и кратко изложить соответствующие тео- ретические работы, основанные на применении дифференциальных уравнений Максвелла. ( § 12.1 Качественное описание явления и краткое изложение теорий, основанных иа применении дифференциальных уравнений Максвелла 12.1.1. Качественное описание явления. Ультразвуковые волны — это звуковые волны, частоты которых выше частот, воспринимаемых ухом человека. Угловая частота ультразвуковых волн, генерируемых в лабораториях, на- ходится приблизительно между 105 сек~1 и 3-10° ее/с. Первая величина пред- ставляет предельную частоту, воспринимаемую нашим ухом. Соответствую- щий диапазон для волн Л, очевидно, зависит от скорости v этих воли в среде, в которой они распространяются. Например, в воде у=1,2-105 см/сек и ука- занные выше частоты соответствуют диапазону длин волн *) от Л=7,б см до Л=2,5-10-* см. В 1921 г. Бриллюэн [2] предсказал, что при освещении жидкости, в которой распространяются упругие волны небольшой длины, видимым светом возникнет дифракция, подобная дифракции на решетке. Для того чтобы убедиться в этом, рассмотрим жидкость, находящуюся между двумя бесконечными плоскостями у — Q к у — d, и допустим, что плоская упругая волна длиной Л движется в ней вдоль положительного направления осп х. Это создает периодическую слои- стость в веществе вдоль оси х, причем расстояние между последовательными плоскостями максимальной плотности равно Л. Рассмотрим падающую монохроматическую плоскую световую волну с уг- ловой частотой со и длиной волны в веществе к, причем волновая нормаль ле- жит в плоскости ху и составляет угол 6 с осью у (рис. 12.1). Далее пусть <р обозначает угол, который дифрагировавший луч образует с осью у. Так как скорость v упругих волн всегда значительно меньше скорости света, можно в первом приближении принять, что слоистая структура вещества, вызванная *) О методах генерации ультразвуковых волн и их многочисленных применениях см., например, [1].
550 ДИФРАКиИЯ СВЕТА НА УЛЬТРАЗВУКОВЫХ ВОЛНАХ [гл. 12 ультразвуковой волной, неподвижна. В таком случае направления q\ в кото- рых имеется заметная интенсивность, определяются условием, трсоующим, чтобы оптическая разность хода между лучами от двух соседних плоскостей, находящихся на расстоянии Л± равнялась целому кратному X. Это условие определяет зависимость между Я,, в и направлениями распространения <рг волн разных порядков в дифракционном спектре, т. е. BC—AD — Л (sin ф,—sin 9) = IX, = 0, ±1, ±2, ... A0 Здесь АВ и CD — части волновых фронтов, связанных с преломленными и дифрагировавшими лучами. Удобно выразить A) через углы 0, ср и длину волны w % вне среды. Если ппгтлипяяться в воспользоваться в A) законом преломления sin 6 sin ф Я sm<p Я * si» 6 то получим Л (sin ф,— sin 6) = IX, 1 = 0, ±1, ±2, .,, B) Из B) находим для углового расстоя- ния между соседними порядками я* ф2—ф|_1 = Х/А. РИС- 12-ЧраХХя0ВрЫешеткаНЫ '" """ Таким образом, при данной длине вол- ны X угловое расстояние уменьшается с увеличением Л. Если Л достаточно велико, то главные линии располагаются так тесно, что инструмент, с помощью которого ведется наблюдение, не сможет их разрешить. Этим обстоятельством объясняется то, что дифракционные яв- ления не наблюдались, пока видимым светом освещались обычные звуковые волны. . _ ,, „ _, ,„, Почти через десять лет после предсказании Ьриллюэиа Деоаи и Uipc Ш и независимо от них Люка и Бикар 14] обнаружили дифракцию света на ультра- звуковых волнах. С тех пор многие исследователи изучали это явление в раз- личных экспериментальных условиях при изменении одного или нескольких из следующих параметров: (а) угла падения света б, (б) длины Л ультразву- ковой волны, (в) длины волны X падающего света, (г) амплитуды ультразвуко- вых волн, (д) ширины d ультразвукового пучка. Естественно, что положение спектров различных порядков на экране, их число и относительная интенсивность зависят от одного или нескольких т перечисленных выше факторов *). На приводимом ниже рис. 12.3 показано для типичного случая число порядков, появляющихся с каждой стороны про- шедшего пучка света, при разных углах падения А на ультразвуковую решетку. Обычное экспериментальное устройство, применяемое для изучения дифрак- ционных спектров, схематически изображено на рис. 12.2. На этой стадии знакомства с дифракцией света на ультразвуковых волнах удобно ввести и определить некоторые принятые в настоящей главе символы и знаки. г Концентрация молекул (атомов) в среде обозначается через Л (г, г). В изо- тропной однородной среде, в которой плоская упругая волна распространяется *) Полуколичественная теория зависимости дифракционных спектров от этих фактороа изложена в [5].
12.11 КАЧЕСТВЕННОЕ ОПИСАНИЕ ЯВЛЕНИЯ. УРАВНЕНИЯ МАКСВЕЛЛА 551 в положительном направлении оси я, iV(r, f) можно записать в виде *) N(r, t)^N, [1 +A cos(Кх-Ш)}, ;, C) где No — средняя концентрация молекул в среде, No\ (оСзычно порядка 1O~47VO) — амплитуда упругой волны (в единицах JV0), К = 2л/Х — вол-, новое число (величина волнового вектора) упругой волны и Q — Kv — угло- вая частота ультразвукового возмущения. В такой среде диэлектрическая Направление распространения ультразвуковогв пучка Источник света А Экран Кристалл кварца Рис. 12.2. Схема экспериментальной установки для наблюдения дифракции света на ультра- звуковых волнах. проницаемость е также зависит от пространственных координат и от времени,- Зту зависимость можно представить в виде e = e0 + eIcos(iOc—Ш). D) Конечно, между ei и Д существует связь, которую можно записать следующим образом: в1=уД. E) . Если мы примем закон Лорентц — Лоренца (см. B.3.-17)) е—1 1 , ^n>-A7: = const. F) то, дифференцируя логарифм F) и вспоминая, что Д и ei/e0 значительно меньше единицы, получим /Vo или т. е. для большинства жидкостей величина у порядка единицы. Мы считаем также, что- G) Наконец, углы 8, ф и т. д. измеряются по часовой стрелке от положитель- ного направления оси у к направлению, по которому распространяется свет (см. рис. 12.11. Предполагается также, что О^0</2 *) Дли простоты мы рассмотрим только плоские бегущие ультразвуковые волны. Диф- ракция света на сюячих ерлнах также изучалась экспериментально (см. [1]); соответствующее обобщение теории не встречает затруднений. Следует отметить, что в эксперименте очень трудно получить совершенно плоские ульт- развуковые волны. Однако волновые фронты -можно считать плоскими в областях, линейные размеры которых значительно больше Л. ,
552 ДИФРАКЦИЯ СВЕТА НА УЛЬТРАЗВУКОВЫХ ВОЛНАХ [ГЛ. 12 12.1.2. Краткое изложение теорий, основанных на уравнениях Максвелла. В областях, свободных от токов и зарядов, уравнения Максвелла для немаг- нитной непроводящей среды с диэлектрической проницаемостью е, зависящей от пространственных координат и времени, имеют вид divH=0, divD^O. (96) Исключая H из (9а) и используя соотношения D = е Е, div D = 0 и тождество rot rot^s—v2 + grad div, найдем, что ¦l^(8E)=V*E + grad(E-gradlns). A0) Если теперь воспользоваться выражением D) w рассматривать Е как суперпо- зицию плоских волн с длинами ?.« Л/я, то мы найдем, что второй член в правой части A0) приблизительно в ех(А./Л) раз больше первого. Так как в обычных условиях эксперимента гх и 7JA значительно меньше единицы, то можно пре- небречь этим членом в A0), и мы получим L|eE) = V*E. A1) Рассмотрим теперь с физической точки зрения ситуацию, изображенную на рис. 12.1. Допустим, что падающая монохроматическая плоская электро- магнитная волна линейно поляризована и ее электрический вектор перпенди- кулярен плоскости падения (^-поляризация), т. е. направлен вдоль оси г. В этом случае из предыдущего следует, что внутри среды компоненты Ех Е,; вектора Е будут малыми величинами порядка eL(}JA) E7, и поэтому ими можно пренебречь. Следовательно, вне среды Ех и Еу также пренебрежимо малы. Из симметрии задачи ясно, что Ег не зависит от координаты г, и поэтому, воспользовавшись D) и A1), получим для Ег уравнение { Чтобы решить его, допустим, что Ег имеет вид Ег == 2^(</)ехр{* [(Лsine+ //()*—(<o + lQ)t]\, {щ где суммирование ведется по всем целым значениям I (положительным, отри- цательным и пулевому). Подставляя A3) в A2) и приравнивая коэффициенты при каждой экспо- ненте нулю, получим следующие рекуррентные соотношения для V,,(y): ^Н#Ж v"M« + гяJ-(? sin е+од2} v, («/) = = --g-e.e~'(a+/QI{Vl_1(i() + V,+1Uf)} (/ = 0, ±1, ±2, ...), A4) где штрих у Vi (у) обозначает дифференцирование по у. Эти уравнения следует решать при граничных условиях *) Vo @) = В, амплитуда падающей световой волпы, ] и ' A5) у,@) = 0 для всех 1Ф0. , } Не решая A4), можно видеть, что A3) представляет суперпозицию волн с частотами <${= а>-\-IQ A = 0, ±1, ±2,;...). Кроме того, х-компонента вол- *) Эти граничные условия правильны только при ничтожно малой интенсивности отра- женных волн. В данной задаче это так и есть, потому что угол падения 6, для которого ампли- туды дифрагировавших воли достаточно велики, не превышает 3° (см, также п. 12.2.4).
§ 12.1] КАЧЕСТВЕННОЕ ОПИСАНИЕ ЯВЛЕНИЯ. УРАВНЕНИЯ МАКСВЕЛЛА S53 нового вектора волны с частотой а^ равна k sin 9 + IK- Следовательно, синус угла фг> который нормаль к волне с частотой сог образует с осью у вне рассеи- вающей среды, равняется +^ 4, так как ?<1, A6) что находится в согласии с B). Далее интенсивность в спектре определенного порядка / можно принять равной \V,(d) \г. Решим A4), предположив сначала, что 1/„^> V^i^s> V. 2 ... Напомним, что нужно рассматривать только те решения A4), которые соответствую! све- товым волнам, движущимся в направлении увеличения у, поэтому, принимая, что в A4) все Vt, кроме Vo, равны нулю и используя A5), получим в первом приближении VA7) Аналогично, полагая в A4) все V,, кроме V±1 и Vo, равными нулю, находим после несложных расчетов * 1 — ехр Г—2«р ("l ± -4-V1 V±i (У) = i У8 U \ LLA у;». (yh A8) Здесь использованы также соотношения E) и (8). Если теперь подставить A8) в уравнение A4) для / = 0 и для / = ±2, то мы получим поправочный член к VTiy) и выражение для V±t(jy), которые в данном приближении пропор- циональны 64 Таким же способом получаются выражения для интенсивности в спектре любого порядка I в виде разложения в ряд по возрастающим сте- пеням 8. Решение в виде такого степенного ряда впервые было получено Брил- люэном [6], применившим, правда, несколько более сложный анализ, чем при- веденный здесь. Дэвид 17], следуя изложенному выше методу, получил в явном виде выражения для интенсивностей линий в спектрах первого и второго по- рядка, предполагая, что интенсивности в,спектрах высших порядков пренебре- жимо малы. Эти формулы упоминаются ниже (см. A2.2.38).). Приближение Бриллюэна (я чакже Дэвида) удобно при 6<gS 1 или б/с<^1, когда степенной ряд сходится быстро. Если эти условия выполняются, то очевидно, что заметная интенсивность будет наблюдаться только в спектрах нескольких первых порядков. Объяснение одновременного появления спектров многих порядков и при- ближенные выражения, определяющие их интенсивности, были впервые полу- чены Раманом и Натом *) Г8]. Они решили уравнение A4) следующим обратом. Полагая в A4) ( exp [ik(zos&)y] Ut(y) A9) и вспоминая, что Q/o)»10~5 (или меньше этой величины), k — nk и &sinO = = fesin0, получим следующие рекуррентные соотношения для U\(у): V] (у) + 2(ксаъШ\ (у) — (ЖКsin в + МС2) U,(y) + + ±i(kYe1^4Ul+1(y)-Ul_l(y))=0 (/ = 0, ±1, ±2, . ..). B0) Вводя новую переменную *) Отмстим, что Раман и Нат, следуя в двух своих первых статьях работе Рэлея [9], относящейся к фазовым решеткам, нашли, что амглшучи дифрлгировапьых волн можно пред- ciaaurb в виде функции Весссля. Б этом методе рассматриваются изменения только фазы пло- ской световой волны при ее пересечении ультразвукового пучка.
554 ДИФРАГОЦ1Я СВЕТА НА УЛЬТРАЗВУКОВЫХ ВОЛНАХ [ГЛ. 12 приведем последнее уравнение к виду X) — 2iel)?-1 \2lK(k)='1 sin W+ W (и)"*} Vx {%). B1) Здесь штрих у U означает дифференцирование по %. Так как Xld-^l, первый член в правой части обычно порядка к,С/, т. е. 10"" U, и его можно отбросить. Кроме того, если мы, следуя Раману и Нату, допустим, что и первый член в фи- гурных скобках равен нулю, то оставшийся ряд уравнений представляет собой рекуррентные соотношения (см., например, 1101), которым удовлетворяют бес- селевы функции целого порядка. Используя граничные условия A5), получим для интенсивности в спектре порядка / выражение BzJ](ll.fils^1kd sec 8). Следует отмстить, что приближение, сделанное Раманом и Нагом, осно- вано главным образом на пренебрежении /2/б и /|/б для всех /. Поэтому, если й достаточно велико по сравнению с единицей, то это приближение будет хо- рошо описывать интенсивности в низших порядках. Однако выражения, со- держащие функции Вссссля, дают завышенную интенсивность в высших по- рядках. Это было показано численными расчетами интенсивностей для трех значений параметра б, выполненными Экстерманом и Ванье [111. В работе этих авторов решение уравнения A2) в конце концов определяется уравне- ниями, в основном подобными соотношениям A2.2.18) и A2.2,19). Наконец, заметим, что были получены решения B1) в виде степенных рядов по возрастающим степеням 1/6 112, 13]. Эти ряды, по-видимому, имеют довольно ограниченное применение, так как сходятся очень медленно. Другая трактовка, основанная на уравнениях Максвелла, в которой дифракция рас- сматривается как граничная задача, дана Вагнером [14]. § 12.2. Рассмотрение дифракции света на ультразвуковых волнах методом интегральных уравнений В §2.4 было отмечено, что интегральные уравнения B.4.4) для эффектив- ного электрического поля Е' (г, i) и соответствующая формула B.4.5) для Н' эквивалентны уравнениям Максвелла для изотропных немагнитных веществ. Это справедливо, если допустить, что плотность среды не зависит от времени, однако полученный результат легко распространить и на более общий сличай, когда такая зависимость от времени существует. Как и раньше, мы будем счи- тать среду немагнитной и непроводящей. Напомним, что сущность метода интегральных уравнений заключается В том, что влияние среды на распространение электромагнитной волны счи- тается эквивалентным действию электрических диполей, находящихся в ва- кууме, причем дипольный момент, индуцированный в каком-нибудь физически бесконечно малом элементе объема dr' с линейными размерами, значительно меньшими *) "а, пропорционален полю Е' (г', I), действующему на этот объем, и числу заключенных в нем молекул (атомов). Связанный с таким диполем в г' вектор Герца позволяет получить поле в точке г в момент t с помощью операции (см. B.2.43)) -4rfF + graddiv. Здесь различные символы имеют то же значение, что и в § 2.4; следовательно, *) Такие элементы объема, значительно большие объема отдельного агома (молекулы) 'ho с линейными размерами, малыми по сравнению с Я, почти всегда можно выбрать для оптиче- ских длин волн.
§ 12.2] ДИФРАКЦИЯ СВЕТЛ. НА УЛЬТРАЗВУКОВЫХ- ВОЛНАХ 555 # = 14-— ж-* | и оператор grad div действует на переменные г(х, уг г). В таком случае, аргументируя так же, как и при выводе уравнения B.4.4), можно по- лучить следующее интегральное уравнение для Е в среде *): A) Как и в B.4.4), интегрирование производится по всей среде, за исключением небольшой области, занятой атомом в точке наблюдения г (х, у, г). Это основное интегральное уравнение рассматриваемой здесь теории. Когда оно решается относительно Е' во всех точках внутри среды, поле вне среды рассчитывается путем добавления к падающему нолю Е(" (г, /) поля диполя Е(* (г, I), определяемого интегралом в A), но взятым по всей области, занятой средой. Следует отметить, что в противоположность обычному методу, требующему составления уравнений Максвелла для среды и вакуума, такое рассмотрение распространения света в среде позволяет избежать явного вве- дения граничных условий на преломляющих поверхностях. Вместо этого в дан- ном методе в пределы интегрирования вводятся размеры среды. Кроме того, изменения плотности среды учитываются в уравнениях Максвелла косвенным путем через диэлектрическую проницаемость в, тогда как в интегральные урав- нения A) функция плотности N(t, I) входит явно. Уравнение A) справедливо только при определенных ограничениях. Во- первых, поляризуемость а, рассчитанная на одну молекулу, вообще говори, зависит от частоты поля Е', так что оно должно быть строго монохроматичным. Однако если мы не находимся слишком близко к резонансным частотам, то изменения а с частотой внешнего поля малы. Следовательно, при условии, что все частотные компоненты Е' близки друг Другу, мы по-прежнему можем ис- пользовать уравнение A). Даже если падающее поле Е(|) строго монохрома- тичио, поле Е', действующее на молекулу и вызывающее образование диполей, не обязательно монохроматично, если N (г, t) зависит от времени, от термиче- ского возбуждения или от других причин, вызывающих разупорядочение. Ширина полосы частот зависит от вариации N (г, t) во времени. Таким образом, ) равнением A) можно пользоваться с уверенностью только тогда, когда изме- нение во времени N происходит медленно по сравнению с изменением **) Е(". К счастью, это ограничение не является очень серьезным, так как в задачах о рассеянии и дифракции света требуемое условие почти всегда выполняется. Далее мы считали а скаляром; такое предположение полностью оправдано, для атомов и молекул, обладающих особой симметрией. Оно справедливо также и в более общем случае, когда молекулы беспорядочно ориентированы, чго уже отмечалось в § 2.3. Наконец, здесь предполагается, что поглощение света средой ничтожно мало; его можно учесть, допустив, что а. комплексно. Теперь воспользуемся методом интегрального уравнения для изучения дифракции снега на ультразвуковых волнах в жидкости [15, 16J. 12.2.1, Интегральное уравнение для случая ?-поляризации. Вернемся опять к физической ситуации, рассмотренной в п. 12.1.1, и допустим, что па- дающий свет линейно поляризован, причем его электрический вектор перпенди- кулярен к плоскости падения; тогда компоненты электрического вектора ElI)(r, t) падающейсветовойволны выражаются соотношениями (вещественная *) Уравнение A) отличается от соотношения B.4.4) тем, что оператор rot rot заменен в последнем на I г Л7г"т"ёга<* ^'v ) и чт0 плотность N, которая теперь зависит от простран- ственных координат и времени, следует брать, подобно Е', в момент времени t — Rjc. **> Использование соотношения D--pE в уравнениях .Максвелла для неоднородной среды также оправдано только тогда, когда на N налагаются аналогичные ограничения.
556 ДИФРАКЦИЯ СВЕТА ТТЛ" УЛЬТРАЗВУКОВЫХ ВОЛНАХ [ГЛ. 12 часть, как обычно, представляет собой физическую величину) xv О, \ [1> = В exp[i (kxsine+ kyzosв — a>t)]. \ y ' Сказанное выше позволяет сделать вывод, что эффективное поле Е' {г, f) в среде почти параллельно оси г, и, значит, можно принять Е'х= Е'г/ — 0 и векторное интегральное уравнение A) для Е' сведется к единственному интегральному уравнению для Е'г. Напомним, что N (г, t) определяется выражением A2.1.3), и поэтому интегральное уравнение для Е'г примет вид E'z =(r, t) = Bexp [((fctsin9 + &г/cos6—at)] -\ f)]})f;(r', i-i)]*1, C) где для удобства введено обозначение *) Из B.3.17) находим, что 3 12.2.2. Пробное решение интегрального уравнения. Так как все плоскости, перпендикулярные к оси г, физически эквивалентны, возьмем в качестве проб- ного решения нашего интегрального уравнения C) выражение вида **) Е'г = 2 Л^иехр [_г (o^J — p^ 2 I, m где /йот— целые числа (положительные, отрицательные и нуль). Уравнение E), очевидно, описывает двойную бесконечную совокупность плоских волн. Такая форма возможного решения следует из существования многократных отражений и преломлений в бесконечной пластинке слоистого вещества с плос- кими параллельными поверхностями. Вскоре мы увидим, что различные не- известные N[т, ы1т, р1 и qm определяются из условия, что E) удовлетворяет интегральному уравнению C). Чтобы решить C), необходимо вычислить интегралы, определяющие 34<а, р, q), а именно = ±- \ \exp[-i((ot-px'-qy')]\^+^\ У-Ldx'dy'dz1. F) Здесь со2>с2р2. Если точка наблюдения х, г/, г находится вне рассеивающей среды, то объем V занимает всю среду (—oo<x'<oo, O^y'^d, —оо<Сг'< <оо). Если же точка наблюдения находится внутри рассеивающей среды, интеграл берется по тому же объему, за исключением небольшой сферы радиуса а (который в конечном итоге стремится к нулю) вокруг точки наблюдения. *) Макрооскопическая величина т (г, t)=4}ta,N (г, f) иногда называется коэффициентом рассеяния среды. *¦*) Здесь не должно возникать недоразумения, связанного с употреблением сходных символов для амплитуд N,т л концентрам™ молекул N (г, t), так как, начиная с этого места, последняя величина больше не будет входить в явном виде в наши уравнения.
§ 12.2]' ДИФРАКЦИЯ СВЕТА НА УЛЬТРАЗВУКОВЫХ ВОЛНАХ 557 Полагая *!=.*' —X, Уг^У' — У, Z1 = Z' — Z, . можно переписать F) (после сокращения на множитель ехр(—lat)) в виде fD>, р, q) = fl-\-^2, G) где /</•/• ( / i<AR ) | ))) 5f )\ (exp [i (px, + Wl)] (-^p-)j ^ф,й!г„ (9) причем теперь рассеивающая среда занимает объем Vu т.е. !, —u^t/i^d—у, —oo<Zi<oo. Эти интегралы вычисляются в приложении 9; они равны следующим величинам. а) Если (х, у, г) находится в рассеивающей среде *), то 1 0J ехр {—ig(a>, р, д)у) а2 ехр {— ih{№, p, q) (y~~d)\ ' ~() 23 '' +^ h (и, p, q) [«&-* —fi>]''' ' ' б) если (х, у, z) находится за рассеивающей средой, то У («в, р, q)= r?XPl~~f,(T P' "^(^P fe(co, P, <7)d]~l); A06) 2c2g(o) p q)\u>1c~i р-\'' в) если (х, у, г) находится перед рассеивающей средой (т. е. с той же стороны, откуда падает свет), то ?Т^№-А>-]~l)- {I0B) В этих выражениях ст(ю, р, q)^3(p* + qt — o>'tc-%)(j)* + q1 + 2<>>'ic~*)-1, g(w, р, q) = q—[a>*c-ii—p*y/>, h(a>, p, q) = q+[(a*c-*—p2]1/. Если теперь подставить E) в C) и использовать соотношения F) и A0а), то простым способом получим — Р? W(m exp [(—t) (a>lmt — plX — qmy)\ + + В ехр [(—i) {mt—kx sin в—Й«/ cos 9)] + + J yi exp K-0 {((»,„ ± Q) <-(p( ± /Q x— 2 +^- CT ((й,и ± Q, p, ± K, qm) А охр [(—i) {oW— Р/ДГ- [ci'mc-* —pfl'^y И g(iM, P(, ?ra [to P;] 1 a V4 «D|m-tQ)*exp[(-0 '(((Л^-ЬП) f-(p)±K) ar-fc-' (Щт±A)г-(miiKY]'1 *Ui] , — u ^^ _ f- + ,_ 2c'g (to,m-fcS!, PtLK, <lm) lc~* (u>tm±C!)'-(pi+K)*] mLexp [(—i){m,mt — p(x+\<н}тс~2 ¦ -pfV'y \] exp |t'A (<»,„, рг, yro)d] 2с2й(о» )Кс-г р?]'/' le- (Ш,и ± aj»-(p, ± if)'!1'- J ~ ' l ' *) В § 12.2 во всех выражениях берется положительный квадратный корень, если спе- циально не оговорен другой знак.
558 дифракция' светА йа Ультразвуковых волнах [гл. 12 где знак суммирования 2 перед любым выражением должен интерпретиро- ваться следующим образом: 2 F(a±b, с ± d) = F (a+ 6, c+d) + /r(a—b, с—d). Для того чтобы A2) удовлетворялось в любой момент'времени и в любой точке внутри рассеивающей среды, коэффициент при каждой экспоненте, от- личающейся от всех остальных по любой из переменных (х, у, /), должен не- зависимо от истальных равняться нулю. Из A2) видно, что изменения а1п происходят с шагом Q и всегда сопровождаются изменением рг на К. Однако коэффициенты при у в различных экспонентах остаются либо неизменными (qm), либо представляют собой одну и ту же функцию соответствующих <л[т и рг Следовательно, можно принять, что ш1т зависит только от индекса L Кроме того, поскольку можно допустить без потери общности, что ш0 равна частоте » падающего света, то /Q A3а) (« = o. ±1. ±2, ...). A3б) Используя эти соотношения в A2) и перегруппировывая различные члены, получим где б,,г. — символ Кронекера *) (т. е. б;.с = 0, если 1ф1' и Ьи = 1), a G, и Я, определяются следующим образом: A^ + ^)J {Ы2Ыс-2~Р1}1/'}-\ A5) X х [exp(»A!Md)] {2с%ш [cofc~2—pf]'/'}. A6) Здесь использованы'также сокращения (см. A1)) Ош = а(°>1, Pi, Ят)> еш = в(®1, Pi, qa) и hta = hi<0,, р„ qm). A7) Приравнивая нулю коэффициенты при каждой экспоненте в A4), можно получить следующую систему уравнений для допустимых значений qm и ампли- туд Nm: 1=0 для, всех I и т, A8) A9) = 0 } ДЛЯ всех/. 12.2.3. Выражения для амплитуд Световых волн в дифрагировавших и отра- женных спектрах. Перед тем как обсуждать решение сравнений A8)—B0), напишем выражения для полного светового возмущения в точке (х, у, г), на- ходящейся позади рассеивающей среды. Для этого подставим E) в подынтег- *) Символ Кронекера б( г нельзя спутать с параметром 6, введенным в A2.1.8), так как первый всегда снабжается индексами.
§ 12.2] ДИФРАКЦИЯ СВЕТА НА УЛЬТРАЗВУКОВЫХ ВОЛНАХ 559 ральное выражение в правой части C), проинтегрируем C) по всему объему, занятому рассеивающей средой, и прибавим к полученному результату выра- жение для падающего поля. Мы вновь столкнемся с интегралом "f- (со, р, q), рассматривавшимся в предыдущем разделе. Вспоминая, что в точке за рассеи- вающей средой ^ (о), р, q) определяется A06), и используя A8), получим для единственной не обращающейся в нуль компоненты полного прошедшего элект- рического поля следующее выражение: i где Bi = of S at Jit. <exp [iglm d]} {2e?q,u [ф-—р1] "'•} ~*. B2) ffl Согласно B1) и B2) прошедшую волну можно считать состоящей из многих плоских волн с разными частотами и разными направлениями распространения. Подставляя A3) в экспоненту B1), легко получить выражения дли частот со, и углов ф(; они оказываются такими же, как и в п. 12.1.2. Аналогично можно, воспользовавшись A0в), написать выражения для амплитуд Bf1 в отраженном спектре, они имеют вид Однако здесь мы рассматриваем только точки, находящиеся позади рассеиваю- щей среды, так как в данной задаче интенсивности волн разных порядков в от- раженном спектре, вообще говоря, очень малы. 12.2.4. Решение' методом последовательных приближений. Предполагая, что амплитуда Д ультразвуковой волны мала, мы решим в пп. 12.2.4 и 12.2.5 уравнения A8) — B0) и получим приближенные выражения для интенсив- ностей линий спектров первого и второго порядков в прошедшем свете. Слу- чай, для которого это приближение не состоятельно, рассматривается качест- венно в п. 12.2.6; наконец, в п. 12.2.7 будут решены уравнения A8) — B0) в приближении, в основном эквивалентном приближению Рамана и Ната. Сначала рассмотрим систему уравнений A8). Индекс т в этих уравнениях позволяет различать величины, относящиеся к различным допустимым зна- чениям q. Следовательно, можно отбросить этот индекс и переписать A8) в виде f i (q*) Mi (qz)—W ^ (Ni-i(Qa) + Ni+1(q2)) = 0, 1 = 0, ±1, ±2, .... B4) где Уравнения B4) образуют бесконечную систему линейных однородных урав- нений для амплитуд Nl{q1). Условием существования нетривиального решения, т. е. N,seQ для всех /, является равенство нулю детерминанта, образованного из коэффициентов при Nt. Корни этого уравнения', содержащего детерминант, определяют допустимые значения величин q'-. Обозначим их через qfn (tn = 0, rtl, ±2, ...). Каждому такому q- соответствуют, конечно, два значения q, а именно +\q\ и —\q\, и два ряда амплитуд, т.е. Nt (+ I q I) s^ Nf (q1) и Ni(.— IЯ I) = NT io1) A = 0, ±1, ±2, ...). Теперь рекуррентное соотношение B4) определяет для данного допустимого значения q2, например <у?я, все зна- чения Nf(q%) A = 0, ±1, -..) через одно из них, допустим iV+(^2n;). Так, все амплитуды Nt(q2) можно выразить через Ит(Ят) (т — 0, ±1, ±2,...). Последние следует определить из уравнений A9) и B0), число которых как раз достаточно для этой цели (заметим, что в выражениях E), A2), A5) и т. д. знак 2 означает суммирование как по А'*., ш, гак и по jV~., m).
560 ДИФРАКЦИЯ СВЕТА НА УЛЬТРАЗВУКОВЫХ ВОЛНАХ [ГЛ. 12~~ Получим теперь приближенное решение B4), используя метод возмущений. Следуя обычной процедуре метода возмущений и считая А малым параметром, разложим y\(=q2) и Nt по степеням '/,А; имеем %B1+-.. B66) Используя B66), можно записать /, (т)) в виде Ш=/| (ч(с>)+уДча)Л' (п@>) + (| аJ Гт|ау/(л10)) + т(т1а')'Л' (чм)| +.. .. B7) где штрих у / означает дифференцирование по т|. (Отмстим, что f't (т|), fi(r\) ... не равны нулю для всех положительных вещественных значений ц.) Подстав- ляя B6) и B7) в соотношение B4), имеем (/ = 0, ± 1, + 2, ...) =0. B8) Приравнивая сначала здесь нулю все члены, не зависящие от 4, получим в нулевом приближении Мт|1°')#Г(т1)-0 (/ = 0, ±1, ±2, ...). B9) Решениями уравнения B9) служат либо /,(г|(»>) = 0, Щт=?0, либо iVS°' = O, f,Dw)^0. C0) Обозначая через ц\т значение т]<0), определяемое уравнением /г(ч<01)=0. найдем из C0) r1«> = ^oofc-a—pf, ' ^«(nJ'OfeJV.^O C1) ^(ii/'O^JVJJHJV.A.,. C2) Далее, приравнивая нулю коэффициент при А в B8), получим ¦ h (С) ЛГ ОС) + nS7; (пи») ЛТ «') = ^i?i №> + л/ГЛ (пй1). C3) Полагая здесь последовательно l = m, m + 1, т—1, т + 2, т—2, .,. и нс- пользуя C2), найдем t&u = 0,, C4а) ^«ki»". ^lo» . C46) И m-0 для />2. C4в) Подобным же образом, приравнивая нулю коэффициент при Аа в B8), по- лучим следующие выражения для поправки к г\'„ и для амплитуд Nim до вто- рого порядка *): i Чп?= /- /„<ок } ,_<о)ч +, ТГТоп > C5а) дгB) , А'га.м "т±2,т 1 (п<0'1/ ГТпТЙТ *) Привсдсйныс здесь формулы справедливы, если все fm±1 ОД'). fm±i (ч"').--- отличны от нуля. Если это не так, то для учета вырождения указанный выше метод возмущений следует изменить. В расчетах возмущений до второго порядка вырождение сказывается при углах щщения света 6=0 и 6— arcsin (Х/2Л). Однако здесь мы больше не будем заниматься этим и в п. 12.2.5 приведем окончательные результаты для данных двух случаев,
§ 12,2] ДИФРАКЦИЯ СВЕТА НА УЛЬТРАЗВУКОВЫХ ВОЛНАХ' 561 Wmli.m = 0, Л/Й1,,„, = О для />3. (З5в) Как следует из предшествующих вычислений, в нулевом порядке теории возмущений отличны от нуля лишь величины Nтт (т = 0, ± 1, . . .); в первом порядке отличны от нуля Nтт и Nm±i m, а во втором порядке отличаются ог нуля также и Nт t2,m- Аналогично при вычислениях в более высоких порядках теории возмущений находим, что все большее число недиагональных амплитуд (т, е. амплитуд с разными индексами) отлично от нуля. Эти вычисления длин- ны, и мы не приводим их здесь. Однако можно предположить, что во всех слу- чаях применимости теории возмущений можно пренебречь членами высших порядков. Недиагональные амплитуды C46) и C56) полностью определены, если известны диагональные амплитуды, дающие решение B4) нулевого порядка. Мы находим последние из A9) и B0). Однако сначала поучительно исследовать решения этих уравнений в простом случае А = 0, для которого легко получить точное решение уравнений A8) — B0). Здесь возможными нулевыми ампли- тудами являются только диагональные амплитуды NnlJm(m = 0, +1, ±2, ...). Если мы положим вес недиагональные амплитуды в A9), B0) ранными нулю, то найдем, что все амплитуды Nm,m тождественно равны нулю, кроме Nfl0 ко- торые равны *) JV+ „ = (' ^?. ^ cos 6 Г(/22 — sin2 О)'/'— cosG] A +рг—2pcos2q0d)-l/> exp (мДО, где Р = +'" > ^ = arctg yzz—0^2 d ' @^) Для нормального падения света (9 = 0) из соотношений A1), C1) и C6) на- ходим C7) Ро = С помощью C6), B7) и B3) легко получается следующее выоажение для отра- жательной способности при нормальном падении на плоскопараллельпую пла- стинку: .С") 4pfl sin3 q(.,d 1 — Ро — 2р„..оз 2qod что согласуется с G.6.9), так как q§— nk при G = 0. Если А отличается от нуля, но остается еще достаточно малым, чтобы мож- но было применять метод возмущений, то из приведенного выше решения для Д _= 0 следует, что Таким образом, для нахождения диагональных амплитуд нужно решить уравнения A9) и B0) методом последовательных приближений. Кроме -юго, поскольку для нормального или почти нормального падения света (в экспе- риментах по дифракции на ультразвуке 9 равно самое большее 3°) отношение данного N~ -к соответствующему N+ мало (см C7)), можно вообще пренебречь *) В выражениях для /Vjo и No,o, приведенных в [15, 16J, имеются опечатки. В нашем тексте они исправлены*
562 ДИФРАКЦИЯ СВЕТА НА УЛЬТРАЗВУКОВЫХ ВОЛНАХ [гл. 12 N~ и определять N+ только из уравнений *) A9). Следует напомнить, что- такая же аппроксимация подразумевается и в случае использования граничных условий A2.1.15). Выражения для диагональных амплитуд N^.a, N±i, ±i и iV±s, ±2 можно теперь получить из A9), используя C46), C4в), C56) и C5в). Далее выражения для интенсивпостей линий в спектрах первого и второго порядков в прошедшем СЕете можно легко написать с помощью B2). Эти выражения будут приведены ниже. 12.2.5. Выражения для интенсивностеи линий в спектрах первого и второго порядков в некоторых специальных случаях, а) Случай 8/?<^;1 и | большого по сравнению с единицей. Этот случай рассмотрен подробно выше. Интенсивности /±1 и /±а линий в спектрах первого и второго порядков равны соответственно C8а> C86) В этих уравнениях берутся либо все верхние, либо -все нижние знаки. Мы приведем без доказательств выражения для интенсивпостей в двух других случаях, рассмотренных в работах [15, 16]. б) Случай I»1/,, /„ = C9а) C96) Выражения для 1Х н /_2 более сложны. Однако при | = V3 они принимают про- стой вид 1 „....[ ,...,*d*v\ ,_2y sm.lw(l±*M] C9в) и e) Случай нормального падения света (|=0), C9г) D0а> . D06) *) Это подробно разобрано в [15, 161. В частности, там показано, что влияние N~ на амп'штуды в[п cixi-лра в отражишом свете в oCinev. случае нельзя считать пренебрежимо
§ 12.2] ДИФРАКЦИЯ СВЕТА НА УЛЬТРАЗВУКОВЫХ ВОЛНАХ 563 Пренебрегая величиной 62ул, входящей в аргумент синуса в D0), можно также получить окончательные выражения из C8), полагая в них | — 0. Как уже } починалось, Бриллюэп [61 и Дэвид [71, а также Рыгов [17] вы- вели выражения C8) дли интенсивностеи линий первого и второго порядков способом, описанным в § 12 1. Аггарвол [18] получил выражения C8) из диф- ференциальных уравнений A2.1.21) Рамана и Ната. Фаризо 119] показал, что выражения C9) для интенсивностеи линий в первом и втором порядках при ?« л;1 2 можно также получить из уравнений *) B1). В этих результатах, ко- нечно, нет ничего удивительного,так как метод, основанный на дифференци- альных уравнениях Максвелла, и использованный здесь метод интегральных уравнений эквивалентны. 12.2.6. Некоторые качественные результаты. Как ясно из приведенных выше выражений для интенсивности, при таких значениях б и §, что либо 8<^1, либо 6/?<^ 1, с каждой стороны прошедшего пучка появляется лишь несколько спектров низших порядков и их интенсивности быстро убывают с ^ветичение*; порядка. Однако если ни одно из приведенных выше условий не вытгошяеки, 1. е. S и S/g велики по сравнению с единицей, то, вообще говоря, возникает значительно больше порядков. В этом случае решение уравнений A8) — B0), а значит, и расчет интенсивностеи в разных порядках оказываются более труд- ными. Исследуя условия применимоеiи метода возмущений, изложенного в п 12.2.4, можно показать [15, 16]. что при решении A8) — B0) надо считать амплитуды N[т не равными нулю юлько тогда, когда значения обоих индек- сов / и т находятся между числами — Мг и Мг, приближенно определяемыми, соотношениями @^§вг/) * — % + б2/. D1) Так как А, вообще говоря, не может существенно превышать 10~4 и максималь- ное значение А/Л, при котором можег наблюдаться явление дифракции, огра- ничивается практически достижимой разрешающей силой и т. д., то максималь- ное возможное значениеб(= ДЛ-Д-) примерно равно 100. Следовательно, даже п наиболее благоприятных эксперимента чьпых условиях придется решать са- мое большее 20 совместных линейных уравнений из Каждой бесконечной сис- темы A8), A9), B0). Но даже при таком упрощении эти вычисления утомитель- ны и их не производили. Числа М] и Мг указывают также число порядков, которые могут появиться с обеих сторон прямо прошедшего пучка света. Согласно D1) число порядков, возникающих по обе стороны прямо прошедшего пучка, должно становиться различным по мере тою как | =• (Л sin fl)/A увеличивается от нуля. Причем большее число линии появляется с той стороны, куда отражается свет ог вол- новых фронтов ультразвуковой волны. Партасаратн [20] экспериментально Таблица 12.1 Число наблюдающихся и предсказанных теорией порядков для различных углов падения 0 при дифракции света на ультразвуковых волнах 9 1 мг мг 0 0 5E) 5E) 0»06' 0,6 5F) 5D) О°22' 2 6G) 3C) 0°39- 4 6(9) 2B) 1°01" 6 3 2 8 2 1 V»45- 10 1 1 2°07' 13 1 1 *) Обсуждение экспериментальных результатов в связи с приведенными здесь различ- ными выражениями для ишеисивностей можно ваши в статьях [15, 16].
564 ДИФРАКЦИЯ СВЕТА НА УЛЬТРАЗВУКОВЫХ ВОЛНАХ [гл. 12 изучал дифракционные спектры при разщлх углах падения 6; на рис. 12.3 показаны фотографии, взятые из его статьи. В этом эксперименте (%!А) = --3-10; полагая АягЮ, мы получим из D1) для нормального падения M,=iMs=5. В табл. 12.1 указано число линий, фактически наблюдавшихся с каждой стороны прямо прошедшего пучка снега при разных углах падения. В скобках приведены соот- ветствующие теоретические значения, полученные из уравнения D1). (Конечно, если S/'s становится значи- тельно меньше единицы, то с каждой стороны прямо прошедшего пучка появляются только один или два порядка.) Аналогичные экспериментальные результаты бы- ли получены также Номото [21]. Зависимости М-, и М% от 6, полученные в его работе, хотя и находятся в качественном согласии с D1), показывают также не- большое периодическое изменение с | в области Os^ fc<6"''2. Уравнения D1) основываются на слишком грубых соображениях, чтобы объяснить эту особен- ность. 12.2.7. Приближение Рамана— Ната. Покажем теперь, что полученные Раманом и Натом выраже- ния для интенсипностей, содержащие функции Бес- селя, можно получить и из решения уравнений A8)— B0). Пренебрегая небольшим изменением частот т[ в зависимости от / и вспоминая, что q% я^ (га3го?„с~2—• — pfn), можно с хорошим приближением принять в знаменателе B5) pt-\-qi-\-2a>fc~i?« k2(n2~\-2). Поэтому B4) можно представить в виде о — пЧ* 2у6 -^Q, ±1, ±2, ...). D2) Рис. 12.3. Дифракция света на ультраза^ко- вых волнах [20] Спектры наблюдались при различных \глах падения в ам=з ю-» Ли 10-<). Выражения для интенсивностей, содержащие функ- ции Бесселя, получены Раманом и Патом при пре- небрежении членами 1A2+21%)/6]U( в уравнениях A2.1.21). В том же приближении мы можем пренеб- речь правой частью у D2). Тогда D2) можно пере- писать следующим образом: (Г=»0, ±1, где У- —k2 (я3— sin2 6) Для решения *) D3) допустим, что NL{q) имеет вид 12nllm \ Nt (q) = N exp М D3) D4) D5) где М — некоторое очень большое целое число, am — такое целое число, что 0М. (Мы сейчас покажем, что окончательный результат не зависит от *) Уравнения D3) аналогичны соотношениям, определяющим нормальные типы колеба- ний линейной цепочки атомов (см. [22]).
ЛИТЕРАТУРА 565 М.) Подставляя D5) в D3), получим для допустимых значений q2 соотношение 9J, = *» + 2n«cos(^), 0^m<M, D6) или, вспоминая, что \хй<^. Ь2, [(Ч){^)\ D7) Следовательно, для каждого т существуют два значения q, а именно ± \qm\; соответствующие амплитуды получаются из выражения 2). D8) Обе постоянные N+ и N~ в D8) теперь можно найти из A9).и B0). Как и в п. 12.2.4, мы пренебрегаем амплитудами Nfm и определяем постоянную N+ только из A9). Заметим, что при не слишком больших значениях /величина [a,(g)'g,(V/)J «s [o<,(q(°')i'gn ((/о0))]; поэтому можно показать, что уравнения A9) тождественно удовлетворяются, если принять в D8) ^ D9) Подставляя D8) и D9) в B2) и полагая (юрс~2—p'f) = (a>2c~-—pi), получим выражение для амплитуды Bt дифрагировавшей волны 1-го порядка SexPi4+AJco4)J E0) tn—Q Здесь фазовый множитель, не зависимый от т, опущен. Теперь, поскольку мы предположили, что М—очень большое целое число, можно заменить ряд в E0) интегралом. Полагая 2пт<М — \р' и <Л|/=2л/7И, перечитаем E0) в виде 2л Я, «|;jexp |/[Л|>' + (*?) cos *']}ch|>\ E1) который не зависит от М. Разделяя интеграл в E1) на две части: одну от О до Зя/2 и другую от Зл/2 до 2л — я полагая в них г(;' = я/2—ф и ф' = = 5л/2—г(; соответственно, получим [23] я ?,*!; ? exp^[-l/*-ty+(^)sin*]}dt = fiexp (i- Ик) J, (И«) . E2) — л Следовательно, интенсивности /г = |бг|а точно равны B''J^{ii'd/b). Кроме того, с помощью D4), A2.1.5) и A2.1.8) можно показать, что аргумент {\i2d'b) функций Бесселя J\ такой же, как и в выражениях, полученных Рамано.м и Натом и приведенных на стр. 553. ЛИТЕРАТУРА 1. Bergman n, Der Ultraschatl, Hirzel, Zurich, 1954. (Л. Б е р г м а и, Ультразвук и его применение в пауке и технике, ИЛ, 1957.) 2. L. В г i 1 1 о u i п. Ann. de Phjsique 17, 103 A921), 3. P. D e b у е, F. W. S с а г s, Proc. Nat. Acad. Sci. USA 18, 409 A932). 4. R. Lucas, P. В i q u a r d, J. Phys. Radium 3, 4G4 A932). 5. G. W. W i 1 1 а т d, J. Acoust. Soc. Amer. 21, 101 A949). 6. L. Brillouin. La Diffraction de la Lumiere par des Ultrasons Heraiann, Paris, 1933. 7. E. D a v i d, Phys. Z. 38, 587 A937). 8. С V. R a m a n, N. S. N. N a t h, Proc, Indian Acad. Sci. A2, 406, 413 A935); 3, 75, 119 A936). 9. R а у 1 e i g h, Proc. Roy. Soc. A79, 399 A907),
566 ДИФРАКЦИЯ СВЕТА НА УЛЬТРАЗВУКОВЫХ ВОЛНАХ [ГЛ. 12 10. Е. Т. W h i t t а к е г, G, N. W a t s о n, A Course of Modern Analysis, 4th ed. Cambr. Univ. Press. 1946. (Э. У и т т е к е р, Г. В а т с о и, Курс современного анализа, Гостех- издат, 1933.) 11. R. Е х t е г ш а п п, G. Wannier, Helv Phys. Acta 9, 520 A936). 12. N. S. N. N a t h, Proc. Indian Acad Sci A4, 222 A936), A8, 499 ((938). 13. R. R. Aggarwal, Ph. D. Thesis, Delhi Unnersity, India, 1954 14. E. H. Wagner, Z i. Phys. 141, 604, 622 A955) 15. W. J. N о b 1 e, Ph D. Thesis, University of Edinburgh, 1932. 16. А. В. В h a t i a, W. J. Noble, Proc Roy. Soc. A2Z0, 353, 369 A953). 17. С. М. Р ы т о в, Известия АН СССР, сер физ , № 2, 223 A937). 18. R. R Aggarwal, Proc. Indian Acad Sci A3I, 417 A950). 19. P. P h а г i s e a u, Proc. Indian Acad Sci. A44, 165 A956). 20. S- Parthasarathy, Proc. Indian Acad. Sci. A3, 442 A936). 21. О. Кошо1о, Proc. Ph>s -Math. Soc. Japan 24, 380, 613 A912). 22. M. Born, Th. v. К arm an, Phys. Z. 13, 297 A912). 23. H. J e f f г с у s, В. S. J с f f г с у s, Methods of Mathematical Physics, Cambr. Univ. Press, 1946, p. 547.
ГЛАВА 13 МЕТАЛЛООПТИКА До сих пор мы рассматривали распространение света в непроводящих изотропных средах. Теперь обратимся к оптике проводящих сред, главным образом металлов. Обычный кусок металла состоит из небольших кристаллов, ориентированных случайным образом. Монокристаллы заметных размеров встречаются редко, но их можно приготовить в лаборатории. Оптические свой- ства кристаллов рассматриваются в гл. 14. Очевидно, что совокупность слу- чапным образом ориентированных кристаллов ведет себя как изотропное тело, а поскольку в проводящей изотропной среде теория распространения света значительно проще, чем в кристалле, мы довольно подробно рассмотрим ее здесь. Согласно § 1.1 проводимость связана с выделением джоулева тепла. Это —¦ необратимое явление, при котором электромагнитная энергия исчезает или, точнее, превращается в тепло, в результате чего электромагнитная волна в про- воднике затухает. Вследствие чрезвычайно высокой проводимости металлов этот эффект в них сюль велик, что они практически непрозрачны. Указанное свойство позволяет металлам играть важную роль в оптике. Сильное погло- щение сопровождается высокой отражательной способностью, так что метал- лические поверхности служат прекрасными зеркалами. Частичное проникно- вение света в металл (хотя глубина проникновения и мала) дает возможность получать информацию о константах металлов и механизме поглощения да наблюдений отраженного света. Вначале ыы чисто формально рассмотрим результаты, вытекающие из наличия проводимости, а затем кратко обсудим простую, до некоторой сте- пени идеализированную физическую модель этого явления, основанную на классической электронной теории. Такая модель дает лишь грубое объяснение некоторым из наблюдающихся эффектов; более точную модель можно создать лишь с помощью квантовой механики, однако это выходит за рамки настоящей книги. Формальную теорию мы применим к двум проблемам, представляющим практический интерес: к оптике слоистых сред, содержащих поглощающий элемент, и к дифракции света на металлической сфере *). Чрезвычайно привлекательной математической особенностью теории яв- ляется то, что наличие проводимости можно учесть, просто вводя вместо ве- щественной диэлектрической проницаемости комплексную (или комплексный показатель преломления). В металлах преобладает мнимая ее часть. § 13.1. Распространение волн в проводнике Рассмотрим однородную изотропную среду с диэлектрической проницае- мостью 8, магнитной проницаемостью ц и проводимостью о. Используя ма- териальные уравнения A.1.9) — A.1.11), а именно j = aE, D = eE, В = цН, *) На русском языке вопросы металлооптики несколько в другом аспекте изложены н обзорных статьях Гинзбурга и Мотулсаич [81 *] и Мотулевич [81а*] и в монографии Соколова [824- {Прим. перев.)
568 МЕТАЛЛООПТИКА [ГЛ. 13 запишем уравнения Максвелла в виде rotH—?Ё = -^сгЕ, A> 0, B) div H = 0. D} Легко видеть, что для электромагнитного возмущения, падающего извне па проводник, мы можем заменить C) уравнением div E = 0. Действительно, если мы применим операцию дивергенции к уравнению A) и используем C), то получим divE = — а — р. с с е г Дифференцируя уравнение C) по времени, найдем divE^p. Исключая div Ё из двух последних уравнений, получим Р+^Р = О, E> или после интегрирования D) где Т=4Й5- F> Таким образом, видно, что любая плотность электрического заряда р экспо- ненциально уменьшается со временем. Время релаксации т чрезвычайно мало для любой среды, обладающей заметной проводимостью. Для металлов это время значительно меньше периода колебаний волны; например, для света в оранжевой области видимого спектра период колебаний равен 2- 10~" сек, тогда как для меди т/е порядка 2- 10~1Э сек. Для любого разумного значения в, которого можно ожидать, т так мало по сравнению с периодом световой волны, что в металле р всегда практически равно нулю. Тогда уравнение C) можна переписать в виде divE = 0. G> Из A) и B) после исключения Н и использования G) следует, что Е удовлетво- ряет волновому уравнению VE-?E + ^E. (8, Наличие члена с Е означает затухание волны, т. е. при распространении через, среду волна постепенно ослабевает. Если поле строго монохроматично и обладает циклической частотой со, т. е. если Е и Н имеют вид Е= Еоехр(—ш$, то производная <5/оЧ = —ico, и уравнения A) и {2) можно переписать следующим образом: rotE—i^H-0. A0) .Тогда уравнение (8) примет вид E AE = 0, (II)
§ 13.1] РАСПРОСТРАНЕНИЕ ВОЛН В ПРОВОДНИКЕ 569 где Если в эти уравнения ввести величину S ^, A3) то они формально станут идентичными с соответствующими уравнениями для непроводящих сред, где фигурирует вещественная диэлектрическая прони- цаемость 8. Аналогия с непроводящими средами станет еще ближе, если, кроме комп- лексного волнового числа k и комплексной диэлектрической проницаемости е, ввести также комплексную фазовую скорость v и комплексный показатель преломления п, которые по аналогии с A.2.8), A.2.12) и A.3.21) определяются как Ъ=гг?=г. й = 4 = /^=-?*. A4) Положим п=яA+*к), A5) где пил вещественны, и назовем к показателем затухания *). Величины пик легко выразить через материальные постоянные е, р, и о. Возводя в квадрат обе части A5), получим п2^пг A+2«—к2). Кроме того, иэ A4) и A3) имеем Приравнивая вещественные и мнимые части в этих двух выражениях для Я2, получим м2A—к2) = |хе, A6а) ^ *7. A66) Отсюда следует, что я1«'=т{ "/W+^-fie}. A76) Здесь выбран положительный квадратный корень, так как п и я/с вещественны, а следовательно, п1* и «V должны быть положительными. Уравнение A1) формально идентично волновому уравнению для непрово- дящей среды, но теперь волновое число комплексно. Простейшим решением A1) служит плоская гармоническая во времени волна E-Eoexp{i[?(r.s)—ы*]}. , A8) Если в соответствии с A4) и A5) подставить значение k из соотношения k = — тя/с = сопA + !'к)/с, то"A8) примет вид Е = Еоехр f—^nKd-s^exp |/ш [y(r-s) — <] }¦. Вещественная часть этого выражения, а именно Е = Еоехр [-¦^nK(r.s)]cos|»[i(r-s)-<]J, A9) •) Употребляется 1акже термин «коэ<))фициент экстинкции».
570 МЕТАЛЛООПТИКА [ГЛ. 13 представляющая собой электрический вектор, является плоской волной длиной X = 2яс:/мя. затухание которой определяется экспоненциальным членом. Так как. плотность энергии w волны пропорциональна среднему по времени от Е\ то ясно, что w будет уменьшаться в соответствии с законом йу = гюоехр [— X(r-s)], B0) где 2й> . 4яv 4п ._ 4я . % = ПК = ПК = — ПК = -г- К. л с с л0 Л B1) Здесь Х„ — длина волны в вакууме, X — длина волны в среде. Постоянная % называется коэффициентом поглощения. Плотность энергии падает в е раз на расстоянии d, где X 4яяге 4пк ' Обычно эта величина составляет очень малую долю длины волны (см. табл. 13.1} *). Таблица 13.1 «Глубина проникновения» d излучения с различными длинами волн %„ для меди @~5,!4-1О17 сек-1, Ц=1) К d Ультра фиолетовая область 1000А=10-5 см 6,2-10-8 см Инфракрасная область 10 лк = 10-3 см 6,2-Ю-7 см евч 10 см 6,2-10-5 см Длинные радио- волны 1000 л = 105 см 6,2-10-з см Возвращаясь к уравнениям A7), мы видим, что когда о = 0, первое урав- нение точно переходит в соотношение Максвелла A.2.14) га3=|ле, а второе дает к = 0. Для металлов о^=0 а фактически так велико, что в A7) можно пренебречь величиной н по сравнению с 2a/v. Чтобы оценить порядок рассмат- риваемых величин, заметим, что для большинства металлов **) ст~-101' сек, и поэтому для X —- 5500 А (что соответствует частоте v = 5,5-10" сек) or/v ~ 200. Диэлектрическую проницаемость е металла невозможно измерить прямо, по как мы покажем, ее легко получить из отических экспериментов. Однако ме- ланизмы электрической поляризации в металлах и диэлектриках не могут Фундаментально отличаться друг от друга, и поэтому мы вправе предположить, что в обоих типах сред е одинаково по порядку величины. Следовательно, для не слишком коротких длин волн можно считать, что B3) B4) B5) Идеальный проводник характеризуется бесконечной про'водимостыо (о->- cl Так как, согласно A6), s/o" = (l — «2)/v/c, то в этом предельном случае Уравнения A7) и B2) переходят при этом в : =л ца *) Явление проникновения па глубину, составляющую малую часть длины волны, хо- рошо известно для переменных токов. В технике оно называется «скик-эффектода. *¦•) Значение, используемое авторами для величин о, относится к статической проводи- мости. Однако в формуле A7) доллма фигурировав проводимость на частоте v Эт"! величиид и оптическом диапазоне для типичных металлов порядка 10*5 сек~1. (Прим. перев.)
§ 13.2] ПРЕЛОМЛЕНИЕ И ОТРАЖЕНИЕ НА ПОВЕРХНОСТИ МЕТАЛЛА 571 /с2-* 1 или на основании A6а) п—>-оо. Такой проводник вообще не позволял бы электромагнитной волне проникать на какую-либо глубину и отражал бы весь падающий свет (см. ниже, § 13.2). Если показатель преломления прозрачных веществ можно легко измерить по углу преломления, то такие измерения для металлов исключительно труд- ны, так как металлический образец, пропускающий заметную долю падающего света, должен быть чрезвычайно тонким. Тем не менее Кундту [11 удалось из- готовить металлические призмы и провести прямые измерения вещественной и мнимой частей комплексного показателя преломления. Однако обычно опти- ческие постоянные металлов определяются посредством катоптрических, а не диоптрических экспериментов, т. е. путем изучения тех изменений, которые возникают при отражении света от металла, а не при прохождении через него. § 13.2. Преломление и отражение на поверхности металла Мы видели, чго основные урлипешш, описывающие распространение плос- кой гармонической волны в проводящей среде, отличаются от соответствующих уравнений для прозрачного диэлектрика лишь тем» что вещественные постоян- ные кий заменяются на комплексные s и к. Отсюда следует, что форм\ 1Ы, полу- ченные в гл. 1, применимы и в данном случае, поскольку они содержат лишь линейные соотношения между компонента-in векторов поля плоских монохро- матических волн. В частности, остаются справедливыми граничные условия для распространения волны через поверхность раздела, а, следовательно, также формулы, приведенные в § 1.5 и относящиеся к преломлению и отражению. Рассмотрим вначале распространение плоской волны из диэлектрика п проводник, причем обе среды будем считать бесконечными, а за поверхность раздала между ними выберем плоскость г — 0. По аналогии с A.5.8) закон преломления можно записать в виде sin 0( = 4- sine,-. A) Так как п — комплексно, то комплексным окажется и 9,. Таким образом, эта величина уже не имеет простого смысла угла преломления. Выберем в качестве плоскости падения плоскость хг. Тогда зависящая.от координат часть фазы волны в проводнике определится выражением /i(r-s">), где (см. A.5.4)) Из A) и B) и A3.1.15) имеем с а та А * 1 / г /• (За) s«> = cos в, = Vl -sin* в, = ]/ 1 -4^% sin* 0,- +1 пН1%^ sin* в,.. C6) Удобно выразить s<" в форме s'p = cos et-^qe'i D) (q, у вещественны). Можно сразу же выразить q и у через я,( ,к и sin 0,-, если возвести в квадрат соотношения C6) и D) и приравнять отдельно вещественные и мнимые части. Это дает bg -4^?sm-'Qi. E)
572 МЕТАЛЛООПТИКА [ГЛ. 13 Отсюда следует, что k (г • s«>) - -^ п A + не) (xsf + zsf) = = y [x sin 0,- + znq (cos у —к sin у) + inzq (к cos 7 -j- sm 7)]. F) Мы видим, что поверхности постоянной амплитуды определяются урав- нением г = const G) и поэтому являются плоскостями, параллельными поверхности раздела. По- верхности постоянной вещественной фазы определяются уравнением xsmQ^ znq (cosy—/csinY) = const 18) и являются плоскостями, нормали которых образуют угол Q't с нормалью к гра- нице, причем COS 6' = я? (cos у—к sin у) -¦ у" sin2 0, -(-л2?2 (cos у—к smfja ,_. sm 0, ^' у sin2 й, +n2(/2 (cos у—к sin уK В общем случае поверхности постоянной амплитуды и поверхности постоянной фазы не совпадают друг с другом, и поэтому волна в металле оказывается не- однородной. Если квадратный корень в (9) обозначить Через п', то уравнение для sin в^ можно переписать в виде sm 9J = sin 9,/я', т. е. в форме закона Снсллиуса. Однако здесь п' зависит не только от величин, характеризующих среду, но и от угла падения 6г. Подставляя комплексное значение для 64 из A) в формулы Френеля (см. п. 1.5 2), легко также получить выражения для амплитуд и фаз преломленной и отраженной волн R явном виде они будут приведены в п 13.4.1 при изло- жении теории слоистых проводящих сред. Здесь мы покажем, как можно по- лучить оптические постоянные металла из наблюдений отраженной волны. Так как, по предположению, первой средой служит диэлектрик, то отра- женная волна будет обычной (однородной) волной с веществьнной фазой. Как и в A.5.21а), компоненты амплитуды падающей волны Ап и ^4j и соответст- вующие компоненты отраженной волны R u и R i связаны соотношениями Поскольку угол 6( комплексный, то комплексны и отношения R<\IA u и R JA:, 1 с при отражении происходят характерные изменения фазы Таким образом, падающий линейно поляризованный свет при отражении от поверхности ме- талла в общем случае становится эллиптически поляризованным Пусть ф, и фд_ — фазы, а Рц и р^ — абсолютные значения коэффициентов отражения, т. е. /•ц = -^;=р1|ехр(/ф||), Гх = д±г=р±ехр(^фх). A1) Предположим, что падающий свет линейно поляризован и азимутальный угол равен ait т. е. и пусть аг — азимутальный угол (обычно комплексный) для отраженного
§ 13.2] ПРЕЛОМЛЕНИЕ И ОТРАЖЕНИЕ НА ПОВЕРХНОСТИ МЕТАЛЛА 573 света. Тогда *) ,-9f) , -De-lAtffa где p ^ = <Pii — «Pi.- A3) A4) Заметим, что величина аг вещественна в следующих двух случаях: 1. При нормальном падении @, = 0); тогда Р = 1 и Д = —и, так что tgar — = — tga,. 2. При скользящем падении @, = и/2); тогда Р = 1 и А = 0, так/что tgar = Необходимо напомнить, что в случае нормального падения направления падающего и отраженного лучей противоположны, таким образом, отрицатель- ная величина tgar означает, что направление поляризации линейно поляризо- ванного света не изменяется в пространстве. Оно не меняется и при скользящем >гле падения. Между двумя только что рассмотренными экстремальными углами су- ществует так называемый главный угол падения 9„ для которого Д=—я/2. При этом угле линейно поляризованный свет в общем случае превращается после отраже- ния в эллиптически поляризованный свет, но, как легко видеть из A.4 316) (для б = л/2), одна из осей эллипса поляризации параллель- на, а другая перпендикулярна к плоскости па- дения Если, кроме того, Ptga, = 1, то, сог- ласно A3), tga,. = —i и отраженный свет по- ляризован ПО кругу, рис 13 ! Эллипс поляризации для Предположим, что на металл падает ли- света, отраженного от металла при нейно поляризованный свет, и между R., и главном угле падения. R^ вводится с помощью подходящего компен- сатора (см п 14.4.2) дополнительная разность фаз Д. Если полная разность фаз равна нулю, то, согласно A3), отраженный свет линейно поляризован с азимутом а'г, определяемым из соотношения tg a^ — Л tga,-. A5) По очевидным причинам угол а'г называется углом восстановленной поляриза- ции, хотя его обычно определяют только для падающего света, линейно поля- ризованного с азимутом "¦')я, --45°. Значения а'г и Р, относящиеся к главному \1лу падения 0, = 0,, обозначим соответственно через а'г и Р. Если мы пред- ставим, что вокруг эллипса поляризации отраженного света, падающего под главным утлом (дополнительная компенсация отсутствует), описан прямоуголь- ник, стороны которого параллельны и перпендикулярны плоскости падения, то отношение его сторон составляет Ptga,, а угол между диагональю и плос- костью падения равен а'г (рис. 13.1). Для дальнейшего полезно ввести такой угол if, что _ значение г];, соответствующее главному углу падения, обозначим через я)>. Используя A) и A0) и зная постоянные металла п и к, легко найти зависи- мость величины P(=tgtp) и Д от 0,. На рис. 13 2, а она показана для типич- ного случая. На рис. 13.2, б для сравнения приведены аналогичные кривые, *) Мы пишем —(Д. а не +(Д н экспоненте правой части A3), чтобы облегчить сравнение с результатами, приведенными в § 1 5 **) Тогда аг равен углу ij), введенному в A6).
574 МЕТАЛЛООПТИКА [ГЛ. 13 относящиеся к случаю отражения от прозрачного диэлектрика. Для света, отраженного от поверхности металла, отсутствует тот резкий скачок 4 от —л до 0, который происходит при отражении света под углом Брюстера от прозрач- ного диэлектрика. Отсутствует также острый максимум tgi|.\ ранный беско- нечности, и кривая для металла оказывается довольно гладкой и имеет срав- нительно широкий максимум. Уго. i падения, при котором достигается это г максимум, иногда называют углом наи- большой поляризации. Он очень близок к главному углу падения Й;. Обыч- 'во°75°9О°01 но допускают, что указанный максимум находится точно при &{. Это предполо- жение почти всегда оправдывается, ес- ли п'A + «3);>>1, что обычно и наблю- дается (см. ниже табл. 13.2). Однако в общем случае эти два угла различны. Например, для серебра при длине вол- ны 3280 А величина геаA+/с2) мала; , = 47,8° и ч|) = 58,2\ тогда как мак- симум tgih приблизительно соответ- Рис. 13.2. Величины-Д=ф1-ф,| и Р=Щ= ствует 0, -= 40° и it = 60,5°. =pj_/Pll , характеризующие изменение состоя- J n ' 'УП1а - ния поляризации света при отражении от ти- Вообще говоря, проблема заклю- ничного металла (а) и прозрачного диэлект- чается пен том, чтобы найти ф и Д по рика (б). известным значениям я и /с, а чтобы определить п и к из экспериментально наблюдаемых амплитуды и фазы света, отраженного от металла. Так как все величины R „, R±, tp „, Фх, ф и А являются функциями 9;, а так- же п и к, то измерение любых двух из них для какого-то значения угла падения 0, позволит, вообще говоря, найти я и к. Во многих экспериментах определяют последние две из этого ряда величин, и поэтому мы выведем фундаментальные зависимости я и «: от г|з и Д. Из A) и A3) имеем 1 — Рехр(— гД) cos 9,- cos в, * — sin-в,- 1-)-Рехр(— (Д) sin 0, sin e, sin9,-tgO,- ' Так как Р = tgi|;, левую часть уравнения A7) можно привести к виду I — Рехр (— (А) 1—ехр(— iA) tgtj) _ cos2x|) + ' s'n 2ф sin Д 1 -t-Pexp(— «A) 1 +exp (— (A) tgij> 1 -f sin Из A7) и A8) имеем У п2 — sin^ О,- cos 2<]з +1 sin 2^|) sin A 1 + sin 2ij)cos Д sin в, tg в/ В видимой области спектра обычно и поэтому величиной sin2 0г можно пренебречь по сравнению с я3. Тогда Я " n(l-t-wc) cos2'4> + i sin 2ip sin Д sin Of tg 0,- sin (I,- tg Of Приравнивая вещественные части, найдем "п 1 -j- sin 2i|v cos A A7) A8) A9) B0) B1) sin 0, tg 6; .cos 2-ф B2a) I -j-sin 2\p cos A Приравнивая мнимые части и используя B2а), получим к « fg 2i|) sin Д» B26) Эти выражения дают возможность рассчитать оптические постоянные пик по измеренным значениям ijini при любом угле падения, В частном случае,
§ 13.2] ПРЕЛОМЛЕНИЕ И ОТРАЖЕНИЕ НА ПОВЕРХНОСТИ МЕТАЛЛА 575 если измерения проводятся при главном угле падения 0$> то А==—re/2, i|j == = i|) и уравнения B2а) и B26) переходят в п « — sin 6~, tg Qc cos 2ф, B3а) к« —tg2^. B36) Иногда оказываются полезными и другие соотношения для я и к. Без ис- пользования условия B0) найдем, возводя в квадрат A9), Я3—sin2 0/ __cos2 2-ф — sin-5 2-ф sin2 \-\-i sin 4i|> sin Д UPTuFT UrPeTuFeT ~ u + sin 24) cos дJ Если подставить и приравнять отдельно вещественную и мнимую части, то мы получим B5а) В частности, при главном угле падения (в(. = 0„ Д=—я/2) эти уравнения принимают вид *) w2 A — к2) = sins ё, A + tg26,- cos 4ф), B6а) 2n2/c = —sin2"e,tg2e, sin4^. B66) Формулы B5) дают не п и к, а комбинации иаA — ка) я игк;. Обращаясь к A3.1.16), мы видим, что эти величины имеют простой физический смысл. При i-1 — l (что всегда справедливо в оптическом диапазоне) п2A — к-) — ди- электрическая постоянная, а я'2;с — отношение проводимости к ччетоте. Из значений этих величин и, в частности, из их дисперсии можно получить ин- формацию о структуре металлов (см. ниже, § 13.3). До сих пор наш анализ относился к амплитудам компонент отраженного света, но, как мы вскоре увидим, можно получить полезную информацию и из сравнения интенсивностей отраженного и падающего света, особенно при боль- ших длинах воли. Для нормального падения (8, =-0) различие между Rit и i?j_ исчезает, плоскость падения становится неопределенной, и можно написать &=¦ B7) Если использовать A) и A0) (или заменить п на Я в A.5.23)), то мы получим Я+1 /г2A+^)+1+2« v ' Оптические постоянные многих металлов определялись с помощью изме- рений в отраженном свете. В табл. 13.2 приведены значения постоянных, наи- денные различными исследователями для длины волны, соответствующей жел- той области видимого спектра. Металлы расположены в порядке убывания их отражательной способности 5S. Отмстим, что во всех случаях п<^пк, и по- этому, согласно A3.1.16а), цс. и, следовательно, к отрицательны (поскольку в оптическом диапазоне |х« 1). На первый взгляд представляется, что отрица- тельной диэлектрической проницаемости нельзя приписать физический смысл. *) Уравнения B3) и B6), которые справедливы только при главном угле падения, про- ще, чем более общие выражения B2) или B5), и лишь по этой причине многие эксперимента- торы ограничивались измерениями при главном угле. Для других углов падения эксперимен- тальная точность может быть выше. Выбор подходящего угла падения рассматривается в ра- 1 ботах [2— 61.
576 ЛЕТАЛЛООПТИКА [ГЛ. 13 Позже мы покажем, что это не так и что отрицательное значение е можно объ- яснить, исходя из некоторых простых предположений об электронном меха- низме проводимости. Из табл. 13.2 может показаться, что значения га<1 всег- да связаны с высокой отражательной способностью, однако это не является общим правилом *). Таблица 13.2 Оптические постоянные металлов для длины волны ^,=5893 А (В-линмя натрия) [7] Металл Натрий твердый Серебро массивное Магний массивный Калии расплавленный Кадмий массивный Алюминий массивный Олово массивное Золото электролитическое Ртуть жидкая Цинк массивный Медь массивная Галлий монокристалл Сурьма массивная Кобалы массивный Никель электролитический Марганец массивный Свинец массивный Платина электролитическая Рений массивный Вольфрам массивный Висмут массивный Железо испаренное п 0,044 0,20 0,37 0,084 1,13 1,44 1,48 0,47 l',60 1,93 0,62 3,69 3,04 2,12 1,58 2,41 2,01 2,63 3,00 3,46 1,78 1,51 ПК 2,42 3,44 4,42 1,81 5,01 5,23 5,25 2,83 4,80 4,66 2,57 5,43 4,94 4,04 3,42 3,88 3,48 3,54 3,44 3,25 2,80 1,63 0,97 0,94 0,93 0,92 0,84 0,83 0.83 0,82 0,77 0,75 0,73 0,71 0,70 0,68 0,66 0,64 0,62 0,59 0,57 0,54 0,54 0,33 Исследователь Дункан 1913 Оппитц 1917 Друде 1890 Натансон 1928 Друде 1890 Друде 1890 Друде 1890 Мейер 1910 Ловери и Мур 1932 Мейер 1910 Оппитц 1917 Ланге 1935 Друде 1890 Майнор 1904 Мейер 1910 Литтлтон 1911 Друде 1890 Мейер 1910 Ланге 1935 Литтлтов 1912 Мейер 1910 Мейер 1910 Значения, указанные в табл. 13.2, не согласуются с формулами A3.1.160) пли A3.1.24). Например, для меди а = 5,14-1017 сек.'1, так что для света с дли- ной волны 5893 A (v~5-1014 cea~l) a/v~10\ тогда как, согласно таблице, «2гс ~ 1,57. Кроме того, изучение зависимости оптических постоянных от час- тоты показывает значительно более сложное поведение, чем предсказанное нашей формулой (см. ниже, рис. 13.3). Таким образом, необходимо сделать заключение, что нлп;а теория не адекватна, когда ока применяется к излуче- нию в видимой области электромагнитного спектра. Это расхождение между теорией и экспериментом, по-видимому, не так удивительно, если вспомнить, что даже для прозрачных сред соотношение, связывающее материальные по- стоянные с показателем преломления (соотношение Максвелла це — п1), имеет ограниченную применимость. Объяснение аналогично данному ранее: мы не находим подтверждения предположению, что е, и. и о являются действительно постоянными и должны рассматривать их как функции частоты; следовательно, и показатель преломления, и показатель поглощения также будут зависеть от частоты. Единственное различие в механизме дисперсии заключается в том, что в прозрачной среде дисперсия связана с вынужденными колебаниями свя- занных электронов, тогда как в металле она связана с вынужденными колеба- ниями свободных электронов. Мы подробно обсудим это в § 13.3; здесь мы от- метим лишь, что если интерпретировать s как статическую диэлектрическую проницаемость и о — как статическую проводимость, то можно ожидать, что *) Когда л.< 1, вещественная фазояая скорость с!п превышает скорость света в вакууме, i но, как показано в конце п. 1.3.3, это не противоречит теории относительности.
§ 13.2] ПРЕЛОМЛЕНИЕ И ОТРАЖЕНИЕ НА ПОВЕРХНОСТИ МЕТАЛЛА 677 наша теория окажется справедливой только для достаточно медленных колеба- ний (длинных волн). Хаген п Рубенс 181 показали, что для инфракрасного излучения с длиной волны ?и>1,2-10~3 см отражательная способность, рас- считанная по данным о статической проводимости, находится в хорошем согла- сии с экспериментом. Если подставить п и пк из A3.1.24) в уравнение B8), оно примет вид (счи- тается, что |х — 1) B9) 2-1 + 1+2 ]/a/v Когда via достаточно мало, можно пренебречь единицей по сравнению с. дру- гими членами и разложить B9) в ряд по степеням ]/v/a. Тогда мы получим Я я» 1 — 2 j/v/c? + . ^ C0) Хаген и Рубенс нашли, что при %—\,2-10~3 см для меди 1—5S = l,6-10~2, тогда как использование в C0) статической электрической проводимости дает 1—52 = 1,4-10~3. При увеличении длины волны величина 31 становится почти равной еди- нице, так что трудно измерить 1—Э1 с достаточной точностью. Однако Хаген и Рубенс получили полезные оценки косвенным методом. Согласно закону Кирхгофа для теплового излучения *) отношение излучателыюй способности ?v к поглощательной способности Л„ какого-либо тела **) зависит лишь от частоты излучения v и температуры Т этого тела, но не от его природы, т. е. ?v/4v = tf(v, Г). C1) Здесь /C(v, Т) ¦—• универсальная функция v и Т. Очевидно, К равно излуча- тсльной способности тела, иоглощательная способность которого равна еди- нице (так называемое абсолютно черное тело). Рассмотрим металлический об- разец такой толщины, что вся энергия падающего излучения, которая не от- ражается, поглощается внутри образца. Тогда Лу=1 — Я, C2) и из C0), C1) и C2) получим _ или ]/a?s = 2Kv/C(v, T), C4) Правая часть последнего уравнения не зависит от природы металла. Это хорошо известная функция v и Т, причем функция К{\\ Т) точно известна и из экспе- римента, и из теории и выражается знаменитой формулой Планка ***). Отсюда следует, что справедливость формулы C0) можно проверить даже тогда, когда отражательная способность 5J очень близка к единице. Определяя проводимость а и излучательную способность Е^ в зависимости от частоты и температуры, легко установить, удовлстворяет ли произведение У a?v урав- нению C4). Хаген и Рубенс, используя так называемые остаточные луча, подтвердили справедливость уравнения C4) для длинного инфракрасного из- лучения. Остаточные лучи — это лучи, которые остаются из всего широкого •) См.. например, [9] или [10]. **) Под излучатслыюй способностью понимается лучистая энергия,'испускаемая телом в 'единицу времени, под поглощательной способностью — часть лучистой энергии, падающей на тело, которая поглощается им. ' ! **•) См., например, [11].
578 МЕТАЛЛООПТИКА [ГЛ. 13 спектрального интервала после ряда отражений от определенных кристаллов, например флуорита, каменной соли или сильвина. Указанные вещества обла- дают резко выраженными максимумами поглощения в спектрально1! области от % = 22,9 мк до 63 мк и, следовательно, (см. B8)) высоким селективным отражением для таких длин волн. На рис. 13.3 приведены эксперименталь- ные кривые, иллюстрирующие зависимость п и пк от длины волны для серебра. Для срав- нения показана также теоретическая кривая, рассчитанная по формуле A3.1 24). Здесь при- нят логарифмический масштаб, и поэтому те- оретический график имеет вид прямой wrO32B№ 5ШШШЛ А где С —\gv\w/c. Воспользовавшись A3.1.24) и C0), можно также выразить п и пк через отражательную способность (для длинных волн) в виде я«1И»-Д-. C5) График функции 2/A—Э1) также приведен для сравнения на рисунке. Мы видим, чго экспериментальная кривая для пк имеет рез- кий минимум вблизи X — 3000 А, а кривая для п — значительно более плоский минимум вблизи X — 5000 А В области X - 3300 А от- ражательная способность серебра очень мала. При увеличении длины волны экспериментальные кривые приближаются к теоретической кривой, рассчитанной по измеренной электропроводности. Рис. 13.3. Зависимость оптических постоянных серебра от Ачины волны, /-теоретическая кривая пк, //-экспе- риментальная кривая 2''A— f/i) 111 — экснеричентал1 кая кр! nai пи Л/-:жс перикептальпа;; Kpi'J^ni и Лсл ;:;>нс] ии- ческнй масштаб § 13.3. Элементарная электронная теория оптических постоянных металлов Формальная теория, развитая в предыдущих разделах, рассматривает металл как непрерывную проводящую среду, характеризуемую диэлектриче- ской проницаемостью е, магнитной проницаемостью ц. и электрической про- водимостью а. Как мы видели, эту теорию нельзя считать достаточно удов iei- ворительной в оптической области электромагнитного спектра. Лучшей пред- ставляется теория, которая рассматривает металл не как бесструктурную среду, а как систему фиксированных ионизированных атомов металла и свободно (или почти свободно) движущихся между ними электронов. В соответствии с A3 1.7) полный свободный заряд в металле равен нулю, но можно предположить, что именно подвижность свободных электронов служит причиной зависимое i оптических постоянных металла от частоты падающего излучения. Если рас- сматривать электроны как частицы, подчиняющиеся законам классическои механики, то такая теория по-прежнему не будет удовлетворительно описы- вать все наблюдаемые особенности поведения металла. Полное согласие с экспе- риментом способен дать лишь подход, основанный на квантовой механике. Однако такое рассмотрение выходит за рамки настоящей книги. 3 \ссь мы лишь кратко укажем, как классическая атомистическая модель объясняет, по крайней мере до известной степени, те расхождения, с которыми мы столкну- лись.
§ 13 3] ЭЛЕКТРОННАЯ ТРОРИЯ ОПТИЧЕСКИХ ПОСТОЯННЫХ МЕТАЛЛОВ 579 Рассмотрим электроны, движущиеся через решетку, образованную иона- ми. Они движутся практически свободно, за исключением коротких периодов столкновений с ионами, и течение которых между ионами и электронами про- исходит обмен небольшими количествами энергии. Мы не можем входить в де- тальное исследование этого процесса, который необходимо рассыацлтать с помощью статистических методов кинетической теории газов. Весьма прав- доподобным представляется вывод о том, что указанный процесс в среднем можно характеризовать определенной силой трения, пропорциональной и пропшоположпои по направлению скорости движения некоторой квазичзс]и- цы Поведение этой квазичастицы, являющейся моделью электрона, отражает среднее поведение всей системы электронов Уравнение движения такого мо- дельного электрона в электрическом поле Е запишется в виде mr-t-m|3r=-eE, A) где /и — масса, е — заряд электрона и р — показатель затухания, отнесенный к единице массы. Для того чтобы понять смысл постоянной р, рассмотрим вна- чале случай, когда электрическое поле отсутствует. Если Е = 0, то гН-Эг = О. B) Решение этого уравнения имеет вид г = г0—jvoexp(— p7), r = v=voexp(—P0- C) Мы видим, что в данном случае электрон экспоненциально замедляется, начи- ная от скорости v0, причем показатель затухания равен C. Время т= 1/р1 на- зывается временем затухания. Рассмотрим теперь гармоническое во времени "поле Е=Еоехр(—imf). Тогда решение уравнения A) является суммой двух членов, один из которых представляет затухающее движение (решение однородного уравнения B)), а другой описывает периодическое движение Е Периодическое движение вносит в поляризацию среды вклад о = ег. Если в единице объема содержится N свободных электронов, то полная поляризация Р, обусловленная всеми электронами, равна Р^Р„-т(Дг.ра)Е. E) Так как вЕ = Е + 4яР, отсюда следует, что Поскольку (при ц = 1) е = л2A — к!)+2т2/с, то, приравнивая отдельно ве- щественные и мнимые части и используя уравнения A3.1.16), получим Если р невелико, то для достаточно малых значений со величина 8 отрицатель- на Критическое значение а<,, при котором в меняет знак, определяется выра- жением »е' = ^-Р=. (8) Используя это выражение, можно переписать уравнения G) в виде e = n.(i_K.)j=i_^±P!.j (9a) 37*
580 МЕТАЛЛООПТИКА [гл. 13 Предположим, что со? значительно больше Р2; тогда вместо (8) мы можем написать Если ограничиться также достаточно высокими частотами (со2^>рз), то вместо (9) получим более простые формулы е = п2A—к2)» 1 —Г-^у, (Па) V '^ 2со \ со у * Из A1а) следует, что если а><ыс, то г отрицательно и к>1. Мы видим теперь, что отрицательное значение вещественной части диэлектрической про- ницаемости имеет вполне определенный смысл. Оно указывает, что поле, воз- никающее в результате колебаний электронов, находится в противофазе с воз- буждающим полем. Отражательная способность, определяемая выражением {13.2 28), в рассматриваемом случае очень велика. Если же oi>co,., то е при- нимает положительное значение, к пе превышает единицы и отражательная способность падает до чрезвычайно низкого значения. Среда становится до- вольно прозрачной, похожей на диэлектрик. Именно такие явления наблюдаются в случае щелочных металлов. В об- ласти длинных волп они непрозрачны и обладают высоким отражением, тогда как при некоторой критической длине волны в видимой или ультрафиолетовой области спектра они становятся прозрачными и сравнительно мало поглощают. Во второй строке табл» 13.3 указаны экспериментально найденные длины Таблица 13.3 Критические длины волн %,. Металл (л<г) набзп °- i с) расч* & " эфф N Литий 2050 1500 0,54 Натрий 2100 2100 1,00 Калий " 3150 2900 0,85 Рубидий 3600 3200 0,79 Цезий 4400 3600 0,67 волн, при которых происходит такой переход. В третьей строке приведены критические длины волп Хг = 2яс/ыс, рассчитанные по приближенной формуле A0), где число свободных электронов считается равным числу N атомов в еди- нице объема. Как мы видим, для всех металлов, кроме натрия, наблюдаемые и рассчитанные значения критических длин волн различны. Последняя строчка содержит отношение концентрации «эффективных» электронов N^ к концент- рации атомов, найденное из соотношения Как мы видим, это число порядка единицы, хотя и заметно меньше (для всех металлов, кроме натрия). Итак, элементарная теория дает правильный порядок величины параметров, но не описывает деталей явления. Предложенную выше теорию можно улучшить, если вместо грубых прибли- жений (И) использовать более точные формулы (9), содержащие показатель затухания р\ Однако расчет р невозможен в рамках классической теории и требует привлечения квантовой механики. Еще одним указанием на неудов- летворительность классической модели служит появление другой области
§ 13.4] РАСПРОСТРАНЕНИЕ ВОЛН В СЛОИСТОЙ ПРОВОДЯЩЕЙ СРЕДЕ 581 непрозрачности при коротких длинах волн, которая не предсказывается на- шими формулами. Наличие этой области можно объяснить на основе квантовой механики как результат поглощения, связанного с внутренним фотоэффекты. За счет энергии падающего света электроны с их нормальных орбш переходят в возбужденные состояния. Однако такие соображения выходят за рамки на- стоящей книги. § 13.4. Распространение волн в слоистой проводящей среде, Теория металлических пленок В § 1.6 мы изучали распространение электромагнитных волн в слоистых диэлектрических средах, т. е. в диэлектрических средах, оптические свойства которых зависят лишь от одной из декартовых координат. Сейчас мы кратко рассмотрим обобщение теории на слоистые среды, содержащие поглощающие элементы. Таким образом, мы предположим, что в дополнение к е и ji, завися- щим лишь от одной координаты, имеется конечная проводимость а, которая также является функцией только этой координаты. В начале § 13.2 мы уже указывали, что все формулы гл. 1, которые со- держат лишь линейные соотношения между компонентами векторов ноля гармонической волны, остаются справедливыми и для проводящих сред, если вещественную диэлектрическую проницаемость е и вещественное волновое число k заменить соответственно на комплексную диэлектрическую проницае- мость s = в + [4л от/со и комплексное волновое число & = w (/u (e -t-»4ло7<й)/6\ Следовательно, мы можем использовать основные формулы теории слоистых диэлектрических сред, выведенные в § 1.6, при в условии, что в соответствующих формулах бу- Диэлектрик \ дет сделано указанное формальное измене- ние. Отсюда, в частности, следует, что слои- стую поглощающую среду можно характери- зовачь матрицей 2x2. Однако элементы этой ^ матрицы, к отличие от матрицы, относящейся Диэлектрик /?Л "' к диэлектрической слоистой среде, уже не яв- ляются вещественными или чисто мнимыми, рис. 13.4. Поглощающая пленка, а представляют собой < комплексные числа, расположенная между двумя ди- содержашие как вещественную, так и мни- электрическими средами, мую части. ( Для иллюстрации теории подробно рассмотрим два случая, представляю- щих практический интерес. 13.4.1. Поглощающая пленка на прозрачной подложке. Рассмотрим пло- скопараллельную поглощающую пленку, расположенную между двумя ди- электрическими средами (рис. 13.4), Формулы, относящиеся к отражению и пропусканию пленкой плоской монохроматической волны, получаются из уравнений A.6.55) — A.6.58) при замене п2 на п2 = гааA + ^г). Удобно поло- 23 2 + 2, A) где ы2 и и2 — вещественные величины. Легко выразить м2 и и2 через угол па- дения и постоянные, характеризующие оптические свойства первой и второй сред. Возводя в квадрат A) и используя закон преломления n2sin02 = га^тбь получим (и,-Нгёг)а = п!—nfsm1^. ' B) Приравнивая отдельно вещественную и мнимую части, найдем i(li*i2e \ ei, \ J
5g2 металлооптика [гл. 13 Отсюда следует, что r \ . I Далее необходимо найти коэффициенты отражения и пропускания для поверхностей раздела 1—2 и 2—3 соответственно, поскольку эти коэффици- енты входят в формулы для коэффициентов отражения и пропускания пленки. Мы отдельно рассмотрим случаи, когда электрический вектор падающей волны перпендикулярен и параллелен плоскости падения. Электрический вектор перпендикулярен плоскости падения {ТЕ волна). В этом случае при замене в A.6.35) величины h.,cos02 на h2cos92 = иг + ю, получим .. щ cos 6,—(u.-f-iv.) ,,. ru = p., exp (ир,,) = ^ cos Hi + ^jq^ • E) Позже нам понадобятся выражения для амплитуды р]2 и изменения фазы фи в ясном виде. Из E) найдем n2 (niCQsOi —Ц,K +  t 2агп1 cos 8t ,„ Ри-(Л1 cos 0,+«,)' + »? ' ЙФх2 ul + Bl-nfcos^O," l' Пропускание на первой поверхности раздела, согласно A.6.56), запишется вшде s f Это дает . = B«,cose1)- . Совершенно аналогичным образом мы получим следующие выражения для отражения и пропускания на второй поверхности раздела: oan8 cos 03 На основании закона преломления я, sin б! = n2sin6s, n2 sin 62 = «a sin 6,; поэтому угол Э3 определяется через 0i посредством соотношения n3sine3 = n, sinBj. A1) Электрический вектор параллелен плоскости падения (ТМ волна). В п. 1.6.3 было показано, что формулы для коэффициентов отражения и пропускания ТМ волны легко получить из формул для ТЕ волны, заменяя величины Pj—rijCosQj на q1 = co^Q]!nJ (при этом среда считается немагнитной). Величины rut теперь представляют отношения магнитных, а не электрических векторов. В частности, из A.6.55) следует, что — cos 8,—=— cos 6-, -о . L^;;c°s0'-n> 91+J [« ( a + m|KaJ cos Si + ^i («аЧ^а) Отсюда легко получить , а [п|A—к|) cos 0!—ni«j 12 [n(l— Kl)cosB + na f„ m tgФ„
§ 13.4] РАСПРОСТРАНЕНИЕ ВОЛН В СЛОИСТОЙ ПРОВОДЯЩЕЙ СРЕДЕ 583 Отношение t,. мы получим из A.6.56), заменяя tijCosQj на cos 2 hi = Ti2 ехР (*Хц) = -j j -~ COS 0! + - Отсюда cos 8! + —cos 0, [лгA — kD + Si/IjKj] 2 ! ?г2 ' A4) Подобным же образом мы получим следующие формулы для коэффициентов отражения и пропускания, относящихся ко второй поверхности раздела: [2 /i „2\ a ft? \1 —Я2/ COS O3 — ПуА^ ^'28 Г_2 /, 3\ /I , .. .. о , о 2к» A к)о ' ( ' =" 2n,ra|cos 6., -п1A— «a) cos 03]2^[я3Ог + 2'г2К2СО8еэ] "I [A — ^гJ ^3 —2ка«г] cos 03 ' Зная величины р12, ф12 и т. д., сразу же можно найти комплексные коэф- фициенты отражения и пропускания пленки. Полезно положить г, = |Ч A8) так что A9) Уравнения A.6-57) и A.6.58) теперь примут вид з ехр (— 2ц2Ч) exp [t (у 2o3ti)cxp ft( Выражения для отражательной способности Э1 и изменения фазы при от- ражении дг получаются непосредственно из B0); имеем & _ 1 г |2 _ Piz ехр Bк2т)) + Ри ехр (— 2ргг])+2р12р2з cos [<p23—фи + 2и2л1 ехр Bагт|) + р?2р1з ехр (—2azTi) + 2pi.3p2D cos [ф1г + фгз + 2и3^ . g __ ргз A--р?а) 51пBц2т)-|-фга)-|-р1з[сжрBцаЛ) —РмехР (—3t'2T])] sin cp12 Г р (Чpi») cos Bи1] + ф) + р [ехр Bит)) + рм ехр (—2o,t))] cos ф12 * Эти формулы справедливы как для ТЕ волны, так и для ТМ волны. В первом случае вместо р и tp необходимо подставить значения, определяемые соотно- шениями F) и (9), во втором — формулами A3) и" A6), '
584 МЕТАЛЛ0011ТИКА [ГЛ 13 Подобным же образом- из B1) получаются следующие выражения для пропускательной способности аГ и изменения фазы при пропускании б(: _. n, cos 8„ n, cos 0, ma- rt, cos 6 j з ехр (—2иат)) B4) ехр Bсет)) sin 2nsr| B5) -& L-r Л12 лаз ' "а-и ехр (Ио2Г|) COS ^Я3Т| j- рЛ/р>3 cos («P12 + фгз) Для ТМ волны множитель (n,cosB,)/(«|CosO,) необходимо заменить на (cos63/«3)/(cos6,/;i,). В зти формулы нужно подставить значения, определяемые соотношениями F), (8) — A0) для ТЕ «Л аи A3), A5) — A7) для ТМ ВОЛНЫ ВОЛНЫ. Напомним, что изменение фазы при отражении (S,.) относится к пер- вой границе, а изменение фазы при пропускании (<S() — ко второй. Уравнения B2) — B5) позволяют рассчитать четыре основные величины, которые характеризуют отражение и пропускание поглощающей пленки за- данной толщины с известными оптиче- скими свойствами. На рис. 13.5 для не- которых типичных случаев показана зависимость отражения и пропускания от толщины пленки. Для непоглощающей пленки iA и еГ — периодические функции тол- щины пленки h с периодом, равным одной длине волны. Как мы видим, поглощение уменьшает величину по- следующих максимумов и вызывает смещение максимумов в направлении меньших толщин. В оптическом диа- пазоне поглощение металлов столь велико, что толщина, при которой еще имеется заметное пропускание, значительно меньше четверти длины волны *) (см. табл. 13.1). Поэтому в проходящем свете максимумы и минимумы не наблюдаются. В оптике металлические пленки применяются главным образом для полу- чения высокой отражательной способности, например в интерферометрах Фабри — Перо (см. п. 7.6.2). Такие пленки обычно изготовляли путем хими- ческого осаждения, но в последнее время этот метод был вытеснен методом испарения в высоком вакууме (см., например, 115] или [16]). Наконец, рассмотрим кратко отражение и пропускание «толстой» пленки. Если толщина h и, следовательно, параметр т) достаточно велики, то в B2) — B5) можно пренебречь всеми членами, которые не содержат множителя ехр Bо2т(). Например, если expBtyii) :s 100, то это, как правило, не приво- дит к ошибке, превышающей несколько процентов. Для такой пленки при *) Упрощенные формулы, относящиеся к таким тонким пленкам, можно получить, ризла- гая числитель и знаменатель B2)— B5) в ряд по степеням толщины пленки и оставляя члены лишь первых нескольких степеней (см. 113]). Оптические свойства тонких металлических пленок в видимой и инфракрасной областях спектра подробно рассмотрены в работах [14]. щЬ Рис. 13.5. Зависимость отражательной способ- ности ffj и пропускателыгои способности ?Г меичллическои пленки от ее оптической тол- щины [12], л, = 1. лг = 3,5, л, = 1.5 Кд = к, = 0, 8, = 0.
§ 13 5] ДИФРАКЦИЯ НА ПРОВОДЯЩЕЙ СФЕРЕ. ТЕОРИЯ МП 585 нормальном падении 4лНщк2/Х^1п 100 = 4,61 или (опуская индекс 2) Ь^- B6) Для серебряной пленки, например, л/с«3,67 при ^, = 5780 Л и B6) даег Л5> S ?./10»5,8-10-6 см. Для толстой пленки из B2) и B4) получим , гпз ^ 2 GT n*s cos ^Ч 2 2 / /i \ /'}7"i Таким образом, отражательная способность «толстой» пленки почти равна отра- жательной способности бесконечно толстой пленки, а ее пропускательная спо- собность экспоненциально уменьшается с тол- щиной. Изменения фазы легко найти из B3) и B5): B8) Диэлектрик I Формулы B7) и B8) раскрывают физи- ческий смысл нашего определения «толстой» пленки, показывая, что в такой пленке можно пренебречь влиянием многолучевой интерфе- ренции. 13.4.2. Прозрачная пленка на поглощаю- щей подложке. В качестве второго примера рассмотрим отражение от прозрачной пленки на (рис, 13.6). , В этом случае г,2 вещественно, тогда как г23 комплексно. Отношение ампли- туд р2з и изменение фазы ф23 определяются выражениями F) или A3), где ин- дексы 1 и 2 заменены на 2 и 3 соответственно. В соответствии с A.6.57) найдем Рис. 13.6. Прозрачная пленка поглощающей подложке. поглощающей подложке Это выражение идентично формуле A.6.57), если в последней 2fl заменено на 2р + ф2.ч и г23 на (>м. Таким образом, можно сразу, же, без всякого расчета, записать выражение для отражательной способности и изменения фазы при отражении, просто выполняя указанную замену в уравнениях A.6.59) и A.6.6!). При этом мы получим , 51 = -^ 1 + Stapes+ 2г,ара, cos (фга-г 2р) Раз A— r C1) Тонкие прозрачные пленки на поглощающих подложках находят много- численные практические применения Они используются, например, для за- щиты металлических зеркал or повреждения и для увеличения их отражатель- ной способности. Эти пленки можно использовать также для уменьшения от- ражения от металлической поверхности. В п. 1.6.4 мы упоминали о поляриза- торе, состоящем из диэлектрической пленки на диэлектрической подложке, для которого М„ -=0, а 51 х достаточно велико. С металлической подложкой мож- но полхчнть либо ой и 0, либо a?j_ 0 [17]. § 13.5. Дифракция на проводящей сфере. Теория Ми Металлы обладают специфическими оптическими свойствами и тогда, когда они тонко измельчены, как в коллоидных суспензиях. Достаточно вспом- нить блестящие ярко красные цвета коллоидного золота в жидкостях или
586 металлооптика [гл. 13 стеклах. Эти явления'представляют большой интерес, так как в них проявля- ются вместе преломление, поглощение и дифракция. Будь металлические частицы идеальными проводниками, мы имели бы дело с проблемой чистой дифракции. Однако мы не рассматривали этот вопрос с указанной точки зрения в главах по дифракции, поскольку для физики осо- бый интерес представляют именно эффекты, обусловленные частичным про- никновением света в частицы. В данном случае важную роль играет поглоще- ние, и поэтому более уместно рассмотреть этот вопрос в настоящей главе. Маши выражения будут содержать в качестве предельного случая (к—>-0) и соответст- вующие результаты, относящиеся к диэлектрическим сферам. Из ранних исследователей, изучавших оптические свойства металлических частиц, необходимо упомянуть Максвелла Гарнепа [18]. Он рассматривал прохождение света через диэлектрическую среду, содержащую в объеме с ли- нейными размерами порядка длины волны много небольших металлических сфер. С помощью формулы Лоренщ — Лоренца (см. B.3.17)) Гарнегг показал, что такая система эквивалентна среде с определенным комплексным показа- телем преломления п' =¦ п' A -\ in'), и выразил п' и к' через показатели пик, характеризующие металлические сферы. При этом он смог объяснить некоторые наблюдаемые особенности. В работе, опубликованной в 1908 г., Дж. Ми 1191 на основе электромаг- нитной теории получил строгое решение для дифракции плоской монохрома- тической волны па однородной сфере произвольного диаметра и состава, на- ходящейся в однородной среде. Эквивалентное решение той же проблемы было вскоре опубликовано Дебаем I20J в статье, относящейся к давлению света (т. е. механической силе, вызываемой светом) на проводящую сферу. Затем различные аспекты этой проблемы рассматривались многими авторами *). Хотя решение, предложенное Ми, получено для дифракции на одной сфере, оно применимо также к дифракции на любом числе сфер при условии, что все они имеют одинаковый диаметр и одинаковый состав, распределены хаотически и находятся друг от друга на расстояниях, больших по сравнению с длиной волны. При таких условиях снеговые пучки, рассеянные сферами, не когерентны, а полная рассеянная энергия равна произведению энергии, рас- сеянной одной сферой, на общее число сфер. Здесь следует отметить, что реше- ние Ми имеет большое практическое значение и его можно применить к самым разным задачам; помимо вопроса о цветах металлических суспензий, можно упомянуть такие приложения, как изучение атмосферной пыли, межзвездных частиц или коллоидов, теория радуги, солнечная корона, влияние облаков и туманов на пропускание света и т. д. Прежде чем переходить к выводу формулы Ми, полезно кратко пояснить применяемый метод. Мы ищем решение уравнений Максвелла, описывающих поле, возникающее при падении плоской монохроматической волны на сфери- ческою поверхность, близ которой резко меняются свойства среды. Вводится соответствующая система криволинейных (сферических) координат, и поле представляется в виде суммы двух «подполей»; электрический вектор одного из них не содержит радиальной составляющей, у другого таким же свойством обладает магнитный вектор. В сферической системе координат уравнения Максвелла вместе с граничными условиями переходят в систему обычных диф- ференциальных уравнений, решение которых для двух подполей ищется в виде бесконечных рядов. В п. 13.5.1 рассматривается получение этого решения, а в п. 13.5.2— основные его следствия. Последний раздел настоящего пара- графа посвящен некоторым общим результатам, относящимся к полному коли- *) Из более поздних исследований, касавшихся осиошюй теории,* особенно следует упо* минуть работы [21, 22].
§ 13.5] ДИФРАКЦИЯ НА ПРОВОДЯЩЕЙ СФЕРЕ. ТЕОРИЯ МИ 587 честву энергии, которое рассеивается и поглощается частицей произвольной формы, причем случай сферической частицы рассматривается подробно. 13.5.1. Математическое решение проблемы, а. Представление пиля через потенциалы Девая. Рассмотрим дифракцию плоской линейно поляризованной монохроматической волны па сфере радиуса я, находящейся в однородной изотропной среде. Предположим, что среда, в которой находится сф^-ра, яв- ляется непроводящей и что как среда, так и сфера немагнитны. Как обычно, выделим зависимость от времени в виде множителя ехр (—iaf). Тогда электрический и магнитный кекторы и вне, и внутри сферы удовлетворяют уравнениям Максвелла в форме, не зависящей от времени, т. е. rotH--— /г,Е, Bа) rotE-fcjH, A6) где *. = Т- B6) Квадрат обычного волнового числа k (вещественного вне сферы и комплексного внутри ее) равен к'^—к^. C) Величины, которые относятся к среде, окружающей сферу, снабдим значком I, а величины, относящиеся к сфере,— значком П. Поскольку, по предполо- жению, среда, окружающая сферу, является непроводящей, оA) - 0. Воспользуемся прямоугольной системой координат с началом в центре сферы. Пусть ось г совпадает с направлением распространения волны, а ось х-— с направлением ее электрического вектора (рис. 13.7). Рис. 13.7. К рассмотрению дифракции на проводящей сфере. Нсли амплитуда электрического вектора падающей волны нормирована на единицу, т. е. |E"'>| то шесть компонент векторов ноля запишутся в виде ?ifi = exp((feaiz), Hf = '-^-jexp(ikmz), Ef =?«> = Я«> =Я|Р =0. D) Что касается граничных условий, то в соответствии с п. 1.1.3 мы потре- буем лишь, чтобы тангенциальные составляющие векторов Е и Н были не- прерывны на поверхности сферы, т. е. рт _ с(Ч) я(|) — Н1П) к-ппя /-—/г /Ч\ '-тапг — *-*танг» '^танг — JJTaHT» кшда / —ы. (Of Тогда условие, требующее непрерывности на поверхности сферы радиальных компонент еЕ и Н, следует из E) и уравнений Максвелла,
588 мьгаллоогпикл [1Л. 13 Для того чтобы удовлетворить граничным условиям, необходимо предпо- ложить, что, кроме падающего поля Еи) и Ни) и поля внутри сферы Е1"", Htal, имеется вторичное (рассеянное или дифрагировавшее) поле Еи>, НA) в среде, окружающей сферу. Таким образом, полное электрическое поле в обеих областях запишется в виде E=E('! + E(S) вне сферы, "\ Е = Е<И| внутри сферы. \ ' ' Подобные же выражения справедливы и для магнитного вектора. Поля Е(ет, H(i) и Е'™\ Н(ш> можно считать аналогичными соответственно отраженному и проходящему полям при падении на плоскую границу (см. п. 1.5.1). Однако такая аналогия верна лишь при диаметре сферы, большом но сравнению с дли- ной вочпы. Так как граничные условия должны выполняться для любого мо- мента времени, все тесть векторов должны обладать одинаковой зависимостью от времсыи lexp (—ico/)J. Для настоящей задачи наиболее удобными криволинейными координатами являются сферические координаты г, в и ф, определяемые выражениями х = г sin б cos ф, i/ = /lsin0smt(), a = rcos6. G) При переходе от декартовой системы координат к этой повой системе компо- ненты произвольного вектора А преобразуются согласно следующим правилам (см., например, [23]): Ar = Axsm бсоэф-у- Ау sin8 sin ф-f- Лгсо5 9, \ Л, — Ах cos 0 cos ф -|- Ау cos 9 sin ф—Лгзт9, V (8) Aj — — Ля sin ф + A., cos ц>. J Определяемые здесь компоненты не совпадают с i омпонептами. используемыми в абсолют- пом дифференциальном исчислении Риччи и Леви-Чивита Там рассматриваются две группы рлз- лачных, но эквивалентных компонент вектора А — контравэриашные ко пюненгы Л'" и кова- рентные компоненты At Если el7 е2, еэ — базисные векторы, в общем случаенеортогональпые и имеющие различную длину, то контравариантные компоненты (по отношению к этим базис- ным векторам) можно определить как коэффициенты в представлении А— А^1}е1 , ЛB)е2 - -1-Л'3>е3, а ковариантные компоненты — как коэффициенты в представлении А- ^е11' Ч-Лае'2)^Л^е1о), где е'1', е'2* и e*3J — взаимные базисные векторы, ч е секторы, удовлетво- ряющие cooiiioaieiiHfltvi e(i) ^^"^fft' г^е ^ik — символ Кронекера В специальном случае, когда ei, e2, e{ oproiопальны, еA), еB) и e(i> также ортогональны п соответствуюп1,ие векторы обеих групп параллельны В этом случае можно ввести одну ipynny естественных компонент А; \ГА1 Л(/>, которые допускают простую теометрическую интерпретацию спи являют; я орто!опальными проекциями вектора А на три направления В случае сферических координат ес1ь,пвешшс компоненты определяются выражениями (8). Компоненты тсчзора можно рассматривать аналогичным образом. Применяя формулы (8) к вектору rot А, получим 1 J д (гА„ sin 6) д (г \ ~~дв д, дА. dirA-sin dr дв
§ 13.5] ДИФРАКЦИЯ НА ПРОВОДЯЩ^ СФЕРЕ. ТЕОРИЯ MB 589 dQ Зср 1 (дНг д {rHa sin в) I г sin в \ 5ф дг \ В сферических координатах уравнения поля A) примут вид /•Я, sine) д{гНц)\ (а) (Р) ) (а) (Y) j (а) (Р) > (б) , p, _ 1 1д(гН„) дНг\ /¦?„ sin 0) d(r?9)\ d (/•?„. sin 9) « и dEr ]¦ (V) Граничные условия E) теперь запишутся следующим образом: 1 для г = с A0) A1) Уравнения A0) вместе с граничными условиями A1) служат основными урав- нениями пашей задачи. Представим решение этих уравнений как суперпозицию двух линейно независимых полей (гЕ, гН) и (тЕ, тН), каждое из которых удовлетворяет уравнениям A0), причем 'ЕГ = ЕГ, <Яг = 0 A2а) и и?г = 0, тНг = Нг. A26) Нетрудно показать, что такое представление согласуется с нашими уравнения- ми. Для Нг=еН, =0 уравнения A0а, р) и A0а, у) примут вид Подставляя ?9 и ?ф из этих соотношений в A06, fi) и A06, 7). получим Уравнения A4) вместе с A0а, а) образуют систему уравнений для еЕг, еН6 и "Hz. Однако физические поля представляют не вес решения этой системы, а лишь те, которые удовлетворяют дополнительному условию div fH —0. Мы ограничимся именно такими решениями. В сферических координатах при нашем предположении, что еНг = 0, дополнительное условие запишется сле- дующим образом: J5(sinee//e)+^(^)_0. A5) Оно обеспечивает выполнение оставшегося уравнения A06, а). Действительно, подставляя A3) в A06, а), получим 0 = ——! ~ I -4 (г sin бвЯв) + 4- (геН„)\, а это соотношение выполняется тождественно на основании A5). Совершенно аналогичные рассуждения применимы и ко второму случаю, когда тБг = 0.
J90 МЕТАЛЛООПТИКА {гл- ^3 Решение с нулевым радиальным магнитным полем называется электриче- ской волной (или поперечной магнитной волной), а решение с нулевым радиаль- ным электрическим полем — магнитной волной (или поперечной электрической волной). Ниже мы покажем, что каждую из волн можно получить из соответст- вующего скалярного потенциала СП или '"И, которые известны как потенциалы Дебая *). При еИг = 0 из A06, а) сразу же следует, что еЕ9 и с?в можно предста- вить как градиенты скаляра е? __ 1 3U еЕ ^LEL {Ю) Если мы положим ,, д(геП) ,,7i и*——Ц— , A/) то из A6) получим I ri% (г ?ГТ\ 1 /J {г еТ[\ g Г? I v \1 11) „ т~. 1 U \/ Ч) /1П\ г дгдО ' * л sin в Как мы видим, уравнениям A3) удовлетворяют .„ ' д1 /'п °9 *. otr'tn \ A9) я. = — ?15. = „ sme Зф ~ г sine Если подставить A9) в A0а, а), то найдем Подстановка A9) и'B0) в A4) дает два уравнения, первое из которых выражает равенство нулю производной по ф, а второе — производной по G одного и тот же выражения. Поэтому, приравнивая это выражение нулю, можно удовлешо- рить обоим уравнениям. Таким образом, мы получим С помощью B1) выражение B0) можно переписать в виде ?.- = •—^5—-А-яг II. \??) Подставляя A8), A9), B0), B1) и B2) в уравнения A0), легко убедиться, что мы получили решение нашей системы уравнений. Подобным же образом можно рассмотреть магнитную волну; тогда мы увидим, что эта волна определяется потенциалом Т1, удовлетворяющим тому же дифференциальному уравнению B1), что вП. Полным решением уравнений поля служит сумма двух полей, т. е. Ег = еЕГ -|- mEr = Г>(^П> + #У еП, (а) (геП) , 1 д(гтП) )г дц> 2 г 55 ' ") , б2 (г "¦!!) \ Ф)\ B36) *) Если г — радиус-вектор из начала координат, то «Пг и '"Пг — векторы Герца, всюду имеющие радирлькпе направление, о которых говорилось в п. 2.2.2 (см. [24], раздел, написан- чый А, Золисрфельдом, а также [25)).
§ 13.5] ДИФРАКЦИЯ НА ПРОВОДЯЩЕЙ СФЕРЕ. ТЕОРИЯ МИ 591 Оба потенциала 'П и ИП служат решениями дифференциального уравнения, B1), которое представляет собой не что иное, как волновое уравнение записанное в сферических координатах. Для того чтобы компоненты Еп, Е,,, Нч и Н„ были непрерывны на сферической поверхности г — а, очевидно, доста- точно, чтобы на этой поверхности были непрерывны следующие четыре вели- чины: й.г'П, ДуиП, §-г{геЩ, §-г(г"Щ. B4) Иными словами наши граничные условия также разделяются на независимые условия для еП и тИ. Таким образом, рассматриваемая нами дифракционная задача сводится к проблеме получения двух взаимно независимых решений волнового \ равнения с заданными граничными условиями. б. Разложение в ряда: компонент полей. Вначале мы представим решение волновых правлений в виде ряда с неопределенными коэффициентами, причем каждый член этого ряда будет каким-то частным решением уравнения. Затем, используя граничные условия, определим коэффициенты. Будем искать решение в виде п=/г(г)в(е)Ф(ф). B5) Функции R, Э и Ф, как легко проверить прямой подстановкой в B1), должны удовлетворять обычным дифференциальным уравнениям _-),* = 0, B6а) *™ + РФ=0, B6в) где аир — постоянные интегрирования. Так как ноле Е, Н является однозначной функцией координат, функция П также должна быть однозначной. Эго требование налагает определенные условия на в и Ф. Для каждого иа уравнений B6) можно записать общее решение. Для B6в) оно имеет вид a cos (Vff<p) + Ь sin (КРф). Условие однозначности требует, чтобы Р = т3 (т—целое). B7) Следовательно, однозначное решение B6в) имеет вид O = amcos(nvf) + bmsin(ni(p). B8) Уравнение B66) — это хорошо известное уравнение сферических гармо- ник. Необходимым и достаточным условием однозначности его решения яв- ляется а = /(/-|-1), ' A>\т\, целое). B9) Подставим C из B7) в B66) и введем новую переменную g = cos6. C0) Тогда B66) преобразуется к виду (см. [26]) ^} C1) {{ Решениями последнего уравнения служат присоединенные функции Лежанд- ра, т. е, 6 =:.Pf> (?) = ¦/>}¦"> (cos 6). C2)
592 ЫЕТАЛЛООТПИКЛ [ГЛ. 13 Эти функции тождественно равны нулю, если \т\>1, поэтому для каждого I имеется 2/ + 1 таких функций, а именно функции с т = — 1, — /+1 1—1, I. Чтобы проинтегрировать последнее уравнение B6а), положим йг = р, Щг) = y=Z(p). C3) Тогда мы получим уравнение Бесселя (см. [26]) Решением этого уравнения является цилиндрическая функция общего вида 7S -/'г+'/«(Р) порядка И- 1/2, так что решение B6а) запишется следующим образом: R=---7=Zi + iu{kr). C5) Каждую цилиндрическую функцию можно выразить в виде линейной ком- бинации двух цилиндрических функций обычного типа, например функций Бесселя </гН7«(Р) и функций Неймана iV,+i/, (р). Для нашей цели удобно при- менить функции *) Ш = У fJ'WAP), зс,(Р) = -у f-^./ЛР). C6) Функции г|';(р) регулярны в каждой конечной области плоскости р, вклю- чая начало координат; функции х, (р) имеют особенное™ в начале координат р "-- 0, где они обращаются в бесконечность. Поэтому для представления волны внутри сферы нужно использовать функции 1]>г(р), а не ул (р). Общее решение уравнения B6а) можно записать в виде . C7) В частности, для ct = 1, dl= —i мы получим rn = lf(kr), C8) где К1' (Р) = ^г (Р) -'Xi (Р) = |/f Н%,, (р). C9) Здесь Я — одна из функций Ханксля **). Функции Ханкеля отличаются от других цилиндрических функций тем, что в комплексной плоскости они равны нулю на бесконечности. Для функции с индексом 1 это справедливо в полуплоскости с положительным значением мнимой части р. Таким образом, именно такая функция оказывается подходящей для представления рассеян- ной волны. Согласно B5) частное решение П'/"' получается при перемножении функ- ций, определяемых выражениями B8), C2) и C7). Общее решение нашего *) В литературе существует несколько немного различающихся определений функций if и у. (см [27] или [26]). Ниже мы приведем некоторые формулы, относящиеся к функциям г|)(. *¦*) Эта формула непосредственно следует из хорошо известного соотношения уежду функциями Бесселя, Неймана и Ханкеля, а именно Jp-^iNр — Н$'. Аналогичное соотношение имеется и для второй функции Ханкеля' Jp—iNp—H'p\ Приведенные формулы аналогичны выражениям, связывающим экспоненциальные функции exp (ip) и ехр (—ip) с cos p и sin p.
13.5) ДИФРАКЦИЯ НА ПРОВОДЯЩЕЙ СФЕРЕ. ТЕОРИЯ МЯ 593 волнового уравнения равно = 2 2 {c,^(^) + rf^(^)}{/)/("'1(cose)}{flmcos(m9) + 6msin(m9)}> D0) i 0 Z i = 0 m=-Z где am, 6m, сг и dt — произвольные постоянные. Эти постоянные необходимо выбрать так, чтобы удовлетворить граничным условиям. Для этого нужно выразить потенциалы СПA) и '"II10 падающей волны в виде рядов, аналогичных ряду D0). Запишем вначале выражение D) для падающей волны в сферических координатах в соответствии с (8): Ef = exp (ik№ r cos 9) sin 9 cos <p, Hf = ^-щ exp (ik{1> r cos 9) sin 9 sin q>, ?«> =exp (ik™r cos 6) cos6 cos <p, Hf = ^exp {ik^r cos9)cos9 sinф, W = _ exp (Ik™ r cos Щ sin <p, Я« = —| exp («"> л cos 9) cos q>. D1) Для определения потенциалов гП'" или иПи> необходимо лишь восполь- зоваться одним из уравнений B3). Первое из них дает exp (ikm r cos G) sin 6 cos ф = <Эг^2'1) + (fe«>J /-гП"\ D2) Первый множитель в левой части этого уравнения можно выразить в виде следующего ряда полиномов Лежандра (формула Бауэра, см. (9.4.9)): ехр AйA> г cose) =.]?;' B/+ l)f'(^"r)P, (cos6). D3) Выполняются также тождества —Lp^(exp [й^гсозв]), D4) ^ P<«(cos9) = 0. D5) Используя эти соотношения, можно переписать левую часть D2) в виде ОС exp {ika) г cos 9) sin 6 cos q>= ^L Ц ''-1 B/ + !) Ь (kW r) piP (cos 9) cos <P- D6) ?™ 1 Выберем в качестве пробного решения уравнения D2) ряд такого же вида да r*Wl> =7^11 a A №lf> r) P? (cos 6) cos Ф. D7) Подставляя D6) и D7) в уравнение D2) и сравнивая коэффициенты, получим соотношение «,{(^)'*,(*A^)+^^} = <'-М2/+1)*^. D8) Из C7) (при ct = 1 и d; — 0) следует, что г|з, (йш г) = rR D9) является решением уравнения B6а): ??+((#")'-?)*,-0 E0) 38 М. Бори, У. Вольф
594 МЕТАЛЛООПТЯКА [ГЛ. 13 при условии, что а — 1A+\) (см. B9)). Сравнивая E0) с D8), мы видим, что Вычисления, связанные с магнитным потенциалом гаП(", аналогичны Таким образом, мы получим следующие выражения для потенциалов падаю- щей волны: г'П» = Eшр Е t 7[ГГТУ Ь (*ш г) PJM (cos 6) cos <р, (а) | \ E2) ^Х^ (б) j Мы выразили оба потенциала в виде рядов, аналогичных ряду D0), и теперь легко определить неизвестные постоянные. Запишем граничные условия B4) полностью | <*>)}г=а = ?{г<П'-Ч,„. (а) <«П,=в = |;{л-П<->}г„, (б) «')}r=a = *<"> {л еП«>},=0, (в) w)}r=e-ftiII){''"n(«}r=e. (r) J Из соотношений E2) следует, что эти уравнения могут удовлетворяться лишь в том случае, если ряды, аналогичные ряду D0), для неизвестных потенциалов П1Я и П(ш) содержат только члены с т = 1 и если, кроме того, для магнитного потенциала ах = 0, а для электрического —• 6, = 0. Мы уже отмечали, что для представления П(я;) пригодны лишь функции т)),, поскольку они остаются конечными в начале координат, тогда как функции %1 обращаются там в бесконечность. Следовательно, можно написать ?' (cos9)cos<p, (a) ? (cos 6) sin Ф. F) E4) Мы видели также, что рассеянную волну можно выразить с помощи» функций ?</' = ti—гХ/. которые получаются при умножении функции Хлп- келя ЯA) на У яр/2 (см. C9)). При больших значениях р функция ЯA) ведет себя как e*lYp, т. е. t,f> — как е'9 и R = ?J" (ft(I)r)//- — как exp (ikwr)!r. Таким образом, на больших расстояниях от сферы рассеянная волна сферична с центром в начале координат г = 0. Поэтому положим (в) | \ E5) > r) Pf> (cos Q)sm4, (г) I
§ 13 5] ДИФРАКЦИЯ НА ПРОВОДЯЩЕЙ СФЕРЕ. ТЕОРИЯ МИ 595 Если подставить выражения E2), E4) и E5) в граничные условия E3), мы получим следующие линейные соотношения между коэффициентами *) еА„ тАь *Bt и mBt: w**~x __ , 'В, ^т> а) "а) = ТЯ , а) = _ф_ а) = ^ в). ересуи ую вс I 1A I ")а). E6) Нас интересуют только коэффициенты eBt и ""В,, которые характеризуют рассеянную волну. Исключая eAL и тА,, получим ' ;II) tyl (^ a) tyl {k^ ^) ^ Ц1+1) -.F) E7) Наконец, при подстановке E5) в B3) найдем для компонент векторов поля рассеянной волны ; С + 1) 'W (й("г) Pi» (cos 6), ^ 2 / (/ +1) "B^u (*<Dr) Pi11 (cos 6), ? (cos 6) 4 j1!' (cos 6) sin 6 ' <cos e)sin 6+ E8) *) Штрих у функций 1))г, Jj и P'J> означает дифференцирование по их аргументу. 38'
596 МЕТАЛЛООПТИКА [ГЛ. 13 Этим завершается формальное решение нашей граничной задачи. Мы не будем здесь заниматься вопросами существования и сходимости полученного ре- шения. Полезно напомнить значение различных постоянных. Так как, по пред- положению, сферу окружает непроводящая среда, то аш=?,0. Из соотношений B) следует (б) E9) (г) здесь Х<, — длина волны света 'в вакууме, Хш — длина волны в среде, окру- жающей сферу, и проводимость сферы ат> обозначена через а. Удобно также ввести комплексный показатель преломления сферы отно- сительно окружающей среды, который понадобится нам в дальнейшем. Обозна- чая этот показатель через п, получим „г — Введем, кроме того, безразмерный параметр q, определяемый выражением 9 = pra> F1> т. е. величина ^ равна произведению 2я на отношение радиуса сферы к длине волны света во внешней среде. Тогда, исподьзуя соотношение можно выразить коэффициенты E7) в виде —ттт :—^- , (а) ¦Гг UoUki ina\ I F2) Этн формулы принимают особенно простую форму, когда либо диэлектри- ческая проницаемость, либо проводимость сферы высоки и вместе с тем радиус сферы не слишком мал, В этом случае |л|^>1, \щ^>\, и выражения F2) сводятся к <63) Хотя это приближение не представляет интереса в оптике, его важность для радиодиапазона несомненна. Оно имеет и исторический интерес, поскольку первые теории относились к такому предельному случаю [28]. в. Сводка формул, относящихся к присоединенным функциям Лежандра и цилиндрическим функциям. Прежде чем переходить к дальнейшему обсуж- дению, удобно привести здесь некоторые формулы, относящиеся к сферическим гармоникам и цилиндрическим функциям.
§ 13.5] ДИФРАКЦИЯ НА ПРОВОДЯЩЕЙ СФЕРЕ. ТЕОРИЯ МИ 597 Присоединенные функции Лежандра Полиномы Лежандра (в которых аргументом служит cos 6) имеют вид f (-1- г „w, (/!! ф-2т), F4) Присоединенные функции Лежандра первого рода определяются выраже- нием *) ^^- F5) Нам понадобятся также соотношения Для больших значений I справедливо асимптотическое приближение F7) Цилиндрические функции I. При малых значениях аргумента х функцию tyt(x) можно разложить в ряд 1.з.!'+B/+1)М*:>- F8) где Для ?,Ч\х) справедливо разложение 8" (х) = -i ьз...у-D ^{Лг w_/Jegj (x)}_ G0) где ht(x) И gjW'— степенные ряды, в которых первый член равен единице, а второй квадратичен относительно х. Аналогично функции "f\ (х) и t,f}' (x) можно выразить в виде ум-(х) = tl '•3--<gt~1)ct* {Af W-^Г (*)}, G2) где f+(x), /i|(x) и gt(x) — степенные ряды того же типа, что и прежде. II. При больших значениях аргумента х и при условии, что / мало по срав- нению с |я|, можно использовать следующие асимптотические формулы: ^ (*)« 1 {('+! ехр (— ix) + (- «)'+1 exp (ix)}; G3) ?}" (*)«(— t)'+1exp(«), G4) и ^J(x)«i f exP (- «) + (— 0г ехр (ix)}, G5) Sj"'(*)«(—*¦)'exp (/*). G6) *) Иногда используется определение, отличающееся от настоящего множителем (—1)"»,
598 МЕТАЛЛООПТИКА [ГЛ. 13 Для вещественных значений х функции фг(х) и г))/' (х) тоже вещественны, т. е. G7) G8) 13.5.2. Некоторые следствия из формул Ми. а. Парциальные волны. Из выражений E8) видно, что амплитуды радиальных компонент Ef и Hf рас- сеянной волны уменьшаются обратно пропорционально квадрату расстояния от рассеивающего центра, тогда как амплитуды остальных компонент умень- шаются более медленно, обратно пропорционально первой степени этого рас- стояния. На достаточно больших расстояниях (г^>к) в радиационной, или волновой, зоне радиальными компонентами можно пренебречь по сравнению с тангенциальными, т. е. в этой области волны поперечны. Полученные формулы показывают, что рассеянная волна состоит из сфери- ческих гармоник разных порядков. Эти гармоники называются парциальными волнами, и их амплитуда определяется абсолютны- ми значениями комплексных коэффициентов еВ1 и тВг, которые зависят от природы обеих сред и от отношения радиуса рассеивающей сферы к длине волны падающего света. Каждая парциальная волна состоит из электри- ческой части с амплитудой eBt и магнитной части с амплитудой mBt. Магнитные силовые линии элек- трической парциальной волны и электрические си- ловые линии магнитной парциальной волны цели- ком лежат на концентрических сферических по- верхностях, так как для первой волны Hi-Si = О, для второй — ?"> — 0. Рассмотрим произвольную парциальную волну, например /-ю электрическую волну. Мы видим, что соответствующие компоненты ?$' и Яф1 равны нулю В точках, где обращаются в нуль либо соэф, либо Pf (cosQ) sin0. Ана- логично ?(tpS) и #es) исчезают там, где либо sin ф, либо PJ1' (cos8)/sin6 равны нулю. Внутри интервала О^б^я функция Р'"' (cosO) обращается в нуль / раз, а функция Р9' (cos9)/sinO обращается в нуль /— 1 раз и отличается от нуля при 9 = 0 или л. При ф = + я/2 все компоненты поля обращаются в нуль 21 раз, т. е. всего D/—2) раза. Поскольку магнитные силовые линии должны быть замкнутыми кривыми и, как мы видели, они целиком расположены на концентрических сферических поверхностях с центром в начале координат, то ясно, что каждая из 21 нулевых точек на окружности с ф — 0 или я оказывается центром семейства таких линий, а каждая из 2A— 1) нулевых точек на окруж- ности сф = ± л/2 будет нейтральной точкой. Силовые линии обходят эти нейт- ральные точки, подобно тому, как два семейства равнобочных гипербол с об- щими асимптотами обходят их общий центр. На рис. 13.8 показаны магнитные силовые линии четвертой электрической парциальной волны. Отчетливо видны две группы точек; точки первой группы лежат в плоскости хг (плоскость рисунка), точки второй — в плоскости уг. На рис. 13.9, а для первых четырех электрических парциальных волн приведены проекции па плоскость уг их магнитных силовых линий, которые расположены на одной из полусфер, находящихся с любой стороны плоскости уг. В волновой зоне электрические силовые линии ортогональны к магнитным линиям, так как, согласно E8), для каждой парциальной волны (электрической Рис. 13.8 Магнитные сило- вые линии четвертой электри- ческой парциальной волны.
§ 13 5] ДИФРАКЦИЯ НА ПРОВОДЯЩЕЙ СФЕРЕ ТЕОРИЯ МИ 599 или магнитной) справедливо соотношение Проекции электрических силовых линий 13 9, 6. Аналогичные результаты получаются и для магнитных парциальных волн, за исключением того, что costp и sin cp меняются местами. Соответствующие проекции электрических силовых ли- нуй, расположенных на сфере, для маг- нитных парциальных воли легко найти, поворачивая рисунки на угол 90и во- круг оси г. б. Предельные случаи Ниже мы ис- следуем относительную роль различных парциальных волн Общий случай (п и q произвольны) не поддается простому аналитическому рассмотрению, и по- этому мы подробно обсудим лишь два предельных сличая, а именно, когда ра- диус сферы зелик по сравнению с дли- ной волны (<7JS>1) и когда он значительно меньше длины волны (q<-^.\). I q^>\ В этом случае наше реше- ние по существу должно давать те же результаты, что дифракционная теория Гюйгенса — Кирхгофа или даже (при д-^-оо) геометрическая оптика. Если ограничиться порядками /, зна- чительно меньшими q и \nq\, то можно использовать асимптотические прибли- жения G3) — G6). Имеем /!pS) = 0. G9) на плоскость хг показаны на рис. (— tnq) + (— t xp (ing) ¦4>i(n<7) ilexp(— Cnq) + (—()' exp (№?) cos [^7- -»f|; (80) cos «<?—'у коэффициенты F2) запишутся в виде sin \q — /y X ехр (— iq) !— J Л т Рис 13 9 Силовые линии первой (/), вто- рой (//), третьей (///) и четвир гии (/К) электрических парциальных воли [19] а —магнитные силовые линии, б — электри- ческие силовые липни —/-j tg \nq — l-? 1-mtg \nq — /y X exp(— iq)- nsm й — l^\ ~ л-ttg [n?-'f (81)
600 i МЕТАЛЛООПТИКА [ГЛ. 13 Отметим, что эти коэффициенты являются быстро осциллирующими функциям» и ц и /, так что небольшое изменение в q или I может вызвать сильное изменение в еВг и mBt. Видно также, что тВ1^.1 и eBt— величины одного порядка, т. е, амплитуда электрической парциальной волны с номером / имеет тот же порядок величины, что и амплитуда магнитной парциальной волны следующего, более высокого номера. Формулы (81) получены в предположении, что I значительно меньше q, и поэтому в таком приближении нельзя определить число парциальных волн, вносящих заметный вклад в рассеянное поле. Дебай [29] получил асимптоти- ческие приближения, справедливые для всех порядков, и показал, что ампли- туды лабиальных воли быстро уменьшаются до нуля как только 1-\-1/2 пре- взойдет q, так что следует оставлять только первые q членов. Если диэлектрическая проницаемость или проводимость сферы очень велицн (\п |->оо), выражения для еВг и mBt принимают вид •В, = I (-1)'« ,§±^ ехр (- iq) cos [q-l f Их проще всего получить из F3) с помощью асимптотических приближений G3)-G6). Результаты настоящего раздела (q^>l) можно применить в теории радуги [30, 311; параметр q, определяемый размером дождевых капель, порядка 104. II. 9<^с1. Этот случай имеет большое практическое значение при изучении" микроскопических и субмикроскопичеекпх частиц в коллоидных растворах. Мы можем теперь использовать разложения в степенные ряды F8) — G2) для цилиндрических функций. Ограничиваясь наиболее существенными членами, получим l 1+1 } (83) Если проводимость или диэлектрическая проницаемость очень велики, из- F3) найдем *) qll+1 - i ' /Ml-3-6...B1-l)J»' "' 1A+1) [1-3-5.,.Bt~l)}>- ) До тех пор, пока проводимость остается конечной (формулы (83)), коэф- фициенты еВ1+1 и тВ1 пропорциональны величине q в одной и той же степени,, т. е. амплитуды (/ + 1)-й электрической и 1-й магнитной парциальных волн, как и в случае, когда (?^>1,— величины одного порядка. Если радиус сферы так мал, что величиной q'* можно пренебречь по сравнению с единицей, необ- ходимо учитывать лишь первую электрическую парциальную волну; ее ампли- туда и фаза определяются комплексной амплитудой eBiqs= Поскольку еВ1 — комплексная величина, между падающим первичным полем и рассеянным вторичным полем существует разность фаз. *) Прямой переход от (83) к (84) не прост; необходимо принять во внимание, что когда /п|-*оо, то q-+ 0 таким образом, что дЦп\2 стремится к конечному значению.
§ 13.5) ДИФРАКЦИЯ НА ПРОВОДЯЩЕЙ СФЕРЕ. ТЕОРИЯ МЛ 601 В другом предельном случае (\п |~>°°), как мы видим из (84), амплитуды 1-й электрической и /-Й магнитной парциальных волн — величины одного- порядка. Рассмотрим теперь поле первой электрической парциальной волны на большом удалении от сферы (г^>Х) при конечном \п |. Воспользуемся асимпто- тическим приближением ?«>(*) = —ехр (/*), ^'(x) = ~iexp(ix) (86) и соотношениями Pl (cos 6) = cos9, Я?> (cos ft) = sin 6, Pi1)'(cose)sm(9 = ~cose, (87) где штрих означает дифференцирование по cos 0; тогда из E8) получим (88) Легко показать, что уравнения (88) идентичны уравнениям для волновой зоны (г^>Х) электрического диполя в точке 0 с моментом р = роехр(—ia>t)y где Га 1 (89) колеблющегося параллельно оси х, т. е. параллельно электрическому вектору первичного падающего поля. Чтобы показать это, предположим вначале, чта внешняя среда — вакуум (вш = 1), и возвратимся к уравнениям B.2.53) и B.2.54), Согласно этим уравнениям радиационное поле линейного электриче- ского диполя с моментом роехр(—iwf) в вакууме определяется выражениями (90) Здесь г — радиус-вектор точки наблюдения. Множитель, зависящий от вре- мени (ехр(—i<at)), опущен. Из (90) следует, что если направление вектора ра совпадает с направлением оси х, то компоненты векторов Ей Н имеют вид ^ exp (ikr) (91) =-(±,yPl> sin 6 сев9 cos Ф =— 7" ^о sm9sinф Если преобразовать эти выражения к сферическим координатам в соответствии с правилом (8) и подставить для р0 его значение (89), то мы получим соотно- шения (88) (с еш = ]). В более общем случае, когда е(||=^=], вместо (91) не- обходимо рассматривать соответствующие выражения для радиационного поля диполя в диэлектрике. Эти выражения, которые можно получить так же, как и выражения (91), также преобразуются в (88) при переходе к сферическим
602 металлооптика [гл. 13 координатам. Отметим, что показатель преломления сферы входит в выражение (89) для эквивалентного момента диполя лишь в комбинации (п2—1)/(п2+2). Д-'я диэлектриков (п вещественно) мы уже встречались с этим выражением в теории молекулярной рефракции (см. B.3.17)). Согласно (88) амплитуда обратно пропорциональна квадрату длины волны, и поэтому интенсивность рассеянного света обратно пропорциональна ее четвер- той степени. В таком случае мы говорим о рэлеевском рассеянии *). Подобным же образом через колебания магнитного диполя можно выразить первую магнитную парциальную волну. Парциальные волны более высоких порядков можно считать результатом колебаний мультиполей, но здесь мы не будем останавливаться на этом. в. Интенсивность и поляризация рассеянного света. Вновь возвратимся к общему случаю и кратко исследуем интенсивность и поляризацию рассеян- ного света. Так как нас интересуют лишь относительные значения интенсив- ностей, мы вправе взять в качестве меры интенсивности квадрат вещественной амплитуды электрического вектора. Мы будем рассматривать поле лить на больших расстояниях от рассеивающего центра (/-5s>?») и поэтому подставим в E8) асимптотические значения функций t!f' и ?'/''. Положим также ? (— i)' (eB,P^1 (cos 6) sin 6— mBt p'" ,'cos e> X (-/)' (еВ^^р-ЯВ^»' (COS9) sinO)[ • (=1 ч '\ ) (92) Тогда |?f,s)|a = /{|s)cosa<p, |?$,s)|3 = /^sin2 ф. (93) Определим плоскость наблюдения как плоскость, в которой лежат направ- ление распространения падающего света и направление @, q>) наблюдения. Согласно D) и G) ф представляет собой угол между этой плоскостью и направ- лением колебаний электрического вектора падающей волны. На основании (93) либо Ео,\ либо /;!/' равно нулю, когда ф = 0 или ф — л/2; поэтому рас- сеянный свет линейно поляризован, если плоскость наблюдения параллельна или перпендикулярна первичным колебаниям. Поскольку отношение Ео'/Е^ комплексно, в любом другом направлении F, ф) свет в общем случае поляри- зован эллиптически. Однако в частном случае рэлеевского рассеяния (см. (88)) отношение Ео,'Е\р всегда вещественно и, следовательно, рассеянный свет линейно поляризован при всех направлениях наблюдения. На практике мы обычно имеем дело с рассеянием естественного света. Соответствующие формулы для этою случая, как и в § 1.5, можно получить из формул Для поляризованного света с помощью усреднения по всем направ- лениям поляризации **). Обозначая усреднение чертой и учитывая, что cos2 <p = = sin^= 1/2, мы получим вместо (93) соотношения *) Как мы уже упоминали на стр. 106, в своих знаменитых статьях о голубом цвете неба Рэлей показал, что спонтанные флуктуации плотности однородной среды вызывают рассеяние такого же типа [321. **) Можно также воспользоваться результатом п. 10.8.2, согласно которому волну есте- ственного света мы вправе считать состоящей из двух некогерентных волн равных чмплитуд, распространяющихся в одьом направлении и поляризованных во взаимно перпендикулярных направлениях. Рассматривая рассеяние каждой такой волны отдельно и суммируя их интен- сивности, для того чтобы получить полную интенсивность, вновь придем к выражениям (94).
§ 13.5] ДИФРАКЦИЯ НА ПРОВОДЯЩЕЙ СФЕРЕ. ТЕОРИЯ МИ 603 В общем случае ни if, ни if не равны нулю, так что рассеянный свет час- тично поляризован. По аналогии с A.5.42) степень поляризации Р рассеян- ного света можно определить как ¦¦¦*' (95)' П Неполяризовацная доля рассеянного света тогда равна (If + /if) (I -F) = 2/[,s), когда /{,¦></?>, ) (If + I\?)(l-P) = 2lf, когда /ff>/is). J Зависимость интенсивности и поляризации рассеянного света от направ- ления рассеяния и от физических параметров (л, а, п) исследовали па основе (96) а=90мш Рис. 13.10. Полярные диаграммы для рассеяния линейно поляризованного света сферической частицей золота [45]. А, л4 ¦ 1,33, п<И)=0.57 + 2,4 теории Ми многие авторы *), однако здесь мы можем лишь кратко суммиро- вать некоторые основные результаты. На рис. 13.10 и 13.11 показана зависимость интенсивности, а также непо- ляризованной доли рассеянного света от угла наблюдения 6 для диэлектри- ческой и металлической сфер различных размеров. Длина радиуса-вектора для внешних кривых пропорциональна /<я — J(^ + if, а для внутренних кривых, если не оговорено особо, /<?>. Единицы измерения произвольны и различны для каждого рисунка. Анализ этих полярных диаграмм, а также других опубликованных данных позволяет сделать следующие общие выводы. За исключением сл"\чая очень большой проводимости или диэлектрической проницаемости (при этом большая часть падающего света излучается в обрат- ном направлении, т. е. «отражается», полярные диаграммы в предельном слу- чае исчезающе малых сфер (а->0) симметричны относительно плоскости, про- ходящей через центр сферы и перпендикулярной к направлению распростра- нения падающего света. Интенсивность рассеянного света достигает максимума как в направлении, совпадающем с направлением падающего света F — 0J), так и в обратном направлении F — 180°) и имеет минимум в плоскости сим- *) В дополнение к уже цитированной работе Ми можно указать на работы [33—40]. Очень полный обзор результатов, полученных рядом исследователей, изложен в статье [22] и в книге [41]. См. также [42—441. (На русском языке результаты, относящиеся к молекулярному рассея- нию, изложены в монографии Фабелинского 183*1. {Прим. перее.))
604 МЕТАЛЛООПТИКА [ГЛ. 13 метрии F = 90°). При увеличении радиуса сферы наблюдаются отклонения от симметрии, причем в направлении падения рассеивается больше света, чем в обратном направлении. Это явление часто называют эффектом Ми. При дальнейшем увеличении радиуса практически весь рассеянный свет будет распространяться в направлении, близком к Э = 0; для проводящей сферы наибольшая концентрация света происходит также в этом направлении. Однако Рис. 13.П, Полярные диаграммы для рассеяния линейно поляризованного света диэлектриче- ской сферой с показателем преломления л=1,25 [35J. если радиус сферы очень велик по сравнению с длиной волны, то, как следует из геометрической оптики, большая часть падающего света отражается. Зависимость интенсивности рассеянного света от радиуса сферы иллюстри- рует табл. 13.4. Наличие эффекта Ми ясно видно из сравнения величин, приведенных в первом и третьем рядах. Как мы видим, имеется очень быст- рый рост интенсивности с увеличением размеров сферы; чтобы получить истинные значения интенсивности, данные в таблице нужно умножить на ктЧ4л*а-= I/?3. Когда q превышает единицу, т. е. диаметр сферы 2а больше Хт1п, появ- ляется серия максимумов и минимумов, которые на первый взгляд распределе-
§ 13.5] ДИФРАКЦИЯ НА ПРОВОДЯЩЕЙ СФЕРЕ. ТЕОРИЯ МИ 605 1 Таблица 13.4 Зависимость нормированных значений интенсивности 4я2а2 (/'j5' + /f*')/^1'' света, рассеянного диэлектрическими сферами с показателем преломления /t=l,25, от параметра ц = 2я.аГк [36] е 0° 90° 180° 5 9 5 9 = ,0 л ,0 0,01 Ю-'4 Ю-14 .10-" 5 4 9=0,1 ,0 п ,9 10-8 10-8 ю-8 1 5 7 9=0,5 ,2 ,0 ,8 Ю-4 ю-1 2 3 1 9=1 ,310-1 ,610-2 ,9.Ю-3 2 9 = 2 4,3 ,510-1 ,0-10—' 9,8- 2, 1, 5 102 7 3 7 9= ,5 7 0 = 8 •103 ,1 ,9 ны не регулярно. Появление ряда максимумов и минимумов при больших q согласуется с теорией Гюйгенса — Кирхгофа. Результаты, относящиеся к поляризации рассеянного света, снова оказы- ваются различными и зависят от того, велико ли значение \п |. Для очень малых сфер с очень большой проводимостью (а—>-оо) или очень большой диэлектрической проницаемостью (е^оо) поляризация максимальна, когда 8 = 60° (угол Томсона). С увеличением радиуса сферы ее максимум сме- щается в направлении увеличения 9. Зависимость поляризации от угла наблюдения 0 для сфер с конечной про- водимостью и конечной диэлектрической проницаемостью показана для двух типичных случаев на рис. 13.10 и 13.11. Когда радиус сферы очень мал (q—>-0), диаграмма поляризации, как и диаграмма интенсивности, симметрична отно- сительно плоскости ху и имеет максимум при 6 =90°, где поляризация полная. В этом случае (рэлеевское рассеяние) степень поляризации можно записать в виде одного аналитического выражения, получающегося при подстановке (88) и (93) в (95), а именно Эта формула была получена Рэлеем другим способом. При увеличении радиуса сферы примерно до значения а = Яш/я максимум поляризации смещается. В большинстве исследованных случаев смещение происходит в направлении увеличения 9 для диэлектрических сфер и в на- правлении уменьшения 6 для поглощающих сфер. При дальнейшем увеличении радиуса сферы появляется нерегулярная последовательность поляризационных максимумов. В направлении 9 = 90° свет при q<Z 1 почти полностью поляризован, при- чем его электрический вектор перпендикулярен к плоскости наблюдения. При больших значениях q это уже не так, и картина становится сложнее. До сих пор мы ограничивались случаем монохроматического света. Однако мы часто сталкиваемся с рассеянием полихроматического света, и поэтому необходимо также рассмотреть эффекты, возникающие из-за наличия компо- нент с различными длинами волн. Заметим, что длина волны входит в наши формулы лишь через параметр q и показатель преломления п. В достаточно малой области длин волн п практически не зависит от X, если в выражении F0) член, содержащий проводимость а, мал по сравнению со вторым членом, т, е. в случае слабо проводящей сферы. Вместе с тем в предельном случае бес- конечно большой проводимости п вообще не входит в наши формулы, и тогда интенсивности спектральных компонент зависят лишь от й/ЯA). Таким обра- зом, влияние изменения длины волны по существу эквивалентно влиянию, вы- зываемому изменением на соответствующую величину радиуса сферы, Так как
606 МЕТАЛЛООПТИКА [ГЛ. 13 для разных длин волн максимумы поляризации оказываются при различных углах наблюдения, то при наблюдении рассеянного света через поляризующую призму видны сложные изменения цвета. Этот эффект называется полихро'из- мом. Зависимость поляризации рассеянного света от длины волны — диспер- сия поляризации—обеспечивает очень строгую проверку изложенной выше теории *). 13.5.3. Полное рассеяние и затухание, а. Некоторые общие соображения Представляет значительный практический интерес определить полное количе- ство света, которое рассеивается или поглощаегся сферой. Его можно найги, вычисляя вектор Пойнтинга и интегрируя его по всем направлениям. С по- мощью соотношений ортогональности, которые существуют между присоеди- ненными функциями Лежандра, интегралы можно выразить через коэффици- енты еВ1 и mBt. Эти расчеты довольно длинны; полностью они выполнены в ра- боте Ми 145]. Полную потерю энергии падающей волной, т. е. сумму рассеянной и по- глощенной энергии, можно определить другим способом из некоторых общих соображений, применимых к телу совершенно произвольной формы. Расчеты показывают существование тесной связи между потерей энергии и амплитудой рассеянной волны в первоначальном направлении (в = 0). Из этого результата (который мы сейчас получим) и из формулы Ми для рассеянной волны легко найти полную потерю энергии на рассеяние и поглощение сферой Рассмотрим плоскую монохроматическую волну, падающую на неболь- шое тело произвольной формы, находящееся в диэлектрической среде. Поле в любой точке среды, окружающей тело, вновь можно представить в виде суммы падающего и рассеянного нолей, т. е. Е = Е<г>+Е<!>, H = H<'> + H<S>. (98) Как обычно, мы опустим временной множитель ехр(—ia>t). Усредненный по времени поток энергии определяется средним значением вектора Пойнтинга. На основании (98) и формулы A.4 56) это среднее значение равно <S> = <S«> + <S<«> + <S'>, (99) где = -|rRe<E(<>x(H">)*>, A00a) ^ A006) g^ )*>. (Ю0в) Рассмотрим усредненный поток энергии, выходящий через поверхность сферы большого радиуса R с центром в некоторой точке области, занятой телом. Полный поток в единицу времени равен интегралу от радиальной компоненты <S>r величины <S>, взятому по сфере Очевидно, что для диэлектрического тела он равен нулю Однако для проводящего тела, поглощающего часть па- дающей энергии, суммарный поток через поверхность сферы совпадает по ве- личине со скоростью, с которой происходит поглощение. Пусть ^"("l — скорость поглощения энергии телом. Тогда из (99) имеем где WKt\ W™ и W — интегралы от радиальных компонент <SU)>r, <SW>, и <S'>r, взятые по поверхности сферы. Поскольку предполагается, что среда, окружающая тело, является непроводящей, ^"м = 0 и, следовательно, A02) *) Дисперсия поляризации и пол^хроизм исследовались в работе [46],
§ 13.5] ДИФРАКЦИЯ НА ПРОВОДЯЩЕЙ СФЕРЕ. ТЕОРИЯ МИ 607 где 5 — поверхность сферы и п — единичный вектор внешней нормали. Таким образом, выражение, стоящее в правой части A02), представляет скорость по- тери энергии на тепло и на рассеяние. Введем единичный вектор п„, направление которого .совпадает с направ- лением распространения падающей волны. Тогда E<" = eexp(«"ft("(n0-r)), H(() = hexp {ikm (nn-r)). A03) Предположим, что эта волна линейно поляризована, и поэтому е и h можно считать вещественными постоянными векторами. На больших расстояниях от тела рассеянную волну можно считать сферической, т. е. r) . A04) Векторы а (п) и b (n) характеризуют силу излучения, рассеянного в направле- нии п. Так как и падающая, и рассеянная волны подчиняются уравнениям Максвелла, получим (ем. уравнения A.4.4) и A.4.5)) h=J/"?»noxe, b = l/^nxa, 1 oe = noh = O, na=nb = 0, I где еш — диэлектрическая проницаемость внешней среды, которая предпо- лагается немагнитной {(х = 1). Из этих соотношений следует, что на поверх- ности S сферы большого радиуса > х ( <s))*) • п = К'кA> е• а*ехр [ikm R (п„ • n)] exp [ R A06) (Ew>x(H">)»)-n = = |/^ [(n.ns) (ae)-(n-e) (n.-a)] exp [-ik™R (n.• n)] exp [gmR] Подставим найденные выражения в A02). Для вычисления полученного ин- теграла воспользуемся леммой *), которая утверждает, что для произвольной функции f(ri) при больших R можно написать i- J j / (n) exp [ — ?*«> R (n0 -n)]dS» Тогда мы получим A08) s) x (н«>)*). n rfS»^- V'e™ [e • a (no)+e • a (—n0) exp BikwR)], _ а соотношение A02) примет вид где Im означает, что берется мнимая часть. Из соотношения A09) следует, что в случае падения линейно поляризован- ного света скорость Оиссипации энергии пропорциональна проекции на направ- ление электрического вектора падающей волны амплитуды волны, рассеянной в первоначальном направлении [п -=п0). *) Эту лемму можно доказать после очевидной замены переменных с помощью принципа стационарной фазы (см. приложение 3). См. та^же [47].
608 МЕТАЛЛООПТИКА [гл. 13 Величина Q, равная отношению скорости диссипации энергии (^i'<«>-f-^ls!) к количеству энергии, падающей в единицу времени на единичную площадку в сечении тела (|<S(">|), называется сечением экстинкции тела. Из (I'lQa), A03) и A05) следует, что |<S'°>| =c}/V)eV8:ri, так что, согласно A09), найдем Q = = 2Я,«) Im Ч). I < S" > | Эта формула получена Ван X у летом *) [48]. Аналогичным образом можно определить сечение рассеяния поглощения Qw) тела, а именно (ПО) и сечение у (HI) Очевидно, что Q = Q(s)-(-Qw). Для непоглощающего тела Q{tt) = 0, и сечение экстинкции совпадает с сечением рассеяния. Прежде чем применить соотношение (ПО) к сферическому телу, найдем величину Q для тела, которое практически не пропускает падающего света. Предположим также, что его линейные размеры велики по сравнению с длиной волны. В этом случае применима теория Гюйгенса — Кирхгофа, и основной вклад в рассеяние в направлении падения света обусловлен дифракцией Фраун- гофера. Пусть па тело падает линейно поляризованная волна с плоским волно- вым фронтом, причем Л' — часть этого фронта, не закрываемая препятствием, и <Л ¦—его часть, занятая препятствием (рис. 13.12). Рассмотрим рассеянное поле Е в точке Р, находящейся на большом расстоянии от тела. Согласно принципу Гюйгенса — Френеля и принципу Бабине (8.3.21) имеем для малого угла дифракции '-?.«>еУУ fixp (»<;<»/¦) dS, A12) Рис. 13.12. К выводу соотношения A14) для сечения экешпкции при большом препятствии Если точка Р находится очень далеко от препятствия в направлении распростране- ния падающей волны, то г можно считать постоянным, и A12) дает E(n(n,) = -4ri3eexp('f"/'); (ИЗ) здесь D — геометрическое поперечное се- чение тела (площадь Ж). Следовательно, б данном случае вектор а в A04) как функция п0 определяется выражением iDt/%il) и из A10) находим, что Q = 2D. A14) Таким образом, сечение экстинкции большого непрозрачного тела равно удвоен- ному значению его геометрического поперечного сечения. На первый взгляд полу- ченный результат кажется несколько парадоксальным, так как можно было бы ожидать, что для тела большего размера должно было бы быть справедливым приближение геометрической оптики, а в этом приближении сечение экстинк- ции равно D. Объяснение этого кажущегося противоречия **) заключается в том, что независимо от размеров тела и расстояния до точки, в которой рас- сматривается поле, всегда имеется хотя бы узкая область — вблизи края гео- метрической тени,— где приближение геометрической оптики несправедливо. *) Используемый здесь метод доказательства предложен в работе [49]. Аналогичная тео- рема существует и в теории атомных столкновений [50, 51]. **) Аналогичный кажущийся парало«< нпервые отмеченный в работе [521, возникает в проблемах рассеяния в квантовой механике.
§ 13.5] ДИФРАКЦИЯ НА ПРОВОДЯЩЕЙ СФЕРЕ. ТЕОРИЯ МИ 609 Помимо света, задерживаемого телом с поперечным сечением D (потери на отра- жение и поглощение), возникает дополнительный вклад в экстинкцию, обуслов- ленный соседством с краем тени, и очевидно, что этот вклад также ранен D. Для экспериментальной проверки соотношения A14) необходимо собрать свет с достаточно широкой площадки, расположенной достаточно далеко от тела *). Применим теперь общую формулу A10) к сферическому телу. На основа- нии E8) проекция амплитуды рассеянной волны на направление электрическо- го вектора падающей волны (<р — 0) при рассеянии вперед @ — 0) определяется выражением да -1*В$> (*«> г) \рр (cos ej-jJ-g-l }. A15) Оба члена, содержащих присоединенные полиномы Лежандра, легко найти из выражения **) [23] SS{№)() } здесь сх, с2, ... зависят лишь от / и т. Из последнего выражения и из его про- изводной находим изводной находим (ЯГ (cos 9)sin 9)9=0 ==-4'('+!)• A17) (sm9) Подставляя A17) в A15) и используя для ??' и ?'/'' асимптотические прибли- жения G4) и G6), получим Вспоминая, что амплитуда падающего поля считается равной единице (е2 = 1), находим искомую величину е-а(по)/е'2, разделив найденное выражение на exp(ika)r)lr. Подставляя ее в A10) и используя тождество !m(z)=Re(—/г), справедливое для любого комплексного числа г, мы окончательно получим следующие выражения для сечения экстинкции сферы: 1[«Д( + "Д1], A19) 1=1 здесь коэффициенты еВ, и mBt определяются выражениями F2). б. Результаты расчетов. Суммируем теперь основные результаты расчетов полного рассеяния, полного поглощения и экстинкции для сферы. В п. 13.5.2 мы показали, что при диаметре сферы, значительно меньшем длины волны (рэлеевское рассеяние), необходимо учитывать лишь первую электрическую парциальную волну. В этом случае амплитуда рассеянной волны пропорциональна 1/(АшK, так что полное рассеяние обратно пропор- ционально четвертой степени длины волны. Если учитывать также члены более высокого порядка, которые зависят от радиуса сферы и материальных постоян- ных, то полное рассеяние станет очень сложной функцией длины волны и будет *) Тщательный анализ, приводящий к лемме A07), показывает, что часть поверхности сферы S, вносящая заметный вклад в Q, стягивает центральный телесный угол порядка (/6R)-P, где 1 > р> 4'5 (см. |47]). Более подробное исследование вопроса о сечении экстинкции большой частицы и роли геометрической тени люл<но найти в работах [53, 54]. '") Формула, прицеленная в [23]. отличается от A16) множителем (—1)и. Различие свя- зано с тем, что в работе [23| использовано несколько иное определение присоединенных поли- номов Лежандра (см. сноску на стр. 597).
610 МЕТАЛЛООПТИКА [гл. 13 ¦W4 селективным *). В случае золота, например, даже очень маленькая сфера дает максимум вблизи Х = 5500 А (рис. 13.13). Такой максимум можно интерпретировать как своего рода резонанс. Пред- положим, что сфера не испытывает влияния поля падающего пучка света, но в ней возбуждены свободные электромагнит- ные колебания. Частоту и постоянную за- тухания таких свободных колебаний мож- но получить из изложенной выше теории, если в уравнениях E6) опустить члены, не содержащие коэффициентов L'Rl и "*Вг. По- лучающаяся система линейных однородных уравнений допускает нетривиальное реше- ние только в том случае, если они совме- стны. Тогда каждое решение уравнения соответствует затухающим собственным ко- лебаниям; частота таких колебаний очень близка к частотам, на которых имеется мак- симум интенсивности для определенных рассеянных парциальных волн **). Расчеты рассеяния и экстинкции сфе- рами конечного радиуса для выбранных значений показателя преломления были проделаны многими авторами. Большин- ство расчетов относится к диэлектриче- ским (вещественное п) и слабо поглоща- приведеиа типичная кривая, полученная ***) и= 1,33. Такой же 4800 45№ то ssos ввоо еж л,а Рис. 13.13. Зависимость полного рас- сеяния на очень маленьких сферах (a-i-0) от длины волны [56]. / — ртуть, //—колото. ///—серебро, /V — идеальный проводник. нжшм сферам. На рис. 13.14 Гольдбергом для сфер с показателем преломления показатель преломления у воды, и поэтому указанные результаты представляют интерес в связи с пропусканием света дымкой, тучами и туманом, а также I I \ •J 10 15 го 25 SO Рис. 13.14. Зависимость сечения рассеяния диэлектрических сфер с показателем преломления п~ 1,33 от параметра q— 2naJX^ [59]. в связи с теорией камеры Вильсона и т. д. Как мы видим, на кривой имеется серия максимумов и минимумов, и с увеличением радиуса сферы сечение экс- тинкции в согласии с уравнением A14) стремится к удвоенному значению гео- *} Интересным примером селективного рассеяния служат явления, наблюдавшиеся' в' сентябре 1950 г., когда на большой части Европы Солнче (а также .Луна) казалось насыщенно голубым. Спектроскопические измерения «голубого» и нормального Солнца позволили полу- чить кривую экстинкции слоя, выбывающего это явление. Было сделано заключение, что голу- бой цвет обусловлен селективным рассеянием дымом, вероятно, состоящим из поразительна одинаковые но размеру капелек масля, занесенных ветрами, дующими в верхних слоях атмос- феры, из горящих лесов в Альберте [55]. **) Оптический резонанс наблюдал Вуд [57] на гранулирозанных пленках и парах щелочных металлов. Собственные колебания сферы изучались Дебасм [58]. ***) Этот случай исследовался также в работах [60, 61]. Сходные кривые, относящиеся к другим значениям показателя преломлении, были получены многими авторами, например, [22, 41, 62-65].
§ 13.5] ДИФРАКЦИЯ НА ПРОВОДЯЩЕЙ СФЕРЕ. ТЕОРИЯ МИ 611 метрического сечения. На кривой заметна также тонкая структура, т. е. до- полнительные небольшие максимумы и минимумы. Естественно, что эти не- большие флуктуации сглаживаются, если рассеяние нызывается многими сфе- рическими частицами не точно одинакового размера. Аналогичный характер имеют кривые экстинкции для диэлектрических сфер с другими показателями преломления. Можно показать, что если п не слишком отличается от единицы, первый максимум у нсех кривых получается при значении q, определяемом выражением*) 2q(n—1)«4, и О при этом может достигать величины 4jm2. Для полиостью отражающих сфер [64, 66] (и->оо) первый максимум на криной экстинкции оказывается при <?= 1,2, a Q = 2,29 ла3, первый минимум — при q = 1,6, a Q = 2,12 na*. Затем появляются слабые осцилляции н кривая приближается к значению 2яаа, когда q-*-oo. Расчеты, относящиеся к случаю поглощающих сфер, значительно более трудоемки, и поэтому подробно изучено лишь несколько специальных случаев. На рис. 13,15 показаны кривые, отно- сящиеся к рассеянию, поглощению и О 1 2 3 q о ' 2 "V ~В"~ 8 й 2qd Рис. 13.15. Сечение поглощения Qta>, се- Рис. 13.16. Кривые экстинкции Q/Jraz (сплошные чение рассеяния Q(s) и сччение экстинкции линии) и кривые поглощения Q<a>/jxaa (пунктирные линии) для слабо пилощающих сфер с показате- лем преломления п =(l+6)+i6 tg P, где величи- на 6 вещественна и мала по сравнению с едини- цей [69] Q для железных сфер различного радиуса 1671. экстинкции небольшими сферами железа. Для сфер с большим диаметром при расчете можно пользоваться асимптотическими формулами [68], выведенными на основе теории Ми и асимптотических разложений Дебая для цилиндрических функций. Случай слабо поглощающих сфер рассматривался Xулетом [69!, результаты его расчетов показаны на рис. 13.16. Как мы видим, в последнем случае общее поведение кривых экстинкции, аналогично их поведению для диэлектрических сфер, но уже очень небольшой проводимости достаточно, чтобы полностью сгладить имеющиеся слабые осцилляции. При дальнейшем увеличении проводимости первый минимум совершенно исчезает и функции, описывающие экстипкцию и поглощение, монотонно увеличиваются, асимпто- тически приближаясь к значениям 2 и 1 соответственно. Теорию Ми можно проверить экспериментально путем наблюдения'рас- сеяния света либо одной сферической частицей, либо многими частицами (мутные среды, коллоидные растворы). Такую проверку относительно легко *) Величина 2д(п— 1) представляет фазовый сдвиг, который претерпевает луч света, пере* секагоший сферу по диаметру. Это полезный параметр, и если строить кривые экстинкции в за- висимости от него, то при п, не слишком отличающемся от единицы, они чрезвычайно похожи друг на друга. 39»
612 металлсюптика [гл. 13 провести для больших частиц, но она становится довольно трудной, когда диаметр каждой частицы порядка длины волны или меньше. Ла Меру с сотруд- никами [62, 63, 701 удалось проверить теорию, измеряя угловое распределение рассеянного света, а также полное рассеяние от взвеси серных золей в воде (частицы диаметром от 3000 до 5000 А). Они использовали излучение с длинами волн в вакууме от 2850 до 10000 А и нашли прекрасное согласие с предсказа- ниями теории Ми. В некоторых случаях па кривой экстинкции наблюдались даже мелкие флуктуации (тонкая структура) (см. рис. 13.14). Ряд авторов изучал рассеяние света несферическими частицами, но в об- щем случае аналитический вид соответствующих волновых функций настолько сложен, что строгие решения имеют ограниченное практическое значение *). Ганс [75] и другие исследователи рассматривали рассеяние электромагнитных волн эллипсоидами с размерами, малыми по сравнению с длиной волны; строгое решение для эллипсоида произвольного размера было получено в работе [761. Рассеяние длинными круглыми проводящими цилиндрами изучалось еще в 1905 г. Зейтцем [77] и Игнатовским [78], и полученные ими формулы подобны формулам Ми для сферы. Рассеяние длинными круглыми диэлектрическими цилиндрами и цилиндрами с высоким отражением исследовали Шеффер и Гроссманн [79] (см. также [80]). ЛИТЕРАТУРА 1. Л. Kundt, Ann. d. Physik 34, 469 2. P. Drude, Ann. d. Physik 39, 504 A890).' 3. J. R. С о 1 1 i n s, R. О. В о с k, Rev. Sci. Instr. 14, 135 A943), 4. I. S i m о n, J. Opt. Soc. Arner. 41, 336 A951). 5. D. G. A very, Proc. Pbys. Soc. 65, 425 A952). 6. R. W. D i t с h b u r n. f. Opt. Soc. Amer. 45, 743 A955). 7. H. H. Landolt, R. Bornstein. Phys. Chem, Tabellen, 5 Aufl., Berlin, 1923; 1—3 F.rganzungsb., 1927—1936. 8.E. Hagen, H. Rubtns, Ann. d. Physik 11, 873 A903). 9. M. Planck, Theory of Heat, McMillan, London, 1932. (M. П л а н к, Введение в тео- ретическую физику, ч. 5, Теория теплоты, ОНТИ, 1935) 10. A. S о m m е г f е 1 d, Thermodynamics and statistical Mechanics, ed. by F. Bopp a. J. Meix- ner, Acad. Press, N. Y., 1956. (A. 3 о м м е р ф е л ь д, Термодинамика и статистическая физика, ИЛ, 1955.) 11. М. В о г n, Atomic Physics, Blackie a. Son, London, 5th ed., 1951, (M. Б о р н, Атомная физика, «Мир», 1965.) 12. К. Hammer, Z. Tech. Phys. 24, 169 A943). 13. F. Abelcs, Rev. d.'Opt. 32, 257 A953). 14. L. N. H a d 1 e y. D, M. Denniso n, J. Opt. Soc. Amer. 37, 451 A947); 38, 483 A948). 15. S. T о 1 a n s ky, Multiple-beam Interferometry of Surfaces and Films, Oxford Univ. Press, 1948, p. 26. 16. O. S. Heavens, Optical Properties of Thin Solid Films, Butterworths, London, 1955. 17. H. Schopper, Optik 10, 426 A953). 18. J. CM. Garnet t, Phil. Trans. Roy. Soc. A203, 385 A904); 205, 237 A906). 19. G. M i e, Ann. d. Physik 25, 377 A908). 20. P. Deb ye, Ann. d.'Physik. 30, 57 A909). 21. T. J. I'A. В г о m w i с h, Phil. Trans. Roy. Soc. A220, 175 A920). 22. H. С v a n d e H u 1 s t, Rech. Astron. Observ. Utrecht 11, Pt I A946). 23. W. M а у n u s, F. Obcrhettinge r, Formulas and Theorems for the Functions of Mathematical Physics, Chelsea Publ. Co., N. Y., 1954. 24. P. F r a n k, R. M i s e s, Riemann — Weber's DifferentiaIgleichungen der Mathematischcr Physik, Vieweg, Braunschweig, 2nd ed., 1935. (Ф. Франк, Р. М и з е с, Дифферен- циальные и интегральные уравнения математической физики, Гостехиздат, 1937.) 25. С. J. Bouwkamp, II. В. J. Casirai r, Physica 20, 539 A954); А. N i s b e t, Proc. Roy. Soc. A231, 260 A955); Physica 21, 799 A955). 26. A. Sommerfeld, Partial Differential Equations of Physics, Acad. Press, N. Y., 1949. (А. Зоммерфельд, Дифференциальные уравнения в частных производных физики, ИЛ, 1950.) *) Некоторыми авторами развивались приближенные методы (см., например, 171—73]). См. также обзорную статью [74].
ЛИТЕРАТУРА 613 27. G. N. W a t s о n, A Treatise on the Theory of Bessel Functions, Cambr. Univ. Press, 2nd ed., 1944. (Г. Н. Ватсоп, Теория бесселевых функций, ИЛ, 1949.) 28. К. Schwarzschild, Munch. Akad., Math.-Phys. Kl. 31, 293 A901). 29. P. D e b у e, Ann. d. Physik 30, 118 A909); Math. Ann. 67, 535 A909); Sitzungsb. Munch. Akad. Wiss., Math.-Phys. KL, 5 Abh. A910). 30. B. vanderPol, M. В г е m m e r, Phil. Mag. 24, 857 A937). 31. H. В uccr i us, Optik 1, 188A946). 32. R а у 1 e i 5 h. Phil. Mag. 41, 274, 447 A871); 47, 375 A899); Scientific Papers 1, 87. 104 A899); 4, 397 A903). 33. R. G a n s, Ann. d. Physik 78, 29 A925). 34. H. Seniileben, E, Benedict, Ann. d. Physik 60, 297 A919). 35. H. В 1 u ra e r, Z. i. Phys. 32,, 119 A925). 36. H. В 1 u га е r, Z. f. Phys. 38, 304, 920 A926). 37. H. В 1 u m e r, Z. f. Phys, 39, 195 A920). 38. С S с h a 1 ё n, Uppsala "Astr. Obs. Ann. 1, № 2 A939); Kb 9 A945). 39. G. R. P а г a n j p e, Y. G. N a i k, P. B. V a i d у a, Proc. Indian Acad. A9, 333, 352 A939). 40. H. H о 1 1, Optik 1, 213 A946); 4, 173 A948/49). 41. H. С v a n d e H u 1 s t, Light Scattering by Small Particles, John Wiley a. Sons, N. Y., Chapman a. Hall, London, 1957. 42. G. О s t e r, Chem. Rev. 43, 319 A948). 43. Tables of scattering functions for sphurial particles, Nat. Bureau Stand. Applied Mathematics ¦Series, 4, Washington, 1949. 44. R. O. G u m p г е с h t, CM. S I i e p ce v i с h, Light-Scattering Functions for Spherical Particles, Univ. of Michigan Press, Ann. Arbor. 1951. 45. G. M i e, Ann. d. Physik 26, 429 A908). 46. M. A. S ch i r m a n n, Ann. d. Physik 59, 493 A919). 47. D. S. Jones, Proc. Cambr. Phil. Soc 48, 736 A952). 48. H. C. V a n d e H u 1 s t, Physica 15, 740 A949). 49. D. S. J о n e s, Phil. Mag. 46, 957 A955). 50. E. Fe en berg, Phys. Rev. 40, 48 A932). 51. M. Lax, Phys. Rev. 78, 300 A950). 52. H. S. W. Masse у, С. В. О. М о h r, Proc. Roy. Soc. A141, 434 A933). 53. D. S i n с 1 a i r, J. Opt. Soc. Amor. 37, 475 A947). 54. L. В г i 1 1 о u i n, J. Appl. Phys. 20, 1110 A949). 55. R. W i 1 s о n, Mo. Not. Roy. Astr. Soc. Ill, 478 A951). 56. R. F e i с k, Ann. d. Physik 77, 582 A925). 57. R. W. Wood, Phil. Mag. 3, 396 A902). 58. P. D e b у e, Ann. d. Physik, 30, 73 A909). 59. В. G о 1 d b e r g, J. Opt. Soc. Amer. 43, 1221 A953). 60. H. H о 1 1, Optik 4, 173 A948). 61. H. G. Houghton, W. R. С h a 1 k e r, J. Opt. Soc. Amer. 39, 955 A949). 62. M. D. В a r n e s, V. K. L a M e r, J. Colloid Sci, 1, 79 A946). 63. M.D. Barnes, A. S. Kenyon, E. M. Z a i s e r, V. K. La M e r, J. Colloid Science 2, 349 A947). 64. J. L. Grccnstein, Harvard circ, 1937, № 422. 65. R. P e n d о r f, J. Opt. Soc. Amer. 46, 1001 A956). 66. F. W. A. Gotz, Astr. Kachr. 255, 63 A935). 67. C. S с h a 1 ё n, Uppsala Aslr. Observ. Ann. 1, Ns 9 A945). 68. G. J о b s t, Ann. d. Physik, 76, 863 A925). 69. H. С v a n d e H u 1 s t, Rech. Astr. Observ. Utrecht 11, Pt. 2, 27 A949). 70. I. J ohnson, V. K. La Mer, J. Amer. Chem. Soc. 69, 1184 A947). 71. R. W. H a rt, E. W. M о n t г о 1 I, J. Appl. Phys. 22, 376 A951). 72. E. W. Mo n t г о 1 1, R. W. H a r t, J. Aupi. Phys. 22,, 1278 A951). 73. E. W. M о п t г о 1 1, J. M. G r e e n b с г g, Phys. Ruv. 86, 889 A952). 74. С J. В о u w k и m p, в сб. «Rep. Progr. Phys». Phys. Soc. London, 1954, Vol. 17. p. 35. 75. R. G a n s, Ann. d. Physik 37, 881 A912); 47, 270 A915). 76. F. M б g 1 i с h, Ann. d. Ph>sik 83, 609 A927). 77. W. S e i t z, Ann. d. Physik 16, 746 A905); 19, 554 A906). 78. W. I g n a I o w s k y, Ann. d. Physik 18, 495 A905). 79 C. S с h a e f f e r, F. G г о s s m a n n, Ann. d. Physik 31, 455 A910). 80. H. С van de H u 1 s t, Astrophys. J. 112, 1 A950). 81* В. Л. Гинзбург, Г. П. М о т у л е в и ч, УФН 55, 469 A955). 81а". Г. П. Мотулевич, УФН 97, 211, 19697. 82*. А. В. Соколов, Оптические свойства металлов, Физматгиз, 1961. 83*. И. Л. Фабелинский. Молекулярное рассеяние света, «Наука», 1965.
ГЛАВА 14 КРИСТАЛЛООПТИКА *> § 14.1. Тензор диэлектрической проницаемости анизотропной среды Вспомним, что в основе нашей оптической теории лежат две отдельные системы: одна — уравнения Максвелла A.1.1) и A.1.2), другая — материаль- ные уравнения, которые для изотропной среды были записаны в виде формул A.1.9)— A.1.11). Чтобы принять во внимание анизотропию кристаллов, не- обходимо обобщить последние уравнения. В основной части настоящей главы мы будем рассматривать однородную, непроводящую (а — 0) и магнитно изо- тропную среду **), считая ее, однако, электрически анизотропной. Иными словами, мы будем рассматривать вещества, электрическое возбуждение кото- рых зависит от направления электрического поля. Тогда вектор D, вообще говоря, не будет параллелен вектору Е. Заменим уравнение A.1.10) простей- шим соотношением между D и Е, позволяющим учесть анизотропию, а именно соотношением, в котором каждая компонента вектора D связана линейно с ком- понентами Е, т. е. D Е Е Е Девять величин е сх, e,/v, ... являются постоянными среды и составляют тензор диэлектрической проницаемости; следовательно, вектор D равен произведению этого тензора на вектор Е. „ > Перепишем уравнение A) в более компактной форме: гЕ„ B) где k — один из трех индексов х, у или г, а индекс I, по которому ведется сум- мирование, принимает по очереди значения х, у и г. При формальной тензорной записи знак суммирования обычно опускают, а указанием на суммирование по всем значениям I служит двукратное появление в произведении этого ин- декса. Однако мы сохраним знак суммы, так как это поможет избежать каких- либо неясностей для читателей, не знакомых с тензорным исчислением. Предположим, что выражения A.1.31) для плотностей электрической и магнитной энергий остаются^ спраэедливыми и здесь. Тогда ^=ЖВ'Н = 1^№. D) Сохраним также определение вектора Пойнтинга, или «лучевого вектора», *) В настоящей главе рассматриваются вопросы кристаллооптики без учета простран- ственной дисперсии. Учет пространственной дисперсии в кристаллооптике выполнен в книге В. М. Аграновича и П. Л. Гинзбурга [40*]. (Прим. ред.). **) Существуют так>че маиштные кристаллы, но поскольку влияние намагничения на оптические явления мало (бысчрыс осцилляции), магнитной анизотропией можно пренебречь. Однако чтобы сохранить некоторую симметрию формул и включить слабо магнитные кристал- лы, мы учтем магнитную проницаемость, считая ее скалярной величиной ^l; кроме того, это облегчит написание уравнений в тех системах единиц, где ц для вакуума не равно единице. ,
¦§ 14.1] ТЕНЗОР ДИЭЛЕКТРИЧЕСКОЙ ПРОНИЦАЕМОСТИ АНИЗОТРОПНОЙ СРЕДЫ 615 задаваемое A.1.38), т. е. S; = ^EXH, (б) и посмотрим,-согласуются ли эти определения с законом сохранения энергии. Как и в п. 1.1.4, умножим первое уравнение Максвелла на Е, второе на Н и используем векторное тождество A.1.27). Тогда получим ^ ? F) Если разделить обе части этого равенства на 4л, то второй член в правой части будет представлять скорость изменения магнитной энергии в единице объема, но первый его член окажется скоростью изменения плотности электрической энергии лишь при условии "т. е. при *( ". Здесь различие индексов k и I фиктивно, так как оба они принимают одни и те же значения (х, у, г). Следовательно, наше выражение не изменится, если переставить k н I во втором члене, что дает ы Поскольку такое условие должно выполняться при любом значении поля, отсюда следует, что kt — Ik' 1 / Это означает, что тензор диэлектрической проницаемости должен быть сим- метричным. Из девяти его компонент только шесть независимы. Обратно, условие (8) достаточно, чтобы обеспечить справедливость уравнения G), и мы получаем теорему, выражающую закон сохранения энергии в дифференциаль- ной форме («гидродинамическое уравнение непрерывности» A.1.43)), т. е. Симметричность тензора е позволяет привести выражение для электриче- ской энергии w,. к такой форме, при которой сохраняются лишь квздрагы ком- понент поля и отсутствуют их произведения. Рассмотрим в пространстве х, у, г поверхность второго порядка гххх2 + еууу" + еггг2 + 2sy!yz + 2г„хг + 1вхуху = const. A0) Левая часть уравнения A0) должна иметь положительную квадратичную форму, потому что при замене х, у и г на компоненты вектора Е она становится равной 8па)е, а энергия we должна быть положительной для любого значения вектора поля. Поэтому уравнение A0) описываег эллипсоид, и его всегда можно при- вести к главным осям эллипсоида; таким образом, существует система коорди- нат, связанная с кристаллом, в которой уравнение эллипсоида имеет вид ехх2-\-еуу2-{-егг2 = const. A1) В этой системе главных диэлектрических осей материальные уравнения и выражение для электрической энергии принимают простую форму, а именно:
616 кристаллооптика [гл. 14 Величины ех, гу, гг называются главными диэлектрическими проницаемостями. Из приведенных выше формул непосредственно следует, что D и Е всегда имеют различные направления, если только направление вектора Е не совпадает с одной из главных осей или все главные диэлектрические проницаемости не равны друг другу. В последнем случае (е* — еи = ег) эллипсоид вырождается в сферу. Здесь необходимо сделать замечание о влиянии дисперсии. Напомним, что в случае изотропных сред диэлектрическая проницаемость не является посто- янной вещества, а зависит от частоты, и точно так же в анизотропной среде шесть компонент тензора диэлектрической проницаемости &hl изменяются с изменением частоты. Поэтому меняются не только значения главных диэлект- рических проницаемоегей zx, «,,, г2, но и направления главных осей. Это явле- ние известно как дисперсия осей. Однако оно может возникать лишь в тех кри- сталлических структурах, симметрия которых не позволяет выделить пред- почтительный ортогональный триплет направлений; т. е. в кристаллах моно- клинной и триклинной систем *) (см. п. 14.3.1). Можно не учитывать дисперсию, если ограничиться рассмотрением моно- хроматических волн; тогда величины shl являются постоянными, зависящими лишь от свойств вещества. § 14.2. Структура монохроматической плоской волны в анизотропной среде 14.2.1. Фазовая и лучевая скорости. Для монохроматической плоской волны с угловой частотой to — 2nv, которая распространяется со скоростью с/п в направлении единичного вектора нормали s, векторы Е, D, Н и В пропор- циональны (в комплексной записи) exp *a>(-j-(r-s)— t) L Заметим сразу же, что в дополнение к фазовой скорости (или скорости по нормали) с/п нам при- дется ввести еще лучевую скорость (или скорость энергии), поскольку, как будет показано далее, в анизотропной среде скорость и направление распрост- ранения энергии в общем случае отличаются от скорости волны и направления волновой нормали. Для такого гармонического поля операция d/dt всегда эквивалентна умно- жению на —по, а операция д/дх — умножению на iwnsje. В частности, имеем Ё = — /шЕ, rotE = i(BySXE, A) В области, не содержащей токов, т. е. там, где rolH—i-D=0, ^ уравнения Максвелла принимают вид = —D, здесь использовано соотношение В = цН. Исключая из уравнений C) Н используя хорошо известное векторное тождество, получим ? ?[E-s(s.E)]=2jEj.. D) Здесь Ех обозначает векторную компоненту Е, перпендикулярную к s и рас- положенную в плоскости векторов Ens (рис. 14.1). Из уравнений C) видно, что вектор Н (а следовательно, и В) перпендику- лярен к векторам Е, D и s, которые поэтому должны быть компланарны. Кроме того, вектор D должен быть ортогонален к s. Таким образом, как и в изотроп- •) Дисперсия осей особенно заметна в инфракрасной области с,пектра (см. [1, 2]).
§ 14.2] МОНОХРОМАТИЧЕСКАЯ ПЛОСКАЯ ВОЛНА В АНИЗОТРОПНОЙ СРЕДЕ 617 ной среде, векторы Н и D перпендикулярны к направлению распространения s, a E составляет с ним некоторый угол, отличный от прямого. Рис. 14.1 по- казывает относительное расположение этих векторов, а также единичного вектора, направление которого совпадает с направлением лучевого вектора S. Этот единичный вектор перпендикулярен к Е и Н и обозначен символом t. Угол между Е и D, равный углу между s и t, . обозначим через а. Мы видим, что векторы /, В D, Has, с одной стороны, и векторы Е, Н н и t — с другой, образуют ортогональные трой- ки векторов с общим вектором Н, повернутые друг относительно друга на угол а. Таким образом, в кристалле, вообще говоря, энергия распространяется, не в направлении нормали к волне. Вместе с тем теорема равенства плот- . ностей электрической и магнитной энергий t=^\. Ч/^ по-прежнему сохраняет свою справедливость. ' s ? Это следует иа уравнения C), так как *) „ ,, , _, J 1 '¦* *• Взаимное расположение 1У == _2_ Е - D = — —— Е* (SxH) волновой нормали, векторов поля и е &п 8я v " ,г. вектора потока анергии в электри- 1 _ „ п , _1 ., ' ' чески анизотропной среде. wBH^sxE)!! Согласно хорошо известным свойствам смешанного произведения правые части обоих уравнений равны между собой. Кроме того, они равны n(E X H)-s/8it, так что для полной энергии w = we + wm имеем » = -2-S.s. F) Необходимо установить различие между фазовой скоростью и скоростью распространения энергии. Направление фазовой скорости совпадает с направ- лением единичного вектора s, а величина ее равна Направление лучевой скорости совпадает с направлением вектора Пойнтинга S, т. е. с направлением единичного вектора t. Величина ее vr численно равна отношению энергии, которая протекает в единицу времени через единичную площадку, перпендикулярную к направлению потока, к энергии единицы объема. Согласно теореме A4.1.9) имеем Из последних трех соотношений находим vp — vrt ¦ s = vr cos a, (9) т. е. фазовая скорость равна проекции лучевой скорости на направление волновой нормали. Следует отметить, что поскольку лучевая скорость определяется через вектор Пойнтинга, для нее также характерна известная доля неопределенности (см. § 1.1). Тем не менее это полезная величина, хотя в отличие от фазовой скорости она не имеет такого явного физического смысла. Если Е и D известны (например, Е задано, а D определяется из уравнений A4.1.1)), то можно определить показатель преломления п и вектор волновой *) Поскольку мы теперь имеем дело с квадратичными функциями, в выражения E) и F) входят вещественные векторы поля, а не соответствующие комплексные векторы (см. стр. 38).
618 КРИСТАЛЛООПТИКА [ГЛ. 14 нормали s. Прежде всего, так как Ej_ — векторная компонента Е в направ- лении D, т. е. то из D) получим Далее, поскольку единичный р,ектор s перпендикулярен к D и компланарен с D и Е, его можно предсгавить в виде (ED)D F ( Р1= D3E-(E По аналогии с показателем преломления п можно также определить луче- вой, или энергетический, показатель /г, посредством формулы «, = ?• A3) Из G) и (9) найдем nr~n cos а. A4) Сейчас мы покажем, что лучевой показатель пг и единичный вектор t, распо- ложенный в направлении распространения энергии, определяются формулами, аналогичными формулам A1) и A2). Используя A1), A4) и соотношение Е- D = ~ ED cosa, получим „_ME-D) п,— gj • A0) Единичный вектор t перпендикулярен к Е и компланарен с Е и D и поэтому должен определяться (с точностью до знака) формулами, которые получаются перестановкой Е и D в A2). Следовательно, _t= ЕЧ)-(Е D)E_ |/~Е2 [E2D*—(E~DL ' ' Отрицательный знак при X слева обеспечивает соответствие между направле- ниями векторов s и t и векторов Е и D, как показано на рис. 14.1. Как A2), так и A6) сводятся к неопределенности при совпадении направ- лений Е и D, т. е. когда вектор Е направлен вдоль одной из главных осей кристалла. Этого следовало ожидать, поскольку в данном случае направления s и t неопределенны и известно лишь, что они должны быть перпендикулярны к Е. Можно также выразить величину вектора Пойнтинга через Е и D. Учи- тывая, что для плоской волбы w = 2we, получим из (8), A3) и A5) 5 = ^ = ^^=—?=?КЁ^7 A7) Как мы видим, для изотропной среды эта фврмула согласуется с уравнениями A.4.8) и A.4.9). 14.2.2. Формулы Френеля для распространения света в кристаллах. Фор- мулы, полученные в п. 14.2.1, являются следствием одних лишь уравнений Максвелла и поэтому не зависят от свойств среды. Объединим их теперь с ма- териальными уравнениями A4.1.1). Выберем в качестве осей координат главные диэлектрические оси. Тогда соотношения A4.1.1) примут более простую форму A4.1.12), и, подставляя D в D), получим E = n*[Ek~sk(E.s)] (*=.*, у, г). A8)
•§ 14.2] монохроматическая плоская волна в анизотропной среде 619 Уравнения A8), которые представляют собой три линейных однородных уравнения для Ех, Е„ и Ег, допускают нетривиальное решение только тог- да, когда соответствующий определитель обращается в нуль. Это означает, что между показателем преломления и, вектором s (sx, sy, sz) и ьтавными диэлектрическими проницаемостями ех, еу и sz должно выполняться опре- деленное соотношение, которое можно получить, записав уравнение A8) в виде Е я'»» (Е-,) A9) умножив его на sft и сложив три 'полученных уравнения. Разделив оконча- тельное выражение на общий множитель (E-s), найдем s* i 4 i 4 = 1 B0) Ф — \1&х ' ГС2 — A6у ' П2 — Ц8г П? ' Это соотношение можно представить в несколько ином виде. Умножим обе части B0) пап2 и вычтем s*-j-sj+sl=l. Затем, умножив получившееся вы- ражение на —я2, найдем 's* | !» | ?? о f9n 1//1г—1/ЦЕ*' 1/Я2— 1/ЦЕу ^ 1/KJ— 1/A8г V ' Определим' три главные скорости распространения с помощью формул *) » в 4 о, = —4=-. B2) У Ц8г Если для фазовой скорости использовать выражение G), то A9) и B1) прини- мают вид 2 ' 2 *2 Н V V V 2 ^ Op—Oj Уравнения B0), B1) и B4) являются эквивалентными формами уравнения, вол- новых нормалей Френеля. Это уравнение квадратично относительно Vp, что легко показать, умножив B4) на произведение знаменателей. Таким образом, каждому направлению s соответствуют две фазовые скорости vp. (Два значения ±vp, соответствующие, любому значению v*, считаются одним, так как отри- цательное значение, очевидно, принадлежит противоположному направлению распространения —s.) Для каждого из двух значений vp из уравнений B3) можно определить отношения Ех : Еу : Ez; соответствующие отношения, со- держащие вектор D, можно затем получить из A4.1.12). Так как эти отноше- ния вещественны, поля Е и D линейно поляризованы. Таким образом, мы полу- чили важный результат, а именно: структура анизотропной среды допускает pat пространение в любом данном направлении двух монохроматических плоских волн, линейно поляризованных в двух разных направлениях и обладающих раз- личными скоростями. Позднее будет показано, ччо два направления вектора электрического смещения D, соответствующие данному направлению распрост- ранения s, перпендикулярны друг к другу. Покажем, что аналогичную формулу можно вывести и для лучевой ско- рости и,. Это легко сделать, показав сначала, что справедливо соотношение, аналогичное D), в котором D и s заменено на Е и t, и наоборот. Удобно ввести *) Отметим, что vx, Vy, ог не являются компонентами вектора и определяются лишь от- носительно главных осей.
620 кристаллооптика [гл, 41 вектор Dx, который определяется как векторная компонента D, перпендику- лярная к t и лежащая в плоскости векторов D и t. Этот вектор, очевидно, равен D± = D — t(D-t). B5) Так как электрический вектор Е тоже перпендикулярен к t и компланарен с D и t (см. рис. 14.1), то Dj_ параллелен Е и, значит, его можно представить в виде , (|)|f B6) где использовано выражение A5). Из последних двух соотношений следует, что E = -Si[D-t(D.t)]=-iiDj.. B7) fir fir Это уравнение аналогично уравнению D) и формально его можно получить при взаимозамене Е и D, я и \lnT, \i и 1'ц и s и — t. Из основных уравнений выте- кает совершенно общее правило взаимного соответствия. Расположим все интересующие нас переменные в два ряда: Е, D, s, t, с, |х, vp, п, гх, гу, в,, vx, vy, vz, П Е t —s ' ' ' X ' ' ' ' - ' Тогда, если в любом соотношении! которое связывает величины, приведенные в одном ряду, заменить все параметры соответствующими параметрами из другого ряда, то полученное соотношение также будет справедливо. Применив это правило к уравнению волновых нормалей Френеля B4), мы немедленно получим искомое лучевое уравнение l/vl- I B9) Конечно, это уравнение можно записать в форме, аналогичной B0) и B1). Уравнение B9), как и B4), квадратично относительно v2r, и для каждого на- правления луча t (tx, t4, t7) дает две возможные лучевые скорости vr. Соответст- вующее направление вектора D можно определить, решая при каждом зна- чении vr уравнение, эквивалентное B3), а именно Du = Л-MD'fi (k=x,y,z). C0) Vk — Vr Затем, используя A4.1.12), можно найти направления обоих векторов Е (ко- торые, как мы видели, перпендикулярны к t). Как правило, задается лишь один из векторов s или t; поэтому желательно вывести соотношения, с помощью которых можно было бы прямо найти не- известный вектор. Из рис. 14.1 имеем E-s = ?xtga, D-t = — Dsina. C1) Но, согласно D), D = n2EJ\i. Следовательно, используя G) и (9), находим D't = -^?±sina = -J E-scosa = -i-I^-E-s. C2) Подстановка C2) в C0) дает i^fcf) <> Сравнивая C3) с B3) и учитывая, что |xesy| — с2, получим V* ._ "^ C4> Vk~Vp v'k—v'r
§ 14.2] МОНОХРОМАТИЧЕСКАЯ ПЛОСКАЯ ВОЛНА В АНИЗОТРОПНОЙ СРЕДЕ 621 Решая относительно th, найдем vA—vpsk = vpsk ";_^ . C6) Возводя в квадрат и складывая три уравнения C6), а затем используя соот- ношение (9), т.е. S't = vplvr, получим Следовательно, мы можем написать ' C8) ( s* у , Это соотношение выражает vT через s, так как зависимость vp от s уже известна из уравнения Френеля B4). Определив таким образом vr, получим из уравнения C5) единичный вектор t как функцию s. Используя выражение для g, можно представить уравнение C5) в виде /A=Wy? + ^V) (k = x, у, г). C9) VpVr \ VP — Vk I Так как каждому вектору s в общем случае соответствуют две фазовые скорости vp, то для каждого направления волновой нормали имеется два на- правления луча *). Однако в некоторых кристаллах (двухосные кристаллы, см. п. 14.3.1) существуют два особых направления, которым вследствие исчез- новения знаменателей в C9) соответствует бесконечное число лучей. Существуют также два особых направления луча, каждому из которых соответствует бес- конечное число направлений волновых нормалей. Эти специальные случаи обусловливают интересное явление (коническая рефракция), которое будет рассмотрено в п. 14.3.4. J4.2.3. Геомегрические построения для определения скоростей распростра- нения и направлений колебаний. Многие результаты, относящиеся к фазовой и лучевой скоростям н к направлениям колебаний, можно проиллюстрировать с помощью некоторых геометрических построений. а. Эллипсоид волновых нормалей. Согласно уравнениям A4.1.13) компо- ненты вектора D при заданной плотности энергии w = 2we удовлетворяют со- отношению ^+-?- + ~- = С (C = 8n» = E-D). D0) ех 8у 8г . Заменим DjVc, DjVC и ?>г|/"С на х, у и г и будем рассматривать послед- ние как декартовы координаты в пространстве. Тогда Это уравнение, описывает эллипсоид, полуоси которого равны квадратному корню из главных диэлектрических проницаемостей и совпадают по направ- лению с главными диэлектрическими осями. Мы назовем такой эллипсоид эллипсоидом волновых нормалей, употребив это название вместо широко ис- пользуемого, но довольно неопределенного термина «оптическая индикатриса» (он известен также как эллипсоид индексов). •) Положение лучей, которые соответствуют данной нормали, подробно рассматривается для случая двухосных кристаллов в кйиге М, Берна [3]*
622 КРИСТАЛЛООПТИКА [гл. 14 Если vp и оба волновой воспользоваться эллипсоидом нормалей, то обе фазовые скорости направления колебаний D, соответствующие данному направлению нормали s, можно найти следующим образом. Через начало коорди- 5 нат проведем плоскость, перпендикулярную к S. Сечение эллипсоида нормалей такой плоскостью представляет собой эллипс,, направление главных осей которого указывает на- правление колебаний вектора D, а длины полуосей обрат- но пропорциональны соответствующим фазовым скоростям vp (рис. 14.2). Для получения этого результата рассмотрим два урав- нения, которые определяют наш эллипс: ,0, D2) 1. D3> Так как по определению главные оси эллипса служат его Рис 14 2 Эллип- наименьшим и наибольшим диаметрами, мы можем опре- сонд волновых пор- J/остр ос Ш'с и а правле- нии колеблии ! век- тороп I) ггриилдлежн- щи,\ волновой норма- делить их, находя экстремумы величины ra = x2 + j/2 + z3 D4) с дополнительными условиями D2) и D3). Это мы сделаем методом неопределенных множителей Лагранжа *). Введем два множителя 2Ki и к2 и сконструируем функцию D5) Тогда наша задача сводится к определению экстремума функции F без допол- нительных условий. Необходимое условие экстремума функции F состоит в равенстве нулю ее производных по х, у и г, т. е. x-\-X1sx-\- — = 0, у-\-\ву-\-~~0, a-f-^Sj-i—— = 0. D6) Умножая эти уравнения соответственно на х, у и г и складывая, получим, учи- тывая D2) и "D j), г2 + Х2 = 0. D1) Теперь, умножая уравнения D6) на s.x, stt и, sz и складывая, найдем, снова учитывая D2), /xsx usv zs.\ Подстановка в D6) Xi и к^ из D7) и D8) дает D9) -Ч-Л--Т- =0 и еще два аналогичных уравнения. Для заданного s это три однородных урав- нения относительно х, у и г. Они совместны только тогда, когда соответствую- щий детерминант обращается в нуль, что дает алгебраическое уравнение для г2. Легко, однако, заметить, что уравнения D9) отличаются от уравнений A8) лишь обозначениями. Если мы заменим х на Dj\^C, х1гх на EX\YC и г2 на DVC= DV(E-D) = пЧ\х (в согласии с A1)), то D9) примет вид цО, = п=[?х —Sje(E.s)], E0) что вместе с двумя аналогичными уравнениями идентично A8), *) Полное описание ЭЮ1 о метода см., например, в 14],
§ 14.2] МОНОХРОМАТИЧЕСКАЯ ПЛОСКАЯ ВОЛНА В АНИЗОТРОПНОЙ СРЕДЕ 623 Таким образом, мы иашли, что корни определительного уравнения для n = c/vp (оно, как мы видели, квадратично) пропорциональны длинам г полу- осей эллиптического сечения, перпендикулярного к s. Кроме того, два воз- можных направления вектора D совпадают с нап- равлениями этих осей. Так как оси эллипса взаимно ' перпендикулярны, то мы получили следующий важ- ный результат' направления колебаний двух векто- ров D, соответствующих заданному направлению ра- спространения s, взаимно перпендикулярны Обозна- чим два направления D, которые соот ветствуют данному направлению волновой нормали s, через D' и D"; таким образом, s, D' и D" образуют ортогональ- ную тройку векторов. В специальном случае совпадения направления распространения с одной из главных осей эллипсоида нормалей, например, с осью х, экстремумы г равны, согласно нашему_построеншо, длинам двух других полуосей, т. е. ]/"еу и Увг. Но мы показали, что эк- стремумы г равны также п\\ \\, — c/vpya. Следователь- но, фазовые скорости волн, которые распространяют' ся в направлении оси х, равны cjV\ie.y и с/|/Aбг, т. е. главным скоростям распространения ~о„ и г>7, вве- денным формально с помощью соотношений B2). Конечно, соответствую- щие результаты имеют место и для распространения в направлении двух других осей. Существует и иной способ построения, с помощью которого можно опре- делить направления колебаний. Известно, что у эллипсоида существуют два круговых сечения С, и С2, проходящих через центр, и что нормали к ним Nt и N2 компланар- ны с наибольшей и наименьшей главными ося- ми (г и х) эллипсоида. Направления Ni и N, называются оптическими осями *) и будут рас- смотрены подробно в п. 14.3.3. Так как С, и Сг — круговые сечения (и имеют одинаковые радиу- сы), то в направлениях Nb N.. существует един- ственная скорость распространения; при этом D может иметь любое направление, перненди Рис. 14.3 Построение для определения плоскостей колебании (s, D') и (s, D"). Рис. 14.4. Плоскость Е, пока- занная на рис. 14.3. кулярное к s. Пусть Е — эллиптическое центральное сечение, перпендику- лярное к произвольному единичному вектору нормали s. Плоскость этого се- чения пересекает круги CL и Са вдоль двух радиальных векторов гь г2, которые равны по величине и поэтому должны образовывать равные углы с главными осями сечения Е (см. рис. 14.3 и 14.4). Таким образом, искомые направления ко- лебаний являются биссектрисами углов между rt и г2. Но гг перпендикулярен к Nj и s и поэтому перпендикулярен к плоскости, содержащей Ni и s; анало- гично г2 перпендикулярен к плоскости, содержащей N3 и s. Если эти плоскости пересекают плоскость эллипса Е вдоль векторов ri, r^, то главные осп эллипса также должны служить биссектрисами углов между г{ и г^. Следовательно, плоскости колебаний вектора электрического смещения, т. е плоскости, со- держащие s и D' или D", делят пополам внутренний или внешний угол менаду плоскостями (Nb s) и (N2, s) **). Это построение становится неопределенным, если направление s совпадает с направлением Nx или N2. ') Точнее, оптическими осями волновых нормалей. Соответствующие сечеиия лучевого эллипсоида (см. ниже) определяют оптические лучевые оси **) В настоящей главе символ (а, Ь) означает плоскость, содержащую векторы а и Ь.
€24 кристаллооптика [гл. 14 Ловерхность нормалей б. Лучевой эллипсоид. Лучи можно рассматривать таким же образом, как и волновые нормали, если в соответствии с правилом B8) исходить из лучевого эллипсоида В частности, центральное сечение этого эллипсоида, перпендикулярное к на- правлению луча t, является эллипсом, направления главных осей которого указывают два допустимых направления электрического вектора (Е' и Е"), а длины полуосей пропорциональны двум соответствующим лучевым скоро- стям vr. Таким образом, t, E' и Е" образуют ортогональную тройку векторов. в. Поверхность нормалей и лучевая поверхность. Представим себе, что из некоторой точки О внутри кристалла, как из начала координат, в направлении s откладываются два вектора, длины которых про- порциональны двум соответствующим значениям фа- зовой скорости. Поскольку вектор s принимает все возможные направления, концы наших векторов опи- шут поверхность, состоящую из двух оболочек, на- зываемую поверхностью волновых нормалей или, ко- роче, поверхностью нормалей. Аналогично концы векторов, отложенных из фик- сированного начала координат во всех направлениях t й имеющих длины, пропорциональные соответст- вующим лучевым скоростям, опишут дв\хоболочеч- ную поверхность, называемую лучевой поверхностью Эти две поверхности сложнее рассмотренных нами выше поверхностей эллипсоидов Лучевая поверх- ность— это поверхность четвертого порядка, поверх- ность нормалей — поверхность шестого порядка *), в чем можно убедиться, обратившись к формулам B4) и B9). Между этими двумя поверхностями су- ществует важное соотношение, которое мы сейчас и ПОЛ)ЧИМ Мы показали, что если Е и D известны, то можно определить как направ- ления s и t, так и соответствующие скорости vp и vr, а следовательно, и соот- ветствующие точки (Р и Р' па рис 14.5) на обеих описанных выше поверх- ностях. Пусть г и г' — векторы, представляющие эти точки, т. е. г — п t г' — я « 1491 Покажем, что приращение вектора г при небольшом изменении Е или D пер- пендикулярно к г'. Начнем с уравнения B7) )]. E3) E4) Рис. 14 5. Соотношение между поверхностью нор- малей и л>чевои поверх- 1ШСГЫ0 Подставляя t из первого уравнения E2) и полагая пТ = c!vr, получим Предположим, что Е изменяется на небольшую величину 6Е. Если 6D и 6г—- соответствующие изменения D и г, то в соответствии с E4) найдем — — Sr(D-r)—rFr-D)—r(r-6D). E5) *) Нельзя ожидать, чтобы поверхность нормалей и лучевая поверхность описывались уравнениями одинаковой степени, так как они не являются взаимно соответствующими друг другу Для построения поверхности, соответствующей поверхности ьормалеи," необходимо, согласно правилу B8), откладывать векторы длиной Uvr (а не vr).
§ 14.3J ОПТИЧЕСКИЕ СВОЙСТВА ОДНООСНЫХ И -ДВУХОСНЫХ КРИСТАЛЛОВ 625 Если обе части этого равенства скалярно умножить на D и воспользоваться соотношением D ¦ 8Е = ехЕх&Ех + еуЕуЬЕу + t.zEJbEt = Е • 6D, E6) то мы получим ^•E-6D = 6D.[r2D — r<D-r)],+ 25r.[rD2—D(D-r)]. E7) Члены, содержащие множитель SD, сокращаются согласно E4), а член с fir можно переписать в виде 26r-l(Dxr)X DJ. Следовательно, учитывая, Ч1Х> T — vr\, имеем 5r-[(Dxt)xD]=0. E8) Вектор Dxt перпендикулярен и к D, и к t, поэтому (Dxt)X D лежит в плоскости векторов D и t и перпендикулярен к D. Таким образом, вектор (Dxt)X D параллелен s (см. § 14.1) и, следовательно, s-6r = Q, E9) т. е. бг перпендикулярен к s, что и доказывает наше утверждение. Отсюда следует, что плоскость, касательная к лучевой поверхности, всегда перпендику- лярна соответствующей волновой нормали. Рис. 14.5 иллюстрирует это соот- ношение на плоском сечении. Так как кратчайшее расстояние от начала ко- ординат до этой плоскости равно, согласно (9), vrt-s — frcosa — vp, то, сле- довательно, поверхность нормалей представляет собой геометрическое место (хнований перпендикуляров, опущенных из начала координат на плоскости, касательные к лучевой поверхности, и, обратно, лучевая поверхность является огибающей плоскостей, проведенных через точки поверхности нормалей перпен- дикулярно радиусам-векторам этих точек. Если нам известна форма одной из этих поверхностей, указанное соотношение позволит определить форму другой. Полученный результат можно интерпретировать с физической точки зре- ния. Рассмотрим не одну волну, а группу плоских волн одинаковой частоты, имеющих слегка различные направления распространения. Волновые нормали s составляющих волн заполняют телесный угол вокруг «средней волновой нормали» s0. Предположим, что заметную величину имеют амплитуды лишь тех волн, нормали которых близки к s0. Допустим, что в момент времени t О фазы всех волн в точке О одинаковы; тогда возмущение в ней максимально. Исследуем теперь распространение этого максимума. Рассмотрим все волновые фронты, которые проходят через точку О в мо- мент I = 0. Через единицу времени волновой фронт W, распространяющийся со скоростью v в направлении s, достигнет такого положения W, что основа- ние перпендикуляра, опущенного на него из точки О, совпадет с концом век- тора vp&. Таким образом, W — это плоскость, перпендикулярная к соответст- вующему радиусу-вектору поверхности нормалей. Амллитуда группы волн будет наибольшей в той области, где волны усиливают друг друга, т. е. гам, где эта плоскость пересекает плоскости с близкими волновыми нормалями Но такая область должна находиться как раз вблизи огибающей этих плоскостей, т. е. около соответствующей точки v,.t на лучевой поверхности. Приведенные выше соображения подтверждают, что энергия, переносимая группой, рас- пространяется со скоростью vr в направлении единичного вектора t. § 14.3. Оптические свойства одноосных и двухосных кристаллов 14.3.1. Оптическая классификация кристаллов. Прозрачные кристаллы делятся по своим оптическим свойствам на три различные группы. Группа I. Кристаллы, в которых можно выбрать три кристаллогра- фически эквивалентных взаимно ортогональных направления. Это кристаллы так называемой кубической системы. Очевидно, что эквивалентные направления ДО М Rnnu Я Rnn^A
626 КРИСТАЛЛООПТИКА [гл. 14 совпадают с главными диэлектрическими осями, поэтому ех = вч — гг = е. Тогда D = gE, а кристалл оптически изотропен неэквивалентен аморфному телу. Группа II. Кристаллы, не принадлежащие к группе I, в которых можно выбрать два или более кристаллографически эквивалентных направления, ле- жащих в одной плоскости. Это кристаллы трпгональной, тетрагональной и гексагональной систем, причем плоскость, в которой лежат эквивалентные направления, перпендикулярна к осям симметрии третьего, четвертого или шестого порядков. Одна из главных диэлектрических осей должна совпадать с этим выделенным направлением, тогда как для двух других направлений можно выбрать любую взаимно ортогональную пару перпендикулярных к нему прямых. Если выделенное направление принять за ось г, то ех = е[1фгг. Такие кристаллы называют оптически одноосными. Группа III. Кристаллы, в которых невозможно выбрать два кристаг- лографически эквивалентных направления. Такие кристаллы принадлежат к так называемым ромбической, моноклинной и триклинной системам. Здесь ?хф?чф?г, а направления диэлектрических осей могут определяться (но могут и не определяться) симметрией (см табл. 14.1) и поэтому могут зависеть от длины волны. Кристаллы этой группы называют оптически двух- осными. Таблица 14.} Кристаллическая система Триклинная Моноклинная Ромбическая Тригональная Terpdi опальная Гексаюнальная Кубическая Диэлектрические оси ССС t. CCF | '"Л «.© Эллипсоид волновых нормалей Произвольный эл- липсоид То же Сфероид Сфера Оптическая класси- фнкация кристалла Двухосный » Одноосный Изотропный В том, что все кристаллы делятся по своим оптическим свойствам на эти три типа, легко убедиться, рассматривая один из соогветствующих эллипсои- дов, например эллипсоид волновых нормалей. Очевидно, такой эллипсоид не должен изменяться при операциях симметрии, не меняющих структуру кри-
§ 14.3] ОПТИЧЕСКИЕ СВОЙСТВА ОДНООСНЫХ Н ДВУХОСНЫХ КРИСТАЛЛОВ 627 сталла *). Возможны лишь три случая: эллипсоид может иметь либо (а) все оси разной длины, либо (б) две равные оси и одну не равную им (сфероид, т. е. эллипсоид вращения), либо (в) все оси равной длины (сфера). Эти гри возмож- ности соответствуют трем группам (в порядке III, II и I), которые мы только что рассмотрели. Термины «одноосный» и «двухосный» относятся к числу опти- ческих осей эллипсоида, i. e. к числу диаметров эллипсоида, перпендикуляр- ных к его круговому центральному сечению. В общем случае эллипсоид имеет два таких диаметра (двухосные кристаллы), сфероид — один (одноосные кри- сталлы), а сфера — бесконечное число (изотропные кристаллы). В табл. 14.1 приведены все возможные случаи. Главные диэлектрические оси, положение которых может зависеть от длины волны (С), показаны двумя тонкими линиями под небольшим углом друг к другу (что указывает на их положение для двух длин волн), фиксированные оси (F) изображены жирными линиями, а оси с произвольным направлением (R) показаны в виде пунктирных линий, заканчивающихся на круге или сфере. 14.3.2. Распространение света в одноосных кристаллах. Начнем с уравне- ния волновых нормалей Френеля A4.2.24) и запишем его в виде sl(vl-vl)(vl-vl) + Sl(vl-vl)(^-vl)-i-Sl(v^-vl)[vl-vl) = O. A) Для оптически одноосных кристаллов с оптической осью вдоль направления z имеем vx = vy. Обозначив через vo эту общую скорость и через ve скорость г)г, получим из A) **) ll) [(lS)(*i) f ($—1#] = 0. B) Пусть d — угол, образуемый нормалью s с осью г; тогда sj-fs| = sin-О, s^ = cos2d, и B) переходит в (vl - vl) [(v%—vl) sin3 ft + (vl—o») cos2d] = 0. C) Двумя корнями этого уравнения (скажем, v'p и t$ служат (VpY^vl (i>;K = y|cos2ft + i;*sm2ft. D) Уравнения D) показывают, что двумя оболочками поверхности нормалей слу- жат сфера радиуса v'p = vo и овалоид — поверхность вращения четвертого порядка. Таким образом, одной из двух волн, соответствующих любому дан- ному направлению волновой нормали, является обыкновенная волна, скорость которой не зависит от направления распространения. Другая—необыкно- венная волна, скорость которой зависит от угла между направлением волновой нормали и оптической осью. Обе скорости равны лишь при 0 = 0, т. е. когда волновая нормаль направлена вдоль оптической оси. Когда vo>ve (рис. 14.6, а), обыкновенная волна распространяется быст- рее, чем необыкновенная (исключая направление 0 = 0, когда их скорости равны). Такой кристалл называют положительным одноосным кристаллом (например, кварц). Еслиоо<г)в (рис. 14,0, б), обыкновенная полна распрост- раняется медленнее, чем необыкновенная, и мы называем такой кристалл от- рицательным одноосным кристаллом (например, исландский шпат), *) Например, кристаллы моноклинной системы характеризуются либо осью второго порядка, параллельной одной из кристаллографических осей, либо зеркальной пло- скостью, перпендик>лярной ей, либо и тем, и другим. Ясно, что во всех случаях одна из осей этого эллипсоида должна быть параллельна такой кристаллографической оси, которая обеспечи- вает его сохранение при операциях, не меняющих симметрию кристаллической структуры. Подробное описание кристаллических классов я операций симметрии приводится в книге [5]. **) Здесь индексы оке означают «обыкновенный» в «необыкновенный», что станет понятным в дальнепшем.
628 КРИСТАЛЛООПТИКА [гл. 14 Направления колебаний нетрудно найти обычным способом с помощью эллипсоида волновых нормалей, у которого в данном случае две равные глав- ные оси. Плоскость, в которой лежит волновая нормаль s и оптическая ось Ог, называется главной плоскостью (на рис. 14.7 она заштрихована). Эллипсоид Рис. 14.6. Поверхности нормалей положительного (а) и отрицательного (б) одноосного кристалла. симметричен относительно этой плоскости. Отсюда вытекает, что эллиптиче- ское сечение плоскостью, проходящей через О и перпендикулярной к s, сим- метрично относительно главной плоскости и, следовательно, одна из главных осей эллипса перпендикулярна, а другая параллельна главной плоскости (см. рис. 14.7). Длина полуоси, перпендикулярной к главной плоскости, равна радиусу экваториального круга сфероида, т. е. обратно пропорциональна скорости va обыкновенной волны. Мы видим, что вектор D обыкновенной волны (D' на рис. 14.7) колеблется перпендикулярно к главной плоскости, а вектор необыкновенной волны (D") — в главной плоскости. Оптические явления в одноосных кристаллах сыграли значительную роль в истории оптики в связи с вопросом о том, перпендикулярно ли колебание «светового вектора» к плоскости поляризации или параллельно ей. Плоскость поляризации определялась как плоскость падения света, па- дающего под таким углом, что любая падающая волна превращается при отражении от плоской границы воз- дух— диэлектрик в линейно поляризованную, т. е. на язы- ке электромагнитной теории как плоскость (Н, s) (см. стр. 47 и 59). Сегодня не имеет смысла подробно обсуждать этот вопрос *), так как мы знаем, что нетодного-единственного физического понятия, которое можно было бы считать «све- товым вектором». 14.3.3. Распространение света в двухосных кристал- лах. Теперь исследуем главные следствия основного урав- нения A) для общего случая двухосного кристалла. Оно поможет нам наг- лядно представить поверхность нормалей, если вначале мы рассмотрим се- чения этой поверхности тремя координатными плоскостями х = 0, у = 0 и г = 0 нашей исходной системы (главные диэлектрические оси). Для опреде- ленности будем считать, что 8*<8/<е* (vx > "у > °г)' E) Рис. 14.7. Направ- ления колебаний в одноосном кри- сталле. *) Описание истории вопроса см. в книге [6],
§ U.3] ОПТИЧЕСКИЕ СВОЙСТВА ОДНООСНЫХ И ДВУХОСНЫХ КРИСТАЛЛОВ 629 Если в уравнении A) положить sx = 0, то оно распадется на два, а именно Положим t^j, = y, VpSx = г. тогда v% = г/2 + г2, и уравнения- F) примут вил s/2 + z3=t'|, ((/8 + 2аJ = ^2 + ф».; Fа) Таким образом, в сечении поверхности нормалей координатной плоскостью х — 0 получаются окружность и овал. В сечении каждой из оставшихся двух координатных плоскостей также получаются окруж- ность и овал, причем единственное различие зак- лючается в относительном расположении этих двух Рис. 14.8. Сечения поверхности нормалей двухосного кристалла. Рис. 14,9. Поверхность нор- малей двухосного кристалла. кривых. При выборе осей, заданном E), вся окружность расположена вне овала в плоскости уг и внутри него в плоскости ху. В плоскости гх окружность и овал пересекаются в четырех точках (рис. 14.8). На рис. 14.9 в перспективе показана часть поверхности нормалей, стягиваемая кривыми A'B'C'N и A"B"C"N. В общем случае две поверхности пересекаются по кривой, но н на- шем случае они имеют лишь четыре общие точки: точку Лг и соответствующие точки в других квадрантах. Две линии, соединяющие начало координат с каж- дой из этих точек, являются двумя оптическими осями волновых нормалей. Ия геометрической теоремы о числе центральных кр\говых сечений эллипсои- да, упомянутой на стр. 623, следует, что не существ) ет других таких точек и, значит, других оптических осей волновых нормалей Мы подтвердим это пря- мым расчетом и одновременно выведем неравенство, которое понадобится нам в дальнейшем. Пусть vl = v* + qx, vl = vl—qz, i? = i>J + <7, G) где qx и qz положительны (см.'E)). При такой замене уравнение A) примет вид slq(q + qz) + sl{q + qz)(q~qx)-tsl(q—qi()q = Q (8a) или <7S+ №* + *№, —qx) — slqx] q — s*qxqz = O. (86) Так. как постоянный член —^хЯг не может быть положительным, корни этого уравнения должны быть вещественными. Если мы обозначим их через ц' н с/", то найдем Следовательно, q' и q" должны иметь разные знаки. Пусть q'^0, a q Если q>qx или q<—qz, то все члены слева в уравнении (8а) положи- тельны. Следовательно, значения q должны лежать в интервале —qz^q^qx и, таким образом, <"<О<'< (9) Два корня q' и q" могут быть равными, только если, оба они равны нулю. Тогда,
630 кристаллооптика [гл. 14 согласно (86), мы должны иметь одновременно s' = 0. s*a = s\gx. A0) Таким образом, мы получили два направления s, для каждого из которых со- ответствующие две скорости равны, что подтверждает существование двух оптических осей волновых нормалей. Как уже было отмечено ранее, эти оси лежат в плоскости хг. Если \i — угол, который образует одна из осей с направ- лением г, то sx — sin P и sz — cos|5, где, согласно A0), Таким образом, оптические оси расположены симметрично относительно оси г. Неравенства (9) можно записать через скорости, т. е. «*<(»;)•< «К ((>;)•< в*. A2) Это соотношение понадобится нам в дальнейшем. Мы видим, что обе фазовые скорости вещественны для любого направления волновой нормали. Такое же заключение вытекает, разумеется, из геометрического построения для фазовых скоростей с привлечением эллипсоида волновых нормалей. Выражение для двух фазовых скоростей, соответствующих заданному направлению волновой нормали s, принимает очень простую форму, если s определить через углы тЭ^ и <&г, которые эта нормаль образует с двумя оптиче- скими осями волновых нормалей. Поскольку направляющие косинусы опти- ческих осей равны ±smp\ 0, соьр\ углы 1д1 и д2 определяются соотношениями cosd1=-sxsinP + S2COsP, cos d2 = — sx sin § + $г cos 0, ¦' A3) Корни уравнения (86), выраженные через sx и sz, имеют вид iV"? (Н) где, если воспользоваться тождеством s| + s|+sf = 1, P = slqx—stqz + q:s—qx, A5) Д = />а +- bs$qxqz = (qx + qzf -2 (q-x 4- qz)(s$qx + slqz) + (&%qz — s*qx)K A6) Но из A3) и A1) имеем 6bbq*s*~-4'i*2 = 2'7xSlt'7?S'« A7) Ях~тЯг Следовательно, выразив A5) и A6) через Ъг и д2, получим Р = Ъ — Ях — {qz + qx)cos\cosQt, A5а) Д= [(<?, + <?.,) sin d, sin d,]а. A6а) Подставляя A5а) и A6а) в A4) и заменяя q, qx и qz их значениями из выраже- ний G), окончательно находим ^ = -jK + fI + (oi—fDcost^i^)]. A8) Хотя в последнее уравнение и не входит vv, оно неявно содержится в й, и де, так как эти углы зависят от угла E, являющегося функцией всех трех главных скоростей. В частном случае одноосного кристалла дх и <&г равны. Легко показать, что тогда уравнение A8) точно переходит в D). Подобный анализ применим и к лучам. Начав с лучевого уравнения A4.2.29), мы найдем, что в сечении лучевой поверхности координатной плос- костью х = 0 получаются две кривые (v'ry^vi '=4+4- A9> (ад vi Чу
§ 14.3] ОПТИЧЕСКИЕ СВОЙСТВА ОДНООСНЫХ И ДВУХОСНЫХ КРИСТАЛЛОВ 631 Если положить vrty = г/, vrtz = z, то v*r = y2 + z2, и A9) примет вид ^ + г»=»5, 4 + 4-= 1, A9а) т. е. сечение лучевой поверхности плоскостью х = О дает окружность и эллипс (а не овал— кривую более общего типа, как в случае Fа)). Каждое из се- чений двумя другими координатными плоскостями также представляет собой окружность и эллипс. В соответствии с неравенством E) в плоскости yz эллипс находится внутри окружности, тогда как в плоскости ху он охватываег окруж- ность. В плоскости хг окружность и эллипс пересекаются в четырех точках. Эти точки указывают положение лучевых оптических осей R,, R2; их направ- ления определяются соотношениями, соответствующими соотношениям A0), а именно /г=о,- ti(±—L)=ti(±—±). B0) \ VU VZ I \Vjt Vy J Угол 7 между каждой из этих осей и о.сью х поэтому определяется выражением Если v,<vx, лучевая оптическая ось образует меньший угол с осью г, чем ось нормалей. 14.3.4. Преломление в кристаллах, а. Двойное лучепреломление. Рассмот- рим плоскую волну, падающую из вакуума на плоскую поверхность 2 анизо- тропной среды. Эта волна создаст прошедшее и отраженное поля. Мы кратко рассмотрим характер прошедшего ноля, используя по существу те же рассуж- дения, что и в случае изотропных тел (см, п. 1.5.1). Ограничимся определением направления распространения возмущения внутри кристалла и не будем ис- следовать выражений для отношений амплитуд, соответствующих формулам Френеля *). Пусть s и s' — единичные векторы волновой нормали падающей и про- шедшей волн соответственно. Вскоре мы увидим, что в общем случае имеются две проходящие волны, так что имеются два возможных значения s'. Вектор- ные поля падающей и прошедшей волн являются функциями величии (t—r-s/c) и(t—т-s'/v') соответственно. Из условия непрерывности поля на границе раз- дела вытекает, что для любой точки г на плоскости 2 и для всех моментов вре- мени t справедливо соотношение т. е-. ?—г)=°- B2) Следовательно, вектор s'/v' — s/c должен быть перпендикулярен к границе раздела. Допустимые направления волновых нормалей s' можно определить следующим образом. Из произвольной точки О на плоскости 2, как из начала координат, во всех направлениях s' отложим векторы длиной 1/t/, где v' —¦ фазовая скорость, соответствующая каждому направлению s' согласно урав- нению Френеля A4.2.24). Концы векторов образуют двухоболочечную поверх- ность, которая отличается от поверхности нормалей тем, что длина каждого радиуса-вектора составляет 1/V вместо v'. Эта поверхность называется об- ратной поверхностью волновых нормалей. Она соответствует лучевой поверх- ности и поэтому, как и лучевая поверхность, представляет собой поверхность четвертого порядка. Поскольку искомый вектор s'/v' должен быть таким, чтобы *) Они обсуждаются, например, в [7].
632 КРИСТАЛЛООПТИКА [Г Л 14- вектор s'/V — s/e был перпендикулярен к 2, его конец Q' должен лежать на нормали к 2, проведенной через конец Р век гора s/c. В общем случае нормаль к 2 пересекает обратную поверхность в четырех точках, две из которых распо- ложены с той же стороны поверхности раздела, что и кристалл. Следовательно, мы нашли две нужные точки (Q' и Q" на рис. 14.10), т. е. два возможных на- правления волновой нормали. Таким об- разом, в общем случае каждая падающая волна вызывает две преломленные во ты. Каждой преломленной волне соответст- вует направление луча и лучевая ско- рость, описывающие распространение энергии в кристалле *). Это явление носит название двойного лучепреломления. В качестве иллюстрации напомним хо- рошо известный эффект появления двух изображений при рассматривании неболь- Рис. 14.10 К определению допустимых объекта через пластинку исланд- направлемии волновых нормалей при двои- ... ном лучепреломлении. ского шпата. Считая граничную плоскость 2 пло- скостью г = 0, перепишем B2) в виде равенств xs'x+ys'y _ ^ которые должны удовлетворяться при всех значениях х и у. Отсюда следует, во-первых, vtos'Jsx — s'yisy и s'Jsx = s'ylsy, т. е. оба преломленных луча лежат в- плоскости падения. Кроме того, если 6,, 0'^ и Q"t — углы, которые падающая и две прошедшие волны образуют с осью, то из B3) получим sin Of _ с sinO; с .„., sinej ~~or' sine? ~~~if' ( f Таким образом, каждая из прошедших в кристалл волн подчиняется такому же замну преломления, как и в случае изотропных сред. Однако скорость v здесь зависит от 0f, гак что определение направления распространения в кристалле становится более сложным В одноосном кристалле одна из оболочек обратной поверхности волновых нормалей является сферической и, значит, фазовая скорость одной из проходящих волн ие зависит от Qt. Это и есть обыкновенная волна. Для специального случая нормального падения @, — 0) имеем 0,' = 6J = О и, следовательно, обе волновые нормали в крисгалле совпадают и направлены перпендикулярно к 2. Другой специальный случай, представляющий боль- шой теоретический интерес,— распространение волны в направлении одной из. оптических осей двухосного кристалла. Возникающее при этом явление из- вестно как коническая рефракция. Оно и рассматривается ниже. б. Коническая рефракция. Выше мы отмечали, что когда в двухосном крис- талле s совпадает с одной из оптических осей волновых нормалей, соотноше- ние между s и t имеет особенность. Прежде чем обсуждать явления преломле- ния при распространении волн в данном, специальном, направлении, необхо- димо исследовать природу этой особенности. *) Возникновение двойного лучепреломления можно также пояснить, обобщая построе- ние Гюйгенса (см п 3 3.3) на анизотропные среды. Однако точное рассмотрение такого под- хода отнюдь не так просто, как это обычно излагается в учебниках При построении Гюйгенса оперируют с э!ементарными волнами, расходящимися из точечных источников, а не с незави- симыми плоскими волнами, законы распространения которых, как правило, принимаются без доказательства. Некоторые трудности, присущие таиому подходу, обсуждались в работах
§ 14.3] ОПТИЧЕСКИЕ СВОЙСТВА ОДНООСНЫХ И ДВУХОСНЫХ КРИСТАЛЛОВ 633 В п. 14.2.3 мы показали, что векторы электрического смещения D, соот- ветствующие направлению волновой нормали s, параллельны главным о-'ям перпендикулярного ь s эллиптического сечения эллипсоида волновых норма- лей В специальном случае совпадения направления вектора s с направлением оптической оси волновых нормалей, это сечение становится круговым, так что допустимо любое направление D, перпендикулярное к s. Следовательно, в дан- ном случае возможно бесконечное число направлений электрического вектора Е tKOTOpbie находят для каждого D из A4.1.1)) и лучевых векторов t (опреде- ляемых согласно рис. 14.1). Покажем, что все эти векторы t лежат па кониче- ской поверхности. Пусть s' (s'x, О, s'z) — единичный вектор, направленный вдоль одной из. оптических осей волновых норма тей. причем главные диэлектрические оси выбраны в соответствии с неравенством E). Тогда ь'х и s^ связаны соотношением A1), и допустимые векторы D, будучи перпенди- кулярны к s', удовлетворяют соотношению V A^ Переходя к компонентам соответствующих векторов Е, его можно переписать в виде s'ja Е -4-s'e Е =0 B5) Пусть на рис. 14.11 П—¦ любая илос- Рис. 14.11. К определению положения кость, перпендикулярная к s', и пусть пря- л>"теи- соответствующих оптическом мая, на которой лежит вектор Е, Пересе- оси волновы\р^ш". " двухоснО№ кает ее в точке Р. Так как, согласно B5), все векторы Е должны лежать на плоскости А, перпендикулярной к век- тору с компонентами (ь'хКх, 0, ъ'2гг), то все возможные точки Р должны ле- жать па прямой АВ, по которой пересекаются плоскости П и Л. Пусть луче- вой вектор t компланарен с Е и s' и перпендикулярен к Е. Пусть векторы t и s' пересекают плоскость II соответственно в точках Т и S. Тогда из подобия треугольников находим TS-SP = OSa = const. B6)- Так как геометрическое место точек Р — прямая линия АВ, то геометрическим местом точек Т является кривая, обратная А В, т. е. окружность *), прохо- дяшая через центр инверсии S, с касательной в точке S, параллельной АВ. Следовательно, оптической оси волновых нормалей соответствует бесконечное- число лучей, которые образуют коническую поверхность. Этот конус не круговой, так как центр кр^га не совпадает с основанием перпендикуляра из точки О на плоскость П. Если векторы Е, s' н t лежат в плоскости хг, то направление t должно совпадать с направлением вектора (s[eK, 0, sjez), к которому Е всегда перпен- дикулярен Если оно образует угол <р с осью г, то угол раствора конуса % в этой, плоскости определяется выражением B7> где использовано соотношение A1). Обычно (vl—pj})/pJ<^1 и (t$—vi)lvl<^:\r так что получающийся конус очень мало отличается от кругового с углом %- •) См., например, [10].
€34 КРИСТАЛЛООПТИКА [гл. 14 О ц Рис. 14.12. Коническая ре- Точно так же можно показать, что лучевой оптической оси соответствует бесконечное число волновых нормалей, которые образуют коническую поверхность. Угол раствора этого конуса \|> определяется соотношением, соответсгвующим B7), т. е. , а tg i|) = —— v(vl—vl) {v\—v%) -=-- -^- tgx- B8) Полученные результаты удобно пояснить, при- бегая к поверхности нормалей и лучевой поверх- ности и используя найденный в § 14.2.3 результат, указывающий, что поверхность нормалей представ- ляет собой поверхность оснований перпендикуля- ров к лучевой поверхности. Сечение этих поверх- ностей плоскостью хг показано на рис. 14.12. По- верхность нормалей пересекает эту плоскость по окружности радиуса v'p = v4 и овалу с полярным радиусом v'p, тогда как лучевая поверхность пере- секает ее по той же окружности с v'r --- va и эллипсу ¦фракция: построение кону- с v"r. Если окружность и овал пересекаются в точ- сов-, ке Л/, то линия ON совпадает с направлением оп- тической оси волновых нормалей, а плоскость, проведенная через N перпендикулярно к ON, должна касаться лучевой по- верхности во всех точках, в которых конус допустимых лучевых направлений пересекает ее. Таким образом, лучевая поверхность обладает необычным свойст- вом: некоторые касательные плоскости касаются ее в бесконечном числе точек *). Лучевая оптическая ось совпадает с прямой OR, где R — точка пересе- чении двух оболочек лучевой поверхности; обе оболочки пересекаются таким образом, что в точке R имеется бесконечное число касательных плоскостей, нормали к которым образуют коническую поверхность. Нормали к этим плос- костям, проведенные из точки О, образуют конус направлений волновых нор- малей, соответствующих направлению луча OR. Углы растворов z и if обоих конусов также показаны на рис. 14.12. По причине, которая вскоре станет ясной, ко- нус, принадлежащий к N, т. е. образованный такими лучами, как ОА, называется конусом внутренней кони- ческой рефракции. Конус, принадлежащий к R, т. е. об- разованный такими волновыми нормалями, как ОВ, на- зывается конусом внешней конической рефракции. Возьмем пластинку двухосного кристалла, напри- Рис. 14.13. Внутренняя мер арагонита, вырезанную так, что две ее парал- К0НиЧеская рефракция, лельные грани перпендикулярны к оптической оси вол- новых нормалей. Если па такую пластинку нормально к одной из парал- лельных граней падает узкий пучок монохроматического света, то внутри пластинки энергия будет распространяться в полом конусе, конусе внутренней конической рефракции. При выходе с противоположной стороны световой п\чок образует полый цилиндр (рис. 14.13). На экране, параллельном грани нашей кристаллической пластинки, следует ожидать появления яркого круг- лого кольца. Это замечательное явление было предсказано Вильямом Р. Га- мильтоном в 1832 г., а через год его наблюдал Ллойд, исследовавший по пред- ложению Гамильтона арагонит. Успех эксперимента послужил одним из наибо- лее четких подтверждений волновой теории света, развитой Френелем, и в очень сильной степени способствовал ее всеобщему признанию (см. «Историческое введение», стр. 17). - *) Свойства этой поверхности подробно рассмотрены в [11].
•§ 14.3] * ОПТИЧЕСКИЕ СВОЙСТВА ОДНООСНЫХ И ДВУХОСНЫХ КРИСТАЛЛОВ V635 Рис. 14 34. Распределение све- та, возникающее вследствие ко- нической рефракции. Практически демонстрация явления конической рефракции не так проста, как было описано выше, поскольку, конечно, невозможно получить строго параллельный пучок монохроматического света. В эксперименте нам всегда приходится использовать пучки с конечной угловой апертурой. В таком слу- чае, как впервые показали Поггсндорф 1121 и Хайдингер I13J, будут наблюдаться дна ярких кольца, разделенных тонким темным кольцом (рис. 14.14). В первых экспериментах Ллойда эту структуру наблюдать не удалось, посколь- ку отверстия, ограничивающие ширину исполь- зуемого им пучка, были слишком велики, и оба ярких кольца сливались в одно. Возникающую структуру не могли объяснить в течение долгого времени после ее открытия, пока Фохт [14] не предложил интерпретацию, которая в конечном счете сводится к следующему. Мы должны рассмотреть распространение волн, нормали которых слегка наклонены к оп- тической оси. Каждой из волновых нормалей со- ответствуют два луча внутри кристалла, и сле- дует ожидать, что их направления мало отли- чаются от направлений образующих конуса внутренней конической рефрак- ции. Чтобы найти распределение прошедших лучей, необходимо рассмотреть часть лучевой поверхности вблизи окружности, по которой она касается пло- скости AN (см. рис. 14.12). Эта часть поверхности напоминает часть надутой автомобильной камеры, а касательная плоскость—плоскую доску, лежащую на ней. На рис. 14.15 показано сечение этой части поверхности плоскостью хг. Две точки на лучевой поверхности, которые соответствуют направлениям двух лучей, относящихся к данному направлению волновой нормали s, опре- деляются как точки касания этой поверхности двумя плоскостями, перпенди- кулярными к s (см. рис. 14.15). Когда волновая нормаль ON слегка отклоняется от оптической оси, вместо одной касательной плоскости возникают две парал- лельные друг Другу плоскости, одна из них при этом перемещается над лучевой поверхностью, причем точка се касания движется от центра касательной окруж- ности к точке F. Другая плоскость (ее невоз- можно показать па нашей модели, потому что она должна пересекать нашу камеру) пере- мещается так, что точка ее касания движется по направлению к точке С. Рис. 14.15 иллю- стрирует это для смещения волновой нормали в плоскости хг, но та же картина будет наблю- даться и при смещении в любом другом на- правлении. Из изложенных выше рассуждений следу- ет, что каждая падающая волна, нормаль к ко- торой образует небольшой угол ф с оптической осью, приведет к появлению пары лучей, сос- тавляющих углы Vj х + аф и 72 х—аф с осью конуса внутренней конической рефракции, где а—некоторая постоянная. Таким образом, вся энергия, сосредоточенная в падающем пучке в интервале углов от гр до ф + йф, окажется в двух конусах, половина угла раствора кото- рых равна 7гХ±аф, а угловое расстояние между ними составляет adt\>. Но соответствующая анергия в падающем пучке пропорциональна ipd<p. Отсюда следует, что при углах 72Х±«Ф интенсивность в конусе лучей пропорцио- нальна ф и; в частности, при ф = 0 она равна нулю. Таким образом, нужно Рис. 14.15. К определению положе- ния лучей, относящихся к тем вол- новым нормалям, которые составля- ют небольшие углы с оптической осью волновых нормалей.
636 Кристаллооптика [гл. D Рис, 14.16. Внешняя кониче- ская рефракция. ожидать появления двух ярких колец с темным промежутком между ними, что и наблюдается. Внешняя коническая рефракция демонстрирует уже установленный ранге факт существования целого конуса направлений волновых нормалей, соот- ветствующего данному направлению луча. Это яв- ление наблюдалось на кристаллической пластинке, вырезанной так, что ее грани перпендикулярны к лу- чевой оптической оси. На гранях пластинки точно друг против друга находятся два небольших отвер- стия,одно из которых освещается сходящимся пучком света, как показано на рис. 14.16. Второго отверстия будут достигать лишь те лучи, направления кото- рых очень близки к направлению лучевой оптической оси, так что нормали всех волн, достигающих второго отверстия, располагаются вблизи конуса внешней конической рефракции. Поэтому из кристалла будет выходить конус света. Из-за преломления при выходе из кристалла угол рас- твора этого конуса будет больше истинного угла \|; внешней конической рефрак- ции. И в данном случае на экране, параллельном грани кристалла, наблю- даются два концентрических кольца света, причем объяснение этого подобно объяснению, данному в случае внутренней конической рефракции. § 14.4. Измерения в кристаллооптике В настоящем разделе мы кратко опишем методы определения свойств кристалла (т. е. является ли он одноосным или двухосным), положения его оптических осей и значений его главных показателей преломления. Как мы увидим, оптические оси можно определить при наблюдении интерференцион- ных полос на кристаллических пластинках; характер интерференционной кар- тины ясно указывает на взаимное располо- жение оптических осей и граней пластинки. Л С Главные показатели преломления можно найти с помощью кристаллических призм, измеряя углы отклонения или полного внутреннего отражения. Предварительно необходимо рассмотреть методы получения и анализа поляризованного света. 14.4.1. Призма Николя. Одним из' наи- более широко используемых приспособле- • . ний для получения линейно поляризованного света является призма Ни- коля [15J. Она состоит из природного кристалла исландского шпата в виде ромбоэдра (одноосный кристалл), разрезанного на две равные части вдоль диагональной плоскости (на рис. 14.17 она показана линией АС). Эти части склеены вместе канадским бальзамом. Длина ромба в три раза больше его ширины, а углы при В и D его главного сечения равны 71J; торцевые грани AD и ВС сполированы тал, чтобы уменьшить этот угол до 68". Луч света, распространяющийся в направлении L параллельно длинной стороне, разделяется на два луча, обыкновенный и необыкновенный. Для первого луча канадский бальзам является оптически менее плотной средой, для второго — более плотной (для кристалла исландского шпаги п0 =1,66, пе— 1,49; для канадского бальзама п— 1,53). Легко проверить по формулам, приведенным в п. 1.5.4, что на границах с канадским бальзамом для обыкно- венного луча выполняются условия полного внутреннего отражения. Этот луч полностью отражается в направлении h зачерненной грани DC, где он и погло- щается. Необыкновенный луч проходит через призму, практически-не.испыты- Рис. 14.17. Призма Николя.
§ 14.4] ИЗМЕРЕНИЯ В КРИСТАЛЛООПТИКЕ 637 вая бокового смещения, и выходит из нее линейно поляризованным, причем его вектор D расположен в плоскости главного сечения (см. п. 14.3.2). Таким образом, призма Николя дает линейно поляризованный свет с известным, на- правлением колебаний. Если падающий луч наклонен к краю ромба, призма Николя все же будет служить поляризатором при условии, что для обыкновенного луча угол па- дения на слой канадского бальзама не меньше критического. В воздухе призма эффективно работает, если угловая апертура падающих лучей не пре- вышает *) 30°. Весьма полную линейную поляризацию света можно получить, пропуская естественный свет через пластинку поглощающего кристаллического нещестна с существенно различными коэффициентами поглощения для двух направлений колебаний. Мы рассмотрим такие «поляроиды» в п. 14.6.3. Устройство, аналогичное призме Николя, которое превращает свет с лю- быми типами поляризации в линейно поляризованный свет, называется поля- ризатором. Его можно также использовать в качестве анализатора, т. е. де- тектора линейно поляризованного света и его направления колебаний. Для детектирования линейно поляризованного света с помощью призмы Пиколя нужно лишь поворачивать призму вокруг се продольной оси и установить, существует ли положение, когда свет через нее не проходит. Если такое поло- жение существует, то свет линейно поляризован и направление колебаний его вектора D перпендикулярно к главному сечению призмы. 14.4.2. Компенсаторы. Кристаллическое вещество можно также исполь- зовать для исследования эллиптически поляризованного света, т. е. для опре- деления направления осей его эллипса поляризации и отношения их длин. Для этой цели применяется кристаллическая пластинка из подходящего материала нужной толщины. С ее помощью вводится разность фая между колебаниями в двух взаимно ортогональных направлениях. В частности, можно ввести та- кую разность фаз, чтобы преобразовать эллиптически поляризованный свет в линейно поляризованный. Требующаяся информация об эллиптически поля- ризованном свете получается тогда из анализа этого линейно поляризованного света. Такой прибор называется компенсатором, так как его функция состоит в компенсации разности фаз **). а. Четвертьволновая пластинка. Рассмотрим плоскопараллельную крис- таллическую пластинку толщиной h. Пусть ось г перпендикулярна к пластин- ке, а направления осей х и у совпадают с направлениями соответствующих коле- баний вектора D. Предположим, что пластинка поворачивается вокруг нормали до тех пор, пока оси х и у не станут параллельными главным осям поляризации падающего света. Тогда компоненты вектора D для падающего света молено записать в виде D%> = acosat, D^^b sin at. A) Поскольку скорости обоих лучей различны, изменения фаз компонент при прохождении через пластинку будут неодинаковыми. Пренебрегая потерями на отражение, можно записать компоненты вектора D для света, выходящего из пластинки, в виде Dp = acos{wt + S'), Df = bsin(at + b"), B) где V=^-n'h, &"^^n"h, C) *) Существует несколько модификаций призмы Пиколя, которое могут работать с ецда Сблыпими апертурами. Их описание см.. например, в [I6J или [17]. **) Подробный обзор, посвященный компенсаторам, приведен в работе [18]. Обзор мето> дов, применяемых для анализа поляризованного света, дан в статье [19]. Аппаратом для теоретического анализа полностью или частично поляризованного света служат матрицы когерентности или параметры Стокса, рассмотренные в § 10.8.. ~ ¦ J
638 кристаллооптика [гл 14- а X—длина волны б вакууме*). Следовательно, вносимая пластинкой раз- ность фаз равна 6"_б'=^(п"—n')h. D> В частности, если прошедший свет линейно поляризован, мы должны получить Ь" — 6' = rtJi'2 или в более общем случае б"—6' —Bт г-1)я/2, где от— любое целое число При этом пластинка должна иметь толщину 2т-'-I E) При наличии такого компенсатора направление колебаний в прошедшем ли- нейно поляризованном свете определяется соотношением Компенсатор, вносящий разность фаз |б"—б' | — л/2, т.е. такой, для которого разность двух оптических толщин составляет четверть волны, назы- вается четвертьволновой пластинкой [20]. Ее легко изготовить из листочка слюды (двухосный кристалл), расщепленной до толщины h = k/D \п"—га'|). С помощью такой пластинки можно следующим образом анализировать эллиптически поляризованный свет пучок свега пропускают через четверть- волновую пластинку, а затем через призму Николя, и оба кристалла независи- мо друг от друга поворачивают до тех пор, пока ноле, наблюдаемое через приз- му Николя, не станет совсем темным. В этом положении оси слюдяной плас- тинки параллельны осям эллипса поляризации падающего света, а призма Николя, согласно F), расположена так, что она гасит линейно поляризованный свет, вектор D которого составляет с осью х угол arclyF/a). Таким образом, определяют ориентацию осей эллипса и их отношение. Если падающий свет поляризован по кругу, то Ъ = -\-а или Ь=ь—а, а про- шедший свет линейно поляризован, причем направление вектора D составляет с осью х соответственно углы 45J или 135°. Первый из углов соответствует ле- вой, втором — правой поляризации. Так как толщина четвертьволновой пластинки зависит от )., точная ком- пенсация возможна только для монохроматического света одной определенной длины волны. Для достижения компенсации в случае света любой заданной длины волны следует использовать не одну плоскопараллельную пластинку, а клип или комбинацию клиньев Рассмотрим некоторые компенсаторы такого типа. б Компенсатор Бабине. Компенсатор, разработанный Рис 14.18. Ком- Бабине 121J, позволяет получить любые разности фаз в том пенсатор Бабине. числе и нулевые. Он состоит из двух кварцевых клиньев (положительный одноосный кристалл) с одинаковыми острыми углами. Клинья расположены так, как показано на рис 14 18, и могут смещаться вдоль плоскости соприкосновения, образуя, таким образом, параллельную пластинку варьируемой толщины. В одном из клдньев опти- ческая ось параллельна, в другом — перпендикулярна ребру. Пусть а0 и га„ — показатели преломления кварца для обыкновенного и необыкновенного лучей, а пх и hi — толщины двух клиньев в некоторой опре- детеннои ючке После прохождения обоих клиньев разность фаз между лу- чами становится равной »--= —К-я„)(А,-А,). G) •) В отличне от § 1.3 здесь мы пишем >., а не Яо,
§ 14.4] ИЗМЕРЕНИЯ В КРИСТАЛЛООПТИКЕ 639 Легко понять, почему в1 это выражение входит разность толщин. В самом деле, скорость луча, для которого направление колебаний вектора D перпендику- лярно к главной оси (обыкновенный луч), превышает скорость необыкновен- ного луча. Поэтому компонента, в которой направление колебаний перпенди- кулярно к ребру клина, будет опережать вторую компоненту в одном клипе и отставать в другом. Толщины А, и А3, а следовательно, и разность cpai Ь непре- рывно меняются, если точка падения света движется вдоль пластинки, причем б равно нулю в середине. В результате получится серия линий, где прошедший свет будет линейно поляризован и, значит, его можно погасить путем соот- ветствующей ориентации призмы Николя. Если выбрать ось х параллельно ребру клина, то эллиптическую поляри- зацию падающего света можно представить следующим образом: ?><"> = a, cos (со/+ 6;), D«>=a,cos(<u/ + 6;). (8) Поляризация света, прошедшего через компенсатор, записывается в виде Di() = a, cos(at + 6'), Df = a2 cos (и/+ 6"), (9) где Для линейной поляризации выходящего света необходимо, чтобы 6"—S' = mn(m = 0, +.Х, ±2, ...), т. е. в'.—6; = —-у-(ле—no){K^-h%)+rrm. A1) Направление колебаний при этом определяется соотношением Df "i ' ( ' Предположим вначале, что призма Николя помещена перед компенсато- ром, так что на компенсатор падает линейно поляризованный свет. Тогда Ь"а =¦= = &'„, и если за компенсатором следует анализатор, скрещенный с поляризую- щей призмой Николя, то появятся темные полосы, идущие параллельно ребру клина через точки, для которых правая часть уравнения A1) кратна я. Эти темные полосы определяют нулевое положение. Если теперь исследовать эллип- тически поляризованный свет только посредством компенсатора и анализатора, то смещение темных полос от нулевого положения сразу же определит разнос1! ь фаз б„ — &'„ для падающего света. Величину отношения компонент D"'', па- раллельной и перпендикулярной ребру, можно найти из ориентации анализа- тора, используя A2). Эти данные позволяют с помощью формул, приведенных в п. 1.4.2, определить положение главных осей эллипса поляризации и их отношение. в. Компенсатор Солейля. В некоторых случаях необходимо создавать раз- ность фаз (положительную, отрицательную или нулевую), остающуюся постоян- ной во всем поле зрения. Этого можно достичь с помощью компенсатора, раз- работанного Солейлем 122]. Он состоит из двух кварцевых клиньев Л и А', которые, как и в случае компенсатора Бабине, образуют плоскопараллельную пластинку, по с тем отличием, что оптические оси обоих клиньев параллельны ребрам. Нижний клин склеен с плоскопараллельной кварцевой пластинкой В, оптическая ось которой перпендикулярна к ребру клина (рис. 14.19). Эффек- тивная оптическая разность хода, которую вносит этот компенсатор между двумя лучами, очевидно, равна (пе—nj \hB—(hA +/1,4-)]. В нулевом поло- жении, когда эта разность исчезает, все поле зрения можно сделать темным
640 КРИСТАЛЛООПТИКА [гл. 14 при помощи соответствующим образом ориентированного анализатора. Эф- фективную оптическую разность хода можно изменять, смещая верхний клин, но для каждого положения разность хода остается постоянной по всем^ полю. Анализ эллиптически поляризованного света прово- дится примерно так же, как и с помощью компен- сатора Бабине. е. Компенсатор Берека. Берск 12.3] разработал компенсатор, используемый в биологической микро- скопии (например, для измерения разностей хода в Рис. 14.19 Компенсатор нитях Двоякопреломляющих материалов). Он состоит Солейля из пластины одноосного кристаллического вещества с оптической осью, перпендикулярной к граням пла- стины. Разность фаз между обыкновенным и необыкновенным лучами вво- дится путем наклона пластины. Ее монтируют так, что она может поворачи- ваться с помощью проградуированного диска, который калибруется прямо в единицах вносимой разности хода. 14.4.3. Интерференция в кристаллических пластинках. Как отмечалось, выше, направления оптических осей можно определить путем наблюдения интерференционных явлений в кристаллических пластинках. Возникающие при этом интерференционные эффекты, которые служат поразительной де- монстрацией согласия теории и эксперимента в кристаллооптике, вполне за- служивают самостоятельного изучения. Рассмотрим вначале пучок линейно поляризованного света, выходящий из поляризатора и падающий нормально на плоскопараллельн'ую кристалли- ческую пластинку толщиной h. Входя в пластинку, каждый луч делится на два луча, распространяющиеся с различной скоростью, причем их векторы D колеб- лются в двух взаимно ортогональных направлениях, перпендикулярных направлению нормали к пластин- ке. Лучи выходят из пластинки с определенной раз- ностью фаз 6. Если анализирующая призма Николя расположена за пластинкой, то она пропускает опре- деленные компоненты этих двух колебаний, которые могут интерферировать в фокальной плоскости линзы, расположенной за анализатором. На рис. 14.20 плоскость чертежа параллельна пластинке. D' и D" — два взаимно ортогональных направления колебаний в кристалле, а ОР и ОА — направления колебаний, которые пропускаются соот- ветственно поляризатором и анализатором. Пусть ф — угол, который ОР образует с D', ах—\гол между ОА и ОР. Амплитуда световой волны, падающей на пластинку, представляется вектором ОЕ (он параллелен ОР); его составляющие в направлениях D' и D" равны ОВ = Е cos ф, OC=Esiny. A3) Анализатор пропускает лишь составляющие, параллельные ОА, амплитуды которых, как легко получить из риСунка и из выражения A3), равны С О В Рис 14.20 К определению комлшзеят колебашп1, гро- пускаемых поляризатором и анализатором. OF = Е cos ф cos (ф—%),, OG = E sin ф sin (q>—%)• Покидая пластинку, компоненты различаются по фазе на величину A4) A5) Согласно G.2.15) интенсивность, получающаяся в результате интерференции
§ 14.4) ИЗМЕРЕНИЯ В КРИСТАЛЛООПТИКЕ 641 двух монохроматических волн с разностью фаз б, равна где /i и /2 — интенсивности (квадраты амплитуд) обеих волн. Если амплитуды имеют вид A4), то —sin2q>tsin2(<p—хЫп2|-1, A6) где использовано тождество cos 6= 1 — 2 sin2 (8/2). Если удалить пластинку ф = 0), то интенсивность будет равна / = Е2 cof2x, следовательно, второй член в A6) представляет собой влияние кристаллической пластинки. Рассмотрим два важных специальных случая. а. Анализатор и поляризатор параллельны (%=0). В этом случае A6) примет вид ^ sin2 2ф sin21-) , A7) Имеется максимум пропускания при Ф = 0, у, я A8) т. е. когда направление колебаний, пропущенных анализатором, совпадает с одним из направлений колебаний в пластинке. Между положениями, опреде- ляемыми A8), располагаются минимумы пропускания, которые задаются со- отношением sin2q> = ±l, т.е. л Зя 5я , ,,„. Ф = 7- T' Т> •-• - ^19> причем минимумы интенсивности равны !) = ?2cos24, B0) В минимуме нет полной темноты, если б пе равно нечетному числу п, т. е. если толщина пластинки пе равна одному из ряда специальных значений, зависящих от длины волны света, б. Анализатор и. поляризатор взаимно перпендикулярны (% = я/2). В дан- ном случае из A6) следует |-. B1) Сравнение с A7) показывает, что возникающие здесь интерференционные яв- ления оказываются дополнительными к случаю а. Имеются минимумы, соот- ветствующие полной темноте, когда <р принимает одно из значений A8), и относительные максимумы для промежуточных положений A9), равные /XMaKC = ?2sin3-|. B2) Подобные явления можно использовать для получения строго дополни- тельных цветов. Для этого необходимо лишь пропустить пучок белого света через две призмы Николя, разделенные кристаллической пластинкой, причем призмы должны быть вначале параллельны друг другу (% = 0), а затем скре- щены (х = я/2). Для создания однородного поля существенно иметь достаточно параллельный пучок, чтобы не вносить заметной разности фаз. Если свет, падающий на первый поляризатор, испускается протяженным некогерентным источником, расположенным в фокальной плоскости линзы, то каждая точка этого источника независимо от остальных его точек будет создавать в сопряженной точке некоторую интенсивность. Наблюдающееся в плоскости изображения распределение света, которое можно описать с 41 М. Ворн, Э. Вольф
642 КРИСТАЛЛООПТИКА [гл. помощью кривых равной интенсивности, обусловливает так называемую ин- терференционную картину кристаллической пластинки. Каждой точке в плос- кости изображения соответствует направление параллельных лучей, входя- щих и выходящих из кристалла, и поэтому необходимо рассмотреть изменение разности фаз б с изменением этого направления. Достаточно рассмотреть лишь случай скрещенных поляризатора и анализатора (у_ = л/2), так как при их параллельности картина будет дополнительной, другие случаи приводят к ме- нее четким интерференционным картинам. Интенсивность, соответствующая заданному на- правлению падения, чависит от <ри б. Полезно рас- смотреть влияние изменения каждой из этих величин по отдельности. КриЕые, вдоль которых ф постоян- но, называются изогирами, кривые, вдоль которых 6 постоянно,—изохраматами. Изогпры зависят ог ориентации оптических осей в пластинке и не зави- сят от толщины пластинки и длины волны, если от- сутствует дисперсия осей. Изохроматы зависят от на- правления волновых нормалей и от толщины пла- стинки и называются так потому, что при исполь- зовании белого света они представляют собой линии одинакового цвета. Принадлежащие этим семействам кривые, вдоль которых интенсивность равна нулю,, называются главными изогирами и главными изо- хроматами; согласно B1) они задаются соотношениями sin 2ц> =0 и sin -у б =? 0. Соответствующее таким кривым состояние поляризации света совпадает с со- стоянием поляризации света, падающего на кристалл. Это связано с тем, что для главных изогир направление колебаний, пропускаемых анализатором, совпадает с одним из направлений колебаний в кристалле, а для главных изо- хромат разность фаз между двумя выходящими пучками кратна 2л. Обе систе- мы кривых налагаются друг на друга, но их можно изучать но отдельности. Прежде чем перейти к исследованию формы этих кривых, необходимо рассмотреть зависимость разности фаз б от угла падения. Пусть SA, АВ', АВ" — волновые нормали к падающей и к двум преломленным волнам в точке А, а 9Ь 9j, 0j—соответственно угол падения и два угла преломления (рис. 14.21). Далее пусть X— длина волны в первой среде (воздух) и V = 'к1п',. %" = %1п"— длины обеих преломленных волн. Лучи из пластинки будут вы- ходить параллельно друг другу и волновой нормали к падающей волне (см. рис. 14.21) с разностью фаз [^--] B3) Рис. 14.21. К определению разнести фаз, приобретае- мой двумя волнами, про- шедшими через кристал- лическую пластинку. где АВ'=- cos 62 cos 6а В'С = В"В' sin 9j = ft sin 9j (tg 8^ — tg Oj). Подставляя последние два выражения в B3), получим г, < Г 1 / 1 sin 0. sm = 2яй =-1 ^г-г. -.— б = 2nh L cos 6l COS 02 i)j. B4) B5) B6) Используя закон преломления, мы можем заменить sin QLt'X на sinO^/A." в пер- вых скобках и на sin Oi, X' во вторых скобках, и тогда получим ,. о . f cos el cos B2 1 2лй , „ л„ , .,. /n,v о = 2ял \—р jj-7-i- | = -у- (п cos 92—п. cos 92), B7)
§ 14.4] ИЗМЕРЕНИЯ В КРИСТАЛЛООПТИКЕ 643 Так как разность п" — п' всегда мала по сравнению с п' и п", можно заменить B7) приближенным выражением. В первом приближении имеем п" cos е;—я' cos e;=(«"—«') -^ (п cos ea) = («"—я') [cos a,—«sin e2 ^1, B8) где п — среднее значение п' и п", 9а — соответствующее среднее углов GJ и 6?. Дифференцируя выражение для закона преломления sinO1 = nsin61 при фиксированном значении 01? получим также 0 = sine2 + «cos92^. B9) Следовательно, B8) можно записать в виде «"cos e;—ft' cos e;=-—^ (п"—я'), (зо> а подставив в B7) выражение C0), найдем Величина ft/cos 6г представляет средний геометрический путь двух лучей в плас- тинке, а после умножения па я" — п' — соответствующую оптическую раз- ность хода. Возвращаясь к случаю протяженного источника, мы должны рассмотреть прохождение волн с различными направлениями распространения. Предпо- ложим, что эти направления обра- зуют небольшие углы с нормалью к пластинке. Зададим каждую из падающих волн ее волновой нор- малью в фиксированной точке А (см. рис. 14.21). Между точками F в фокальной плоскости линзы, где собираются волны, и точками В, где нормали проходящих волн АВ пересекают нижнюю поверхность пластинки, существует однознач- ное соответствие (ЛВ — это сред- нее из АВ' и АВ"). Так как нак- лон АВ к нормали пластинки AD мал, точки F образуют слег- ка искаженное изображение —¦ проекцию точек В. Следовательно, форма изохромат существенно зависит от местоположения точек В, для которых постоянна величина б. В частности, для главных изохромат эта-постоянная равна целому кратному 2л. Для исследо- вания влияния изменения толщины пластинки мы должны лишь сместить плос- кость, содержащую точки В, параллельно самой себе. Очевидно, можно получить все изохроматы, строя вокруг некоторой точки А поверхности постоянной разности фаз б (h, 62) = const, называемые также изохроматическими поверхностями, и находя их пересечения с плоскостями h — const. При определении этих поверхностей необходимо помнить, что по- казатели преломления п' и п", входящие в выражение C1) для 8, также за- висят от 6г. Рассмотрим по отдельности форму интерференционных картин, получен- ных с пластинками из одноосного и двухосного кристаллов. Для задания поло- жения точек В удобно воспользоваться полярным радиусом Рис. 14.22. К теории интерференционных картин, получающихся с кристаллическими пластин- ками. и углом G (или углами #х и тJ), который Л5 образует с направлением оптиче- ской оси (или осей) волновых нормалей кристаллической среды (рис. 14.22). 41»
644 КРИСТАЛЛООПТИКА [ГЛ. 14 14.4.4. Интерференционные картины, получающиеся с пластинками одно- осных кристаллов. В одноосном кристалле фазовые скорости, соответствующие направлению волновой нормали, образующему угол # с оптической осью, t связаны межд\ собой, согласно A4 3.4), соотношением (v'pr-(v;r = {vl-vl)sm*$. C3) Так как vp — cln и аналогично для других скоростей, мы вправе написать J —=(~ ^sinsfl. C4) (n'f (п'У \nl nl J Разность этих двух показателей преломления обычно мала по сравнению с их величинами, и поэтому последнее выражение приближенно можно представить в виде п"—п'= (пе — no)sin8ifr. C5) Подставляя выражение C5) в C1) и используя C2), получим ^P C6) Следова1елыго, поверхности постоянной разности фаз определяются соотноше- нием N psin2# = C (С = const). C7) Чтобы представить себе форму этих -поверхностей, обратимся к декартовым осям координат с осью г, направленной вдоль оптической оси. Тогда Р^х*+У3 + **Л C8) и в соответствии с C7) поверхности постоянной разности фаз будут определять- ся уравнением (х' + у*У^СЦх> + у* + г*). C9) Эти поверхности можно получить при вращении кривых x4=C3(x3 + za) D0) вокруг оси г (типичная кривая такого вида показана на рис. 14 23). На боль- ших расстояниях от начала координат (z*~^>x-) кривые асимптотически при- ближаются к параболам х*=±Сг. D1) Вблизи оси х имеем так что кривая там аппроксимируется гиперболой ха —z3 = C2. D3) На рис. 14.23 эти параболы и гиперболы покачаны пунктиром. Теперь мы можем определить все изохроматы, просто беря сечения по- верхности C9) плоскостями, находящимися на различном расстоянии h от начала координат, причем все возникающие изохроматы можно наблюдать на внешней грани кристаллической пластинки. Из рассмотрения рис. 14.23 оче- видно, что формы изохромат зависят от ориентации этой грани пластинки относительно оптической оси. Если внешняя грань пластинки перпендикуляр- на к оптической оси, то ясно, что изохроматы имеют вид окружностей; если нормаль к грани образует небольшой угол с оптической осью, кривые сжимают- ся и переходят в эллипсы, если же эта нормаль образует большой угол с опти-, ческой осью, кривые приближаются к гиперболам.
§ 14.4] ИЗМЕРЕНИЯ В КРИСТАЛЛООПТИКЕ 645 Главные изогиры (кривые, для которых sin2cp = 0) имеют вид темного расплывчатого креста, образующие которого параллельны направлениям поля- ризатора и анализатора, а центр соответствует направлению волновой нормали, параллельному оптической оси. Это следует из того, что, как известно, при любом заданном направлении волновой нормали в кристалле направления колебаний параллельпы и перпендикулярны главной плоскости, в которой лежат волновая нормаль и оптическая ось. Таким образом, всем направлениям, для которых главная плоскость параллельна направлению колебаний, про- пускаемых либо поляризатором, либо анализатором, соответствуют в поле зрения темные области. На рис. 14.24 показана типичная интерференционная картина, полученная с одноосным кристаллом; на ней ясно видны главные изогвры и изохроматы. Интерференционные картины в плоскопараллельных кристаллических s Рис. 14.23. Меридиональная кривая поверхности постоян- ной разности фаз для опти- чески одноосного кристал- Рис. 14.24. Интерференционная карти- на, получаемая с плавиковым шлагом, вырезанным перпендикулярно оптиче- ской оси. Призмы Николя скрещены пластинках находят важное практическое применение в полярископах. Этт приборы используются для определения небольших количеств поляризован- ного света в пучке, который в основном негголяризован. В качестве примера приведем пластинку Савара 124). Она состоит из двух кварцевых пластинок, каждая из которых вырезана таким образом, что ее оптическая ось составляет 45° q нормалью к пластинке. Обе пластинки склеены так, что плоскости, со- держащие нормали к пластинкам и оптические оси, перпендикулярны друг к другу. Следовательно, направление колебаний, соответствующее обыкно- венному лучу в одной пластинке, совпадает с направлением колебаний, соот- ветствующим необыкновенному лучу в другой, а разности фаз имеют противо- положные знаки. При нормальном прохождении волн через пластинки ргз- ности фаз точно компенсируют друг друга. Для случая почти нормального падения в таком устройстве разность фаз почти не меняется при изменении длины волны, что позволяет получать полосы в белом свете. Если между скре- щенными призмами Николя поместить пластинку Савара так, чтобы ее глав- ные плоскости составляли угол 45° с направлениями призм, то интерферен- ционная картина будет состоять из почти прямых светлых и темных полос. Если убрать поляризующую призму и пропускать через систему частично поляри- зованный свет, то поляризованная составляющая будет создавать полосы, которые накладываются на однородный фон, обусловленный неполяризован-
646 КРИСТАЛЛООПТИКА [ГЛ !4 ной компонентой. Эти полосы можно обнаружить даже при очень малой доле поляризованного света Полосы наиболее контрастны, когда плоскость колеба- ний падающего света составляет угол 45° с главными плоскостями пластинки Савара. 14.4.5. Интерференционные картины, получающиеся с пластинками двух- осных кристаллов. Для плоскопараллельной пластинки двухосного кристалла мы получим вместо C3) более общее соотношение D4) которое следует из A4.3.18). Здесь /Ь1 и $2 — углы между направлением вол- новой нормали АВ с каждой из двух опшчееких осей волновых нормалей. Так как vp = с/л, vx = с/пх и т. д., то D4) принимает вид или приближенно, так как разности показателей преломления малы по срав- нению с их величинами, п"—«' = (пг—nx)sin&1 sinftj,. D6) Подставляя последнее соотношение в C1) и снова вводя величину fr/cos Ф2 — = р, получим для разности фаз ё = ^5?.(пл—nx) sin 0t sin *2. D7) Как мы видим, поверхности постоянной разности фаз определяются теперь выражением р sin #х sin d2 = С " (С = const). D8) В направлении каждой оптической оси ("9ч — 0 или Ф,. = 0)р стремится к бес- конечности, так что Э1и поверхности асимптотически приближаются к ци- линдрам, окружающим оптические оси. Когда Фх мало, J% jNi Ьг приблизительно равно углу 2р между двумя оптически- ми осями, и D8) тогда переходит в соотношение С -~Я Рис: 14.25 Поверх- ность постоянной разности фаз для Но psm Ф, — это расстояние точки на поверхности до оп- тической оси ¦&! = 0, а р sin 02 — расстояние до оси дг = 0. Следовательно, «асимптотические цилиндры» являются круговыми. Форма поверхности постоянной разности фаз в общем случае показана на рис. 14 25. Очевидно, что вбли- зи оптических осей изохроматы являются замкнутыми кри- выми, приближающимися к зллипсам и окружающими две точки в фокальной плоскости, которые соответствуют оп- тическим осям. Главные изогиры получают, как и раньше, находя нап- равления волновых нормалей, для которых направления колебаний в кристалле совпадают с направлениями, пропу- скаемыми призмами Николя. Мы можем использовать построение эллипсоида волновых нормалей, выполненное в п. 14 2.3, а, где было показано, чго плоскости колебаний делят пополам углы между плоскос- тями (Nl7 s) и (N., s); здесь г, и N2—направления оптических осей нашего кристалла. Таким образом, если у кристалла ось г вертикальна и направления колебаний, пропускаемые призмами Николя, параллельны осям х и у, то глав- ные изогиры будут лежать в плоскостях хг и уг. Следовательно, интерферен- ционная картина будет иметь вид темного креста, причем одна пара образующих проходит через точки, соответствующие оптическим осям.
14.4] ИЗМЕРЕНИЯ В КРИСТАЛЛООПТИКЕ 647 Рис. 14.26. Интерференционная картина, получающаяся с бразильским топазом. В более общем случае, когда кристалл ориентирован относительно на- правлений поляризаторов произвольным образом, главные изогиры проходят через точки, соответствующие оптическим осям, и имеют форму равнобочных гипербол, асимптоты которых совпадают с направлениями колебаний, пропус- каемыми призмами Николя. Если при фиксированных положениях обеих призм поворачивать кристаллическую пластин- ку в ее плоскости, то картина изогир будет изменяться, а изохроматы (не считая их вращения) останутся такими же, так как они определяются условия- ми, не зависящими от направлений по- ляризаторов. Типичная интерференци- онная картина, полученная с пластин- кой двухосного кристалла, показана на рис. 14.26. 14.4.6. Определение положения оп- тических осей и главных показателей преломления кристаллической среды. Так как изохроматы образуют замкнутые кривые, охватывающие оптическую ось (или оси), ю наблюдение интерферен- ционных картин сразу же позволяет ус- тановить число осей кристалла и опре- делить их положение. Интерференци- онные картины можно наблюдать в мик- роскоп, снабженный двумя призмами'Николя (так называемый поляризацион- ный микроскоп), либо удаляя окуляр и фокусируя глаз на заднюю фокальную плоскость объектива (что воспроизводит условия рис. 14.21), либо помещая дополнительную линзу так, чтобы заднюю фокальную плоскость объектива можно было наблюдать через окуляр. При втором методе получается увели- ченное изображение интерференционной картины и можно проводить изме- рения, используя калиброванную шкалу окуляра. Таким образом, можно измерять угол между оптическими осями двухосного кристалла (естественно, необходимо учитывать, что при выходе из кристалла свет преломляется). Указанные способы пригодны для определения положения оптических осей и измерения их наклона даже при наличии очень небольших кусочков кри- сталла, попадающихся в тонких слоях минералов. Главные показатели преломления кристалла пх, пч, пг можно определить, либо измеряя угол отклонения или полного отражения в призме, либо после- довательно погружая кристалл в жидкости с разными показателями прелом- ления. Метод с использованием призмы более удобен для одноосных кристаллов, чем для двухосных. Призму вырезают так, чтобы ее преломляющее ребро было параллельно оптической оси волновой нормали. Тогда для обыкновенной и необыкновенной волн векторы D соответственно один перпендикулярен, а Дру- гой параллелен этому ребру. Оба показателя преломления можно найти по -отклонениям двух лучей, выходящих из призмы, когда на одну из ее граней надает неполяризованпый пучок света. Обыкновенный и необыкновенный лучи легко различить с помощью призмы Николя. Иммерсионный метод основан на том, что прозрачное тело, погруженное в жидкость с таким же показателем преломления, становится невидимым. По- скольку при любом направлении распространения света кристалл имеет два показателя преломления, он останется видимым в любой жидкости, если его наблюдать в неполяризованном свете. Однако при использовании поляризо-
648 КРИСТАЛЛООПТИКА [ГЛ. Н ванного света, у которого направление вектора -D совпадает с одним из на- правлений колебаний в кристалле, последний станет невидимым в жидкости с соответствующим показателем преломления (я' или я"). Если направления главных диэлектрических осей известны, кристалл можно ориентировать так, чтобы свет распространялся по очереди параллельно каждой оси; при этом п' и я" будут равны соответствующей паре главных показателей преломления пх, п„ и пг. Если направления главных диэлектрических осей неизвестны, можно получить прекрасную оценку величин показателей преломления, погружая большое число кристаллов рассматриваемого типа со случайными ориента- циями осей в ряд жидкостей с известными показателями преломления. Каждый кристалл станет невидимым при двух различных значениях показателя пре- ломления и двух направлениях колебаний падающего света. Если эти показа- тели преломления для какого-то кристалла равны п' и я." то, согласно неравенствам A4.3.12), получим . пх =sj п' ^ пу ^L п" ^ пг. E0) Таким образом, пх равно нижнему пределу значений п', пх— верхнему пре- делу значений п", а пч равно и верхнему пределу п' и нижнему пределу я", которые должны совпадать, если выполнено достаточное число измерений. В случае одноосных кристаллов один из показателей преломления каж- дого кристалла равен пи, а значения другого лежат в интервале между по и пе. § 14.5. Искусственная анизотропия 14.5.1. Двойное лучепреломление, вызванное напряжением. Прозрачное изотропное вещество может стать оптически анизотропным, если его подверг- нуть механическим напряжениям. Это явление, впервые обнаруженное Брюстс- ром [25] и известное как искусственная анизотропия, вызванная напряжением, или фотоупругость, находит полезное практическое применение. Мы лишь кратко укажем, как можно использовать оптические методы для получения информации о состоянии напряжения в первоначально изотропном веществе. Предварительно мы должны получить соотношения, связывающие упругие.и оптические постоянные вещества. i Напряжение и деформация в упругом твердом теле характеризуются тен- зорами второго ранга, тензором напряжения РЬ1 и тензором деформации rhl, компоненты которых связаны друг с другом линейными соотношениями. Эти два тензора всегда симметричны, но главные оси соответствующих эллипсоидов в общем случае не совпадают с главными осями эллипсоида, соответствующего тензору диэлектрической проницаемости, который, как мы видели в § 14.1, определяет оптические свойства тела. Когда тело подвергнуто напряжению, тензор его диэлектрической про- ницаемости изменяется, и в первом приближении можно предположить, что изменения компонент этого тензора линейно связаны с шестью компонентами тензора напряжения и, следовательно, с шестью компонентами тензора де- формации. Таким образом, мы приходим к необходимости ввести две новые группы коэффициентов, связанных с напряжением и деформацией и характе- ризующих указанные соотношения. Эти коэффициенты называются упрцго- оптическими коэффициентами напряжения и деформации соответственно. Если мы свяжем оси координат с главными диэлектрическими осями не- напряженного материала, то эллипсоид волновых нормалей будет определяться уравнением 2 2 2
§ 14.5) ИСКУССТВЕННАЯ АНИЗОТРОПИЯ 64!} При наличии напряжения с компонентами Рхх, РХ1), ,.. этот эллипсоид перей- дет в другой, уравнение которого можно записать в виде аххх> + аууу* + azzzl + ayzyz + azxzx + ахуху = 1. B) В соответствии с нашим предположением каждый коэффициент а!н отли- чается от соответствующего коэффициента в A) на линейную функцию от Р, Таким образом, мы имеем шесть соотношений; приведем два типичных соот- ношения: ахх—~= ЯцРхя + ЯцРуу + q^Pzz + q^Pyz + qibPzx + яиРху, \ а C^ В этой записи каждая цифра 1—6 индекса относится к паре осей; таким об- разом, 1 = хх, 2 = уу, 3 = гг, 4 = уг, 5 = zx, 6 = ху. Аналогичная система урав- нений связывает коэффициенты afll с компонентами тензора деформации. Влияние напряжения на оптические свойства можно также выразить через деформацию лучевого эллипсоида, и тогда получатся еще две системы линей- ных уравнений с 36 коэффициентами. Эти коэффициенты связаны с коэффи- циентами эллипсоида волновых нормалей, так как направлении главных осей обоих эллипсоидов всегда совпадают, а величины полуосей одного являются обратными величинами полуосей другого. Соотношения C) принимают более простую форму, если изучаемая струк- тура обладает элементами симметрии. Для кристаллов кубической системы все три главные оси х, у и г эквивалентны, и поэтому между упруго-оптически- ми коэффициентами напряжения выполняются соотношения *) причем все остальные коэффициенты равны нулю. Для изотропных веществ соотношения C) должны оставаться неизмен- ными при любом изменении осей. Это возможно только в том случае, если упру- го-оптические коэффициенты напряжения удовлетворяют условиям D) и, кроме того, выполняется соотношение Таким образом, в данном случае имеются лишь две независимые постоянные. Так как все системы осей теперь эквивалентны, мы можем использовать любые оси координат и, в частности, главные оси тензора напряжений; тогда Ру1 = = РIy = Рху = 0, и вместо C) мы получим более простые соотношения ахх ь—ЯпРхх + ЯцРуу + ЯиРгг' ауу ~~~ = ЯыРх* + Ч\\Р уу + QlsPzz< I ayz= «z*= а*у = 0. J Таким образом, в данном случае главные оси тензора напряжений и эллип- соида волновых нормалей совпадают, как и следовало ожидать из соображений симметрии. » Хотя кристаллы кубической симметрии, например каменная соль, при отсутствии напряжений оптически изотропны, их поведение при наличии де- формации отличается от поведения истинно изотропных веществ типа сгекла. Влияние напряжений удобно наблюдать, рассматривая тело, помещенное между скрещенными призмами Николя (или другими поляризующими устройствами, например поляроидными пленками, см. п. 14.6.3). Предцоло- *) Соотношения, существующие между упруго-оптическими коэффициентами напряже- ния для каждой кристаллической системы, рассматриваются а работах [26, 27]. Они собраны в [2oJ.
?50 кристаллооптика [гл. 14 жим, что свет падает нормально на пластинку толщиной h. Эта пластинка подвергается напряжению, приложенному так, что две главные оси тензора напряжений, например х и у, а следовательно, и тензора диэлектрической про- ницаемости лежат в плоскости пластинки и образуют углы ф и (p-f-n'2 с на- правлениями поляризатора и анализатора, как и в опыте, описанном в п. 14.4.3. Сечение эллипсоида нормалей плоскостью ху имеет вид эллипса аххх* + ауууг=\, G) где ахх и аИ№ определяются из F). Показатели преломления п' и п" для двух ¦волн, распространяющихся в пластинке, равны п = , га = , (о) ¦Следовательно, Практически п' и га" слабо отличаются от лм так что приближенно имеем n'-n'=ynS(</ii-<7i.) (/'«-''>,)• (Ю) Подставляя это выражение в A4.4.31), получим для разности фаз 6 между двумя волнами, выходящими из пластинки, соотношение b = ~nl(qn-q12)(Pxx-Pyi,). A1) Таким образом, разность фаз пропорциональна величине Рхх—Р,г!1, которая представляет собой удвоенное значение напряжения сдвига в плоскости, на- клоненной иод углом 45" к направлениям х и у. В данном случае остается лишь один независимый 5пруго-онтический коэф- фнциент напряжения, а именно qu — ql2. Отсюда следует, что ес- ли напряженною пластин- I1J ку стекла или прозрачной пластмассы поместить меж- Рис. 14.27. Картина напряжений в бруске, возникающая ДУ скрещенными призма- под действием концентрированной нагрузки. МИ НпкоЛЯ, иуд)Т ВИДНЫ Положение груза указано стрелкой L, концы бруска (не пока- Светлые И ТвМНЫе ПОЛОСЫ, И заны) закреплены. эти шлош сООТПеТСТВуЮТ контурам равного напря- жения сдвига. Такая «картина напряжений» показана на рис. 14.27. В лю- бом данном участке картины наибольшая контрастность полос наблюдается при угле между главными осями напряженной системы в этом участке и на- правлениями колебаний, пропускаемых призмами Николя, равном 45°. Если главные оси тензора напряжения параллельны направлениям, пропускаемым призмами Николя, полосы исчезают и поле зрения становится темным. Таким образом, направления осей напряженной системы можно определить, повора- чивая скрещенные поляризаторы, тогда как величину напряжения сдвига можно найти, зная порядок полос. Эгот метод используется для исследования напряжений в промышленных конструкциях; модель конструкции изготов- ляют из подходящей пластмассы и описанным выше способом наблюдают не- посредственно влияние напряжений. Указанный способ часто позволяет избе- жать очень трудоемких расчетов *). *) Подробное описание этого метода приведено, например, в книге [291 или 130],
H.51 ИСКУССТВЕННАЯ АНИЗОТРОПИЯ 651 14.5.2. Двойное лучепреломление формы. Способность кристаллов к двой- ному лучепреломлению можно объяснить, исходя из анизотропии электриче- ских свойств молекул, составляющих кристаллы. Однако двойное лучепрелом- ление может возникать и вследствие анизотропии элементов, значительно более крупных, чем молекулы. Речь идет в данном случае о некоторой упоря- доченной системе частиц из оптически изотропного вещества, размер которых велик по сравнению с размерами моле- кул, но мал по сравнению с длиной полны света. Тогда говорят о двойном лучепрело члении формы. Часто из оптических измерений можно получить информацию о суб- микроскопнческих частицах, кото- — рые обусловливают двойное лучепре- ~*vh h "Щ* 4—"Щ" ломление указанного типа. Мы по- Рис 14 28, Регулярная система тонких па- ясним принцип этого метода, рас- раллельных пластин, смотрев некоторый идеализированный случай регулярной совокупности частиц, которые имеют форму тонких параллельных пластин. Пусть tt — толщина каждой пластины, а 4 — ши- рина промежутков между ними (рис. 14.28). Далее пусть вх — диэлектри- ческая проницаемость каждой из пластин, a s2—диэлектрическая проницае- мость окружающей их среды. Предположим, что на эту систему падает плос- кая монохроматическая волна и что ее электрический вектор перпендикулярен к пластинам Если предположить, что линейные размеры граней пластин ве- лики, а толщины /х и 4 малы по сравнению С длиной волны, то поле в пластинах и между ними можно считать однородным. Далее, в соответствии с изложенным в п. 1.1.3, нормальная составляющая вектора электрического смещения долж- на оставаться непрерывной при пересечении поверхности, на которой резко меняются свойства среды. Следовательно, вектор электрического смещения D должен быть одинаковым как внутри пластин, так и вне их. Если Ei и Еа —• соответствующие электрические поля, т. е. _ D „ D A2) то среднее поле Е, полученное усреднением по всему объему, равно В этом случае эффективная диэлектрическая проницаемость ех равна U ('1 ~Т~'2) ^1^2 ^1^2 A3) A4) где /, = tj(ti + 4) и /2 = t,J(ti + 4) = 1 — U — Доли общего объема, занимаемые пластинами и окружающей средой соответственно. Предположим теперь, что электрический вектор падающего поля парал- лелен пластинам. Согласно п. 1.1.3 тангенциальная составляющая электри- ческого вектора непрерывна на поверхности разрыва, так что в данном случае он будет иметь одно и то же значение Е внутри пластин и между ними. Элект- рические смещения в обоих этих областях равны D^^E, D2 = e2E A5) и, значит, для среднего электрического смещения D имеем -• A6)
652 КРИСТАЛЛООПТИКА [ГЛ. 14 Следовательно, в этом случае эффективная диэлектрическая проницаемость окажется равной g|i = -e-= У1+/'2 Wi8i + /vv A7) Так как эффективная диэлектрическая проницаемость одинакова для всех направлений, параллельных пластинам, но различна для направлений, пер- пендикулярных к ним, наша система ведет себя как одноосный кристалл с оп- тической осью, нормальной к плоскости пластин. Разность 6 ц—8j_ всегда положительна, так как, согласно A4) и A7), е« -ex- /л+/л >0. A8) Электрический вектор обыкновенной волны перпендикулярен к оптической оси, т. е. параллелен плоскости пластин. Уравнение A8) означает, что рас- сматриваемая система всегда ведет себя как отрицательный одноосный крис- талл (см. п. 14.3.2). Последнее соотношение можно выразить через показа- тели преломления в виде ' °~ hnl + hnl ' A9) Для системы не столь идеализированных частиц расчеты, естественно, более сложны *), Значительный практический интерес представляет случай системы оди- наковых тонких цилиндрических стержней, расположенных параллельно друг другу. Винер показал *"'), что если стержни занимают малую часть общего объема (/i<^l), то вместо A9) мы получим Пе ° о+м»*+/,»? B0) Иными словами, такая система ведет себя как положительный одноосный крис- талл, причем его оптическая ось параллельна осям стержней. Двойное лучепреломление формы используется в биологической микро- скопии. Знак наблюдаемой разности указывает на близость формы часгиц к форме стержня или пластинки, и если я, и пг известны, то из уравнения A9) или B0) можно оценить часть объема, занятую частицами. Для того чтобы отличить двойное лучепреломление формы от двойного лучепреломления ма- териала самих частиц, меняют показатель преломления среды п2. Двойное лучепреломление формы исчезнет при пг = пъ тогда как двойное лучепрелом- ление материала ис зависит от изменения п2. При наличии двойного луче- преломления обоих ганов график зависимости величины |«|—п„| от п2 будет иметь минимум при ях = п2, но он не будет проходить через нуль. Упорядочение частиц, которое вызывает двойное лучепреломление формы, может быть постоянным или полупостоянным, как, например, н кристаллах вируса табачной мозаики 1341; двойное лучепреломление такого типа возникает также при временном упорядочении одинаковых частиц, взвешенных в жид- кости. Подобная взвесь оптически изотропна, если частицы ориентированы случайным образом, что обычно и наблюдается в неподвижной жидкости. Если же заставить такую взвесь течь, то частицы стремятся выстроиться в опреде- ленных направлениях и наша система начнет вести себя как кристалл. Этот .*) Общую теорию см. в работе [31]. Соответствующие формулы для эллипсоидальных частиц приведены также в стати; [32]. 1*) См. [311, стр. 581. Главные диэлектрические проницаемости прямоугольной системы параллельных цилиндров были также рассчитаны лордом Радеем [33]. Уравнение B0) пахи- дится в согласии с его результатами даже для значении fL, не очень малых по сравнению с еди- ницей, при условии, что мала разность между показателями преломления п\ и п^.
§ 14.6] ПОГЛОЩАЮЩИЕ КРИСТАЛЛЫ 653 эффект можно наблюдать, помещая взвесь между двумя коаксиальными ци- линдрами: одним вращающимся и другим— неподвижным; затем, пропуская свет в направлении, параллельном осям цилиндров, рассматривают жидкость между скрещенными призмами Николя *). Это явление, впервые обнаружен- ное Максвеллом [37], помогает при исследованиях потока жидкостей, текущих мимо препятствий, давая информацию о направлении и величине градиента скорости. § 14.6. Поглощающие кристаллы 14.6.1. Распространение света в поглощающих анизотропных средах. Опти- ческие свойства кристаллических сред, которые мы рассматривали до сих пор, описывались тензором диэлектрической проницаемости ек[. Для описания не только анизотропной, но и поглощающей среды необходимо дополнительно ввести тензор проводимости ghl. Вообще говоря, направления главных осей обоих тензоров не совпадают, и поэтому теория распространения света в та- ких средах довольно сложна. Однако ли направления совпадают для кристал- лов высокого класса симметрии (по крайней г/ере для кристаллов ромбической системы). Мы ограничимся рассмотрением кристаллов такого типа, так как все существенные особенности общей теории можно проиллюстрировать с их помощью. Для таких кристаллов следует лишь заменить вещественные ди- электрические проницаемости гх, sv и ег комплексными прошщаемостями ех, гу и вг. Мы покажем, что формально сохраняются все предыдущие формулы кристаллооптики при условии, что все. величины, зависящие от вх, е„ и ег, считаются комплексными. , Начнем с уравнений Максвелла для проводящей среды, а именно с урав- нений rbtH = -!-D+~J. rotE = —1й, A) и рассмотрим распространение плоской зату-хающей волны. В комплексной записи каждый из векторов Е, D, В, Н я j пропорционален По аналогии с A4.2.3) мы получаем уравнения «sxH= — D + ^-l nsxE = B. B) Полагая B = (iH и исключая Н из этих уравнений, найдем Если выбрать оси координат в направлении главных осей тензора ди- электрической проницаемости (которые, по нашему предположению, совпадают с направлениями главных осей тензора проводимости), то мы получим yyy, Z ZEZ, 1 iy^ayEy, jz = ozEz. J омплексные диэ ---x, у, г), E) Подставляя выражения D) в C) и вводя комплексные диэлектрические про- ницаемости тах [35 *) Определение ориентации частиц на основании таких измерений рассмотрено о рабо- *""% 361.
654 кристаллооптика [гл. 14 находим вместо C) выражение )]. F) Формально оно идентично соотношению A4.2.18), но вещественные постоянные «it и п заменены комплексными постоянными zh и п. Переписывая последнее соотношение в форме Е,=Щ^, G) мы получим, привлекая те же соображения, что и с § 14.2 (или просто исполь- вуя формальную подстановку eft->8ft, п-^-п), уравнение Френеля Вводя комплексные скорости $,-*-?*—rr, ?, = -" _JL (9) V цв п V рех %х я т. д., мы снова можем записать уравнение Френеля в форме A4.2.24), т. е. 2 s a —5* ] &—_l—^—= 0, A0) Полученные выше соотношения полностью аналогичны соотношениям, относящимся к непоглощающим кристаллам; однако их физические интер- претации несколько различны. Из выражений (8) или A0) мы снова получаем квадратичное уравнение относительно «2(s), т. е. находим два показателя преломления и два главных колебания D' и D", соответствующих каждому заданному направлению распространении s. Из G) мы видим, что о'пкыщпия Dx : DTJ : D, комплексны, так что в общем случае главные колебания поляри- зованы теперь не линейно, а по эллипсу. Еще одно отличие состоит в том, что векторы электрического смещения больше пе перпендикулярны к волновой нормали s. Действительно, из первого уравнения B) при скалярном умноже- нии на s получим уравнение и правая его часть в общем случае не равна нулю. Однако если отношения 4nah/(j>ih малы по сравнению с единицей, составляющая вектора D в направ- лении s мала по сравнению с самим вектором D. Дальнейший анализ значительно упрощается, если поглощение считается малым, т. е. если металлы исключаются, а рассматриваются лишь среды, кото- рые до известной степени прозрачны. Этим случаем мы и ограничимся Фор- мально слабое поглощение означает, что можно пренебречь членами второго порядка относительно показателя затухания /с по сравнению с единицей. По- этому, используя (9), можно записать Аналогичные выражения можно написать для каждого из индексов х, у и г, .например, пх = пх(\ + 1кх), vx = c/nx — vx(\ — i/cx) и т. д. Кроме того, № = «1 - п\ A -f 2т,) = м»*A+ 2йе*), A3)
§ 14.6] ПОГЛОЩАЮЩИЕ КРИСТАЛЛЫ 65S где k = х, у, г. Сравнение с E) даег Возвратимся к уравнению Френеля A0) и отделим его вещественную часть от мнимой. Один из членов A0) имеет вид / 4^ A5) отсюда следует, что вещественная часть A0) представляет собой уравнение Френеля в старой форме A4.2.24). Для мнимой части находим A 4 ? \_ KxvM ) +) +)i ~+ При любом заданном направлении волновой нормали s в общем случае урав- нение Френеля дает, как и раньше, дна значения (разовой скорости vp. Часть энергии, переносимой двумя волнами, в этом случае поглощается, и уравнение A6) дает приближенные значения для двух показателей затухания. Выражение для «'можно записать в другом виде. Используя D), G), (9) и A3), найдем Sk V%—V{, Ч Vp — Vk [ l+2i Здесь также оставлены лишь члены первого порядка относительно показателя затухания. Теперь мнимый член в A7) содержит разность величин к и во мно- гих случаях оказывается пренебрежимо малым. Это означает, что мы пренебре- гаем эллиптичностью колебаний. В таком приближении направления двух векторов D, принадлежащих любой данной волновой нормали s, совпадают с их направлениями для непоглощакхдего кристалла, который обладает та- кими же (вещественными) главными диэлектрическими проницаемостями. Тогда имеем и A6) можно переписать в виде Очевидно, что эта формула может стать неверной, если vp приблизится к одной из главных скоростей vh, так как мнимая часть в A7), которой мы пренебрегли, содержит в знаменателе разность у*— и| (см. конец п. 14.6.3). Поскольку коэффициенты к' и к", соответствующие данному направлению- волновой нормали s, в общем случае различны, две волны поглощаются по- разному. Оба коэффициента могут зависеть от частоты и меняться различным образом с частотой; поэтому, если на кристалл будет падать белый свет, то в общем случае кристалл окажется окрашенным и его цвет будет зависеть от направления колебаний в падающем свете. Это явление называется плеохро- измом; в случае одноосного кристалла обычно говорят о дихроизме; в случае двухосного кристалла •— о трихроизмг *). Для одноосного кристалла (вх=е/;=е0, 8г = ее; кроме того, kx = kv=*ko, кг = /св) все соотношения принимают более простую форму. Как и в случае *) Происхождение этих терминов связано с тем, что для одноосного кристалла имеются два характерных цвета, а для двухосного кристалла — три. Однако ряд авторов называет дихроичным веществом люб)ю среду, коэффициент поглощения которой зависит от состояния поляризации падающего света,
656 КРИСТАЛЛООПТИКА [ГЛ. 14 непоглощающих кристаллов, уравнение Френеля разбивается на два (см. п. 14.3.2), т. е. (v"pf =- vl cos2 sin2 B0) где, как и прежде, # -— угол, который волновая нормаль s образует с опти- ческой оськз. Первое уравнение при разделении вещественной и мнимой частей дает Ор = ов. к'р = ко, B1а) а из вторрго находим B16) здесь мы вновь пренебрегли членами, содержащими члены второго порядка относительно показателей затухания. Мы видим, что поглощение обыкновен- ной волны одинаково для всех направлений распространения. Для двухосного кристалла все соотношения оказываются значительно сложнее, и мы ограничимся специальными случаями, представляющими ин- терес. Как и в п. 14.3.3, вначале рассмотрим те направления распространения, для которых sx = 0. Тогда из уравнения Френеля A0) получаются уравнения, аналогичные A4.3.6), т. е. \ B2) Разделяя вещественную и мнимую части, мы получим две скорости и два показателя затухания, соответствующие направлению волновой нормали s@, s,,, sz), а именно (v'pY = v%, к'„=кх, B3а) (v"pY = v%sl + vlsl, Kp(uJ)s = K^|sJ+/Cjt;Jsl. B36) Аналогичные соотношения, конечно, выполняются и для направлений рас- пространения, перпендикулярных к осям у и г. В общем случае не существует вещественных значений sv и sz, для которых оба корня v'p и v"p одинаковы. Можно найти направления, для которых равны вещественные фазовые скорости v'p и v"p, но соответствующие показатели затухания (к' и к") в общем случае не одинаковы. В качестве второго случая мы рас- смотрим распространение света в направ- лениях, не очень сильно отличающихся от направления оптической оси волновых нор- малей. Для того чтобы можно было приме- нить A9), нужно определить направления D' и D". Это можно сделать, используя результат, установленный в п. 14.2.3, со- гласно которому две плоскости колебании (D', s) и (D", s) делят пополам углы между плоскостями (Nn, s) и (N2, s), где Ni и N2 — оси волновых нормалей. Пусть г|з— угол между плоскостью (Nb s) и плос- костью хг, в которой лежат обе оптические оси. Так как плоскость (N2, s) почти параллельна плоскости хг, из упомянутой выше теоремы следует, что угол между D' и плоскостью хг почти равен -ф/2 (рис. 14.29). Следовательно, проек- ция вектора D' на плоскость хг равна D' cos (ф/2). Чтобы получить составляю- щую вдоль оси х, мы должны найти проекцию этого отрезка на ось х. Так как направления s и Nt приблизительно совпадают, угол между отрезком D'cos (г|з/2) и осью х почти равен углу между оптической осью Nj и осью г и, следователь- 14.29. К теории поглощающих кристаллов.
14.6] ПОГЛОЩАЮЩИЕ КРИСТАЛЛЫ 657 но (рис. 14.30), D^ = Z)'cospcos(i|V2). Аналогичным образом определяются и другие составляющие. Итак, D;=D'cosicosp, ?>; = D'sin|-, D;= — U cos^-sinp. B4a) Вектор D" ортогонален к sh D'; его составляющие сразу же можно получить, заменяя в B4а) г|з/2 на 1|з/2-f-я/2, что дает D-x=-D' sin -| cos p, D; = D" cos |, D't = D" sin |. sin p. B46) Подставим два Последних выражения в A9) и используем приближение Vp — v"p — Vy (ya:>fj/>t|z)i которое вполне оправда- но, поскольку мы ограничиваемся направлениями, не слишком отличающимися от направления оптической оси. Таким образом, мы получаем для искомых пока- зателей затухания к' и к" соотношения k'vI = (kxvx cos2 р + Kzvl sin2 p) cos2 i + Kyv* sin21-, k"v\ = (Kxvl cos2 p + Kfil sin3 P) sin2 -i + k^cos2 -i . B5) ^ИСг 1^-ЭО- К теории ло- глощающих кристаллов. Учитывая приближение, в котором получена форму- ла A9), нельзя ожидать, что эти формулы останутся справедливыми, когда направление s будет мало отличаться от направления оптической оси. В пре- дельном случае, когда волновая нормаль направлена вдоль оптической оси, угол i|) становится неопределенным. Для получения в этом случае соответствую- щих показателей затухания возвратимся к уравнению Френеля. При любом направлении s в плоскости хг (s,, = 0) мы получим, как в уравнениях B3), приравнивая вещественные и мнимые части, \ B6) В частности, для оптической оси sx —= sin p, s^ = cosp, где р — >гол между каждой из оптических осей и осью г, определяемый A4.3.11). Кроме того, v'p — v"p = vv и правые части уравнений B6) примут вид (если мы еще напишем #хвместо к1 и кц вместо я") KL=-Ky, /с„и* = /сяи» cos» р + /c,w| sin» p. ¦ B7) Здесь Kj_ — показатель затухания для волны D, поляризованной в плоскости, перпендикулярной к плоскости оптических осей, акц — показатель затухания для волны D, поляризованной в плоскости осей. Таким образом, поглощение волны, распространяющейся в направлении оптической оси, зависит от на- правления ее колебаний. Удобно выразить к' и к" через показатели ки и «j_ и азимут поляризации i|), подставляя B7) в B5). Это дает к' = cos2 - + KLs&^- = f. «II—« : COSlj), B8) 14.6.2. Интерференционные картины, получающиеся с пластинками по- глощающих кристаллов. Теперь кратко рассмотрим интерференционные эф- фекты, возникающие с пластинками поглощающих кристаллов, вырезанными перпендикулярно к оптической оси волновых нормалей. Теория в этом случае
658 КРИСТАЛЛООПТИКА [ГЛ. \4- не очень сильно отличается от теории, относящейся к пластинкам из непогло- щающих кристаллов. Единственное важное различие заключается в том, что два интерферирующих луча поглощаются различным образом, в результате чего вндность полос уменьшается. Другие заключения (и, в частности, вы- ражение для разности фаз в нашем приближении) остаются неизменными, так как геометрические законы распространения не изменяются. Согласно A3.1.19) амплитуда плоской волны, распространившейся в погло- щающей среде на расстояние /, уменьшается в схр {—шпк1/с} раз. Следова- тельно, для такого же случая, как в п. 14.4.3 и при тех же обозначениях (см. рис. 14.20) амплитуды главных колебаний при выходе из пластинки опреде- ляются выражениями (см. A4.4.13)) ОВ = Еexp (—(<ok'/v'I) cos ср, ОС = Е ехр (—(аж"ЛО0 sin q>. B9) Здесь / = ft/cos 62, где h — толщина пластинки и 62 — угол, который волновая нормаль в пластинке образует с осью волновых нормалей. Предполагается, что два пути в пластинке одинаковы для обеих волн. Это приблизительно верно, если мы ограничимся направлениями волновых нормалей, близки- ми к оптической оси. В том же приближении мы можем положить в B9) v' — tf = vy. Удобно положить и = al/Vy » Ы/v' « a>l/v". C0) Тогда получим OS = ?exp(—-K'«)coscp, ОС = Е ехр (—к"и) sin ф. C1) Для амплитуд волн, прошедших поляризатор и анализатор, находим вместо A4.4.14) (см. рис. 14.20) следующие выражения: OF = ?exp(—к'ы) cos ф cos (ф—%), 1 ОО = ?ехр(—к"и) sirup sin(tp—у). ) Полная интенсивность света, получающаяся в результате интерференции, равна /=/, + /a4-2K7I7Icos6, C3) где, с точностью до несущественных коэффициентов пропорциональности, /, = {OFI, U = @GJ, а разность фаз б рассчитывается, как и раньше. Ниже мы рассмотрим некоторые случаи, представляющие особый интерес. а. Одноосные кристаллы. В этом случае мы имеем vx = vy = v0, vz = ve, кх = ку = ко, Kz = Ke. C4) Направление колебаний в необыкновенном луче лежит в главной пло- скости, т. е. в плоскости, в которой лежат волновая нормаль и оптическая ось. Поэтому мы можем отождествить угол между вектором D для необыкновенной волны и направлением поляризатора ОР с углом ф в уравнении C2). Однако, для того чтобы сохранилось согласие с B1а) и B16), необходимо поменять мес- тами к' и к". При скрещенных призмах Николя (х — я/2) получим из C2) OF — ?ехр(—к'и) cos ф sin ср, OG ——?ехр(—K"u)sm(pcosq>, C5} а C3) дает / ='/„ ?2 sin2 2ф {ехр (—2/с'«)+ехр(—2«"«)—2ехр [~(к' + к")и] cos б}. C6а> Для оптической оси к' = к", 6 = 0, и C6а) принимает вид /,, = 0. C6б> Следовательно, центр картины (точка, соответствующая оптической оси) ока- зывается темным. Поле зрения пересекается темной изогирой, определяемой соотношением sin 2ф = 0, т. е. соотношениями ф = 0 и ф = я/2. Таким образом, изогира имеет форму креста, образующие которого параллельны направле- ниям поляризатора и анализатора (см. п, 14.4.4)» Минимум и максимум
§ 14.6] ПОГЛОЩАЮЩИЕ КРИСТАЛЛЫ 659 интенсивности равны • 'мм = 4~ sin 2Ф {ехр (—2к'и) + ехр (—2к"и) — 2 ехр [—(к' + к") и]}, } L ' ( .C7) /»а„с = "Т" sin 2ф {ехр (—2к'«) + ехр (—2/с"м) + 2 ехр [ - (к' + к") и]}, J и, значит, для видности полос V можем написать — /мин _ 2ехр[ —(к'+/с")ы] _ I ал, ехр(-2к'ы)-ехр(-2к"ы) сЬ{(к'-к")"} Таким образом, видность тем больше, чем меньше разность между к' и к". Так как для направлений волновых нормалей, близких к направлению оптической оси (угол ¦()¦ мал), к' и к" почти равны, то в этой области полосы должны быть ясно видны при условии, что наша пластинка пропускает достаточное коли- чество света. Если к0 мал по сравнению ке (например, для цианида магния — платины), то вблизи оптической оси будет относительно слабое поглощение и центральные полосы окажутся яркими. Если к„ велик по сравнению с ке (i^ пример, для турмалина), то поглощение вблизи оптической оси будет относи- тельно наибольшим и центральные полосы окажутся темными. В обоих слу- чаях видность полос уменьшается от центра к краю поля. Если /с„ и кп почти равны, то интерференционная картина будет подобна картине для непогло- щающего кристалла, но с увеличением рас- стояния от центра видность полос будет умень- шаться. б. Двухосные кристаллы. Мы вновь огра- ничимся случаем скрещенных николей (х = л/2) и предположим, что грани пластинки перпен- дикулярны к одной из оптических осей (ATi). Мы рассмотрим лишь волны, направления распространения которых близки к этой оси. Пусть Nlt N2 и Q — точки пересечения двух оптических осей и волновой нормали с выходной гранью пластинки соответственно. Пусть далеетр—угол между линией N,Q И про- Рис. 14.31. К теории интерференции должением линии М.,МЪ а а — угол между в пластинках поглощающих двухос- плоскостью оптических осей и плоскостью ' иых кРисталлов- колебаний, пропускаемых поляризатором Р. Если N,Q<<:N,N2, то угол, который направление колебаний D' образует с yVijV2, приблизительно равен г|)/2. гак что угол ф между D' и направ т?нием NtP приблизительно равен (рис. 14.31) Ф = а—г|з/2 C9) Тогда для амплитуд C2) интерферирующих волн имеем 0F = ? cos (а—|) sin (а—|А ехр (— к'и), ) 00 = —?sin (а —|-) cos (о—|)ехр(—/с'и). ) Следовательно, интенсивность запишется в виде / = ^ sin2 Bа—ф) {ехр(—2/с'и) + ехр(—2к"и)—2 ехр[—(к'+к") w]cos6}. D1a) Для волны, распространяющейся в направлении оптической оси, угол г|з не- определен. В этом специальном случае мы разложим колебания на составляю- щие, параллельные и перпендикулярные к плоскости, содержащей оптические оси, т. е. положим г|7 = 0 и напишем /с„ и /с± вместо к' и к" в D1а) (см. B8)),
660 КРИСТАЛЛООПТИКА [ГЛ.14 Поскольку, кроме того, 6 = 0, вместо D1а) мы получим Е2 /0 = -j- slna 2а {ехр (-~кп и)—ехр (—кхи)\*. D16) Из уравнения D1а) следует, что интенсивность равна нулю вдоль линии, для которой sin Bа—i|j) =0, т. е. эта линия служит главной изогирой. В слу- чае непоглощающего кристалла главная изогира проходила через точку, со- ответствующую оптической оси; теперь это не так, если только, как мы видим из D16), не выполняется равенство а = 0 или а = я/2, т. е. если плоскость поляризатора не параллельна или перпендикулярна плоскости, содержащей обе, оптические оси. Темные изохроматы, определяемыми уравнением cos6 = l, т.е. значе- ниями б — 0, ±2я, ±4я, ..., имеют вид колец, охватывающих точку, которая соответствует оптической оси. Видность полос, снова определяемая выраже- нием C8), отлична от нуля лишь при почти равных к' и к". Согласно B8) для этого нужно, чтобы угол i|) мало отличался от л/2 или —я/2. Посмотрим теперь, как меняется интенсивность в зависимости от i|> при фиксированном б. Если воспользоваться соотношением B8), то уравнение D1а) можно переписать в виде / = -^-ехр [—(К||+к±.)»] sin2 Ba—if) {eh [(«i| — Kj.) « costp] — cosS}. -D2) Член в фигурных скобках достигает наибольшего значения при максимальной величине |cosi|)| и наименьшего при минимальной величине |cosiji|. Следова- тельно, интенсивность максимальна, когда ф = 0 и i|; = я, и минимальна, когда 1|> = л;/2 и —я/2. Таким образом, поле зрения пересекается, помимо темной изогиры \|з = 2сс, еще и темными полосами, перпендикулярными к плоскости, содержащей оптические оси *). 14.6.3. Дихроичные поляризаторы. В предыдущем разделе мы изучали распространение поляризованного света через пластинку поглощающего кри- сталла. Здесь мы рассмотрим ее влияние на естественный свет. Мы снова предположим, что грани пластинки перпендикулярны оптической оси волновых нормалей (или одной такой оси, если кристалл двухосный), и будем рассматривать распространение света в направлении, близком к на- правлению оптической оси. Параллельный пучок естественного света можно считать состоящим из двух взаимно пекогерентных пучков с равными ампли- тудами, поляризованных в любых двух взаимно ортогональных направлениях, перпендикулярных к направлению распространения (см. A0.8.56)). В качестве Направлений колебаний в этих двух составляющих пучках выберем направ- ления главных колебаний в кристалле. Если Е — амплитуда колебаний в каж- дом из таких пучков на входе пластинки, то их амплитуды после прохождения в пластинке расстояния / будут равны ?" = ?ехр(— к'и), Е" = Еехр(—к"и), D3) где, как и раньше, «= v>llvy, причем считается, что свет квазимонохроматичен и средняя частота его а. Тогда для полной интенсивности получим / = /' + /", D4) где /' = /„ехр(—2к'и), /" = /„ехр (—2к"м), D5) и /0 = -Б2. Для направления, совпадающего с оптической осью, к' и к" необ- ходимо заменить на к и и к±. *) Из уравнения D4), которое с помощью B8) можно переписать в виде /=2?2ехр [ — (кц +kj_) и] ch {(к\\ —к±)и cos 1|>}, следует, что эти темные полосы появляются также в отсутствие поляризатора и анализатора при 11рохождиши через пластинку естественного света.
§ 14.6] ПОГЛОЩАЮЩИЕ КРИСТАЛЛЫ 661 Мы видим, что после прохождения света в среде на расстояние / отноше- ние амплитуд составляющих равно ехр {— (к' — к") и} и, следовательно, свет станет частично поляризованным. Если два показателя поглощения такого вещества различаются очень сильно, то относительно тонкой пластинки его уже достаточно для преобразования 4 3 п 1 .— --. - 1—.. — de \ \ f / \ \ \ dn МО 5000 Б000 7О00Я.А Рис. 14.32. Дихроизм пластинки из чер- ного турмалина толщиной около 0,2 мм, вырезанной под углом 24° к оптической оси, для света, падающего перпендику- лярно к оптической оси \38]. d=4x (lg е) (пЫ/К) к 5,5лЫД 4000 5000 6000 ТОООЯ,А Рис. 14.33. Дихроизм иода в ори- ентированном поливиниловом спир- те [381. Голубой образец — сплошная кривая, коричневый — пунктирная. d=4K (lg e) (nkl/X) » 5,5 nkl/X, падающего неполяризовашюго пучка в почти лийейно поляризованный пу- чок, т. е. такая пластинка действует как поляризатор. Примером природно- го кристалла, являющегося поляризатором такого типа, служит турмалин, в котором обыкновенный луч поглощается значительно сильнее необыкно- венного. Однако для большинства длин волн турмалин сильно поглощает и необыкновенный луч (рис. 14.32), так что этот кристалл не очень подхо- дит для практических применений. В результате исследований главным об- разом Лэнда и его сотрудников (приблизительно 1932 г.) появилась возмож- ность изготовлять синтетические дихроичные материалы, служащие прекрас- ными поляризаторами. Эти материалы, известные в обиходе как поляроиды, не являются монокристаллами, а представляют собой пластинки органических полимеров с молекулами в виде длинных цепочек, почти полностью выстроив- шихся параллельно друг другу в результате растяжения или какой-либо другой обработки *). Такие пластинки иногда имеют окраску. Полимером, наиболее подходящим для этой цели, является синтетический поливиниловый спирт (—СНг — СНОН—)х. На рис. 14.33 показана зависимость дихроизма иода в ориентированном поливиниловом спирте от длины волны. Отношение коэффициентов поглощения хорошего дихроичного поляриза- тора может достигать 100 : 1. Он может пропускать около 80% свега, поля- i ризованного в одном направлении, и менее 1% света, поляризованного в на- ' правлении, перпендикулярном первому. Можно получать большие листы таких поляризующих материалов; существуют промышленные машины, вырабаты- вающие непрерывную ленту шириной около 75 см. В этом отношении такие поляроидные пленки превосходят призму Пиколя, так как большие куски исландского шпата хорошего оптического качества встречаются очень редко. Наконец, напомним, что в основной части настоящей главы мы предпола- гали, что можно пренебречь эллиптичностью главных световых колебаний *) Более полное обсуждение дихроичиых поляризаторов проводится в [381 или а [391,
662 кристаллооптика [гл. 14 в кристалле. Это предположение, конечно, не всегда справедливо. Можно по- казать, например, что в каждом поглощающем кристалле существуют четыре направления, расположенных попарно вблизи оптических осей, в которых поляризация оказывается круговой. Однако чем слабее поглощение, тем мень- ше области заметной эллиптичности вокруг этих специальных направлений, а сами они стремятся совпасть с оптической осью. Таким образом, и в данном случае сохраняются основные характеристики наблюдаемого явления, и по- этому нет необходимости проводить более детальное рассмотрение. Конечно, наш анализ не затрагивает некоторых тонких аспектов оптической теории поглощающих кристаллов. Для их изучения необходимо обратиться к спе- циальной литературе (см., например, 17], стр. 861—904). ЛИТЕРАТУРА 1. Th. L i e b i s с h, H. R u b e n s, Sitzber. preuss. Akad. Wiss. 198, 876 A919). 2. H. Rubens, Sitzber. prcuss. Akad. Wiss., Phys-malh. Kl., 198, 976 A919). 3. M. Born, Optik, Springer, Berlin, 1933. (M. Бори, Оптика, ГНТИУ, 1937.) 4. R. С о u r a n t, Differential and Integral Calculus, Blackie a. Son, 1942, Vol. П. (Р. Ку- рант, Курс дифференциального и интегрального исчисления, ГТТИ, 1933, ч. П.) 5. С. W. Bun n, Chemical Crystallography, Clarendon Press, Oxford, 1945, Ch. 2. 6. E. T. Whittakcr, History of the Theories of Aether and Electricity, Vol. I: The Classical Theories, T. Nelson, London, 1951. 7. G. S z i v e s s у, в сб. «Handbuch d. Physib, Springer, Berlin, 1928, vol. 20, p. 715. 8. M. G. L a m c, Lecons sur la theorie mathematique de I'elasticite des corps solides, Gau- thier-Villars, Paris, 2me ed., 1866. 9. V. V о 1 I e r r a, Acta Math. 16, 153 A892). 10. D. M Y. So m mcrvillc, Analytical Conies, Bell a. Sons, London, 1941, p. 92. 11. G. Salmon, Analytical Geometry of Three Dimensions, Rev. by. R. A. P. Rogers, Longmans, Green a. Co., London, 1915, 5th ed. Vol. II, ch. IV. 12. .1. С. Р о g g e n d о г f i, Pogg. Ann. 48, 461 A839). 13. W. H a i d i n g e r, Wiener Ber. 16, 129 A854); Pogg. Ann. 96, 486 A855). 14. W. Voigt, Phys. Z. (i, 672, 818 A905). 15. W. N i с о 1, Edinburgh New Philos. J. 6, 83 A829). - 16. L. С Martin, An Introduction to Applied Optics, Pitman, London, 1930, Vol. 1, p. 204. 17. R W. Woo d, Physical Optics, Macmillan, N. Y., 3rd ed., 1934. (P. В у д, Физическая оптика, ОНТИ, 1936). 18. Н. G. J e r r a r d, J. Opt. Soc. Amer. 38, 35 A948). 19. M. R i с h а г t z, 11 s i e n-Y ii II s 0, J. Opt. Soc. Amer. 39, 136 A949). 20. G. Airy, Trans. Cambr. Phil. Soc 4, 313 A833). 21. J. В a b i n e t, С H. Acad. Sci. 29, 514 A849); J. J a m i n, Ann. Chim. 29, 274 A850) 22. H. S о 1 e i 1, С R. Acad. Sci. 21, 426 A845); 24, 973 A847); 26, 162 A848); J.Duboscq, H. S о 1 e i 1, C. R. Acad. Sci. 31, 248 A850). 23. M. В е г е k, Zbl. Miner. Geol Palaont. 388, 427, 464, 580 A913). 24. F. S a v a r t, Ann. d. Physik 49, 292 A840). 25. D. Brewster, Phil. Trans. 60 A815); 156 A816); Trans. Roy. Soc, Edinb. 8, 369A818). 26. F. Pockels, Ann. d. Physik 37, 158 A889). 27. F. P о с k с 1 s, Lchrbuch der Kristalloptik, Leipzig, 1906, p. 469—74. 28. G. Szivessy, в сб. cHandbuch d. Physik», Springer, Berlin, 1929, Vol. 21. p. 840. 29. E. G. Coker, L. N. F i 1 о n, A Treatise on Photoelasticity, Cambr. Univ. Press, 1931 30. M. M. Frocht, Photoelaslicity, Vol. I, 1941, Vol. II," 1948, John Wiley, N. Y. (M. M. Ф р о x т, Фотоупругость, Гостехиздат, т. 1, 1948, т. 2, 1950.) 31. О. Wiener, Abh. Sachs. Ges. Akad. Wiss , Math-Phjs. KL, № 6, 32, 575 A912). 32. W. L. В r a g g, А. В Р i p p a r d, Acta Crjst. 6, 865 A953). 33 R а у 1 e i g h, Phil. Mag. 34, 481 A892). 34. M. F W i 1 k i n s, A. S t о k e s, W. S e e d s, G. О s t e r, Nature 166, 127 A950). 35. P. Boeder, Z. f. Phys. 75, 258 A932). 36. J. T. E d s a 1 1, о сб. «Advances in Colloidal Science», <ed. E. О. К г a e m e r, Intersci Publ. Inc., N. Y., 1942, Vol. I, p. 269. 37. J. С Ma x we 1 1, Proc. Roy. Soc. 22, 46 A873); Collected Papers, Cambr. Univ. Press, 1890, Vol. 2, p. 379. 38. E. H. L a n d, С D. W e s t, в сб. Colloid Chemistry», ed. J. Alexander, Reinhold Publ Corp., N. Y., 1946, Vol. 6, p. 167. 39. E. L a n d, J. Opt. Soc. Amer. 41, 957 A951). 40*. B. M. A r p а н о в и ч, В. Л. Г н н з б у р г, Кристаллооптика с учетом простр-аист- веииой дисперсии и теория эжеитоиов, «Наука», 1965.
ПРИЛОЖЕНИЯ ПРИЛОЖЕНИЕ I ЭЛЕМЕНТЫ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ Общая черта уравнений классической физики состоит в том, что все они могут быть выведены из вариационных принципов. Принцип Ферма в оптике A657 г.) и принцип Мопсртюи в механике A744 г.) служат примерами наиболее ранних вариационных принципов. Из соответствующих вариационных прин- ципов можно также получить уравнения упругости, гидродинамики и электро- динамики. Однако при рассмотрении уравнений полей, содержащих, как правило, четыре или большее число независимых переменных к, у, г, t ..., практически невозможно воспользоваться тем, что решение является стационарным значе- нием некоторых интегралов, так как само решение дифференциальных урав- нений в частных производных представляет большие трудности. В этих случаях использование вариационного принципа дает преимущество лишь при выводе законов сохранения, в частности закона сохранения энергии. Другое дело, если решаются задачи с одной независимой переменной (время в механике или длина луча в геометрической оптике). В этом случае имеют дело с обыкно- венными дифференциальными уравнениями, и оказывается, что применение вариационного принципа существенно упрощает исследование решения задачи. Фактически такой подход является непосредственным обобщением обычной геометрической оптики. В своем современном виде он разработан главным об- разом Д. Гильбертом, и рассуждения, изложенные выше, базируются на ма- териалах его неопубликованных лекций, прочитанных в Геттингене примерно в 1903 г. Здесь приводится теория лишь для трехмерного пространства (х, у, г), однако ее легко обобщить на многомерный случай. 1. Уравнения Эйлера как необходимое условие экстремума. Пусть F(u, v, х, у, г) — заданная функция с непрерывными частными производными до второго порядка включительно по всем пяти переменным. Пусть далее С — произвольная кривая х~х(г), y — y(z) в пространстве я, г/, г. Будем считать, что производные от х и у также непрерывны до второго порядка включительно. Если положить и = х', v — y' (штрих обозначает дифференцирование по г), то интеграл Г* r = \F(x', у', х, у, z)dz A) г, будет функцией x(z), у (г); другими словами, интеграл A) представляет собой функционал. Основная задача вариационного исчисления состоит в следующем. Найти такой участок кривой С между двумя заданными точками Pi[xi=x{zi), yi = y{zt), zj и Рг1хц — х(га), У2 = у(г2), г2], чтобы интеграл A) имел экстремальное значение (минимальное или максимальное). Необходимые условия, которым должна удовлетворять такая кривая С, называемая экстремалью, выводятся с помощью простого линейного варьиро- вания. Выберем для этого функцию | (г) с непрерывной первой производной, которая обращается в нуль в конечных точках, т. е, Цг^^Цг^^О, B)
664 ПРИЛОЖЕНИЯ и проведем новую кривую С, заменив координату х экстремали величиной" + e|, где е— малый параметр. Тогда уравнение A) станет функцией е, т. е. /(e)=$F(x' + er. V', x + sl. У, z)dz. C> Величина ИЭ! (??) D> называется первой вариацией по х. Обращение в нуль первой вариации, т. е. справедливость соотношения F/), = 0 E) является, очевидно, необходимым условием экстремума. Проинтегрировав первый член в D) по частям и воспользовавшись гра- ничными условиями B), получим (|) Fа> где Fx обозначает dFldx и т. д. Заменяя теперь у на у + ет|, аналогичным об- разом получим J() F6) Поскольку % и 11 можно выбирать произвольно в интервале 2L^z^.zit то из Fа) и F6)" вытекает, что условия F7) гс = 0 и F/)v = 0 эквивалентны следующим двум дифференциальным уравнениям, называемым уравнениями Эйлера ^-S^ = °« <7а> F*-%Fr = 0- Соотношения Gа) и G6) представляют собой дифференциальные уравнения второго порядка относительно х(г) и у(г). Оставим члены, содержащие про- изводные наивысшего порядка, а именно: (8a) (86) Эти уравнения можно разрешить относительно х" и у", если соответствующий определитель не равен нулю, т. е. F.aFm-FlB^0. (9) Предположим, что это условие выполняется во всей рассматриваемой нами нятимерпой области. Решение дв>х дифференциальных уравнений второго порядка содержит четыре произвольные постоянные; следовательно, экстремали образуют четы- рехпараметрическос семейство кривых (оо4 экстремалей). 2. Интеграл Гильберта и уравнение Гамильтона — Якоби. Чтобы иссле- довать свойства экстремалей, удобно рассмотреть сначала другую, по связан- ную с этим исследованием задачу. Будем считать, что переменные и и v зависят от х, у, г, т. е. и = и(х, у, г), v = v(x, у, г). A0> Тогда F[u(x, у, z), v(x, у, г), х, у, г] и ее частные производные Fu, Fv зависят только от х, у, г. Далее выберем кривую С[х = х(г), у = у(г)\ и образуем
ПРИЛОЖЕНИЕ 1 665 интеграл S=[{F-+-{x'-u)Ftt + (y' — v)F.},dz. A1) Задача состоит в следующем: найти такие функции и, v, для которых интег- рал S не зависит от формы кривой С, а определяется лишь положением конце- вых точек Рг и Яг, где Pt имеет координаты ху = x(zi), yt = у(гг) и г:; Р2 — ко- ординаты Хя = х(гг), у% = у(г2), га. Величина 5 называется интегралом Гиль- берта. Для определения и и а перепишем A1) в виде \ A2) Рг где и = Р„ V = FV, W~F-uF.-vFr A3) Хорошо известно, что необходимым и достаточным условием того, чтобы A2) не зависел от формы кривой интегрирования С, служит обращение в нуль компонент ротора от вектора А, с проекциями U, V, W, т. е. dW dV п ои cw n sv 9U _n Мы получили систему из трех дифференциальных уравнений в частных производных относительно а (х, у, г) п v(x, у, г); эти уравнения, однако, не вполне независимы, поскольку для любых U, V, W справедливо тождество (div rot A = 0 для любого вектора А) д (OV JV\ ,d(?U dW\ д Если уравнения A4) удовлетворяются, то Udx+ Vdy + Wdz является полным дифференциалом, т. е. dS Ud + VdWd A6) и S зависит только от Р, (хи уи zt) и Р2 (х2, у2, z2). Написав для простоты х, у, г вместо х2, j/2, Zj, получим П-— V~— W=— П7> Возьмем теперь произвольную поверхность Т(х, у, г) =0 и в каждой ее точке Pi проведем нормальный к ней вектор (U, V, W). Тогца. согласно A6), dS = 0, и, следовательно, величина S{x,y,z)*=S1 A8) постоянна на этой поверхности. Из двух (совместных) уравнений A3) можно определить и и v как функции координат поверхности; имеем u = u(U, V, х, у, г), v=-v(U, V, х, у, г). A9) Если теперь решить дифференциальные уравнения A4) с такими граничными условиями, то мы получим частное решение рассматриваемой задачи, а именно решение, принимающее постоянное значение S] на ныбранной поверхности Т(х, у, z) — 0. Его можно получить из одного дифференциального уравнения в частных производных относительно функции S. Подставляя A9) в оставшееся уравнение A3), находим W^W(U, V, х, у, г), B0) или, используя A7), dS ,v, I AS I AS as r = F r, 3-, X,y,
666 ПРИЛОЖЕНИЯ Это уравнение называется уравнением Гамильтона — Якоби данной задачи. Функция S(x, у, г), принимающая постоянное значение на поверхности Т(х, у, г) — 0 и удовлетворяющая уравнению B1), служит решением рассмат- риваемой задачи. Функции и, v, обусловливающие независимость интеграла от пути интегрирования, находят из решения любых двух из (совместных) урав- нений F —— F —— F—uF —vF —— B2) полученных комбинированием A3) и A7). 3. Поле экстремалей. Установим теперь связь между двумя задачами, рассмотренными в пп. 1 и 2. Она состоит в следующем. Если и (х, у, г) и v(x, у, г) — функции, делающие интеграл Гильберта S, определенный в A1), не зависящим от пути, то решением дифференциальных уравнений х' = и(х,у,г), у' = о(х,у.г) B3) служит двухпараметрическое семейство (оог) экстремалей, «ортогональных» поверхности S(x, у, г) — S,. Под «ортогональностью» мы здесь подразумеваем выполнение условия ^O, B4) из которого следует, что вектор (U, V, W), опре- деленный в A3) через и и v, перпендикулярен к любому элементу dx, dy, dz поверхности. Рассмотрим область в пространстве х, у, г и по- ставим в соответствие каждой точке области вектор (и, v), непрерывный и имеющий непрерывные част- _ „ , й ные производные первого порядка. Система таких волновых°фроет™ Туче™" векторов, определенных в заданной области про- гсомстрической оптике. странства, называется полем. Здесь мы будем гово- вариационныя интеграл (и ра- рить о поле экстремалей, величины же и(х, у, г) и "СН "М™Я*«°МУ знанию для ( г) на е функциями НпКЛОНО ПОЛЯ, всех экстремален PtP2, Р Р ч Д ги у ~ ортогональных к поверхностям Справедлива также теорема, обратная приве- si H s" денной выше. Если поле оо3 экстремалей ортогональ- но поверхности Т(х, у, г) =^0 и и, v — его функции наклона, определенные в B3), то интеграл Гильберта S A1) не зависит от. пути интегр ирован ия. Прежде чем доказывать эти теоремы, отметим следующее следствие из них. Пусть кривая С в A1) является одной из экстремалей поля; тогда интеграл Гильберта A1) сводится к вариационному интегралу / *= ] F dz. Следовательно, zt значения этого интеграла, взятого между парами «соответствующих» точек на поверхностях 5 (х, у, г) =5, и 5 (х, у, г) = S2 (т. с. между точками, располо- женными па одной экстремали, ортогональной S, и S3), одинаковы для всех таких пар точек (рис. 1). Поверхности 5 (х, у, г) ¦—- const, и семейство оо3 экстре- малей можно рассматривать как обобщения волновых фронтов и лучей в гео- метрической оптике. Для доказательства первой теоремы рассмотрим фиксированную кривую С, которая удовлетворяет соотношению B3) и ортогональна поверхности S (х, у, г) — Si, а затем применим к ней линейную вариацию, т. е. заменим х на х + а| и у на г/ + 6г|, гдеа и b — малые параметры, а Ъ, и т| — произвольные, но фиксированные дифференцируемые функции г, обращающиеся в нуль при
ПРИЛОЖЕНИЕ 1 667 z — Zi и z = г2. По условию теоремы S не зависит от пути интегрирования, т. е. (?) =о, (§) =0, B5) где индекс 0 обозначает, что после дифференцирования мы положили а = Ъ = 0. Дифференцирование f[u(x, (/, г), v(x, у, г), х, у, г] дает ^ 1. . B6) Из A1) с помощью B6) получим (?»#e^ -°)^},<fe. B7) Члены, содержащие (х' — и) и (у'— и), обращаются в нуль, поскольку предпо- лагается, что кривая удовлетворяет соотношению B3). Кроме того, часть чле- нов сокращается, и мы находим )a = ](Fxl + F?')dz, B8) или, интегрируя по частям, аналогично можем написать ?)?D О ¦ <28б> Правые части уравнений B8а) и B86) являются первыми вариациями /(см. Fа) и F6)), и согласно B5) они обращаются в нуль. Следовательно, кри- вая С удовлетворяет уравнениям Эйлера, т. е. она является экстремалью, и паша теорема доказана. Для доказательства обратной теоремы построим поле ft oo2 экстремалей, ортогональных данной поверхности Т(х, у, г) = 0 и сравним его с другим полем /» ооа экстремалей. Последнее поле строится следующим образом. Решаем урав- нение Гамильтона — Якоби B1) с граничным условием, состоящим в том, что S (х, у, г) должна быть постоянной величиной на поверхности Т(х, у, г) =0. Если и и у определены соотношениями B2), то решение выражается интегралом A1). Тогда в соответствии с только что доказанной теоремой уравнения B3) определяют поле экстремалей /2, ортогональных поверхности Т = 0. Однако поля fi и f2 должны совпадать, поскольку они удовлетворяют одним и тем же дифференциальным уравнениям и одним и тем же граничным условиям па поверхности Т — 0. Следовательно, для данного поля Д величина интеграла S не зависит от пути интегрирования. 4. Нахождение всех экстремалей из решения уравнения Гамильтона — Яко- би. До сих пор мы рассматривали только однопараметрическое (оо1) семейство решений S (х, у, z) = const уравнения Гамильтона — Якоби, которое соот- ветствует двухпараметрическому (ж2) семейству ортогональных экстремалей. Для получения полного четырехпарамстрического (оо4) семейства экстрема- лей необходимо рассматривать четырехпараметрическое (оо4) семейство реше- ний S; последнее можно получить, если поворачивать поверхность Т -- 0 во- круг какой-нибудь точки и полагать в каждом случае S(x, у, г) =Si. Пред- положим, что мы нашли «полное» решение S(x, у, г, a, f>) уравнения B1), содержащее два параметра а и р. Функцию 5, соответствующую любой паре
668 ПРИЛОЖЕНИЯ значений аир, можно представить в виде интеграла A1), не зависящего от пути интегрирования при правильном выборе функций и и V, а именно при и~и(х, у, г, а, р) и v^--v(x, у, г, а, Р). Следовательно, не только S, 1ю и dS/da и dS/dfi не зависят от пути интегрирования. Поскольку F — = F[u(x, у, z, a, fi),v(x, у, г, а. Р), х, у, г], мы вправе написать Ц = ^Л + ^Л. B9) и из A1) получим ' ч C0> где dF,, dFv да Аналогичные выражения справедливы и для других двух производных. Так как величины интегралов C0) не зависят от пути интегрирования, вы- ражения d^^ d^ v)^ C2) C3) являются полными дифференциалами; таким образом, величины 5, и 5р — функции только концевых точек Рг и Рг, т. е. существуют поверхности, скажем dS (х, у, г, a, ft) _ . dS{x,y, г, a, ft) _ „ да * с*6 ' определяемые постоянными значениями Sa и Sf здесь Л и В — постоянные. Следовательно, соотношения C3) должны быть решениями дифференциальных уравнений х' = и(х, у, г, a, f>), у' =v(x, у, г, а, Р). C4> Отсюда следует, что на поверхностях C3) dSa = 0, dS? — 0, и тогда из C2) вытекает C4), если соответствующий определитель не равен нулю. (Согласно C1) этот определитель можно записать в виде да dF,. F. F.,, C5) Первый множитель в правой части равен выражению (9), которое, по пред- положению, отлично от нуля. Второй множитель обращается в нуль только в тех точках, где уравнения C4) не имеют решения для а и f>, другими слова- ми,— в точках, где экстремали пересекаются. Если исключить такие случаи, то выражения C4) будут представлять собой двухпараметрические (оо2) систе- мы дифференциальных уравнений, каждое из которых имеет оо2 решений; полная совокупность решений должна совпадать с полным четырехпарамет- рическим (оо4) семейством экстремалей. Мы Доказали, что решения уравнений <33) х=-.х{г,а, р, А, В), у = у(г, а, р\ А, В) C6) образуют полное четырехпараметрическое (оо4) семейство экстремалей; сле- довательно, для получения полной системы оо4 экстремалей из полного реше- ния уравнения Гамильтона — Якоби S (.*, у, г, а, р) необходимо только, со- гласно C3) и C6), продифференцировать его и привести подобные члены,
ПРИЛОЖЕНИЕ 1 669 5. Канонические уравнения Гамильтона. Каждое из уравнений Эйлера G) является дифференциальным уравнением второго порядка. Иногда оказы- вается удобным заменить их четырьмя дифференциальными уравнениями пер- вого порядка. Такую замену можно провести многими способами. Наиболее симметричный способ дает так называемые канонические уравнения Гамиль- тона, которые выводятся следующим образом. Соотношения A3) рассматриваются как преобразования Лежандра (см. стр. 139), заменяющие переменные и, v на U, V (сохраняя х, у, г) и функцию F(u, v, х, у, г) на W(U, V, х, у, г). Последнее уравнение A3) можно предста- вить в виде W=F—uU— vV, C7) тогда dW=dF — udU —vdV — U du —Vdv. Далее Следовательно,- dW = Поскольку W нужно считать функцией U, V, x, у, г, то Wa = -u, Wv = ~v, Wx=*Fxl> Wy^Fy, -W, = Ft. C8) Если рассматривать теперь кривую x — x(z), y = y(z), которая удовлетворяет уравнениям x'=u{x,y,z), y' = v(x,y,z), ' C9) то.эти уравнения совместно с уравнениями Эйлера G) можно записать в виде x' = -Wu. y' = -Wv, U' = WX, V'=Wy, D0) Соотношения D0) представляют' собой четыре дифференциальных уравнения первого порядка относительно х, у, U, V как функций г и называются кано- ническими уравнениями Гамильтона. Их можно рассматривать как урав- нения Эйлера для вариационного интеграла, выраженные через функцию W{U, V, х, у, г). Если подставить C7) и C9) в A), то вариационный интеграл запишется в виде I=l{W(U,V,x,y,z) + x'U + y'V\dz. D1) i, Если считать теперь U, V, х, у четырьмя неизвестными функциями г и написать для каждого из них уравнение Эйлера, то в результате мы получим 140). 6. Частный случай, когда независимая переменная не входит явно в подын- тегральное выражение. Случай, когда F не зависит явно от г, требует отдель- ного рассмотрения. В общем случае для F(x', у', х, у, г) справедливо соотношение Предположим теперь, что Fz = 0, и подставим выражения для Fx и Fv из урав- нений Эйлера G). Тогда **- = Fx,x" + Fy,y" + *' ^ Fx. + y'±Fr = i; (X'F*> + У'М- Следовательно, т. е, . . - F—x'Fx.—y'Fy,-_^const. . D2)
670 ПРИЛОЖЕНИЯ Полученное выражение, равное значению W на экстремали, не зависит от г; следовательно, W есть постоянная интегрирования. Тот же результат можно- непосредственно получить из канонических уравнений D0), так как, если F не зависит явно от г, величина W тоже не зависит от г, Wz — 0 и последнее же выражение обращается в нуль в соответствии с D0). В рассматриваемом случае трехмерную вариационную задачу можно свести кдвумерной. Будем считать у функцией х; тогда у' = (dyldx)x' »F(x',y',x, y)= — Fix", dyldx, х, у). Аналогично величины /\., Fy. и F—x'Fx,—y'Fy, тоже можно считать функциями х', dyldx, x, у. Решение уравнения F—x'Fx,—y'Fy! = W ¦ (Щ относительно х' имеет вид D4) Рассмотрим теперь все кривые, для которых W равно некоторому задан- ному значению; тогда интеграл A) можно заменить на разность двух интегра- лов, а именно D5) Если ввести обозначение и исключить х', у' с помощью D4), то f станет функцией dyldx, x, у, W, и мы можем написать = f/(g. x,'y,w)dx D6> Таким образом, для каждого значения W получается вариационный интеграл с числом параметров, уменьшенным на единицу. (Такой переход соответствует в механике переходу от принципа Га- мильтона к принципу Мопертюи: см. (88) ниже). Если из уравнения Эйле- ра, соответствующего D6), опреде- лить у(х), то полное семейство экст- ремалей получается путем интегриро- вания D4). 7. Разрывы. Может случиться, что функция F («, v, х, у, г) не везде не- прерывна. Наиболее важен случай (часто встречающийся в оптике), ког- да F претерпевает конечный разрыв на поверхности а(х, у, г) = 0 при всех значениях и и V. Очевидно, что вне этой поверхно- сти экстремали находятся как обычно из решения уравнений Эйлера G); однако если экстремаль пересекает поверх- ность, ее направление резко меняется (происходит преломление). Будем раз- личать области слева и справа от поверхности, снабжая их соответственно индексами 1 и 2 (рис, 2),. Рис. 2. Иллюстрация вариационного аналога оптического закона преломления.
ПРИЛОЖЕНИЕ 1 571 Для нахождения «закона преломления» выведем условие, при выполне- нии которого интеграл Гильберта S A1), взятый от точки Plt находящейся слева от этой поверхности, до точки Р2 справа от нес, не зависит от пути ин- тегрирования. Рассмотрим дна пути Я,/4/\ и Р,ВР2, где А и В— точки на поверхности. Потребуем (обозначения очевидны), чтобы S(P,/l/>2) = SiPiBPz) или S1 (РгА) + S2 (APt) = St (PtB) + S, (BPJ. D7) Для замкнутого контура PiABPt, расположенного слева от поверхности, имеем $l(P1A) + S1(AB) + S1(BPl)==O, D8) а для замкнутого контура Р,ВАР% справа от нее — S,(P,B) + SABA) + S2(APJ = O. D9) Складывая уравнения D8) и D9) и используя D7) и соотношение S (XY) = = —S(YX), получим S1(AB)=SS(AB). E0) Иными словами, интеграл A1), взятый по любому пути на поверхности а = 0, имеет одно и то же значение независимо от того, возьмем ли мы в качестве и, v величины «х, »! слева от нашей поверхности или м2, v2 справа от нее. Следова- тельно, в обоих случаях подынтегральные выражения равны между собой, и закон преломления эквивалентен утверждению, что выражение F + (x'-u)Fu + (y'-v)Fv E1) непрерывно на поверхности о = 0. Согласно A3) это. условие можно записать в виде (Ux' + Vy' + WI = (Ux'+Vy' + W)t, E2) где х', у' — производные от х(г), у(г) для произвольной кривой на поверх- ности. Условие E2) соответствует также утверждению, что вектор ?/2—6ri, V2—Vi, W2—Wi нормален поверхности разрыва, т. е. W1)dz = O. E3) Вывод закона отражения для экстремалей очень бли- зок к рассмотренному выше. Для этого нужно соединить точки Я, и Р2, расположенные по одну сторону от задан- ной поверхности о(х, у, г) — 0 (рис. 3) в области, где F является непрерывной функцией х, у, г, кривой РлАРг, которая терпит разрыв (меняет свое направление) в точ- ке А на данной поверхности. Ясно, что отрезки РгЛ и АР2 являются экстрема- лями; тогда из рассуждений, сходных с теми, которые 6(aiy,i)=o использовались при выводе закона преломления E3), следует, что условием справедливости теоремы неэсюи- Рис- 3- Иллюстрация самости для падающего (индекс 1) и отраженного (ин- Гтич™™ от- деке 2) полей является закон отражения раження. Теорема независимости выполняется также для любых полей, имеющих конечное число разрывов непрерывности (как преломления, так и отражения). Как будет показано ниже, во всех таких случаях интеграл A) имеет минималь- ное значение независимо от того, является ли экстремаль, соединяющая точки Я, и 'Рг, непрерывной или терпит разрыв (изменяет свое направление) при условии, что функция F удовлетворяет некоторым простым условиям вдоль этой кривой.
672 ПРИЛОЖЕНИЯ 8. Условия Вейерштрасса и Лежандра (достаточные условия экстремума). До сих пор мы не делали различия между максимумом и минимумом; рассмот- ренные экстремали (гладкие или с «петлями») могут даже соответствовать ста- ционарным случаям, когда истинного экстремума вообще не существует. Вы- ведем теперь необходимые условия истинного минимума. Пусть х(г), у (г) — фиксированная экстремаль С в поле и(х, у, г), v(x, у, г), и пусть х(г), у (г) — любая соседняя кривая С, совпадающая с С Рис. 4. К определению ^-функции Вейерштрасса. Рис 5 К выводу условия сильного минимума Вейерштрасса в концевых точках Рг и Р2 и тоже целиком лежащая в поле и, v (рис. 4). Эк- стремум является истинным минимумом, если ^F(x', у', х, у, z)dz — J F (х', у',х, у, г) dz> 0. E5) с с Согласно пп. 2 и 3 второй интеграл в последнем соотношении можно за- менить на интеграл вдоль кривой С, т. е. на {F (и, v, х, у, г) + (х' — и) Fu + (у' —v) Fv) dz- если путь интегрирования этот интеграл не зависит от пути и сводится к С" совпадает с С. Следовательно, E5) принимает вид 'yy', u,v,x,y,z)dz>0, E6) где ', у', и, v, х, у, г) = = F(x',y',x,y, z)—F(u, v,x,y,z) — (x'—u) Fa—(y'—v)F1l, E7) а аргументы функций Fa, Fv совпадают с аргументами функции F(u, v, x, у, г). Функция, определенная E7), называется ^-функцией (или функцией избытка) Вейерштрасса; аргументы х, у, г, х', у' характеризуют точку на кривой С и направление последней, тогда как и, v—направление экстремали поля, про- ходящей через точку х, у, г. Как мы видим, § обращается в нуль на любом отрезке кривой С, совпа- дающем с экстремалью ноля. Выберем теперь в качестве поля двухпараметри- ческое (оо2) семейство всех экстремалей, проходящих через точку Рх. Затем проведем специальную кривую С так, чтобы она совпадала с экстремалью поля между точками Ргн А, являлась прямой между точкой /I и точкой В, лежащей на заданной экстремали, и совпадала с заданной экстремалью между В и Р2 (рис. 5). Тогда $ на отрезках Р,А и ВР2 обращается в нуль и E6) принимает вид в
ПРИ ЛОЖЕНИЕ 1 673 Устремляя А к В, получим, что это неравенство выполняется только в том случае, если ?(х',у',х',у',И,у,г)>0, ¦ E8) где к, у, г — координаты произвольной точки (В) на данной экстремали С, а х', у' относятся к совершен;) э произвольному направлению АВ. Формула E8) служит условием сильного минимума Вейерштрасса; разумеется, оно яв- ляется необходимым условием. Однако если предположить, чго функция F непрерывна по всем своим пяти переменным (следователь- но, функция ? непрерывна по своим семи пе- ременным), то при условии, что E8) удовлет- воряется для всех точек заданной экстремали и при произвольном направлении х', у', нера- венство E6) должно выполняться для любой соседней кривой С, имеющей произвольное направление и лежащей в некоторой окрест- ности кривой С. Следовательно, условие E8) является также достаточным условием силь- ного минимума. Это, конечно, относитель- ный минимум, так как может найтись не- сколько экстремалей, для которых интеграл A) минимален по сравнению с интегралом по всем соседним кривым; рассмотренным способом нельзя уста- новить, какой из этих минимумов абсолютный. Неравенство E8) допускает простую геометрическую интерпретацию. Для фиксированной точки пространства х, у, z величина F зависит только от х', у'', эту функцию F(x', у') можно представить поверхностью в трехмерном пространстве х', у', F. (На рис. 6 изображен двумерный разрез x'F). Тогда as' Рис. 6. Геометрическое истолкова- ние условия сильного минимума Вейерштрасса. ?(х', у', х', y') = F(x', y')—[FOc','y') + (x'—x'-hF-. + {y'—y')F-,] E9) есть, очевидно, расстояние QR вдоль ординаты в пространстве х', у' между точкой Q на поверхности F — F (х', у') и точкой R (см. рис. 6), в которой плос- кость, касающаяся в,точке Р(х', у') поверхности F, пересекает эту ординату. Следовательно, <§(х', у', х', у')>0, когда поверхность F находится над этой касательной плоскостью. Если это справедливо для всех х', у', то имеется сильный минимум. Если же условие E8) выполняется лишь в' небольшой области ? = х' — F, f\-=y'—У', то имеется слабый минимум; в этом случае величину ? можно разложить по степеням %, т|, и тогда (снова опуская аргументы х, у, г) получим При малых значениях | и г\ квадратичные члены играют решающую роль, и для существования минимума они должны быть положительными. Таким об- разом, условие Лежандра (необходимое и достаточное) для слабого минимума *) имеет вид F-х, -х, > О, F-x,-, F-. -. — F\,- > 0. F0) *¦) Это условно легко обобщить на случай большего числа переменных (скажем, и). Для существования минимума квадратичная форма с п переменными должна быть пололштель- но определенной; отсюда следует, что соответствующий определитель и все его главные ми- норы должны быть положительными, , i .
674 приложения 9. Минимум вариационного интеграла, когда один конец кривой связал с поверхностью. С помощью ^"-функции легко определить минимум вариацион- ного интеграла A) относительно всех кривых с одной общей концевой точкой Pi, а другими, связанными с заданной поверхностью в(х, у, г) = 0. Кривая, очевидно, должна совпадать с одной из экстремалей двухпарамет- рического ос2 семейства, проходящей через точку Рь и нужно лишь узнать, «с какой из них». Среди всех ooz экстремалей имеется только одна *), которая ортогональ- на поверхности а = 0, и легко показать, что именно она служит решением данной задачи. Для этого обозначим через Р3 точку пересе- чения такой экстремали с поверхностью и - О и окружим ее полем всех экстремалей, перпен- > дикулярных к поверхности. Пусть PXQ—лю- бая экстремаль, проходящая через Ри a Q—- ™ка ее пересечения с поверхностью (рис. 7). кривых, один конец которых фик- 1 огда интеграл Гилых-рта 5 (P., Q) ооращает- сирован, а другой связан с поверх- ся в нуль. Следовательно, интеграл 5 вдоль ностью- пути PiQPi равен вариационному интегралу /(Л, Q). Разность /(Рь Q) — /(Рь Р2) можно выразить точно таким же образом, как и выше, через ^-функцию; тогда, ес- ли условие E8) выполняется, она положительна для всех Q, отличных от Ри 10. Критерий Якоби для минимума. Если экстремаль можно целиком по- местить в поле и условие Лежандра выполняется для всех ее точек между Pt и Р2, то интеграл /, определенный A), имеет (слабый) минимум. Остается найти критерий существования такого поля. Пусть двухпараметрнческое (оо2) семейство экстремалей, проходящих через Рх, описывается уравнениями х = х(г,а, Р), у = у{г,а,$), и пусть заданная экстремаль С характеризуется сс = О, |3 =0, т. е. х = х(г, 0, 0), «/=(/B,0,0). F2> Кривые F1) образ\ют поле, если существует одна кривая, проходящая через заданную точку Р (х, у) на произвольно близком расстоянии от С, т. е. если уравнения F1) имеют единственное решение для а, |5 как функций х, у; это условие имеет вид д_ х* h фо, F3) У* У9 Полученное соотношение является критерием Якоби существования минимума. Определитель Д есть функция г вдоль заданной экстремали F2). Первая точка Р, в которой Д обращается в нуль, называется точкой, сопряженной точке Рп для любого интервала PiP2, где Р2 лежит между Р% и Р, существует истинный минимум. В точке Р заданную экстремаль пересекает соседняя (бесконечно близкая к заданной); эта точка лежит на огибающей семейства F1). Следовательно, поле ограничено огибающей семейства экстремалей F1). В оптике такие оги~ бающие являются каустическими поверхностями. 11. Пример I. Оптика. Проиллюстрируем теперь общую теорию несколь- кими примерами. В первом примере рассматриваются наикратчайшая линия в обычной геометрии и кратчайший ошическии п^ть в геометрической оптике. *) Предполагается, что Рх находится достаточно близко к поверхности, т. .е. случай не- скольких таких экстремалей исключен.
ПРИЛОЖЕНИЕ 1 675 Геометрия Евклида основана на теореме Пифагора, согласно которой элемент длины ds связан со своими проекциями dx, dy, dz на оси прямоугольной системы координат соотношением ds1=dx3 + dy2 + dz\ F4) Тогда кратчайшие линии между двумя точками определяются из минимума вариационного интеграла s^^ds^l Vxl2 + y'2 + Idz. F5) Р, zt Геометрическую оптику можно построить с помощью обобщения этого интегра- ла, а именно с помощью принципа наикратчайшего оптического пути Ферма (см. п. 3.3.2), т. е. р, гг \ п ds = \ п (х, у, г) Vx'2 + у'2 + 1 dz, F6) Р, г, где п(х, у, г) — показатель преломления. Мы будем рассматривать только второй случай, так как соотношение F5) является частным случаем F6) при я=1. Имеем F(x', у', х, у, г) = п(х, у, z)Vx'2 + y'2 + 1 . F7) Поскольку ds = У х'2 -\- у'г + 1 dz, имеем т, т, пх' dx U = fx. = = п -г = ns,. V д ре = 41 д п dJf (ов) где sx, sg, sz— компоненты единичного вектора s, касательного к кривой х = — х(г), у— у(г). Закон преломления на поверхности разрыва п(х, у, z) можно, согласно E3), записать в виде («A—nlSl)-dl = 0, F9а) где d\ (dx, dy, dz) ¦— произвольный элемент длины на поверхности. Из послед- него соотношения следует, что векторы sb s2 и нормаль к поверхности разрыва компланарны и что углы 0х и 92, образованные Sx и s8 с нормалью к поверхности соответственно, связаны соотношением n,sines = n1slnel, F96) что согласуется с законом преломления C.2.19). Уравнения Эйлера G), соответствующие F6), имеют вид d { dx\ дп А Г dy\ дп Третье уравнение Эйлера ds \ ds 43*
676 ПРИЛОЖЕНИЯ является тождеством, так как оно следует из соотношения Для получения G06) можно поступить следующим образом: сначала продиф- ференцируем G1) nos. Затем умножим G1) на dn/ds, а продифференцированное уравнение—на п, после чего сложим полученные выражения. И, наконец, используем *) G0а). Три скалярных дифференциальных уравнения G0) согла- суются с векторным уравнением C.2.2) для световых лучей. Поскольку U, V и W характеризуют теперь компоненты лучевого вектора (см. п. 4.1.4), из A2) следует, что функция S, соответствующая полю геомет- рической оптики, является точечной характеристикой Гамильтона (см. D.1.1)). Более того, с помощью процедуры, использовавшейся при выводе B1), можно показать, чго уравнение Гамильтона— Якобн дтя данной вариационной за- дачи совпааает с уравнгни°м эйконала. Для изучения условия Лежандра F0), необходимо найти производные Fx.x. и т. д. В "данном случае имеем 1+Х'г n х'ч' следовательно, y,r>0. G2) Таким образом, каждой экстремали соответствует слабый минимум (см. стр. G74), если выполняется условие Якоби F3). Однако, поскольку выпуклость функции F для данных значений х, у, г, т. е. для данного п, направлена вниз при всех х', у', то из геометрического истолкования условия Вейерштрасса следует, что минимум является сильным. Остается рассмотреть критерий Якоби. При /г = const, т. е. в обычной евклидовой геометрии, экстремали, очевидно, имеют вид прямых. Так как пучок прямых, проходящих через точку Ри не может иметь огибающую, то каждой прямой линии соответствует сильный минимум расстояния между лю- быми двумя точками на этой прямой. В геометрической же оптике, когда п является в общем случае функцией х, у, г (непрерывной или разрывной), пучок лучей из точки Pt может иметь огибающую (каустическую поверхность). По- этому при исследовании характера экстремума необходимо в каждом случае отдельно рассматривать такие поверхности. 12. Пример II. Механика материальных точек. В качестве второго примера рассмотрим механику системы материальных точек. Независимой переменной здесь выступает время /, а в качестве неизвестных функций — лагранжевы координаты <?я (а = I, 2, ..., га) и их производные, т. е. скорости, иа = <?„• Вариационный характер задачи определяется принципом Гамильтона t, J L (и1у и2, .. ., <7г, <72, ... , t)dt~ экстремум, G3) *) Уравнение G06) можло лолучить более симметричным способом, однако для этого придется использовать лишнее уравнение Эйлера. Координаты х, у, г считаются функциями параметра Я; тогда получаются три уравнения Эйлера, спязянные между собой тождеством, a парыиетр л идентифицируется в конце концов с переменной s.
ПРИЛОЖЕНИЕ 1 677 где L — лагранжиан. В обычной нерелятивистской механике L — Т— Ф, где Т — кинетическая энергия, т. с. квадратичная форма по иг„ и Ф — по- тенциальная энергия; однако условие G3) справедливо и в более общем случае, когда действует магнитная сила и учитывается релятивистское изменение массы. Функции F(и, v, х, у, г) соответствует теперь L(u, g, t), и следовательно, (см. A3)) величинам U, V — импульсы '.=еЬ G4) а величине W соответствует —Н, где Н — гамильтониан вида Я-?«.!г—*- = 2>Л-*» G5) а а а Если L = T—Ф, то последнее соотношение принимает вил Из теоремы Эйлера для однородных функций *) следует, что и Н сводится к выражению для полной энергии, т. е. G5) Уравнения Эйлера G) дают уравнения движения Лагранжа и канонические уравнения D0) принимают вид dqa_dH dp«_ дН й. dt -W,' ~Ж~~Щ1' ( где Н считается функцией' ра и qa. Если Я не зависит от времени t, то формула D2) выражает закон сохранения энергии H=-HjuapI—L = const =?. G9) В этом случае дифференциальное уравнение Гамильтона — Якоби (?1) запи- сывается следующим образом: Интегрируя его, получим S^—Et + S^qJ, (81) где 5i удовлетворяет уравнению Я (g, <?.)=?. (82) Из решения уравнения Гамильтона — Якоби получаем в согласии с A7) вы- ражение для импульсов в виде Отсюда следует, что линейный интеграл р, { ПрЖ* (84) *) См., например, fl].
678 ПРИЛОЖЕНИЯ не зависит от пути, соединяющего Рт и Рг, и поэтому он равен нулю, если путь интегрирования — замкнутый в односвязной области, т. е. §p,dq, = 0. (85) Если функции р„ многозначны, то интеграл по замкнутому контуру может не обратиться в нуль, а равняться числу, кратному какому-нибудь постоянному периоду. Найденное соотношение является обобщением оптического инва- рианта Лагранжа (см. п. 3.3.1) и совпадает с одним из инвариантов Пуанкаре, Его можно также представить в виде Т^-Р-О. (86) Если Н не зависит от времени, то переменную t можно исключить из вы- ражения для принципа минимума с помощью формул D5) и D6). В результате получим У = $ (L + Я) <й = $ 2 qj>a dt = ) 2 р„ dqa = экстремум, (87) п и а р> а Это есть принцип наименьшего действия Мопертюи, обобщенный для произ- вольного лагранжиана L; его нужно понимать следующим образом: уравнение G9) позволяет исключить производные по времени «„—?„, выражая их через производные, скажем dqjdq, (а = 2, ..., п), если считать ql независимой пере- менной. Уравнение (87) выражает чисто геометрический принцип, который описывает траектории, но не движения. Последние можно найти из соотноше- ния G8). Если L — T—Ф, то Е—Т + Ф, и мы получим первоначальную формулу Мопертюи J = 2^Tdt, (88) t, которую следует трактовать таким же образом. Рассмотрение вопросов элект- ронной оптики (см. п. 2 приложения 2) служит примером подобного сведения задачи о движении к задаче о траекториях посредством перехода от прин- ципа Гамильтона к принципу Мопертюи. Условие Лежандра можно рассматривать только в случае заданного L. Если L — T—Ф и Т— квадратичная форма по и„, то это условие, очевидно, эквивалентно утверждению, что Т — положительно определенная величина. Тогда условие Вейерштрасса тоже выполняется, и имеется сильный минимум, если удовлетворяется условие Якоби. Последнее позволяет исследовать дина- мические фокусы и каустики, что не представляет большого практического значения. ' ' Условие Лежандра для релятивистского электрона с лагранжианом (см. приложение 2) дает форму квадратичную по компонентам вектора р(ё, Ц, Q, и поэтому оно всегда удов- летворяется.
ПРИЛОЖЕНИЕ 2 679 ПРИЛОЖЕНИЕ 2 ОБЫЧНАЯ ОПТИКА, ЭЛЕКТРОННАЯ ОПТИКА И ВОЛНОВАЯ МЕХАНИКА В 1831 г. Вильям Гамильтон обнаружил аналогию между траекториями материальных частиц в потенциальных полях и траекториями световых лучей в средах с непрерывно изменяющимся показателем преломления. Благодаря своему математическому изяществу <аналогия Гамильтона» излагалась в те- чение почти ста лет в учебниках по динамике, но практически ее никто не при- менял до 1925 г., когда Буш впервые объяснил фокусирующее действие элект- рических и магнитных полей па электронные пучки, пользуясь оптической терминологией. Примерно в то же время Шредингер воспользовался аналогией Гамильтона для получения своего уравнения, позволившего перейти от гео- метрической оптики к волновой оптике частиц; при этом он использовал по- нятие длины волны частиц, впервые предложенное в 1923 г. де Бройлем. Практическая электронная оптпка начала бурно развиваться с 1928 г. В это время аналогия Гамильтона была уже широко известна и ее использо- вание позволило изобрести целый ряд электроннооптических приборов (таких, как электронный микроскоп), являющихся аналогами оптических. Хотя ма- тематическая аналогия носит общий характер, оптическая и электронная техники различаются между собой. Такие элект роннооптические приборы, как электроннолучевые трубки и системы с искривленной оптической осью, не имеют аналогов в обычной оптике. Мы будем рассматривать только такие проблемы электронной оптики, оптические аналоги которых подробно обсуж- дались в предыдущих главах книги, и поэтому получающиеся результаты после небольшой модификации почти полностью переходят в уже известные. Отме- тим, что это относится, в частности, к наиболее трудной для понимания главе электронной оптики, а именно к волновой теории аберраций линз. 1. Аналогия Гамильтона в элементарной форме. Мы сначала покажем, что задачу определения траектории заряженной частицы можно свести к опти- ческой задаче путем введения подходящего показателя преломления, изменяю- щегося от точки к точке. Рассмотрим частицу с зарядом е и массой т и для простоты будем считать ее электроном, движущимся в постоянном электростатическом поле с потен- циалом <р(дг, у, г). Из уравнение» движения Ньютона имеем ¦§- = eE = -egradcp, A) где р — вектор импульса. Это уравнение справедливо для любых скоростей V, если ньютоновское определение импульса р — тх заменить на эйнштейновское где с — скорость света в вакууме. Уравнение движения A) удобно разбить на два; первое является уравне- нием траектории, а второе характеризует «временное расписание», согласно которому электрон движется вдоль траектории. Для этого напишем v = v&, р = ps, где s — единичный вектор в направлении движения. Тогда dp dp ds dp . ds ds ¦ dp ds Из дифференциальной геометрии известно, что вектор ds/ds направлен вдоль главной нормали v, а его абсолютная величина равна кривизне 1/р траектории. Следовательно, dt
680 ПРИЛОЖЕНИЯ Отсюда и из уравнения A) следует, что мгновенный центр кривизны "лежит и плоскости, проходящей через касательную s к траектории и вектор электри- ческого поля Е grad<p. Разлагая gradcp по двум направлениям, имеем ^ v e[(sgrad<|>)s + (vgrad4)v]. C) Приравнивая первые члены в левой и правой частях C), получим скалярное уравнение, которое можно назвать «временным расписанием», поскольку оно определяет положение электрона на траектории в зависимости от времени. I !осле умножения на v — ds'dt его можно проинтегрировать, что дает — —etp + const. D) Это есть эйнштейновский интеграл энергии. Для медленно движущихся частиц. (р\<<?1) он переходит в ньютоновский интеграл -g-ffwa-b«p = const. Ограничимся теперь для удобства рассмотрением электронов, для которых постоянные интегрирования одинаковы, т. е. обладающих одинаковой полной энергией. Этот случай соответствует электронам, вылетающим из определенной потенциальной поверхности ф0 с нулевой скоростью. Во многих практических задачах такая поверхность совпадает с поверхностью катода. Полагая У=ф—ф,„ т. е. считая поверхность ф0 началом отсчета дотенциала V, интеграл энергии можно представить в виде тс2 Г — 11 = — eV. Da) Ко б.шнруя B) и Dа), можно написать одно двойное уравнение Тогда абсолютная величина импульса р этих частиц, выраженная через коор- динаты х, у, г, примет вид тс3 Рассмотрим теперь вторую часть C), т. е. компоненту, перпендикулярную к направлению движения, Р Выражая v и V с помощью B) и F) через р, получим простой закон ___ v-gra Р. —у.оГасщПп). (8) Уравнение (8) идентично уравнению C.2.14) для кривизны лучей в среде с пока- зателем преломления л, если считать, что последний пропорционален р; таким образом, мы получаем формальную аналогию между траекториями лучей и электронов. Необходимо подчеркнуть, что абсолютная величина импульса р зависит только от координат лишь для электронов с фиксированной полной энергией; для электронов с различными энергиями значение р будет другой функцией, «шределяемой F). Таким образом, показатель преломления зависит от энергии электронов. Это также имеет аналогию в обычной оптике, где показатель пре- ломления среды зависит от длины волны света Позднее будет показано су- ществование довольно глубокой аналогии, поскольку в обоих случаях показа- тель преломления оказывается функцией длины волны Для медленных электронов значение р пропорционально скорости, а по- следняя в свою очередь пропорциональна \'У, Использовавшиеся нами реля-
ПРИЛОЖЕНИЕ 2 681 тивистские уравнения имеют следующее преимущество: они ясно показывают, что характеристической величиной служит не скорость, а импульс. Более того, найденные результаты допускают немедленное обобщение на случай общего статического поли, электрического и магнитного. Из теории относительности хорошо известно, что при наличии магнитного поля механический импульс р, который будет теперь обозначаться через рт, заменяется на «полный» импульс Рпол^Р-и + еА. (9) где А — векторный потенциал *). Отсюда можно заключить, что к общем слу- чае показатель преломления, который в электростатике пропорционален ком- поненте р,„ в направлении движения, должен заменяться на компоненту рп".„ в том же направлении. Такое предположение оказывается справедливым, од- нако при рассмотрении законов электронной оптики при наличии электро- магнитных полей мы все же прибегнем к более строгому и общем} обоснованию. 2. Аналогия Гамильтона в вариационной форме. Законы геометрической оптики можно вывести из принципа Ферма (см. п. 3.3.2), согласно которому путь света между двумя какими-нибудь точками Pt и Р2 обеспечивает мшшм\м оптической длины, т. е. я, [ п ds = минимум. A0) я, Необходимо напомнить, что такая строгая формулировка принципа Ферма справедлива лишь в том случае, когда две концевые точки расположены дос1а- точно близко друг от друга или, что то же самое, когда па отрезке луча, соеди- няющего эти точки, нет изображения ни точки Рг, ни точки Рг. Если Р2 служит изображением Рь то уравнение A0) определяет не луч, а бесконечно тонкий п\чок лучей, соединяющих эти две точки и проходящих равные оптические пути. Если расстояние между Рг и Р2 настолько велико, что между ними имеется изображение, то луч определяется из слабой формулировки принципа Ферма р. 6$ nds = 0; A0а) я, такой формулировке соответствует не максимальное, как иногда ошибочно утверждают, а стационарное значение интеграла, которое не является ни мак- симальным, ни минимальным. Некоторые следствия из принципа Ферма обсуждались в п. 11 приложе- ния 1 при вычислении вариаций. В п. 12 того же приложения было показано, что движение системы материальных точек также можно записать в вариацион- ной форме, используя принцип Гамильтона, который в частном случае одной материальной точки имеет вид У' . . . ] L(x, у, г, х, у, г) dt — минимум. A1) Put, Такая формулировка справедлива в любой системе координат, но мы ограни- чимся для простоты декартовыми координатами х, у, г. Здесь х, у, г — компо- ненты скорости, L — лагранжиан. Положение начальной и конечной точек рассматривается в четырехмерном пространстве — времени и считается не- изменным в вариационном процессе. В приложении 1 (см. G7) и G8)) было по- казано, как из A1) получить уравнения движения в форме Лагранжа и в форме Гамильтона. *) Необходимо отметить, что этот фундаментальный результат бы.т получен Шварц- шильдом [2] за три года до появления теории относительности.
682 приложения Для релятивистского электрона с зарядом с и массой покоя т лагранжиан имеет вид КГ5Г) A2) Здесь r = v—вектор скорости, <р — электростатический потенциал, А — магнитный или векторный потенциал *). Лагранжиан A2) можно проверить, если подставить его в уравнения движения Лагранжа (см. G7) приложения 1) и использовать электромагнитные соотношения B.1.5) и B.1.7) Е = — -J-A — 0гас1ф, В = rot А. Уравнения Лагранжа принимают тогда вид v X В') , A3) т. е. совпадают с уравнениями движения в форме Ньютона -— Лоренца. Принцип Гамильтона A1) является слишком общим для электронной оптики. Во-первых, в соответствующую вариационную задачу входит время, которое не представляет никакого интереса, если поля стационарны. Во-вто- рых, решение этой задачи содержит пятипарамеарическое (ос5) семейство экст- ремалей; четыре параметра обусловлены тем, что при данном значении полной энергии точки Plt P2 можно свободно выбирать на любых двух заданных по- верхностях, а пятый тем, что значение полной энергии считается произволь- ным. В электронной оптике, как и в обычной оптике, стремятся по возможности уменьшить число измерений. Рассмотрим сначала фиксированную энергию, другими словами, огра- ничимся обсуждением монохроматического света или моноэнергетических электронов. Как следует из (87) приложения 1, число измерений задачи умень- шается при этом на единицу. Принцип Гамильтона A1) заменяется принципом наименьшего действия J= j (L + E)dt = минимум, A4) где Е — полная энергия, т. е. Время t входит в соотношение A4) лишь формально, так как после под- становки в него выражения для Е получим p,.t, р, р, J= ] '?lpxxdt=^ ^pxdx = ] p-dr = минимум. A5) p,,t, p, p, Во втором и третьем выражениях опущены t1 и t1? так как мы рассматриваем только постоянные во времени ноля (в противном случае полная энергия не оставалась бы постоянной), в которых начальный момент tt не играет роли, а время it—1\ полностью определяется траекторией и величиной энергии. Таким образом, принцип наименьшего действия A4) полностью аналоги- чен принципу Ферма A0). Изучение движения электрона сводится к ошиче- ской задаче, если определить электронно-оптический показатель прелом и'ния как компоненту импульса в направлении движения. Для чисто электростати- ческого поля этот результат эквивалентен результату, полученному выше из более простых соображений. В этом случае импульс оказывается чисто меха- ническим и параллельным траектории, а его абсолютная величина дается *) Нерелятивистская функция Лагргнжа A2) была получена Шварцшильдом [21 в 1903 г.
ПРИЛОЖЕНИЕ 3 - 683 выражением B), т. е. При наличии магнитного поля необходимо использовать общее определение компонент импульса (см. соотношение G4) приложения 1) как производных от лагранжиана по компонентам скорости. Для одной частицы с лагранжианом A2) получим _ dL т'х е . Рх~~дх~ FT=p! + <- и т. д. В векторном виде имеем A6V Таким образом, общее выражение для электроннооптического показателя пре- ломления имеет, с точностью до произвольного постоянною множителя, сле- дующий вид: п= г ==¦ -\—A-s, A7) где A-s—компонента векторного потенциала в направлении движения. Не- обходимо еще раз подчеркнуть, что эту величину следует рассматривать как функцию положения электронов с заданной полной энергией. По-видимому, имеется существенное различие между общим случаем и частным случаем чисто электрических полей. В электрическом поле показатель преломления пропорционален механическому импульсу, т. е. измеряемой фи- зической величине. В общем же выражении A7) второй член представляет собой компоненту векторного потенциала, являющегося не физической вели- чиной, а функцией, ротор которой равен магнитной индукции В. Таким обра- зом, электронноошический показатель преломления представляет собой в об- щем случае не физическую величину, а функцию Лагранжа "). Однако, как уже упоминалось, он является физической величиной в частном случае чисто электрического поля. В обоих случаях к этим выражениям можно добавить компоненту градиента в направлении движения от произвольной функции координат, не изменяя при этом ни одного физического следствия. Существует более важное различие между частным и общим случаями, которое проще пояснить, если провести дальнейшие упрощения и свести челы- рехпараметрическое (оо4) семейство траекторий к двухпараме1рическому (оо1). Для этого выберем такие траектории, которые начинаются на какой-то по- верхности &~' (х, у, г)=<5Р0 и нормальны к ней. В геометрической оптике эту поверхность можно считать волновым фронтом; нетрудно показать, что пучок траекторий остается ортогональным семейству поверхностей & (х, у, z) — const (теорема Малюса и Дюпина, см. п. 3.3.3). Как было показано выше (см. пп. 2 и 3 приложения 1), какая-то «ортого- нальность» существует и в общем случае, однако ее физический смысл сложнее смысла теоремы Малюса •— Дюпина. В этом случае семейству поверхностей vf —const ортогонален не единичный вектор s в направлении движения, а им- пульс р. Поскольку векторный потенциал не определен однозначно, сущест- вует бесконечное множество семейств ортогональных новерхноглеп; олнлко при наличии магнитного поля никакими калибровочными преобразованиями их нельзя сделать перпендикулярными к траекториям. На языке геометрии двумерные пучки кривых, ортогональные семейству поверхностей, образуют «нормальную конгруэнцию», в противном случае они -} Это особенно подчеркивалось в работе [3], где отмечалось тгкже, что если маглшяоз поле по равно нулю во всем пространстве, то невозможно с помощью калибровочного преобра- зования так отноркировать потенциал А, чтобы он обращался в нуль вместе с магнитным полем.
684 ПРИЛОЖЕНИЯ образуют «косую конгруэнцию» (см. п. 3.2.3). В обычной оптике и электро- статической электронной оптике траектории образуют нормальные конгру- энции, а ортогональные им поверхности отождествляются с «волновыми фрон- тами». При наличии магнитного поля двумерные пучки траекторий образуют косые конгруэнции, к которым нельзя применить понятие ортогональных вол- новых фронтов. В пои и состоит довольно существенное различие между электронной и обычной оптикой. 3. Волновая механика свободных электронов. В 1905 г. Эйнштейн впервые выдвинул гипотезу о двойственной природе света. Свет распространяется как электромагни'ная волна, но при взаимодействии с веществом он ведег себя так, как будто его анергия сконцентрирована в фотонах, каждый из которых несет кванг энергии Вскоре гипотеза Эйнштейна получила блестящее подтверждение при наблюдениях фотоэлектрических и фотохш нческих процессов. Предположение о двойственной природе материальных частиц принадле- жит Луи де Бройлю, который н 1923 г. показал, что частице с механическим импульсом рт может соответствовать (релятивистски инвариантно) только длина волны % = hlpm, A8) где h—универсальная постоянная с размерностью действия, которую де Бройль отождествил с постоянной Планка. Вскоре после этого Гейзенберг, Борн и Иордан, независимо от де Бройля, предложила первую полную математическую формулировку квантовой меха- ники, однако их методы менее удобны для обсуждения поведения свободных частиц, чем методы волновой механики Шредингера, краткое описание которой и приводится ниже. Шредингер объединил идеи де Бройля и Гамильтона и пришел к задаче волнового описания движения частиц, которая так же связана с динамикой материальных частиц, как волновая оптика — с геометрической. Его подход, который, как мы теперь знаем, справедлив не всегда, содержал, конечно, це- лый ряд догадок; в самом деле, хотя геометрическая оптика логически следует из волновой, обратное утверждение неверно. Предположим, что существует некое волновое поле, интенсивность которого характеризует плотность электронов таким же образом, как интенсивность электромагнитного поля — плотность фотонов. Более того, предположим, что это поле скалярно и его амплитуда описывается скалярной функцией *Р (х, у, г, t); чтобы учесть волновой характер поля, будем считать, что У удов- летворяет волновому уравнению i ± где и — скорость распространения волны, которая в общем случае является функцией координат. Это, конечно, весьма жесткое предположение, так как обычное волновое уравнение с постоянной скоростью распространения можно обобщить множеством различных способов, а данное обобщение является наиболее простым. v Выбирая Ч1 в виде «монохроматической волны» *? (х, у, г, t) = ty(x, у, г)ехр(—/со/), получим уравнение, не зависящее от времени в которое входит не скорость, а только длина волны %. Предположим теперь, что % совпадает с длиной волны де Бройля, если вместо р,„ подставить значение импульса, которым бы обладал*! настиг) в точке х, у, г согласно законам ктас- епческой механики. Это значение можно вычислить С помощью F) Для прост::.- ты рассмотрим движение медленного электрона в электростатическом ноле-
приложение 2 685 Тогда из соотношения де Бройля A8) и из формулы F) имеем B0) }г2т (?—еф) Подставляя последнее соотношение в A9), получим ^О. B1) Это и есть волновое уравнение Шредингера для свободной частицы в ска- лярном потенциальном поле. Поскольку оно не зависит от времени, его можно интерпретировать как уравнение, описывающее стационарное (например, периодическое) движение частицы в силовом поле. Однако это уравнение мож- но использовать и в случае стационарных пучков, с которыми обычно имеют дело в электронной оптике, когда рассматривают много частиц, появляющихся одна за другой, но находящихся в одинаковых условиях. Как в первом, так и во втором случаях разумно предположить в соответствии со статистической интерпретацией Борна, что квадрат модуля |ф |2=г|л|?* пропорционален плот- ности частиц в точке х, у, г, измеренной за длительный промежуток времени, либо, что в данном случае совпадает с этой плотностью, пропорционален ве- роятности нахождения частицы в данной области пространства в любой момент времени. Справедливость уравнения B1) была впервые доказана Шредингером, который объяснил с помощью этого уравнения закономерности атомных спект- ров, предположив, что электрон в атоме находится в таком же силовом поле, что и в старой модели атома Резерфорда — Бора. Для пас больший интерес представляет доказательство справедливости B1) ъ случае свободных электро- нов; таким доказательством послужило открытие дифракции электронов Дэ- виссоном и Джермером и независимо от них Томсоном в 1927—1928 гг. Для медленных электронов, обладающих кинетической энергией, экви- валентной eV de, соотношение де Бройля A8) дает следующее приближенное значение длины волны: л— у уг-л. Таким образом, длины волн электронов, с которыми обычно имеют дело в ла- бораторных экспериментах, составляют доли ангстрема, т. е. имеют тот же порядок, что и длины волн рентгеновского излучения. Следовательно, волно- вой характер свободных электронов легче всего продемонстрировать с помощью экспериментов, сходных с опытами но дифракции рентгеновских лучей в крис- таллах. Терминология, применяемая при рентгеновском анализе (которая ис- пользовалась также н в случае электронов), несколько отличается от термино- логии, принятой в обычной оптике. То, что называется дифракцией рентге- новских лучей или электронов, является на самом деле интерференцией коге- рентных вторичных волн, испущенных более или менее регулярно располо- женными атомами решетки. Дифракция электронов в смысле световой оптики на относительно крупных материальных препятствиях, атомная структура которых нр играет никакой роли, происходит на весьма малые углы; впервые ее наблюдал Берш в 1940 г. в электронном микроскопе *) 14]. 4. Применение оптических принципов в электроной оптике. Представленный выше элементарный и неполный обзор волновой механики достаточен почти для всех практических нужд электронной оптики. Нет даже необходимости в использовании обобщения волновой механики на случай наличия магнит- ного поля, поскольку в электронной оптике для исследовапия дифракционных проблем достаточно приближения Кирхгофа. Допущения, при которых оно *) Фотографии дифракционных картин Берша воспроизведены в 15].
686 ПРИЛОЖЕНИЯ справедливо, полностью выполняются в электронной оптике. За исключением полей внутри и в непосредственной близости от атомных ядер в электронной оптике не встречаются электрические поля, которые существенно изменяются на расстоянии длины волны иело.л>зуемых электронов. Это утверждение тем более справедливо для магнитных полей, и дифракционные эффекты, обуслов- ленные наличием именно магнитного поля (которых можно ожидать, исходя из волновых уравнений Клейна — Гордона или 7шрака), настолько малы, что их невозможно обнаружить в экспериментах со свободными электронами. Та- ким образом, в электронной оптике можно, правда, с известными оговорками, о которых будет сказано ниже, использовать дифракционную теорию Кирх- гофа (см. § 8.3), смысл которой (в несколько обобщенной форме) состоит в сле- дующем: I. Отмеряя равные оптические пути вдоль лучей, построенных по правилам геометрической оптики, строят волновой фронт от источника до предмета или препятствия. II. Если препятствием служит светонепроницаемый экран, то часть вол- нового фронта, не совпадающая с ним, считается невозмущенной как по фазе, так и по интенсивности, а остальная часть — несуществующей. В случае же частично пропускающего излучение препятствия строят по законам геометри- ческой оптики траектории лучей, проходящих через него, причем их изменения по фазе и интенсивности определяются комплексным показателем преломления препятствия. Во всех практических приложениях такой подход оказывается справедливым, поскольку предметы, с которыми приходится иметь дело, на- пример в микроскопии, имеют столь малую толщину, что дифракционными эффектами внутри них можно спокойно пренебречь. III. Чтобы вычислить дифракционные эффекты в некоторой удаленной точке, например в оптическом изображении, необходимо найти с помощью правил геометрической оптики вклад в эту точку от каждого элемента волно- вого фронта, выходящего из предмета или препятствия, и просуммировать комплексные амплитуды с учетом их коэффициентов наклона. Описанный таким образом метод Кирхгофа можно без всяких изменений применить к вопросам электронной оптики, если имеются только электрические поля, в том числе сильные микроскопические поля, обусловленные атомной структурой твердого тела, которые являются в основном электрическими. Однако при наличии магнитных полей уже нельзя строить волновые фронты, , отмеряя вдоль траекторий равное число длин волн де Бройля. Как отмеча- лось выше, волновые фронты при наличии магнитного поля ортогональны не траекториям, а линиям равного полного импульса, или «р-лиииям», которые в рамках геометрической оптики не имеют простого истолкования. В принципе волновые фронты можно построить, если начать с какого-нибудь заданного волнового фронта и отмерять оптические пути вдоль «р-лнннй». Однако такой метод практически почти бесполезен, поскольку он позволяет получить не амплитуды, а только фазы. Эту трудность можно избежать, если мысленно заменить магнитные линзы эквивалентными им электрическими, которые даюг Такое же изображение, за исключением вращения его как целого и некоторой вращательной дисторсии изображения. Игнорируя подобные специфически магнитные эффекты в процессе распространения и учитывая их юлько в самом конце, можно с помощью метода Кирхгофа получить результаты, которые справедливы во всех практически встречающихся случаях. Хотя у электронной и у обычной оптики одинаковое математическое обосно- вание, их технические средства весьма различны. В основе развития практи- ческой световой оптики лежала техника шлифовки и полировки поверхностей необходимой формы из различных прозрачных и отражающих твердых мате- риалов. В электронной же оптике имеется только одна среда — электромаг- нитное поле. Поэтому в ней всегда возникают трудности при попытках исправ-
ПРИЛОЖЕНИЕ 3 . 6fe7 ления аберраций, особенно тогда, когда практически невозможно использо- вать пространственные заряды и токи. В самом начале развития электронной оптики было установлено, что с помощью одних лишь вращателыю-симмет- ричных полей нельзя создать рассеивающие линзы и системы, свободные от сферической или хроматической аберраций. Это привело к созданию систем, не обладающих вращательной симметрией, а также систем с искривленными оптическими осями, почти неизвестных в обычной оптике. Следовательно, знание теории оптических инструментов и принципов их конструкций полезна в электронной оптике только при постановке задач; их практические решения будут силы-о отличаться от решений соответствующих оптических проблем. Тем не менее очевидно, что «оптическое мышление», основанное па фундамен- тальной аналогии этих двух областей физики, будет так же полезно в будущем, как и в первом двадцатипятилетии электронной оптики. ПРИЛОЖЕНИЕ 3 МЕТОД АСИМПТОТИЧЕСКИХ ОЦЕНОК ИНТЕГРАЛОВ Цель настоящего приложения состоит в изложении математического обо- снования до известной степени общих методов, используемых в основной части кнчгк и позволяющих получить асимптотические оценки интегралов некоторых типов, часто встречающихся при решении оптических задач. 1. Метод наибыстрейшего спуска. Этот метод*) позволяет получать асим- птотические приближения комплексных интегралов типа *\g(z)exp[kf(z)]dz A) при больших значениях k, где g (г) и /(?) не зависят от k. Сейчас и в дальнейшем мы будем считать, что k — вещественная и поло- жительная величина. Полученные результаты, вообще говоря, справедливы и при комплексных значениях к: предварительно скажем несколько слов об асимптотических разложениях ф\нкцпи комплексной переменной, например ?. Во-первых, согласно Пуанкаре [7], асимптотическое разложение можно определить следующим образом: если п Х ?), B) где при всех п величина UnRn(Q стремится к 0 при ?^оо для значений лежащих в заданном интервале, а а0, аи ..., ап — константы, то F(g)«ao+f- + ||+... ; C) правая часть C) называется асимптотическим разложением F (?) для заданной области значений arg?. Если F(Q является частным от деления двух функций, скажем, G(t,) и Я @, то ( ^ ^) D) Необходимо подчеркнуть, что в дальнейшем будут рассматриваться только такие разложения, которые имеют вид правой.части D) с H(Q, равной exp (at,), где а— некая постоянная. Отметим теперь некоторые основные свойстна асимптотических разложе- ний **). Если ряд в C) конечен или сходится при достаточно больших значе- •) Развитый в основном Дебаем [6], . * *•) См., например, [8] иди [9].
C88 приложения ииях |?|, то он является асимптотическим; однако часто йодобные ряды схо- дятся не при всех значениях |? |. В общем случае для заданной функции fiQ рассматриваемое разложение справедливо только в каком-то определенном диапазоне значений arg ?, если такое разложение возможно при всех значениях аг^?, то оно сходится. Кроме того, асимптотическое разложение заданной функции F (t) в соответствующем диапазоне значений arg? является единствен- ным в том смысле, что коэффициенты в C) тоже являются единственными, вместе с тем асимптотическое разложение любой функции представляет собой, кроме того, разложение для бесконечного числа функций; например, разло- жение F(Q +е~' совпадает с асимптотическим разложением F(?,) при —-jn< <arg?<-n-:nc. Асимптотическое разложение произведения двух функций равно произведению их асимптотических разложений. Наконец, интегрируя C) почленно, можно получить асимптотическое разложение интеграла от F (l), а дифференцируя почленно — асимптотическое разложение производной от F(Q, если они существует. В общем случае при заданном (достаточно большом) значении | ? [ абсолют- ные величины членов разложения C) сначала спадают до минимума, а затем начинают возрастать. Грубо говоря, если суммировать разложение до какого- ньбудь члена, стоящего перед минимальным, то возникающая при этом ошиб- ка окажемся порядка первого неучтенного члена *). Очевидно, что чем больше | ? |, тем больше достигнутая точность. В физических приложениях часто ока- зывается достаточным учитывать только первый член; например, в теории электромагнетизма поле излучения источника конечных размеров описывается первым членом асимптотического разложения полного поля по отрицательным степеням расстояния до источника. Основа метода получения асимптотического разложения A) по отрица- тельным степеням к заключается н установлении связи подобного разложения с интегралами вида **) $-^)ф. E) о Асимптотическое разложение E) легко получить; для этого функцию ft (и.) нужно разложи 1ь в ряд по степеням и., а затем почленно проинтегрировать его. В последней фразе заключена сущность леммы Ватсона ''н') 110], которую можно сформулировать следующим образом. Пусть цр?<у1*, F) причем радиус сходимости этого ряда равен р, величина |3 вещественна и боль- ше пуля, а вещественная часть а меньше единицы. Пусть существует такое вещественное число d, что величина (.i"exp(—d^)h(}i) ограничена при всех вещественных значениях (х, больших р. Тогда (буквой Г обозначается гамма- функция) выражение ^ ) + cr ( | ) - + сг ( V ) + + 3 I 2 / является асимптотическим разложением E). *) Для ознакомления с методами вычисления погрешностей см [8! **) Выбор и/ о экспоненте, стоящей под nrfxeipd inv, вгесто парной или любой другой степени ц несуществен, четная степень ц удобна в том отношении, что то1да интеграл типа A) с пределами от —-да до оо можно преобразовать в интеграл типа E) с нижним пределом, рав- ным — » ***) См. также [81.
ПРИЛОЖЕНИЕ 3 689 Для физических приложений желательно, чтобы а ^=0 и р" — 1. Как уже отмечалось ранее, первый член в G) тоже часто дает хорошее приближение. Для того чтобы с помощью замены переменной интегрирования интеграл A) можно было представить в виде одного или нескольких интегралов типа E), необходимо, чтобы путь интегрирования в A) состоял из отрезков, вдоль которых мнимая часть /'(г) остается постоянной, а вещественная монотонно убывает до —оо. Если путь интегрирования не удовлетворяет этому требова- нию, его необходимо соответствующим образом деформировать. Такая про- цедура подчиняется, конечно, основным законам интегрирования в комплекс- ной плоскости; здесь будет только показано, каким образом можно замкнуть путь интегрирования с помощью отрезков, обладающих требуемыми свойст- вами, если предположить, что вычисление любого остающегося контурного интеграла можно провести обычным способом. Сцелаем несколько вполне общих замечаний относительно путей интегри- рования, вдоль которых мнимая часть функции f(z) постоянна независимо or вида самой функции. Иными словами, укажем способ соединения двух точек на комплексной плоскости, обладающий отмеченным свойством, хотя этот метод может оказаться непригодным, если f(z) имеет особенности. Важную роль будут играть точки, в которых ' Они называются седловыми точками, потому что в них вещественная и мнимая части /(г) стационарны на комплексной плоскости, не будучи ни абсолютными максимумами, ни абсолютными минимумами *). Если теперь представить f(z) в виде f(z) = u(x, tj) + iv(x, у), (9) то легко показать с помощью соотношений Коши — Римана, что вдоль любого пути v{x, у) = const скорость изменения и(х, у} обращается в нуль лишь в сед- ловой точке. Другими словами, и(х, у) строго монотонна вдоль пути v(x, у) — = const, не проходящего через седловую точку, а вдоль пути v{x, г/) = const, проходящего через одну или несколько седловых точек, и(х, у) строго моно- тонна между соседними седловыми точками, а также между крайними седло- выми точками и соответствующими концами пути интегрирования. Для любой точки направление, вдоль которого и(х, у) спадает быстрее всего, совпадает с направлением, вдоль которого v (x, у) — const, и в этом смысле такие пути называются путями наибыстрейшего спуска. Если функция f(z) однозначна или превращена в однозначную с помощью разреза, то из произвольной точки (Хо, Уо) всегда можно выбрать такой путь интегрирования v(x, y) = v(x0, y0), который непрерывен в направлении умсныиения и(х, у) и заканчивается либо на бесконечности, либо в особой точке. Легко показать, что единственными точками (не считая особых точек), где путь v(x, у) — const может разветвляться, являются точки, в которых dfldz — Q; таким образом, если путь v(x, у)— = v(x0, (/о), вдоль которого и(х, у) спадает, был начат правильно, то в даль- нейшем можно не беспокоиться о наличии другого пути, пока не встретится седловая точка, из которой имеется по крайней мере одно направление спада- ния и(х, у). Предположим теперь, что концевыми точками заданного пути интегри- рования в A) служат Л и В и что можно найти пути наибыстрейшего спуска от Л и В до бесконечности. Если оба пути оканчиваются на бесконечности в од- ной и той же области сходимости интеграла, то процедуру можно считать за- вершенной; однако если они оканчиваются в разных рбластях сходимости, то *) Вещественная и мнимая части аналитической функции не имеют абсолютных макси- мумов и минимумов на комплексной плоскости.
690 ПРИЛОЖЕНИЯ последние нужно соединить или путем v(x, у) = const, вдоль которого скорость изменения и(х, у) меняет знак только один раз (в седловой точке), или в случае необходимости несколькими путями, проходящими через промежуточные об- ласти на бесконечности. Асимптотическое разложение в обобщенном смысле D) можно получить для каждого из этих различных путей интегрирования, однако правильное асимптотическое разложение исходного интеграла соот- ветствует пути, на котором и(х, у) достигает своего наибольшего значения *). Аналогичные замечания справедливы и в том случае, когда пути наибыстрей- шего спуска оканчиваются в особых точках. Необходимо отметить, что в ряде случаев описанный метод не годится, но их исследование становится возможным при небольшом его видоизменении. Прежде всего отметим, что замена верхнего предела в E) любым положитель- ным числом (не зависящим от k) не приводит к изменению асимптотического разложения G). Следовательно, этот случай можно исследовать, используя путь наибыстрейшего спуска, вдоль которого и(х, у) стремится не к —со, а к конечному значению. Как и раньше, можно использовать путь v(x, у) = const, на котором лежит несколько точек, где скорость изменения и(х, у) ме- няет знак. Наиболее распространенным случаем, к которому применим метод наи- быстрейшего спуска, является тот, где путь интегрирования v(x, у) ~ const идет от седловой точки до бесконечности, причем вдоль пего и(х, у) все время монотонно спадает **). В этом случае легко получается хорошо известная формула для первого члена асимптотического разложения. Положим, что седловая точка находится в г?( и произведем в A) следующую замену пере- менных: Тбгда A) примет вид -2ехр [ft/(г,)] jJfgj.pexpC- *,i*)d|i. A1) Для получения первого члена асимптотического разложения A1) надо знать величину jig (?)//' (г) при ц. =0 (г = г0). Легко показать, что эта величина равна g(za)lV—2/"(г0), если gfo) не стремится к бесконечности, а /"(г„)=^0; знак корня выбирается в каждом отдельном случае особо. Тогда искомый первый член разложения имеет вид Необходимо сделать несколько замечаний относительно случаев, когда приближение A2) недостаточно или несправедливо. Полное асимптотическое разложение получается, конечно, если разложить fig"(г)//' (г) в степенной ряд по |А, а затем почленно проинтегрировать A1). Как видно из G), степень k в первом члене асимптотического разложения определяется степенью \х, с ко- торой начинается разложение в ряд \*.g(z)/f (г). Если первый член такого ряда равен А[1~р, где р<1, что обеспечивает сходимость интеграла, то первый. *) Возможны, конечно, случаи, когда и(х, у) достигает наибольшего значения на не- скольких путях интегрирования. *я) Строго говоря, наиболее распространенным является случай, когда путь интегриро- вания начинается и оканчивается на бесконечности, а и(х, у) сначала монотонно нарастает от — со до максимума в седловой точке, а затем монотонно спадает до —ао. В этом случае выраже- ние A2) необходимо умножить на 2, однако для наших целей удобнее выбрать путь, начинаю- щийся в седловой точке. Поскольку случаи, в которых путь интегрирования начинается в сед- ловой точке или проходит через нее, столь распространенны, метод наибыстрейшего спуска иногда называют методом седловой точки.
ПРИЛОЖКНИЕ 3 691 член асимптотического разложения имеет вид \ 2 ) ft(i-P)/2 ' ^ Таким образом, если §(г0)->-зо или /"(го)=О, то выражением A2) пользо- ваться нельзя и его следует заменить на A3). В этом случае при k—*-<x> множи- тель перед exp {kf(z,,)} стремится к пулю медленнее, чем k~li*. Если g(ze) ~0 или /"(z0)—>-оо, то A2) нельзя считать пригодным, но при &->-оо множитель перед exp {kf(z0)} стремится к нулю быстрее, чем ft'*. Легко показать, что когда путь интегрирования, являющийся путем наи- быстрейшего списка, оканчивается, как и раньше, па бесконечности, но на- чинается не в седловой точке, то в общем случае неэкспоненциальная часть в первом члене асимптотического разложения пропорциональна не k'1^, как в A2), a k~L. Если же величина g(z)/f'(z) имеет особенность или равна нулю в концевой точке, то, как и ранее, степень k зависит от порядка особенности или нуля. До сих пор были приведены результаты, получающиеся методом наибыст- рейшего спуска, для асимптотических разложений в строгом математическом смысле, причем считалось, что величина k может становиться бесконечно боль- шой, а остальные параметры имеют определенные значения, не зависящие от к. Однако было показано, что вид асимптотического разложения зависит от не- которых условий, в частности от того, начинается ли путь наибыстрейшего спуска в седловой точке или нет. Иными словами, вид разложения может за- висеть не только от k, но и от других параметров, и может резко меняться, когда эти параметры принимают определенные критические значения *). Таким образом, для любого данного значения k независимо от того, насколько оно велико, приведенное выше выражение не дает хорошего численного прибли- жения, если значения остальных параметров достаточно близки к критиче- ским. Следовательно, практически необходимо получить выражения, обеспе- чивающие плавный переход от одного асимптотического разложения к другому. Естественно, что эти выражения представляют собой более сложные функции k, чем A3), однако имеет смысл рассмотреть три случая, которые можно ис- следовать довольно строго. В кратком обзоре, излагаемом ниже, везде неявно предполагается, что комплексность всех величин такая же, как и раньше. Предположим сначала, что /"(?») обращается в нуль. Тогда A2) служит хорошим приближением лишь для случая больших к, и необходимо выраже- ние, с помощью которого можно перейти от A2) к другой форме, пригодной при /" (г0) = 0. Поскольку величина f" (г0) близка к нулю, около г0 должна су- ществовать вторая седловая точка, скажем, гь Тогда искомое выражение полу- чается с помощью преобразования p> + i3 где Это преобразование представляет г в качестве регулярной функции и. в окрест- ности г„ и Zj и приводит к асимптотическому разложению, выраженному чере* интеграл Эйри **) и его первую производную по аргументу k\i. •) По сути дела такое поведение обусловлено неравномерной сходимостью. Например, при Дг-»оэ величина стремится либо к \lka при аф 0, либо к 1 при а=0. *") Роль интервала Эйри в однородных аппроксимациях такого типа была обнаружена ужа давно (см., например, [8]), по лишь сравнительно недавно Оыл разработан удовлетворителывдй метод его использования (см. [11]), 44*
692 ПРИЛОЖЕНИЯ Предположим далее, что разложение \*-g(z)lf (г) в степенной ряд по [д. имеет радиус сходимости, стремящийся к нулю, так как g(z) обладает простым по- люсом, находящимся вблизи седловой точки. Тогда A2) снова служит лишь хорошим приближением для случая больших к, и требуется найти выражение, с помощью которого можно перейти от A2) к другой форме, пригодной при совпадении полюса с седловой точкой. Последний случай исследовался многи- ми авторами [12—16]. Оказалось, что неэкспоненциальную часть подынтеграль- ного выражения следует представить в виде суммы двух членов, один из ко- торых содержит только полюс, тогда как другой не имеет особенностей. С по- следним членом обходятся обычным образом, а первый сводится к интегралу Френеля (или интегралу ошибок) в общем случае от комплексного аргумента. Наконец, предположим, что начальная точка пути наибыстрейшего спуска не совпадает с седловой, но приближается к ней весьма близко. Ясно, что в этом случае для перехода от одной асимптотической формы к другой снова можно воспользоваться интегралом ошибок [14]. 2. Метод стационарной фазы. Метод стационарной фазы отличен от метода наибыстрейшего спуска, хотя они и весьма сходны между собой. Метод стацио- нарной фазы менее общий, и его труднее доказать аналитически, но он часто теснее связан с физической задачей. Подлежащий исследованию интеграл удоб- нее записать в виде чем в форме A), поскольку экспонента обычно описывает бегущую волну. В обозначениях (9) кривая v(x, z/) = const снова описывает путь интегри- рования; однако в A4), в противоположность методу наибыстрейшего спуска, амплитудная часть экспоненты остается постоянной вдоль этого пути, тогда как фаза меняется с максимальной скоростью. Можно, как и раньше, показать, что основные вклады в интеграл вносят отрезки пути, лежащие вблизи седло- вых и концевых точек, однако физическое толкование этого результата про- водится теперь не в терминах спадания амплитуды, а в терминах «фазовой ин- терференции» (см, §8.3). Метод стационарной фазы был впервые использован Кельвином [17]. Строгое математическое рассмотрение изложенных выше утверждений при- надлежит Ватсону [18]; оно основано на том, что если 0<m< I, a — положи- тельная постоянная и полная флуктуация функции F(х) ограничена при х^>0, то *) при /г->оо xm-1F{x)ex?{ikx)dx—> F @) Г (пг) ехр (-j imn\, 6 Исследование Ватсона имеет, однако, весьма ограниченное применение. В частности, с его помощью, по-видимому, невозможно провести полное асимп- тотическое разложение. Полное разложение было подробно исследовано в ра- боте Фокке [20] для случая, когда /(г) — вещественная функция, а путь ин- тегрирования совпадает с действительной осью. Фокке использовал метод нейтрализующей функции, предложенный ранее Вандер-Корпутом [21]. Следствия, вытекающие из метода стационарной фазы и из метода наибыст- рейшего спуска, весьма сходны. Так, если путь интегрирования в A4) начи- нается в седловой точке г„ и уходит в бесконечность вдоль кривой v(x, у) = = const, не встречая другой седловой точки, то приближение, соответствую- щее A2), имеет вид 1 ,.„ \ exp (ikf (г,,)) ,.Г, *) Этот результат принадлежит Бромвичу [19].
ПРИЛОЖЕНИЕ 3 &93 Однако здесь необходимо отметить одно различие между обоими методами. При использовании метода наибыстрейшего спуска с путем интегрирования, начинающимся в седловой точке и не уходящим па бесконечность, вклад в асимптотическое разложение от концевой точки пути оказывается бесконечно малым по сравнению со вкладом от седловой точки, поскольку первый содержит дополнительный экспоненциальный множшель. Вместе с тем при использо- вании метода стационарной фазы вклад от концевой точки пути интегрирования равен но порядку величины вкладу от седловой точки, деленному на ?'/«; по- этому он не входит в асимптотическое приближение только в том случае, если учитывается лишь первый член разложения. Таким образом, методы наибыстрейшего спуска и стационарной фазы (если отвлечься от их математического представления) состоят в выборе такого пути интегрирования, вдоль которого подынтегральное выражение, содержащее экспоненциальный множитель, вносит пренебрежимо малый вклад в интеграл везде, за исключением окрестностей некоторых критических точек, являющихся либо седловыми, либо концевыми точками пути интегрирования. 3. Двойные интегралы. В § 8.3 и 9.1 было показано, что решение задачи о дифракции электромагнитного поля на отверстии сводится к вычислению двойных интегралов типа \\ g (х, у) exp [ikf (х, у)] dx dy, A6) где g(x, у) и f(x, у) не зависят от k, а область интегрирования определяется отверстием. Ясно, что интеграл A6) сходен с A4), и его приближенное значение при больших k можно также получить с помощью асимптотических разло- жений. Естественно, что теория асимптотических разложений двойных интегра- лов намного сложнее, чем в случае однократных интегралов. Техника интегри- рования на комплексной плоскости непосредственно применима лишь для однократных интегралов, поэтому представляется, что для вычисления двой- ных интегралов следует воспользоваться методами, отличными от изложенных выше. Случай, когда f(x, у) является вещественной функцией, подробно иссле- довался Фокке с помощью нейтрализующей функции в работе [20] *); мы уже ссылались на нее в связи с применением этого метода к однократным интегра- лам. Анализ показывает, что вклады в асимптотическое разложение вносят лишь области в окрестностях определенных критических точек и что при различных типах таких точек **) в главных членах соответствующих вкладов появляются разные степени k. Существуют три типа критических точек. Исследуем кратко главные члены их вкладов в асимптотическое разложение, не учитывая случаев, когда крити- ческая точка принадлежит одновременно к нескольким типам. Критической точкой первого рода является точка, лежащая в области ин- тегрирования, в которой JhJH- A7) Вблизи этой критической точки, скажем в точке (хо, у<>), имеем f(x, y) = f(x,. Уь) + ^*(х-ХъУ + ~§(у-уа)* + ч(х-ха)(у—у,) + „., A8) где a = d%f/dx2, $ = дг[/ду2, у = д^/дхду, причем частные производные берутся в точке (х0, у о)- Выберем теперь такие новые переменные интегрирования \, ц, *) См. также [22, 23, 23а]. **) Критические точки для двойных интегралов упоминаются в работе [21]; их качест- венное значение для задач оптики отмечено в статье [24].
694 приложения что f(x, y) = f(xt, уо) + таЕ' + тРт1' + Т6т1' Тогда искомое асимптотическое приближение интеграла A6) примет вид g(x0, yo)txp[ikf(x0, y0)] J J exp[l^(a^ Г ч ехр [/?/(.*„, уоI . квадратный корень *) во второй строчке выражения B0) берется со знаком плюс, и ( +1 при ар > у\ а> О, сг == < —1 при ар > у2, а<0, B1) (^ —( при аE <f2- Выражение B0) является аналогом асимптотического приближения A5) для однократного интеграла. Критическими точками второго рода служат точки на кривой, ограничи- вающей область интегрирования, в которых df'ds — O, где s есть элемент дуги этой кривой. В отличие от B0), степень k в иеэкспонснциальной части главного члена соответствующего вклада в асимптотическое разложение равна не —1, а —3/2. Наконец, критическими точками третьего рода служат угловые точки на кривой, ограничивающей область интегрированил, т. е. точки, в которых угол наклона кривой терпит разрыв. В этом случае соответствующий множитель равен k~'1. ПРИЛОЖЕНИЕ 4 ДЕЛЬТА-ФУНКЦИЯ ДИРАКА В настоящем приложении приводится сводка основных свойств дельта- функции **), которая оказалась полезной при описании точечных источников, точечных зарядов и т. д. Эга функция, используемая особенно часто как в квантовой механике, так и в классической прикладной математике, опреде- ляется с помощью следующих уравнений: 8(х) = 0 при хфО, Aа) ] l. A6) Очевидно, что б(х) не является функцией в обычном математическом смыс- *) Член, стоящий под корнем, и^еет простое геометрическое истолкование. Рассмот- рим поверхность г—}(х, у). Пусть Rt в /?2 — главные радиусы кривизны и К— MR^R^ —• гаус- сова кривизна в какой-либо точке нашей поверхности. Тогда (см., например, [25]) (fx.xfttU — fxy) где fx-=df/dx, Cxx—c^f/dx^ и т. д. В критической точке первого .рода /х=/'«=0, fxx=a и т. Д.. и полученное выражение принимает вид К=сф — V2- **) Эта функция иногда называется импульсной функцией. Она получила широкую из- вестность после опубликования работы Дирака [26], по о ней знали математики и физики зна- чительно раньше, в основном благодаря работам Хевисайда (см. [27]).
ПРИЛОЖЕНИЕ 4 695 ле *), поскольку, если функция равна нулю везде, за исключением одной точки, а интеграл от нее существует, то этот интеграл обязательно должен рав- няться нулю. Рассмотрим набор функций б(х, (а), которые при увеличении р отличают- ся заметно от нуля лишь па все меньшем и меньшем х-интервале около начала координат, а их интеграл ' - *»,,„. для всех значений (х равен " \w единице; т. е. Ь(х, B) Такими функциями слу- жат, например, следующие (рис. 8): «(JC, A) = = !=- ехр (— fiV). C) -1,8 -1,2 -0,8 -0,4 0-0,4 0,8 ?? 1,8 х Рис. 8. R определению дельта-функции Дирака. Графики функции 6 (х, д)= - 2,4. Соблазнительно попы- таться определить дельта- функцию Дирака как пре- дел функций C) при [х->оо; однако следует иметь в виду, что такой предел существует не при всех к. Предел же Полная площадь под каждой кривой равна единице. lira ¦ \ М - о» - 0 б (х, ц) их D) ¦существует всегда и равен единице. Будем интерпретировать любую операцию над б (х) как операцию над какой-то б (х, fi) из соответствующего набора, на- пример из C), с последующим нахождением предела при ц—»- оо в конце вычис- лений. Очевидно, что при такой интерпретации соотношение A6) выполняется. Явный вид функций 6 (.к, ц) несуществен при условии, что их колебания (есл,» •они существуют) около начала координат не слишком резки. Важным свойством дельта-функции Дирака является следующее: + 00 \ nx)b(x—a)dx = f{a). E) — Л Здесь f(x) — любая непрерывная функция х. Справедливость E) сразу же становится очевидной, если заменить 8(х—а) на 8(х—а, \и) и исследовать поведение интеграла при больших значениях ц. Ясно, что при |л-»-оо /(лг)б(лг—a, n)dx F) существенно зависит от значений f(x) в окрестности точки х = а, и погрешность, возникающую при замене }(х) на f(d), можно сделать пренебрежимо малой, взяв достаточно большое (Л. Используя затем A6), получим E). Отсюда ¦следует, что умножение непрерывной функции на 6(х—а) и последующее ее интегрирование по всем значениям х эквивалентно замене ее аргумента на а. *) Теорию дельта-функции мещно сделать математически строгой путем использования понятий распределений (см. книгу Шварца [28]). Более простой вариант теории Шварца был лредложеа Теыплом [29] к. чписан б книге [30].
696 ПРИЛОЖЕНИЯ Фактически тот же результат получится, если интегрировать функцию не от -—оо до +оо, а по любой области, содержащей точку jf = a. Полученный ре- зультат можно символически записать еще и в виде f(x)b{x—a) = f(aN(x—a); G) гри такой записи мы видим, что правая и левая части G) дают одинаковый результат после интегрирования. В частности, при /(х) — х, а = 0 соотношение G) дает хб (х) = 0. (8) Аналогичным образом легко доказать справедливость следующих выра- жений: 6(-х) = 6(х), (9) в (ах) =-fir-6 (х), A0) ^ A1) $ б (а—х)Ь(х—b)dx = 6(a—b). A2) Для доказательства справедливости, например, A0) сравним интегралы от / (х) б (а х) и f М-Лг е (а$ • Имеем +00 + СО J f{x)b[ax)dx=± J f{^ где второй интеграл берется со знаком плюс или минус в зависимости от того» положительно ли а, отрицательно или равно 0. Из E) следует, что Как мы видим, эти интегралы совпадают, что и означает справедливость A0). Аналогично соотношение A2) означает, что если умножить обе его части на непрерывную функцию от а или Ь и проинтегрировать соответственно по всем значениям а или Ь, то мы получим тождество. Выясним далее, как можно интерпретировать производные от дельта-функ- ции. Используя «аппроксимирующие функции» 8 (х, \х) и интегрируя по частям, получим + а> +ое J f(xN'(X, lx)dX = f(oo)8(oo, n)_f(_ooN(-oo, ,*)_ 5 Г(Х)Ь(Х, n)dx. — о» - с» При переходе к пределу при ц-»-оо первые два члена в правой части исчезают, и мы имеем 5 f(xN'(x)dx = — f'@). A3) — да Повторяя этот процесс, найдем + 00 ] f(x)^(x)dx = (—1)"/<")@). A4) — со Легко доказать справедливость следующих соотношений: Ь'(—х) = —Ь'(х), A5)
ПРИЛОЖЕНИЕ 4 697 Часто оказывается удобным (см., например, приложение 6) выразить дельта-функцию Дирака через единичную функцию Хевисайда (называемую иногда ступенчатой функцией) U(x), определяемую соотношениями ?/(*) = 0 при лг<0. \ U{x) = l при х>0. j ( ' Если, как и раньше, обозначить штрихом производную по х, то, интегрируя по частям (при *i>0, хг>0), формально получим f (х) V (х) их = [f (х) U (x)]*jXt — $ Г (х) U(x)dx^ о Полагая х — у—a, f(x) = f(y—а) — F(y) и переходя к пределу xl-*-oo, жа- имеем J F(y)U'(y—a)dy = F(a), — OS т. е. U' обладает свойством E). В частности, при Fssl иа = 0 находим следовательно, U' удовлетворяет соотношению A6). Более того, И'{х)=0, , когда хфО. Таким образом, производную от единичной функции можно иден- тифицировать с дельта-функцией, т. е. b(x) = ±U(x). A8) Дельта-функцию можно также ввести с помощью интеграла Фурье + 00 f(a)=k Idk Полагая K(x-ati>,) = ± J exp [_ife(x_-a)]dfe = Elg?^l B0) -ц и изменяя порядок интегрирования, соотношение A9) можно формально пред- ставить в виде /(a)= J f(x)K{x-a)dx, B1) — 00 где К(х—а) есть предел К(х—a, \i) при ц-»-оо. Строго говоря, такой предел в обычном смысле не существует *) при х—афО, однако B1) имеет такой же смысл, как и ранее рассмотренные интегралы, т. е. /(e)= lira I f(x)K(x-a, p)dx. B2) м-*» -» Таким образом, К обладает свойством E). Полагая /(*) = 1 в B1), находим, что интеграл от К(х), взятый по всем значениям х, равен единице. Следова- *) Такой предел существует н равен нулю, если его рассматривать в смысле Чезар» (см. [27]).
€98 приложения тельно, мы получили еще одно представление дельта-функции Дирака, а именно B3) т. е. б (х) можно рассматривать как фурье-образ от единицы. Существует и обратное соотношение, получающееся из B1), если положить /(х) = exp (ikx) и а = 0, а именно J 6(х)ехр («&с)dx=l. B4) —» До сих пор мы рассматривали лишь одномерное пространство, но все най- денные соот ношения легко обобщить на случай нескольких измерений. В част- ности, рассмотрим трехмерное пространство. Тогда функция 8(х,у,г) = 8(х)8(у)8(г), B5) обозначаемая часто через б (г), где г—вектор с компонентами х, у, г, удов- летворяет, очевидно, соотношениям, аналогичным A), т. с. 8(х,у,г) = 0 при хфО, уфО, гфО, B6а) \\l = \. B66) ¦Свойство E) можно представить теперь в виде l\lf(x,y,z)8{x—a,g—b,z—c)dxdydz=i(a,b,c), B7) — OS ¦И 6 (х, у, г) удовлетворяет обратным преобразованиям Фурье 4- со 8(х,д,г) = щ? jJJ exp [—i (kxx + kyy + k,z)] dkx dky dk^ B8) l. B9) ПРИЛОЖЕНИЕ 5 МАТЕМАТИЧЕСКАЯ ЛЕММА, ИСПОЛЬЗУЕМАЯ ПРИ СТРОГОМ ВЫВОДЕ ЗАКОНА ЛОРЕНТЦ — ЛОРЕНЦА В настоящем приложении мы докажем ,лемму, используемую в п. 2.4.2, -согласно которой rot rot j Q (r') G (R) dV'-»j rot rot Q (r') G (/?) dV'-\^-Q(r) A) о о при о-»-0. Здесь Q(r) — произвольная векторная функция координат и G(R) = = exp (ikR)lR. Интегралы берутся по объему, ограниченному снаружи по- верхностью S и внутри поверхностью сферы о радиуса а, центр которой на- ходится в точке Р с радиусом-вектором г (я, у, г). R обозначает расстояние |г—г' |, где г'(х', у', г') ¦— радиус-вектор элемента объема dV. Пусть А — произвольная векторная функция координат. Компоненты rot rot А имеют вид (rot rot А), = -т—j" + з—ir- з-r- ггт-
ПРИЛОЖЕНИЕ 5 699 и т. д., так что (rotrot?QGdr) B) Тогда для произвольной дифференцируемой скалярной функции ^(г, г') имеем C) где 0" — поверхность небольшой сферы радиуса а с центром в точке Т(х-\-Ьх, у, z). Для определения предела в C) заметим, что разность двух интегралов характеризует вклады от двух областей, заштрихованных на рис. 9. Элемент объ- ема можно записать в виде 6У'= — bS'6xpx, где 65' — элемент поверхности и рх — х-компопента единичного радиального век- тора р, выходящего из точки Р, Следо- вательно, [у у _ \FdV'—\FdV' ° a J xdS'. D) Рис. 9. К вычислению предела 11ш ~\ { FdV г— f f dv . Центр о расположен а точке Р (х, у, г), центр а'— в точке Т {х-т-6.*, #. г). Положив F = Q;(r) G (R), где Q7 (/ = х, у или г) — любая декартова компонента вектора Q, получим из C) и D) §-x\{Qfi)dV' = l§-x{ E) Рассмотрим далее частные производные второго порядка. Продифферен- цировав последнее соотношение по х и снова используя его, находим F) G) Поскольку dG _dGdH _ d exp (ikR) dZ~~dRdZ~~~PxdR R * где dQ — элемент телесного угла, имеем при a->0 здесь Q — поверхность единичной сферы. Последний интеграл в F) обращается в нуль при а—э-0, в результате чего получим (9)
700 ПРИЛОЖЕНИЯ Смешанные вторые частные производные можно вычислить таким же об- разом. Например, имеем Член —"jrQ/O") теперь отсутствует, поскольку интеграл, соответствующий (8), равен К dS' = J P-PyQ/ ( а т. е. стремится к нулю при а-*-0. Подставляя уравнения вида (9) и A0) в B), получим при а-»-0 rotrot f(QG)dV" -* [ rotrot(QGW + ^Q,. A1) L о ix La Jx Аналогичные выражашя йаходим и для у- и «-компонент. Комбинируя эти три соотношения, получим векторную формулу A). ПРИЛОЖЕНИЕ « РАСПРОСТРАНЕНИЕ РАЗРЫВОВ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ В п. 3.1.1 отмечалось, что уравнение эйконала в геометрической оптике идентично уравнению, строго описывающему распространение разрывов элект- ромагнитного поля. В более общем виде можно показать, что четыре уравнения C.1.11а) — C.1.14а), характеризующие поведение электромагнитного поля, создаваемого геометрическими световыми лучами, совпадают с уравнениями, связывающими векторы поля на движущейся поверхности разрыва. Цель настоящего приложения состоит в математическом доказательстве этой экви- валентности. 1. Соотношения, связывающие разрывы непрерывности векторов поля. В п. 1.1.3 мы рассматривали разрывы векторов поля, возникающие из-за рез- кого изменения материальных параметров еиц, скажем, на поверхности линзы. Разрывы в нолях могут также возникать и но совершенно иным причинам, например вследствие того, что источник внезапно начнет излучать. Тогда поле распространяется в пространство, окружающее источник, и с течением времени заполняет все большую и большую область. На границе этой области поле терпит разрыв, причем внутри области векторы ноля в общем случае конечны, а вне ее они равны нулю. Установим сначала некоторые общие соотношения, справедливые иа любой поверхности, на которой поле терпит разрыв. Пред- положим для простоты, что для любого момента времени ^>0 существует только одна такая поверхность; обобщение на случай нескольких поверхностей разрыва (возникающих, например, при отражениях от препятствий, находя- щихся в среде) не представляет труда. Пусть F (х, у, г, t) — произвольная поверхность, на которой по крайней мере один из векторов поля терпит разрыв. Если она фиксирована в прост- ранстве, то F, конечно, не зависит от t. Точки по разные стороны от этой по- верхности характеризуются неравенствами F<0 и F>0. Пусть Е — вектор электрического поля, и пусть Е (х, у, z, t) = ЕA) (х, у, z, t), когда F(x, у, z, t) < 0, Е(х, у, г, t)=^Ew{x, у, г, t), когда F (х, у, г, t) > G. Тогда Е можно записать в виде Е = EWU (-F) + ЕB>?/ (F), B) где U ¦— единичная функция Хевисайда (см. уравнение A7) приложения 4), 0, 1 G. j
ПРИЛОЖЕНИЕ 6 701 С помощью B) получим выражения для rot E, div E, dE/df и т. д., входящих в уравнения Максвелла. При дифференцировании суммы или произведения, содержащих разрывный множитель, применим обычные правила дифференци- рования и соотношение A8) приложения 4 ? = б (*), C) где 6 — дельта-функция Дирака. Так, например, из B) получим rot Е = U (—F) rot Eu> + U (F) rot E™ + -t- [grad U (—F)} x Е<» + [grad U (F)] X E<2>. D) Далее имеем grad U (-F) = — grad U (F) = - ^^ grad F = — 8 (F) grad F, E) а из последних двух соотношений следует, что rot Е = U (—F) rot Eu> + U (F) rot Е<« + б (F) grad F X (ДЕ), F) где ДЕ = ЕB)—ЕA). G) Аналогичным образом находим div Е = U (-F) div ЕA> + U (F) div ЕB) + б (F) grad F- ЛЕ, (8) "-Ui-n^ + U^+w'i*. О) Токи и заряды можно представить в таком же виде, как и векторы поля, однако если материальные параметры е и (г терпят разрыв на поверхности F = О, то в этих выражениях могут появиться дополнительные члены, содержащие поверхностную плотность тока j и поверхностную плотность заряда р. Вклады от этих величин описываются уравнениями A.1.17а) и A.1.18а), так что в ре- зультате мы получим j = |ШG (_/г) +i<nV (F) +~j | grad p = p<i>[/ (—f) _p(«?/ (F) + p | grad F | Подставим теперь соотношения F), (8), (9), A0), A1) и аналогичные соот- ношения для других векторов поля в уравнения Максвелла A.1.1) — A.1.4). Члены с индексами A) сокращаются так же, как и члены с индексом B), по- скольку по обе стороны от поверхности разрыва поля удовлетворяют уравне- ниям Максвелла. Оставшиеся члены дают следующие соотношения, связываю- щие разрывы векторов поля: ff 4^!|, A2) y^ A3) gradF-AD,-4np~|gradF|, A4) gradF-AB = 0, A5) Интересно отметить, что эти уравнения получаются формально из уравнений Л1аксвелла, если заменить векторы поля Е, Н, D, В па разности АЕ, ДН, AD, ДВ, величины j и р на j и р и дифференциальные операторы уг-, %- , ¦=-, дт на ОХ Оу 02 Ot операторы \ д?_ 1 dF I dp 1 дР | grad р | <ЙГ ' | grad F \ ~ду ' | gradTf d? ' | grad F | ~dt * Пусть п12 — единичный вектор, нормальный к поверхности разрыва и направленный из области F<0 (индекс 1) в область F>0 (индекс 2):
702 приложения Введем также скорость v, с которой движется поверхность разрыва. Неболь- и:сму смещению 6гFх, Ьу, &) из точки на поверхности разрыва Fix, у, г, 1) —О до точки па соседней поверхности разрыва соответствуег такое изменение вре- мени Ы, что gradf-6r+^8/ = 0. A7) В частности, для смещения вдоль нормали бг = 8snI2, так что скорость а дается выражением rfs_ 1 dF V~df~ Tgrad F\W llb> Соотношения A2) — A5) можно записать тогда в виде *): n12xAH + yAD = i5j, A2а) щ, хДЕ — уАВ-^0, A3а) n13-AD = 4n(>, A4а) п,3.ДВ = 0. A5а) Если разрывы векторов полей возникают из-за резкого изменения вели- чин материальных параметров е и р. на поверхности Р(х, у, г) = 0, положение которой фиксировано в пространстве, то v = 0 и соотношения A2а) — A5а) сводятся к уравнениям B5), B3), A9) и A5), приведенным в § 1.1. . . 2. Поле на движущейся поверхности разрыва. Рассмотрим движущуюся поверхность разрыва, возникающую из-за присутствия источника, внезапно начинающего кзлучать. Представим эту поверхность в виде F(x,y,z,t)=-^8:(x,y,z)—ct = Q, A9) где с — скорость света в вакууме. Векторы поля на поверхности разрыва мы будем обозначать маленькими буквами, т. е. е(х, у, г) = Е \х, у, г, ±-&(х, у, г)] ; B0) аналогичные выражения справедливы н для других векторов поля- Далее, в области за движущейся поверхностью (скажем, при F(x, у, г, 0>0) поле равно нулю, так что, согласно A) и G), имеем ЛЕ--=—-Еш=-—е и т.д. Из материальных уравнений A.1.10) и A.1.11) следует, что d —ее, b = jxh, и если положить ] =--- 0, р — 0, то из A2) — A5) получим = O, B1) = 0, B2) = 0, B3) = 0. B4) Эти уравнения формально совпадают с основными уравнениями C.1.11а) — C.1.14а) геометрической оптики. Следовательно, векторы поля на движущейся поверхности разрыва подчиняются точно таким же уравнениям, как и гармо- нические по времени векторы поля в приближении геометрической оптики, причем движущейся поверхности разрыва соответствуют геометрические вол- новые фронты **). *) Эти уравнения служат обобщением системы соотношений для разрывов полей, извест- ных, но-видгмому, еше Хевисяйду. См. также [31 — 36] и, кроме того, [23а] стр. 37—51 и [33]. Исполъзусм!- й здесь метод вьвода этих уравнений принадлежит Бреммеру [37]. *!") Можно также показать, что е и h удовлетворяют тем же уравнениям переноса (см. C.1.41), C.1.42)), что и комплексные векторные амплитуды полей в геометрической оптике. Этот результат был впервые устано'влен Лунебергом [34]. См. также 123а] стр. 162 и 138).
ПРИЛОЖЕНИЕ 7 703 Очевидно, что движущаяся поверхность разрыва должна удовлетворять уравнению эйконала \дх) +{ду) +[дг ) ~П • Bо> где гс2 — г\а. Это уравнение выводится так же, как и ранее. Оно служит усло- вием совместности уравнений B1) и B2) и следует из них после исключения h или е и использования B3) или B4). Согласно A8), A9) и B5) поверхность разрыва движется со скоростью v = с/п. ПРИЛОЖЕНИЕ' КРУГОВЫЕ ПОЛИНОМЫ ЦЕРНИКЕ В настоящем приложении будут более подробно рассмотрены круговые- полиномы, о которых мы кратко говорили в п. 9.2.1. Эти полиномы были впер- вые введены и исследованы Цсрнике F39] в его сажной работе, посвященной исследованию метода темного ноля и фазового контраста; затем они изучались им и Бринкманом 140J, а также Нижбером [41J. Эти полиномы были позднее выведены только из требования ортогональности и инвариантности [421; в нашем изложении мы будем придерживаться в основном последнего иссле- дования. 1. Некоторые общие замечания. Нетрудно показать, что существует бес- численное множество полных систем полиномов от двух вещественных пере- менных х и у, ортогональных внутри единичного круга, т. е. удовлетворяющих условию ортогональности С С * Здесь F(,, и У(„, — два произвольных полинома системы, звездочка — комп- лексное сопряжение, б — символ Кронекера и А^ — нормировочная постоян- ная, которая будет определена позднее. Круговые полиномы Цернике отли- чаются от полинорлов других систем некоторыми простыми свойствами инва- риантности, которые проще всего объяснить в рамках теории групп. Однако с помощью своего рода нормировки можно избежать введения абстрактного формализма теории групп. Рассмотрим сначала такие системы полиномов, ко- торые «инвариантны по форме» относительно поворота координатных осей во- круг начала координат. Такая инвариантность означает, что при любом по- вороте х' =хсозф + (/51Пф, у' = — л: sin ф + у cos ф B) каждый полином V(x, у) переходит в полином такого же вида, т. е. при исполь- зовании преобразования B) V удовлетворяет следующему соотношению: V (х, y) = G (ф) V (х1, у'), C) где 0(ф) — непрерывная периодическая функция угла поворота ф с периодом 2я и G@) = 1. Далее, осуществление двух последовательных поворотов на углы ф1 и ф2 эквивалентно одному повороту на угол ф] + фг. Следовательно, из C) следует,. что величина G должна удовлетворять функциональному уравнению Общее решение этого уравнения, имеющее период 2я, хорошо известно *): 1 = ехр(г7ф). E) *) См., например, [43].
704 приложения Здесь I — любое целое число, положительное, отрицательное или нуль. Под- ставляя E) в C), полагая х' =р, у' =0 и используя B), получим, что V дол- жен иметь вид V(pcoscp, psin<p) = #(p)cxp(G(p), F) где R(p)~V(p, 0) зависит только от р. Разложим теперь ехр(Gср) в ряд по степеням costp и sin ср. Предположим, что V— полином степени п от перемен- ных x = pcos(p и z/ = psinq); тогда из F) следует, что R (р) есть полином по р степени и и не содержит степеней р, меньших |/1. Более того, R (р) является, очевидно, четным или нечетным полиномом в зависимости от четности числа /. Система круговых полиномов Цернике отличается от псех других подобных систем тем, что она содержит полином для каждой пары возможных значений п (степень) и / (угловая зависимость), т. е. для всех целых значений п и /, для которых п^О, /§ 0, 1С^\1\, an— \l\ — четное число. Обозначим произ- вольный полином этой системы следующим образом: ). G) Из A) и G) следует, что радиальные полиномы R'n(p) удовлетворяют соот- ношению $#»(Р)#л'(р)РФ=а«в»Л', (8) где ° * = Ш. О) Для любого заданного значения / нижний индекс п может принимать только значения \1\, | /1 + 2, | /1 + 4,... Соответствующая последовательность Я\ц (р), Rm+t (Р)> Rw+i(p) ••• получается путем ортогонализации степеней pl'i, pl'l+2, pl «1+4, _. A0) с весовым множителем р на интервале О^р^ 1. Далее, поскольку в A0) вхо- дит только модуль I, то Rnl(p) = KRln(p), A1) где fin— постоянная, зависящая только от нормировки полиномов R^' и R'n. В частности, она может быть выбрана так, чтобы р{, = 1 для всех значений / и п, и тогда У^1" (р cos <р, рз1пф) = ^7(р)ехр(±«'Пф)) A2) где т— \1\ — неотрицательное целое число. Система круговых полиномов содержит — (я+ 1)(п + 2) линейно незави- симых полиномов степени ^.п. Следовательно, любой одночлен х'уЦ^О, j^s?Q — целые числа) и любой полином по х и у можно представить в виде ли- нейной комбинации конечного числа круговых полиномов Vln. Тогда в соот- ветствии с теоремой Вейерштрасса *) такая система будет полной. 2. Точные выражения для радиальных полиномов /?,fm (р). Поскольку Rn (p) есть полином по р степени га и он не содержит степени р, меньшей т, и является четным или нечетным в зависимости от того, четно или нечетно п, то его можно представить в виде Rim(p) = tmi*Qn-m{t), A3) где 2 t = p2 и Qn-m(t) — полином по t степени -у(п—т). Согласно (8) *) См., например, [44],
приложение 7 705 ¦полиномы Q должны удовлетворите соотношениям 1 §im6kll., где й = у(п — т), к' =^{п' — т). A4) о Отсюда следует, что полиномы Qo (t), Q, (t) Qk (t), ... можно полу- чить ортогонализацией последовательности натуральных степеней 1, t, F **, ... A5) с весовым множителем w(t) = tm в области O^tf^l. Хорошо известные полиномы Якоби (или гипергеометрические функции) (см. [44]) G*(P. 4,t) = ^zl)-T^-H\-tL-P^^-^H\-t)P-<'^]^ A6) И(Н)'у, n, (P + k+sl)\ (ft S —0 ^^0, g > 0, p — g> — 1) можно определить как функции, получающиеся при ортогонализации A5) с весовой функцией более общего вида в области 0 ^ t ^ 1, Свойства ортонормируемости этих полиномов выра- жаются следующим образом [45]: 1 $^-1A— ty-"Gh(p, q, t)Gk,(p, q, t)dt^bk(p, qNkk,, A8) о где (При таком выборе Ьк имеем Gh(p, q, 0) = 1 для всех k.) Сравнивая A8) и A4), получим, что*) Из A3) и B0) вытекает следующее соотношение между радиальными поли- номами и полиномами Якоби: Следуя Цернике, выберем нормировку таким образом, чтобы при всех г, и т оставалось справедливым соотношение . #Jm(l) = l. B2) Тогда из BL) и B2) находим Значение Gt(m+1, m+ 1> 1) можно получить с помощью производящей функции полиномов Якоби [44]. Имеем 5 ) sK l > *) Знак квадратного корня в правой части B0) определяется из уравнения B6), сле- г\'юшого далее. 23 м Борн, Э. Вольф
706 ПРИЛОЖЕНИЯ При р=1 левая часть последнего соотношения равна fl+z), и разлагая ее в степенной ряд и сравнивая с правой частью, получим ^! B51 Из B5) и B3) следует, что используя A6), A7) и B6), найдем из B1) следующие окончательные выра- жения для радиальных полиномов: <27> <28) В табл. 9.1 приведены в явном виде выражения для нескольких первых полиномов. Для нормировочной постоянной о*т получим из B6) и A9) ^ = 2^-2- • <29> Для нахождения производящей функции радиальных полиномов пати- шем в B1) и B6) s вместо к = (п — тI2 и m + 2.s вместо п и подставим полу- ченные выражения в B4). Тогда имеем Наконец, вычислим интеграл ) о который, как мы видели в гл. 9, играет важную роль в дифракционной теории аберраций Цернике — Нижбера. Подставим в этот интеграл выра- жение B7) для R'Sip), а вместо функции Бесселя /и—ее разложение в ряд [44]. В результате получим i где i 09 1 ( —1)J f v \т+л J s\{s+m)\\2) 0 n-\-m n—m f(s, p, q, г) = ^и^?^Р{и"{и-\у}<1и, C2) a p, q, r, s—неотрицательные целые числа. Интегрируя C2) по частям, имеем f(s, p, q, г) = {«^ (^Г1 [«*(«.- !)']};-* ja*-> (?)P~l{u<(u-l)'}du. C3)
ПРИЛОЖЕНИЕ S 707 I Если r~^p я s + 9 + /0^>0, то первый член в правой части исчезает, так что f(s, р, q, /¦) = — sf{s— 1, р—\, д, г), C4) Рассмотрим по отдельности случаи s^p и s<ip. Когда s^p, то, применяя C4) р раз, получим f(s, p, q, r) = (— \Yb(s— l)(s — 2)...(s — /7+l)/:(s—p, 0, <?, /¦)=* i = t=(^r-Ust^pO-urdu. C5) о Интеграл в правой части есть интеграл Эйлера первого рода (бета-функ- ция), который равен (s + </—р)\ r\/(s + q + r—р + 1)! (см. [44]). Следова- тельно, при s^p имеем и,, р. ^,г)=(-1^(._;; Рассмотрим теперь случай s<p. Применяя C4) s раз, получим /E, р, q, г) = (—l)Js(s—l).../@, р —s, </, г) = }^0- C7) Подставим теперь C6) и C7) в C1) и введем такую новую перемен- ную /, что s = -g-(n—m) + l. Тогда _ /г? (р) ¦/„ «*>) р ф=L-i4 § л (i+1+Di №) • ^ Ряд в правой части C8) есть разложение функции /„+, (и). Поскольку п—т—четное число, то множитель (—])з<л-т)/г можно заменить на (—.])<«-«•)/», в результате чего получим окончательно Я!У (Р) Ja (op) P dp - (- !)(»-«)/« ia^. C9) 6 ПРИЛОЖЕНИЕ« ДОКАЗАТЕЛЬСТВО ОДНОГО НЕРАВЕНСТВА, ПРИВЕДЕННОГО В П. 10.7.3 Пусть f (%) и g(i) — произвольные функции, в общем случае комплекс- ные, от вещественной переменной т, и пусть Я— вещественный параметр. Тогда A) — со —со или 4- со 4-со +от -« —00 —со Минимум этого выражения, квадратичного по Я, определяется дифферен- цированием, т. е. ¦*¦<» +00 — 00 -00 23*
708 приложения Корень Я = Хмвв уравнения C) равен со I _« Если подставить его в B), то получим /+» \ / + » v 4 S //•*){ S гг*л)>( J (fe+/V)^l. E) Пусть f = ^(T), g = *Cil). F) Тогда ^ + Г^ = х^^ + ^^)=т^ («*), G) и E) после интегрирования правой части по частям и в предположении, чтр *) тд|л))*'—>-0 при т—>¦ ± оо, принимает вид Это и есть требуемое неравенство. Равенство в (8) имеет место только в случае, когда выполняется равепс1ао в A), чго возможно только при f^r-—\g*, или, используя F), при ль 1 -df = -TT^ О) Общее решение этого дифференциального уравнения имеет вид A0) где А — постоянная. Пригодны только решения с л 5*0, поскольку в про- тивном случае 'ф(т) не будет обращаться в нуль на бесконечности. Следо- вательно, (8) становится равенством тогда и только тогда, когда ф есть функция Гаусса. приложение$ ВЫЧИСЛЕНИЕ ДВУХ ИНТЕГРАЛОВ, ИСПОЛЬЗУЕМЫХ В П. 12.2.2**) В настоящем приложении мы вычислим интегралы A2.2.8) и A2.2.9), т. с. к^аууйг^ A) j t\R ) \ B) *) Фактически это условие всегда выполняется, когда интегралы в левой части (8) сходятся (см. [46J). •*) По Дарвин! [47].
ПРИЛОЖЕНИЕ 9 709 R=+Vx' + yl + zl C) и ш2 > с2/?2. Рассмотрим два случая, а именно: (а) 0<y<d, где у и d—постоянные, а область интегрирования V, представляет собой слой — оо < хх < оо, — У<Уг<й — у, — оо < zt < оо, кз которого исключена небольшая сфера исчезающе малого радиуса с центром в начале координат х1 — уг = г1 = 0. (б) г/ > d или г/< 0; область интегрирования Vx совпадает со всем слоем — оо <ДГТ < оо, —y<yi<d—у, — оо < г, < оо. Для вычисления f-, применим теорему Гаусса, записанную в виде ^\ d\vGdV, = ^G-ndS1, D) V, S," где G — произвольная векторная функция координат, п(пх, я„. я,)—еди- ничный вектор внешней ноомали к поверхности Sl, ограничивающей объем \\. Положим ехр E) тогда из A) и D) получим Поскольку пг<— 0 на обеих сторонах (.(/,= — г/ и y-,=d—у) слоя, то в слу- чае (б) интеграл 34=0*). В случае (а) мы должны также учесть вклад ог небольшой сферы сг, с центром в начале координат. Если а—радиус сферы, то «г= — zja, и этот вклад равен Следовательно, \ = 0, когда у < 0 или у> d. Пре?;де чем вычислять ^а, отметим, что интегрирование по исчезающе малой севере с центром в начале координат не дает никакого вклада, поскольку подынтегральное выражение содержит только особенность по- рядка 1/R. Полому в случае (а), как и в случае (б), н)>кио интегрировать *) Строго говори, поверхность S, должна быть замкнхтой; поэтому нео6ходи"о рассмат- рииать T?i л<е вклады от удаленных краев слоя. Однако ятими вкладами можно i ренсбречь по физическим соображения!-!, так как их эффекты проявятся в исследуемых точках через ^кчконечно большой проме;-.суток времени.
710 ПРИЛОЖЕНИЯ по всему объему слоя, т. е. (О2 f где ехр (Ю) Выберем в A0) новые независимые переменные р и %, определяемые соотношениями (Па) A16) где корпи в A1а) и A16) берутся со знаком плюс. На плоскости ^г, кривые р-= const имеют вид эллипсов, а %—угол между радиусом-вектором и большой осью эллипса. При p — \yl\ эллипс вырождается в точку. Таким образом, всей плоскости х1г1 соответствуют следующие интервалы значений р и %: \ уг \ ^ pss; oo, 0=^х^2я. Следовательно, г г «"ХР I !'Р у -^г- J J Я <5(Р. i О | E/i I где является якобианом нашего преобразования. Из C) и A1а) находим ./ pi _p; i dx, = У \ с J ! Р Р+7"^- !' A4а) а из 1,1 ю> имеем j ' A46) ра-Й-г!. J Кроме того, справедливо тождество пли, используя C) и (Па), }/ (—J —Р2Кр2 —i/f —г?. П5) Из A3), A4) и A5) следует, что Подставим теперь A6) в A2). Интегрирование по % дает сразу же множитель 2я. Интегрирование по р тоже не представляет труда, и мы
ЛИТЕРАТУРА 711 получим A7) тде на основании таких же физических соображений, как и ранее, мы отбросили осциллирующий вклад от бесконечности. Подставляем теперь A7) в (9) и вычисляем получившийся интеграл. Имеем A8) 74=^-— {ехр (fed)-1}, ( vy ч '-.xp(ihd)—1}, когда 2А ]/ ф'- „ / о) у / J ехр (— igy) ехр [— lh jy—d)} \ ¦ 2я I/ i ¦—- ) — p" Zh I/ I — 1 — p I когда 0 < {/'< d, где -p2, h = q+ j/ (-f-J—Pa- С9) ЛИТЕРАТУРА 1. R. С о u г an t,.Differential and Integral Calculus, Blackie a. Son, Glasgow, 1936. (P. К у- p а н т. Курс дифференциального и интегрального исчисления, ГТТИ, 1931.) 2. К. S с h w a r z с h i I d, Konigl. Gess. Wiss. Gottingen, Math.-Phys. Kl., 3, 126 A903). 3. W. Ehrenberg, R. E. S i d a >, Proc. Phys. Soc. B62, 8 A949). 4. H. Boersch, Naturwissenschaften 28, 709 A940). 5. W. G 1 a s e r, Grundlaijen der F.lektronenoptik, Springer, Wien, 1952, p. 548. ¦6. P. Debye, Math. Ann. 67, 535 A909). 7. H. Poincare, Ada Math. 8, 295 A886). 8. E. J e f f г е у s, B. S. Jeffreys, Methods of Mathematical Physics, Carnbr. Univ. Press, 1946, ch. 17. 9. A. E r d ё 1 у i, Asymptotic Expansions, Dover Publications, New York, 1956. 10. G. N. Watson, Theory of Bessel Function, Cambr. Univ. Press, 2nd ed., 1948, ch. 8. (Г. В а т с о и, Теория бессолевых функций, ИЛ, 1949, гл. 8.) 11. С. Chester, В. Friedman, F Ursell, Proc. Cambr. Phil. Soc. 53, 599 A957). 12. W. P a ul i, Phys. Rev. 54, 925 A938). 13. H. О t t, Ann. d. Physik 43,, 393 A913). 14. P. С. С 1 e га га о w, Quart. .1. Mech. Appl. Math. 3, 241 A950). 15. P. С. С 1 e га m о w, Proc. Roy. Soc. A205, 286 A951). 16. B. L. van der W a e г d e n, Appl. Sci. Rev. B2, 33 A952). 17. W. Thomson, Proc. Roy. Soc A42, 80 A887). 18. G. N. Watson, Proc. Ca'mbr. Phil. Soc. 19, 49 A918). 19. T. J. ГА. В г о m w i с h, An Introduction to the Theory of Infinite Series, Macmillan, London, 1908, p 447. 20. J. Focke, Ber. bacns. Ges. Akad. Wiss. Щ, H. 3 A954). 21. J. G. van der С о i p u t, Indag, Math. 10, 201 A948). 22. D. S. J о n e s, M. К 1 i n e, J Math Phvs. 37, 1 A95S). 23. N. С h a k о, С R. Acad. Sci. 247, 43E, 580, 637 A958). 23a. M. К 1 i n e, I. W К а у, Electromagnetic Theory of Geometrical Optics, New York, Inter- sci. Publ., N. Y., 1-965, ch. XII. 24. N. G. van К a m p e n, Physica D, 575 A949). 25. Ci. Salmon, Analytic Geometry of three Dimensions, Vol. I, rev. by R. A. P. Rogers, Logmans, Green a. Co , London, 5th ed , 1912, p. 411. 26. P. D i r a c. The Principles of Quantum Mechanics, Clarendon Press, Oxford, 1930. (П. А. М. Дирак, Принципы квантовой механики, Фнзчатгиз, I960.) 27 В. van der Р о 1, Н. В г е m m e r, Operational Calculas based on the two-sided Laplace Integral, Cambr. Univ. Press, 1950, pp. 62, 100.
712 приложения 28. L. S с h w a r t z, Theorie des distributions, Hermann et Cie, Paris, 1950, Vol. 1, 1951, vol. II. 29. G. Temple, Proc. Roy. Soc. A228, 175 A955). 30. M. J. L i g h t h i t 1, An Introduction to Fourier Analysis and Generalised Functions, Carabr. Univ. Press, 1958. 31. A. E. H. Love. Proc. Lond. Math. Soc. 1, 56 A904). 32. H. В a t e ra a n, Partial Differential Equations of Mathematical Physics, Cambr. Univ, Press, 1932, p. 196. 33. T. L e v i — С i v i t a, Caracteristiqucs des Systemes Differentiels et Propagation des Ondcs, Librairie Felix Alcan, Paris, 1932, § 10. 34. R K. L u n e b u r g, Mathematical Theory of Optics, Brown Univ., 1944, p. 21; печатное издание Univ. California Press, Berkeley a. Los Angeles, 1964, § 6, 7. 35. M. Kline, Comm Pure a. Appl. Math. 4, 239 A951). 36. A. Rubinowicz, Acta Phys. Polonica 14,209 A955). 37. H. В r e m m e I, Comm. Pure a. Appl. Math. 4, 419 A951). 38. E. T. Cop son, Comm. Pure a Appl. Math. 3, 427 A951). 39. F. Zernike, Physica 1, 689 A934). 40. F. Zernike, H. С. В r i n к m а п. Verh. Akad. Wet. Amst. (Proc. Sec. Sci.) 38, 161 A935). 41. B. R. A. N i j b о е r, Thesis, Univ. of Groningen, 1942. 42 А. В. В h a t i a, E. W о 1 f, Proc. Carabr. Phil. Soc. 50, 40 A954). 43. M. Born, Natural Philosophy of Cause and Chance, Clarendon Press. Oxford, 1949, p. 153; Dover Publications, New York, 1964, p. 153. 44. В. С о u r a n t, D. H i 1 b и г t, Methods of Mathematical Physics, Intersci. Publ. New- York, 1953, Vol. 1. (P. К у р а и т, Д. Гильберт, Методы математической физики, Гостехиздат, 1951, т. I.). 45. Е К е m b I e, The Fundamental Principles of Quantum Mechanics, McGraw-Hill, Ne» York, 1937, p. 594. 46. H. W e у 1, The Theory of Groups and Quantum Mechanics, Methuen, London, 1931. 47. C. G. Darwi n, Trans. Cambr. Phil. Soc. 23,, § 6, 8 A924).
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Аберрации 179, 198 — 222, 420—449 Волна, затухание 569 — волновые 198 — 201, 253, 420 — квазимонохроы.1! ическая 248 и Д. ' *_ — первичные (;3;1нделя) 201, 2D4—222, 428— — —, матрчцл когерентности 501 441 — магнитная 500 _ — _, допустимые величины 428—432 — монохроматическая 39 и д , >— — —, коэффициенты 210 — 222 — необыкновенная Ь?7, 632 ,_ — —, — для иемтриртынпой системы 211—222 — неоднородная 38, 63, G9, 518, 572 ; — — —, среднеквадратичные значения 424 — обыкновенная 627, 632 _ — _ сферически 20f>, Z\O. 130 — 437 — однородна-! 518 __ — _ топкой линзы 217- 220 — плоская 36 и д ,— — —_ функции 1QS — 202 — —, отражеьиь и преломление 54—66 ' —, геометрическая теория 198—222 — —, угловой спектр 518 — 521 |—, дифракционная теория ^20 —449 —, распространение в проводнике 567 — 57) —, — тоорем i смещения 422 — 424 —, ¦— — слоисши приводящей среде 581 — 535 1— лучевые !98 —21b — скалярпкя 35 —4,-i i— _ моложе шм 220, 221 —, степень поляризации 508, 509 и- — увеличения 221 — сферическая 3fi и д -—, функц i.i 1У8, 202, 421 к Д. ~ ТЕ {F, попиризонлшяя) 67, 68, 582 -— хроматические 172 — 177, 220 — 222 — —, коэффициент отражения 582 Автокогерентность 459, 497 — —, - - пропускали ¦ гз82 Аккомодация 22 \ — ТМ {Н поляризованная) 67, 68, 582 Амплитуда векторная 123, 359 ид. — —, коэффициент отражения 582 — —, распространение 123 — 125 —¦ —, — пропускания 582 *— полны 37 и д —, фаза 37 и д — —, деление 242, 263—290 —, частота 37 и д. — — комплексная 38, 244, 298, 451, 468 —, эквивалентные представления 506 — 5С9 >— гчектрпльнан 455 — электрическая 590 Анализатор 61, 637 Волновой фронт 38 и д А*Ш:Ш1рогшя 614 - —, гауссова кринизна 122 ' — искусственная 648 — — геометрический 119, 135 !— кристаллов 614 — —, деление 2-12, 245 — 259 Аномалия фазы 40, 407 — —< деформация среднеквадратичная 424, 429 Апертура 177 — 185 >— —, запаздывание относительно опорной сферы •— относительная 183 Гаусса 427 — угловая 182 — цуг 292 -- числовая 182, 384, 445 Волны вторичные 341 ид >— — микроскопического объектива 182, 384 — —, суперпозиция 345 Апланат 226 — парцц ыьные MJ8—606 Апланатизм 194, 239 — — магнитные 5Э0 Аподизация 382 —¦ — электрические 590 Астигматизм 206. 207, 430 — стоячие 259--263 *—- глаза 224 — —, применение для цветной фотографии 262» — первичный 430; 440, 441 263 Восприимчивость диэлектрическая У4, - магнитная 94 Время затухания 5/9 Биения 40 — релаксации 568 Б»линза Бийе 248 Бинокль 229 230 Бипризма Френеля 247, 248 Глаз, 223 224 —, предельное разрешение 224, 381 —, спектральная чувствительность 180, 131 Глубина лропикипнепия 570 Вектор Герца 84, 90. 93, 554, 590 Голограмма 411 —4 16 — кринитмы луча 128 — негативная 412 — лучевоп 129, 139, 615, 676 — —, иоестапонление. 413 >— Пойнтинга 31, 44, 51, 93 и д — позитивная 411. 412 i— поляризации 39 —- световой 47, 628 Взаимности неравенство 498 — 500 Деформация 648 н'орема 539 —, влияние на оптические свойства 649 и д Видность 180 452, 489, 499 —, тензор 048 >—.кривая 180, 295—297, 452 —, упруго-оптические коэффициенты 648 >— относительная 180 Диаграмма полярная рассеяния на металле 603—• — — полос 250 252, 257. 272, 295. 452, 464, 659 GOG — — —, зависимость от формы источника 257 Диафрагма 181—183, 225 _, _ —< — _ ширины источника 252 — апертурная 182 Виньетирование 183 — поля зрения 183 Волна 1G, 33 и д Диошрия 159 — векторная 43 — 54 Диполь 90, 94, 540 — 542 >—. восстановление 413 —, волновая зона 93, 601 ¦— дифрагировавшая 354 Диск Эири 1 ьо *-. — граничная 407 — 416 Дисперсия 39 и д.
714 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Дисперсия аномальная 39, 43, 102 — ~~, область 102, 307. 311, 332 — — осей 616 — дифракционной решетки 377 — — —, свободная область 375, 337 — нормальная 101 — относительная 173 ¦¦— поляризации 606 ¦— призмы 172 —177 ¦—, теория элементарная 94 —105 — угловая 177, 379 Дисторси* 209. 430, 432 — перпнчнаи 432 Дифракции задача 541 — —, единственность решения 546, 547 .Дифракционная картина 353 и д. — — при наличии одной аберрашш 433—441 1— — Эйри 365 < >— маска 472 *— решетка 369—379 <— — блестящая (концентрирующая) 375 1— — в ниде реплики 376 *— — вогнут a h 378 — —, дисперсии 375, 377 — —, духи 309 — —, период 369 <— —, принцип действия 369 — —, разложение в спектры 372 — —, разрешающая сила 307, 372 373, 380 .— —, схема Пашена 379 — —, — Роуланда 379 _ —t теория 369—375 — —, типы 374—378 — — трехмерная 373 — —. функция отражения 369 — —, ¦— пропускания 369 — формула Френеля — Кирхгофа 349, 350, 352 Дифракция 341 ид. — дпумерияя 517 — — на плоском экране 516 — на бесконечно длинной идеально проводящей — — полосе 5 44. 545 — — бесконечном наборе ступенек 544—546 — — Двух параллельных полуплоскостях 542—' 544 — — дополнительном экране 544 — —• полуплоскости 513, 52], 53S—540 ¦— — — при локализованном источнике 535—540 ¦— — проводнике 5!б •— — проводящей сфере 585 , f -joopwj Ми 585-612 — рентгеновских лучей в кристаллах 374 — света на ультразвуке 549—565 ,— — — ~-г теория 552 —, теория 341 и д. „, _ дббе 3S4 ¦¦—, — Кирхгофа 345—35?, 687 — трехмерная на полуплоскости 533—535 — Фраунгофера 352 — 350. Ш2-~392 .— — » ош-ических приборах 369 — 392 ¦— — на границе идеального проводника 514 — — — идеально проводящим экране 515 ,—, — — отверстый в плоском экране 349 _ — — _ круглом 364 — 308 — — — щели и прнмпугольпом отверстия 362 — — __ экране с многими отверстиями 366—368 — — при некогерентном освещении 363 — Френеля 352 — 356, 392 — 397 Дихроизм 62, 655 Длина волны 37 и Д. — —, измерение 247, 269 — — критическая 580 .— — приведенная 37 — оптическая 121, 132 — 141, 146, 147 Зайделя переменные 202—217 — —, выражение через параметры двух лучей 212-215 „ _t _ _ _ одного луча 2J5, 216 Закон Брюстера 59. 61 .— интенсивности 119 i— — в геометрической оптике 119 —123 ¦— Ламберта 179 — Лоренца 30, 47 1— обратного квадрата расстояния 122 •— освещенности 179 •— отражении 34, 54, 55, 84, 1D8, 411 i— — в геометрической оптике 129 —131 «а «-, вариационный аналог 67,2 Закон преломления 34, 55, 84, 107, U3, 1$6 — — в геометрической оптике 129 — 131, 189 — 19! — — — кристаллах 632 — <— параксиальной области 18S —. —, вариационный аналог 671 — — для слоистых сред 69 — Снеллауса 55, 130, 572 Зеркало Ллойда 247 — Френеля 342 Зоны Френеля 342 и д. — —, построение 342 Зрачок 181 — 183 — входной 182 — выходной 132 Изображение 145 ид. — в микроскопе 383—392 — — —, теория 383—392 _______ дифракционная формирования 384 _ __ __t ™t когерентное освещение 3S4— 392 — — —, —, некогерентное освещение 383, 384 — объекта протяженного 441 -449, 486 — — —, осьещепие когерентное 441—445 „ _ _ф _ некогерентное 440—449 — — точечного М5 —, полученное методом восстановления волновым фронтов 411—410 — стигматическое 146, 151 Изогиры 642 — главные 642, 644—646 И-к.фоты 401, -137 — 440 Изохроматы 642, 645 — главные 642 Инвариант Лббе 158, 160, 207, 212 — — линзы 2 17 — Лагранжа 131, 132, 134, 678 — последовательных преобразований 164 — Пуанкаре 132. 678 — Смита — Гельмгольца 164 Интеграл Гильберта 664—666 •— Гюйгенса — Френеля, асимптотическое приб- лижение 407 — Дебая 398 — дифракционный 392 Кирхгофа 348 — — при наличии аберраций 421—425 Интегралы Френеля 393 — 395, 522—529 Интенсивность 29 и д. — в геометрической фокальной плоскости 401 — взаимная 4С4 — 476, 492 — —, распространение 473—486, 493 — —, — в оптической системе 484—486 — —, расчет 4C6 — 471 — и средняя деформация волновых фронтов 424 ¦¦— истинная 488 >— нормированная в параксиальном фокусе 422, — при интерференции 244 и д. —, пространственный спектр 488 —, распределение 402—407 —, — в геометрической фокальной плоскости 40t —, — — зависимости от отношения числовыж апертур 482 —, — вдоль границы тени 402, 403 —, — — оси 402 Интерференционная картина 245 и д •— — кристаллической пластин ни 640, 642 „ _ _ __г кривые равной интенсивности 64S — — пластинки кристалла двухосного 646 — — ___ _ одноосного 644 — 646 — — поглощающего кристалла 657—660 — _ — _ двухосного 659 — — — — одноосного 658 — — — — -- . пидность 659 — функция — см. Функции интерференционны» Интерференционные полосы 24S — — ахроматические 254 — — Брюстера 235 — — —, многолучевой вариант 336 — —, внцность 250—252, 257, 272, 465, 659 — —, контрастность 304 — —, локализация 264, 271—278, 290 — — многолучевые 297 и д. — — — в пленках 382—350 „ — — с двумя одинаковыми пластинками 288. 330 — 336 •— —, полуширина 301 >— —, порядки 264, 270, 311—313 * , - Дробные 264, 271, 311-313
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 715 Интерференционные полосы, порядки целые 264 Когерентность, степень комплексная при освеще- — — равьс-о и Kiotid ?.-L, 300 нии микроскопа 480 -4S4 — — — \[)-)M,'ii''uch.oio порядка 329 —, — —, р;дчет 466 — 471 — — равноц толщины '2ЬЬ, 324 —., теории 453 492—500 ¦ , резлость 303—305, 317—326 — частичная 124, 242, 452 и д — —- с плоскпгыраллельной пластпнкой 263—266 Колбочки 224 , суперпозиция 333 — 336 Кома 167, 206, 207, 430 — — Фнзо 270 — круговая 167 — — Эдссра — Бутлера 329 — линзы 218 Ьитерференционнкй фильтр 318—323 — периичиая 431—441 — — типа Фабри — Перо 319 Компенсатор Бабине 688 — —, характеристики 320 — Еерека R40 Интерференция 242 ид — кристаллический 637 -- в кристаллических пластинах 640—644 — Солсйля 639 — — пленках 266—271 Конгруэнция 130, 134—136, 684 — *— свете к зазимов о хроматическом 248— 250, 285, Кпидспсор 237, 241, 480, 483 462—477 —т аберрация 4 81 _ монохроматическом 243. 248 Контраст фязопьш светлый 369, 390 — двух пучков частично ктерс-шных 458—262 — — темный 3bCt. 390 — двухлучевая 242, 245, 26*3 — 290 Контрастность лО4, 32$, 339 — —, деление амплитуды г\2, 2Ei3 — 290 Корню посгрсе ше i94 — —, — волнового фронта 242, 245 — 259 —- спираль 395, 390 —, зйкои для квазимонохроматических волн 466 Коэффициент автоматизма 215 —, — общий 460 — Д1х,;орм цп!- i4_> 1 „ — дтп CTamiOHdpilLlX ОПТИЧеСККХ ПОЛеЙ 460 — — ЛННЗа! 217 — многолучевая 242, ?97—336 — Корреляции 452 — полей геометрической оптики и дрфршЫии — каълона ^42, 348, 492 52G — 526 — отражения 73, 74, 298 —, порядок 264. 37! пленки дп электрической 74, 582 Интерферометр 242 _ _ „ металлической 583 -— Бептса со смещенным волновым фронтом 28S— ,— поглощения 5/0 292 _ пропускания 73, 74, 298, 412, 444, 687 — Дапеона 2S7 — — ямллшудпыг 4f2 — Ж wild 2S3—2S3 _ »_ взаигл ьш 4ВЯ — -- ' идоизмснез-ыый (Сиркса И Прингсгейма) — — много^ппииоа системы 79 304 2Sb, 287 — — пленки 74, 582 — 585 *— зв^даыи Майкельсона 255—259, 470 Коэффициенты упруго оптические 648—653' (— — —, измерение угловых расстоянии 255— Кривая Хсртсра — Дриффе.1ьца 412 256 470 Кривизн^ поля 207, 2-09 210 430 432 — интенсивностей 259 Кристгллп дхухесные 625 — Кюстерса 282 — —г оптические свойства 625—636 — Люммсра — Герке 313 „ одноос! ые 025 — NwiHftWibCOha 278- -280 — _, оптические снойстпа 625—636 — — зидошчшеииыи (Ьрауна а Твисса) 470 *- — отрии^тсльнье 027, 652 — Маха — Цеидгра 2kb — 292 _ __ положптелъ ibic G27, 352 —, область д.исие\х mi 307 — 311 — t оптический к^м^сионкация 625, 627 —, предел разрешения 307 — поглоща:ощие tMj —Ь02 — Р^лия 252, '1ЬЗ, 2Ь5 »— — одноосные 6с>0 — TIlt.iiMdha — Грила 2S0—283 , уравнения Фг-енеля 654, 656 — Фабри — Перо 80, 302 — 313, 584 Кружок рассеяния наименьший 206 437 — — —, контрастность 304 — — —, критерии р ispe-шения 306 — — —, к 1кс1Ша.>ч,ксе пропускание 303 — — —, пред* i pa'jijeiuc±i[ijH 307 Лин^;; глазная 231 *— — —, примере! i:e для сравнения длин волн — Лунеберга 149 311 —ИЗ _ полевая 231 — Физо 2bb—27l — толггая 1ьО~1б2 Источник 116 в д — тонкая 1о2 — кя1гнчолохрОй'-]тический 256, 46S — — f mjf вичные аберрации 217 — 220 — ко tihJi HTt ын 24/ Линии равной оптической толщины 324 — мочохромдясский 243 — р«арныл амплитуд fiJO, 531 — hCi<orep(.HTi:biif 1^6, 250. ^66 — — ф,1з ^30, 531 — — прогчлачпгли 25Ь, 4fio, 477—480 — спектральные 296 -ж — —, слепень кегере тпости 466—473 — — г аберр щии изображения решетками 379 — —, тонкая структура 297 — _( — —s лру. теисние днухлучевоЙ интерфе- ренции 292—297 Калибры 208, 2G9 — —, — —, ~ интерферометра Фабри — Перо -~, измерение методом дробных частей порядка 305 — 311, 332 271, 2S3 — —f — — t — пластинки- Люммера — Герке Камера Шг/идта 235, 236 316, 317 Каустик^ 1М — —, эталон длины 311 Каустические поверхности 131, 675. 677 — средясчт, ичтока энергии 531 — ! v:Kc прлми^jjh iu.bix лучен 16е Линия кчп~и-шы 12%, 168 Korepci.T,iocTi 124. Z~.± ид — фокальная 169 — взакм ips 45Г> и д Луч ! 15 1 1У—\А\ — —, iicivoropbic теооемы 489 — 492 — гепмстрич скии 120 — 123 — —, jwi'jinrip.iiLhMe 491, 492 , вектои кркви.шы 128 — —, —, строгая ф)рмулировка закона 404—496 — — ц/.шф i;;'щиальное урарпечме 127 — 130 — —, расчет 4D-~'i4i _ -_ komid'ou-uih U0, 134 — 136, 6ЬЗ — —, --- для п^когеревтного источника 477 — 480 — главцьш {опорный) 1S2 — —, cnci тр^^ььое представление 462, 463 — дифгм ишч.пчичн 126, 354 и д — ~ функция ^58—4S^ — цп) л ,i i-ni i^Ka 1C9 — , время 2^4 451 496—500 Лучепр' ш» лш; двойное 62, 431 —, — взаимное 500 — — вьшямюе напряжением 64S—650 — дли^ 292—297, 361, 451 — — фопъы 651 —653 попила ^42 Лучи остаточные 577 — пучков 242 — парпксияльные 188, 189 — — мон»х])омятическич 242 ид. — нэпрр/хен^ые l';i, 155 —, степень 452, 461, 466 Люк 183 —, — комплексная 45S ид. — входной 183
716 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Лкж выходной 183 Люкс 181 Люмен 18 L МатриДа когерентности 501 ид. — — монохроматической плоской волны 501- - 50G — корреляционная 453 — хара <. 1сристичсск,,я 71 — — jinoi осло гнеи системы 78 — — однородно 1 диэлектрической пленки 74 — — слои с гон среды 71—73 — — —. — ncnoi ющающои 73 Метод Г<1бор<1 411 416 — двуступенчатый получения изображения 411 — 116 — — фотогр ф"и 411, 415 — дробных: 4i. cir порядка 271, 311—313, 337 ¦¦— интерференционных испытании качества по- I'cpxifoeTe,] H * 270, 281, 327 — MariKUj'ibconi измерения угловых диаметров звезд ^55—250, 470 ^- наибыстрейшего спуски 522, 525, 537, 687 — 692 >— построения хода лучей 185—191 _ . _„ косых 184 — 191 »— — —•¦ ~ наклонных меридиональных 185 — 188 •—• — — — параксиальных 188, 189 — свилей 38S >— стационарно» фазы 355, 692 — 694 i— фазо-контрастным Цсснмке SS4 — — —, ЧУВСП ИТСЛЫЮСТЬ S9Q Микроскоп 237 — 241 — интерференционный 283 —288 "— — Даисонэ 287 *~, объектив 23» —2^0 р—, — иммерсионный 240 i—, ¦—, числовая апертура 239 i—, окуляр 238 <— поляризационный 647 —, рачрешающат сила 383 •— pern геройский 415, 416 —, ieop-п Аббс 354—392 — электроинып 415 Момент дапольный 99, 106 Напряжение 648 —, влияние на оптические свойства 649 и д >—, тензор G4S —, ¦—, главные иеи 648, 649 —, упруго-оптические коэффициенты 648—Ь5Э Неравенство Шварца 461, 502 Нвколь 635 Нит 181 Нормами волновые 621 — -—, конус напртрлспи^ 634 — —, повермюсгь 624 — 631 — —, эллипсоид 621 Ньютона кольца 269, 270 — цвета 270 Область изопап тчческая 443, 434 — kuj ерептноыи 4Г»1, 470 — отражения 526 — течи 520 Обогючка рчдужнап 222 Об'1."кт нмплшудныИ 369 —, «восстановлено» изображения 411—416 — СоПрЯЖМЧ ьШ [13 — фазовьш Зь9. 380 Объективы 225 — 230 Окуляры ?2Ь, 231 Оптика гсол'СТ1_пчсск;]Л 116 гг Д — —, гр щицп Г1[ ичеикмосан 125 — 127 — —, чаион интицепвчистч ] 19 — \2А — — основное урлвнеиие 110 — ппраксп'|Щ,ная 157 —105, 189 Оптическая сила 153 — — лпичы 161, 217 — — поверхности отражающей 100 — — — преломляющей 158, 159 — — системы линз 162 Оптические оси кристалла 621!, 635 — — — ^пределе тс положения 036, 54/ — - - ¦ лученые ь2й, Ь.М, <>34 -6А6 — постоянные 5^6 — — металл d j7G —581 -, элокгро та» теория 578 — 581 Опыт Меслина '2 fS Юта ЧУо—Ш Ot л от и гс» ш 237 Освещение кзаэимопохромати юское, частично- когерентное 484 .„, _,t __. __f 1тОлу'1с;!;1С изображения 484—489 — когс^птиое 38;—392 — KpHTHMiLkoe 1й0 - hrkoi f.рентное 3S.3, 384 -- центральное по Келлеру 384, 480, 482 — — частично когерентное 478 - - выходного зрачка 478 Оол5еш,с.ыдаль 1М Оси ди-Уюктрнчссккс 615 г гявнь'е Г>П 622, 628 — эллш соид j L " 1вчь е 6^L' — — полегрнзе дни ^79, 5S0 Отобрли c:i»e 1^ ид — дпопгочмескос \45Г 155, 159 — ндс 1ЛЫЮС 145 —ИЗ — катоптрическое I5G, 160 — KOIKJIODMHOJ i 1'i — стигма 1>1лсское \1\ 150, 165 — теческо шчсско( '35 161 — ценгририв^ннон ciu течон 163 Отражательная способность 57, 74—SO, 117 298, 57Sj — — металлов 576 581 — — многесло [нон истгмы 80 — — г гкн -Л1 мет i-i.iii w: -.он 531 — — - - in irt)i«"omruoi st и т85 — — — «толстой* 585 Отражение диффузное 73, 179 — на по'крхг-кхгн металла 571—578 — полное внутреннее 55, 62, 66 — — — vгол 62 —, функция 369 Па.'ог волновой 39 и д. Палоч'ш ¦"'24 Hdpd ;ц]Л-.1]9Тнчоск tn !fi7 Паря-гс ры Стоке. 4П, 50е* — 511 — — дл i еолны кв<) и'монохроматической 509— ^ 511 — — — — монохроматической 49, 50 — — системы независимых волн 510 Не^цодш '1. ич^ 457 Tie риской 2 >>2 Пл цинк! Люммера — Герке 314—317 — Clm*?.p 1 645 — <Ь иов"- i 38^ — четвергыютловая 80, 502, 637 Пленка диэлект'ичсг-кая 66 -— металлическая 581 — —, коэффициент отражения 582 — - , — пропускания 582 — —, — теория распространения волн 581 — 585 — поглощающая на прозрачной подложке 581 585 — прозрачная на поглощающей подложке — просветляющая 66, 7S Плппхгюи ш 6.15 Плоскос1ь 1 лапн i j 154, 168 — - в крпст 1 те 628 — иоляртлции \7, 59 — ручк<-- U>8 — фэ<,лыи i П1 —153. 169 — — п рос \ 5 ],<"¦] в а шображения 152 _ _ _ пьчдмета 152 ПлотиосТо спгическая 55, 65, 412 — тл?1яр1 'яусми ги 100. 101 — спектр \яьиач 45$, ^02, 490 — — взаимная ЛЬ2, 43U, 499 Погср'-гнопн постоянно i амплитуды 38, 572 — фазы j щестЕеш.оц 38, 572 — синфазньк 405 *— - блиа геометрической фокальной плоское!» 405 — —, профили 4Ст Поверхность асферическая 102
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 717 Поверхность в кристалле лучевая Ь24 Принцип Гюйгеиса — Френеля 136, 340—345, 421 -- — — —, сечение 631 473 — — — пормп-шч15 62-1 _____ для распространения интенсивности в чл- — — — .— ( сечение G29 стично когерентном поле 478 вращения uj р икающая 144, 159 — наикра^чапнкчо оптического путл Ферми 132 — — — 11ро-1СмляиIЦс1Я Н2--П-1, 157 — 159 1оЛ fi/b, <>Ы — изочроматнческая 643 — наимгьынс! о времени 132 фокальная U1 — — действия Мопертюи 679, 683 Ног лоща гол ьная способность металлической плен-- — — —• ¦—, аналогия с принципом Феом5 ки 577 682 Нокаа пчуш преломления кристалла главные 630, — ратюго омти^пч^ого пути 136, 146, 166 647 (Tdu-ioii. рпои cpdju 112, 355, 410 Показатель затухания 569, 57$, t>54 Принцыш и.гг.гчоские 112 и д — лучевой i-jiiLpi этический) 01» -— -—, примени не к электронной оптике 685 — преломления 6<i и д Проницаемость диэлектрическая 25 и д. — — абсолк>тчы i 3-i — — к<,мтек~иая 567 — — гЛс-tuijiI'i 63В, Ь — — мсгйллс! 570 — —, зависимость от плотности 97 — — енрицательная 576 _--.-- — частоты 99 — 105 _ — —, т<и;ор R14 и д — — коуп.чконьч! 101. 567, 5-1 Проницдоюсги диэлектрические главные 61G — - ^льктрошю-олтическиц 683 Протекание JO1}, 319, 412, 442 Поль- в» шоиое частично ко1еренгное 477 — в кристаллу четких пллстиаах G4J — jeoMupi ческой оптики 528 — максимальное ЗОЛ ^ОЪ, 641 — д^фрелчиш 56 11 д — пленки nenoiлощ<иощс1* 581 -- - . представление в виде интегралов Френеля -- - i n лппыющ^ч 581 — 5й5 522 —, полуи.ппшы полосы 319 — изображения 356—360 —, функция ЗЬ9, 442 Поднес (наблюдаемое) 95 Примускгтмыгия способность 57 — 62, 81, 117, 298 ^фф<ч(Т]1ваое ^гт, %. 107, 110 584 Но ^.рн^ор 01, о01, оУ7 Пространство виртуальное 163 — - дихгюпчпын (НИ). 652 — изображения Мб и д Полярщ. .щя 47, 54 и д. _- тфодчегл 1 S6 и д —, JJ04T0P 59 Лучок астигматический 168—172 — нотлювленная, угол 573 -- гомоцентрический 13-1, 1E8 и Д. — круговая 47 — 50, 50з - лишенная 4 17, 505 — магии-пы!1 (ним и niPieiuie) 83, S7 — наибольшая, угол 574 Разность астигматическая 169 -- поли ah 55, 1з0о. 506 — хода оптическая 244 и д — —, >гол 5е), 574 Разрешающая сила 224, 306 ид. — —, \словно 506 — — гл-зза 224 — при i.i, 1Ш'>м лгле падения 573 — — дифракционных решеток 307, 372, 380 — — очражешш 57—62—77 - - - интерферометра ^07, 380 — — преломлчПги 57^62 — —, критерии Рчлея 306 и д — — скользящем т,1Ле падения 61* 05, 573 — — микроскопа 3&4, ЗУ8, 481 — света KBasiif.ioHOT-pfiMfirH^tcKoro 500 — 511 — — —, влияние конденсора 430 — 484 •— — рассеянного 002 — ЬОи ¦— — призмы 373 *—, состояние 49, 117 — — гнетом, обр,; (\'ющих изображение 380— 382 •— „—, аи ал и э с помощью параметров Стокса 49, — — гпл^ j>ui p i(]>,i JG9 50, 509 — 5П — — т;_ж<копа 3S0 --, степень 60. Ы, о06 — 509 — — гыллсии АД ччк^льсона 376 ^ частичная 60. 5П0, ЬОЙ Рлс(.-сиз*.1гсль Рщея 413 — элпшгпзчсская 41, 45 Расстоншк' фокусное 154 F пилиршчцря >г*, 520 — 529, 555 Р(-(кость И) i. Ш и Д. И поляртации 518 — ЬП, lU9t 530 Рсплкеация '.рсмя 568 По.ьри1усмость '18. 109, 555 Рефракция 97, 09 По ' ,1р(ш;шые пленки 02 — коническая 6^1, 632—G36 Поляроиды 661 — — внешняя 634—636 Построение геометрическое для определения ско- — — внутренняя 634 росги paciipocTpdiTcHHf] 621—625 Роговица '22:) — Гюйгенса 31, 1,.6, Л*1, 632 Ромб Френеля 66 Потенциал векторный 84, ид срыбни ui(\s» Максвелла 149, 150 — Добая S87 Правило взаимного соотлетствия 620 — "JCTUepui полны Рэлея 1S8 Предел ptnpi4i!{ пия ->0/ и д Свет естественны!"! 00 и д — — шиерф^рпчетр.! 307 — —, представление 508 — ~- мнкроек(„1ч Jq8. 4^2—481 — ~. рассеяние 605 __ — — npjj MiropiiiTimM ос!Лчщ1.Н1Ш 38S —, р.1спростр1шенне в кристаллах G16, 627—631 .— — — — критическом Oi-пощспии 4R1 —, сила 1S1 ,„ — __ _ псг*стенгш но Келлеру 4SS —, скорость 32 и д ¦— — систем, пбрр.эующи-ч шобряжение 380 —, —, илшергине 33, 34 — — телескоп-:) oS0 Светосила {нормальное фокальное отноигение) Прспо'ипснпг ,->4 и д ' 182, 183 — в кристаллач f>31 — fiSfi - Свеча 1SI — Hd nobLp.xjfocTx металла 571—578 . «Сг-гтлживяппе* 457 — тонкого ny4Kd 1E9—172 Сетчатка 2D3 Преобразование .перинное (телескопическое) 152. Сигнал аналитический 454, 460 1 56 — — ас< оч,иирон;1Ниы1\ 457 .— шторсии 149 ¦— — ко-плеки'ьи -I5C — ьалпбршючпое В5 Система о||Лс,];атич< екая 194, 446 ¦— ироекпп иоо (коллипеация) 155—158 — fiхрома сичечтльы I с\ — —, кл<1ссифи1ч.ция 155 — тслецеигримоскйя 182 ~ ~, кочбшиши 1Ь0 Скорость ('^снрострапония, геометрическое постро- Пргближсние Бриллю-Hia 553 енне для определения 621—625 7Ъ)Ч*ягэ 1ГП1"'сшш абсолютный 146 ид. — — гллшая 619, 623 11;.л мл Доьс 232 — света 32 и д — t боргчппяюшпя Кеиига 229 — — в анизотроинш'! среде 016 ,- lKpu ivo — лучевая ъИ> - G18 П|3иидт Ь„бипе351, 367, 516 — — — — — —, направление 617 <— —, электромагнитная форма 516, 517, 529 — — — — — фазовая 6-f67-61S
718 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Скорость света в анизотропной среде фазовая, направление 617 •— — групповая ЗУ, 41 и д. — — фазовая 37, 39 — 43, 99 и д. -— — __ комплексная 569 Спектр вторичный 173 ¦— дифрагировавший 553 к- — шорого порядка 562 1— — первого порядка 562 I— канавчатый 250 i— ьющн ост и А 52 *— ¦—, взаимный 462 — углоиои 518 — S2L |— эффектитшяя ширина 496—500 — _ _ __ взаимная 500 Спектрoi раф с дифракционной решеткой 378 Среда анизотропная 614 и д. — однородная 3S, 614 *— слоистлч 66 — 81, 581 I— — диэлектрическая 66 1— — периодическая 78—81 •—.— проводящая 581 •— — —, распространение волн 581—585 — — —, теория 581—584 •— —, теории 66—79 Стигматизм 107 — осевой 107, 191—494 Стильб 181 Структура монохроматической плоской волны 616—625 Суперпозиция когерентная 461 — некогерентная 293, 461 Сфера опорная Гаусса 199, 421—424 *-. Пуанкаре 50, 51 Телескоп 228 — Галилея 229 — - зеркальный 233—236 Теорема Ван-Циттерта -— Цернике 466—471 — взаимности (обратимости) 351, 539 — Гельмгольца — Кирхгофа 345, 347 — Гюйгенса 156 — Кирхгофа в общем виде 348 — Максвелла 146, 148 •— — для абсолютного прибора 148 — Малюса и Дюпина 134 — i36, 684 ¦—• независимости 672 >~- Петцваля 216, 217 — погашения Эвальда — Озеена 33, 107—114 „— — — —, для преломления и отражения 111 — — смещения 422—424, 428 i— Смита — Гельмгольца 194 ¦— Фурье 39 н д. Теория дифракции Гюйгенса — Френеля 340 и д. -— — Кирхгофа 345 — 356 . Ми 585 — — — на проводящей сфере 585—612 Толщина оптическая 75 и д. Точки аштанатические 151, 239 — главные 153, 158 >— кардинальные 153, 158 —161 — сопряженные 134, 146, 152, 674 — узловые 154, 155 Трихронзм 655 Труба астрономическая 228 *— зрительная земная 230 Увеличение 149 ¦— относительное 164 ¦— —, формула Максвелла 164 •— поперечное 154, 164, 188 — приборов 238 — продольное (коэффициент сходимости) 154, 164 Угол Брюстсра 59, 61» 574 <— дифракции 342 ¦— наименьшего отклонения 176 '— падения главной 573 — поля зрения 183 1— поляризации восстановленной 573 Уравнение волновое 32 и д. — — для взаимной когерентности 492—494 <— волновых нормалей 619, 627, 654 •— Гачильтона каноническое 670 — Гамильтона — Якоби 1 19, 665—679 •— Гельмгольца — Кирхгофа 346, 347 Уравнение лучевое 620 — Максвелла 22 и д. — — для проводящей среды 563 — переноса 124, 126 — перехода 186, 188—190 — Пуассона 96 -- Фредгольма 109 — эйконала 117 — 131, 138, 676 Условие Вейерштрасса 674, 675 — Гершеля 165, 167 —¦ Л еж а ндр а 674 — Лоренца 85 — 90 — Марешаля 429 — Пет цв ал я 217 — синусов 165 — 167, 194» 384 Фазовый контраст 389 Фокус 13 1 — вторичный 170, 172 — главный 153 дифракционный 422, 430—441 — краевой 206, 431 — первичный 170, 171 Фон когерентный 411—416 Формула Бугера 128 — В;ш-Циттерта — Цернике 468, 490 — Гопкинса 470. 471, 491 — дисперсионная Зельмейера 103, 104 — Лорентц — Лоренца 83, 94—105, 107 — 111. для относительного увеличения *— Максвелла 164 — Ми, 586, 593 >— Рэлея 3GG, 605 — Смита - ¦ Гельмгольца 164 Формулы Френеля 55 и д. — — для амплитуд и фаз отраженной и прелом- ленной волн 57 — — __ отражения 55, 114 — _ __ полного внутреннего отражения 63 — — — преломления 55, 114 — Эйри 299, 364, 402 Фотоаппарат 225—228 Фотометрическая освещенность 178, 179. 185 — сила света 178 — яркость 178 — — изображения 183 — 185 — — предмета 181 Фотоупругость 648 Функции аберраций 192, 202, 422—441 — —, разложение 425—427 — автокогерентпости 497, 499 — амплитудные 68, 370, 389 — взаимные корреляционные 382, 458 — зрачка 355, 369, 443, 444 — — автокорреляционные 446 — интенсивности 371 — интерференционные 371 i— когерентности 458 ^ — взаимные 458—463, 494 »—1 корреляционные 452 •—» наклона ноля 667 *-> отражения 369 >— пропускания 369, 389, 442, 470 — сопряженные 454 Функция частотного отклика 444—449, 485 —. — —, нормированные кривые 448 _ __ —, освещение когерентное 441—445 — — —t — не когерентной 1'15-449 _, — —( — частично когерентное 485—489 —< —> —, связь о функцией зрачка 443, 485 Характеристика 138—145 — смешанная 139 — 141 1— точечная 138, 139, 676 — угловая 139, 145, 170 |— — поверхности отражающей 144, 145 •— — -~ преломляющей 142 — 144 Хроматизм 174, 220—2-22 Хрусталик 223 Цвета дополнительные 641 *~ Ньютона 270
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 719 Частота 37 и д. — резоняигняя 1 Of» I 04 ~ угловая кикличсскач 37 и д. Число волновое 61 и д — —. комплексное 569 — — спектроскопическое 37, 307 Эйконал 117, US, 133 — Заиделя 208, 214 — ИТнарцшилвда 201—204, 212 Экран бесконечный 351, 526 — дополнительный 351, S26 Экспозиция (снеговая сумма) 413 Экстремали 666 и д. Экстремали, нахождение 667—669 — поля 666, 667 —-, ссмеистпа 666 — 669 Эллипс поляризации 49, 52, 572 Эллипсоид тшновых нормалей 621, — лучевой Ь24 — —, дафстчация G49 Эталон Фабри — Перо 303 Эффект Ми Ь04 ~~ Пуркинье 180 Эшелег 375 Эшелон Майкельсона 376 Эшель 375
Макс Бори, Эмиль Вольф ОСНОВЫ ОПТИКИ М., 1973 г., 720 стр. с илл/ Редактор Н, А. Райская Техн редактор И. Щ. Акгельрод Корректор Л. И. Боровина Сдано в набор 24/IV 1973 г. Подписано к печати 20/VIII 19? * г Бумага 70x1 08Vie- Физ. печ. л. 45 +вкл. 0,25 п. л. Условн печ, л. С3,35. Уч.-изд. л- 66,33 Тираж 20 000 экз. Цена книги 5 р. 10 к. Заказ JVs 301 Издательство «Наука» Гларчая редакция физико-математической литературы 117071. Москва В-71, Ленинский проспект, 15 Ордена Трудового Красного Знамени Первая Образцовая типография имени А. А. Жданова Союзполиграфпромз при Государственном комитете Совета Министров СССР по делам издательств, полиграфии и книжной торговли Москва М-54 Валовая, 28