Текст
                    535
К17
УДК 535@75)
Рецензент — докт. физ.-мат. наук, проф. В. А. Фабрикант.
Калитеевский Н. И.
К17 Волновая оптика. Учеб. пособие для ун-тов. Изд. 2-е, испр.
и доп. М., «Высш. школа», 1978.
383 с с ил.
В пособии последовательно развиты основные следствия электромагнитной теории
светл и должное внимание уделено эксперименту. Изложение свойств электромагнит-
электромагнитных волн базируется на уравнениях Максвелла В пособии даны элементы кристалло-
кристаллооптики, электронная теория дисперсии, подробно рассмотрены такие важные физиче-
физические явления, как интерференция и дифракция света, изложены основы теории отно-
относи гелыюс! н и элементы квантовой оптики
Прсдп 1 имчается для студентов университетов. Может быть полезно для специа-
специалист!», рлбоыющих в области физической оптики.
20405-045
К001@1)—78 41~~77 535
(С) И »д«пел1,ство «Наука», 1973 г.
i Шд.исльмио «Высшая школа*, 1978, с изменениями


Предисловие ко второму изданию При подготовке к переизданию книги «Волновая оптика» был сохранен ее основной план и дополнены некоторые разделы. Наиболее существенным до- дополнением явилось рассмотрение основ фотонной теории (гл. VIII), позволив- позволившее охарактеризовать важнейшее свойство света — его дуализм и оценить гра- границы применимости электромагнитной теории света, изложению которой посвя- посвящены основные разделы этой книги. Кроме того, включение в книгу сведений о термодинамике излучения, формуле Планка, законах фотоэффекта и свойствах приемников света должно способствовать более широкому использованию этого учебного пособия в университетах и втузах. Подробно исследованы основания геометрической опгики (§ 6.2) с целью установления неразрывной связи этого раздела с электромагнитной теорией, а также решения некоторых важных задач. Заметно расширено описание светового давления (§2 6) и голографии (§ 6.10), а также некоторых других вопросов, в изложение которых пришлось внести существенные изменения в связи с последними достижениями оптики и атомной физики. К числу таких проблем относится, например, реализованная совсем недавно возможность прецизионного измерения скорости света в вакууме. Последовательность изложения материала осталась в основном прежней, но подробному изложению интерференции и дифракции во втором издании пред- предшествует небольшая IV глава, посвященная основам электронной теории диспер- дисперсии. При переработке книги были исправлены некоторые досадные описки и неточности, и автор пользуется случаем поблагодарить всех читателей, ука- указавших на эти погрешности. Особо хочу поблагодарить В. А. Фабриканта, про- прорецензировавшего эту KHHiy и сделавшего много ценных замечаний; признате- признателен С. Э. Фришу, ознакомившемуся с дополнениями к первому изданию. Я сердечно благодарю за помощь и советы Е. Б. Александрова, Е. И. Бу- тикова, В. Г. Домелу'нксена, Э. И, Иванова, Е. Н. Котликова, М. П. Чайку, Л. К. Черняева и А. М. Шукшина, а также Г. П. Анисимову и Ф. А. Ялышеву за помощь в подготовке рукописи к печати. Автор Предисловие к первому изданию Эта книга представляет собой несколько расширенное изложение одного из разделов курса общей физики, который автор читал последние годы на фи- физическом факультете Ленинградского университета. При построении курса была сделана попытка такого изложения основных проблем оптики, которое в мак- максимальной степени облегчило бы слушателям дальнейшее более подробное изу- изучение этих вопросов и в то же время удовлетворяло бы требованию единства теории и эксперимента. Это требование совершенно обязательно при первичном ознакомлении студентов-физиков с основами науки. Следует иметь в виду, что физики не едины в вопросе о том, каким долж- должно быть содержание университетского курса общей физики, и за последнее время изданы книги, которые могут быть охарактеризованы как поисковые. Эта книга также является поиском способа более или менее современного изложения такого классического раздела физики, как волновая оптика. При решении этой задачи возникают трудности и часто приходится при- принимать компромиссное решение Так, например, при исследовании проблем классической волновой оптики нельзя игнорировать открывшуюся ныне воз- возможность использования когерентных источников света, хотя затруднительно детальное исследование фундаментального понятия когерентности (как это еде-
лано, например, в монографии Борна и Вольфа*, рассчитанной на более подго- подготовленного читателя) Неизбежны также разрывы в логике, связанные с необ- необходимостью использования квантовых понятий при изложении некоторых во- вопросов Стремясь ограничить круг таких проблем, мы, например, не рассматри- рассматривали принципы действия оптических квантовых генераторов (лазеров), хотя не однократно сравнивали действие таких когерентных источников света с обыч- обычными некогерентными В силу этих же^соображений сведены к минимуму обра- обращения к проблемам атомной спектроскопии, иллюстрирующие возможность применения рассматриваемых оптических методов Мы сочли целесообразным отойти от обычной последовательности изуче- изучения основных разделов оптики Изложение начинается с тех проблем, которые могут быть описаны с помощью плоских электромагнитных волн, условия воз- возникновения и распространения которых в однородных диэлектриках получа- получаются при решении классических уравнений Максвелла, обобщающих предшест- предшествующую данному курсу элементарную теорию электричества При освоении электромагнитной теории света сразу выявляется поляризация световой волны, а использование граничных условий для уравнений Максвелла позволяет про- провести детальный анализ преломления и отражения волны на границе двух ди- диэлектриков (формулы Френеля и их следствия) Решается ряд важных задач, в том числе достаточно подробно исследуется полное внутреннее отражение электромагнитных волн и его приложения В гл III исследуются условия прохождения электромагнитной волны в ани- анизотропном диэлектрике (оптика кристаллов), преобразование плоской поляри- поляризации в эллиптическую, вращение плоскости поляризации Дается качественное представление о молекулярной теории вращения В рамках этой же идеализации (плоские монохроматические волны) можно рассмотреть ряд существенных вопросов (например, элементы оптики металлов, давление света и др ) Но для понимания интерференции и дифракции электро- электромагнитных волн такого описания уже недостаточно, поэтому водятся квази- квазимонохроматические волны («хаотически модулированные колебания»**) При введении этих понятий законы возникновения и распространения электромаг- электромагнитных волн дополняют условиями обрыва колебаний оптических электронов в атоме и другими причинами, определяющими время когерентности В рам- рамках этой схемы обосновывается когерентность колебаний для точечных источ- источников света в пределах одного цуга волн, а затем выявляются условия простран- пространственной когерентности, при которых может наблюдаться стационарная интер- интерференционная картина от реальных источников. После этого уже не представляет труда исследовать экспериментальные методы наблюдения интерференции световых волн (гл. IV) При этом прово- проводится приближенная оценка времени когерентности для обычного источника све- света и лазера по изменению видимости интерференционной картины, получаемой с помощью интерферометра Майкельсона Большее внимание уделено интер- интерферометру Фабри—Перо, широко используемому в спектроскопии и позволяю- позволяющему охарактеризовать проникновение радиофизических идей в современную опгику Дифракция световых волн (гл V) базируется в пособии на подробном, но полуколичественном исследовании принципа Гюйгенса—Френеля Это под- подготовляет читателя к усвоению более строгого метода Кирхгофа*** В то же вре- время часть задач на дифракцию (например,распределение интенсивности, давае- даваемое дифракционной решеткой) сосчитана до конца, что облегчает их понимание Подробнее, чем это обычно делается, рассмотрены особенности современных ре- решеток с профилированным штрихом Один из разделов этой главы посвящен вопросу о дифракции частично когерентного света Понятие о степени когерентности исследуется в приложе- приложении к задаче о дифракции квазимонохроматической волны на двух отверстиях (опыт Юнга) При изложении основ дифракционной теории оптических инстру- *См Бори М, Вольф Е Принципы оптики М , «Наука», 1970 **См Горелик Г С Колебания и волны М , «Наука», 1965. ***См. Зоммерфельд А Оптика. М, ИЛ, 1953.
ментов кратко охарактеризован новый метод получения изображения — iолография. При таком построении курса естественным является дальнейший переход к объяснению разнообразных физических явлений, связанных с учетом дейст- действия поля световой волны на электроны и ионы. Эти приложения электронной те- теории существенны для решения многих принципиальных вопросов: кроме тра- традиционного рассмотрения электронной теории дисперсии исследуется враще- вращение плоскости поляризации и решаются некоторые другие задачи. При описании оптических экспериментов с движущимися телами даны под- подробные приложения эффек/а Доплера. Экспериментальные основы специальной теории относительности и анализ следствий постулатов Эйнштейна приведены весьма кратко. Это, очевидно, целесообразно, так как в рамках данного курса трудно добавить по этим проблемам что-либо существенное к многочисленным монографиям и широко известным руководствам по оптике*. По тем же при- причинам из пособия исключены основы фотометрии и геометрической оптики. Квантовая теория света подробно рассматривается во многих руководствах по атомной физике и затрагивается в заключение лишь в связи с обсуждением храниц применимости электромагнитной теории света. Я сердечно благодарю А. В. Тиморезу, С. Э. Фриша и В. А. Фабриканта, прочитавших рукопись и сделавших большое количество ценных замечаний, и глубоко признателен М. П. Чайке за продолжительные и острые дискуссии по основным разделам книги. Автор благодарит Л. Я. Курбатова за дискуссию по общему плану курса, Ф. М Герасимова за критику раздела, посвященного свойствам дифракционных решеток, Е. Я. Бутикова, Г. С. Кватера и Л. М. Шухтина за ряд ценных за- замечаний, Т. Я. Крылову, Я. Я. Пенкина, Р. Я. Семенова, Л. А. Коростылеву, Ю. Я. Островского, Ю. П. Ефремова за предоставление оригинальных фотогра- фотографий. Я приношу также глубокую благодарность Э. И. Иванову, Я. Я. Фила- Филатову, Ф. А. Ялышевой, С. Л. Изотовой, /(. М. Тонковой за помощь при под- подготовке рукописи к печати и сердечно благодарю редактора издательства Я. А. Райскую за большую помощь, которую она мне оказала. Я. Я. Калитеевский * См.- Ландсберг Г. С. Оптика. М, Гостехиздат, 1957; Фриш С. Э, Тиморева А В. Курс общей физики. Т. 3. М., Физмат- гиз, 1962
Введение Оптикой обычно называют учение о физических явлениях, связанных с распространением коротких электромагнитных волн. Как известно, длина лю- любой волны Я, ее частота v, скорость в среде и и период колебаний Т связаны соответственно соотношением К = u/v = иТ. Для волн, которые будут рассма- рассматриваться нами, в вакууме и = с « 3 . 1010 см/с. Прежде всего надо найти диапазон возможного изменения длины волны (или частоты), т. е. изучить шкалу электромагнитных волн (рис. 1), определив более точно расплывчатое понятие «короткие электромагнитные волны». Од- Однако для одних характеристик радиации (например, поляризации) значитель- значительное изменение длины волны не приводит к качественным нарушениям, тогда как для других физических явлений (дифракция и интерференция) выбор исследуе- исследуемой области длин волн часто бывает критичен. Таким образом, выделение узкой области (от 0,4 до 0,7 мкм), характеризую- характеризующейся специфическим воздействием на органы чувств («видимый свет»), не имеет особого смысла. На данном этапе также неоправдано практикуемое выделение «оптического диапазона», включающего в себя инфракрасные, видимые и ультра- ультрафиолетовые лучи, тем более что все указанные на чертеже границы довольно условны. Несмотря на очевидное различие в способах генерирования и регистрации электромагнитных волн разного типа, можно показать, что законы распростра- распространения волн всех типов задаются одними и теми же дифференциальными урав- уравнениями. Речь здесь идет об уравнениях Максвелла, в которых свойства среды учитываются введением соответствующих констант, а переход излучения из одной среды в другую определяется с помощью граничных условий для векто- векторов напряженности электрического и магнитного полей. Использование метода, Ю" 3-Ю6 з-юп 3-Ю'1 Ллин\гоейние\Порот\ Ультра- ffb/e\L/ftuwc\ кие [короткие Радиоболны Электрические колебания 6и5ратород Цифра красные лучи 1 Ультра- фиоле- тобше лучи Рентгенов- Рентгеновские лучи у -лучи Молекулярно-атомные колебания Рис. 1. Шкала электромагнитных волн предложенного Максвеллом 100 лет^назад, позволяет построить единую теорию распространения электромагнитных волн и применить ее для описания основ- основных свойств света. Такое феноменологическое рассмотрение подкупает своей общностью, но, конечно, оказывается приближенным и становится недостаточным в целом ряде случаев. Поэтому изложению подобной строгой, но формальной схемы, в зна- значительной степени игнорирующей механизм протекающих микропроцессов, предпослана качественная характеристика электромагнитных волн разных ча- частот и способов их возбуждения и регистрации. Это полезно для выявления гра- границ применимости теории, и вместе с тем открываются богатейшие возможности для экспериментальной проверки и иллюстрации теорешческих выводов с ис- использованием наиболее удобного вида излучения. Методы возбуждения и регистрации радиоволн приведены в курсах элек- электро- и радиотехники и имеют лишь косвенное отношение к проблеме распростра-
иения коротких электромагнитных волн. Важно лишьч подчеркнуть, что для частот v> 109 Гц (X < 30 см) электронная лампа* типа триода, на использова- использовании которой основана классическая радиотехника, уже становится непригодной. Действительно, в этой области частот время пролета электрона от катода до анода сравнимо с периодом изменения электрического поля и сетка уже не мо- может управлять анодным током. Уменьшая размеры электронной лампы, можно повысить частоту генерируемого ею излучения, но, как остроумно замечает Пирс*, естественным концом такого процесса должно служить исчезновение самой лампы. Вместе с тем автор указывает, что в радиорелейных линиях США широко применяют сверхминиатюрные радиолампы, в которых расстояние между катодом и сеткой незначительно превышает 10 мкм, что позволяет испол- зовать их для усиления колебаний с X с* 7,5 см. Мы приводим эти данные лишь для того, чтобы подчеркнуть значительную условность разделения различных видов электромагнитного излучения. Ультракороткие волны (УКВ) представляют чрезвычайный интерес для решения многих важнейших технических задач. Это связано с тем, что для пере- передачи энергии и получения направленного излучения выгодно увеличивать ча- частоту колебаний (см. § 1.7). Революция в технике УКВ произошла в 1930— 1940 гг., и теперь устройства, на которых были проведены знаменитые опыты Герца, Попова и др., представляют лишь исторический интерес. Основным не- недостатком передатчика Герца являются наличие затухающих колебаний и большая ширина спектра излучаемых частот. В современных генераторах УКВ (клистронах и магнетронах) взаимодействие электронного пучка и волн, воз- возникающих в резонаторе, происходит по-иному, что позволяет поднять верхнюю границу частот (v ^ 30 ГГц) и резко увеличить мощность сигнала, достигаю- достигающего иногда десятков миллионов ватт в импульсе. Положительными свойствами подобных излучателей являются высокая монохроматичность электромагнит- электромагнитной волны (излучается строго определенная частота) и крутой фронт временных характеристик сигнала. В качестве приемника УКВ-излучения обычно используют вибратор или объемный резонатор с кристаллическим детектором, имеющим резко нелиней- нелинейные свойства, с последующим усилением низкочастотного сигнала. Для того чтобы более конкретно представить себе методику регистрации УКВ, рассмотрим следующую упрощенную картину. Улавливаемый вибрато- вибратором импульс представляет собой амплитудно-модулированное колебание, кото- которое можно записать в виде произвольной функции y(t)=A(t)cos <о/. Здесь A (t) — медленно меняющаяся амплитуда (например, звуковая ча- частота v' ~ 104 Гц), a v = (о/2п — основная (несущая) частота в УКВ-диа- пазоне (v ~ 109 Гц). После демодуляции в нелинейной системе (высокочастотного выпрямления) и усреднения за период Т = 1/v имеем Сигнал можно усилить и подать его на осциллограф или какой-либо другой индикатор звуковой частоты. Законность такой операции доказывается в соот- соответствующих разделах радиотехники. Простыми опытами иллюстрируются на- направленность излучения в УКВ-области и некоторые другие свойства такого излучателя. Оптический диапазон спектра (инфракрасные, видимые и ультрафиолето- ультрафиолетовые лучи) представляет большой интерес, но мы будем предельно кратки при об- общем описании методов возбуждения и регистрации спектра в этой области, так как в дальнейшем придется детально рассматривать многие вопросы, о которых )десь лишь упоминается. * См.: Пирс Д. Электроны, волны и сообщения. М., Физматгиз, 1961.
Для возбуждения оптического излучения в лабораторном эксперименте применяются следующие физические явления: 1) свечение раскаленных твердых тел (тепловое излучение), что во всех случаях обеспечивает испускание сплошного спектра и особенно эффективно в близкой инфракрасной области. Электрический дуговой разряд между уголь- угольными электродами часто оказывается наилучшим источником сплошного спек- спектра в видимой и близкой ультрафиолетовой областях; 2) свечение возбужденных газов (квантованные переходы внешних элек- электронов в атомах и молекулах приводят к возникновению атомных и молекуляр- молекулярных спектров). Электрическая дуга между металлическими электродами или угольными, пропитанными солями металлов, дает яркое свечение с дискрет- дискретным спектром. Ртутная дуга низкого давления — чрезвычайно удобный источ- источник света, излучающий яркие линии, которые можно выделить из спектра с по- помощью фильтров или других оптических устройств. В последние годы широкое распространение получили безэлектродные лампы, возбуждаемые СВЧ-разрядом. Они изготовляются следующим образом. Внутри хорошо откачанного полого шарика (диаметром 1—2 см) из специаль- специального стекла распыляется какой-либо металл. После заполнения инертным газом лампа отпаивается от установки. Основные (резонансные) линии металла воз- возбуждаются с помощью миниатюрного СВЧ-генератора. Такая лампа дает резкие и* интенсивные линии; 3) свечение различных тел под действием излучения (люминесценция) также широко применяется в разных экспериментах. Упомянем, что чрезвычайно большие возможности открываются при ис- использовании в оптических экспериментах лазеров (квантовых оптических генераторов), излучающих обычно одну спектральную линию большой яркости. Особые свойства таких источников света (когерентность) будут обсуждены ни- ниже, а сейчас лишь укажем, что сам факт их существования заставляет по-ино- по-иному подходить к изучению многих оптических явлений. Регистрация излучения в оптическом диапазоне базируется на фундамен- фундаментальных свойствах электромагнитных волн. Здесь укажем лишь на наиболее важные способы индикации, в основе которых лежат фотоэлектрические явле- явления (фотоэлементы, фотоумножители, электронно-оптические преобразователи и др.); фотохимические явления (в первую очередь фотоэмульсии); люминесцен- люминесценция (различные люминесцирующие экраны и др.); термоэлектрические явления (термостолбики, болометры и другие устройства). Отличительная черта метода с использованием термоэлектрических эле- элементов —отсутствие селективной чувствительности к излучению разных длин волн, характерной для всех остальных приемников света. Это, с одной стороны, громадное преимущество термоэлектрических приемников света, а с другой — их,недостаток. В самом деле, используя другие явления (например, фотоэффект), можно получить хотя и селективные, но более чувствительные для данной об- области спектра приемники радиации. В дальнейшем мы рассмотрим конкретные методы получения наибольшей величины отношения сигнал/шум при использовании различных приемников света, а сейчас имеет смысл остановиться на вопросе о границах всевозможных видов излучения внутри оптического диапазона спектра. Обычно считают, что длины волн видимого спектра лежат в интервале 4000—7000 А. Хорошо извест- известно, чю внутри этого интервала чувствительность глаза изменяется по закону» представленному на рис. 2, достигая максимального значения в зеленой обла- области (Я ж 5500 А). Хотя такая чувствительность глаза связана с длительным при- приспособлением органов чувств человека к условиям, сложившимся на нашей планете, где наиболее ярким источником света всегда было Солнце, все же сле- следует считать указанные выше границы достаточно условными*. Столь же ус- * Так, например, когда мы наблюдаем яркое свечение рубинового лазера (к « 6940 А) или, что еще более поражает, отлично в.идим ярко-красное свечение полупроводникового лазера на As—Ga (к « 8500 Л), го приходится оговари- оговаривать, чго граница 7000 А соответствует яркости обычных (сдолазерных») излу- излучателей. 8
ловка граница между ультрафиолетовой и видимой частями спектра, которую обычно считают равной 4000 А. Трудно также говорить о границе между инфра- инфракрасным излучением и УКВ, поскольку миллиметровые волны можно регистри- ровать и исследовать -как с помощью обычных «оптических» методов, так и спо- способами, характерными для УКВ-диапазона, что было показано еще в начале XX в. М. А. Левитской и другими учеными. Условно, наконец, и различие меж- между короткими ультрафиолеговыми волнами и мягкими рентгеновскими лучами, что было ярко продемонстрировано в работах последнего времени, выполненных А. Я. Лукирским. 4000 5500 7000 Л,А Рис. 2. Зависимость чув- чувствительности глаза от длины волны света Рис. 3. Схема разрядной рент- рентгеновской трубки: К ~ катод, А — антикатод В связи с этим следует подчеркнуть разницу между физической оптикой, изучению которой посвящена настоящая книга, и физиологической оптикой, не рассмотренной здесь. В некоторых случаях различие между ними очевидно: если ввести в дугу соль натрия и разложить ее излучение в спектр призмой или дифракционной решеткой, то мы увидим на экране ярко-желтый дублет. То, что длины волн этих линий равны 5890—5896 А, нетрудно установить из- измерениями, целиком относящимися к методам физической оптики. Но вопрос о том, почему эти линии кажутся нам желтыми, нельзя решить в рамках этой науки, и он относится к физиологиче- физиологической оптике. Конечно, проведение столь четкой границы между ними далеко не всегда возможно, и иногда трудно ре- решить, имеем ли мы, например, дело с истинной интерференционной картиной или с «кажущимися» глазу полосами, возникновение которых связано с явле- явлением контраста, и т. д. Так, известно, что в свое время Гёте (занимавшийся кроме поэзии натурфилософией вообще и физикой в частности) не разобрался в этом вопросе и аналогичная проблема в более позднее время явилась предме- предметом дискуссии «Гете против Ньютона». Некоторые интересные данные по фи- физиологической оптике содержатся в третьем выпуске лекций Р. Фейнмана*, который счел возможным сочетать изложение этих вопросов с основами физической и геометрической оптики. Рентгеновские лучи характеризуются весьма малой длиной волны (h10 а их свойства сильно отличаются от свойств других видов электромагнитного излучения. Рентгеновские лучи возникают в результате бомбардировки анти- антикатода разрядной трубки быстрыми электронами (рис. 3). Кинетическая энергия электронов mv42 ■= eU и проникающая способность рентгеновских лучей воз- возрастают с увеличением приложенной разности потенциалов U. • Смл Фейнмановские лекции по физике. Вып. HI. M.# iMep», 1965. Рис. 4. Смещение коротковолновой границы и появление характеристиче- характеристического рентгеновского излучения с ро- ростом напряжения, приложенного к рентгеновской трубке
Различают непрерывный и линейчатый спектры рентгеновских лучей. По- Последний (характеристические лучи) образуется при больших напряжениях на трубке. При возрастании напряжения смещается также коротковолновая гра- граница непрерывного спектра (рис. 4), причем Ягр ~ XlU (см. §8.5). Непрерыв- Непрерывный рентгеновский спектр связан с появлением электромагнитного импульса при торможении ускоренного электрона в теле антикатода. При увеличении ско- скоростей бомбардирующих электронов возникают добавочные процессы, которые интерпретируются как квантованные переходы между внутренними оболочка- оболочками атомов, связанные с выбиванием одного из внутренних электронов. При этом возникает линейчатый спектр. Для индикации рентгеновского излучения используют те же физические явления, что и при исследовании ультрафиолето- ультрафиолетовых лучей. В первую очередь применяют фотохимические, фотоэлектрические и люминесцентные мегоды. Дальнейшее продвижение по шкале в сторону еще более коротких электро- электромагнитных волн представляется ненужным в рамках нашего курса. Но если даже ограничить шкалу электромагнитных волн, с одной стороны УКВ, а с другой- рентгеновским излучением, то нужно считаться с тем, что у читателя неизбеж- неизбежно возникнет вопрос, можно ли в рамках единой теории как-то связать эти раз- разнородные процессы. Из дальнейшего мы увидим, сколь законны такие опасения, но следует сразу указать, что классическая электромагнитная теория света — это феноменологическая теория, описывающая распространелие элекгромаг- нитных волн в различных средах без детального анализа микропроцессов, что, конечно, ограничивает объем получаемой информации, но вместе с тем облегча- облегчает применение теории к описанию распространения радиации самых различных типов. Для получения необходимых сведений в некоторых случаях придется дополнять теорию соображениями о движении электронов в поле световой волны, обрыве их колебаний и другими предположениями электронной теории, конкре- конкретизирующими физическую картину рассматриваемых явлений.
ГЛАВА I ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНЫХ ВОЛН § 1.1. СИСТЕМА УРАВНЕНИЙ МАКСВЕЛЛА Приведем законы, которым подчиняется поведение электриче- электрического и магнитного полей, лежащие в основе теории электромагне- электромагнетизма. Эти законы, являющиеся обобщением опыта, формулируют- формулируются ниже в интегральной форме, так как именно в таком виде обычно выражают данные эксперимента. Используя основные положения векторного анализа, можно записать эти законы электромагнитного поля в дифференциальной форме. Если исследуют электромагнитное поле в каком-либо веществе, изотропно заполняющем пространство, то значения векторов Е и В получаются при усреднении микроскопических величин <ЕмикР> = Е и <Нмикр> = В. Такая запись позволяет оперировать с мгновен- мгновенными напряженностями электрического и магнитного полей в любой точке пространства. Усреднение микроскопических значений законно-в том случае, если линейные размеры области, где <Емикр> и <НмикР> можно считать неизменными, значительно превышают размеры атомов (молекул). Длина волны X является тем отрезком, на котором напря- напряженность поля сильно изменяется. Поэтому усреднение можно прово- проводить лишь в том случае, когда X значительно больше атомных разме- размеров. Такое неравенство соблюдается для всего оптического диапазона спектра, включая короткие ультрафиолетовые лучи. Сложнее обстоит дело в рентгеновской области спектра, где Я « 10"8 см, т. е. того же порядка, что и размеры атомов. В рамках данного курса количествен- количественные оценки будут проводиться лишь для оптического диапазона спек- спектра, где законность усреднения микроскопических уравнений поля не вызывает сомнений. При переходе к дифференциальной форме законов электромагнит- электромагнитного поля используют следующие теоремы векторного анализа: Теорема Гаусса о преобразовании поверхностного интеграла в объемный: andS = f V divadf. A.1) Теорема Стокса о преобразовании интеграла по замкнутой кри- кривой в поверхностный интеграл (поток ротора через поверхность, ох- охватываемую исследуемой кривой)*: ах&1 =1 rotnadS. A.2) 5 * См : С м и р н о в В. И. Курс высшей математики. Т. 2. М., Гостех- юориздат, 1970. 11
Итак, вспомним законы электрического и магнитного полей*. Первый из них — основной закон электростатики — закон Кулона. Как следствие этого закона, формулируется теорема Гаусса о потоке, которая при наличии диэлектриков в исследуемом пространстве за- записывается в виде DndS = 4я Г pdV. A.3) Отсюда указанным выше способом переходим к дифференциальной форме закона divD = 4яр, A.3а) где D — вектор электрического смещения, р — объемная плотность зарядов. Существенно, что выражения A.3) и A.3а), полученные из урав- уравнений электростатики, обобщаются Максвеллом для переменных полей, где D и р зависят от времени. Отсутствие в природе магнитных зарядов (монополей) приводит к выражению §BndS = 0, A.4) которое преобразуется к виду divB =0. A.4а) Эти формулы соответствуют хорошо известным модельным пред- представлениям о силовых линиях электрического поля, начинающихся на положительных зарядах и заканчивающихся на отрицательных, тогда как линии магнитного поля замкнуты и охватывают породившие их токи. Введение понятия линий электрического и магнитного полей совершенно не обязательно (смысл законов содержится в приведен- приведенных формулах), но, как и во многих других случаях, наглядность модельных представлений помогает пониманию явления. Переходя к описанию свойств электрического тока, сформулируем основной закон о зависимости напряженности магнитного поля от силы породившего его тока. Этот закон обычно связывают с именами Биоу Савара и Лапласа. Запишем его в виде, который называют теоремой о циркуляции вектора Н: dS. A.5) Дифференциальная форма этого закона получается применением теоремы Стокса к равенству A.5) и описывает связь плотности тока j с напряженностью магнитного поля в данной точке: rotH=— j. A.6) с * См. Фриш С. Э., Т и м о р е в а А. В. Курс обшей физики. Т. 2. М., Фи- зматгиз, 1962. 12
Как известно, Максвелл ввел ток смещения, плотность которого удовлетворяет соотношению . i_aD ]см~4я dt ' Ток проводимости и ток смещения дополняют друг друга, образуя полный ток плотностью *ПОЛН == 1пр ~Т" J CM» которая, согласно Максвеллу, и фигурирует в уравнении A.6). Последним из требующихся нам фундаментальных соотношений является математическая формулировка знаменитого открытия Фа- радея — закона электромагнитной индукции. ^инд с dt ' U ' в котором электродвижущая сила #инд, возникающая в замкнутом контуре, связывается со скоростью изменения потока магнитной ин- индукции Ф, пронизывающего этот контур. При соблюдении некоторых условий эксперимента (в частности, если контур с током неподвижен и не деформируется за время измере- измерений) справедлива следующая интегральная запись закона индукции: / S откуда легко получается дифференциальная форма закона rotE.-J-?. A.9) С 01 Здесь уместно сделать следующее замечания: 1. Хорошо известны соображения о вихревом характере электри- электрического поля, порождаемого изменяющимся во времени магнитным полем. Это переменное электрическое поле существенно отличается от потенциального электростатического поля, создаваемого системой неподвижных электрических зарядов, для которого rot E = 0. В по- последующем нас будет интересовать именно переменное электрическое поле. Но, как было показано Максвеллом, наличие переменного элек- электрического поля с неизбежностью приводит к возникновению связан- связанного с ним магнитного поля и поэтому нужно говорить о едином элек- электромагнитном поле, характеризуемом в каждой точке пространства взаимосвязанными ортогональными векторами Е и В. 2. Введение Максвеллом понятия тока смещения вначале выгля- выглядело как гениальная догадка. Но несовместимость сформулированного уравнения электромагнитного поля A.6) и уравнения непрерывности div}=—Jj-, A.10) 13
пырлж.пощою одно in самых общих свойств материи - закон сохра- hviuih электрического заряда, — с неизбежностью приводит к необ- необходимости введения дополнительного слагаемого в правую часть уравнения поля. Следовательно, уравнение A.6) должно иметь вид Именно это изменяющееся во времени электрическое поле, столь не- неудачно названное «током смещения», и связанное с ним магнитное поле будут играть главную роль в дальнейшем изложении. Итак, имеем уравнения электромагнитного поля в следующем виде: div D = 4яр, div В = О, =4^ (J f J- £), rotE—L * A.11) с \ 4я dt) с dt Их нужно дополнить «материальными» уравнениями, учитываю- учитывающими соотношение между векторами Е, D, В, Н и j. При отсутствии ферромагнитных и сегнетоэлектрических материалов для изотроп- изотропных сред можно записать эти уравнения при помощи трех констант: а (электропроводность), е (диэлектрическая проницаемость) и fi (магнитная проницаемость), постулируя линейную связь между D и Е, В и Н, j и Е, т. е. D = еЕ, В =[хН, j =aE. A.12 Следует также сформулировать граничные условия для уравнений электромагнитного поля, из которых наиболее широко будем исполь- использовать равенство тангенциальных составляющих Е и Н на границе раздела двух сред, т. е. ЕХх =£т„ НХх = #*,. A.13) Если предположить, что две граничащие среды разделены слоем, в котором е, \i и а изменяются непрерывно, a j и р конечны, то при стремлении к нулю толщины этого слоя уравнения A.9) и A.6) све- сведутся к равенствам A.14). Однако при решении конкретных задач часто возникает необходимость задать значения искомых функций (например, Ех или #т) на границе исследуемой области. Такие гра- граничные условия определяются условиями эксперимента и не выте- вытекают из уравнений электромагнитного поля. Они должны быть добав- добавлены к системе уравнений A.11). В частности, при рассмотрении без- безграничного пространства часто задают вид тех или иных функций на бесконечности, руководствуясь физическими условиями решаемой задачи. Система уравнений, включающая в себя уравнения электромаг- электромагнитного поля, «материальные» соотношения и граничные условия, на- названа системой уравнений Максвелла и играет в электродинамике ту же роль, что и аксиоматика уравнений Ньютона в классической ме- механике. Из дальнейшего станет ясно, что классическая физика зиж- 14
дется на уравнениях Ньютона и Максвелла, а из проведенного крат- краткого рассмотрения очевидна генетическая связь уравнений Максвел- Максвелла с экспериментальными законами электромагнетизма. В электродинамике доказывается, что система уравнений Максвел- Максвелла является полной, т. е. из нее можно получить все свойства электро- электромагнитного поля. Укажем также, что уравнения Максвелла, выведен- выведенные для неподвижных тел, справедливы и для движущихся тел, хотя этот вопрос требует дополнительного исследования (см. гл. VII). § 1.2. ПОПЕРЕЧНОСТЬ ЭЛЕКТРОМАГНИТНЫХ ВОЛН Система уравнений Максвелла позволяет корректно описать воз- возникновение и распространение электромагнитных волн, представ- представляющих собой совокупность быстропеременных электрического и маг- магнитного полей. Такие волны вполне материальны и характеризуются определенной энергией и рядом других параметров, позволяющих экспериментально их исследовать. Все дальнейшее изложение фак- фактически будет посвящено изучению физических процессов, связанных с распространением коротких электромагнитных волн и выявлением их свойств в различных условиях эксперимента. Отложим до следующего параграфа более строгое доказательство существования электромагнитных волн и начнем рассмотрение их свойств с наиболее простого случая — распространения волн в одно- однородном диэлектрике (а =0), не содержащем объемных зарядов (р =0). Очевидно, что в этом случае j = 0, т. е. всюду и всегда от- отсутствует ток проводимости, а наличие магнитного поля Н связано лишь с существованием переменного электрического поля (тока сме- смещения). Систему уравнений Максвелла в этом случае можно записать сле- следующим образом: div D == 0, div В = 0, rotH = -J-aJ> „ЛЕ—Л* A.14) с dt с dt при связи D = еЕ, В = |хН. Как правило, в диэлектриках [,i ^ 1 и можно считать В = Н, но для сохранения общности пока не будем исключать \i. На границе раздела двух ди?лектриков по-преж- по-прежнему будут справедливы граничные условия для тангенциальных составляющих векторов Е и Н, т. е. EXl = ЕХг и НТх = Нх%. Исследуем очень важный частный случай (вносимые ограничения будут позднее оценены) — одномерную задачу, иными словами, при- примем, что векторы Е, D, Н, В зависят только от z и t. Это отнюдь не значит, что векторы Е и Н не имеют х- и «/-компонент, но в данный момент времени t и при z = const эти компоненты имеют вполне опре- определенные значения, одинаковые на всей плоскости, перпендикуляр- перпендикулярной оси z. Такое поле называют однородным. Подобное ограничение позволит пока не пользоваться формулами векторного анализа, а ре- решать скалярную задачу. 15
Обратимся сначала к вопросу о поперечности электромагнитных воли, распространяющихся в безграничной изотропной среде (свобод- (свободных) II* нерпой ароки уравнений Максвелла A.14) следует, что \)г const н Bz - const. Эти соотношения указывают на постоянство составляющих векторов D и В вдоль оси Zbo всех точках пространства. Рассмотрим вторую строку уравнений Максвелла, связывающих значения роторов Е и Н со скоростями изменения во времени векторов D и В. Так как компоненты Е и Н зависят только от г, а z-компонента ротора зависит лишь от производных по х и по у, то можно сразу же написать: Следовательно, не только в пространстве, но и во времени Dz = = const и Bz = const. Таким образом, вдоль оси Z может существовать лишь статическое поле (например, созданное каким-либо распределе- распределением зарядов электростатическое поле), которое в дальнейшем нас не будет интересовать. Поэтому, не нарушая общности, полагаем Dz = Bz == 0, что свидетельствует о строгой поперечности электро- электромагнитной волны, распространяющейся вдоль оси Z. Мы видим, что электромагнитная теория сразу привела к одно- однозначному выяснению проблемы, представляющей чрезвычайные затруднения в старой волновой теории света. Действительно, опытами Френеля и Араго была экспериментально доказана поперечность све- световых волн, но истолкование этих опытов в рамках представлений о распространении упругих волн в эфире было крайне трудно и по- потребовало введения искусственных предположений, чрезвычайно ус- усложнивших теорию. Сейчас это совершенно не актуально, светоносный эфир неприемлем не только как конкретная среда, но и как абстракт- абстрактная система отсчета (см. гл. VII), и отсутствие продольной составляю- шей свободной электромагнитной волны оказывается простым след- следствием уравнений Максвелла. Интересен вопрос о возможности экс- экспериментального доказательства этого фундаментального свойства электромагнитных волн (см. гл. V). На данном этапе имеет смысл ука- указать на возможность эффектной иллюстрации их поперечности в опы- опытах с современными источниками СВЧ (рис. 1.1). Пусть приемник радиации представляет собой определенным обра- образом ориентированный рупор, соединенный с кристаллическим детек- детектором и волноводом. Заметим, что такая система пропускает электро- электромагнитную волну с вполне определенным направлением колебаний (с определенной линейной поляризацией). При повороте излучателя относительно приемника на угол л/2 мы будем наблюдать полное ис- исчезновение сигнала. Этот опыт иллюстрирует излучение передатчиком линейно поляризованной электромагнитной волны (если бы излучение было не поляризовано, то поворот на я/2 никак не сказался бы на величине сигнала). Но в то же время он свидетельствует об отсутст- отсутствии продольной составляющей электромагнитной волны, так как при наличии таковой никак нельзя было бы погасить ее вращением ис- 16
точника или приемника радиации в плоскости, перпендикулярной направлению распространения волны. Следует подчеркнуть, что поперечность электромагнитной волны является одним из самых важных ее свойств. Однако при определен- определенных условиях эксперимента может возникать сложная картина, при истолковании которой легко ошибиться. Речь идет о распространении волны при наличии каких-либо ограничивающих экранов, отражаю- отражающих зеркал и других аналогичных устройств. При строгом решении 7/////////////////////////////////, Рис. 1.1. Общий вид установки для демонстрации элек- электромагнитных волн в СВЧ-диапазоне таких задач необходим аккуратный учет граничных условий в урав- уравнениях Максвелла, но некоторые результаты можно получить и ка- качественно. Так, например, пусть система волн распространяется между дву- двумя параллельными отражающими плоскостями (это упрощенная модель волновода, широко применяющегося в технике УКВ). Ось Z направим между этими плоскостями параллель- параллельно им [(рис. 1.2). Тогда для волны, распространяющейся вдоль оси Z, на- наличие ограничений скажется мало и она будет подобна свободной волне, которая, как мы знаем, строго попе- поперечна. Волны, направление распро- распространения которых при входе в си- систему составляет некоторый угол с осью Z, будут отражаться от ограни- ограничивающих плоскостей. Эти волны, конечно, поперечны, но векторы Е* и Н* будут иметь составляющие вдоль оси Z. Для того чтобы выяснить, какова суммарная, волна на выходе из такой системы, нужно сложить векторы Е* (их сумма 2Е* определяет результирующую напряженность поля Е) и Hi (их сумма 2Н| определяет результирующую напряженность магнитного поля Н). Очевидно, что в суммарной волне, вышедшей из такой системы, может присутствовать продольная составляющая В зависимости от условий 17 У////////////////////////////////Л Рис. 1 2. Упрощенная модель вол- волновода При прохождении волны вдоль волно- волновода может образоваться продольная составляющая суммарного поля
прохождения электромагнитной волны внутри такой модели волновода могут появиться как Ez-, так и #2-компоненты. Поэтому возникают различные типы волн, которые обозначают ТЕМ, ТЕ, ТМ и т. д.* В дальнейшем мы не будем учитывать эти волны, играющие боль- большую роль в вопросах техники СВЧ, и сосредоточим свое внимание на свойствах свободных электромагнитных волн. Но все же необходимо иметь в виду, что в некоторых сложных случаях при отражении и преломлении волн в силу указанных причин может появиться состав- составляющая вектора Е в направлении распространения суммарной волны. Наличие такой составляющей у суперпозиции волн ни в коей мере не противоречит сформулированному ранее положению о строгой по- перечности свободной электромагнитной волны. Заметим, что аналогичные проблемы, требующие детального ана- анализа граничных условий, возникают при распространении сложной электромагнитной волны вдоль какого-либо изогнутого прозрачного стержня или волокна, показатель преломления в котором больше, чем в окружающей среде. Такой способ передачи световой энергии («волоконная оптика») основан на использовании полного внутреннего отражения (см. § 2.4). Рассмотрим теперь поляризацию свободных электромагнитных волн, которую можно получить из уравнений Максвелла. Проведем простые выкладки, используя уже ввведенные упрощения. Преобра- Преобразуем уравнения rot Н = — ^- и rot Е = — — -^ для данной одно- одномерной задачи, учитывая, что все компоненты векторов Н и Е зависят только от координаты г и времени t: ^-компоненты роторов ^-компоненты роторов дну дг дЕу дг 1 с 1 с oDx dt ' дВх dt ' дНх дг дЕх дг 1 с dDy dt ' 1 dBy с dt A.16) Используем соотношения Dx = еЕх, Вх = \iHx и т. д. и сгруп- сгруппируем полученные соотношения так, чтобы в колонке I слева были у-компоненты вектора Н, а в колонке II слева — ^-компоненты того же вектора (Нх): A.17) Колонка I dHy г dz с ** дНу с dt дЕх dt * dEx dz f Колонка II dHx 8 dEy dz ц dHx с dt с dt dEy dz Компонента Hx в этих уравнениях связана с Еу и не связана с Ех. Соответственно Ну связана с Ех и не связана с Еу. Такие соотношения ♦ См.: Харкевич А. Основы радиотехники. М., Связьиздат, 1962. 18
могут иметь место в том случае, если вектор Е перпендикулярен век- юру Н*. Для наглядности упростим задачу. Направим ось X вдоль Е. Тогда Нх = О, Ех= Е. Из системы четырех уравнений A.17) останутся лишь два: dz dt dt дЕ дг A18) Взаимное расположение ортогональных векторов Е и Н, каждый из которых перпендикулярен направлению распространения (оси Z), показано на рис. 1.3. Это упрощение задачи, при котором направление Рис 1 3 Взаимное рас- расположение векторов Е и Н в линейно поляризо- поляризованной волне Рис 14 Эллиптическая поляризация Конец вектора Е описывает / Кц р эллипс /, конец вектора описывает эллипс 2 Н векторов Е и Н в распространяющейся волне остается неизменным, имеет очень большое значение и широко используется в электромаг- электромагнитной теории света. Физические свойства такой волны, называемой линейно поляризованной, будут рассмотрены ниже.** Линейной поляризацией не исчерпываются возможные типы поля- поляризации электромагнитных волн, на что указывает система уравнений A.17). Часто возникает такое колебание, при котором в каждой фик- фиксированной точке конец вектора Е (а соответственно и конец орто- ортогонального ему вектора Н) движется по эллипсу. Это так называемая эллиптическая поляризация (рис. 1.4), частным случаем которой слу- служит круговая поляризация (циркулярно поляризованный свет). В по- последнем случае конец вектора Е движется по окружности. Но возможен и другой предельный случай — эллипс может выродиться не в круг, а в прямую. Так возникает линейная поляризация. Следовательно, эллиптическая поляризация является наиболее общим случаем поля- поляризации электромагнитных волн. Для последующего важно напомнить, что она всегда возникает при наличии постоянной разности фаз б * Строгое доказательство ортогональности Е и Н см. в § 3.2. ** Линейную поляризацию часто называют плоской, подчеркивая этим, что колебания вектора Е осуществляются в заданной плоскости, проходящей через направление распросгранения волны. 19
между двумя взаимно перпендикулярными колебаниями. Пусть х = = ах cos со/, у = а2 cos (a>t — 6). Тогда, исключая время, получим траекторию движения — эллипс, т. е. ^ + ^ — ^- cos б = sin2 б. г г а\ а\ аха2 Эксцентриситет и положение эллипса относительно выбранной системы координат зависят от разности фаз б. В частности, если б = = я/2, то х*/а{ + y2la\ = 1 и при аг = а2 эллипс вырождается в ок- окружность. Вместе с тем при б = kn (где k = 0, 1, 2, ...) эллипс вы- вырождается в прямую, т. е. эллиптическая поляризация переходит в линейную. Математически удобно описать наличие такой разности фаз б введением комплексной амплитуды в уравнение колебания, записан- записанное в виде Е = Сеш. Пусть С = а + ib. Но любое комплексное чис- число С можно записать в виде С = Сое/б, где Со — вещественная ве- величина. При этом справедливы следующие известные соотношения: tg б = Ыа и q = а2 + b\ Следовательно, наличие комплексного отношения составляющих (ЕУ1ЕХ) у волны свидетельствует об эллиптической поляризации излу- излучения, тогда как для линейно поляризованной волны это отношение вещественно. Преобразуя систему четырех уравнений A.17), в кото- которую входят две проекции векторов Е и Н, в систему A.18), получаю- получающуюся при закреплении направления колебаний этих векторов, мы переходим от эллиптической поляризации к линейной: Е = Ех (см. гл. III). § 1.3. ПЛОСКИЕ МОНОХРОМАТИЧЕСКИЕ ВОЛНЫ И ВОЗМОЖНОСТЬ ИХ ЭКСПЕРИМЕНТАЛЬНОГО ОСУЩЕСТВЛЕНИЯ Основные свойства электромагнитных волн (поперечность и орто- ортогональность векторов Е и Н) были получены в § 1.2 из прямого ана- анализа уравнений Максвелла, причем молчаливо предполагалось, что существование электромагнитной волны бесспорно. Для более стро- строгого доказательства того, что электромагнитное поле распространяет- распространяется в виде волны, покажем, что из уравнений Максвелла для одно- однородной непроводящей среды следует волновое уравнение. Будем по-прежнему рассматривать одномерную задачу, т. е. счи- считать Ну = Я и Ех= Е, где Е и Я зависят лишь от z и t. Это ограниче- ограничение скажется лишь на свойствах волн (что будет подробно обсуждено ниже), но не имеет отношения к поставленному вопросу об их су- существовании. Будем исходить из уравнений A.18). Продифференциро- Продифференцировав первое уравнение по i и умножив на \i/c и продифференцировав второе по переменной z, найдем: \i с dtdz откуда 02 £ с2 'д*Е A.19) 20
Аналогично можно получить дифференциальное уравнение для напряженности магнитного поля электромагнитной волны: 02 Я С2 02 Н д/2 8jx dz2 A.20) Следовательно, как Е, так и Н удовлетворяют одному и тому же уравнению Это и есть волновое уравнение. В математической физике доказы- доказывается, что оно не имеет других решений, кроме функций вида f (t ± zlu) и их суперпозиции. Параметр и в данном решении есть скорость распространения волны вдоль оси Z. Таким образом, мы доказали, что электромагнитное поле распространяется в пространст- пространстве в виде волн. Из сопоставления уравнений A.19)—A.21) имеем A.22) т. е. получаем известную формулу Максвелла. Величина п = V^ejui =c/u называется показателем преломления среды. В рамках электронной теории физический смысл этой важней- важнейшей величины связан с колебаниями электронов и ионов под действием световой волны, распространяющейся в исследуемой среде, чем и объясняется наблюдающаяся на опыте зависимость показателя пре- преломления от длины волны (см. гл. IV). В классической электромаг- электромагнитной теории столь формально вводимый показатель преломления считается константой, определяемой значениями е и \i для исследуе- исследуемой среды. В вакууме е = |х = 1 и, следовательно, и = с. Распростра- Распространение волны и в этом случае происходит не мгновенно, а с конечной, хотя и очень большой, скоростью. Вопросы об экспериментальном определении скорости электромагнитных волн и согласии с опытом выражения и =с/п см. в § 1.5. Заметим также, что магнитное поле Н распространяется с той же скоростью и =с/п [уравнения A.19) и A.20) однотипны]. Этого и следовало ожидать, так как распростра- распространение векторов Е и Н в виде электромагнитной волны есть единый про- процесс. Вернемся теперь к выявлению тех ограничений, которые связаны с введенными выше упрощениями в постановке задачи. Выше уже указывалось, что закрепление направления колебаний векторов Е и Н соответствует переходу от эллиптической к линейной поляризации электромагнитной волны. Постановка одномерной задачи [Е = ф (г, /)] фактически означает использование плоских волн. В этом случае излу- излучению с плоским волновым фронтом соответствует в оптике параллель- параллельный пучок лучей. Отклонимся от вопроса о том, сколь реально экс- экспериментальное осуществление плоской волны, и исследуем подроб- подробнее ее свойства. 21
Выше указывалось, что в общем случае плоская волна описывается функцией вида f (t ± z/u). Наиболее простым, но очень важным ча- частным случаем такой волны является волна, возникающая в результате гармонического колебания, которая записывается следующим об- образом: Е = £0 cos (о (t — z/u). Это и есть выражение для плоской линейно поляризованной моно- монохроматической волны (о = const), и его можно записать любым из приводимых ниже способов: E=r-E0cosLt —)=£0 cos ffirf— — sW£0cos(©/—fc). A.23) где k = 2я/А, — волновое число. Здесь приводятся эти элементарные преобразования, так как в даль- дальнейшем будут использованы различные формы записи уравнения пло- плоской монохроматической волны. Удобна запись и в виде Е = Re Ео ехр [ш (t — z/u)] = Re Ео ехр [i (&t — kz)]. Амплитуда может быть комплексной (физический смысл этого свя- связан с эллиптической поляризацией волны), и, кроме того, Е — ве- величина векторная. Поэтому в общем случае нужно записать выраже- выражение для плоской монохроматической волны в виде Е = Ео ехр [i (&t — kz)]. A.24) Соотношение A.24), описывающее монохроматическую волну, слу- служит одним из возможных решений волнового уравнения, и такая вол- волна обязательно должна быть поляризована (в общем случае эллип- эллиптически). Итак, мы пришли к чрезвычайно важному утверждению, глубокий смысл которого заключается в том, что поляризация моно- монохроматической волны является прямым следствием уравнений Мак- Максвелла. Однако опыт показывает, что если не применять специальных приспособлений, то в оптических экспериментах практически всегда мы имеем дело с неполяризованньш светом. Почему и как нарушает- нарушается поляризация электромагнитной волны, будет рассказано ниже. Если направление колебаний вектора Е уже задано, выражение A.24) упрощается и эту формулу можно записать в скалярном виде. Тогда оказывается целесообразным использование при дифференци- дифференцировании исследуемой функции так называемого символического ме- метода. Так, например, если ищется решение волнового уравнения в виде Е = Ео ехр [ш (t — z/u)]9 A.24a) то операция дифференцирования по времени -^ сводится к умножению функции A.24а) на ш. Аналогично, ^ = — i —, ^ = — о2, 62 Я* = 22
Подставляя эти значения в уравнение A.19), имеем 2 С С2 / 02 \ откуда в явном виде получаем формулу Максвелла и =< Легко найти также соотношение между значениями векторов Е и Н в каждый момент времени и в каждой точке пространства. Восполь- ък дН 8 дЕ тт зуемся уравнением Максвелла — ^- = — ■%?•. Ищем его решение в виде 02 С ОТ Н = #<> ехр [ш (t — г/и)], Е =Е0 ехр [/со (* — г/и)]; отсюда находим Заменяя u—c/Y& Щ имеем YVH =У"е Е. Для диэлектриков, как уже указывалось, обычно ц«1 и, следовательно, Н =)/?£; в вакууме Так как в свободной волне векторы Е и Н синфазны, т. е. одновре- одновременно и в одних и тех же точках пространства достигают максималь- максимального или минимального значения, то легко изобразить распростра- распространение линейно поляризованной волны на графике (рис. 1.5), избрав Рис. 1.5. Распределение в пространстве поля линейно по- поляризованной волны в качестве осей координат направления векторов Е (ось X) и Н (ось У) и направление распространения (ось Z). Совершенно аналогичная картина получается для зависимости от времени поля линейно поля- поляризованной волны, наблюдаемой в определенной точке пространства. Следует иметь в виду, что векторы Е, Н и направление распростра- распространения всегда составляют в свободной волне так называемый правый винт. Это очень важное свойство станет более очевидным, когда будет введен вектор, характеризующий распространение энергии. Часто такую свободно распространяющуюся волну называют бегущей, чтобы отличить ее от стоячей волны (см. § 1.6), где синфазность векторов Е и Н не имеет места. 23
Итак, используя уравнения Максвелла для однородной непроводя- непроводящей среды, мы получили ряд фундаментальных результатов, которые имеет смысл перечислить: 1. Доказано существование электромагнитных полей, распростра- распространяющихся в пространстве в виде волн. 2. Установлены поперечность свободной электромагнитной волны и ортогональность векторов Е и Н. 3. Указаны возможные виды поляризации электромагнитной волны. 4. Получены выражения_для скорости распространения электро- электромагнитной волны и = с/у ер (формула Максвелла) и количественное соотношение между векторами Е и Н для каждой точки пространства и в каждый момент времени. Заметим, что полученные результаты справедливы для любого значения со, что и выявляет универсальность использованного метода. Теперь необходимо более подробно исследовать найденные выше свойства плоских электромагнитных волн, с которыми и придется главным образом иметь дело в последующем изложении. Этими основ- основными характеристиками служат наличие плоского фронта, монохро- монохроматичность и существование определенной поляризации излучения. Разберем их последовательно, уделяя особое внимание вопросу о том, в какой степени такую абстракцию можно реализовать на опыте. 1. Плоский фронт волны относительно просто создается системой зеркал, что нетрудно продемонстрировать как в области УКВ, так и в оптическом диапазоне. При этом получается более или менее на- направленная (т. е. мало расходящаяся) волна, хотя детальный анализ степени направленности излучения часто оказывается далеко не про- простым. Фронт волны, создаваемой локальным источником на достаточно большом расстоянии от него, можно считать плоским. Амплитуда ко- колебаний для расходящейся волны уменьшается с увеличением рас- расстояния от источника. В оптической области можно использовать следующую, в принципе простую, систему: малая диафрагма (или щель, ограниченная по вы- высоте) помещается перед линзой (объективом) в ее фокусе. Тогда на выходе этого устройства (рис. 1.6), называющегося коллиматором, получается параллельный пучок света, соответствующий плоской волне. Но если излучение источника содержит широкий интервал длин волн (т. е. не монохроматично), то создание такой системы ста- становится затруднительным, так как условия фокусировки для радиа- радиации разных длин волн различны. Мы замечаем, что свойства плоской волны (в данном случае наличие плоского фронта и монохроматич- монохроматичность) оказываются зависимыми. Укажем, что излучение лазера (оптического квантового генератора) в наибольшей степени отвечает сформулированным требованиям — расходимость пучка очень мала* и излучается обычно строго определенная длина волны (рис. 1.7). * Наименьшую расходимость имеют газовые лазеры. Она составляет для них примерно 10'. Использованием относительно простой телескопической на- насадки можно еще уменьшить расходимость излучения газового лазера (до 10— 20"). 24
2. Более серьезен вопрос о возможности создания монохрома- монохроматического излучения. Конечно, понятие монохроматической волны вида A.23) несколько идеализировано. Монохроматическая волна рождается гармоническим колебанием, которое длится вечно, тогда как любое реальное колебание не может продолжаться сколь угодно долго. Очевидно, что колебание, график которого представлен на рис. 1.8, не является гармоническим, но чем больше т = t2 — tx по сравнению с периодом колеба- ний Т, тем в большей степени этот импульс походит на монохрома- монохроматическую волну. Легко показать, что чем больше т, тем меньше ин- интервал частот Av, соответствующий данному излучению [Av ~ 1/т, см. E.19)]. Рис. 1.6. Схемы получения пло- плоского фронта волны при помощи зеркала (а) и линзы (б) Рис. 1.7. Схематическое изображе- изображение газового лазера: в«10' — угол, характеризующий рас- расходимость излучения. Указана поляри- поляризация волны Значение принятой идеализации (т = оо) велико именно потому, что любой импульс можно представить в виде суммы (конечной или бесконечной) гармонических функций вида Eoi cos (co^ — q>j). Су- Существуют серьезные основания, в силу которых разложение по гар- гармоническим функциям представляется с точки зрения физика наибо- Рис. 1.8. Пример негармонического колебания лее целесообразным по сравнению с любой другой возможной мате- математической операцией. Мы еще вернемся к вопросу о разложении из- излучения в спектр (см. § 6.7), а сейчас имеет смысл выяснить степень монохроматичности излучения тех или иных источников электромаг- электромагнитных волн и указать основные способы монохроматизации радиа- радиации (т. е. уменьшения интервала частот Av). Как уже упоминалось, для любой радиации следует различать сплошной и линейчатый спектры. В диапазоне УКВ переход от виб- вибратора Герца к современным источникам (клистрон, магнетрон) оз- 25
нпчает переход от сплошного спектра к линейчатому. Клистрон из- излучает волну строго определенной длины (например, X ж 3 см). Из- Измерить эту длину нетрудно (см. § 1.6), но определение степени моно- монохроматичности такого источника требует достаточно тонких опытов, рассмотрение которых увело бы нас далеко за рамки нашего курса. В оптическом диапазоне тоже приходится иметь дело как со сплошным, так и с линейчатым спект- спектром. Естественный свет (так называемый «белый») содержит все частоты — можно считать, что со из- изменяется от 0 до оо. Такие сплошные спектры (но с различным распределением энергии по частотам) дают раскаленные тела и некоторые другие источ- источники. Выделение какой-то узкой области частот из сплошного спектра представляет собой трудную и неблагодарную задачу — чем уже область, тем меньше энергии в ней остается. Поэтому использо- использование линейчатого спектра удобнее, но здесь также возникают затруднения, особенно если иметь дело с многолинейчатым спектром. Для монохроматиза- ции излучения используют различные приборы (будем условно называть их монохроматорами). Использование каждого из этих устройств связано с потерей части энергии, но эффективность такой методики несравненно больше, чем в случае сплош- сплошного спектра. Так, например, относительно легко выделить из ртутного спектра какую-либо линию (чаще всего выделяют зеленую линию с X = = 5460 А). Но следует иметь в виду, что каждая спектральная линия имеет определенную ширину («естественная» ширина « 10~4 А, и, Окроме того, Рис. 1.9. Структу- линия обычно уширяется до 0,1—0,01 А в силу раз- различных причин, см. § 5.2). Для того чтобы оценить условность рассмат- рассматриваемой операции монохроматизации излучения (выделение отдельной линии из спектра реального источника света), на рис. 1.9 приведена структура упоминавшейся зеленой линии ртути (см. § 5.9). Наличие множества различных компонент этой линии связано со сложным изотопическим составом ртути и взаимодействием ядра атома ртути с его электронной оболочкой. Если попытаться выделить один из таких пиков, т. е. в еще большей степени монохроматизировать излучение, что бывает необходимо при интерференционном определе- определении длины и в других задачах, то придется значительно усложнить методику эксперимента. Эти примеры показывают, что при любой монохроматизации излу- излучения реального источника всегда используют определенный интервал частот, который обычно лишь в грубом приближении может считаться бесконечно малым. 1 ""■* 1 i III *"* III ^ и 1 R ра зеленой линии ртути, зарегистри- зарегистрированной на при- приборе, мало иска- искажающем ее истин- истинный контур 26
Излучение лазера представляется наиболее близким к идеальной монохроматической волне. Эффективная ширина каждой из компонент линии газового лазера в результате ряда причин оказывается даже меньше указанного выше предела (она равна 10~6—10~7 А, тогда как «естественная» ширина линии составляет 10~4 А), а мощность, излу- излучаемая в столь узком интервале длин волн, относительно велика. Так, неон-гелиевый лазер, генерирующий излучение, с длиной волны 6328 А, обычно имеет мощность порядка нескольких милливатт. В не- некоторых других газовых лазерах (например, в ионном аргоновом) излучается мощность порядка нескольких ватт, а инфракрасный лазер на СО2 (Я ^ 10 мкм) излучает громадную мощность (несколько кило- киловатт). Укажем также, что существуют лазеры, излучающие энергию импульсами, длительность и частота повторений которых можно варь- варьировать. В частности, очень распространены импульсные лазеры на рубине (X ж 0,69 мкм) и неодимовом стекле (X « 1,06 мкм), мощность которых может достигать нескольких мегаватт, а в специальном режиме «гигантских импульсов» — значений « 109 Вт и более. 3. Поляризация излучения является третьей основной характери- характеристикой плоской монохроматической волны. Наиболее простой случай линейной поляризации имеет место в УКВ-области, и его можно ис- искусственно создать и в оптическом диапазоне. Существует множество различных типов оптических поляризаторов — устройств, на вы- выходе которых получается линейно поляризованный свет (кристаллы исландского шпата или кварца, призма Николя и различные другие приспособления). С помощью таких устройств можно не только по- поляризовать излучение, но и проверить, характеризуется ли неизвест- неизвестная радиация линейной поляризацией. Методика подобных исследо- исследований ясна из рис. 1.10, где показаны две взаимные ориентации по- поляризатора и анализатора, при которых свет или проходит целиком, или нацело задерживается. Более сложный метод исследования эллип- эллиптически поляризованного света (который можно спутать со случаем частичной поляризации в какой-либо плоскости) будет приведен в гл. III, посвященной прохождению света в кристаллах. При общем изучении явления поляризации необходимо объяснить, как возникает характеризующийся осевой симметрией обычный не- поляризованный свет. Как уже упоминалось, решением уравнений Максвелла служит строго монохроматическая волна, и поэтому она обязательно должна быть поляризована (в общем случае эллиптиче- эллиптически). Лишь обрыв колебаний (нарушение монохроматичности волны) приводит к исчезновению данной поляризации излучения. Именно так обстоит дело в оптике, где в среднем через каждые 10~8 с проис- происходит затухание колебаний. Если бы поляризацию исследовали безы- безынерционной аппаратурой, то можно было бы обнаружить смену раз- различных эллипсов через столь малые промежутки времени. Но создать такую аппаратуру трудно, любое приспособление, пригодное для исследования поляризации, неизбежно инерционно, и, наблюдая есте- естественный свет, мы усредняем изменение его поляризации за промежу- промежуток времени, значительно превышающий 10~8 с. Так и возникает 27
(рис. 1.11) осевая симметрия колебаний вектора Е (неполяризован- ный свет), которая и наблюдается на опь!те. Применяя какое-либо поляризационное устройство, можно вы- выделить из неполяризованного света колебания вполне определенного направления и затем оперировать с таким линейно поляризованным излучением. В дальнейшем будет показано, что можно рассматривать неполяризованный свет как сумму двух взаимно перпендикулярных линейно поляризованных колебаний, никак не скоррелированных между собой по фазе, — сдвиг фаз б за время наблюдения хаотически меняется. Эллиптическая поляризация излучения возникает в тех а) Поляризатор Анализатор ГР|( 5) fR\ Рис. 1.10. Взаимная ориентация поляризатора и анализатора Стрелками показано направление пропускаемых колебаний: анализа- анализатор пропускает свет (а); не пропу- пропускает (б) Рис. 1.11. Осевая симметрия колеба- колебаний вектора Е в ес- естественном свете случаях, когда этот сдвиг фаз S искусственно можно сделать постоян- постоянным во времени. При 6=0 эллиптическая поляризация вырождается в линейную (см. гл. III). В заключение стоит указать, что и по поляризации излучение лазера отличается от излучения обычных источников света. Физика процес- процессов в лазере связана не со случайным началом колебаний (спонтанное излучение), а с некоторыми более сложными явлениями, обусловлен- обусловленными взаимодействием электромагнитного излучения и атомных си- систем. Такое вынужденное излучение (это понятие было введено Эйн- Эйнштейном еще в 1916 г.; см. гл. VIII) должно характеризоваться вполне определенной поляризацией. При работе со специально изготовлен- изготовленными лазерами, у которых окна разрядной трубки перпендикулярны ее оси, можно наблюдать, как через определенное время At один вид эллиптической поляризации переходит в другой. Но обычно окна раз- разрядной трубки, находящейся внутри резонатора, располагают под некоторым углом к ее оптической оси (угол Брюстера), что (см. гл. II) неизбежно приводит к линейной поляризации излучения, выходяще- выходящего через любое из зеркал резонатора. Следовательно, обычный лазер является интенсивным источником линейно поляризованного света (см. рис. 1.7). Итак, мы видим, что для создания в эксперименте плоской моно- монохроматической волны нужно использовать коллиматор, монохрома- тор и поляризатор. Излучение произвольного источника света, про- пропущенное через систему, содержащую все эти устройства, в какой-то 28
степени соответствует идеальной волне, описываемой A.24). Излу- Излучение лазера в еще большей степени соответствует принятой идеали- идеализации. Из предыдущего изложения следует, что в оптике обычно имеют дело с волнами, которые лишь в известной степени могут считаться монохроматическими. Поэтому большое значение имеет способ описа- описания оптических явлений, в котором вводится понятие квазимонохро- матической волны вида Е = Ео @ cos Ы — Ф (/)]. A.246) В этом соотношении амплитуда Ео @ и фаза ф (f) не постоянны, а относительно медленно (по сравнению, с основными колебаниями на несущей частоте <о) изменяются во времени. Другими словами, квази- квазимонохроматическая волна имеет модулированную амплитуду и фазу. При описании некоторых оптических явлений можно пренебречь из- изменением Ео (t) и ф (/) и исследовать распространение монохроматиче- монохроматической волны, т. е. считать Ео и ф постоянными. В других случаях не- необходимо допустить, что Ео (t) и ф (t) остаются постоянными лишь в течение известного промежутка времени т, длительность которого определяется физическими процессами в источнике света. Понятие квазимонохроматической волны очень важно при иссле- исследовании интерференции и дифракции световых волн и поэтому будет подробно рассмотрено в гл. V и VI, посвященных описанию этих ос- основных явлений волновой оптики. § 1.4. ЭНЕРГИЯ, ПЕРЕНОСИМАЯ ЭЛЕКТРОМАГНИТНОЙ ВОЛНОЙ Рассмотрим вопрос об энергии, переносимой электромагнитной волной, распространяющейся в изотропной среде, в общем виде. Что же происходит с этой важнейшей характеристикой поля, распростра- распространяющегося в виде волны со скоростью и = с/п? Запишем выражение для мощности, рассеиваемой в объеме V, ко- которая равна работе сил электрического поля в единицу времени: Напомним, что отсюда 4я 4я а/ ' 4я 4я д/ 29
Преобразуем произведение Е rot H, используя известную формулу векторного анализа и учитывая, что rotE=—LiL: с dt Тогда ErotH=HrotE—div[E.H]= — -H — — div[EH]. EJ—-LH-f—-L *■§—£ divfEHj. 4я dt 4я dt 4я Это выражение проинтегрируем по произвольному объему и при- применим к нему теорему векторного анализа о потоке вектора через по- поверхность а, охватывающую исследуемый объем (теорема Гаусса). Окон- Окончательно получаем Первый член в правой части этого равенства характеризует ско- скорость изменения энергии электромагнитного поля (dWIdf) в исследуе- исследуемом объеме. По смыслу вывода и форме записи можно сделать заключе- заключение и о втором члене равенства: он определяет поток энергии через поверхность, охватывающую данный объем. Тогда смысл равенств- A.25) предельно прост — оно выражает закон сохранения энергии, который в данном случае можно сформулировать следующим образом: изменение энергии электромагнитного поля в каком-то объеме равно сумме работ сил этого поля и потока электромагнитной энергии через поверхность у охватывающую данный объем. Теперь можно поставить вопрос о том или ином ограничении объе- объема V. Если поверхность а охватывает полностью тот объем, где име- имеется электромагнитное поле, то поток энергии через нее равен нулю. В этом случае мы приходим к знакомому выражению закона сохране- сохранения: изменение электромагнитной энергии равно работе сил элек- электрического поля. Впрочем, такое утверждение нетривиально: если на- написать* j = а (Е + Естор), то получается выражение для работы сторонних сил и джоулева тепла и мы убедимся в том, что ток смеще- смещения не участвует в этом балансе. Таким образом, видно, что ток сме- смещения (переменное электрическое поле) обусловливает возникновение переменного магнитного поля, но не приводит к выделению тепла**. Однако эти вопросы в данный момент интересуют нас в меньшей степени, чем сформулированная выше проблема о распространении энергии электромагнитной волны. Поэтому ограничим размеры поля так, чтобы в исследуемой области левая часть равенства A.25) обра- * Здесь, конечно, а означает электропроводность, а не поверхность. ** См.: Тамм И. Е. Теория электричества. М., «Наука», 1965. 30
щалась в нуль. Это выполняется, в частности, в случае однородной не- непроводящей среды (j =0). Тогда A.26) Выражение A.26^) означает, что поток энергии через замкнутую по- поверхность а, охватывающую произвольный объем диэлектрика F, равен изменению электромагнитной энергии внутри этого объема. Аналогичное соотношение, справедливое для любого вида энергии, было получено Умовым. Специально для потока электромагнитной энер- энергии этот закон был впервые доказан Пойнтин- гом. При экспериментальных исследованиях обыч- обычно проверяется его интегральная форма, выра- выраженная равенством A.26). Однакь имеет смысл Вя перейти к дифференциальной форме и тем самым расположе„ие векто- получить право говорить о векторе плотности ров Е, н и S в бегу- потока энергии S = (с/4гс) [Е Н]. Он указывает щей электромагнитной направление распространения энергии в каждой волне точке пространства в данный момент времени. Он ортогонален векторам Е и Н и в изотропной среде совпадает с на- направлением распространения волны, т. е. с направлением луча. Сле- Следовательно, векторы Е, Н и S образуют «правый винт» (рис. 1.12). В свободной волне векторы Е и Н изменяются синфазно в простран- пространстве и во времени. Вектор S = (с/4п) [Е Н] изменяется от SMHH = 0 MaKC (I Таким образом, поток энергии колеблется с удвоенной частотой (по сравнению с Е или Н) вокруг среднего значения (фп)УгЕ, прини- принимая положительные значения (включая S = 0). Мы пришли к выводу, что плотность потока энергии пропорцио- пропорциональна квадрату амплитуды электрического поля. Это общее и очень важное соотношение, на котором фактически основывается возмож- возможность регистрации распространяющихся электромагнитных волн раз- различными приемниками. Практически все приемники света в той или иной степени инерционны. Поэтому они регистрируют среднее значе- значение квадрата амплитуды <LE\>. Применяя радиофизическую тер- терминологию, можно говорить, что приемники оптического излучения работают как квадратичные детекторы. Рассмотрим подробнее вопрос об измерении потока лучистой энер- энергии. Эта проблема усложнена тем, что при измерениях в видимой части ♦ Здесь и далее полагается \\. « 1, чго справедливо для большинства ди- • иектриков. 31
спектра часто пользуются кроме обычных энергетических величин светотехническими, учитывающими зрительное восприятие света*. Все светотехнические единицы базируются на использовании силы света стандартного источника с определенным распределением энер- энергии по спектру. Для изотропного источника световой поток Ф связан с силой света / равенством Ф = 4я/. Поток выражается в люменах (лм), а освещенность поверхности — в люксах A лк=1 лм/м2). В энер- энергетических единицах световой поток выражают в ваттах (Вт), а освещен- освещенность — в ваттах на квадратный метр (Вт/м2). Световому потоку 1 лм будет соответствовать разная мощность излучения в зависимости от его спектрального состава, и для установления между ними количе- количественной связи используют таблицы или графики, характеризующие среднюю чувствительность глаза к излучению той или иной длины волны (см. рис. 2). Приводимые в справочниках коэффициенты для перевода люменов в ватты относятся к узкой спектральной области вблизи X = 5550 А, где в среднем чувствительность человеческого глаза оказывается максимальной. Если измеряется световой поток d<X>, излучаемый площадкой dS во все стороны (в пределах телесного угла 2я), то величину R = dO/dS называют светимостью поверхности. Мы видим, что освещенность Е и светимость R определяют одинаковым выражением, но в первом случае измеряют поток, падающий на площадку, а во втором — излу- излучаемый ею. Важной характеристикой светящейся поверхности является так- также ее яркость. Для определения этого понятия запишем световой поток в пределах телесного угла dSl (рис. 1.13): dO = BdSndQ = nd Здесь dSn = cos idS — элемент поверхности, ориентированный пер- перпендикулярно проходящему излучению. Величину В называют яр- яркостью. Для многих светящихся тел можно считать, что яркость не зависит от угла шежду направлением потока и нормалью к поверх- поверхности. Для таких «косинусных излучателей» упрощается связь между светимостью и яркостью (R = пВ). Укажем также, что в литературе (особенно в спектроскопической) часто пользуются термином интенсивность, не имеющим четкого све- светотехнического определения. Важно подчеркнуть, что интенсивность излучения всегда пропорциональна яркости источника, хотя коли- количественное определение их связи часто оказывается совсем не простым. Укажем некоторые характерные особенности таких измерений. С помощью различных оптических устройств можно перераспре- перераспределить световой поток по некоторым избранным направлениям, но нельзя увеличить исходную яркость источника, определяющую пол- полный световой поток, испускаемый данной поверхностью. Более того, за счет поглощения, неизбежно происходящего во всех оптических си- ♦ Смл Фриш C. Э. Оптические методы измерений. Ч. I. Л., Изд-во ЛГУ. 1976. 32
, п результате такого перераспределения обязательно потеря- tri и ч.шь полного потока. 111> 11 измерениях следует иметь в виду, что некоторые приемники ршпмции (фотоэлектрические, термоэлектрические и др.) реагируют ii;i поток, тогда как большая группа других приемников (в первую очередь фотохимические) измеряет не поток, а создаваемую им осве- освещенность поверхности приемника. В частности, освещенность сетчат- сетчатки человеческого глаза определяет его реакцию на свет. Хотя световой поток и создаваемая им освещенность всегда взаимо- взаимосвязаны, зависимость между ними может оказаться достаточно слож- сложной и искаженной условиями эксперимента. Для пояснения этого Рис. 1.13. К вопросу о введении понятия яркости Рис. 1.14. Принципиальная схе- схема призмеиного монохроматора важного положения рассмотрим следующий простой опыт. Выделим какую-либо спектральную линию из линейчатого спектра при помощи призменного монохроматора со входной и выходной щелями (рис. 1.14). Оставляя одну из них (например, выходную щель) неизменной, будем постепенно раскрывать входную щель монохроматора. Если пренебречь явлением дифракции, играющим существенную роль лишь при очень узких щелях (см. гл. VI), то можно считать, что световой поток будет возрастать по линейному закону с раскрытием входной щели. Исполь- Используя фотоэлемент или фотоумножитель, установленный на выходе моно- монохроматора, легко проверить эту зависимость. Но если установить в фо- фокальной плоскости линзы L2 фотопластинку (т. е. превратить монохро- матор в спектрограф), то она уже будет регистрировать не световой поток, а освещенность в том месте, где получается изображение вход- входной щели. Освещенность этого участка останется неизменной, так как при раскрытии щели поток возрастает, но в том же отношении увели- увеличится и площадь изображения входной щели и, следовательно, отно- отношение Ф/сг останется прежним. Если тот же опыт проделать с исполь- использованием источника сплошного спектра, то получаются более сложные соотношения, которые сейчас не имеет смысла детально разбирать. Следовательно, измерение потока лучистой энергии всегда тре- требует тщательного анализа условий эксперимента. К сказанному нужно добавить, что большинство приемников радиации селективно, т. е. неодинаково реагирует на излучение различных длин волн. Это так- также надо учитывать при опытах, проводимых для сравнения потока лучистой энергии в разных участках спектра. Еще большие трудности возникают в том случае, когда измеряют абсолютное значение све- 2 Зак 172 9 33
тового потока или создаваемую им освещенность. Для этого необходимо проградуировать используемый приемник радиации, что часто оказы- оказывается совсем не просто. § 1.5. СКОРОСТЬ РАСПРОСТРАНЕНИЯ ЭЛЕКТРОМАГНИТНОЙ ВОЛНЫ Рассмотрим более подробно понятие скорости распространения электромагнитной волны и = с/]/*г\1, которая фигурирует в качестве параметра в выражении для плоской волны Е = Re Ео ехр [ш (* — г/и)], где и характеризует скорость распространения фазы волны и назы- называется фазовой скоростью. Значение и легко получить из условия по- постоянства фазы распространяющейся волны. Действительно, если для плоской волны о (t — zlu) = const, то, дифференцируя это выражение по t, находим и = dz/dt, т. е. скорость распространения волны вдоль оси Z. Запишем условие постоянства фазы, используя волновое чис- число k. Имеем (со£ — kz) = const. Тогда для фазовой скорости монохро- матической волны получаем ' dz со Очевидно, что все эти формулировки полностью согласуются с вве- введенным ранее основным соотношением и = %/Т. Если мы имеем дело только с монохроматическим излучением, то проблема полностью исчерпана и понятие фазовой скорости достаточ- достаточно для описания всех явлений, связанных с распространением элек- электромагнитных волн. Но на самом деле радиация распространяется в виде импульсов, представляющих собой совокупность различных монохроматических волн. При движении в реальных средах импульс деформируется и невозможно охарактеризовать происходящие при этом сложные процессы лишь одним значением и = о/&. Приходится вводить новые, более сложные понятия. Проанализируем эксперимен- экспериментальные данные. Если 8 = \i = 1, то и = с. Опыты по определению скорости света ведутся уже более 300 лет и характеризуются совершенно особыми масштабами. Здесь нет ничего удивительного. Знание числового зна- значения скорости света важно для всех разделов физики. Более того, она в значительной мере определяет метрику окружающего нас мира, а требование ее неизменности лежит в основе важнейших теорий есте- естествознания. Первая оценка скорости света в вакууме была проведена еще в конце XVII в. и базировалась на астрономических наблюдениях. Было замечено , что промежуток времени между затмениями ближай- ближайшего спутника Юпитера уменьшается при сближении его с Землей и увеличивается при их расхождении. Анализируя эти наблюдения, Ремер предположил, что свет распространяется с конечной скоростью, равной 3,1 • 1010 см/с. Эта смелая идея находилась в противоречии 34
с господствовавшими] тогда]|взглядами школы Декарта, согласкб которым свет должен распространяться мгновенно. В XIX в. усилия- усилиями Физо, Фуко и других физиков, развивавших волновую теорию све- света, были проведены тщательные измерения этой константы. При этом использовались различные лабораторные устройства. В частности, применялся метод вращающегося зеркала, который был вначале XX в. усовершенствован Майкельсоном, определившим скорость света с вы- высокой точностью. Мы не будем подробно рассматривать эти тонкие и остроумные исследования. Укажем лишь , что во всех таких опытах фактически измеряется время, необходимое для прохождения импуль- импульсом света вполне определенного пути. Таким образом, в результате эксперимента измеряется скорость светового импульса, точнее, ско- скорость некоторой его части. Например, можно вести измерения по переднему или заднему фронту сигнала, исследовать область макси- максимальной энергии импульса и т. д. Чем точнее определяется момент выхода и возвращения сигнала, тем меньшей можно сделать длину оптического пути при той же по- погрешности в измерении скорости. Поэтому применение различных оптических затворов (например, практически безынерционной ячей- ячейки Керра; см. гл. III) позволяет использовать для определения ско- скорости света установку, помещающуюся на лабораторном столе, тогда как ранее для таких опытов была необходима точно измеренная база в несколько километров. Можно считать, что в результате всех подобных экспериментов скорость электромагнитных волн в вакууме известна с весьма большой точностью. Оценка среднего значения этой важнейшей константы, по данным различных авторов, проводилась неоднократно. В 1941 г. был проведен тщательный анализ всех экспериментов и получено зна- значение с = B99 776 ± 4) км/с. В середине XIX в. были также накоплены сведения об электро- электродинамической постоянной, фигурирующей при переходе от электриче- электрических к магнитным единицам. Она имеет размерность скорости и по значению очень близка к скорости света в вакууме. Наилучшие изме- измерения, проведенные электромагнитными методами, приводили к зна- значению B99 770 ± 30) • 105 см/с. Имеются данные, что столь хорошее совпадение этих констант, казавшееся в те времена случайным, сти- стимулировало исследования Максвелла по созданию единой теории рас- распространения электромагнитных волн. После появления этой фунда- фундаментальной теории уже не могло быть сомнений в том, что скорость света в вакууме и электродинамическая постоянная — это одна и та же константа, а совпадение результатов измерений ее значения, выпол- выполненных различными методами, является доказательством универсаль- универсальности теории Максвелла, справедливой для любых электромагнитных волн. Ниже будет охарактеризован современный способ прецизион- прецизионного определения скорости света в вакууме. В XIX в. появилась возможность точного измерения скорости све- света а в каком-либо веществе (газообразном или жидком). Из таких из- измерений можно определить с/и = п и сравнить его с табличным зна- значением показателя преломления для данного вещества, получае- 2* . 35
мого из измерений, основанных на использовании закона преломле- преломления, которые можно провести с большой точностью. Обычно значения п = sin ф/sin ф2 хорошо согласуются со значениями, найденными из измерений скорости света, но в некоторых случаях возникают расхож- расхождения. Так, например, для показателя преломления сероуглерода вместо п =1,64 было получено значение 1,76, что выходит за пределы допустимой погрешности измерений. Это является следствием значи- значительных трудностей, неизбежно возникающих при описании движения импульса в среде, в которой показатель преломления зависит от ча- частоты, т. е. в диспергирующей среде. В таком случае кроме фазовой скорости нужно ввести еще групповую ско- Рость> характеризующую скорость распро- странения всей группы волн, к рассмотре- нию КОТОР°Й мы переходим. Не будем сейчас обсуждать причины, приводящие к зависимости п от о (диспер- (дисперсии). В рамках классической электромаг- электромагнитной теории объяснить дисперсию невоз- невозможно. Лишь объединение электромагнит- электромагнитной теории света с электронной теорией Рис. 1.15. Последовательные (что было впервые выполнено Лоренцем на «моментальные "ш™"'» рубеже XIX и XX вв) приводит к полному вРко?о1)ойВфазовая скорость количественному истолкованию всех свя- и больше групповой скоро- занных с этим явлением вопросов. сти U Следует учитывать, что немонохрома- немонохроматичность световых воли в первую очередь обусловлена реальными условиями возбуждения в источниках све- света,, Качественное рассмотрение этих сложных проблем проведено в гл. V. На данном этапе будем исходить из эксперимента, пока- показывающего, что вдоль оси Z (по-прежнему рассматривается одно- одномерная задача) распространяется не одна монохроматическая волна, а совокупность таких наложенных друг на друга волн с разными зна-, чениями щ которую мы будем называть импульсом (волновым пакетом). Уравнение для подобной группы волн можно записать в виде волны, модулированной по амплитуде. Так, например, легко доказать, что модулированное колебание с амплитудой Ео (t) = Ео A + т cos Ш) при Q <^ со и т < 1 можно заменить суммой трех монохроматических колебаний вида Ео cos со£, -=■ rn Ео cos (со + Q) t, у тЕ0 cos (со — Й) t. Тождественность такой записи проверяется простыми тригонометри- тригонометрическими преобразованиями. На опыте удобно регистрировать максимум амплитуды; поэтому обычно под групповой скоростью понимают скорость перемещения максимума энергии в исследуемой группе волн. Эта скорость U мо- может отличаться от скорости распространения горбов или впадин (рис. 1.15), которые будут перемещаться с фазовой скоростью и. Для определенности на рис. 1.15 выбрано соотношение и > U. В дан- данном случае сзади импульса как бы пристраиваются новые горбы и впа- впадины, что и приводит к разнице между значениями фазовой и группо- 36
ной скорости. Совершенно очевидно, что получение любой физической информации связано с передачей сигнала и, следовательно, лишь для Фупповой скорости существенны те ограничения, которые наклады- накладываются теорией относительности (скорость любого сигнала не может быть больше скорости света в вакууме; см. гл. VII). Установим связь между групповой и фазовой скоростями. Для этого прежде всего получим выражение для групповой скорости. Эту задачу полезно рассмотреть в общем случае. Для импульса, состоящего из бесконечно большого числа монохроматических плос- плоских волн, непрерывно заполняющих интервал частот соо ± Асо0 (где Ло)о<^ соо), имеем Ek = Ео (k) exp [i (tot — kz)]. Считая, что зна- значению Дсоо соответствует некая добавка Ak к волновому числу k0 (т. е. ш0 — Д^о соответствует k0 — Д&), находим выражение для ре- результирующей напряженности электрического поля путем интегри- интегрирования по переменной k в пределах от k0 — Д& до k0 + Д&: Ео (k) exp {i [со (k) t—kz)} dk. Выражение для фазы колебания -легко преобразовать к виду СО (k) t — kZ = (O0t — kQZ + [(CD — C00) t — (k — k0) Z]. Тогда для результирующей напряженности электромагнитного поля получаем Е (z9t) = С (г,0 exp [i (a>ot — koz)l A.27) Это уравнение плоской волны с частотой соо и волновым числом k0, амплитуда которой С (г, t) будет медленно изменяться (в простран- пространстве и во времени), так как т-<^! 1 и — <^ 1. Следовательно, «о Щ С (zy f) является модулированной амплитудой этой группы волн (оги- (огибающей волнового пакета). Скорость распространения огибающей мы и будем называть групповой скоростью U. Согласно A.27) амплитуда С (г, t) задается выражением С (г,*)= j Ео (k) exp {I [(со —соо) t—(k—k0) z)} elk. A.27a) ku*-Ak Мы видим, что амплитуда С (г, /) представляет собой суперпози- суперпозицию монохроматических составляющих с волновыми векторами Afe = ■= k — k0 и частотами Аса = со — ш0. Подчеркнем, что выражение A.27а) описывает огибающую группы волн, закон движения которой мы хотим получить. Электромагнитные волны, образующие группу, описываемую выражением A.27), и движущиеся со скоростью a=co/]fe, имеют более высокую частоту (шо^>Дсо), чем монохроматические со- составляющие С (z, t). 37
Тлк кпк нас интересует ход функции со (k) в узком интервале вбли- ш А'о> к) можно разложить (со — соо) в ряд: »-»о=га.. <*-*•> + f f-^г).. (^-^ Ограничиваясь в этом разложении первым членом ряда, получим из A.27а) следующее выражение: o + C(z,t)= J fio(*)exp{/(ft-fto)[(^-^/-2r]}rfA. ' A.276) &o— Ak В этом приближении результирующая амплитуда С (г, I) представ- представляет собой суперпозицию упомянутых выше низкочастотных монохро- монохроматических составляющих, распространяющихся с одинаковой ско- скоростью. Зависимость от координат и времени у всех составляющих одинакова, и волновой пакет движется как целое (не деформируясь) с групповой скоростью U = (—) . Такой же результат можно \dkjk = k0 получить, исходя из суперпозиции двух близких по частоте волн, ког- когда возникают биения. Сложный вопрос о законности проведенного выше рассмотрения, связанного с введением понятия групповой скорости, с исчерпываю- исчерпывающей полнотой изложен в лекциях академика Мандельштама*. В среде с дисперсией [п = п (к)] возмущение по мере распространения неиз- неизбежно деформируется. Если эта деформация осуществляется медлен- медленно, то полученные закономерности приближенно выполняются. Более точная формулировка условий существования недеформируемой груп- группы волн предполагает наличие узкого спектра (Afe <^ k0) синусоидаль- синусоидальных волн, образующих группу, и определенных свойств среды, в ко- которой происходит ее распространение [отсутствие резких изменений п (X) вблизи Яо]. При нарушении этих условий импульс быстро дефор- деформируется («расползается») и описание движения его как целого ста- становится неточным. Итак, групповая скорость U = —, тогда как фазовая скорость и = со/&. Для нахождения связи между ними запишем dk dk dk dk Это выражение легко преобразовать, учитывая, что тогда окончательно получается выражение, называемое формулой Рэлея: и=и—%$1. A.28) дХ * См.: Мандельштам Л. И. Лекции по оптике, теории относилель- ности и квантовой механике. М., «Наука», 1972. 38
Проведем подробный анализ найденного соотношения между фа- фановой и групповойХ|скоростями. 1. Если *£ = 0, т. е. п = const, то дисперсия отсутствует и U = и; иными словами, фазовая и групповая скорости совпадают. Это спра- справедливо не только для вакуума, но и для некоторых материальных сред. В частности, для световых волн в воздухе и воде можно не учи- учитывать дисперсии, так как она пренебрежимо мала. 2. Если ^> 0, то U <. и. Этот случай, как правило, реализует- реализуется при прохождении света через различные стекла и другие про- прозрачные среды. Заметим, что если ^ > 0, то ^ <. О, так как ^ = = —  * я? • Следовательно, показатель преломления п уменьшает- уменьшается с увеличением длины волны. Эту часто встречающуюся зависимость п от X называют нормальной дисперсией. 3. Если g^<0, то U> и. В этом случае ~£ > 0, т. е. показа- показатель преломления возрастает с увеличением длины волны. В даль- дальнейшем будет показано, что такая зависимость п от X может иметь место в тех областях спектра, где наблюдается интенсивное поглоще- поглощение света. Она называется аномальной дисперсией. Теперь становится понятно то расхождение экспериментальных данных, которое наблюдалось при прохождении света через серо- сероуглерод. В этом веществе дисперсия резко выражена и U Ф и, при- причем U < и (нормальная дисперсия). Поэтому в результате измерения на опыте U и вычисления c/U получается значение 1,76, отличное от п =с/и = 1,64. В наших рассуждениях мы исходим из того, что на опыте обычно измеряется групповая скорость U. Это действительно так; как уже указывалось, практически все приемники света реагируют на усред- усредненное значение квадрата напряженности электрического поля <£а>. Более того, детальный анализ любого эксперимента по определению скорости электромагнитных волн показывает, что в опыте тем или иным способом образуется импульс света, который затем регистри- регистрируется. Наиболее ясно это выявляется при изучении различных спо- способов, основанных на прерывании света (метод Физо, Майкельсона и т. д.). Следует также указать, что все радиолокационные установки в диапазоне УКВ работают на 'принципе «эхо», регистрируя отражен- отраженный сигнал ]и измеряя т = 2R/U, где R — расстояние до исследуе- исследуемого объекта. Так как в воздухе U = и = с, то R = cx/2. Многократ- Многократная проверка правильности показаний локаторов и свидетельствует о том, что в этом случае U =с. Фазовую скорость обычно находят из соотношения и = clny где 'п 'предварительно определяют тем или иным способом (см. § 2.4, Г..6). ' 39
В результате прогресса лазерной техники и успешного развития радиотехнических методов преобразования частоты в оптическом диапазоне удалось существенно повысить точность измерения скоро- скорости света в вакууме. При этом проводились независимые измерения длины волн и частоты (и = %v) специально стабилизированного неон- гелиевого лазера, генерирующего в инфракрасной области спектра (Я = 3,39 мкм). Таким способом в 1972 г. скорость света была опре- определена с большой точностью (bclc ж 3 • 10~9). Авторы получили с = B99792,4562 ± 0,0011) км/с и считают, что в дальнейшем ошибка может быть еще уменьшена за счет улучшения воспроизводимости измерения первичных эталонов длины и времени (см. § 5.9). Заслуживает особого упоминания случай и > с (фазовая скорость больше скорости света в вакууме), который не противоречит теории относительности, ограничивающей лишь скорость сигнала (групповую скорость). С фазовой скоростью и распространяется в среде немоду- лированная волна. Для передачи какой-то информации нужно промо- дулировать волну, причем экспериментальное значение скорости сиг- сигнала не может превосходить скорости света в вакууме. В дальнейшем будут рассмотрены случаи, когда п<С 1, т. е. и>с (например, для радиоволн в ионосфере, при исследовании рентгеновских лучей и др.). Введенных выше понятий фазовой и групповой скорости (и = = со/&, U = dto/dk) обычно оказывается достаточно для описания процесса распространения сигнала в той или иной среде. Но в не- некоторых случаях (например, когда волновой пакет сильно деформи- деформируется) описание в таких терминах становится затруднительным и приходится вводить понятие сигнальной скорости. Проведем лишь качественный анализ этой проблемы. Подробное математически стро- строгое изложение содержится в книге А. Зоммерфельда*, который впервые ввел это понятие в своих оригинальных работах, относящих- относящихся к 1910—1915 гг. Выше уже указывалось, что если ^> 0 (имеет место аномальная дисперсия), то групповая скорость оказывается больше фазовой, т. е. A.28а) Если при этом показатель преломления сильно изменяется с ча- частотой (дп/дХ достаточно велико), то может оказаться, что групповая скорость U, формально вычисленная по формуле A.28а), будет больше скорости света в вакууме, что противоречит основам специальной тео- теории относительности. В гл. IV, посвященной электронной теории дис- дисперсии, будут более подробно исследованы условия эксперимента, при которых может возникнуть описываемая ситуация. Очевидно, что принятое описание находится в противоречии с физической реаль- реальностью. В частности, может происходить уже упоминавшееся «рас- «расползание» импульса, формула A.28), полученная для малых изме- изменений волнового числа, становится неточной и понятие групповой ♦См.: Зоммерфельд А. Оптика. М.. ИЛ, 1953. 40
скорости теряет смысл. Но и в таких условиях скорость передачи сигнала не превышает скорости света в вакууме. Для иллюстрации эгого фундаментального положения приведем следующую схему яв- явления. Пусть среду, в которой распространяется исследуемый волновой пакет (импульс), составляют элементарные осцилляторы (атомы), произвольно распределенные в вакууме. Когда передний край импуль- импульса (распространяющийся со скоростью с) дойдет до какого-либо атома среды, он раскачает его осциллирующий электрон и последний нач- начнет излучать. Но этот процесс неизбежно должен характеризоваться какой-то инерционностью. Возникшее излучение, которое также дви- движется со скоростью с (атомы находятся в пустоте), внесет свой вклад в структуру волнового пакета, но не может повлиять на скорость распространения его переднего края (фронта волны) — она по-преж- по-прежнему будет равна скорости света в вакууме вне зависимости от того, что происходит с импульсом. В заключение определим, в какой степени соответствует экспе- эксперименту принятое выше значение показателя преломления п = j/ejx. При этой проверке формулы Максвелла мы пренебрегаем отклоне- отклонениями \i от единицы, которые совсем невелики для всех прозрачных тел. Не учитывается также дисперсия, и все приводимые ниже ре- результаты относятся к средней части видимого спектра. Опыт показывает, что для благородных газов, а также для Н2, N2, О2, СО2, СО и воздуха наблюдается отличное согласие между измеренными на опыте значениями показателя преломления п и вы- вычисленными по формуле п =i/e (табл. 1.1). Таблица 1.1 Вещество г*изм Воздух Водород (Н2) Окись углерода (СО) . . Двуокись углерода (СО2) 1,000294 1,000138 1,000340 1,000449 1,000296 1,000132 1,000345 1,000473 Хорошее согласие яИзм с пвыч = Ye наблюдается для некоторых жидкостей, характеризующихся симметрией в распределении внутри- внутримолекулярных зарядов. Так, например, бензол имеет показатель пре- преломления п = 1,482, тогда как У~е = 1,489. Но вместе с тем для широкого класса веществ (даже не обладаю- обладающих заметной дисперсией) наблюдаются значительные расхождения указанных данных (табл. 1.2). Расхождение данных в табл. 1.2 настолько велико, что здесь оче- очевидно наличие серьезных физических причин. В связи с этим сле- следует указать, что показатель преломления п =Vty* введен пока чисто формально и физический смысл явлений, связанных с изме- 41
Таблица 1.2 Вещество Метиловый спирт (СНзОН) Этиловый спирт (С2НбОН) Вода (Н2О) 1,34 1,36 1,33 5,7 5,0 9 нением скорости света в реальных телах, останется неясным, пока электромагнитная теория не будет дополнена представлениями о ко- колебаниях заряженных частиц. В частности, при рассмотрении данных табл. 1.2 сразу же броса- бросается в глаза, что все упомянутые в ней вещества характеризуются значительными дипольными моментами. Вспомним основы теории поляризуемости различных веществ*. Как известно, различают элек- электронную, ионную и ориентационную поляризуемости, связывая пер- первую с колебаниями электронов, вторую — с ионными колебаниями, а третью — с выстраиванием дипольных моментов вдоль поля. Оче- Очевидно, что в столь высокочастотных полях (v « 1014 Гц) показатель преломления п будет определяться лишь малоинерционными элек- электронными колебаниями, тогда как приводимые в таблицах значения е обычно получаются при измерениях на малых частотах, когда иг- играют роль все три механизма. Немудрено, что в этом случае |/е много больше показателя преломления для видимой части спектра. В гл. IV будет рассмотрена роль ионных колебаний, имеющих су- существенное значение при определении показателя преломления мно- многих веществ, дающих полосы поглощения в инфракрасной области спектра. § 1.6. СТОЯЧИЕ ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ Вопросы интерференции электромагнитных волн мы здесь пока не обсуждаем, но все же имеет смысл исследовать один очень важный частный случай суперпозиции двух плоских волн, имеющий простые аналогии в механике. Речь идет о стоячих электромагнитных волнах. Как уже упоминалось ранее, в математической физике доказывает- ся, что волновое уравнение типа ^~ = и2 ^ имеет решение в виде суперпозиции функций f (t — zlu) и f (t + zlu)> соответствующих двум плоским волнам одной частоты, распространяющимся навстре- навстречу друг другу. Две взаимодействующие волны могут возникать различными спо- способами. Наиболее простой и часто встречающийся случай — это от- отражение при нормальном падении электромагнитной волны от пло- плоской поверхности идеального проводника (см. § 2.5) или диэлектрика с большим показателем преломления**. * См.: Киттель Ч. Введение в физику твердого тела. М., Физматгиз, 1962. ♦♦ При исследовании возникновения стоячих волн предполагается, что от- отражение полное, т. е. | £"о отр I = I Eq пад!» чг0 значительно упрощает выкладки. 42
Впрочем, полученные ниже результаты не связаны с механизмом возникновения двух плоских монохроматических электромагнитных волн одинаковой амплитуды, движущихся навстречу друг другу со скоростью и. Фактически нужно воспользоваться лишь двумя об- общими свойствами электромагнитных волн, а именно: а) справедли- справедливостью при всех условиях соотношения Н = YsE и б) справедли- справедливостью для обеих волн (условно назовем их падающей и отраженной) правила правого винта. Последнее условие необходимо расшифровать. Если выбрать опре- определенный вектор Епад и перпендикулярный ему вектор (рис. 1.16), то направление и модуль вектора = 4^[ЕпадНпад1 будут уже де- терминированными. В волне, """"Г ^ распространяющейся навстречу * — исходной, направление S0TP про- противоположно SnaA, а векторы Еотр и Нотр должны составлять с S0TP правый винт. Направле- рпс {Ж Векторы Е н и s B падающей, ние вектора Сотр произвольно отраженной и преломленной волнах при ДО тех пор, пока не сформули- прохождении света из оптически менее рованы граничные условия за- плотной в оптически более плотную сре- дачи, но оно определяет направ- ДУ (ла>л0 ление Нотр. Направление Еотр выбрано так, как на рис. 1.16, т.е. Епад и Еотр находятся в противофазе. В дальнейшем будет показано (см. гл. II), что это всегда имеет место при отражении волны от оптически более плотной среды (п2 > пг). Итак, будем считать, что Епад и Еотр находятся в противофазе на границе раздела; тогда Нпад и Нотр должны быть синфазными. В этом случае eikz— 21 — 2EQS\n(utsmkz, eikz+ e-i Ш 2 = 2 V"sE0 cos со/ cos kz. A.29) Исследуем полученную суммарную волну A.29). Это линейно по- поляризованная стоячая волна; на границе раздела находятся узел Е и пучность Н (только эта особенность связана с конкретизацией за- задачи — выбором п2 > пх). Временная зависимость полей для различ- различных точек пространства (z = const) представлена на рис. 1.17, а. Подставляя определенные значения t (например, t = О, Т/8 и 774) п выражения A.29), можно получить Е и Н в различных точках про- пространства («моментальные фотографии»; рис. 1.17,6). 43
Таким образом, мы убеждаемся, что для стоячей электромагнит- электромагнитной волны во времени имеется сдвиг фаз А<р = я/2 между векторами Е и Н, которые в свободной волне были синфазными. Узлы (и соответственно пучности) векторов Е и Н разнесены про- пространственно и расстояние между ними (между узлом Е и узлом Н) равно Я/4. В любом узле S = ~ [EHJ = 0. Отсюда следует, что энер- энергия лишь колеблется между двумя соседними узлами, и в этом смысле каждый такой участок автономен. Znonst Рис. 1.17. Временная (а) и пространственная (б) зави- зависимости Е и Н в стоячей электромагнитной волне В промежутке между своими узлами каждый из векторов (Е и Н) изменяется во времени так, что между его колебаниями в любых двух точках нет разности фаз. При этом для всех точек между двумя узла- узлами одновременно достигается Емакс, но колебания имеют разные ам- амплитуды. В узлах напряженности электрического поля имеют зна- значение Е = 0. Так же, но со сдвигом по фазе я/2, колеблется вектор Н. Если приемник радиации реагирует (как это обычно бывает) на <£>, то можно измерить расстояние между двумя узлами или двумя пучностями Е и тем самым определить длину волны. Такой метод, впервые примененный в классических экспериментах Герца с деци- дециметровыми волнами, нетрудно проиллюстрировать, используя технику УКВ (X « 3 см), что облегчается высокой степенью монохроматич- монохроматичности излучения клистрона. В этом опыте электромагнитная волна падает под прямым углом на поверхность какого-либо вещества, хоро- хорошо отражающего УКВ, например на лист металла, перемещаемый вдоль линии распространения волны (рис. 1.18). Приемник УКВ будет регистрировать пучности вектора Е, расстояние между которы- которыми составит примерно 1,5 см, что хорошо видно большой аудитории. 44
Проведение аналогичных опытов со световыми волнами осложнено малой длиной волны (X « 5000 А). Это затруднение было остроумно преодолено в опытах Винера, проведенных им в начале XX в. При исследовании отражения плоской световой волны от поверхности ртутного зеркала фотографическую эмульсию наносили на тонкую коллоидную пленку, которую располагали под очень малым углом ф к отражающей поверхности. Схема эксперимента (в искаженном мас- масштабе) представлена на рис. 1.19, а. На пленке после ее проявления должна получиться серия черных параллельных полос, соответствую- соответствующих максимальному воздействию световой волны. Таким способом Рис. 1.18. Установка для определения длины волны в УКВ-диапа- зоне можно выявить пучности стоячей световой волны, а использование малых углов ф позволяет получить хорошее разрешение этих полос. Действительно, АВ = ВС = CD = УB sin q>). Для <р « 1' дли- длина АВ оказывается равной 1 мм, что можно заметить на копии ориги- оригинальной фотографии, полученной таким методом (рис. 1.19,6). Анализ проведенных опытов позволяет ответить на вопрос, имею- имеющий прямое отношение к взаимодействию излучения и вещества. В стоя- стоячей электромагнитной волне пучности векторов Е и Н пространствен- пространственно разделены, и, следовательно, в принципе можно установить, какой из них ответствен за фотохимическое действие. В этих опытах свет отражался от металлической поверхности, которая, как уже указы- указывалось, эквивалентна в смысле отражения диэлектрику с очень боль- большим показателем преломления. Поэтому на границе раздела проис- происходит изменение фдзы вектора Е на я, т. е. должны образоваться узел Е и пучность Н. Первичная пучность Е должна возникнуть на рас- расстоянии V4 от границы раздела. Опыты Винера однозначно показали, что первая полоса, соответствующая максимальному фотохимическо- фотохимическому воздействию, находится на расстоянии Я/4 от границы раздела. Следовательно, именно вектор Е ответствен за фотохимическое дей- действие, приводящее после проявления к почернению фотопластинки в этом месте. Позднее другими учеными были поставлены опыты, в ко- 45
торых было доказано, что флуоресценция и фотоэлектрический эффект также обусловлены вектором электрического поля Е. Таким образом, если ранее Е и Н рассматривали как «равноправ- «равноправные» компоненты электромагнитной волны, то при исследовании воз- воздействия электромагнитной волны на вещество можно установить различие между ними. Это, впрочем, понятно, так как физический процесс подобного* рода сводится к воздействию поля на эле- элементарные заряды (в первую очередь свободные и связанные электроны). Такое воздействие количественно описы- ^ вается формулой Лоренца f =еЕ+— [vH]. \ \ \ ср V - а) - . Ш,; *.«-, -"-- Рис. 1.19. Схема опыта Винера (а) и фотография, получен- полученная таким образом (б): АЕ — фотопластинка, AF — зеркало Обычно 1/«си второй член в формуле мал. Поэтому вектор Е и от- отвечает за движение электрических зарядов под действием электромаг- электромагнитного поля. Тем самым подводится база под довольно неопреде- неопределенное понятие «светового вектора», которым часто пользуются при описании оптических явлений. Можно считать вектор Е таким «све- «световым вектором», ясно отдавая себе отчет в том, что в старой волно- волновой теории смысл этого понятия был совсем иным. § 1.7. ИЗЛУЧЕНИЕ ЭЛЕМЕНТАРНОГО ВИБРАТОРА СФЕРИЧЕСКИЕ ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В дальнейшем нам придется подробно исследовать взаимодействие излучения с веществом — это будет необходимо для понимания дис- дисперсии света и других фундаментальных оптических явлений. Поэто- Поэтому представляется разумным закончить эту вводную главу выясне- выяснением вопроса о том, как излучает электрон, движущийся под дейст- действием периодической возмущающей силы, т. е. совершающий колеба- колебания с частотой со. Приведем простой вывод уравнений поля для этого случая и уделим внимание описанию свойств волны, излучаемой уско- ускоренным электроном. Рассмотрим диполь, электрический момент которого меняется по закону р = ро cos cot. Напомним, что в электростатике вычислялось 46
йоле системы двух электрических зарядов разного знака, закреплей- ных на расстоянии / один от другого. Электростатическое поле такой системы спадало при удалении от ее центра по закону 1/г3. Решим теперь динамическую задачу и вычислим электромагнитное поле системы движущихся зарядов. Следует иметь в виду, что изменение р = q\ может происходить как в случае изменения q по закону q = q0 cos cot при / = const, так и при постоянном q и изменяющемся расстоянии I = /0 cos со/. Пер- Первый случай обычно интересует радиотехников (излучение антенны и др.), а второй лежит в основе многих физических теорий (например, модель атома Томсона и др.). Будем исходить из закона / = /0 cos со/ в приближении /<С^, что окажется доста- достаточным для получения основных зависимо- зависимостей. Все вычисления проводятся для вакуу- вакуума (е = \i = 1, и = с), и длина волны % про- просто связана с частотой со соотношением X = = 2я (clш). Исследование проведем для достаточно больших расстояний г^>К/2п [вектор г исхо- исходит из центра осциллятора в точку О' (х, у, г), где наблюдается поле; рис. 1.20]. Эта область значений г названа волновой зоной — быстро спадающее статическое поле мало при доста- достаточно больших^ значениях г. В электродина- электродинамике доказывается, что поле нейтральной си- системы движущихся зарядов (с отличным от нуля дипольным момен- моментом) в волновой зоне совпадает с полем осциллятора, электрический момент которого равен суммарному моменту системы. Это позволяет свести к данной модели множество различных задач, например заме- заменить светящееся тело суммой элементарных вибраторов, и затем^ рас- рассмотреть действие некоторого вибратора с эквивалентным суммарным моментом (см. § 5.2). В вакууме (и = с) для волновой зоны можно получить следующее решение уравнений Максвелла, где единичный вектор тх = г/г: Рнс. 1.20. К понятию вол- новой зоны осциллирую- осциллирующего диполя н(/)= [tip (t-r/c)], E @ = [H (t) rj. A.30) Следует отметить, что значения Е и Н в момент времени t в точке О' (#, у, z) определяются значением р в более ранний момент времени t — г/с. Время г/с необходимо для того, чтобы излучение диполя дошло от точки О до О'. Близкодействие, на котором основывается электро- электромагнитная теория Максвелла, здесь очевидно. Вывод выражений A.30) из уравнений Максвелла проводится в курсах электродинамики. Учитывая большое значение этих выраже- выражений для понимания процесса возникновения бегущей электромагнит- электромагнитной волны, приведем их элементарный вывод, основанный на простой модели явления. 47
Рассмотрим сначала электрическое поле, создаваемое точечным зарядом </, совершающим следующее движение: до момента времени t = О заряд покоится в начале ииерциальной системы координат; начиная с t = 0 он приходит в движение в направлении оси Z с по- постоянным ускорением а; по истечении короткого промежутка времени At ускорение прекращается и заряд движется с постоянной скоростью v = aAt, которую он приобрел к концу периода ускорения. Представим себе картину силовых линий электрического поля, создаваемого зарядом при таком движении, в момент времени t^>At До точек, находящихся за пределами сферы радиуса г = ct, информа- Рис. 1.21. Излом силовых линий электрического поля ускоренно движущегося точечного заряда Рис. 1.22. К подсчету отно- отношения поперечной и про- • дольной компонент поля в области излома силовых линий ция об изменении состояния заряда q, происшедшем при t = 0, к мо- моменту времени t еще не дошла, поэтому поле здесь совпадает с полем точечного заряда q, покоящегося в начале координат: Внутри сферы радиуса г = с (t — At) возникает поле равномерно движущегося вдоль оси Z заряда. Так как его скорость v <^ с, то это поле в момент времени t совпадает с полем точечного заряда q, находящегося в точке г = vt [смещением заряда за время ускорения At можно пренебречь, если мы интересуемся полем в момент времени t >> At]. Учитывая непрерывность силовых линий, можно поле изо- изобразить так, как показано на рис. 1.21. Изломы на силовых линиях между сферами г =с (t — АО и г = ct характеризуют поле излучения, распространяющееся со скоростью с от источника. Рассмотрим одну из силовых линий этого поля, проходящую через точку наблюдения О' на расстоянии г от начала координат (рис. 1.22). Направление на О' составляет угол 9 с осью Z. Из рис. 1.22 легко найти отношение поперечной и продольной компонент поля в изломе: 48
Так как Ег = q/r2, то для поперечной компоненты Ее получаем _£_ *'si"9 A.32) Исключая t с помощью г =ct и учитывая, что и/Д£ = а @) — ускорение заряда при t = 0, получаем A.33) Заметим, что в точке наблюдения, находящейся на расстоянии г от источника, поле излучения в некоторый момент времени t—оказалось зависимым от ускорения заряда в предшествующий момент времени t' = t — rlc. Обобщая полученный результат на случай произволь- произвольного нерялитивистского движения заряда q в малой окрестности начала координат с ускорением a (t), можно для поля излучения в мо- момент времени t в точке наблюдения на расстоянии г написать следую- следующее выражение: ^r/psine^ рр-г/рчие ^ ГС2 Г& Из выражения A.34) следует, что каждый движущийся с ускоре- ускорением заряд излучает электромагнитную волну, а напряженность поля излучения спадает обратно пропорционально первой степени расстоя- расстояния от источника. На большом расстоянии от источника (в волновой' зоне) поле излучения можно рассматривать как плоскую волну, что позволяет сразу найти и магнитное поле излучаемой электромагнит- электромагнитной волны, у которой \Е (t)\ = |Я@|, а направление Е и Н опреде- определяется правилом правого винта. В сферических координатах (см. рис. 1.20) векторы Е и Н определяют следующими выражениями: Е@, Ее.О) £г=£ф=0; £9= ^(*~"r , ГС* Н@,0,#ф) #г=#е=0; #ф=£е, A.35) Формулы A.35) для электромагнитной волны, излучаемой точеч- точечным зарядом, могут быть записаны в векторном виде, полностью со- соответствующем выражениям A.30). Исследуем электромагнитную волну, характеризующуюся век- векторами Е (/) и Н (t) и распространяющуюся из центра диполя. Преж- Прежде всего заметим, что р и р антипараллельны. В самом деле, р (t — г/с) =* — со2ро cos (cot — kr)=s— ©2р (t — rlc). A.36) Тогда для произвольной точки на сфере радиусом г (см. рис. 1.20) можно определить относительное направление векторов Е, Н и еди- единичного вектора тг. Вектор Е направлен по касательной к окружности радиусом г, а вектор Н перпендикулярен плоскости чертежа. Найдем напряженности электрического и магнитного полей. Вводя угол <J> (рис. 1.22), дополнительный к углу 9, имеем sin 9 =costj). 49
На основании A.35) | E(Q|—| H(/)l cos ф cos H—kr). A.37) Очевидно, что cos Ф — амплитуда сферической электро- электромагнитной волны, исходящей из центра осциллятора. Проанализируем полученные соотношения. 1. Величина Е (t) [или Я (/)] существенно зависит от угла ф. Максимальное излучение наблюдается в экваториальной плоскости, где а|> = 0. Вместе с тем cos ф =0 при г|> = я/2 и амплитуда волны обращается в нуль. Мы приходим к очень важному выводу — осциллирующий диполь не излучает в направлении своей оси. Про- Пространственное распределение интенсивно- интенсивности излучения осциллятора можно графи- графически изобразить в виде своеобразной диа- диаграммы, приведенной на рис. 1.23. 2. Если i|) = const (т. е. при некотором вполне определенном направлении векто- вектора гх), то наблюдается уже упоминавшаяся зависимость напряженности электромаг- нитного поля от расстояния г, которое прошла волна: Е (/) = Н (t) ~ 1/г. Это очень важная особенность сферической волны, существенно отличающейся от плоской, для которой в лю- любой точке пространства Ео = Но = const. Правда, для достаточно большого г и при изменении его в небольших пределах можно при- приближенно считать сферическую волну эквивалентной плоской волне с соответствующей амплитудой. Вместе с тем наблюдается резкое от- отличие поля исследуемой волны от статического поля диполя С^стат ~ 1/г*)> Спадание амплитуды сферической волны происходит по закону 1/г, т. е. значительно медленнее, и в волновой зоне (г^> >>У2я) можно не учитывать £стат. 3. Рассчитаем поток энергии, излучаемый осциллирующим элек- электроном. Прежде всего убеждаемся, что вектор S = ^ [ЕН] всегда на- направлен вдоль г1э т. е. энергия распространяется от диполя. По мо- модулю SA W-ftr). A-38) Рис. 1.23. Пространственное распределение поля излуче- ния осциллирующего диполя Усредняя это выражение во времени, получим (ь39> Но найденное значение <S> равно средней плотности потока электромагнитной энергии в определенном направлении, характери- характеризуемом углом яр. Для того чтобы получить полную мощность излучаю- 50
щего диполя Т^изл, нужно просуммировать эти средние значения по всем направлениям. Используя полярные координаты и заменяя элемент площади кольца на сфере радиусом г выражением 2пг * г cos ij? • dij? = = 2яг2 cos il^hj), найдем Я/2 W 4c8 J A.40) -Я/2 Полученный результат очень важен и играет существенную роль в разнообразных технических приложениях. Из этого выражения (И^изл ~ ю4 ~ 1Д4) следует, что в радиотелеграфии необходимо ис- использовать высокие частоты, тогда как сильные токи нужно переда- передавать на низкой частоте, чтобы из- излучение проводов было наимень- наименьшим. Соотношение A.40) имеет большое значение в теории рассея- рассеяния электромагнитных волн — ко- короткие волны рассеиваются силь- сильнее, чем длинные (см. § 6.8). Сконцентрируем свое внимание лишь на одной оценке — ее легко провести, и она поможет сделать ряд выводов. Подсчитаем баланс энергии электрона, связанного в атоме квазиупругими силами, за время, равное периоду его колебаний. Допустим, что такой электрон обладает средней энергией <IF> = <И?КИН> + <№пот> и тратит ее на излучение. Нетрудно заметить, что рассуждение ведется в рам- рамках модели атома Томсона. Добротность такой системы Рис. 1.24. К введению времени зату- затухания колебаний атома вследствие излучения _о запасенная энергия р энергия, расходуемая за период В рамках принятой модели легко оценить числитель и знаменатель этого выражения и рассчитать Q: тсоммакс т©2р; ИЗД (о Зс* A.41) Для оптических частот (со & 40 • 10м Гц) «добротность атома» Q оказывается порядка 107. Этот результат представляет большой ин- юрес. Известно, что радиотехнические устройства имеют добротность 51
порядкл 102 103. Но более важна возможность приближенной оценки прсмсии затухания колебаний атома вследствие излучения. Напомним, что для какого-либо затухающего колебания спадание его амплитуды Ео (t) можно выразить законом Ео (t) = Ео @) е-а* (рис. 1.24). Логарифмический декремент затухания d =аТ опреде- определяется добротностью системы и его можно вычислить по формуле Q = n/d. Время, за которое амплитуда колебаний уменьшается в е раз, называется временем затухания вследствие излучения, обозначается через тизл и оценивается из очевидного равенства тизл = 1А*. Эти оценки приводят к значению тизл « 10~8 с. Найденный результат чрезвычайно важен для многих разделов атом- атомной физики. Мы грубо оценили время жизни атома по отношению к процессам излучения. Последнее обстоятельство весьма существенно, так как в дальнейшем мы увидим (см. гл.У), что среднее время жизни атома в возбужденном состоянии может определяться и другими при- причинами, например столкновениями. Конечно, к исследованию атом- атомных систем, содержащих громадное число излучающих атомов, нуж- нужно подходить лишь с позиций статистической физики; более того, корректное описание излучения атомов обязательно должно прово- проводиться квантовомеханически, однако полученное значение тизл « « 10~8 с все же можно использовать для оценки роли различных яв- явлений, связанных с немонохроматичностью колебаний.
ГЛАВА II ОТРАЖЕНИЕ И ПРЕЛОМЛЕНИЕ ЭЛЕКТРОМАГНИТНЫХ ВОЛН Предшествующее изложение показывает необходимость детального ана- анализа условий прохождения электромагнитной волны через границу двух сред. Физические явления, имеющие место в этом случае, следует прежде всего оха- охарактеризовать энергетически, вводя понятие коэффициентов отражения и про- пропускания. Но кроме характеристик, связанных с амплитудами векторов Е и Н, нужно также исследовать фазовые соотношения на границе двух сред. Мы увидим, что это позволит получить новую информацию об изучаемых физиче- физических явлениях. Формально задача сведется к использованию граничных условий, которые для векторов Е и Н записывают в виде равенства тангенциальных составляющих на границе раздела: EXt = Ех% и //Ti = HXt. По-прежнему ограничимся слу- случаем плоских волн и введем систему координат XYZ. Будем считать, что ocbZ всегда направлена перпендикулярно границе раздела, а оси X и Y лежат в пло- плоскости раздела двух сред. Тогда граничные условия для линейно поляризованных волн и плоской границы раздела (Е = Ех> Н = Ну) запишутся в виде ЕХ1=ЕХГ иУ1 = НУг при z=0. B.1) Рассмотрим сначала нормальное падение волны на границу раздела, а за- затем исследуем наклонное падение и выведем законы отражения и преломления электромагнитных волн. Для этого введем основные понятия и обозначения и вы- выведем фазовые и амплитудные соотношения на границе раздела двух диэлектри- диэлектриков. Используя полученные соотношения (формулы Френеля), решим ряд за- задач, научное и прикладное значение которых весьма велико. Распространяя затем этот метод на случай границы раздела диэлектрик—проводник, получим основные сведения о электромагнитной волне в проводящей среде и ознакомим- ознакомимся с элементами оптики металлов. В заключение рассмотрим возникновение све- светового давления. Таким образом, еще раз убедимся, что теория Максвелла поз- позволяет получить информацию о весьма разнообразных физических явлениях. § 2.1. НОРМАЛЬНОЕ ПАДЕНИЕ ЭЛЕКТРОМАГНИТНОЙ ВОЛНЫ НА ГРАНИЦУ РАЗДЕЛА ДВУХ ДИЭЛЕКТРИКОВ Рассмотрим две непроводящие среды 1 и 2 с разными значениями диэлектрической проницаемости ех и е2. Магнитные проницаемости Hi = И'г считаем равными единице. Фазовая скорость волны в первой среде ux = dYzx, во второй среде и2 = c/j/^. Пусть на плоскую гра- границу раздела из среды 1 падает нормально волна ЕН, которая час- частично отразится (волна Е^), а частично пройдет во вторую среду (волна Е2Н2). Итак, в первой среде распространяются две волны — падающая и отраженная (рис. 2.1)*. Обе они характеризуются зна- значением скорости ul9 прошедшая волна — значением скорости и2. Мы пока не знаем, произойдет ли какое-либо преобразование частоты со * В этом и последующих рисунках гл. II показано положение векторов Е, Н, Ех, Н1э Е2 и На такое же, какое они имеют на границе раздела. 53
при прохождении электромагнитной волны через границу раздела. Поэтому обозначим частоты падающей, отраженной и проходящей волн соответственно через со, щ и со2. Предположение со Ф щ Ф со2 допустимо в столь общем описании, игнорирующем механизм изучае- изучаемого процесса. К тому же оно будет быстро исключено в процессе нашего исследования. Запишем выражение для линейно поляризованных волн — падаю- падающей (Е, Н), отраженной (Е1э Нх) и прошедшей (Е2, Н2): Е = Re Еоо ехр [ш (t — г/щ)], Н = Уч £, Ег = Re Е10 ехр [шх (t + г/щ)], Н1 =Уг~гЕъ Е2 = Re Е20 ехр [ш2 (t — z/u2)]y Я2 = V^E2. Зная направления падающей, отраженной и прошедшей волн (век- (векторы S, Slf S2 соответственно), а также учитывая взаимную ориента- ориентацию векторов Е и Н (правило правого винта), легко составить гра- граничные условия (рис. 2.1): Е + Ег = Е2у Н — Нг= Я2. B.2) По поводу такой записи необходимо сделать два замечания. Во-первых, равенства B.2) записывают в скалярной форме, так как предполагается, что векторы Е, Ех и Е2 направлены вдоль одной прямой, а векторы Н, Нх и Н2 направлены вдоль другой прямой, обра- образующей прямой угол с вектором Е. Для векторов Е, Е1э Е2 и Н, Hlf H2 соблюдается правило правого винта, а связь между их модулями опреде- определяется соотношениями Н = п±Е, Н± = Пх \ н Я2 = н, Рис. 2.1. Векторы Е, Н и S в па- *дающей, отраженной и прошедшей волнах (n2<tii) где пх = Уг± и п2 = |/*еа. Во-вторых, учтем, что знак минус, например, в выражении B.2) соответ- соответствует направлению вектора, проти- противоположному исходному направлению этого вектора в падающей волне. Так, например, мы предположили (рис. 2.1), что вектор Н2 имеет знак, противоположный знаку Н. С тем же успехом можно было приписать знак минус вектору Elf но тогда Нх был бы положитель- положительным, так как должно соблюдаться условие правого винта. Важно лишь запомнить сделанное предположение и в дальнейшем пользо- пользоваться им при анализе результатов. Заметим, что в уравнения B.2) входят алгебраические величины и знак их, как будет показано далее, определяется соотношением между показателями преломления пх и п2 исследуемых сред. Следует учитывать, что записанные граничные условия должны выполняться для любого значения t, т. е. при z = 0 имеем Яоо е'»' + Е го =Е го B.3) 54
Но тождество B.3) выполняется (при произвольном значении /), если со = соА = со2. Этого и следовало ожидать, поскольку нет ника- никаких физических причин для изменения частоты при отражении или преломлении света на границе раздела двух диэлектриков. Следует иметь в виду, что при взаимодействии с веществом очень сильной электромагнитной волны очевидное соотношение со = сог = со2 мо- может не выполняться. Это одна из ключевых проблем нелинейной оптики, получившей существенное развитие за последнее время. Упо- Упоминание некоторых исходных положений этой науки см., например, в §2.5. Тождество B.3) очень упрощает форму записи, так как можно йе учитывать зависимости Е и Н от времени и формулировать гранич- граничные условия для амплитуд напряженности электрического и магнит- магнитного полей. В данном частном случае нормального падения имеем: ■^00 ~Ь -Ею — ^20» -0 = У е1^00» 0 0 == " 20> 0 = V е1^10> После очевидных преобразований получим: •Еоо "г Ею == -^20» ^оо Е10 == jr Его* Отсюда следуют окончательные выражения для амплитуд отражен- отраженной и прошедшей волн при нормальном падении волны на границу раздела: Проведем анализ полученных соотношений. Если пг > п2, то знаки £10 и Еоо совпадают. Следовательно, реа- реализуется тот случай, который был выбран (рис. 2.1) в качестве ис- исходного: на границе раздела двух диэлектриков векторы Е и Ег ко- колеблются синфазно, а фазы векторов Н и Нх отличаются на п. Если п2 > пъ то знаки Е10 и £00 будут различны. Это значит, что изменяется на я фаза вектора Ех по отношению к вектору Е, тогда как векторы Н и Нх колеблются на границе раздела двух таких диэлек- диэлектриков синфазно. На рис. 1.16, иллюстрирующем возникновение стоя- стоячей волны, был показан именно этот случай. Итак, получено правило, которое в оптике обычно формулируется как потеря полуволны (К/2) при отражении света от оптически более плотной среды (п2 > пх). Заметим, что Е20 всегда совпадает по знаку с Еоо. Это значит, что вектор Е2 синфазен вектору Е. Аналогично ведут себя векторы Н2и Н. Введем теперь некоторые основные величины, которыми будем ши- широко'пользоваться в дальнейшем изложении (энергетические коэффи- 55
Циенты отражения М и пропускания SF), определив их следующим об- образом: ж средний поток энергии отраженной волны \ 4я / й й / с С — Ч4я средний поток энергии падающей волны / с ___ С — ЕН /JLE н - средний поток энергии прошедшей волны \4я 2 B.5) средний поток энергии падающей волны / с ч С — ЕН у Используя соотношения B.4) между амплитудами EOOf Е10 и Е2о для нормального падения волны на границу раздела двух диэлектриков, имеем: Для подобных процессов справедливо соотношение =1. B.56) Оно следует из закона сохранения энергии, и сразу видно, что коэф- коэффициенты, определяемые B.5а), • удовлетворяют равенству B.56) Следует подчеркнуть, что в данном разделе рассматриваются яв- явления на границе двух сред, поэтому никак не учитывается поглоще- поглощение энергии в средах 1 и 2 (см. § 2.5). При формулировке закона со- сохранения энергии для некоторого объема нужно учесть уменьшение потоков энергии в падающей, отраженной и проходящей волнах. Это приведет к появлению еще одного слагаемого в левой части выражения, подобного B.56) [см., например, формулу E.79I. Проведем численную оценку коэффициентов отражения и пропус- пропускания для одного частного случая. При прохождении света из воздуха (пг = 1) в стекло (для видимой области спектра п2 & 1,5) М = /L\24%, тогда как <Г = 4/l2 а? 96%. A+ЛJ U+/ (+2) Следовательно, обычное стекло отражает очень малую часть падаю- падающего на него под прямым углом света и, как подтверждает повседнев- повседневная практика, не может служить зеркалом. Вместе с тем эти 4% лучи- лучистой энергии, отражаемые при каждом прохождении границы воздух — стекло, играют существенную роль в сложных оптических системах, имеющих множество A2—16) таких границ. Поэтому при конструи- конструировании сложных объективов, как правило, используют различные способы уменьшения отражения для системы стекло—воздух («про- («просветление оптики»; см. §5.7). 66
§ 2.2. ЗАКОНЫ ОТРАЖЕНИЯ И ПРЕЛОМЛЕНИЯ ЭЛЕКТРОМАГНИТНЫХ ВОЛН Проведем теперь предварительное исследование общего случая. Электромагнитная волна падает под произвольным углом на границу раздела двух сред. В данном параграфе не используются соотношения между амплитудами напряженности электрического и магнитного полей на границе сред, а будут лишь записаны исходные уравнения, из ана- анализа которых сразу можно получить законы отражения и преломления электромагнитных волн. Прежде всего напишем выражение для плоской электромагнитной волны, распространяющейся в произвольном направлении Z' со ско- скоростью их (рис. 2.2). Текущие координаты точки на плоскости, нормаль п к которой совпадает по направлению с Z', обозначим х, у, z, а радиус-вектор этой точки примем за г. Если cos a, cos p и cos у — направ- направляющие косинусы нормали п, то для вол- волны, распространяющейся вдоль Z', полу- получается выражение B.6). Заметим, что при такой записи начальная фаза включена в значение Еоо: = Re£ooexp -Y| /J x \] B.6) Рис. 2.2. К записи уравнения плоской волны, распростра- распространяющейся вдоль произволь- произвольного направления Z' , Запишем теперь выражение для падающей, отраженной и прелом- преломленной волн. Пусть по-прежнему плоскость XY, удовлетворяющая условию z =t 0, служит границей раздела двух сред. Для определен- определенности положим, что в падающей волне нормаль п лежит в плоскости ZX (т. е. cos р = 0). Никаких ограничений на направления нормалей пг (в отраженной волне) и п2 (в преломленной волне) мы не налагаем. Рассмотрим частный случай линейно поляризованной волны,, когда ось Y направлена вдоль вектора Е. Тогда £-Re£wexpfto (t L V £2=Re£20exp \ш2 it — x cos «2+у cos p2+г cos y2 «2 VI Запишем теперь граничное условие — равенство тангенциальных составляющих напряженности электрического поля при z = 0: 57
Оно должно выполняться в любой момент времени t и при любых ко* ординатах х, у. Иными словами, jccos o&i-f-j/cos pt «1 ==£12отехри'оJ f^ — х cos a2 у cos B.7) Записанное тождество справедливо лишь при выполнении следую- следующих условий: 1) со =@! =(о2 (см. §2.1); 2) (cos Pi)/^ = (cos р2)/и2 = 0. Предполагая, что нормаль п к падающей волне Е лежит в плоско- плоскости ZX, мы пришли к выводу, что нормали к отраженной и преломлен- преломленной волнам (пх и п2) также лежат в этой плоскости (рис. 2.3): 3) (cos а)/^ = (cos а^1иг = (cos а2)/и2, откуда получаем: a) cos a = cos аг и, следовательно, а = ± аг. Из этих двух значений физическому смыслу задачи соответствует — а±. Итак, получен закон отражения электромагнитных волн. Если перейти к дополнительным углам, то найдем обычную формулировку этого закона; угол отражения волны равен углу падения; б) cos a/cos a2 = их/и2 Но (рис. 2.3) а + 7 = я/2 и а2 + у2 = я/2. Следо- Следовательно, sin у их sin у2 и2 Чтобы придать этому закону прелом- преломления электромагнитных волн более при- привычный вид, вспомним, что иг = clnly a u2 = с/п2. Тогда окончательно полу- получим* Рис. 2.3. К выводу законов отражения и преломления элек- электромагнитных волн Показаны направления нормалей к фронтам падающей, отраженной и преломленной волн B.8) sin у j*i_ п^ sin 72 «2 ni Это выражение B.8) обычно назы- называют в оптике законом Снеллиуса. Хоро- Хорошо известно, что законы отражения и преломления световых волн служат основой геометрической оптики. Мы видим, что в электромагнитной теории света эти законы полу- получаются в самом общем виде без введения каких-либо специальных предположений, как следствие записанных выше граничных условий для уравнений Максвелла. Они справедливы для электромагнитных волн в любом диапазоне частот. * В дальнейшем мы будем обозначать угол падения q>, угол отражения (f>i и угол преломления ф2- Тогда соотношения B,8) запишется так: sin (p/sin <p2 — = n2lnv 58
Таким образом, направление распространения отраженной й пре- преломленной волн однозначно определяется соотношениями B.7) и B.8). Но приведенные выше простые выкладки позволяют также решить вопрос об интенсивности таких волн в зависимости от угла падения и показателя преломления. § 2.3. ФОРМУЛЫ ФРЕНЕЛЯ При выводе и анализе формул Френеля можно не учитывать вре- временных множителей векторов напряженности электрического и маг- магнитного полей и формулировать граничные условия для соответст- соответствующих проекций амплитуд векторов Е и Н, учитывающих началь- начальные фазы колебаний. Неполяризованный свет будем рассматривать по-прежнему как сумму двух плоских волн, распространяющихся в одном направлении с одной фазовой скоростью и> но поляризован- поляризованных в двух взаимно перпендикулярных направлениях, причем фазы этих двух колебаний никак не скоррелированы. Таким способом можно моделировать хаотическую суперпозицию различных эллипти- эллиптически поляризованных электромагнитных воли, обусловленную реаль- реальными условиями возбуждения световых волн (см. § 5.2). Для каждого момента времени нетрудно вычислить суммарную напряженность электрического поля | Е |, если известны две ее про- екции на границу раздела (Е\\ и Е±). В самом деле, | Е | = YE\ + £± И, наоборот, зная Е , можно разложить его на две взаимно перпен- перпендикулярные компоненты. В качестве направлений таких компонент Е удобно выбрать следующие: первая лежит в плоскости падения — будем обозначать ее через £ц, Е± колеблется перпендикулярно этой плоскости. Запись граничных условий для амплитуд и последующий вывод формул Френеля будем проводить раздельно для этих двух взаимно перпендикулярных направлений колебаний вектора напря- напряженности электрического поля. I. Вектор Е лежит в плоскости падения электромагнитной волны. Направления векторов Ец, (Е^ц и (Е2)ц для какого-то момента времени показаны на рис. 2.4. Для дальнейшего выбор этих направле- направлений (знаков их проекций на ось X) более или менее безразличен—ана- безразличен—анализ конечных формул позволит внести необходимые коррективы. Мы останавливаемся на такой их ориентации лишь по аналогии со случаем п2 > пх при нормальном падении. Направление векторов Н, Нх и Н2 уже детерминировано выбором направления для Е, Ех и Е2. В дан- данном случае векторы Н, Нх и Н2 направлены одинаково — перпенди- перпендикулярно плоскости рисунка по направлению к читателю. Для проек- проекций амплитуд векторов Е и Н на ось X имеем: Еоо cos фх — Е10 cos фх = Е20 cos ф2, Ноо + Н10 = Н20. Учитывая, что Яоо = я^оо» #ю = пхЕ109 Я20 = п2Е20, п2/пг = = sin фх/sin ф2, находим: р р р C0S(P2 р \п р sincpi COS фх Sin ф2 59
Тогда Еро— 2sin(<pi+<pa)cos(<pi—ф2) Складывая уравнения B.9), получаем 1 si B.10) откуда cos фх sin фг / I 2 sin ф2 cos ф! (^oo)ll- B.10a) Все необходимые данные для решения интересующих нас задач содержатся в выражениях B.10) и B.10а). При желании читатель без труда может получить соотношения между амплитудами векторов Н, Нх и Н2. Рис. 2.4. Выбранные на- направления векторов Е и Н на границе раздела Вектор Е лежит в плоскости падения Рис. 2.5. Выбранные на- направления векторов Е и Н на границе раздела Вектор Е перпендикулярен плоскости падения 2. Вектор Е перпендикулярен плоскости падения волны. В этом случае выберем направление векторов Н, Н1э Н2 согласно рис. 2.5. На нем векторы Е±, (Ех)±и (E2)j_ направлены от читателя перпенди- перпендикулярно плоскости рисунка. Для проекций амплитуд исследуемых векторов на оси получим соотношения 2?00 + £ю = ^20» ^00 COS фх Н10 COS фх = #20 C0S Ф2' Последнее условие можно переписать в виде р г. C0S(p2 П2 г» COS ф2 Sin фх г» Х^оО ^10 £-20 : ^20« 60
Отсюда легко получаются искомые зависимости: (Р \ _ sin(9x —ф2) (F , sin(q>i+q>2) A7 \ 2 sin ф2 cos ф! / п ч /0 11Ч (Д2о)л= . , , ч (^оок- B.11) sm(9!+92) Проанализируем найденные соотношения. Прежде всего рассмо- рассмотрим относительные интенсивности отраженной и преломленной волн. Для энергетического описания процессов на границе двух сред ранее были введены коэффициент отражения Л = (—) и коэффициент \£оо/ пропускания !!F =~ (—) . Найдем зависимость коэффициента от- ражения М от угла падения. Рассмотрение формул Френеля показывает, что компоненты (Ег)\\ и (Ег)± по-разному изменяются с увеличением угла фх. Во-первых, сразу видно, что если фх + <р2 ->■ я/2, то tg (фх + ф2) -*■ °° и, следо- вательнр, J?j| = 0. Вместе с тем коэффициент отражения Я± не обра- обращается в нуль при Фх + ф2 = я/2, так как знаменатель выражения B.11) sin (фх + ф2)-> 1. Таким образом, получается, что при некото- некотором значении угла падения от границы раздела отразится только элек- электромагнитная волна с вполне определенной поляризацией. Волна, в которой колебания вектора Е параллельны плоскости падения, во- вообще не отразится при (<рг + ф2) = я/2. Вектор Е в отраженной волне (при Ф1 + ф2 = я/2) будет колебаться перпендикулярно плоскости падения. В учебниках по оптике часто употребляют несколько иную терминологию. Так, например, в данном случае говорят, что отражен- отраженный свет поляризован в плоскости падения. Отсюда видно, что пло- плоскость поляризации света соответствует плоскости, перпендикуляр- перпендикулярной направлению колебаний вектора Е. Для данного случая, впервые экспериментально обнаруженного Малю, очевидны следующие соотношения: если <Pi + Фг = л/2, то sin ф2 == cos и, значит, £l=sin91=sin91= t пх sin ф2 cos ф! Эта зависимость угла, при котором наблюдается линейная поляри- поляризация отраженной волны, от отношения показателей преломления двух исследуемых диэлектриков называется законом Брюстера, а соот- соответствующий угол часто называют углом\ Брюстера (фвр). В этих обозначениях tg?Bp=i^. B.12) Для перехода световой волны (видимая область спектра) из воздуха в стекло tg фвр » 1,5, что соответствует углу фвр « 57°. 61
Заметим, что отражение полностью поляризованной волны на- наблюдается тогда, когда нормали в преломленной и отраженной волнах ортогональны (рис. 2.6). Тогда, используя полученные ранее сведе- сведения об излучении диполя (см. § 1.7), легко дать физическое истолков- ние этого явления с позиций электронной теории. Если связывать на- наличие отраженной волны с вынужденными колебаниями электронов во второй среде, то в на- направлении, перпендику- перпендикулярном нормали к пре- преломленной волне, не должна распространять- распространяться энергия, так как электрон не излучает в направлении, вдоль ко- которого осуществляются его колебания (рис. 2.7). Легко заметить, что по- последнее ограничение от- Рис. 2.6. При падении света под углом Брюстера на границу раздела двух сред нормали к фрон- фронтам преломленной и отраженной волн взаимно перпендикулярны носится лишь к колеба- колебаниям электронов в плос- плоскости падения волны, происходящим в результате действия на них (£2)ц. Вместе с тем (Е2)± будет раскачивать электроны в направле- направлении, перпендикулярном плоскости падения, и такое излучение будет распространяться без всяких ограничений в направлении, удовлетво- удовлетворяющем условию B.12), целиком опреде- определяя поляризацию отраженной волны. Но вернемся к исследованию зависимо- зависимости коэффициента отражения Л от угла падения электромагнитной волны. При ф = <рх = 0 угол ф2 также равен 0. Чтобы не проводить длинных выкладок, восполь- воспользуемся промежуточной формулой 2?оо-—2: to п\ и, положив п-2 cos <pi = ф2 = 0, получим B 13) ^ис> ^' ^ трактовке'закона ^ ' Брюстера с позиций элек- электронной теории Вектор Е в падающей волне ле- лежит в плоскости падения. Отра- Отраженная волна этой поляризации отсутствует, так как электроны не излучают в направлении сво- своих колебаний Мы уже использовали подобную фор- формулу при решении частной задачи —ис- —исследовании нормального падения электро- электромагнитной волны на границу раздела. В данном случае не имеет смысла гово- говорить о Е\\ и Е±. Никакого изменения поляризации не происходит, и Обе компоненты вектора Е отражаются одинаково. Легко также показать, что при ф -> я/2 (скользящее падение электромагнитной волны на границе раздела) коэффициент отражения как для £ц, так и для Е± стремится к единице. Каждый читатель это, 62
по-видимому, наблюдал на опыте. Вспомните, как ярко отражается в воде противоположный берег реки или другой отдаленный предмет, и сравните мысленно йаблюдаемую картину с неудачной попыткой рассмотреть свое изображение в направлении, перпендикулярном поверхности воды, — в последнем случае вы увидите дно реки, а не свое лицо. На рис. 2.8 представлена исследованная зависимость Я\\ и J?j_ от угла падения ср. Там же приведены кривые для коэффициентов пропускания Л\\ и £Г±, которые (без учета потерь на поглощение) должны дополнять значения соответственно Я\\ и М± до единицы. Но, как уже указывалось, естественный свет, падающий на границу раздела, представляет собой сумму двух не скоррелированных по фазе взаимно ЛМ перпендикулярных волн Е\\ и Е±. Тогда для суммарной интенсивности отражен- отраженного света, измеренной без учета его поляризации, находим ^отр — — - —ф2) p—ф2I B.14) Кривая /отр/^пад проходит между Я\\ и 33±, совпадая с ними в точках ср = 0 и Ф = я/2. На том же рисунке показан средний коэффициент пропускания Рис. 2.8. Зависимость коэффи- коэффициентов отражения «Я/ и про- пропускания еГ от угла падения при переходе света из воздуха (>ii«l) в стекло (/12«1,5) прпад Полезно напомнить, что здесь, как и всюду, речь идет об измерении коэффициента отражения, который, по определению, равен отношению среднего потока электромагнитной энергии в отраженной волне к сред- среднему ее потоку в падающей. Но поскольку для падающего неполяри- зованного света имеет место осевая симметрия, т. е. <(£00)J> = = <B?ооI>» то целесообразно говорить о суммарном коэффициенте отражения света, представляющем собой полусумму средних потоков с взаимно перпендикулярными плоскостями поляризации вектора Е. Именно в этом смысле и использовался выше термин «интенсивность» для отраженной и падающей волн. Эти явления удобно демонстрировать в эксперименте, схема кото- которого представлена на рис. 2.9. Свет отражается от черного стекла. Тогда преломленная волна полностью поглощается и нет отражения от второй поверхности стекла. Это важно отметить, так как формулы Френеля были выше получены для перехода света от одного беско- бесконечно протяженного диэлектрика в другой, а не для пластинки с дву- двумя отражающими плоскостями. Наличие двух отражающих поверхно- поверхностей исказило бы результат опыта и усложнило сравнение его с тео- теорией. Конечно, применение черного стекла не полностью соответствует исходной постановке задачи (явления на границе между двумя идеаль- 63
ными непоглощающими диэлектриками). Но поглощение в черном стекле мало и вносимые искажения не скажутся на результатах опыта. Теперь можно полностью истолковать этот эксперимент. Приша- дении на первое зеркало естественного (неполяризованного) света под углом Брюстера отраженный свет оказывается полностью поляризо- поляризованным. От второго зеркала он либо отразится полностью (п2 II nlf рис. 2.9, а) или совсем не отразится от него (i^-Li^, рис. 2.9, б), так как в последнем случае второе зеркало отражает свет только той по- поляризации, которая отсутствовала в пучке, отраженном от первого зеркала. Контрольными опытами нетрудно показать, что именно по- поляризация света при первом отра- (/п, жении и определяет условия отра- отражения от второго зеркала. Для этого можно заменить первое зер- зеркало каким-либо поляризатором, (например, поляроидом или приз- призмой Николя; см. §3.1). Изменяя Рис. 2.9. Схема опыта, демонстрирую- поляризацию падающего на второе щего поляризацию света, отраженно- зеркало света, легко перейти от го от черного стекла под углом Брю- максимальной к минимальной ин- стера тенсивности света на выходе. Ука- Укажем также, что если одно из ди- диэлектрических зеркал заменить обычным металлическим, то ни при каком положении другого зеркала не удается добиться исчезновения света. Следовательно, при отражении света от металлического зеркала никогда не получается линейно поляризованной волны (см. § 2.5). Введенные выше понятия коэффициентов отражения и пропуска- пропускания имеют точный смысл лишь для линейно поляризованного света с направлением колебаний вектора Е либо в плоскости падения, либо перпендикулярной ей. На практике приходится измерять поток отра- отраженного (или прошедшего) света самой различной поляризации и при заданном угле падения коэффициент отражения может изменяться между двумя предельными значениями, а поляризация отраженного света может существенно отличаться от поляризации падающего. Для определения этих важнейших характеристик света, претерпевшего от- отражение или преломление, удобно ввести понятие частичной поляриза- поляризации. В этом случае колебания вектора Е в некотором направлении превалируют над колебаниями в других направлениях (при линейной поляризации колебания происходят только в одном направлении). Другими словами, частично поляризованное излучение представляет собой смесь естественной (неполяризованной) и линейно поляризован- поляризованной радиации. Для характеристики меры, или степени, поляризации обычно вводят функцию A=/j-~7il 100%. 7-L+ 7i! Очевидно, что для неполяризованного света 1± = /ц и А = 0. Для света, отраженного от диэлектрика под углом Брюстера, /ц =0, и А = 100%, т. е. свет полностью поляризован. Вместе с тем для пре- 64
ломленной волны (при ср = фвр) мера поляризации отлична от 100%. Если сопоставить формулы Френеля для амплитуд преломленного света (£2о)н и (^2о)±» то получим (^2 о) || cos(cpi— ф2) Следовательно, (/пРел)н ~ (Е2оI всегда больше (/прел)± ~ ~ (^го)! и меРа поляризации А отрицательна. Легко сосчитать, что при переходе воздух—стекло (для ф = фбр) степень поляризации А = — 8%. Итак, при падении света на границу двух диэлектриков под углом Брюстера отраженная волна полностью поляризована, тогда как пре- преломленная волна оказывается частично поляризованной, причем век- вектор Е колеблется в плоскости падения. Изучение графиков для ко- коэффициентов отражения и пропускания (см. рис. 2.8) показывает, что при ф = фБР поток отраженной энергии невелик, а главная его часть распространяется в направлении преломленной волны. Поэтому для получения поляризованного света выгодно многократно преломить падающий под углом Брюстера свет, каждый раз увеличивая степень его поляризации. Расчет показывает, что при ф = фвР стопа из 10 стеклянных пластинок дает степень поляризации преломленной волны, близкую к 100%. При этом интенсивность прошедшей радиации за- заметно больше, чем в отраженной волне. Такой компактный прибор удо- удобен и прост в изготовлении. Он используется в видимой части спектра, где поглощение света определенными сортами стекла пренебрежимо мало. На опыте легко продемонстрировать, сколь быстро падает сте- степень поляризации света, прошедшего стопу, при отклонении угла па- падения от угла Брюстера. Теперь перейдем к анализу фазовых соотношений в отраженной и преломленной волнах. Исследуем зависимость изменения фаз Ег и Е2 относительно фазы Е от угла падения ф. При этом будем исхо- исходить из того, что изменение знака проекции эквивалентно изменению фазы соответствующего колебания на я (исходным будем считать рас- расположение векторов Е, Ех и Е2, показанное на рис. 2.4). Сначала рассмотрим наиболее простой случай — докажем син- фазность преломленной и падающей волн. Напомним [см. B.10а)], что, поскольку ф! = ф, (F20)|| 2cos9sinq>2 (£оо)ц sin (ф + ф2) cos (ф — ф2) Нетрудно показать, что (£20)ц и (ЕОо)н всегда совпадают по знаку. Действительно, если 0 < ф + ф2 < я, to sin (ф + ф2) > 0. Вне зависимости от того, какой из углов (ф или ф2) больше, cos (ф — ф2) положителен в пределах 0 < | ф — ц>2\ < я/2 и, следовательно, век- векторы (Е2)ц и Ец всегда синфазны. Аналогичные рассуждения убеж- убеждают нас, что таким же образом ведут себя векторы (E2)j_ и Ej_. Анализ фазовых соотношений в случае отраженной волны более сложен. Начнем его с исследования случая п% > nlf что соответствует 3 Эак. 1729 65
ц» ^ ф2. Рассмотрим векторы соотношение 1г)\\ и Ец, для которых справедливо t& (ф— ф2) tg(ф+ф2) ' Оценим знак этого отношения для двух случаев: ф + фг < я/2, т. е. ф < фБр, Ф + Фа > я/2, т. е. ф > фБр. При сделанных предположениях имеем* tg (Ф — ф2) > 0, tg (ф — ф2) > О, tg (ф + ф2) > 0, tg (Ф + ф2) < 0. В первом случае (£10)ц и (£Оо)и совпадают по знаку, во втором противоположны. Для того чтобы установить, когда (Ех)ц и Ец синфазны, надо вспомнить их расположение на рис. 2.4, использованное при выводе формул Френеля. Учитывая принятое допущение о том, что проекции этих векторов на плоскость раздела имеют разный знак, можно сделать следующий вывод. Если ф + ф2 < я/2 (т. е. ф < фБр), то (Ех)ц и Ец колеблются в противофазе. При ф + ф2 > я/2 (ф > фБр) обе компо- компоненты напряженности электрического поля синфазны. Зависимость от угла падения разности фаз между падающей и отражен- отраженной волнами иллюстрирует полученные вы- выводы (рис. 2.10, а). Если рассматриваются векторы напря- напряженности электрического поля, колеблю- колеблющиеся перпендикулярно плоскости падения f(I*i)j. и EjJ, и если ф > ф3 (т. е. я2 > ni)> то получим, учитывая B.11), что и для Ф + ф2 < я/2, и для ф + ф2 > я/2 отно- отношение (Е10)±/(Е00)± остается отрицатель- отрицательным. Следовательно, (Ех)х и Е± всегда колеблются в противофазе (рис. 2.10, б). Напомним, что на исходном рис. 2.5 векторы Е, *Ег и Еа были направлены в одну сторону. Итак, для отражения электромагнитной волны от оптически более плотной среды (я2 > пг) можно сделать следующие выводы: если ф < фБр, то обе компоненты вектора Ег [т. е. (Ег)± и (E^ul противо- противоположны по фазе напряженности поля Е в падающей волне. Вспом- Вспомним, что при решении частной задачи — отражении электромагнитной волны при нормальном падении на границу раздела — уже был полу- получен исходный результат (см. §2.1). Теперь можно утверждать, что при отражении электромагнитной волны от оптически более плотной среды (п2 > пг) происходит потеря полуволны (изменение на п фазы 66 Рис. 2.10. Фазовые соотно- соотношения между падающей и отраженной волнами
вектора Е в отраженной волне) не только при нормальном падении, но и при всех углах <р, меньших угла Брюстера. Если угол падения больше ]угла^|Брюстера (ср + ср2 > я/2), то компоненты (Е^ц и (Ei)j_ ведут себя по-разному: фаза (Ех)х по-преж- по-прежнему (так же как и при малых углах падения) противоположна фазе падающей волны, а (Е^ц синфазна Еу. Следовательно, при угле Брюстера скачком изменяется разность фаз между (Е^ц и (Ех)± — при углах ф < фБР они были синфазны, а при больших углах колеб- колеблются в противофазе (рис. 2.10, в). Этот вывод из формул Френеля неоднократно проверялся на опыте, причем было замечено, что вблизи угла Брюстера изменение происходит не столь резко, как следовало бы из приведенных расчетов (см. пунктирную кривую на рис. 2.10, в). Были высказаны различные суждения о природе подобных аномалий: Друде предположил наличие тонкого промежуточного слоя со зна- значением 8, лежащим между вг и еа. Толщина этого слоя должна за- зависеть от состояния соприкасающихся поверхностей, их полировки и других факторов. Вуд исследовал возможность влияния дополни- дополнительных натяжений в стекле при его полировке, но к окончательному выводу о соответствии теории Друде экспериментальным данным прийти не удалось, В заключение кратко охарактеризуем фазовые соотношения между отраженной и падающей волнами для случая пх >пг (ф < ф2). Для волны, в которой вектор Е колеблется в плоскости падения (Ец Ф 0, ejl =0), анализируя соотношение B.9), находим, что (Ег)\\ и Ец синфазны при ф < фБР и противоположны по фазе при ф > фвр. Для волны, в которой Ег и Е перпендикулярны плоскости падения (Е± Ф 0, Ец = 0), во всех случаях (ф < Фбр и ф > фвр) векторы (EiXl и Ejl совпадают по фазе. Следовательно, при углах падения, меньших угла Брюстера (ф < фвр), при отражении от оптически менее плотной среды (пх > > я2) отраженная и падающая волны совпадают по фазе, т. е. нет потери полуволны при отражении. Рассмотрение больших углов (за- (заметим, что для случая n2lnx< 1, т. е., например, при переходе волн из стекла в воздух, фвР < 45°) затруднено тем, что существует такой угол ф = Фдред, при котором фа = я/2, т. е. весь световой поток отражается, и преломленная волна отсутствует. Ранее считалось, что формулы Френеля теряют смысл при ф ^ ФпРед> «но впоследствии было выяснено, что использование комплексных величин для ампли- амплитуд и углов позволяет получить достаточно полное описание и этого частного случая отражения и преломления электромагнитных волн (явления полного внутреннего отражения), представляющего само- самостоятельный интерес. § 2.4. ЯВЛЕНИЕ ПОЛНОГО ВНУТРЕННЕГО ОТРАЖЕНИЯ Как уже указывалось, при отражении электромагнитной волны от оптически менее плотной среды (n2/%<l) при углах падения Ф > ФПред энергия целиком возвращается в первую среду, и по- поэтому это явление называется полным внутренним отражением. 3* 67
Элементарные опыты иллюстрируют этот эффект. На рис. 2.11 изображены стеклянные призмы, в которых наблюдается полное вну- внутреннее отражение. Для системы стекло—воздух щ1пг ~ 1/1,5 и Фпред » 42°. Следовательно, падение световых лучей на грань приз- призмы под углом 45° соответствует случаю <р > фпред. Аналогичные опыты можно проделать и в УКВ-диапазоне с применением призмы из пара- парафина. Очень эффектна также демонстрация своеобразного «световода». Стеклянный стержень многократно изогнут , но так, что всегда Ф > Фпред- Поэтому световой поток после многократных отражений выходит через торец стержня, практически не потеряв своей энергии (рис. 2.12). Такой «световод» напоминает (см. § 1.2) волновод, широко используемый в технике СВЧ. Этот способ «транспортировки» свето- Рис. 2.11. Оборачивающая (а), по- воротно-оборачивающая (б) и по- поворотная (в) призмы Рис. 2.12. Схематическое изображение «световода» вого потока применяется в «волоконной» оптике для передачи информа- информации *модулированным световым сигналом. Однако при этом возникли существенные трудности и лишь в последние годы наметились пути решения проблемы, основанные на использовании весьма чистых и однородных волокон. Дело в том, что наличие в стеклянном волокне мельчайших пузырьков воздуха, трещин, пылинок и т. д. приводит к рассеянию световых волн и резкому возрастанию потерь энергии, нацело исключающих возможность применения системы таких воло- волокон для целей оптической дальней связи. В результате интенсивной исследовательской работы в 70-е годы была разработана технология получения оптических волокон очень высокого качества. Потери энергии в таких светопроводах оказываются того же порядка, что и затухание электрического импульса, распространяющегося в метал- металлическом проводнике. Можно ожидать, что несомненная выгода пере- передачи информации на оптических частотах будет реализована не только в условиях космоса, где не играют роли помехи, неизбежно возникаю- возникающие при распространении свободной световой волны в приземной ат- атмосфере. Полное внутреннее отражение электромагнитных волн объясняет рефракцию радиоволн в ионосфере. Известно, что на высоте от 100 до 300 км существует ионизированный слой, от которого отражаются радиоволны с длиной волны X > 10 м. Более короткие волны прохо- проходят через него, что используется в радиоастрономии. Оказывается, что 68
в ионосфере реализуется случай и>су т. е. фазовая скорость больше скорости электромагнитных волн в вакууме. Физика этих процессов рассмотрена в гл. IV, а сейчас важно лишь указать, что с увеличением высоты происходит уменьшение показателя преломления я, который к тому же зависит от частоты. При некотором значении X наступает полное внутреннее отражение электромагнитных волн (X ^10 м), что обеспечивает возможность дальней радиопередачи в этом диапазоне и является естественным рубежом между корот- короткими и ультракороткими (УКВ) радиоволнами. Изучим подробнее явление полного внутрен- внутреннего отражения, причем при записи основных соотношений будем, как и прежде, пользоваться комплексными значениями для амплитуд отра- отраженной и преломленной волн с переходом к ве- вещественным значениям в окончательных фор- формулах. 1. Исследование преломленной волны. Утвер- ждение, что поток электромагнитной энергии не попадает во вторую среду, полностью отра- жаясь от границы раздела, нельзя считать точ- ным. Покажем, что при полном внутреннем отражении (ф > фпред) во второй среде появ- появляется электромагнитная волна, распространяющаяся вдоль границы раздела. Для этого запишем выражение для преломленной волны, направленной вдоль оси X' во второй среде (рис. 2.13). Как уже ука- указывалось [см. B.6)], для волны, движущейся в среде 2 по Х\ имеем: волны п£и ПОЛном внутреннем отраже- нии (щ>п2) £а=£20ехр[to (t-x'/uj]=Et0exp [to ^-Х8}Пф2+2СО$ф2)] =  W2/Slll(p2 B.15) В этой записи член I обозначает амплитуду некой волны II, рас- распространяющейся вдоль оси X со скоростью w2/sin ф2. Эта комплекс- комплексная амплитуда I зависит от координаты z, характеризующей глубину проникновения волны во вторую среду. Рассмотрим подробнее эту неоднородную волну, движущуюся вдоль границы раздела, которой мы заменили однородную волну, бегущую вдоль X'. Прежде всего оценим cos ф2: Здесь |/"( — sin фJ— 1 — вещественная величина, так как при Ф > фпред имеем sin ф > ^ = sin фпред. Тогда для амплитуды не- 69
однородной волны находим sin 2 |/^sincp)a *] BЛ6) Знак плюс в показателе экспоненциальной функции соответствует безграничному возрастанию амплитуды во второй среде, что лишено физического смысла. Знак минус соответствует волне, амплитуда ко- которой быстро убывает по мере проникновения во вторую среду. Прак- Практически эта неоднородная волна сущест- существует лишь в поверхностном слое второй среды, толщина которого примерно равна длине волны исследуемого излучения (рис. 2.14). Мы пришли к кажущемуся противоре- противоречию: опыт показывает, что при полном Рис. 2.14. Возникновение не- внутреннем отражении вся энергия отра- однородной волны при пол- жается (этот результат будет подтвержден ном внутреннем отражении, при анализе отраженной волны) и вместе направленной параллельно с тем какая-то часть потока энергии рас- линий раздела двух сред пространяется во второй среде вдоль гра- £lll уС11еиьш^иеКа3ампал^туды ницы раздела. Наличие такой миграции вОЛопЬтичес^иРменееНплот" энергии нетрудно подтвердить математиче- ную среду ° " скими выкладками: для стационарного про- процесса среднее значение нормальной компо- компоненты потока энергии <SH0PM> =0, тогда как среднее от составляю- составляющей потока вдоль границы раздела <STaHr) Ф®> Подобная ситуация может наблюдаться лишь в том случае, если часть потока энергии по- попадает во вторую среду, а затем из нее выходит. Проникновение электромагнитной энергии во вторую среду можно связать с физиче- физическими явлениями, протекающими при установлении процесса. Это своеобразное ответвление части потока энергии во вторую среду можно обнаружить на опыте и использовать в практических целях. Так как толщина слоя, в котором мигрирует энергия, порядка длины волны, то выгодно экспериментировать в УКВ-диапазоне. Действительно, если поставить рядом две призмы полного внутрен- внутреннего отражения, оставив между ними небольшой зазор (рис. 2.15), то в зависимости от ширины последнего приемник излучения зареги- зарегистрирует разное количество энергии. Меняя ширину зазора, можно изменять количество прошедшей энергии, т. е. модулировать ампли- амплитуду прошедшей волны. Аналогичные опыты в оптическом диапазоне требуют значительно большей точности, так как длина волны (и, следовательно, величина зазора) в 100 000 раз меньше. Используя раствор флуоресцеина, на- нанесенный на грань оборачивающей призмы, можно показать эффект- эффектный опыт, доказывающий наличие световой энергии в оптически ме- 70
нее плотной среде. Идея такого опыта была, по-видимому, независимо предложена рядом выдающихся физиков (Вуд, Мандельштам и др.). 2. Исследование отраженной волны. Будем исходить из формул Френеля, записанных в следующем виде: tg(q> sin2q>—sin2q>a sin (ЕОо)|| sin 2(P+sin 2Фа s*n Ф cos Ф+sin Ф2 cos ф2 — sin (ф—ф2) sin ф cos ф2—sin ф2 cos ф sin (ф+ф2) sin ф cos ф2+sin ф2 cos ф Излучатель /л V/ / N /7, щемник Рис. 2.15. Схема опыга, демонстрирующего ответвление части потока энергии при полном внутреннем отражении (а), и экспериментальная установка в УКВ- диапазоне (б) Воспользовавшись соотношением где п12 = — < 1 и sin п12 sin ф2, получим после простых подстановок и преобразований: (^оо)ц ц n?g cos ф+ IV sing ф—nj2 п\г cos ф — cos ф + т — П\ B.17) 12 Легко показать, что при ер > фпред имеем т^Ц~ I = ЩO \ ==z^' Значит, действительно при полном внутреннем отражении весь поток энергии возвращается в первую среду и при описании стацио- стационарного процесса можно не учитывать той доли энергии, которая ми- минирует во второй среде. Для исследования зависимости коэффициента отражения М от угла падения <р при п2 < пг рассмотрим часто встречающийся пере- 71
ход света из стекла в воздух. В данном случае, как уже указывалось, Фпред & 42°. Угол Брюстера, получающийся из условия tg фвр = п12, будет еще меньше (фвр ^ 33°). Следовательно, зависимость коэффи- коэффициентов отражениями = [(Е10)\\/(Е00)>\]2 и J%± =[(E10)± /(£00)J2, от угла падения, определяемая соотношениями B.17), должна пред- представляться следующей кривой (рис. 2.16): при ф = 0, как и прежде (при п2 > %), коэффициент отражения ~ 4%. При ф = фБр находим J?U =0, т. е. отражается только волна, в которой вектор Е колеб- колеблется перпендикулярно плоскости падения (J?j_ Ф 0). При ср-»- фпред (а не при ф -> я/2, как было при п2 > пг) поток световой энергии отра- в жается полностью и наступает &А явление полного отражения Заметим, что при ф -> фпред коэффициент отражения очень быстро возрастает. Поэтому, используя явление полного от- отражения И ИЗМерЯЯ фпред, МОЖНО определять показатель прелом- Ф ления какого-либо вещества, что широко применяется на Рис. 2.16. Зависимость коэффициента от- практике. ражения^от угла падения Для получения фазовых со- При фпред наступает полное внутРеннее отРа- ОТНОШеНИЙ НУЖНО ДОМНОЖИТЬ И жение. На гРафике показано также изменение uin^v,nnn путм а"шл\лл\пiо п разности фаз о при ф>фпреД разделить B.17) на величины, сопряженные их знаменателям, и отделить таким образом действительную часть от мнимой. Однако здесь проще воспользоваться теорией комплексных чисел*, согласно которой если z =^з£]> то 121 = 1 ♦ tg 6/2 = Ыа. Эти утверждения легко проверяются указанным выше способом. Покажем, что при явлении полного внутреннего отражения про- происходит изменение поляризации излучения — линейно поляризован- поляризованная волна становится эллиптически поляризованной. Введем обозначения Ш^ =е'б« и ^|Ц± =el6j-. Тогда , _п_ у sin <р ■—#; 2 , 2 я^гСОБф * 2 соэф Мы видим, что б || Ф 6j_, т. е. скачки фаз при переходе из среды в среду неодинаковы и отраженная волна будет эллиптически поляри- поляризована. Теперь нетрудно провести количественную оценку степени эл- эллиптичности. Обозначим через б = б0 — бх разность между иссле- ♦ В § 1.3 уже отмечалось, что любое комплексное число С =• а + Ы мож- можно представить в виде С ■= Сое/б, где Со—действительное число, a tg б = Ыа. 72
дуемыми скачками фаз. Из выражений для 8± и 6 ц получается следую- следующая зависимость этой разности фаз от угла падения: Очевидно, что tg F/2) обращается в нуль дважды: а) при ф = фпред, так как sin фпред = п12\ б) при ф = я/2, так как cos я/2 = 0 (скользящее падение). Дифференцируя B.18) по ф и приравнивая ^- (tg^ нулю, получим 35мм Ммм условие экстремума. Оказывается, что максимальная разность фаз возникает при выполнении условия sin2 фмакс = 2nh/(l + #h)- Под- Подставляя это значение в B.18), находим tg-~f^ = A — /г?2)/2д12- Отсюда еле- дует, что чем больше различие в пока- показателях преломления двух сред [т. е. чем меньше (п12 = n2ln$, тем больше разность фаз между двумя колебаниями. Рис. 2.17. Призма Френеля Легко видеть, что для получения круго- круговой поляризапии [6макс =я/2 и tg (бмакс/2) = 1] различие в пока- показателях преломления должно быть очень велико. Из условия A— n2i2)/2n12 = 1 находим п12 « 0,4, что достигается в оптическом диапазоне лишь при переходе из алмаза (п± ж 2,4) в воздух (п2 = 1). В правой части рис. 2.16 показана зависимость сдвига фаз S = = 6 и —б± от угла падения, изменяющегося в пределах от фпред до я/2. Для перехода стекло—воздух фмакс « 51° и при однократном отражении никак нельзя получить круговую поляризацию, так как tg \ = 0,42. Изучая эти явления, Френель предложил оригинальный способ получения циркулярно поляризованного света при полном внутрен- внутреннем отражении. Можно показать, что при подходящей геометрии в ре- результате двукратного отражения света от граней стеклянной призмы (рис. 2.17) будет достигаться требуемая разность фаз б = я/2, при которой линейно поляризованная волна может превратиться в волну, поляризованную по кругу. Очевидно, что для равенства амплитуд в двух ортогонально поляризованных волнах плоскость поляризации исходной волны должна составлять угол я/4 с плоскостью чертежа. Здесь уместно поставить вопрос о способах индикации круговой поляризации. Общий метод заключается в том, что круговую поляри- поляризацию излучения преобразуют в линейную, которая обнаруживается обычным способом — вращением поляроида, служащего анализато- анализатором. При линейной поляризации излучения, как известно, свет не пройдет через анализатор, если направление разрешенных колебаний и анализаторе ортогонально плоскости колебаний в исследуемом мучке света. Перевод круговой поляризации в линейную достигается введением при помощи какого-либо устройства дополнительной разности фаз 73
6 r±s я/2 двух волн, поляризованных во взаимно перпендикулярных направлениях. Обычно для этой цели используется пластинка в чет- четверть длины волны (см. §3.1). Призма Френеля фактически также служит устройством, обеспечивающим введение дополнительной раз- разности фаз двух волн, поляризованных во взаимно перпендикулярных направлениях. Такой способ обладает тем преимуществом, что до- достигаемый сдвиг по фазе (в отличие от пластинки в четверть длины волны) мало зависит от длины волны падающего света. Действие призмы Френеля можно исследовать, используя оп- оптическую схему, показанную на рис. 2.18. После прохождения по- поляризатора Рг падающий свет бу- будет линейно поляризован. Вращая Рис. 2.18. Исследование круговой по- анализатор Р2, будем периодически ляризации света, полученной с по- наблюдать полное исчезновение мощью призмы Френеля прошедшего света, что соответст- соответствует определенному направлению линейно поляризованных колебаний, получившихся в результате превращения призмой Френеля линейной поляризации в круговую и повторного превращения в линейную поляризацию в результате действия пластинки в четверть длины волны. Можно также продемон- продемонстрировать всю описанную выше методику в УКВ-диапазоне. Для этого используется большой «ромб Френеля», изготовленный из па- парафина, § 2.5. ОТРАЖЕНИЕ ЭЛЕКТРОМАГНИТНОЙ ВОЛНЫ ОТ ПОВЕРХНОСТИ МЕТАЛЛА При построении физической теории, описывающей отражение элек- электромагнитных волн металлами, необходимо учитывать вторичные волны, обусловленные вынужденными колебаниями свободных элек- электронов, плотность которых внутри металла весьма велика. Такая теория должна быть сугубо квантовой, так как электроны в металле подчи- подчиняются законам не классической, а квантовой физики. Изложение подобной теории далеко выходит за пределы этой книги. Ниже будет показано, что основные оптические свойства метал- металлов могут быть рассмотрены в рамках развиваемой здесь феноменоло- феноменологической теории. Но прежде всего выясним специфичность этой за- задачи. Большинство металлов, как известно, характеризуется высоким коэффициентом отражения. Кроме того, даже в тонком слое металла излучение очень сильно поглощается. Опыт показывает также, что при отражении электромагнитной волны от металлической поверх- поверхности наблюдается эллиптическая поляризация излучения, отсутст- отсутствующая лишь при нормальном падении. Проникновение электромагнитной волны внутрь металла неиз- неизбежно приводит к возникновению тока проводимости j « аЕ и соот- соответствующих потерь на джоулево тепло. Поэтому при построении тео- 74
рии будем, как и прежде, исходить из уравнений Максвелла, но учтем теперь члены, описывающие электропроводность среды (j Ф 0), тогда как при исследовании диэлектриков мы ими пренебрегали. Соотношение между величинами потоков отраженной и поглощен- поглощенной энергий должно зависеть от электропроводности металла а. Опыт показывает, что чем больше электропроводность металла, тем лучше он отражает световые волны (благородные и щелочные металлы служат хорошими отражателями). Хуже проводящие ток металлы характери- характеризуются низким коэффициентом отражения (например, Fe). Потери на джоулево тепло для хорошего проводника должны быть ничтож- ничтожно малыми. Будем называть идеальным (а ->- оо) проводник, ко- который полностью отражает электромагнитную волну (.#->1). В даль- дальнейшем изложении мы уточним это определение. При формулировке основных положений теории необходимо преж- прежде всего учесть наличие поглощения электромагнитной волны, которое ранее никак не учитывалось. При рассмотрении явлений на границе двух диэлектриков мы исходили из соотношения Я + <*Г = 1 и счи- считали, что сумма потоков энергии для отраженной и преломленной волн всегда будет равна потоку падающей энергии. Но любая среда в той или иной степени поглощае* энергию, что неизбежно приведет к за- затуханию электромагнитной волны, амплитуда которой будет постепен- постепенно уменьшаться. Для затухающей волны, распространяющейся вдоль оси Z, можно записать следующее дифференциальное соотношение для интенсивности излучения: dl = — qldz. Отсюда получается зависимость / = /oe~~*z, названная законом Бугера. Она количественно описывает спадание интенсивности излу- излучения по мере его проникновения в поглощающую среду. При записи дифференциального уравнения коэффициент поглощения q считается не зависящим от интенсивности света. Это положение лежит в основе всех обсуждаемых ниже явлений. Справедливость такого линейного приближения доказана множеством самых разных экспериментальных фактов. Лишь при использовании источников света очень большой мощности (лазеров), появившихся в последнее время, возникла не- необходимость учета зависимости q от /, что и послужило одной из причин возникновения нелинейной оптики (см. также § 2.1). ' Введем теперь вместо q величину % = q%/Dri), характеризующую поглощение в каком-либо веществе (в данном случае в металле) излу- излучения с длиной волны Я. Подчеркнем, что К — это длина волны в ис- исследуемом веществе, связанная с длиной волны в вакууме Яо очевидным соотношением Я = Х0/п. Тогда закон Бугера можно записать в виде B.19) Такая запись оказывается более удобной для описания поглощения света металлами. Например, при пк ^ 1 в металле на пути, числен- численно равном длине волны в вакууме (г=%0), интенсивность уменьшит- 75
ся в е4я раз (~ 100 000). Для большинства металлов пк изменяет- изменяется в пределах от 1 до 5. Запишем теперь выражение для напряженности электрического поля Е волны, распространяющейся в каком-либо веществе. Так как /~<£2>, то из B.19) имеем Е=Еоехр\ — ^-пкг\ехри<о (t—-I = B.20, Очевидно, что в этой формуле Ео ехр [ — ~ пкг] играет роль амплитуды затухающей волны и затухание происходит в направлении ее распространения. Теперь сделаем следующий шаг, значение которого станет ясным чуть позже. Введем понятие комплексного показателя преломления п' = п A — Ы). B.21) Если подставить это выражение в общее уравнение затухающей волны B.20), то получится E=E0exp\i2n (J-—^-zX\. B.20a) Это выражение формально представляет собой уравнение плоской волны (амплитуда Ео = const), и мы вправе пользоваться всем арсе- арсеналом полученных ранее формул, заменяя в них действительный ко- коэффициент преломления п комплексной величиной п' = п — шх, действительная часть которой п по-прежнему характеризует преломле- преломление электромагнитной волны, а мнимая часть inn [как это показывает формула B.20)] описывает поглощение радиации. Попытаемся теперь разобраться в смысле такой формальной за- замены. Если п' комплексно, то комплексным будет (при всех углах падения <р, исключая <р = 0) и угол преломления ф2, так как всегда должно соблюдаться равенство sin ф/sin <р2 = п' = п A — in). Таким образом, мы снова приходим к положению, которое разби- разбиралось в предыдущем параграфе, с той разницей, что в данном случае ф2 комплексно при любом ф Ф 0, а не только при ф >> Фпред, как в случае полного внутреннего отражения. Комплексное значение ф2 приведет к тому, что комплексными ока- окажутся амплитуды отраженной и преломленной волн в формулах Фре- Френеля, что, как известно (см. § 1.2), связано с эллиптической поляри- поляризацией излучения. Следовательно, если на металл падает линейно по- поляризованная волна, то как отраженная, так и преломленная волны будут эллиптически поляризованы, что уже упоминалось в начале параграфа при перечислении исходных экспериментальных фактов. Исследование преломленной волны затруднительно, так как она на- 76
цело поглощается в очень тонком слое металла, и поэтому обычно экспериментально изучают волну, отраженную от металла. Этот ме- метод, предложенный в начале XX в. Друде, служит основным спо- способом определения оптических характеристик металла. Идею метода Друде можно сформулировать следующим образом: при отражении электромагнитной волны от поверхности металла полу- получается эллиптически поляризованная волна и поэтому должен возни- возникать отличный от нуля сдвиг фаз б между (Ег)ц и (£i)jl. Измерив б и коэффициент отражения Я при некотором угле падения, определяют значения п и х и затем связывают их с константами среды (а, е) в урав- уравнениях Максвелла. Введение комплексного показателя преломления п' позволяет вос- воспользоваться формулами Френеля, полученными для незатухающих волн. В частности, (£io)ii tg(q>— <p2) -= = рх ехр (*бн), B.22) (Яоо)„ tg(<p + <p2) ri HV "" ' sin((p—ф2) =р2ехр(*б|). B.23) P2 PK ±} (Eoo)± sin(cp + <p2) В общем случае бц ф8±, т. е. имеется сдвиг фаз между двумя ортогональными компонентами вектора Е, приводящий к эллиптиче- эллиптической поляризации волны, отраженной от металла. Отсюда и определяет- определяется б =бц — б±. Для того чтобы наиболее просто проиллюстрировать методику определения коэффициента отражения Лу воспользуемся соотношени- соотношениями, справедливыми при малых углах падения. Для нормального падения плоской волны из вакуума на поверхность диэлектрика было получено Е10/Е00 = (п — 1)/(п +1). Следовательно, для отражения от металла под углом ср, близким к нулю*>, при замене п на п' = п — шх находим соотношение £ю _ (я—1)—/хк /2 24) Еоо ' (n+\)-im Учитывая, что Л есть произведение =^ на сопряженную ей вели- чину (гг2)*, имеем J (Л+1J+(П>СJ Итак, измерив Я и б, можно экспериментально определить дейст- действительную и мнимую части комплексного показателя преломления (величины п и пк). Теперь необходимо связать эти значения со свой- *} Следует учитывать, что если угол <р строго равен нулю, то никакой эл- эллиптической поляризации в отраженной волне не будет. 77
ствами среды, т. е. вычислить константы металла а и е. Для этого обратимся к уравнениям Максвелла 4 JL Ё где j = aE, D = 8E. Как мы помним, операция дифференцирования dldt сводится здесь к умножению на ко. Из уравнения Максвелла с членом, содержащим j Ф 0, находим, что действитель- действительное значение г нужно заменить комплексным: ^> .,.. .^ ж /_ / / / / f ; 11 !■», о i=e——i. B.26) 4жт со v Комплексный показатель пре- преломления п' связан с этим ком- комплексным значением диэлектриче- диэлектрической проницаемости г' соотноше- соотношением п' = YV. Возводя B.21) в квадрат, имеем п* A _ 2Ы — х2) = е — i2o/v. Разделяя действительную и мнимую части, получаем искомую связь оптических констант металла п и п% с его электрическими харак- характеристиками а и г: Рис. 2.19. Зависимость коэффициента отражения серебра от длины волны п2х =5 a/v. Разделив почленно эти уравнения, находим A — у?)Ы = ev/a. B.27) B.28) Это значит, что х-* 1 при а->оо. Вместе с тем из уравнения 0/v получается, что /i-*- oo при 0-> оо. Теперь можно уточ- уточнить понятие «идеального» проводника, установив, что в этом случае и=г1, а->оо и л-^оо. Подставляя /i-voo в уравнение B.25), видим, что действительно в этом случае Я *= 1, т. е. вся энергия от- отражается. Вопрос о границах применимости развитой здесь теории требует детального обсуждения. Прежде всего следует указать на трудности проверки теории, связанные с зависимостью электрических констант металла от частоты падающего света. Имеет смысл рассматривать далекую инфракрасную область, где можно заменить а (V) статиче- статическим значением электропроводности металла. Однако если сравнить эксперимейтальйые значения п2п & 1,5 (см. табл. 2Л) с величиной ah для меди, достигающей 5000 (статическое зяачейие а ж 5 • Ю1*7 с-1), то становится очевидной невозможность использоваййя для видимой области спектра (v ^ 1014 Гц) формул B.27), связывающих оптиче- оптические и электрические константы. Приводимый на рис. 2.19 график показывает, что в видимой (а тем более в ультрафиолетовой^области 7в
Таблица 2.1 Оптические постоянные некоторых металлов Металл Na Ag Cd Al Аи $1 0,97 0,94 0,84 0,83 0,82 n 0,044 0,20 1,13 1,44 0,47 ПК 2,42 3,44 5,01 5,23 2,83 Металл Hg Си Pb Fe Л 0,77 0,71 0,54 0,33 n 1,60 0,62 3,46 1,51 ЛХ 4,80 2,57 3,25 1,63 спектра серебро не может считаться идеальным проводником и лишь для красных и инфракрасных лучей наблюдается удовлетворительное согласие расчета и эксперимента. С зависимостью Я от v связан ха- характерный фиолетовый цвет при наблю- наблюдении на просвет тонких слоев серебра. Рассмотрение данных табл. 2.1 (по- (полученных для % =s 5893 А — желтый свет) показывает, что во многих случаях п <^г 1. Отсюда следует, что фазовая с корость и = с/п в металле больше ско- скорости электромагнитных волн в вакууме. Это нас не должно особенно удивлять, так как хорошо известно, что никаких ограничений для фазовой скорости нет (см. гл. VII). Другое дело, что значе- значение п2 A — и2) =е оказывается отрица- отрицательным. Это не имеет физического смысла и служит прямым доказательст- доказательством некорректности формул B.27) для видимой области спектра. Рис. 2.20, показывающий зависимость от длины волны пин (рассчитанных и экспери- экспериментальных) для серебра, иллюстрирует последний вывод. Для инфракрасной области спектра проверка теории была осуществлена при исследовании потерь на отражение для ряда благородных металлов в спектральной области от 10 до 25 мкм. Нетрудно заметить [см. B.25) и B.27)], что при х=1 и при л>1 потери света при отражении ~ B.29) 79 100 50 го 10 5 0,5 ол 1 • ■ ъ at til ■■ R J / у I / Д j 0,5 Рис. 2.20. Оптические постоян- постоянные серебра в логарифмиче- логарифмическом масштабе в зависимости от длины волны Пунктиром показана теоретическая кривая тс; /, //, /// — эксперимен- 2 тальные кривые -\—г=г» ли пн соот- 1—&ъ ветственно
Так как v ~ JJX, то потери на отражение должны изменяться по за- закону ~ 1/}А,. Из данных табл. 2.2 следует удовлетворительное согласие между приведенными в ней значениями отношения потерь на отражение A — Л^1(\ —Я2) и VQK = /25/12 «1,5. В аналогичных опы- опытах, проведенных в начале XX в., была также исследована зависи- зависимость а (Т), которая, как известно, для не очень низких температур хорошо согласуется с законом а ~ 1/7\ Полученные из оптических измерений значения электропроводности подчинялись этой зависи- зависимости. Таблица 2.2 Металл Ag Pt Аи Си [Потери на отражение для ряда металлов Потери на отражение ^=12 мкм 9,05 10,6 13,8 12,1 9 = 25 мкм 7,07 6,88 8,10 6,67 A .< 1,2 1,5 1,7 1,8 Таким образом, для инфракрасной области спектра наблюдается удовлетворительное согласие теории, развитой Друде, с данными эксперимента, и открывается возможность вычисления а и е по фор- формулам B.27) из экспериментально найденных оптических констант металла п и пк. Следует подчеркнуть, что обратный путь (получение п и пх из измерения а и е) не приводит к успеху, так как в области столь высоких частот отсутствуют достаточно точные методы опреде- определения этих электрических констант, § 2.6. СВЕТОВОЕ ДАВЛЕНИЕ Закончим изложение физических явлений, связанных с отраже- отражением электромагнитной волны, рассмотрением причин возникновения так называемого давления света. Расчет этого весьма общего явления впервые был проведен Максвеллом для случая отражения световой волны от поверхности металла. Экспериментальное подтверждение расчета П. Н. Лебедевым сыграло большую роль в утверждении элек- электромагнитной теории света. Измерение столь малой силы, действующей на отражающую по- поверхность (в яркий солнечный день на 1 м2 земной поверхности дейст- действует сила 0,5 дин), была задачей отнюдь не легкой. Эти трудности усу- 80
гублялись тем, что в годы, когда экспериментировал Лебедев, тех- техника высокого вакуума была развита слабо. При недостаточно высоком разрежении вторичные эффекты (термический и др.) играют большую роль. Достаточно указать, что если наблюдать воздействие света на два помещенных внутри откачанной колбы крылышка, одно из кото- которых сделано блестящим, а второе — зачерненным (именно так часто иллюстрируют явление светового давления), то система начинает вра- вращаться в направлении, противоположном предсказываемому теорией. Это значит, что в данном случае вторичные явления, связанные с ос- остаточным давлением газа, намного превышают истинный эффект. В 1873 г. физик Крукс ошибочно утверждал, что в таком опыте он обнаружил световое давление, существование которого предска- предсказывалось многими учеными начиная с XVII в. Но выполненный Максвеллом в том же году расчет показал, что ожидаемый эффект дол- должен быть на несколько порядков меньше, чем вращающие силы, наблюдавшиеся в этом простом опыте. Теперь хорошо известно, что именно так проявляются «радиометрические» эффекты, обусловленные молекулярной бом- бомбардировкой поверхности, нагретой светом. Лебедев добился успеха благодаря исклю- исключительно продуманной методике и технике эксперимента, при котором «радиометриче- «радиометрические» эффекты были минимальны. Лопасти миниатюрных крылышек с хорошей тепло- теплопроводностью, подвешенных на тонкой квар- кварцевой нити, освещались серией коротких импульсов, и измерялось закручивание нити. Величина светового потока градуировалась с помощью чувствительного термоэлемента. Позднее Лебедев решил еще более сложную задачу, измерив давление света на газы, подтвер- подтвердив тем самым гипотезу о причинах искривления хвостов комет под действием излучения солнца. Легко показать, что при отражении электромагнитной волны от металлической поверхности должна возникать сила светового давления совпадающая по направлению с вектором плотности потока электро- электромагнитной энергии S (рис. 2.21). Для количественного описания этого эффекта нужно воспользоваться формулами Френеля с подстановкой в них комплексных значений диэлектрической проницаемости, ха- характеризующих отражение от металла электромагнитной волны. Такие довольно громоздкие вычисления могут явиться полезным упражне- упражнением для закрепления понятий, введенных в § 2.5. Ниже мы получим выражение для светового давления в самом общем случае. Это про- простой вывод будет базироваться на элементарных представлениях элек- электронной теории. Нетрудно заметить, что эффект светового давления должен на- наблюдаться при отражении электромагнитных волн от любого вещест- вещества или их поглощении в облучаемом образце. Действительно, при всех Рис. 2.21. Возникновение поверхностного тока плотностью j, имеющего то же направление, что и Е близ границы при па- падении световой волны на металл 81
изменениях светового потока должна возникать дополнительная сила, которую можно интерпретировать как давление света. Если исходить из наличия в веществе заряженных частиц (электронов), то мы вправе предположить, что при взаимодействии электромагнитной волны с ве- веществом, приводящем к отражению или поглощению части светового потока, электрическая компонента электромагнитного поля будет раскачивать электрон с силой qE> сообщая ему скорость v. Другая же составляющая электромагнитного поля (Н) будет воздействовать на движущийся заряд с силой Лоренца Af =q [v H]/c. Усреднение за период колебаний приводит к тому, что эффективное действие на движущийся заряд оказывает только эта составляющая силы Лоренца, которая много меньше (v<^c) раскачивающей электрон силы f9n=<7E. B.30) Преобразуем выражение для силы, действующей на электрон, введя единичный вектор нормали к фронту электромагнитной волны п, который в изотропной среде совпадает по направлению с вектором плотности потока электромагнитной энергии S. Очевидно, что Н =» = [п Е], и так как скорость заряда v коллинеарна Е, то (v n) =* 0. Тогда Af=-^[vtnEj] = n-^(vE)=-Ln(f8nv). B.31) с ее Заметим, что произведение силы f9a =* qE на скорость электрона v равно dA/dt — мощности отдаваемой электромагнитной волной элек- электрону: Af = -L п 4*. B.32) с dt v ' Важно отметить, что в выражении B.32) для силы, действующей на электрон, не фигурирует величина его заряда q. Это облегчает реше- решение задачи о действии электромагнитной волны на площадку а9 пол- полностью поглощающую падающее на нее излучение. Будем характеризовать ориентацию рассматриваемой площадки вектором нормали а (рис. 2.22). Очевидно, что в данном случае dA/dt = Stf, a S = cWn. Подставляя эти значения в формулу B.32), имеем Af = Wn (no). B.33) Из этого выражения ясно, что свет оказывает давление на площад- площадку в направлении вектора п, который, как уже указывалось, коллине- арен вектору плотности потока электромагнитной энергии S. Для того чтобы вычислить световое давление р, численно равное нормальной силе, действующей на единичную площадку, надо положить | п | = 1 и (па) = 1. Тогда р = W. B.34) Напомним, что это значение получено в предположении, что пло- площадка а полностью поглощает падающее на нее электромагнитное излучение. 82
Теперь уже не представляет труда вычислить световое давление в самом общем случае. Пусть на площадку о падает излучение, плот- плотность энергии которого W. Площадка частично поглощает это излу- излучение, а частично его отражает. Если обозначить Wx плотность энер- энергии в отраженной волне, то, по опре- определению, Wx = J%W (см. §2.2). Подсчи- Подсчитаем силу Af, -действующую на пло- площадку а. На рис. 2.23 указаны направ- направления векторов п и щ в падающей и Рис. 2.22. Ориентация погло- поглощающей площадки 0, относи- относительно нормали к волновому фронту падающей электромаг- электромагнитной волны Рис. 2.23. Ориентация ча- частично отражающей пла- пластинки а и нормалей к волновым фронтам па- падающей и отраженной электромагнитных волн: S —плоскость падения отраженной волнах и вектор нормали к площадке а. Угол падения <р равен углу отражения <pj. Тогда для силы, действующей на площад- площадку а, получается формула Af = Wn (na) + Wytix (пха). B.35) Для вычисления светового давления р надо найти силу Af при нор- нормальном падении света на единичную площадку. В этом случае п =* = — щ и (nor) = — (ща) — 1. Тогда в согласии с результатами рас- расчета, впервые проведенного Максвеллом, получаем р » W A + Я). B.36) Очевидно, что при полном отражении (например, при отражении от идеального металла) энергетический коэффициент Я = 1 и световое давление определится по формуле р=2№=2^. B.37) с Для полного поглощения Я *= 0. В соответствии с выражением B.34) имеем Таким образом, мы установили, что площадка, полностью отражаю- отражающая падающее на нее излучение, должна испытывать вдвое большее световое давление, чем площадка, полностью поглощающая свет. Сле- Следовательно, имеет смысл постановка опыта, заключающегося в освеще- 83
нии видимым светом вертушкис двумя крылышками, одно из которых посеребрено, а на другое нанесен слой сажи. Сила светового давления, действующая на блестящее крылышко, будет почти в два раза больше, чем на зачерненное, но, как уже указывалось, выявить этот эффект, маскируемый значительно большими радиометрическими силами, от- отнюдь не просто. Как общий вывод из проведенного рассмотрения природы светово- светового давления, следует законность введения понятия импульса электро- электромагнитного поля g, непрерывно распределенного по всему объему,где отличен от нуля вектор плотности потока электромагнитной энергии S. Действительно, будем исходить из формулы B.32), которая для еди- единичной площадки, перпендикулярной направлению распространения волны п, имеет вид Af==_Ln^i==_L# B.38) с dt с х ' Если волна распространяется в вакууме (скорость ее будет с), то за 1 с через единичную площадку пройдет вся энергия, сосредото- сосредоточенная в прямоугольнике, основание которого равно 1 см2, а ребро численно равно с. Следовательно, произведение Af на At = \c будет соответствовать импульсу поля, сосредоточенному в объеме, численно равном с см3. Поэтому средняя плотность импульса электромагнитного поля g=S/c2= -J- [EH]. B.39) Значение этого утверждения в полной мере проявляется в фотон- фотонной теории (см. § 8.5). На данном этапе изложения материала пред- представляется важным подчеркнуть, что существование светового дав- давления и связанного с ним понятия импульса электромагнитного поля может быть доказано в рамках электромагнитной теории света. В последнее время световое давление снова привлекло внимание исследователей. Для экспериментов в этой области оказались весьма удобными некоторые свойства лазеров, а именно монохроматичность излучения и эквивалентность лазера точечному источнику света. В силу этих свойств лазерное излучение может быть сфокусировано с высокой точностью*. При использовании хороших оптических систем (см. § 6.8) можно сфокусировать лазерное излучение в пятно с радиусом того же порядка величины, что и длина волны генерации. Простые оценки показывают, что, если в фокусе лазерного излучения мощностью 1 Вт (такая мощность легко реализуется, например, в аргоновом лазере, генерирующем в зеленой области спектра) ока- оказывается малая частица с массой «10~~12 г, полностью отражающая излучение, то под действием светового давления она должна получить ускорение, в миллион раз превышающее ускорение свободного паде- падения. * В гл. VI будег подробно рассмотрена пространственная когерентность лазера, определяющая его эквивалентность точечному источнику, и указаны особенности фокусировки лазерного излучения. 84
При экспериментальном осуществлении этой идеи, конечно, воз- возникает ряд трудностей. Так, например, исключена возможность ис- использования высокоотражающих металлических частиц, так как даже при коэффициенте отражения М = 98% оставшихся двух процентов поглощенно'й энергии достаточно для сильного нагрева и даже плав- плавления исследуемых объектов. Опыт удалось осуществить*, используя малые сферические прозрачные диэлектрические частицы, помещенные в дистиллированную воду. Хотя в этом случае коэффициент от- отражения мал [R ~ (AftJ; см. § 2.2], силы, действующие на частицы, будут достаточно вели- велики, и удается чисто доказать, что их природа непосредственно связана со световым давлением, а не с вторичными процессами. Другой очень эффектный вариант подобных опытов пред- представлен на рис. 2.24. В этом случае [прозрачная стеклянная сфера диаметром 20 мкм при воздействии на нее лазерного пучка мощностью 250 МВт висит в воздухе над стеклянной пла- пластиной. Хотя частица очень мала и еле заметна невооруженным глазом, в опыте она легко обна- обнаруживается по яркому сиянию, связанному с рассеянием на ней света лазера. Дополнительной трудностью этого опыта явилось прили- прилипание таких частиц к поверхности пластины за счет сил Ван-дер-Вааль- са, величина которых была примерно 104 g. Для разрыва этих сил ис- использовались акустические колебания пластины. Как только частица освобождается от молекулярных сил притяжения, начинается ее движение вверх под действием сил светового давления. В равновесии сила тяжести уравновешивает силу светового давления. В описывае- описываемом эксперименте ярко сияющая частица была взвешена на высоте около 1 см над поверхностью стеклянной пластины. Эти опыты доказывают принципиальную возможность использо- использования давления лазерного излучения для решения многих актуаль- актуальных задач атомной физики, например для ускорения в высоком вакууме малых тел до очень больших скоростей, разделения газов разной массы и в том числе^разных изотопов. Рис. 2.24. Частица, поддерживаемая в воздухе световым давлением верти- вертикального лазерного пучка * См.: УФН, 1973, ПО, вып. 1,с. 101.
ГЛАВА HI ЭЛЕМЕНТЫ ОПТИКИ КРИСТАЛЛОВ В предыдущем изложении предполагалась изотропность среды, в которой распространяются электромагнитные волны. Однако в природе существуют тела, не удовлетворяющие этому требованию. Прохождение света в таких средах сопровождается дополнительными эффектами, рассмотрению которых и посвя- посвящена настоящая глава. Физическая природа наблюдаемых явлений обусловлена взаимодействием световой волны и вещества, анизотропия которого может быть связана с осо- особенностями строения его молекул или, что чаще имеет место, с особенностями кристаллической решетки, в узлах которой находятся атомы или ионы иссле- исследуемого вещества. Взаимодействие света с веществом для большинства кристаллов уже не может быть моделировано колебаниями одного диполя (см. § 1.7), так как в кри- кристаллах осциллирующий электрон связан не только с одним положительным за- зарядом, но и находится в электрическом поле, создаваемом всеми зарядами кри- кристаллической решетки. Для описания таких анизотропных сред необходимо вве- ввести три различных взаимно перпендикулярных осциллятора и характеризовать три взаимно перпендикулярных направления в кристалле различными значе- значениями показателя преломления. Ниже будет показано, что для широкого клас- класса так называемых одноосных кристаллов можно свести описание к колебаниям двух осцилляторов. Такие модельные представления подтверждаются огромным эксперимен- экспериментальным материалом. Так, например, при исследовании кристаллов, обладаю- обладающих высокосимметричной кубической решеткой, отсутствуют оптические эф- эффекты, связанные с различной ориентацией кристалла относительно возбуждаю- возбуждающего пучка света. Однако при внедрении в решетку кубического кристалла ионов какого-либо элемента могут образоваться локальные анизотропные цент- центры. При этом кристалл будет оставаться макроскопически изотропным, но такая сскрытая анизотропия» может быть обнаружена при том или ином анизотропном воздействии (светом, электрическим или магнитным полем, деформацией). Даже полностью изотропное вещество (например, жидкость) может стать анизотроп- анизотропным под воздействием внешних механических или электрических воздействий. Таким образом, оптика кристаллов является весьма специфическим разде- разделом учения о свете, очень важным как по значению, так и по многочисленным приложениям.Подробное описание оптики кристаллов имеется в специальных руководствах. Ияберем следующий план изложения материала: после краткого рассмотрения основных экспериментальных фактов исследуется возможносгь их описания с помощью электромагнитной теории. Изложение строгой теории связано с использованием сложных и громоздких математических построений, и поэтому можно ограничиться формулировкой исходных положений и прове- провести подробное качественное рассмотрение, объясняющее фундаментальные свойства световых волн, распространяющихся в кристалле, а именно: двойное лучепреломление, линейную поляризацию обыкновенного и необыкновенного лучей в двух взаимно перпендикулярных направлениях и возникновение эллип- эллиптической поляризации световой волны при определенной ориентации кристалла относительно падающей на него линейно поляризованной волны. Затем будет кратко охарактеризована методика построения волнового фронта по Гюйгенсу, позволяющая наиболее простым способом определить направление обыкновен- обыкновенного и необыкновенного лучей (см. § 3.3). В заключение будет обсужден вопрос о вращении плоскости поляризации кристаллическими и аморфными телами. 86
§ 3.1. ОПИСАНИЕ ОСНОВНЫХ ЭКСПЕРИМЕНТОВ Фундаментальным свойством световых лучей при их прохождении в кристаллах является двойное лучепреломление, открытое в 1670 г. Бартолином и подробно исследованное Гюйгенсом, опубликовавшим в 1690 г. свой знаменитый «Трактат о свете, в котором изложены при- причины того, что происходит при отражении и преломлении и, в част- частности, при необыкновенном преломлении в кристаллах из Исландии». Двойное лучепреломление в УКВ-диапазоне было открыто лишь в XX в. П. Н. Лебедевым. Это явление играет меньшую роль в раз- различных приложениях, поэтому ограничимся разбором опти- ческих явлений. В качестве основного объекта исследования разумно и по сей й2глггнгг: все кристаллы в той или иной при прохождении через кристалл исланд- степени обладают этим свойст- ского шпата вом. Опыт показывает, что при освещении кристалла исландского шпата узким пучком света в нем возникают два луча, которые со времен Гюйгенса называют обык- обыкновенным и необыкновенным (рис. 3.1). Этот эффект наблюдается и при нормальном падении света на естественную грань кристалла. Для необыкновенного луча показатель преломления пе зависит от на- направления луча в кристалле, тогда как по — показатель преломления обыкновенного луча остается постоянным при любом угле падения световой волны на кристалл. В частности, для исландского шпата (для света с длиной волны % = 5893А — желтый дублет натрия) п0 = 1,658, а 1,486 <пе< 1,658. Следовательно, в данном случае пе ^ ло- Такие кристаллы называют отрицательными. Вместе с тем существует широкий класс веществ (например, кристаллический кварц), для которых пе^п0. Такие кристаллы называют положитель* ными* В любом кристалле имеется направление, в котором отсутствует двойное лучепреломление, т. е. пе = п0. Это направление называется оптической осью кристалла. Любая плоскость, проведенная через опти- оптическую ось, называется главным сечением. В природе существуют одно- одноосные и двуосные кристаллы. Чаще всего в экспериментах используют одноосные кристаллы, к числу которых относятся исландский шпат и кварц. Теоретическое описание прохождения света в одноосных кристаллах также оказывается много проще, и в дальнейшем наше внимание будет сосредоточено главным образом на них. В исландском шпате оптическая ось совпадает по направлению с линией, соединяющей два тупых угла кристалла (естественная грань исландского шпата имеет вид ромба с углами около 102 и 78°). Спи- Спилим эти углы по плоскостям, перпендикулярным оптической оси (рис» 3.2), Пропуская через такой кристалл узкие пучки света, лег- легко убедиться, что двойное лучепреломление всегда отсутствует, если 87
луч п кристалле распространяется параллельно его оптической оси. Следовательно, формулируя понятие оптической оси, имеет смысл говорить о некотором направлении, а не о линии. Оба луча, позликающие в кристалле при двойном лучепреломле- лучепреломлении, полное!ыо поляризованы в двух взаимно перпендикулярных плоскостях. L*iо явление легко продемонстрировать на опыте: пусть спет по кыходс нз кристалла падает на какой-либо анализатор (по- (поляроид, призма Николя). Повернув его на некоторый угол, мы га- гасим один луч и пропускаем второй, а повернув анализатор еще на я/2, полностью пропускаем первый луч и гасим второй. Анализ таких экспериментов показывает, что колебания вектора Е в обыкновенном Рис. 3.2. Прохождение луча параллельно оптиче- оптической оси 00' кристал- кристалла — двойное лучепре- лучепреломление отсутствует Ъшршщ Рис. 3.3. Схема получения цир- кулярно поляризованного света с помощью четвертьволновой пластинки: 00' — оптическая ось пластинки луче перпендикулярны плоскости главного сечения, а в необыкно- необыкновенном луче вектор Е колеблется в плоскости главного сечения* (рис. 3.1). Большой интерес представляет случай распространения световой волны в направлении, перпендикулярном оптической оси кристалла. Как показывает опыт, в этом случае также отсутствует двойное лу- лучепреломление, но дополнительные исследования позволяют устано- установить, что разность показателей преломления \п0 — пе\ оказывается наибольшей. Следовательно, если на кристалл перпендикулярно его оптической оси падает линейно поляризованная волна (в которой Е колеблется не в плоскости главного сечения и не перпендикулярно ей), то в нем в одном и том же направлении будут распространяться две волны с разными скоростями (иг = cln0 и и2 = с/пе), поляризован- поляризованные в двух взаимно перпендикулярных направлениях. В зависимости от толщины пластинки d они выйдут из кристалла с той или иной раз- разностью фаз б. Известно, что если б = 0, я, ..., то результирующей бу- будет линейно поляризованная волна. Во всех остальных случаях долж- должна получиться эллиптически поляризованная волна. Таким образом, имеется еще один способ получения эллиптически поляризованного света, точнее, перевода линейной поляризации в эллиптическую (возникновение эллиптически поляризованной волны при полном внут- * По терминологии, часто используемой в литературе по оптике, «обык- «обыкновенный луч поляризован в плоскости главного сечения». 88
реннем отражении и отражении плоскополяризованного излучения от поверхности металла; см. § 2.4 и 2.5). Рассмотрим несколько подробнее условия получения круговой поляризации, которая, как известно, является частным случаем эллиптической поляризации. Для возникновения циркулярно поля- поляризованного света разность фаз б должна быть равной Bk + 1) я/2. Но, кроме того, должны быть одинаковыми амплитуды двух взаимно перпендикулярных колебаний. Это достигается при определенной ориентации вектора Е в падающей волне относительно оптической оси кристалла. Нетрудно сообразить, что если угол между Е и пло- плоскостью главного сечения равен 45°, то амплитуды обыкновенной и необыкновенной волн одинаковы и при б — Bk + I) я/2 из крис- кристалла выйдет волна, поляризованная по кругу. Именно так работает пластинка в четверть длины волны (рис. 3.3), которую можно исполь- использовать как для превращения линейно поляризованной волны в вол- волну, поляризованную по кругу, так и для обратного перехода, что необходимо при анализе эллиптически поляризованного света (мы уже упоминали о такой методике в § 2.4). Проведем элементарный расчет оптической толщины* такой пластинки. Как указывалось выше, б = Bk + 1) я/2, но вместе с тем б = Bп/Х) (п0 — пе) d, откуда d (п0 - пе) = Bk + 1) А/4, что и объясняет ее название. Такие пластинки изготовляют обычно из кварца, а иногда и из тон- тонких слоев слюды, которая, несмотря на то что является двуосным кри- кристаллом, может быть использована в этих целях. Свойства пластинки Х/4 легко проверить, поместив ее между двумя скрещенными поляри- поляризаторами. Если при вращении анализатора интенсивность прошедшего света не меняется, то толщина подобрана правильно — на выходе из пластинки получается циркулярно поляризованный свет. Добавив еще одну такую пластинку, можно снова перевести круговую поля- поляризацию в линейную, в чем легко убедиться вращением анализатора. В подобных опытах, конечно, должно быть выдержано упомянутое выше условие, т. е. вектор Е в волне, падающей на пластинку, должен составлять угол я/4 с ее плоскостью главного сечения. Это достигается относительным вращением поляризатора и пластинки вок- вокруг направления луча. Здесь следует указать, что если направление колебаний вектора Е в падающей волне совпадает с оптической осью пластинки А/4 (или с направлением, перпендикулярным этой оси), то через пластинку пройдет лишь одна волна. В таком случае из плас- пластинки выйдет линейно поляризованная волна. Очень важно понять, что все эти эффекты наблюдаются при осве- освещении пластинки линейно поляризованным светом. Если освещать ее естественным (неполяризованным) светом, то, конечно, эллиптиче- эллиптической поляризации на выходе не будет. Это совершенно ясно, так как * Учитывая, что скорость электромагнитной волны в веществе и = с/п, легко показать, что запаздывание по фазе будет определяться произведением длины пути d на показатель преломления /г, которое называется оптической длиной пути. 89
Поляризатор Анализатор естественный свет представляет собой излучение, в котором совер- совершенно не скоррелирована разность фаз между взаимно перпендику- перпендикулярными колебаниями. Поэтому внесенние дополнительной разности фаз б ничего не может изменить в его характеристике. Для преобразования эллиптически поляризованного света в ли- линейно поляризованный (а также для превращения линейной поляри- поляризации в эллиптическую с любым заданным значением б) можно при- применять кристаллический клин, определенным образом вырезанный относительно его оптической оси (рис. 3.4). Его использование позво- позволяет скомпенсировать любую разность фаз. Поместив этот клин меж- между двумя поляризаторами и осветив его точечным источни- источником света, получаем на выходе систему темных полос, парал- параллельных его преломляющей гра- грани и соответствующих значению б — kn. Введя после клина пла- пластинку А/4, наблюдаем сдвиг полос. При освещении клина протяженным источником света необходимо установить допол- дополнительную линзу, фокусирую- фокусирующую на экран полосы, локали- локализованные на поверхности клина. Этот опыт позволяет понять дей- действие устройств, применяемых для измерения степени эллиптичности излучения (так называемых компенсаторов). Обычно используются два таких клина, которые сложены вместе по скошенным плоскостям и могут перемещаться один относительно другого, создавая требуемую разность фаз б между двумя волнами, поляризованными во взаимно перпендику- перпендикулярных плоскостях. Перемещающиеся один относительно другого клинья эквивалентны пластинке переменной толщины. Рассмотрим более подробно вопрос об интенсивности плоскопо- ляризованного света, прошедшего через произвольную кристалли- кристаллическую пластинку. Обозначим через ВВ' направление колебаний вектора Ев обыкновенном луче (рис. 3.5). Тогда 00' будет направле- направлением колебаний Е в необыкновенном луче. Очевидно, что ОО'Л-ВВ' и лежит в плоскости главного сечения кристалла. Пусть на кристалл падает плоская волна, в которой направление колебаний АА' вектора Е составляет угол а с ВВ'. Тогда, обозначая через (Е0)о и (Е0)е ам- амплитуды колебаний векторов Е в обыкновенной и необыкновенной волнах, имеем: (Е0)о = (£0)пад cos а, (Е0)е = (£0)Пад sin a. Учитывая, что интенсивность света / определяется квадратом амплитуды колебаний, получаем: Рис. 3.4. Схема измерения эллиптиче- эллиптической поляризации с помощью клина. Внизу система из двух клиньев, часто исполь- используемая в компенсаторах. Оптические оси поля- поляризатора АА' и клина 00' находятся под уг- углом друг к другу I* — cos2 ее, 19 /пад sin8 a. 90
Следовательно, гпад* (ЗЛ) Отношение I0IIe зависит от угла а. Через каждые я/2 или /0, или 1е обращается в нуль. Эти соотношения названы правилами Малю, и их можно эффектно продемонстрировать в опыте, схема которого представлена на рис. 3.6. Вращая поляризатор относительно крис- кристалла и подобрав диаметр исходного пучка света так, чтобы при дан- данной толщине кристалла пучки частично перекрывались, будем на- Рис. 3.5. К выводу правил Малю Поляризатор Рис. 3.6. Опыт, иллюстрирующий правила Малю блюдать постоянную интенсивность в области перекрывающихся пучков и резкое изменение относительной интенсивности пятен при вращении кристалла относительно поляризатора. В эксперименте используют приборы и приспособления для по- получения поляризованного света, основанные на изложенных выше свойствах. К числу таких устройств относится призма Николя (рис. 3.7), выделяющая один из поляризован- поляризованных лучей, тогда как второй поглощается за- зачерненными стенками или выводится из при- прибора, что полезно при работе с большими пото- потоками света (рис. 3.7, а). Призму Николя изго- изготовляют из специально вырезанного кристалла исландского шпата, разрезанного и затем склеен- склеенного канадским бальзамом — веществом, про- прозрачным для видимого света, с показателем преломления як. б « 1,55, удовлетворяющим соотношению пе < пк. б < п0. При выбранной геометрии призмы Николя и подходящем угле падения обыкновенный луч испытывает в слое бальзама полное внутреннее отражение, а необыкновенный луч прохо- проходит через призму. Призма Николя служит превосходным поляризато- поляризатором (вышедший луч полностью поляризован), но большие высококаче- высококачественные кристаллы исландского шпата являются редкостью и изго- изготовление такого прибора достаточно большого сечения очень дорого. Кроме того, канадский бальзам поглощает ультрафиолетовое излуче- излучение, и в качестве поляризаторов в ультрафиолете обычно используют призмы Волластона (рис. 3.7, б), также изготовленные из исланд- екого шпата, но без склейки канадским бальзамом» Направления оп- оптических осей в двух кусках исландского шпата, из которых состоит В) Рис. 3.7. Призмы Ни- Николя (а) и Волласто- Волластона (б) 91
Рис. 3.8. К анизотропии, возникающей при дефор- деформации прозрачного изотропного тела такая двоякопреломляющая призма, ортогональны. Поэтому внутри призмы обыкновенный и необыкновенный лучи расходятся и выходят из нее под разными углами (рис. 3.7, б). Таким образом, получаются два расходящихся луча, поляризованных во взаимно перпендикуляр- перпендикулярных направлениях. Напоминаем, что из призмы Николя (рис. 3.7, а) выходит один полностью поляризованный луч. Кроме описанных существуют также поляризаторы, в которых ис- используется явление дихроизма — избирательное поглощение некото- некоторыми кристаллами света определенной поляризации. Наиболее из- известный кристалл такого рода — турмалин, в котором практически нацело поглощается обыкновенный луч, а необыкновенный луч опре- определенного спектрально- спектрального состава (желто-зеле- (желто-зеленая область спектра) проходит. Поэтому тур- турмалин является не толь- только поляризатором, но и своеобразным свето- светофильтром. Дихроизм — довольно сложное явле- явление и здесь не обсуж- обсуждается. Заметим, что наиболее важны его приложения при изго- изготовлении поляроидов, которые нашли широкое применение в науке и технике. Поляроид представляет собой тонкую пленку из множест- множества мелких и очень дихроичных кристаллов, нанесенную на целлулоид или какую-либо другую прозрачную подложку. Таким образом, удается получить большие листы, практически нацело поляризующие свет почти во всей видимой области спектра; лишь для фиолетовых и красных лучей степень поляризации сравнительно невелика. В заключение вернемся к качественной характеристике природы явлений, приводящих к возникновению двойного лучепреломления и других особенностей распространения света в кристаллах. Очевидно, что анизотропия среды служит тем основным физическим свойством, которое и обусловило рассмотренные экспериментальные факты. Но, по-видимому, следует говорить об анизотропии как о каком-то интегральном эффекте, связанном с упорядоченным расположением молекул, а не об асимметрии самих молекул, которая должна усред- усредниться при их хаотическом расположении и в общем случае не может привести к возникновению преимущественных направлений в изу- изучаемом веществе. Как уже указывалось, внешним воздействием изотропное тело можно сделать анизотропным. Следовательно, можно искусственно создать двоякопреломляющую среду. Ниже излагаются два наиболее характерных способа получения искусственного двойного луче- лучепреломления. 1. Анизотропия при деформациях. Если подвергнуть какое-либо прозрачное тело сжатию (или растяжению), то в результате такого 92
Рис. 3.9. Картины, создаваемые механическими напряжениями в стекле при освещении его по- поляризованным светом Закаленный стеклянный кубик между парал- параллельно установленными поляроидами (а) и ме- между перпендикулярно установленными поля- поляроидами (б) воздействия образуется своеоГ азный «квазикристалл», оптическая ось которого проходит в направлении сжатия (растяжения). Симмет- Симметрия всех свойств вещества в плоскости, перпендикулярной направ- направлению сжатия, совершенно очевидна, поэтому в данном случае имеет смысл говорить о возникновении одноосного квазикристалла. Это явление легко наблюдать на опыте, схема которого приведена на рис. 3.8. Через тело, подвергшееся сжатию, пропускают свет в на- направлении, перпендикулярном образовавшейся оптической оси; сле- следовательно, в нем должна возникнуть эллиптическая поляризация. Для измерения An в схему введена пластинка в четверть длины волны, а колебания вектора Е, про- пропущенные поляризатором Рг и анализатором Р2» должны составлять угол я/4 с осью квазикристалла. Оказывается, 4TOj An <^ F, где F — сила натяжения, возникающего в веществе. Следовательно, измеряя An, можно оценить нагруз- нагрузку, действующую на иссле- исследуемое тело. Это позволяет создать оптический метод исследования напряжений в различных системах. Конечно, он пригоден лишь для прозрачных тел, но позволяет моделировать механическую систему и оценивать напряжение в различных ее частях. Оптический метод также широко используется для исследования напряжений в оптическом стекле, возникающих при его изготовлении. Все детали "ответственных опти- оптических узлов, как правило, просвечивают поляризованным светом для обнаружения в них возможных остаточных напряжений. На рис. 3.9 проиллюстрированы поляризационные опыты со стеклами, в которых натяжения образовались при термической обработке. Разность An = пе — по оказывается зависящей от длины волны, и при осве- освещении таких стекол немонохроматическим излучением картина в по- поляризованном свете получается разноцветной. 2. Анизотропия в электрическом поле. Возникновение анизотро- анизотропии в электрическом поле было обнаружено Керром в 1875 г. и с тех пор широко используется в технике эксперимента. В настоящее время явление Керра хорошо исследовано как экспериментально, так и тео- теоретически. Это оказалось возможным благодаря тому, что эффект наблюдается в веществах, находящихся в жидком и даже газообразном состоянии, а их изучение несравненно проще изучения твердого тела. Схема опыта относительно проста (рис. 3.10). Между двумя скрещен- скрещенными поляризаторами Рг и Р2 располагают плоский конденсатор. Между пластинами конденсатора помещают кювету с жидким нитро- нитробензолом — веществом, в котором изучаемый эффект весьма велик. 93
При включении напряжения происходит поляризация молекул нитробензола и их выстраивание. Тем самым создается анизотро- анизотропия вещества с преимущественным направлением (оптической осью квазикристалла) вдоль электрического поля. Так же как и при меха- механической деформации, излучение становится эллиптически поляри- поляризованным и частично проходит через второй поляризатор, скрещенный с первым, т. е. установленный так, чтобы не пропускать линейно поляризованный свет. Опыт дает An = пв — по = /СЕ2, где К — некая константа, как правило, положительная. Однако для некото- некоторых веществ К оказывается меньше 0 (это значит, что по > пе, т. е. образуется «отри- «отрицательный» квазикристалл). ~г у Рг Рис. 3.10. Схема опыта с ячейкой Керра Рис. 3.11. Схема измерения инерци- инерционности ячейки Керра Такой эффект был объяснен Борном, дополнившим исходную теорию явления, развитую Ланжевеном. В теории Ланжевена предпо- предполагалось возникновение и выстраивание наведенных электрическим полем (индуцированных) дипольных моментов, тогда как в допол- дополнении Борна учитывалась также ориентация постоянных дипольных моментов, которыми обладают некоторые жидкости. Знак постоянной Керра обусловлен относительной ролью этих двух физических про- процессов. Абсолютное значение константы К характеризует пригодность данного вещества к использованию его в ячейке Керра. Обычно по- постоянной Керра называют эту величину, выраженную в длинах волн, т. е. К1%. Она заметно уменьшается с повышением температуры жид- жидкости, так как тепловое движение молекул препятствует их ориента- ориентации. Для нитробензола она достаточно велика — эффект легко на- наблюдается при подаче на конденсатор импульса напряжения с амп- амплитудой в несколько сотен вольт. Наблюдение эффекта Керра в дру- других жидкостях (а особенно в газах) требует использования значитель- значительно большей напряженности электрического поля. Наиболее важной особенностью эффекта Керра, обусловившей ши- широкое его применение, является весьма малая инерционность. Это свой- свойство ячейки Керра проверялось в остроумных опытах (схема опытов изображена на рис. 3.11), а в последующем детально исследовалось в большом числе экспериментов. Источник света (конденсированная искра) и конденсатор Керра получают напряжение от одного источ- источника тока. Как только произошел пробой газа между электродами 94
(искра) и возник связанный с этим пробоем импульс света, начинает постепенно исчезать эффект Керра, что вызвано релаксацией диполь- ных моментов молекул. Системой зеркал можно удлинить путь от ис- источника света до ячейки Керра. Опыты показали, что, пока свет проходит расстояние 400 см, все следы двойного лучепреломления успевают исчезнуть. Отсюда была найдена инерционность процесса, характеризуемая средним временем т ^ 10~8 с. В последующих прецизионных опытах было учтено время пробоя газа и была уста- установлена еще меньшая инерционность эффекта (т < 10~9 с). Таким образом, открылась возможность создания практически безынерцион- безынерционного оптического затвора и тем самым были зало ены основы физики очень быстрых процессов («ианосекундная техника»; 1 не = 10~9 с). За последнее время эта техника приобрела особое значение в связи с возможностью получения очень больших мощностей светового потока в лазерах. Действительно, если возбудить в твердотельном лазере импульс света с энергией ~10 Дж и продолжительностью ~10~8 с, то мощность такого импульса составит 10 кВт. Если же с помощью какого-либо быстродействующего устройства (например, ячейки Керра) заставить высветиться эту систему за время порядка 10~8 с, то мощность импульса составит уже 1 ГВт. Такие «гигантские импульсы» обладают некоторыми совершенно новыми физическими свойствами. Использование подобных сверхмощных световых пото- потоков играет большую роль в области бурно развивающейся нелиней- нелинейной оптики, а также при решении различных технических задач. § 3.2. РАСПРОСТРАНЕНИЕ ЭЛЕКТРОМАГНИТНОЙ ВОЛНЫ В АНИЗОТРОПНОЙ СРЕДЕ Для анизотропного диэлектрика становится неверной простая зависимость D = еЕ (е — скалярная величина), которой пользуют- пользуются при описании любой изотропной среды. В этом случае связь между векторами D и Е задают более сложным соотношением, в которое вхо- входит так называемый тензор диэлектрической проницаемости. Оно записывается следующим образом: D2 ~ гпЕх + еа2£2 Отсюда следует, что в данном случае векторы D и Е не коллинеарны. Существует ряд обстоятельств, позволяющих упростить эти соотно- соотношения в оптике кристаллов. Так, например, из выражения для элект- электрической энергии единицы объема, которая, по определению, равна №эл = ED/(8rc), можно при учете закона сохранения энергии получить симметричность составляющих тензора диэлектрической проницае- проницаемости (т, е. eih === eki). Нетрудно доказать, что для любого кристалла 95
можно найти таких три главных направления, для которых (если иыбрлть их за оси координат XYZ) справедливы соотношения* ®х == ^x^xf Dy = &уЕу, и г = &ZEZ9 причем в общем случае гхФ еу Ф ez. Рис. 3.12 иллюстрирует неколлинеарность векторов Е и D, имеющую место в данном случае. В выбранных таким образом координатах XYZ выполняется соот- соотношение S**2 + ЧУ* + гг** = const- C-3) Это есть уравнение некоего эллипсоида, который называют эллипсоидом Френеля. Используя равенство п = "j/e, можно записать уравнение эллипсоида в виде C.4) Формула C.4) показывает, что главные оси эллипсоида Френеля представляют собой обратные величины по отношению к трем главным показателям преломления пх> пуу nz. Из геометрии известно, что лю- ж z? 0' Рис. 3.12. Неколлинеар- Неколлинеарность векторов Е и D в анизотропной среде Рис. 3.13. Эллипсоид Фре- Френеля для двухосного кри- кристалла: О'О' и О"О" — оптические оси кристалла бой эллипсоид имеет два круговых сечения (рис. 3.13). Направле- Направления, перпендикулярные таким круговым сечениям, называют опти- оптическими осями кристалла, который в общем случае дожен быть двуос- ным. Если справедливо равенство гг = гу Ф &х, то эллипсоид Френе- Френеля вырождается в эллипсоид вращения, характеризующий одноосный кристалл, единственная оптическая ось которого совпадает с осью X. * В математике эту операцию называют диагонализацией матрицы (ех О О \ 8= 0 гу О . \0 0 eJ 96
В ^ П были обсуждены основные оптические свойства таких кристал- лоA и простые способы определения этого преимущественного направ- направления в кристалле. Сформулируем следствия из уравнений Максвелла для непрово- непроводящей анизотропной среды, где связь между векторами D и Е зада- 101 с помощью указанной выше диагональной матрицы C.5) Пудем считать \i ~ 1, т. е. В -= Н, что соответствует опытным данным по распространению света в кристаллах. Тогда уравнения Млксвелла примут вид rotE = - ——. rot H =-*-££. C.6) с dt с dt Ищем решение этих уравнений, записав выражение для напряжен- напряженности электрического поля в виде Е=Еоехр|"ко U— ^)] = Еоехр Г/ю (t—~ ")] = C.7) Здесь кх — единичный вектор нормали к волновому фронту (кх = = к/А, где k = 2п/к). В изотропной среде этот вектор совпадал с на- направлением вектора потока энергии S = ^ [ЕН]. Аналогичное выражение можно получить и для вектора Н. Напом- Напомним, что D = Do ехр [/о) (/ — кхг/^)], где Do не совпадает по направ- направлению с Ео. Считая, что плотность свободных зарядов внутри крис- кристалла равна нулю, имеем div D ■== 0, тогда как div Е = -jp + + "а/ "Ь 7 не обращается в нуль, поскольку Е не коллинеарен D. При решении уравнений Максвелла C.6) учтем, что для плоской волны дифференцирование по времени и координатам сводится к сле- следующим операциям: dt дх с х Toi да Вместе с тем 97
Аналогично, для уравнения rot Н = — -%- имеем: С ОЕ (rot Н), = -ш SL (klyHz - kizHy), (rot W)x = I i®Dx. В векторной форме приведенные выше соотношения можно запи- записать в виде п[Екг]= — Н, /iIHkJ^D. C.8) Отсюда следует, что вектор klf характеризующий направление нормали к волновому фронту, перпендикулярен векторам Н и D. Вместе с тем вектор S = ^ [ЕН], определяющий направление рас- распространения потока энергии, перпендикулярен векторам Е и Н и не совпадает с направлением кь так как известно, что D и Е не коллинеарны. Рис. 3.14 иллюстрирует эти следствия решения уравнений Максвелла. Следовательно, при распро- распространении электромагнитной волны в кристалле фазовая скорость и (направленная по кг) и группо- групповая скорость U (совпадающая по направлению с Рис. 3.14. Перпен- вектором S) различаются по направлению. Вместе дикуляр к фронту с тем вектор е, оставаясь перпендикулярным Н, ВОЛНЫ В КрИСТЭЛЛе ki не совпадает с не перпендикулярен направлению распростране- направлением рас- ния фазы волны — вектору кг. В этом смысле пространения энер- волна в кристалле не является строго поперечной, гии s так как имеется отличная от нуля проекция векто- вектора Е на направление кг и соответственно проек- проекция вектора D на направление S. Лишь при распространении волны вдоль одного из главных направлений (когда вектор кг совпадает с одним из главных направлений кристалла, которые были приняты выше за оси координат) вектор D коллинеарен вектору Е. Заметим, что проведенные преобразования позволяют в общем виде решить задачу о распространении электромагнитной волны в кристал- кристалле. Действительно, комбинируя оба решения уравнений Максвелла, имеем D = — п2 HEkJ kj = п2 (Е — кг (EkJ). C.9) Решая это уравнение совместно с D = (е) Е, можно получить в яв- явном виде искомую матрицу е и далее записать формулы Френеля и все другие соотношения для данного случая. Не будем заниматься этими очень трудоемкими и сложными выкладками*, а разберем лишь некоторые основные задачи, связанные с распространением электрома- электромагнитных волн в кристаллах. На базе введенных понятий докажем возникновение эллиптической поляризации у преломленной волны в кристалле, определенным образом ориентированном по отношению к падающей линейно поляри- поляризованной волне. Рассмотрим распространение электромагнитной вол- * См.: Зоммерфельд А. Оптика. М., ИЛ, 1953, гл. IV.
ны вдоль одного из главйых направлений кристалла, которое совмес- совместим с осью Z. В зависимости от ориентации вектора Е в падающй вол- волне относительно двух других главных направлений (X и Y) получа- получается два различных результата: 1) пусть вектор Е в падающей волне направлен вдоль одного из главных направлений кристалла, например вдоль оси X (рис. 3.15). Тогда для падающей на кристалл волны имеем Е = £х =- ReEOx ехр [/со (/ — zlu)]. В кристалле D = Dx и Dx = &ХЕХ. Следовательно в нем возник- возникнет волна, в которой колебания вектора Е' будут также направлены вдоль оси X. Она будет распространяться в кристалле со скоростью и' = с/Угх, а ее уравнение имеет вид E' = ReE'Oxexpli(s>{t—2/u')]. C.10a) Совершенно аналогичные рассуждения приводят к выводу, что если вектор Е в падающей волне направлен вдоль оси Y, то в кристал- кристалле будет распространяться со скоростью и" = с/^Ву волна, в кото- которой вектор напряженности электрического поля Е" будет колебаться вдоль оси Y. Уравнение этой волны E"=ReE'byexp[i(o(t—z/u")]\ C.106) 2) пусть вектор Е в падающей волне лежит в плоскости XY и составляет угол а с осью X (рис. 3.15). Разложим исходное колебание Е на два — одно по оси X, другое по оси Y. Тогда в кристалле будут распространяться с разными скоростями (и' Ф и"), но в одном направ- направлении (ось Z) две волны, поляризованные в двух взаимно перпендику- перпендикулярных направлениях. В зависимости от толщины пластинки d будет возникать различная разность фаз б между этими двумя колебаниями, и, следовательно, на выходе получится эллиптически поляризованная волна, которая лишь при б = 0, я, 2я, ... превращается в линейно поляризованную. При б = Bk + 1) я/2 и а = я/4 удовлетворяются условия возникновения круговой поляризации, которая реализуется на опыте при прохождении света через определенным образом ориенти- ориентированную пластинку с оптической толщиной Я/4 (см. § 3.1). Становит- Становится понятным также, почему при некоторых ориентациях пластинки Я/4 на выходе снова получается линейно поляризованная волна — это соответствует случаю Е — Ех или Е = Еу. Столь же просто можно пояснить возникновение двойного лучепре- лучепреломления в кристаллах. Для наглядности исследуем одноосный крис- кристалл, хотя тот же результат легко получить и в общем случае. Пусть из воздуха на кристалл под углом <р падает пучок естествен- естественного (неполяризованного) света. Выберем оси координат XYZ так, как показано на рис. 3.16. Ось X перпендикулярна плоскости рисун- рисунка, а оси Y и Z лежат в этой плоскости. Нормаль к падающей волне i акже лежит в плоскости YZ. Пусть для этого одноосного кристалла г,у = ez ф вх. Введем следующие обозначения: &х = ге> гу = гг = е0. '1* 99
Замейим падающую волну двумя плоскими волнами (их фазы никак не скоррелированы), причем в одном случае (рис. 3.16, а) вектор Е в падающей волне колеблется вдоль оси X, ав другом (рис. 3.16, б) он лежит в плоскости YZ. Очевидно, что в кристалле также будут распространяться две волны — в одной из них вектор Е колеблется вдоль оси X, а в другой — в плоскости YZ. Запишем для этих двух волн следующие очевидные соотношения: (a) (б) Так как е0 Ф ее, то <р'2 Ф q>J, т. е. преломленные лучи поляризо- поляризованы во взаимно перпендикулярных плоскостях и распространяются в кристалле в двух разных направлениях. Следовательно, если на ОС IE! V Рис. 3.15. К возникновению эллипти- Рис. 3.16. К объяснению двойного лу- ческой поляризации при прохождении чепреломления по электромагнитной света вдоль одного из главных напра- теории (ф2 Ф Фг) влений кристалла * кристалл падает естественный (неполяризованный) свет, то в нем про- произойдет разложение исходного пучка света на два непараллельных пучка, каждый из которых полностью линейно поляризован. Конечно, проведенное рассмотрение нельзя считать строгим дока- доказательством. Исследован лишь частный случай, позволяющий пред- представить себе изучаемые закономерности в наиболее простой форме. Более общее исследование можно выполнить методом краевых зна- значений, использованным при выводе уравнений Френеля. Это позво- позволяет не только доказать наличие двойного лучепреломления в крис- кристалле, но и вычислить амплитуды обыкновенной и необыкновенной волн. Мы упоминаем об этом опущенном в изложении выводе, чтобы сделать одно весьма общее заключение. Электромагнитная теория объясняет все свойства световых волн в кристалле, а именно: направ- направление распространения преломленных волн, их поляризацию и отно- отношение амплитуд обыкновенной и необыкновенной волн к амплитуде падающей волны. Электромагнитная теория дает также методику опре- определения этих характеристик. Пусть известны свойства исследуемого кристалла, т. е. можно построить эллипсоид Френеля, а также более удобный для орпеделения показателей преломления «обратный эллип- 100
ооид»*. Зададим направление падающей волны и проведем сечейие обратного эллипсоида, перпендикулярное этому направлению. Тогда длины полуосей получившегося эллипса позволяют найти соответст- соответствующие показатели преломления, а направление полуосей эллипса укажет разрешенные направления колебаний в кристалле и тем самым определит поляризацию двух возникших в кристалле плоских волн. Однако для решения конкретных задач кристаллооптики обычно поль- пользуются удобными и наглядными построениями Гюйгенса. § 3.3. ПОСТРОЕНИЕ ГЮЙГЕНСА Большой заслугой Гюйгенса является создание стройной теории прохождения световой волны через кристалл, объясняющей возник- возникновение двойного лучепреломления. Примененный им метод прост и нагляден, а как способ определения направления обыкновенного и необыкновенного лучей сохранил свое значение и по сей день. Его теория базируется на предположении о наличии у волны в кристалле двух волновых поверхностей. Скорость обыкновенной волны и0 = с/п0 одинакова во всех направлениях (ей должна соот- соответствовать сферическая волновая поверхность). Скорость необыкно- необыкновенной волны ие = с/пе зависит от направления ее распространения. Она совпадает по значению с и0 в направлении оптической оси крис- кристалла и больше всего отличается от и0 в направлении, перпендику- перпендикулярном оптической оси. Волновая поверхность необыкновенной волны для одноосного кристалла имеет вид эллипсоида вращения, который в направлении оптической оси должен касаться сферической волновой поверхности обыкновенной волны. Для отрицательного кристалла по ^ пе> следовательно, и0 ^ ие> т. е. шар вписан в эллипсоид вра- вращения. Для положительного кристалла и0 ^ ие и волновая поверх- поверхность обыкновенной волны (шар) охватывает волновую поверхность необыкновенной волны (эллипсоид вращения). На рис. 3.17 пред- представлены оба этих случая. В основе объяснения двойного лучепреломления лежит принцип Гюйгенса, в котором постулируется, что каждая точка, до которой доходит световое возбуждение, может рассматриваться как центр соответствующих вторичных волн. Для определения волнового фрон- фронта распространяющейся волны в последующие моменты времени сле- следует построить огибающую этих вторичных волн. В случае перехода света из одной изотропной среды в другую построение Гюйгенса предельно просто (рис. 3.18). Строится плоский фронт ОА падающей волны в тот момент времени, когда часть его в точке О дошла до границы раздела. Далее из точки О проводится полуокружность радиусом ОС = u2kt (где At — время, которое * Уравнение обратного эллипсоида (иногда его называют эллипсоидом индексов) 101 пх пу пг Вывод см. в кн.: Зоммерфельд А. Оптика. М, ИЛ, 1953, § 24.
должна была затратить волна, чтобы пройти путь А В в первой среде). Очевидно, что А В =ихМ и ОС =*^АВ. Ту же операцию можно повторить для точек О', О" и т. д. Огибающей всех этих полуокруж- полуокружностей служит прямая BD, перпендикуляр к которой (луч) состав- составляет угол ф2 с нормалью к границе раздела. Отсюда получаются за- законы отражения и преломления световых волн, и, следовательно, из принципа Гюйгенса можно вывести законы геометрической оптики. Вопрос о том, почему этот принцип (без дополнений, сделанных Фре- Френелем) нельзя положить в основу волновой оптики, будет подробно рассмотрен в гл. VI. Рис. 3.17. Волновые поверхности в от- отрицательном (а) (по^Пе) и положи- положительном (б) (по^Пе) кристаллах Рис. 3.18. Построение Гюйгенса для изотропной среды Такую же методику построения волнового фронта можно приме- применить для описания перехода волны из изотропной среды в анизо- анизотропную. Если для исследуемого кристалла известно направление оптической оси, то построение в нем двух волновых поверхностей (обыкновенной и необыкновенной) не представит труда. На рис. 3.19 выполнено такое построение для волны, падающей под некоторым углом <р на плоскую поверхность отрицательного кри- кристалла, вырезанного так, чтобы его оптическая ось была параллельна границе раздела. Касательные к волновым поверхностям определят волновые фронты обыкновенной и необыкновенной волн, направление распространения которых характеризуется векторами к0 и ке. На- Направление потока энергии для обеих волн тоже показано на рисунке (лучи о и е), причем, как мы видим, необыкновенный луч не перпен- перпендикулярен волновому фронту. Следовательно, можно сделать очевидные заключения: 1) в кристалле происходит двойное лучепреломление. Построение Гюйгенса позволяет определить направления распространения обыкно- обыкновенного и необыкновенного лучей; 2) направление необыкновенного луча и направление нормали к соответствующему волновому фронту не совпадают. Приведем еще одно построение для случая нормального падения световой золны на естественную грань кристалла исландского шпата (рис. 3.20). Здесь волновые фронты обыкновенной и необыкновенной 102
волн совпадают, а направления лучей различаются, поскольку двой- двойное лучепреломление имеется и в этом случае. Двумя приведенными примерами можно ограничиться для иллю- иллюстрации столь простого и удобного метода построения волнового фронта и определения направлений обыкновенного и необыкновенного лучей. При построении Гюйгенса наглядно выявляется несовпадение необыкновенного луча с нормалью к волновому фронту в кристалле. Но при общей характеристике метода Гюйгенса необходимо учитывать его недостаточность по сравнению с электромагнитной теорией света. В самом деле, теория Гюйгенса: 1) требует дополнения не выте- вытекающими из нее положениями о направлении поляризации обыкно- венной и необыкновенной волн; Рис. 3.19. Построение Гюйген- Гюйгенса для анизотропной среды Поверхность кристалла параллельна оптической оси Рис. 3.20. Построение Гюйгенса для нормального падения свето- световой волны на естественную грань кристалла исландского шпата: 00' — оптическая ось кристалла 2) не решает вопроса об отношении амплитуд падающей, отражен- отраженной и преломленной волн; 3) несмотря на простоту и наглядность построения Гюйгенса, корректность подобного метода (как указывает А. Зоммерфельд) тре- требует дополнительного исследования. В частности, лишь в XIX в. была доказана возможность замены расходящегося пучка системой плоских волн. В целом в современной физике построение Гюйгенса может рас- рассматриваться как следствие электромагнитной теории света, сущест- существенно облегчающее ее применение для решения многих конкретных задач (см. § 6.2). § 3.4. ВРАЩЕНИЕ ПЛОСКОСТИ ПОЛЯРИЗАЦИИ Вещества, обладающие способностью вращать плоскость поляри- поляризации, называют оптически активными. Этот эффект наблюдается у ряда кристаллических и аморфных тел. Начнем наше рассмотрение с анализа экспериментального материала. 1. Опыты с кварцем. Классическим объектом для демонстрации вращения плоскости поляризации служит одноосный кристалл. Схема 103
опыт представлена на рис. 3.21. Поляризатор и анализатор установ- установлены так, что они не пропускают излучения (скрещены). После введе- введения пластинки кварца толщиной d поле просветляется. Свет распрост- распространяется вдоль оптической оси кварца, и, следовательно, двойное лучепреломление отсутствует. Повернув анализатор на угол ср, снова получаем темноту, что доказывает наличие в данном случае именно поворота плоскости поляризации, а не какого-то другого явления (например, при возникновении эллиптической поляризации было бы невозможно погасить свет вращением анализатора). Опыт показыва- показывает, что разные образцы кварца вращают плоскость поляризации вправо или влево (если смотреть навстречу светово- световому лучу). Таким образом, различают правое вращение (по часовой стрелке) и левое ера- щение (против часовой стрелки). Не пытаясь пока объяснить этот процесс, укажем, что s- Шрц Р, Рис. 3 21. Схема опыта по изу- изучению вращения плоскости по- поляризации кварца: 00' — оптическая ось кристалла Рис. 3.22. Правовращаю- Правовращающий и левовра- щающий кри- кристаллы кварца кристаллы правовращающего и левовращающего кварца огличаются по своей форме и являются зеркальным отображением друг друга (рис. 3.22). Опыт дает <р = ad, причем коэффициент a ~ 1М,2, т. е. сильно зависит от длины волны падающего на кристалл света. (Так, при d = 1 мм имеем Фжелт ^ 20°, а ФфИ0Л « 50°.) Следовательно, вра- вращение плоскости поляризации света кварцем — это эффект, который легко наблюдается. 2. Опыты с аморфными веществами (сахар, камфора, патока, никотин и др.). Опыт ставится так же, как и в предыдущем случае, но вместо кварца между поляризаторами вводят кювету с оптически активным веществом. Если обозначить длину кюветы через d, а кон- концентрацию вещества — через с\ то из опыта получается <р = [a] dc\ где [а] — постоянная вращения для данного вещества, сильно завися- зависящая от длины волны ([а] ~ 1/Я2) и слабо — от температуры образца. Постоянная вращения [а] практически не зависит от агрегатного сос- состояния вещества. Подобные опыты лежат в основе метода определения кооцентрации оптически активного вещества при измерении угла вращения плоско- плоскости поляризации. Метод имеет многочисленные приложения. В част- частности, им пользуются для нахождения концентрации сахара в произ- производственных растворах и биологических объектах (кровь, моча). Конечно, такие измерения должны проводиться в стандартных усло- 104
виях опыта (X = const; t = const) в спектральной области, далекой от собственных полос поглощения исследуемого вещества, так как в противном случае наблюдаются некоторые аномалии. Угол поворота плоскости поляризации <р можно измерить с большой точностью (по- (погрешность измерений ~0,0Г). Для достижения такой точности ис- используют дополнительные устройства (полутеневые анализаторы), в которых измерение угла вращения проводят уравниванием освещен- освещенности двух половин поля зрения. Подобный способ значительно точнее обычного определения, при котором нужно заметить исчезно- исчезновение света, прошедшего через скрещенные поляризаторы. I \ I Рис. 3.23. Разло- Разложение линейно по- поляризованного ко- колебания па два круговых Рис. 3.24. Составная призма из правого и левого кварца Двусторонними стрелками показаны на- направления оптических осей Интерпретация вращения плоскости поляризации была дана впер- впервые Френелем, показавшим, что оно в какой-то степени аналогично двойному лучепреломлению. При изложении сущности формальной теории Френеля прежде всего установим, что любое линейно поля- поляризованное колебание можно разложить на два круговых колебания с правым и левым вращением. Это ясно из геометрического построе- построения, приведенного на рис. 3.23. Действительно, сумма двух векто- векторов («левого» и «правого») равна удвоенной проекции любого из них на диаметр, т. е. вектору, направление которого постоянно, а модуль изменяется по периодическому закону с частотой со. Это и есть линей- линейно поляризованное колебание. Френель предположил, что в оптически активном веществе ско- скорость распространения волны с правым вращением отлична от скоро- скорости распространения волны с левым вращением, т. е. «пр Ф #лев. В силу этого все оптически активные вещества можно подразделить на «правые» («пр > илев) и «левые» (ипр < илев). Для экспериментального доказательства справедливости этого предположения Френелем была построена специальная составная призма из «правого» и «левого» кварца (рис. 3.24). Легко сообразить, что если ппр Ф ялев, то при падении на такую призму линейно поля- поляризованного света сначала пучок света раздваивается, а в последующем '.че поляризованные по кругу в разные стороны волны будут расхо- чпться все больше и больше. Рассмотрим, что произойдет с линейно поляризованной волной, Распространяющейся в оптически активной среде. Разложим ис- 105
ходную волну Е на две, поляризованные по правому и левому кругу, скорости распространения которых в данном веществе не равны. Очевидно, что время, необходимое каждой волне для прохождения одного и того же отрезка в исследуемой активной среде, окажется различным. Следовательно, векторы Епр и Елев повернутся на раз- различные углы ф11р и срлев. На рис. 3.25, иллюстрирующем эти рассуж- рассуждения, ф1ф выбран больше, чем флев. Для того чтобы результирующее колебание осталось линейно по- поляризованным, неизбежно должна повернуться плоскость симметрии. Для определения направления колебаний в резуль- результирующей линейно поляризованной волне нужно сложить две поляризованные по кругу волны после прохождения ими равного пути в оптически активной среде, т. е. найти плоскость симметрии, которая (рис. 3.25) должна разделить пополам разность углов фпр и флев. Очевидно, что плоскость колебаний вектора Е в результирующей плоскопо- ляризованной волне повернется по отношению к направлению, колебаний в исходной волне на угол Ф = (Фпр - Флев)/2. C.11) Нетрудно получить основные соотношения для Рис. 3.25. Графиче- Угла поворота плоскости поляризации в привыч- скоё определение ных обозначениях электромагнитной теории, угла поворота пло- Если линейно поляризованная волна описы- скости поляриза- валась выражением ции г Е = Re Ео ехр [ко (t — г/и)], то аналитическое выражение для волны, поляризованной по кругу, запишем в виде Е = Re {Ео ехр [ко (t— г/и)] ± iE0 ехр [ко (t — г/и)]}. C.12) Это ясно из того, что круговое колебание всегда можно получить сложением двух взаимно перпендикулярных колебаний равной ам- амплитуды с разностью фаз б = я/2. Так как ехр (in/2) = i, то появле- появление разности фаз б = я/2 между компонентами Ех и Еу эквивалент- эквивалентно умножению одной из них на и а знак «±» соответствует правому или левому вращению. При определении знака вращения следует иметь в виду, что при правом вращении компонента Еу опережает Ех на я/2, т. е. (Ey)nv/(Ex)np = ехр (in/2) = t, а при левом вращении Еу отстает от Ех на я/2, т. е. (£у)лсв /(£*)«» = ехр (—in/2) = —L Следовательно [учитывая, что cos (а + я/2) = —sin а], имеем: Правое вращение Левое вращение Ех = Ео cos со (t — г/и), Ех = Ео cosco(t — г/и), Еу = — Ео sin со (t — z!u)y Ey = Е0$т<* (t — г/и). C.13) 106
Отсюда, кстати, вытекает законность разложения линейно поля- поляризованного колебания на два колебания, поляризованных по кругу с правым и левым вращением. Для неактивного вещества ипр = илев = = и, и если, например, Е = £*, то обе равные по модулю и противо- противоположные по знаку ^-компоненты в сумме дадут нуль. Теперь учтем сделанное выше предположение, что в активном веществе ипр Ф илев. Запишем выражение для волны, распространяю- распространяющейся в активном веществе: ^-компонента напряженности электри- электрического поля (£*)акт = (£*)пр + (£*W а у-компонента {Еу)акт = (£2/)пр +{Еу)лев. Вместо Ео в C.13) нужно ввести другую амплитуду Ео, меньшую Ео, так как часть энергии отразилась при входе в среду. Известно, как можно подсчитать по формулам Френеля Ео при определенной идеализации явления (например, при отсутствии поглощения), но сейчас нас эта проблема не интересует. Итак, ^-компоненту волны в оптически активной среде записывают в виде = £6 COS @ (t — z/Unp) +Eo COS СО (/ — ) . C.14) Аналогично, для «/-компоненты имеем (£г/)акт =Е'й sin to (t—z!uneB) —Ео sin © (t—z/unp) = =2Eb sin -JL (/глев-«„р) г cos ш (/ —Плев+Пдр г) . C.15) ^^ *с ш \ 2с J Здесь множители, выделенные снизу фигурной скобкой, являются проекциями на оси X n Y амплитуд суммарного колебания. Рассмотрение C.14) и C.15) показывает, что фазы колебаний (£а)акт и (Еу)акт одинаковы. Следовательно, между колебанием вдоль оси X и колебанием вдоль оси Y нет сдвига фаз (б = 0) и при сложении этих колебаний получится линейно поляризованная волна. В резуль- результате прохождения в активной среде пути z =d плоскость поляризации повернется на угол ф. Из сравнения проекций амплитуды Е'о на оси Y и X определяем значение угла ф: Ф =~(ЯлбВ — >Wd = ■£- «"лев—Япр) d. C.16) Произведем теперь оценку величины An = плев — /гпр, которую можно зафиксировать в опытах по вращению плоскости поляризации. Если точность измерения ф « 0,01° B • 10~4 рад), то при d « 10 см и X « 5 • 10 см можно измерить An ~ 10"9, т. е. обнаружить нич- ничтожную разницу в показателях преломления плев — лпр. Итак, можно считать, что в рамках феноменологической электро- электромагнитной теории света вращение плоскости поляризации получило 107
объяснение. Однако эта теория не способна объяснить, почему ско- скорость волны в правовращающем веществе отлична от ее скорости в левовращающем. Если попытаться ответить на этот вопрос с позиций молекулярной теории, то надо предположить, что вращение плоскости поляриза- поляризации связано с асимметрией строения оптически активного вещества. В случае кристаллов главной причиной различия скоростей следует считать асимметрию внешней формы (отсутствие центра симметрии). Об этом говорит уже упоминавшаяся выше возможность различать кристалл правого и левого кварца по внешнему виду. Для аморфных однородных тел нужно связать исследуемое явление со строением сложных молекул активной среды. Рис. 3.26. Модель асим- асимметричной молекулы Рис. 3.27. Две асимме- асимметричные молекулы Зеркальная симметрия отсут- отсутствует Этот вопрос был подробно рассмотрен М. Борном A915 г.), который показал, что описанный выше эффект можно объяснить, если учесть взаимодействие электромагнитного поля с веществом в пределах одной молекулы. При построении теории принималось во внимание, что все оптически активные вещества существуют в двух модификациях, характеризующихся правым и левым вращением плоскости поляриза- поляризации, и рассматривались сложные асимметричные молекулы с прост- пространственной структурой, не имеющие ни центра симметрии, ни пло- плоскости симметрии. Наиболее простая модель этой молекулы — отре- отрезок спирали. Пусть на такую молекулу, диаметр витка которой равен а, падает линейно поляризованная волна Е = Ех (рис. 3.26). Она вызовет дви- движение зарядов, направленное вдоль оси X. Но если заряды будут двигаться вдоль спирали, то неизбежно возникнет их движение и вдоль оси Y. Следовательно, можно говорить об F-компоненте волны в веществе, наличие которой должно привести к отклонению пло- плоскости колебаний от направления Е = Ех. Расчет неизбежно должен быть связан с изменением фазы волны в пределах одной молекулы (вместо Ы нужно взять ю£ — ka), а его результат покажет, будет ли такое изменение существенно. На первый взгляд этот эффект кажется пренебрежимо малым, так как для оптической области отношение раз- размера молекулы к длине волны порядка 10"~3, но возможность выявления в эксперименте чрезвычайно малых An не позволяет заранее отверг- отвергнуть подобное предположение. Так, например, для модели асимметричной молекулы имеет место поворот плоскости поляризации волны, распространяющейся вдоль 108
оси Z (рис. 3.27), причем An будет зависеть от размера молекулы*. При проведении расчета предполагается наличие определенных соот- соотношений между электрическими моментами, вызываемыми линейно поляризованной волной в разных участках (радикалах) изучаемой сложной молекулы, и учитывается изменение фазы волны в ее преде- пределах. В результате расчета получается Дд = лпр — плев = Any sin (Ш), C.17) где у — некоторая константа, k = 2п/Х. Нетрудно заметить, что при / = 0 имеем Ал = 0 и плоскость по- поляризации не вращается. Однако расчеты подобного рода достаточно трудны и, для того чтобы читатель смог лучше представить себе процесс вращения пло- плоскости поляризации аморфными телами, следует обратиться к экспе- эксперименту. Чрезвычайно поучительный опыт иллюстрирует рассмат- рассматриваемое явление. Как известно,современные источники УКВ-излу- УКВ-излучения испускают линейно поляризованные волны. На пути волны, испускаемой клистроном (X « 3 см), ставится небольшая картонная коробка, заполненная хаотически расположенными отрезками спи- спирали из медной изолированной проволоки (диаметр 6—7 мм, длина каждого отрезка около 10 мм). Рупор приемника излучения состав- составляет угол я/2 с рупором излучателя, и до введения коробки, напол- наполненной отрезками спиралей, сигнал не регистрируется («скрещенные» излучатель и приемник). Введение коробки приводит f к появлению отчетливого сигнала (синусоида на экране осциллографа). Повернув рупор приемника на некоторый угол i|), можно снова погасить этот сигнал. Тем самым доказывается, что наблюдается именно вращение плоскости поляризации. Но, более того, в другую такую же картон- картонную коробку набрасывают отрезки спирали совершенно тех же раз- размеров, но намотанные в другую сторону (спирали намотаны на левый винт). Введение такой коробки между излучателем и приемником при- приводит к повороту плоскости поляризации на тот же угол г|э, но в дру- другую сторону. Таким образом, в этом эксперименте моделируются пра- правое и левое вращения плоскости поляризации двумя модификациями асимметричных молекул одного и того же аморфного вещества. В заключение упомянем о фундаментальных экспериментах Фара- дея, который в 1845 г. впервые осуществил искусственное вращение плоскости поляризации, помещая оптически неактивное вещество в продольное магнитное поле. Значение его опытов для развития электромагнитной теории было чрезвычайно велико, так как в этом случае впервые рассматривались совместно оптические и магнитные явления. Значительны и технические приложения открытого Фарз- деем эффекта. Подробный расчет этого эффекта и описание экспериментов по ис- искусственному вращению будут проведены в § 4.5, где электромаг- электромагнитная теория света дополнена электронной теорией. ♦ См.: Г о р е л и к Г. С. Колебяяля и волны М., «Наука», 1965. 109
ГЛАВА IV ЭЛЕКТРОННАЯ ТЕОРИЯ ДИСПЕРСИИ § 4.1. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ В настоящей главе будет рассмотрено действие поля световой волны на движение связанных в атоме заряженных частиц. Решение этой задачи позволит понять разнообразные физические явления, истолкование которых невозможно с позиций классической электро- электромагнитной теории света. Соединение электронных явлений и электромагнитной теории света является заслугой Лоренца — крупнейшего физика, работавшего на рубеже XIX и XX вв. Появлению этой фундаментальной теории предшествовал ряд наблюдений, опытов и попыток их обобщения. Упомянем лишь о некоторых таких исследованиях, так как построе- построения, основанные на «упругостной» волновой теории, представляют интерес для истории развития физики, а не для уяснения современно- современного состояния изучаемой проблемы. В первую очередь нас интересует дисперсия вещества, т. е. зависимость показателя преломления от длины волны проходящего света. Напомним, что в классической электромагнитной теории света предполагается, что п (X) = const, однако еще Ньютон поставил опыт, наглядно иллюстрирующий зависимость п (X). В его опыте две призмы располагались так, чтобы они разлагали про- проходящий пучок света в спектр в двух взаимно пер- перпендикулярных направле- направлениях (рис. 4.1). На экране показан спектр, возникаю- возникающий в результате совмест- совместного действия обеих призм, на котором видно, как по- показатель преломления стекла зависит от длины волны проходящего света. Правда, недоста- недостаточная точность этого метода «скрещенных призм» привела Ньютона к неверному заключению о том, что относительная дисперсия для всех прозрачных тел одинакова. Как хорошо известно (см. например, рис. 6.71), у разных сортов стекла величины п(Х) и дп(Х)/дХ раз- различны, что и позволяет создавать ахроматические объективы. Неоднократно делались попытки теоретически получить искомую зависимость п (X). Одно из подобных построений было выполнено в первой половине XIX в. знаменитым математиком Коши. Так, исходя из представлений Френеля, Коши получил формулу п=Л + Б/Х§+СА4о + ..., D.1) ПО Рис. 4.1. Схема опыта, показывающего зависи- зависимость показателя преломления от длины волны
где Хо — длина волны в вакууме; Л, В, С — экспериментально опре- определяемые константы. Это соотношение хорошо описывает зависимость показателя пре- преломления от длины волны для различных прозрачных тел. В боль- большинстве случаев достаточно точная аппроксимация получается при использовании лишь двух первых членов (т. е. из опыта нужно определять только две константы). Очевидно, что обоснование подобной зависимости п (X) для про- прозрачных тел — это одна из главных задач, которые возникают при соединении электронных явлений и электромагнитной теории света. МО 7200 6800 6W0 6000 5600 5200 4800 ШО Я, У* Рис. 4.2. Зависимость показателя преломления от длины волны для двух красителей Нужно также выяснить, почему известная формула Максвелла и = с1У*г в некоторых случаях (инертные газы, кислород и др., види- видимая область спектра) превосходно соответствует опытным данным, а в других приводит к резкому расхождению с результатами экспе- эксперимента. Дальнейшее усовершенствование техники эксперимента позволило заметить новые факты, также требовавшие своего истолкования. В середине XIX в. было установлено, что у ряда веществ в какой-то области спектра наблюдается аномальная зависимость показателя преломления от длины волны {аномальная дисперсия дп/дк > 0). Впервые это явление наблюдал Леру, исследовавший прохождение света через пары иода. В дальнейшем при исследовании различных красителей (фуксин, цианин и др.), обладающих очень интенсивными полосами поглощения в видимой области спектра, было показано, что аномальная дисперсия всегда возникает в той области спектра, где данное вещество сильно поглощает световую энергию. Типичная кри- кривая зависимости п (к) вблизи полосы поглощения красителя приведена на рис. 4.2. ill
Очевидно, что аномальная дисперсия возникает не случайно, а не- непосредственно связана с наличием полос поглощения у исследуемого вещества. Она огсутствует в той области спектра, где нет полос по- поглощения. Так, например, спектры всех прозрачных тел (многие газы, вода, стекло, кварц и др.) не имеют полос поглощения в видимой области, и у них в этом диапазоне наблюдается только нормальная дисперсия (Оп/дХ < 0). В ультрафиолетовой и инфракрасной облас- областях многие из тел интенсивно поглощают электромагнитное излуче- излучение — там должна наблюдаться также и аномальная дисперсия. Следует напомнить, что обсуждаемое понятие аномальной диспер- дисперсии было формально введено ранее при записи формулы Рэлея, свя- связывающей групповую и фазовую скорости распространения электро- электромагнитных волн (см. § 1.5). В самом деле, выше было выведено соот- соотношение A.28) тт л dll Обычно U < и, что приводит к требованию duldX > 0, или дп/дк < < 0, т. е. указывает на нормальную дисперсию. Но эта феноменоло- феноменологическая теория не отвергает возможности возникновения аномаль- аномальной дисперсии, когда ди/дХ < 0, т. е. дп/д% > 0, и У > w. Заметим, что вопрос о корректности формулы Рэлея в данном случае требует очень тонкого рассмотрения в связи с основным постулатом теории относительности, накладывающим строгое ограничение (U < с) на значение скорости передачи энергии (т. е. групповой скорости). Во второй половине XIX в. было осуществлен ряд попыток теоре- теоретически истолковать явление аномальной дисперсии и найти выра- выражения, связывающие дисперсию и поглощение света. Наиболее ус- успешны были работы Зельмейера, получившего в рамках теории Фре- Френеля формулу, достаточно хорошо описывающую изменение показа- показателя преломления в непосредственной близости к линии поглощения. Согласие формулы Зельмейера с опытом детально исследовалось в ра- работах Д. С. Рождественского. Предложенная им оригинальная ме- методика («метод крюков») позволила проводить эти измерения с боль- большой точностью. В 40-х годах нашего столетия Г. С. Кватер показал, что исследуемая формула Зельмейера хорошо согласуется с измере- измерениями показателя преломления паров натрия даже на расстоянии всего 0,1 А от центра линии поглощения. Вывод основных соотношений для аномальной дисперсии будет проведен ниже при изучении действия электромагнитной волны на дви- движение связанных электронов атома с учетом их торможения. В гл. V мы более подробно остановимся на экспериментальных исследованиях явления аномальной дисперсии в парах и газах, проводящихся мето- методами интерферометрии. Таким образом, выясняется еще один круг проблем, которые долж- должны быть решены при рассмотрении электронных явлений. К сказан- сказанному следует добавить, что при этом удается также количественно описать вращение плоскости поляризации электромагнитной волны в продольном магнитном поле и другие физические явления. 112
§ 4.2. УРАВНЕНИЯ ДИСПЕРСИИ Сложная задача взаимодействия электромагнитного поля с ве- веществом может решаться как методами классической, так и квантовой физики. Следует учитывать, что при использовании гармонического осциллятора в качестве модели излучающего атома результаты кван- квантовой и классической теории дисперсии полностью совпадают*. При применении другой модели (например, атома водорода, где нужно учитывать кулоновское взаимодействие, а не квазиупругую силу) результаты квантового и классического описания будут существенно различны. В последующем изложении, проводимом в приближении классической физики, фактически использована модель Томсона — атом как гармонический осциллятор с частотой собственных колеба- колебаний соо. Квантовомеханическая формулировка полученных выраже- выражений, содержащая добавочную информацию о рассматриваемых явле- явлениях, будет приведена лишь в связи с описанием экспериментальных работ. Идея расчета, впервые проведенного Лоренцем**, предельно[проста: для получения зависимости показателя преломления како'го-либо вещества от частоты падающего на него света нужно найти вектор поляризации этого вещества Р, создаваемый полем световой волны Е. Затем вычисляют вектор электростатической индукции D =<Е + + 4я Р и определяют е = D/£. Используя основное соотношение электромагнитной теории света п = j/T, получают искомую зависи- зависимость п (со). Таким образом, изменение п в зависимости от со обусловливается суперпозицией первичной световой волны и всех вызванных ею вто- вторичных волн в исследуемом веществе, свойства которого должны существенно влиять на ход показателя преломления п (со). Важно понять, что в данном случае первичная волна не заменяется суммой вторичных волн (как это делается при истолковании явления дифрак- дифракции, см. § 6.1), а взаимодействует с ними. Уточним постановку задачи: пусть в единице объема имеется N хаотически расположенных эквивалентных атомов исследуемого ве- вещества. Будем считать, что в каждом атоме имеется один оптический электрон с зарядом q. Электрическое поле световой волны воздейст- воздействует на такой электрон с силой qE (вынуждающая сила). Не будем пока учитывать действия на данный электрон поля, создаваемого всеми другими электронами. Это пренебрежение спра- справедливо при малой плотности изучаемого вещества. В дальнейшем будет показано, как видоизменяются формулы при учете взаимо- взаимодействия электрических зарядов [см. D.10)]. * См.: Мандельштам Л. И. Лекции по оптике, теории относитель- ности и квантовой механике. М., «Наука», 1972, с. 286. ♦♦ См.: Лорентц Г. А. Теория электронов. М., Гостехиздат, 1956. В заглавии и тексте этой весьма поучительной и сохранившей свежесть изложе- изложения книги фамилия ее автора пишется Лорентц. В большинстве других книг и научных публикаций пишут Лоренц, не боясь спутать Г. А. Лоренца с менее известным его современником Л. В. Лоренцем. Мы следуем этой традиции. 113
Электрон удерживается в атоме квазиупругой силой /г, которая, как мы видим, пропорциональна смещению электрона г, возникаю- возникающему под действием поля световой волны. Масса электрона т и ко- коэффициент квазиупругой связи / определяют частоту собственных колебаний гармонического осциллятора соо. Связь между ними запи- записывается в виде со* = flm. В этой схеме наличие в спектре нескольких полос поглощения, возле которых резко изменяется ход показателя преломления, по- потребует допущения о наличии нескольких групп различных гармо- гармонических осцилляторов. Воздержимся от этого предположения и связанного с ним усложнения исходных формул [см. D.12)]. Будем считать, что все гармонические осцилляторы идентичны, т е. имеют одну собственную частоту колебания соо. Заметим, что исходные по- положения излагаемой теории пригодны не только для описания ко- колебаний оптических электронов, но их можно использовать для уче- учета вынужденных колебаний ионов с частотами, соответствующими ин- инфракрасной области спектра (cog, ион =//^ион<^ ©J. эл). Такое рас- расширение теории приводит к интересным следствиям (см. § 4.3). Сложные проблемы усреднения также можно игнорировать на дан- данном этапе исследования, особенно если ограничиться оптическим диапазоном спектра (инфракрасные, видимые и ультрафиолетовые лучи). В этом случае в кубе с ребром порядка длины световой волны даже при очень малой плотности вещества содержится громадное ко- количество излучающих атомов, которые, как мы условились, не влия- влияют друг на друга, и можно положить, что поляризация вещества в поле световой волны определяется соотношением Р = Nqr. Таким образом, можно считать выясненным вопрос о необходи- необходимости введения в уравнение движения осциллирующего электрона вынуждающей и квазиупругой сил. Теперь уточним их знаки. Квазиупругая сила всегда имеет знак обратный направлению сме- смещения, т. е. равна —/т. Знак вынуждающей силы ^Е, так же как и поляризация среды, зависит от знака электрического заряда. Выше поляризация среды была определена выражением Р = Nqr. Поэ- Поэтому введем в уравнение движения вынуждающую силу +9^> что будет годиться для описания движения как положительного, так и отрицательного заряда. Необходимо разобраться еще в одном вопросе: как учесть неиз- неизбежное затухание колебаний осциллятора? Физические причины, приводящие к затуханию излучения и связанному с ним уширению спектральной линии, будут подробно обсуждены ниже (см. гл. V). Они сводятся к потере энергии вследствие излучения, к столкнове- столкновениям, тушащим колебания осцилляторов, и к хаотическому тепло- тепловому движению атомов (эффект Доплера). При феноменологическом описании можно объединить все эти разнородные процессы, вводя убывающую во времени амплитуду затухающей волны (что эквива- эквивалентно использованию комплексного показателя преломления). При составлении уравнения движения осциллирующего электрона для учета затухания нужно ввести какую-то тормозящую силу. Запишем 114
ее в виде —gr, где g — некий коэффициент; частное от его деления на массу электрона обозначают y и называют коэффициентом затухания. В теории колебаний доказывается, что тормозящая сила пропор- пропорциональна скорости движения в том случае, когда затухание относи- относительно мало и в незначительной степени искажает собственные колеба- колебания системы. Простые оценки показывают, что в данной задаче такое приближение законно. Действительно, ранее (см. § 1.7) было прове- проведено исследование соотношения потерь на излучение и энергии, за- запасенной в атоме, что позволило оценить «добротность» атома, кото- которая оказалась весьма большой («107). Упоминавшиеся выше причины (столкновения, тепловое движение) могут в 10—100 раз уширить линию излучения, но и при этом в полной мере сохраняется основной результат — в течение одного периода атом теряет очень малую часть накопленной энергии, и, следовательно, введение такой тормозящей силы в уравнение движения остается вполне законным. Итак, дифференциальное уравнение движения осциллирующего электрона имеет вид тх =— /г— gr + qE. D.2) Напомним, что g/m =уи f/m = cog- Перегруппировав члены, найдем г + Y* + «>ог = qE/m. D.3) Будем исходить из того, что напряженность электрического поля изменяется по закону Е = Ео ехр (ш/). Следовательно, решение этого уравнения следует искать в виде г = г0 ехр (Ш). Замечая, что г = /саг, г = —оо2г, получим г0 (—со2 + iya) + cog) = qE0/m или Вместе с тем мы знаем, что Р = Nqt и 8 — 1 = 4л РАЕ. Теперь уже нетрудно получить окончательный результат и установить на- наличие зависимости показателя преломления от частоты, т. е. сущест- существование дисперсии. В самом деле, 4^B/m) ( g Анализ этого соотношения позволит решить все поставленные выше задачи. Разумно начать его с более простого случая, когда можно пренебречь поглощением. 115
§ 4.3. ДИСПЕРСИЯ ВДАЛИ ОТ ЛИНИИ ПОГЛОЩЕНИЯ Согласно выражению D.5), диэлектрическая проницаемость е (а следовательно, и показатель преломления) — величина комплекс- комплексная. Если в D.5) положить y = 0, то диэлектрическая проницаемость будет вещественной. ЯТереход от комплексного значения показателя преломления к вещественному означает пренебрежение поглощением электромагнитной волны^Рассмотрим это приближение более под- подробно: |^^№L7 D.6) На рис. 4.3 представлена зависимость функции (я2 — 1) от частоты излучения. За исключением точки со = соо, где эта функция терпит разрыв, что не может соответствовать физический реальности, показа- показатель преломления всюду возрастает с увеличением частоты, т. е. имеет место нормальная дисперсия вещества (дп/дХ<0). Можно выявить те условия, при которых приближение у = О имеет вполне определенный физический смысл. Как уже указыва- указывалось, все прозрачные тела не имеют полос поглощения в видимой области, а при переходе в ультрафиолетовую часть спектра подав- подавляющее большинство таких тел начинает интенсивно поглощать электромагнитные волны [пока не учитываются инфракрасные полосы поглощения, наблюдаемые у некоторых прозрачных тел; см. D.18) и далее]. Для всей видимой части спектра справедливо неравенство со<Ссоо (дисперсия изучает- изучается вдали от линий поглощения), и при исследовании таких тел можно пользо- пользоваться лишь левой частью кривой рис. 4.3. Иными словами, частота собст- собственных колебаний осциллирующего электрона соответствует ультрафиолето- ультрафиолетовой области спектра. В полном согласии с опытом для всех прозрачных тел на- наблюдается нормальная дисперсия ("фиол > пкР> если сокр < со < софиол). Предположив, что со<^со0, можно разложить выражение D.6) в ряд по степеням (со/соо) и ограничиться в этом разложении двумя членами; тогда J _ » 7 - О Г" /-_ \ П-Ш D.7> it) Рис. 4.3. Зависимость п2—1 от частоты при отсутствии погло- поглощения Заменяя ю = 2пс/К и ю0 = 2лс/К0, получаем простую формулу, которую легко сравнить с опытными данными: п2 = 1 + А A + В/К2), D.8) где 4 = 4яМ?7(/п<0§), В = 4я2с7ю§ D.9)
и отношение В/А не зависит от частоты собственных колебаний элект- электрона соо. Соотношение D.8) совпадает с выражением D.1), в котором соот- соответствующие константы должны были определяться из эксперименталь- экспериментальных данных. Следовательно, появляется возможность проверки элект- электронной теории дисперсии, так как константы А и В можно оценить как из наблюдаемой на опыте зависимости п (X), так и по формулам D.9). При таком сравнении нужно определить из газокинетических данных концентрацию атомов N и правильно оценить число излучаю- излучающих электронов в атоме. Затем, задавшись известным значением удельного заряда электрона qlm, можно оценить частоту собственных колебаний ю0, и сравнить ее с имеющимися в литературе данными о полосах поглощения исследуемого вещества в ульрафиолетовой об- области спектра. Используя соотношение В/А = nmc2/(Nq2), можно сравнить экспериментально найденное значение констант с рассчи- рассчитанными. В этом случае не нужна детальная идентификация спектра поглощения (В/А не зависит от соо) и, как уже указывалось, необ- необходимо лишь правильно оценить концентрацию атомов и число излу- излучающих электронов. Сравнения подобного рода проводились неоднократно, и наблю- наблюдалось удовлетворительное совпадение (расхождение 10—20%) дан- данных эксперимента и расчета констант А и В по приведенным выше формулам. При проверке соотношения D.8) следует учитывать, что предпо- предположение об отсутствии взаимодействия между излучающими электро- электронами справедливо лишь при исследовании разреженных газов, а также ряда веществ, в которых концентрация излучающих центров доста- достаточно мала. При большой плотности вещества наше предположение неверно. В этом случае кроме внешнего поля Е нужно учесть еще элект- электрическое поле, создаваемое в той точке, где находится электрон, все- всеми остальными электрическими зарядами. Такое рассмотрение (а имен- именно учет «поля Лоренца»*), как известно, приводит к своеобразной зависимости диэлектрической проницаемости от свойств среды (фор- (формула Клаузиуса — Мосоти). Учитывая, что е = п2, и проводя совер- совершенно аналогичные рассуждения, легко получить следующее соот- соотношение, которое обычно называют формулой Лоренц — Лоренца: п2~\ 4я лЧ-2 з ©J—со* ' К ' ' Она хорошо описывает зависимость показателя преломления от частоты при больших давлениях газов. Из формулы D.10) следует, П2— 1 1 что произведение п2 , 2 • -^ не должно зависеть от плотности иссле. дуемого вещества б, которая пропорциональна концентрации атомов N. Часто вводят понятие удельной рефракции вещества * См,: К и т т е л ь Ч. Введение в физику твердого тела. М., Физматгиз, 1962. 117
Как показывает опыт, для многих веществ удельная рефракция не зависит от их плотности в широком интервале значений последней, что находится в согласии с D.10); при уменьшении давления иссле- исследуемого газа его показатель преломления п стремится к единице и выражение D.10) переходит в привычную формулу D.6). Если в спектре исследуемого вещества имеется несколько корот- коротковолновых полос поглощения, то нужно заменить правую часть выражения D.6) соответствующей суммой, а именно: Здесь Nj — число атомов, для которых электрон имеет собственную частоту соо</. Число таких собственных частот в классической теории дисперсии соответствует числу полос по- ЛВоздужденные глощения в коротковолновой части спект- J уровни ра Если общее число атомов в единице объема по-прежнему равно N, то 2^j = N. -Основнойуровень Таким образом, предполагается существо- существование нескольких групп атомов, характе- характеризующихся различными квазиупругими силами. Выше уже упоминалось, что задача о движении электрона в поле световой волны может рассматриваться квантовомеханически. В ре- результате этого получается почти такое же выражение, как и класси- классическая формула D.12), а именно: 0J со, п2 ^2^*- D.13) однако смысл сходных обозначений будет в этом случае совсем иным. Здесь символ (uik означает уже не частоты свободных колебаний раз- различных квазиупругих электронов, а круговые частоты, соответствую- соответствующие разрешенным переходам в атоме для одного и того же оптического (валентного) электрона, которые можно определить по известным пра- правилам, впервые сформулированным Бором. Так, например, рис. 4.4 иллюстрирует возникновение спектра поглощения; атом находится в основном состоянии и может перейти в одно из трех возбужденных состояний. Введенную величину fik называют силой осциллятора. Она про- пропорциональна интенсивности спектральной линии, возникающей при данном переходе. Это понятие использовалось в классической физике, но в данном случае речь идет о квантовой величине. Сила осциллятора однозначно связана с другой, уже чисто кван- квантовой величиной, широко используемой в атомной физике, — вероят- вероятностью перехода Aih (см. гл. VIII), характеризующей скорость распа- распада возбужденного состояния, причем Aik ~ ЫЦк. D.13а) 118
Для простейших атомов вероятность перехода можно вычислить методами квантовой механики. Обратная ей величина (для двух- двухуровневой схемы) характеризует среднее время жизни атома в сос- состояниях, между которыми происходил оптический переход. Исследование соотношения D.6) позволяет выявить некоторые закономерности, которые на первый взгляд не имеют прямого отно- отношения к данной проблеме. Так, например, можно исследовать диспер- дисперсию рентгеновских лучей и рассчитать фазовую скорость распростра- распространения радиоволн в ионосфере. Для этого обратимся к правой части кривой на рис. 4.3, где частота вынужденных колебаний со значи- значительно больше собственной частоты колебаний соо. Такое приближение (со > соо) можно использовать при описании дисперсии рентгенов- рентгеновского излучения, частота которого в несколько тысяч раз больше час- частоты видимого света. Если coj^> соо> то в D.6) можно положить соо = О и получить следующую своеобразную зависимость п от со: D.14) Очевидно, что здесь п < 1, хотя мало отличается от 1, так как в данном случае частота со велика. Полученный результат соответст- соответствует экспериментальным данным и используется в оптике рентгенов- рентгеновских лучей, где можно наблюдать полное внутреннее отражение при переходе рентгеновского излучения из воздуха в стекло, что было не- невозможно в оптическом диапазоне. Формально такой же результат получается при описании совер- совершенно иного явления — распространения радиоволн в ионосфере. Хотя в этом случае рассматриваются весьма низкочастотные колеба- колебания (длина волны порядка десятков метров), исходное положение со ^> соо оказывается приемлемым. Действительно, ионосфера пред- представляет собой полностью ионизованный газ (плазму), в котором из- излучающие электроны не связаны внутриатомными силами. Отсюда следует, что в рамках развиваемой теории нужно положить coj =//m = = 0. Для таких «свободных» электронов условие со^>со0 будет удов- удовлетворяться даже в области столь низких частот. В согласии с другими физическими оценками фазовая скорость ра- радиоволн в ионосфере оказывается больше скорости электромагнитных волн в вакууме; в самом деле, и=— = с — > с. D.15) п Y\AN*l(fi) С увеличением частоты показатель преломления должен увеличить- увеличиться и при со ^ 108 Гц можно считать л» 1. Такая частота является граничной в том смысле, что на распространение ультракоротких волн (X ^ 10 м) ионосфера уже не влияет; такие волны свободно про- проходят через ионосферу, не преломляясь в ней и не отражаясь от ее границ. Это ограничивает их применение для радиопередач, но вместе с тем открывает возможность радиолокации Луны и планет солнечной системы и лежит в основе всей радиоастрономии, использующей тех- технику ультракоротких волн. 119
Для достаточно длинных волн показатель преломления оказыва- оказываемся мнимой величиной. Иными словами, для радиоволн столь малой частоты плазма непрозрачна. Нетрудно показать, что амплитуда волны, проникающей в плазму, спадает по экспоненциальному за- закону. Важно подчеркнуть, что в данном случае происходит полное отражение (J? = 1) электромагнитной волны от плазмы при любых углах падения, а не поглощение энергии. Граничная частота (ее часто называют плазменной), при которой наступают указанные явления, равна Групповая скорость радиоволн в ионосфере, определяющая скорость переноса энергии, конечно, меньше скорости света в вакууме. Для вычисления U = do)/d& запишем DЛ5) в виде О) У * CO* Возведя обе части этого равенства в квадрат, решая его относи- относительно со и проводя дифференцирование dco/dk, имеем c/l dk у mco2 D.16) Перемножив D.15) н D.1G), замечаем, что для фазовой и группо- групповой скоростей радиоволн, распространяющихся в ионосфере, выпол- выполняется соотношение Uu=c\ D.17) Заметим, что эта простая формула справедлива в том случае, когда соо = 0. В более важном для оптического диапазона приближении соо ф 0 соотношение между фазовой и групповой скоростями электро- электромагнитных волн оказывается более сложным. Обратимся теперь к интересным следствиям, получающимся при учете колебаний ионов под действием световой волны. Мы уви- увидим, что такое усложнение теории дисперсии позволит оценить гра- границы применимости формулы Максвелла n=]/s и понять причины значительного расхождения ее с опытными данными, наблюдаемого для многих веществ. Рассмотрим для простоты движение пары разноименно заряженных ионов, объединенных в простейшую молекулу типа, например Na+Cl~. В этом случае валентность каждого иона равна единице и его заряд равен заряду электрона. Уточнение конечных формул для более сложных молекул не представляет особого труда*. При составлении исходного дифференциального уравнения будем исходить из естественного предположения о том, что поляризация вещества Р аддитивно складывается из поляризации Plf вызванной ♦ См.: Зоммерфельд А. Оптика, § 18. 120
смещением электронов, и поляризации Р2, связанной со смещением ионов в поле световой волны (рис. 4.5), т. е. что р -Pi + Ps. D.18) При расчете поляризации Р2 и оценке собственной частоты коле- колебания ионов оH2 будем исходить из выражения для приведенной массы —=JL + J_. D.19) м м+ м- Здесь М+ и Nl~~ — массы ионов разных знаков, составляющих молекулу. Очевидно, что собственная частота колебаний электрона со^ = flm значительно больше собственной частоты колебаний ионов (о§2 = f/M, так как М ^> т. Опуская промежуточные выкладки, после- последовательность которых ничем не отличается от уже разобранного случая, когда учиты- учитывалась только электронная поляризация, получим следующее выражение для по- показателя преломления с учетом как элек- Рис. 4.5. Смещение разно- тронных, так и ионных колебаний: именно заряженных ча- частиц в электрическом по- А12= 1 + 4яМуа , 4nNq* ,. 2Q\ ле световой волны w<©8©2) M(©Jю2) ' ' Преобразуем его к виду, который удобно сравнивать с данными опыта. Вспомним, что o>Oi = 2nc/X0tf ш02 = 2пс/кО2> со = 2пс1%. Тогда „2 Нетрудно найти константы Сх и С2. Мы этим заниматься не будем и лишь заметим, что они связаны очевидным равенством Сх1Сг =в = т/М, которое можно сравнивать с данными опыта. Произведя простые алгебраические преобразования, преобразуем 4.21): ^^ + ^Ц^. D.22) Проанализируем более внимательно полученное выражение для показателя преломления. Уже указывалось, что со01^>оH2. Тогда Я01<^Я02. Следователь- Следовательно, если электронные полосы поглощения лежат в ультрафиолетовой области спектра, то полосы поглощения ионов должны быть распо- расположены в инфракрасной его области. Их наличие существенно ска- скажется на ходе показателя преломления в видимой области спектра, где исследуемое вещество может быть совершенно прозрачно, так как зависимость п (К) определяется двумя резонансными членами, из ко- которых С2Л82/(^2 — Я§2) играет во всяком случае не меньшую, чем СхЯ§1/(Я3 — ЯоО, роль (напомним, что Я02 ^> 101). В рамках классической электромагнитной теории показатель пре- преломления п = УТ принимается постоянным, что, как мы знаем, 121
не соответствует опытным данным. Но формула D.22) показывает, что при %->■ оо (т. е. для дальней инфракрасной области) можно пре- пренебречь зависимостью п (Х)> так как оба резонансных члена стремятся тогда к нулю. Следовательно, если п^ —значение показателя прелом- преломления для этой дальней инфракрасной области, то должна быть спра- справедливой следующая связь между п^ и константами Cl9 C2, kOi и ^02: n0O=l+X§iC1 + Xg2C2, D.23) которую и надлежит сравнить с опытом. Эксперименты показывают, что для многих случаев определенное таким образом значение п^ находится в удовлетворительном согла- согласии с ]/в" (диэлектрическая проницаемость измеряется обычными элек- электрическими методами). Следовательно, обсуждая применимость формулы Максвелла в да- далекой инфракрасной области, где можно пользоваться статическими значениями 8, имеет смысл записать показатель преломления в виде D.23). Ясно, что в этом приближении главную роль играет наличие или отсутствие в спектре данного вещества инфракрасных полос поглощения, так как член Я§2 С2 часто вносит основной вклад в зна- значение п^. Если же сравнивать показатель преломления п, измеренный в видимой области спектра, со статическим значением |/¥, то у ве- веществ, в спектре которых имеются интенсивные инфракрасные поло- полосы, эти значения неизбежно окажутся совершенно различными. В част- частности, 'столь значительное различие между показателем преломления воды (лвод« 1,33) и |/*8*«9 можно сопоставить с наличием в спектре воды интенсивных полос поглощения в ближней инфракрасной об- области. § 4.4. АНОМАЛЬНАЯ ДИСПЕРСИЯ Вернемся к соотношению D.5), в котором учтено затухание колеба- колебаний осциллирующего электрона. Будем считать, что частота вынужденных колебаний со незначи- незначительно отличается от частоты собственных колебаний атома соо. Иными словами, в отличие от исходных посылок проведенного ранее вывода здесь исследуется дисперсия вещества в непосредственной близости от его линии поглощения. Прежде всего заметим, что в данном случае диэлектрическая про- проницаемость оказывается комплексной величиной. Следовательно, комплексным должен быть и показатель преломления п' = п — тх = п A — Ы) , связанный с диэлектрической проницаемостью равенством п12 = = в'. Для анализа выражения D.5) подставим в него е' = A — 2Ы — к2) п2, D.24) т
разделим мнимую и вещественную части и, таким образом, полупим уравнения, связывающие п (показатель преломления) и пк (коэффи- (коэффициент поглощения) с частотой со: 2lK—K2)=\ 4nN(q2/m) (со?—®2)—frov (cog—со2) — /coy -0JJ ?2/m) yco D.25) ? — CO2J + у2 СО2 сог Зависимость и д2 A_Х2) от квадрата ча- стоты Ограничимся исследованием полученных формул, так как попытка довести выкладки до конца (т. е. получить в явном виде зависимость п и пк от свойств изучаемого вещества) привела бы к очень громоздким выраже- выражениям. Прежде всего заметим, что изменение функции 2д2х с частотой подобно измене- изменению коэффициента поглощения пк. В са- самом деле, при со ->- оо функция 2п2к -> О, при со ->■ соо она имеет максимум, который довольно быстро исчезает по мере увели- чения разности со2 — coj. Максимальное (амплитудное) значение B/г2х)макс = = 4nNq2/(my(o0) тем больше, чем меньше константа затухания у. Ширина максимума в шкале частот возрастает с увеличением у. График функции п2 A — к2) в основном воспроизводит зависи- зависимость п (со). При (о ->■ оо эта функция стремится к единице. Макси- Максимальное и минимальное значения у = п2 A — х2) принимает в близи частоты, соответствующей линии поглощения. Эти экстремальные значения colt2 можно определить, вычислив первую производную dyldto и приравняв ее нулю. Соответствующие расчеты показывают, что расстояние между экстремумами функции у равно ширине максимума функции 2п2к9 т. е. пропорционально коэффициенту затухания Y- На рис. 4.6 нанесены графики функций 2п2к и п2 A — х2), пере- передающие в основных чертах изменение коэффициента поглощения и показателя преломления вблизи линии поглощения. Мы видим, что подробно обсуждавшаяся в § 4.3 кривая с разрывом близ со = соо (полученная в предположении y = 0) трансформировалась при учете поглощения в характерную непрерывную кривую ABCD (дисперси- (дисперсионная кривая). Математически эта трансформация эквивалентна пере- переходу от имеющей разрыв гиперболы z = —l/х к резонансной кривой z = —х/(х2 + б2), которая при & -> 0 снова переходит в гиперболу с особой точкой х = 0. Рис. 4.6 показывает, что на участке ВС показатель преломления убывает при возрастании частоты и после перехода через центр ли- линии поглощения (со = ш0) становится меньше единицы. Это значит, что в данных условиях фазовая скорость волны больше скорости света 123
D вакууме. Мы уже сталкивались с подобными явлениями, и выше ука- указывалось, что соотношение и > с не противоречит теории относитель- относительности, запрет которой (U < с) распространяется лишь на скорость пе- переноса энергии. Однако нужно предостеречь читателя от попыток оценить для этого случая групповую скорость Ut используя формулу Рэлея. Детальное исследование показывает, что такие оценки некор- некорректны при столь резких изменениях показателя преломления, кото- которые происходят вблизи линии поглощения, и в этом случае необходимо различать групповую скорость волн и скорость сигнала [см. A.28а)]*. Перейдем теперь к сравнению теоретических результатов с дан- данными опыта. Наблюдается несомненная аналогия между изменением показателя преломления (см. рис. 4.6), найденным по формулам Рис. 4.7. Схема опыта Кундта--Вуда 4.25), и упоминавшимися выше результатами экспериментальных исследований поглощения и преломления света различными краси- красителями (см. рис. 4.2). В согласии с данными Кундта и других участок ВС кривой ABCD, где показатель преломления убывает с частотой (дп1д® < 0), совпадает с максимумом коэффициента поглощения. Таким образом, можно считать, что в рамках электронной теории дисперсии решена еще одна важная задача и установлена связь коэф- коэффициента поглощения и показателя преломления света вблизи линии поглощения. Однако получение дополнительной информации из измерений по- показателя преломления вблизи линии поглощения требует более под- подробного обсуждения. Заметим, что исследование зависимости п (Я) в разреженных газах и парах металлов представляет наибольший интерес, так как именно в этом случае исходные положения развитой теории в большей степени соответствуют условиям опыта. Эффектный опыт, качественно иллюстрирующий ход показателя преломления вблизи линии поглощения, был поставлен Кундтом и усовершенствован Вудом. Фактически ими было осуществлено своеоб- своеобразное развитие метода скрещенных призм Ньютона. Пучок света от вольтовой дуги или мощной лампы накаливания пропускается через горизонтальную кювету и разлагается в спектр призмой с вертикаль- вертикальным преломляющим ребром (рис. 4.7). Кювета откачивается рота- ротационным насосом и подогревается снизу газовой горелкой, в результа- результате чего кусочек металлического натрия, лежащий на нижней стенке кюветы, постепенно испаряется. Верхняя часть кюветы охлаждается, и внутри нее создается неравномерная по высоте плотность паров — * См.: Зоммерфельд А. Оптика, § 22. 124
Рис. 4.8. Разрыв линии на экране, отображающий зави- зависимость п(К) в опыте Кунд- та — Вуда концентрация атомов натрия вели- велика, вверху их мало. Такой столб паров действует на проходящий пучок света как своеобразная призма с горизонтальным преломляющим ребром. В результате сов- совместного действия «призмы» из паров нат- натрия и обычной стеклянной призмы на эк- экране должна отобразиться зависимость по- показателя преломления от длины волны, ко- которая вблизи линии поглощения терпит разрыв (рис. 4.8). Если вместо стеклянной призмы ввести в оптическую схему спект- спектральный прибор с щелью, позволяющий разрешить две резонансные линии натрия E890—5896 А.), то можно наблюдать более сложный ход показателя преломления внутри и вне натриевого дублета. Для количественных измерений диспер- дисперсии в разреженных газах и парах метал- металлов обычно проводят интерферометрические измерения, позволяющие заметить небольшие изменения показателя преломления. Методика таких измерений с использованием интерферометра Рождественского, наиболее приспособленного для решения данной задачи, обсуждена в § 5.8. § 4.5. МЕХАНИЗМ МАГНИТНОГО ВРАЩЕНИЯ ПЛОСКОСТИ ПОЛЯРИЗАЦИИ В рамках излагаемой теории можно исчерпывающе истолковать классические эксперименты Фарадея, впервые наблюдавшего вра- вращение плоскости поляризации в оптически неактивном веществе, по- помещенном в продольное магнитное поле. Рассмотрим основные результаты таких экспериментов и объясним их с позиций электрон- электронной теории. Опыт проводят по схеме, представленной на рис. 4.9: между скре- скрещенными поляризаторами вводят оптически неактивное вещество, по- помещенное внутри катушки с большим количеством витков. При вклю- включении электрического тока внутри катушки возникает продольное маг- магнитное поле и на экране наблюдается светлое пятно — свет от внешне- внешнего источника S проходит через скрещенные поляризаторы. Враще- Вращением анализатора Р2 можно убедиться, что в данном случае действи- М#1Г 1 l lii П1 V7\ Рис. 4.9. Схема опыта Фарадея 125
uvii.uo плоскость поляризации поворачивается йа некоторый угол (р. При повороте анализатора на угол ср свет не проходит через систему. Угол ф пропорционален напряженности магнитного поля Явнеш и пути света / и исследуемом веществе: Ф = рНвнеш1. D.26) Коэффициент р называют постоянной Верде. Он неодинаков для разных оптических материалов и невелик. Поэтому требуются сильные поля, чтобы эффект был значителен. Обычно в качестве вращающего вещества используют специальные сорта стекла (например, тяжелый флинт, для которого р « 0,08 см Э"). Коэффи- Коэффициент р зависит от длины волны исследуемого света (р ^ 1Д2), поэтому для количественных измерений нужно монохроматизировать излуче- излучение источника S с помощью какого-нибудь фильтра. Важной особенностью эффекта является его малая инерционность (время установления мень- Рис 410 Усиление ше 10~9 с>' а также независимость от направ- эффекта ' магнитного ления лУча- Отсюда следует, что угол вращения вращения плоскости в данном веществе определяется направлением поляризации при мно- магнитного поля Явнеш. Последнее свойство гократных отраже- (отличающее вращение в магнитном поле от ниях естественного вращения) позволяет увеличить суммарный угол поворота плоскости поляриза- поляризации системой отражений, на что указывал сам Фарадей (рис. 4.10). За последние годы этот эффект широко используется при решении различных задач, в частности связанных с лазерной техникой. Малая инерционность эффекта позволяет применять его для модуляции све- света, создания оптического затвора и т. д. Были найдены и синтезированы новые вещества с большим значением постоянной Верде. Большую роль эффект Фарадея играет при научных исследованиях. При изучении явления следует иметь в виду, что в данном слу- случае, как и в предыдущих задачах, нужно рассчитать действие элект- электромагнитной волны на излучающий электрон. При изучении диспер- дисперсии вещества учитывалось лишь действие вектора Е, так как в формуле Лоренца f = qE + - [vH] второй член в vie раз меньше первого. с Но при истолковании эффекта Фарадея необходимо учесть действие внешнего поля #внеш, которое во много раз больше напряженности магнитного поля электромагнитной волны. Следовательно, членом f [vHBneilI] пренебречь уже нельзя. Пусть все остальные исходные предпосылки полностью соответ- соответствуют задаче о вычислении смещения квазиупругосвязанного элект- электрона в поле световой волны (см. § 4.2). В качестве вынуждающей силы здесь будет фигурировать не произведение qE, а сила Лоренца, кото- 126
рую в данном случае следует записать в виде D.27) Во всех последующих выкладках будем считать Нвнеш = Ввнеш. Это приближение вполне законно, так как в опытах по искусствен- искусственному вращению используют прозрачные тела, у которых, как прави- правило, |Л ^ 1. На первой стадии рассмотрения эффекта Фарадея пренебрежем затуханием колебаний, т. е. будем считать, что у = 0 (тормозящая сила отсутствует). Известно, что такое приближение законно вдали от линии поглощения. Пусть Нвнеш направлено вдоль оси Z и в этом же направлении рас- распространяется световая волна. Напряженность ее электрического поля Е и смещение электрона г лежат в плоскости XY, перпендику- перпендикулярной оси Z. Дифференциальное уравнение осциллирующего элект- электрона в этом случае mr + fr=q(E f ± [гНвнеш]) . D.28) Вводя стандартное обозначение flm = cog и переходя к состав- составляющим векторов по координатным осям Хи 7, имеем: Г*~~т7 Гу Явнеш + °)§ r*=JtЕх' D.29) Гу + — Гх #виеш + <°0 Гу = -3-Еу. тс т Вместо двух вещественных дифференциальных уравнений D.29) составим одно комплексное дифференциальное уравнение. Для этого умножим второе из уравнений D.29) на i и сложим получившиеся выражения. Тогда D.30) Напомним, что исходную линейнополяризованную волну всегда можно разложить на две распространяющиеся в том же направлении циркулярно поляризованные волны (по правому и левому кругам). В этом и заключается физический смысл проведенной математической операции — перехода от вещественных уравнений D.29) к комплекс- комплексному уравнению D.30). Если в результате решения уравнения D.30) окажется, что показатели преломления для двух циркулярно поля- поляризованных волн не одинаковы (япр Ф плев), то тем самым будет до- доказано наличие поворота плоскости поляризации суммарной волны, получающейся в результате сложения двух циркулярно поляризо- поляризованных волн после прохождения ими в веществе некоторого пути / при наличии продольного внешнего магнитного поля Явнеш Ф 0. т
Итак, считаем, что «на входе» в вещество (г = 0) имеются две вол- волны, поляризованные по кругу, а именно: Ех = Ео cos at, Ey = ±Е0 sin со/. D.31) Запишем их следующим образом: Ех + iEy = Ео exp (tot) (правое вращение), Ех + iEy = Ео ехр (—ш/) (левое вращение). Ищем решение уравнения D.30) в виде гх + iry «= г0 ехр (±Ш). После дифференцирования и подстановки этого выражения в D.30) находим Го= Заметим, что в отличие от формулы D.4), описывающей смещение осциллирующего электрона при наличии тормозящей силы, полученное выражение D.32) вещественно. Этого и следовало ожидать, так как поглощением мы пренебрегаем, а магнитное поле лишь изменяет на- направление движения электрических зарядов, но не тормозит их. Дальнейшие выкладки очевидны: рассчитаем поляризацию среды Р = Nqr и приведенным выше способом (см. § 4.2) найдем п2 = 8 = 1 + 4лР/Е. В результате получается следующая формула: Актт ( Это выражение содержит решение сформулированной выше зада- задачи. Для волны, распространяющейся в исследуемой среде, получены два значения показателя преломления ппр и ллев, и тем самым до- доказан поворот плоскости поляризации, непосредственно связанный с наличием продольного магнитного поля Нтет. Для получения в явном виде измеряемых на опыте величин за- запишем D.33) в виде «лев—nip — т (cog—со2J — Обозначим п = левТ п?. и пренебрежем квадратом получив- получившегося в знаменателе добавочного члена (~|/ тогда пт* с (cog—с 128
Используя формулу C.16), связывающую разность показателей преломления с углом поворота <р плоскости поляризации для волны, прошедшей путь / в исследуемой среде, находим (ПлевПпр) / ^ ^^ - D.35) Сравнивая это соотношение с экспериментальной формулой D.26), получаем следующее выражение для постоянной Верде в эффекте Фарадея: 2nNq3 аз2 /л О/?ч р = ■* » D.36) П1П*С* (й)* — 0JJ ' При (о<^оH (электронные полосы поглощения лежат в ультра- ультрафиолетовой области спектра) можно пренебречь со2 в знаменателе по- последнего выражения и в согласии с экспериментом получить зависи- зависимость постоянной Верде от частоты р ~ со2 ~ 1/%2. Вполне понятна также упоминавшаяся особенность искусствен- искусственного вращения: угол поворота не зависит от направления светового пучка и полностью определяется направлением внешнего магнитного поля. Это следует как из формулы D.35), так и из самой общей поста- постановки данной задачи, при которой рассматривается не направление Н в электромагнитной волне, а направление внешнего магнитного поля "внеш* Используя зависимость D.6), запишем выражение D.36) в виде р = _2_0-*!. D.36а) ^ 2/лс2 дсо Это более общее выражение оказывается в некоторых случаях удобным для определения постоянной Верде. Так, если известно дп/доь, то при вычислении р не нужна оценка частоты собственных коле- колебаний упруго связанного электрона соо- В частности, выражение D.36а) пригодно для описания вращения плоскости поляризации при наложении продольного магнитного поля на вещество, электроны которого можно считать «свободными» (ю0 = 0). Представляет интерес искусственное вращение плоскости поляри- поляризации при освещении образца излучением, частота которого близка к частоте поглощения исследуемого вещества, т. е. когда затуханием колебаний нельзя пренебречь. Эта задача осложнена тем, что до сего времени мы не интересовались, что происходит со спектральной ли- линией, если источник света или поглощающая среда помещены в маг- магнитное поле. Как было впервые установлено в 1896 г. Зееманом, при этом линия расщепляется на несколько компонент (эффект Зеемана). Число таких компонент, взаимное расположение и относительная ин- интенсивность определяются структурой энергетических уровней, при переходах между которыми возникла исследуемая спектральная ли- линия, и существенно зависят от напряженности приложенного магнит- магнитного поля. Эффект Зеемана — важное для спектроскопии и атомной физики явление, которое до конца объясняется с позиций квантовой механики. 5 Зак. 1729 129
I Aw I Ш a) Ait) Аи) При иекотором наиболее простом строении атомных уровней воз- возникает так называемый нормальный эффект Зеемана, который был объяснен с позиций электронной теории Лоренцем, получившим вместе с Зееманом за это открытие Нобелевскую премию по физике в 1902 г. При нормальном эффекте Зеемана линия расщеп- расщепляется на две компоненты, если наблюдение ведет- ведется вдоль поля (рис. 4.11, а), или на три компо- компоненты, если оно проводится перпендикулярно маг- магнитным силовым линиям (рис. 4.11, б). Опыт пока- показывает, что смещенные компоненты поляризованы по правому и левому кругам (а+- и ог*-компонен- ты), а несмещенная (я-компонента) линейно поля- поляризована. На рис. 4.12 приведена фотография спектральной линии неона (Ne), расщепленной магнитным полем C3 кЭ) на три компоненты (наблюдение велось перпендикулярно магнитным силовым линиям). Получим этот результат из представлений элек- электронной теории, а затем используем его для изу- изучения изменения показателя преломления вблизи спектральной линии, расщепившейся на две компо- компоненты в продольном магнитном поле. Это позволит истолковать эффект вращения плоскости поляриза- поляризации вблизи линии поглощения. Хотя нас интересует расщепление линии погло- цения, рассмотрим более простой случай — рас- расщепление линии испускания. Рассчитаем, как из- изменится частота колебаний со упруго связанного электрона при действии на него магнитного поля Нвнеш, направленного вдоль оси Z. Положим Е = 0, так как будет рассчитываться лишь изменение движения электрона при наложении внешнего маг- магнитного поля: Рис 4 11 Нормаль- Нормальный эффект Зеема- Зеемана Наблюдение вдоль поля (а) и перпенди- перпендикулярно силовым ли- линиям поля (б) г+©8г=-£-[гНвввш]. Рис 4 12. Фотогра- Фотография линии неона (Я = 6133 А), рас- расщепленной вследст- вследствие эффекта Зее- Зеемана на три ком- компоненты тс D.37) В направлении оси Z электрон колеблется так же, как и раньше, — составляющая векторного произведения вдоль оси Z равна нулю. Вводя обозначение / ==rx ± iry, получим в плоскости XY lit % : Я н *!./ i гл2 *./ л /л оо\ Т ±1 -Пвнеп/ -pCOgr =U. D,оо) тс Решением такого уравнения, описывающего круговое колебание, служит выражение вида г' = г0 ехр (/©/). В результате получаем следующее уравнение, из которого в дальнейшем и определим искомое изменение частоты: тс D.39) 130
Легко показать, что второй члей здесь мал по сравнению с Двумя другими. Положим о = соо ± Аса, где Асо <^ ю0 и пренебрежем чле- членами, содержащими в качестве множителя (АсоJ. В этом приближе- приближении получаем окончательный результат: я А(о=- 2тс Н виепг D.40) Рис. 4.13. Эффект магнит- магнитного вращения плоскости по- поляризации вблизи линии по- поглощения Мы установили, что при данной постановке опыта (наблюдение ведется вдоль внешнего магнитного поля) линия испускания расще- расщепится на две поляризованные по кругу алев- и апр-компоненты, сме- смещенные относительно соо на величину ±Асо. В центре, где при Н =0 находи- находилась бы исследуемая спектральная линия, не будет наблюдаться никакого излуче- излучения (см. рис. 4.11, а). Аналогично расщепляется линия по- поглощения при прохождении света сквозь исследуемое вещество в направлении ли- линий напряженности внешнего магнитного поля. Это позволяет установить, как изме- изменяется разность показателей преломления (#лев — Япр)> определяющая угол враще- вращения плоскости поляризации вблизи рас- расщепленной в продольном магнитном поле линии поглощения. Проще всего провести такую оценку графически. Для этого воспользуемся уже извест- известным нам графиком изменения показателя преломления вблизи линии поглощения (см. рис. 4.6). Сместив этот график вправо и влево на ~—Явнеш, получим две дисперсионные кривые A1B1C1D1 и A 2B2C2D2 (рис. 4.13). Затем вычтем ординаты одной кривой из ординат другой и определим результирующую кривую, характеризующую изменение угла поворота плоскости поляризации вблизи линии поглощения. В результате такого построения выявляются два интересных ре- результата. Во-первых, в узком спектральном интервале вблизи линии поглощения дважды меняется знак эффекта Фарадея; угол вращения плоскости поляризации имеет один знак вне интервала соо ± Асо и другой знак внутри этого интервала частот. Во-вторых, угол вращения вблизи линии поглощения может быть очень большим, так как в иссле- исследуемой области происходит резкое изменение показателя преломле- преломления и коэффициента поглощения и разность (птв — ппр) может при- принимать большие значения. Опыт подтверждает выводы этой простой теории, и вращение пло- плоскости поляризации парами металлов и другими веществами широко используется в современной атомной физике для определения атом- атомных констант, а также для ряда других весьма тонких измерений.
ГЛАВА V ИНТЕРФЕРЕНЦИЯ СВЕТА Физикам давно были известны многие оптические явления, непонятные с по- позиций геометрической («лучевой») оптики. К их числу относят кольца Нью- Ньютона (см. § 5.6) и другие чередующиеся полосы максимальной и минимальной освещенности (интерференционные полосы), происхождение которых, как мы те- теперь знаем, связано с возникающим в ряде опытов перераспределением пото- потока световой энергии в пространстве. Существенный прогресс в истолковании явления интерференции связан с именами Френеля, Юнга и других выдающихся физиков, работавших в начале XIX в. Развитая ими волновая теория, согласно которой световые волны пред- представляют собой возмущения,распространяющиеся в мировом эфире, в этот пе- период достигла наибольшего успеха, хотя исследование некоторых проблем (на- (например, интерференции поляризованных лучей) требовало очень сложных по- построений и необычных гипотез о свойствах эфира. Электромагнитная теория света, заменившая старую волновую теорию, позволила существенно упростить постановку задачи и решить ряд сложных интерференционных задач. Но при ее применении к проблеме интерференции воз- возникают трудности, связанные с тем, что в оптике, как правило, имеют дело не с монохроматическим волнами, а с импульсами, или волновыми пакетами. «Си- «Синусоидальная идеализация», которая оказалась вполне пригодной для описания широкого класса явлений, рассмотренных в предыдущих разделах, требует видоизменения при истолковании более тонких интерференционных эффектов. В математической физике доказывается законность замены волнового им- импульса суммой (конечной или бесконечной) монохроматических волн. Но при изложении этого важнейшего раздела волновой оптики представляется целесооб- целесообразным сначала рассмотреть ее основы более наглядно, используя упрощенную модель источника световых волн. Таким образом, формальная схема электромаг- электромагнитной теории дополнится качественным анализом условий обрыва колебаний и связанного с ним уширения линий излучения. При этом можно оценить те границы, в которых может быть использована синусоидальная идеализация. Но прежде всего нужно определить основные понятия и проанализировать, как они проявляются в эксперименте. § 5.1. КОГЕРЕНТНОСТЬ КОЛЕБАНИЙ Пусть в некоторой точке пространства Р одновременно существу- существуют две произвольные (в общем случае немонохроматические) элект- электромагнитные волны Ех и Е2. Согласно принципу суперпозиции, на- напряженность результирующего поля равна Е = Ех + Е2. Для перехода к энергетическому описанию возведем это равенство в квадрат: Е2 = (Ех + Е2J =Е\ + Е1 + 2ЕХЕ2. E.1) Если измерять потоки электромагнитной энергии (в случае свето- световых волн измеряется поток световой энергии или освещенность какой- либо поверхности), то надо учесть инерционность измерительной аппа- аппаратуры, которая обычно довольно велика. Во всяком случае, весьма трудно осуществить безынерционное измерение процессов, имеющих 132
ум цельность того же порядка, что и время пребывания атома в воз- возбужденном состоянии, хотя в современной физике для этих целей используют приборы в миллион раз менее инерционные, чем челове- человеческий глаз (инерционность зрительного восприятия человека обычно оценивается по порядку величины в 0,1 с). Поэтому надо усреднить выражение E.1) и с данными опыта срав- сравнивать значение среднего квадрата напряженности электрического поля <£2> за относительно большое время Г. Значение f должно выбираться в соответствии с инерционностью приемной аппаратуры. Итак, вместо E.1) нужно рассматривать соотношение <£2>=<(Е1 + Е2J>=<£?> + <£1> + 2<Е1Е2>. E.2) При измерении средней суммарной энергии <СЕ2> мы неизбежно встречаемся с двумя различными результатами опыта в зависимости от того, что получается при усреднении произведения <Е1Е2>, названного интерференционным членом: Случай 1 Случай 2 ? > + <£8>, E.3) (при <Е1Е2> = 0), (при <Е1Е2>^0). В случае 1 суммарная освещенность равна сумме освещенностей, создаваемых каждым источником света (интерференция отсутствует). В случае 2 суммарная освещенность не равна сумме освещенностей (имеет место интерференция). Неравенство <.Е1Е2> ¥* 0 служит необходимым условием воз- возникновения интерференции. Здесь следует подчеркнуть, что наруше- нарушение аддитивности энергетических характеристик связано, конечно, не с нарушением закона сохранения энергии, а с перераспределением потока энергии в пространстве. Не будем сейчас рассматривать частный случай наложения двух плоских монохроматических волн разных частот или поляризованных во взаимно перпендикулярных направлениях, когда <EiE2> равно нулю. Здесь исследуется наложение двух произвольных (немонохрома- (немонохроматических) электромагнитных волн. Ранее при изучении монохромати- монохроматических колебаний мы исходили из уравнения Е = Re Ео exp [i (at — ср)] = Ео cos (at — ф), где £0, со, ф — константы, не зависящие от времени. Для произволь- произвольной электромагнитной волны и амплитуда Ео, и фаза ф могут зави- зависеть от времени. При этом, так же как в формуле A.246), описываю- описывающей квазимонохроматическую волну, рассматривается возможность модуляции амплитуды Ео или фазы ф колебания. Предполагается, что частота ш остается постоянной, а возможность ее вариаций учитыва- учитывается изменением во времени фазы ф (t). 133
Простыми тригонометрическими преобразованиями можйо полу- получи ib выражения для амплитуды и фазы суммарного колебания: Ег @ = Е10 @ cos Ш — фл (/)], Е2 @ - £20 @ cos Ы - ф2 @1, Е (t) - Ег (/) + Е2 (t) - £0 (/) cos Ш - Фо @1, где Ео (О=/£?о @ +£1о @ + 2£10 (/) £2о @ cos [Фх @ - , = £10 @ sin ф! @+Е2р @ sin ф2 @ 8 £ю @ cos ф1 @+Е20 (/) cos Ф2 (/) Если колебания случайно обрываются или происходит хаотиче- хаотическое изменение их фазы за время усреднения, то на опыте всегда будет наблюдаться сумма интенсивностей / = 1г + /2, т. е. отсутствует интерференционный член. В самом деле, /^<£2> — <£§> (см. § 1.4). Тогда даже в случае, когда амплитуды Е10 (t) и £20 (t) можно считать неизменными за время усреднения, получаем v v E.4) Если за время усреднения f разность фаз ((рг — ф2) много раз из- изменялась так, что cos (фх — Ф2) принимал как положительные, так и отрицательные значения, то J cos (фх — ф2) dt стремится к нулю и интерференционный член отсутствует. Следовательно, можно сфор- сформулировать необходимое условие существования интерференции в дру- другой форме: для возникновения интерференции необходимо, чтобы раз- разность фаз фх — ф2 сохраняла свое значение за время усреднения. Поэтому и вводят фундаментальное понятие когерентных колебаний, для которых разность фаз за время наблюдения остается неизменной. Интерференция может происходить в случае негармонических коле- колебаний, когда фаза каждого колебания является какой-то функцией времени, но их разность постоянна. Иными словами, возможно, что <Pi = <Pi @» ф2 = ф2 @> но <Pi (*) - Ф2 @ = const. E.5) Очевидно, что два гармонических колебания одной частоты всегда когерентны. Гармонические колебания порождают монохроматические волны, способные интерферировать. Равенство частот интерферирую- интерферирующих волн (% = ш2) и неперпендикулярность векторов Ег и Е2 служат дополнительными требованиями, превращающими необходимое усло- условие E.5) в достаточное. Правда, следует учитывать, что при а>х Ф со2 (точнее, при щ — ш2 = бсо, где |бш|<С. Щ и |бш|<<(о2) все же мо- 134
>мт наблюдаться нестационарная интерференционная картина (бие- (биении). Вопрос об интерференции неполяризованных колебаний будет подробно исследован в § 5.5. Для негармонических колебаний наличие корреляции фаз служит необходимым условием их когерентности. При постановке опытов по интерференции световых волн очень важно правильно выбрать на- п|)лвление и ограничить угол, под которым наблюдается интерферен- интерференционная картина. Несоблюдение этих условий часто приводит к исчез- исчезновению эффекта. При описании интерференционных явлений часто используют понятия временной и пространственной когерентности*^. Временною когерентность обычно связывают со степенью мо- монохроматичности исследуемых колебаний, а сте- степенью пространственной когерентности характе- характеризуют геометрию экспериментов. В дальнейшем (см. § 5.4) понятие пространственной когерентно- когерентности будет подробно обсуждаться при рассмотрении ' наложения интерференционных картин от многих рИс. 5.1. К форму- элементарных источников, образующих протяжен- лировке понятия ный источник света. комплексной степе- Необходимое условие возникновения интерфе- ни когеРентности ренции (неравенство нулю интерференционного члена) можно сформулировать в рамках других, весьма общих пред- представлений. Рассмотрим суммарное колебание в точке Р, создаваемое двумя источниками световых волн частоты со, удаленными от точки Р на расстояния О±Р =гх и О2Р =г2 (рис. 5.1). Первый и второй ис- источники излучают волны Ег = Е10 (t) еш и Е2 = Е20 @ еш, ам- амплитуды которых можно представить комплексными числами. Если обе волны распространяются в одной среде с показателем преломления п и дисперсия отсутствует, то сразу можно оценить Д/х и Д/2—времена запаздывания колебаний в точке Р по сравнению с колебаниями в точ- точках Ог и О2: Д^ =гг/и, At2 =r2/u. E.6) Суммарная интенсивность колебания в точке Р будет определяться следующим выражением, которое запишем, используя правила об- обращения с комплексными числами и пренебрегая изменением ампли- амплитуд вследствие разницы расстояний г2 и rl9 в виде / = <{Е10 (t- Д« + Е20 (t - Д/2)} '{£!oMtt+ EU (t - E.7) Считая, что начало отсчета времени сдвинуто на Д£ = Д*2 — Д^, получим после несложных преобразований E.8) *) См.: Франсон М., Сланский Е, Когерентность в оптике. М., «Наука», 1967, 135
11срвые два члена равенства E.8) характеризуют энергию, излучае- излучаемую каждым источником, а последний (интерференционный член) описывает пространственное перераспределение суммарной энергии в результате интерференции. Величину <£10 (* + АО Eh @> E.9) называют функцией корреляции. Обычно ее нормируют. Для этого выражение E.9) делят на l/7jT2 и полученную функцию б определяют как комплексную степень когерентности излучаемых колебаний. Тогда выражение E.8) для суммарной интенсивности двух взаимо- взаимодействующих в точке Р пучков света имеет вид /(P) = Ii(Р) + h(Р) + 2ReVli (P) h(P) Yi2(АО- EЛ0) Степень когерентности у12 (АО можно вычислить для различных конкретных задач и, таким образом, оценить предполагаемое качество (видимость) интерференционной картины. Можно поступить и ина- иначе — оценить 7i2 (АО из характера получае- получаемой на опыте интерференционной картины. Если волны Ех и Е2 создаются двумя со- совершенно независимыми источниками, то степень когерентности равна нулю и интен- интенсивность в точке Р равна сумме интенсивно- стей. В другом предельном случае — при ин- интерференции двух монохроматических волн — Рис. 5.2. к интерферен- степень когерентности порождающих их гар- ции двух монохроматиче- монических колебаний равна единице. точечный истГниГами Отл™ ?ока исследование физических Sx и s2 причин случайного изменения фаз колебании за время наблюдения и рассмотрим схему яв- явления, по-прежнему пользуясь синусоидаль- синусоидальной идеализацией (что полностью соответствует условиям распро- распространения монохроматических волн). Результаты такого исследова- исследования послужат своеобразным тестом. Мы получим возможность срав- сравнивать с ними более сложные явления, наблюдаемые при супер- суперпозиции произвольных электромагнитных волн, и оценивать, в ка- какой степени они соответствуют нашей идеализованной схеме. Пусть S± и S2 (рис. 5.2) — источники, каждый из которых излу- излучает монохроматическую волну Ег и Е2 соответственно. В качестве таких источников S± и S2 можно выбрать две узкие параллельные щели в непрозрачном экране, освещенные светом монохроматического ис- источника. Для простоты будем считать, что источники St и S2 испускают волны, имеющие в точке Р одинаковые амплитуды £0; такое предполо* 136
жение вполне законно, так как расстояние D значительно больше 21. Все колебания направлены одинаково, поэтому можно считать нашу задачу скалярной. Имеем Ех = Ео cos (at — krj, Е2 = Ео cos (cot — kr2). Поле Е, создаваемое суммарным колебанием, определяется выра- выражением ) E.11) Обозначим r2 — гг = Д. Величину А называют разностью хода; смысл этого названия понятен из рис. 5.2. В выражении E.11) легко выделить амплитуду суммарного колебания 2 Ео cos (&A/2). Как из- известно, интенсивность света / пропорциональна квадрату амплитуды, т. е. ^ (^) E.12) Исследуем это выражение и найдем те значения А, при которых наблюдается максимальная и минимальная интенсивность: при kA = ±2тп% /мин = 0 при kA = Bт + 1) я. Здесь т называемое порядком интерференции, принимает значе- значения 0, 1, 2, ... Условие возникновения экстремумов интенсивности можно сформулировать в другой общеизвестной форме, исключив k = 2лД. Условие максимума А = тЯ = 2т%/2, т. е. разность хода А равна четному числу полуволн. Условие минимума А = Bт + 1) Я/2, т. е. разность хода А равна нечетному числу полуволн. Мы рассмотрели наиболее простой случай — волны Ех и Е2 рас- распространяются в вакууме (д=1, X =Я0). Если одна из них про- проходит в среде с показателем преломления п19 а вторая — в среде с по- показателем преломления п2, то вводят понятие оптической разности хода (разность произведений ггпг). В этом случае разность фаз двух интерферирующих колебаний ^ ^(r2nz-rini). E.13) Если оптическая разность хода равна нулю (/уг2 = г^), то Аф =0 и будет наблюдаться максимальная интенсивность. Именно так, кста- кстати говоря, работает собирающая линза, которая не вносит дополни- дополнительной разности хода в лучи, образующие изображение. Однако по- понять фокусирующее действие линзы с позиций волновой оптики не просто. Для этого надо учесть интерференцию вторичных волн, что делается при изучении явления дифракции (см. гл. VI). 137
Рассчитаем зависимость освещенности экрана от h — расстояния от точки Р до оси симметрии (рис. 5.2), что позволит предсказать, ка- какой будет наблюдаемая на экране стационарная картина интерферен- интерференции. Очевидно, что при D 2> 21 и D ^> h 21 D ' Л Следовательно, и на экране будет наблюдаться периодическое изменение освещенно- освещенности (рис. 5.3), а именно чередование светлых и темных полос. Исполь- Используя условие возникновения максимальной освещенности Д =тХ и соотношение E.14), имеем ft =ч mDX/Bl). Тогда для расстояния между двумя максимумами — ширины поло- полосы 8ft — получим 1 - м A i 8ft = _,_ ;за?исимос?иСот Теперь имеются все данные, чтобы оце- расстояния до оси сим- нить возможность наблюдения интерферен- метрии ции. Пусть D « 100 см; Я « 5 • 10~6 см; 21 ж 0,05 см =0,5 мм. Тогда 8ft ж 0,1 см. Такие интерференционные полосы должны хорошо наблюдаться невооруженным глазом. Но оказывается, что на опыте невозможно получить стационарную картину интерференции двух пучков света, возникших при освещении двух щелей в непрозрачном экране произ- произвольным источником света. Такие попытки делались многими учены- учеными, начиная с XVII в. Однако все они кончались неудачей. Отсюда можно сделать только один вывод: в обычном источнике света имеется громадное количество некогерентных излучателей, которые хаоти- хаотически высвечиваются после непродолжительного пребывания в воз- возбужденном состоянии. Совершенно невозможно предположить, что в этих случайных процессах (спонтанное излучение) существует ка- какая-либо корреляция между фазами излучаемых обрывков синусоид и наблюдаемая на опыте картина (равномерная освещенность экрана) абсолютно не соответствует тому расчету, который был проведен для интерференции двух монохроматических волн. Вместе с тем стационарная картина интерференции пучков света, прошедшего через две щели (без всякого дополнительного устрой- устройства), легко наблюдается при освещении их излучением лазера. Этот опыт доказывает, что в данном случае допустима синусоидальная иде- идеализация, принятая в проведенном выше расчете, и лазер представля- представляет собой источник пространственно когерентного света. Мы не рас- рассматриваем механизм генерации излучения лазера и лишь упомянем, что в нем определяющим является не спонтанное, а вынужденное излу- 138
чение, при котором все излучающие атомы жестко связаны по фазе, что и обусловливает его когерентность (см. § 8.3). \ При постановке этого опыта можно использовать неон-гелиевый лазер, генерирующий на длине волны 0,63 мкм (красная область спект- спектра). На металлическом слое зеркала, нанесенном на прозрачную под- подложку, делают два почти параллельных штриха (расстояние между ними примерно равно 0,3 мм). Вводя эти две щели в лазерный пучок и перемещая их на небольшие расстояния в плоскости, перпендику- перпендикулярной лучу, легко добиться оптимальных условий наблюдения ин- интерференционной картины. Никакая фокусирующая оптика в таком эксперименте не нужна. Лазер располагают в 5—6 м от экрана. Для увеличения масштаба интерференционной картины выбирают направ- направление светового луча так, чтобы он составлял некоторый угол с поверхностью экрана (рис. 5.4). При таких условиях ширина интерференционной полосы рав- равна примерно 1 см, а освещен- освещенность и контрастность ИНТерфе- Рис. 5.4. К интерференции от двух ще- ренционной картины вполне до- лей ПРИ освещении их когерентным ис- статочны для ее наблюдения на точником света (лазером) расстоянии 15—20 м. Возвращаясь к обычным (не лазерным) источникам света, следует указать, что лишь в XIX в., усовершенствовав условия опыта (силь- (сильно уменьшив угловые размеры источника, для чего в пучок света вводилась дополнительная щель; см. рис. 6.47), Юнгу удалось полу- получить стационарную картину интерференции от двух щелей и впервые измерить длину волны света. В § 6.6 будет рассмотрена геометрия опы- опыта Юнга, позволяющая как бы заменить протяженный источник света точечным. Заметим, что введение дополнительной щели, обеспечиваю- обеспечивающей когерентное освещение двух основных щелей, резко уменьшает используемый световой поток, что затрудняет осуществление этого очень важного опыта. Необходимо также подчеркнуть, что при выполнении опыта Юнга или какого-либо другого интерференционного опыта с использова- использованием обычных (не лазерных) источников света, на экране, как прави- правило, наблюдается такое периодическое изменение освещенности, при котором /мин Ф 0. Для количественной характеристики качества интерференционной картины вводят функцию видимости // E.15) /макс+Лиин где /маКс и ^мин — экспериментально найденные величины. Очевидно, что рассмотренным выше двум предельным случаям соответствуют следующие значения этой функции: а) при освещении двух щелей когерентным источником света (например, излучением лазера) на экране возникает интерференцион- 139
или картина, интенсивность которой хорошо описывается синусои- синусоидой. В этом случае /мин = О, V = 1; б) при освещении двух щелей некогерентным источником света никаких полос интерференции не возникает — наблюдается равно- равномерная освещенность экрана, т. е. /макс = /мин, V = 0. Но, как уже указывалось, кроме некогерентного (V = 0) и коге- когерентного (V = 1) освещения может иметь место промежуточный слу- случай — на экране наблюдается интерференционная картина, но ее качество хуже, чем при когерентном освеще- 7V- — -у^- нии. Тогда функция видимости больше нуля, ^\ Г\ но меньше единицы @< V<. 1). Назовем два \/ \/ источника света, создающие такую картину ин- —^——■ г терфёренции, частично когерентными. В даль- /А а' нейшем последнему случаю будет уделяться наибольшее внимание. Заметим, что иногда I практикуется представление частично когерент- UJ /? ного света как суммы когерентного и некоге- рентного излучений. Тогда степень когерентно- сти просто интерпретируют как долю когерент- ного света. На рис. 5.5 представлены три возможных результата взаимодействия двух пучков света. ПРИ их сопоставлении легко усмотреть связь ф ^ш^с^^и Р ур взаимодействии двух между функцией видимости и введенным ранее когерентных (а),неко- понятием степени когерентности, герентных (б) и ча- Действительно, используя E.10), легко оце- стично^ ^когерентных нить максимальную и минимальную интенсив- у { } ности результирующей волны / (Р): /макс (Р) = А (Р) + /, (Р) + 2 Vh (Р) /2 (Р) | Тц (AQ 1, Часто оказывается, что 1г (Р) = /2 (Р). Это наблюдается при интер- интерференции излучения двух идентичных источников света и разности хода \r2 — ril» малой по сравнению с г2 и /у, тогда V = (/макс - /мин)/(/макс + /мин) = IVn (A0I- E-16) Последнее соотношение позволяет сопоставить экспериментально найденное и рассчитанное значение функции видимости интерферен- интерференционной картины с оценкой степени когерентности двух исследуемых источников света. Модуль комплексной функции \у12 (At)\ и будет определять видимость интерференционной картины. Равенство V = \у12 (А/)| = 1 указывает на полную когерентность двух рассматриваемых колебаний. Используя выражение E.9а), можно показать, что |Yi2| равен единице при выполнении необходи- необходимого условия когерентности E.5) и равенства \Е20 (f)\ = а \Е10 (t)\, где а = const. Эти требования фактически означают синхронность фа- фазовой и амплитудной модуляции интерферирующих волн. 140
Ранее уже указывалось, что в оптике обычно приходится иметь дело не с монохроматическими волнами, а с цугами волн, являющимися от- отрезками синусоид. Чем меньше интервал времени т, в течение которого длится исходное колебание, тем больше отличается от монохромати- монохроматической порождаемая им волна. Таким образом, чрезвычайно важным оказывается изучение свойств квазимонохроматических волн, которые можно охарактеризовать во введенных выше терминах как частично когерентные, т. е. видимость создаваемых ими интерференционных картин отвечает условию 0 < V < 1. В § 5.8 описаны опыты, в которых исследовалась зависимость ви- видимости интерференционной картины от степени монохроматичности излучения, используемого для освещения интерферометра Майкель- сона (см. рис. 5.41, 5.42). Здесь же мы получим основные соотноше- соотношения для квазимонохроматического излучения. Они непосредственно вытекают из теоремы Фурье, согласно которой любую конечную и ин- интегрируемую функцию F (f) можно представить в виде интеграла* оо F (t) = j" / (v) exp (i2nvt) dv E.17) —00 или (обратное преобразование) / (v) = J F (t) exp (—i2nvt) dt. —oo В данном случае | / (v)|2 — распределение энергии колебаний по частотам. Покажем, к каким результатам приводит соотношение E.17) в наиболее простом случае, когда исследуемое колебание F (/) явля- является отрезком синусоиды. Пусть F (t) = /0 exp (i2nvot), если —т/2 < < t < т/2 и F (t) = 0, если \t\ >> т/2 (т — продолжительность иссле- исследуемого колебания). Вычислим распределение энергии колебаний по частотам для этого случая: т/2 J /2 v)-/, J expl-2ni(v-vo)t]dt=fo[ Si"^-y ]т E.18) -т/2 На рис. 5.6 изображены графики функций ReF(t) и |/(v)|2. Для сравнения на этом же рисунке приведены графики ReF (t) 11 l/(v)|2 Для строго монохроматического колебания; распределение но частотам для этого колебания определится простым равенством v - vft. * Точнее, функция F (t) должна удовлетворять условиям Дирихле и быть абсолютно интегрируемой в интервале (— оо, + оо). См.: Смирнов В. Курс иысшей математики. Т. 2. М., «Наука», 1967. Вопрос о физическом и математи- математическом разложении в спектр рассмотрен в § 6.7, 141
График квадрата модуля / (v) для отрезка синусоиды имеет вид кривой типа (sin х/хJ. Можно определить ширину этого распределе- распределения в шкале частот 6v (т. е. расстояние между точками, соответствую- соответствующими половине максимальной ординаты) и получить соотношение 8v E.19) являющееся основным для всей теории квазимонохроматических волн. С точностью до коэффициента порядка я зависимость т—l/6v остается одинаковой для всех возможных видов уширеиия спект- спектральной линии, природа которого весьма разнообразна. В § 5.2 мы -Г/2\ Т/2 Л Рис. 5.6. Временное представление функций ReF(t) для отрезка синусоиды и для безграничной синусоиды и их спектры качественно охарактеризуем основные физические процессы, приво- приводящие к уширению спектральной линии. Очевидно, что при любой степени приближения нельзя игнорировать наличие в обычном ис- источнике света громадного количества атомов, колебания которых не- некогерентны. Поэтому для описания физических явлений в таких системах целесообразно использовать статистический метод. § 5.2. СТАТИСТИЧЕСКОЕ РАССМОТРЕНИЕ ФИЗИЧЕСКИХ ПРОЦЕССОВ В ИСТОЧНИКАХ СВЕТА Для изучения физических процессов, связанных с излучением све- световых волн, примем следующую модель источника света. В некоторой области пространства находится совокупность N атомов. В каждом атоме имеется один оптический электрон, а колебания этих N электро- электронов (гармонических осцилляторов) и обусловливают излучение сис- системы. Будем считать, что направления всех колебаний одинаковы (в дальнейшем мы снимем это ограничение) и, следовательно, можно рассматривать скалярную задачу. Частоты и амплитуды колебаний 142
оптических электронов (со и а соответственно) также одинаковы. Тогда напряженность поля Ek, создаваемая k -м атомом в произ- произвольной точке А на оси Z (рис. 5.7), определится выражением Ek = Re aexp [i (cot — ф/,)] ~ a cos (а>/ — ц>к). E.20) Согласно принципу суперпозиции, напряженность суммарного по- поля в этой точке равна N £=2 Ek=bcos((ot—ф). Усложним схему. Пусть в моменты времени т, 2т, Зт и т. д. одно- одновременно меняются случайным образом фазы колебаний всех элект- электронов. Тогда суммарное колебание изобра- изобразится графиком, представленным на рис. 5.8. Моменты времени t и t + т приходятся на два совершенно независимых значения фа- фазы ф. Амлитуда колебания Е постоянна лишь в течение интервала времени т. Такое колебание можно описать выражением Е = Ео (t) cos Ы — ф @1. E.21) Сложнее описать случай неодновременно- неодновременного изменения фаз колебаний оптических элек- электронов. Пусть, например, в каждый момент времени, отстоящий на т/Л/" от предыдущего, меняется фаза только одного из колебаний. Очевидно, что существенное изменение фазы и амплитуды суммарного колебания накопится лишь за время т. Действительно, если ввести At = nxIN (где п = 1, 2, 3, ...), то до тех пор, пока At<^x (т. е. п << N), изменение фазы и амплитуды сум- суммарного колебания будет незначительным, так как это изменение It f Рис. 5.7. Поле Ек, созда- создаваемое в точке А гармо- гармоническим осциллятором, расположенным в начале координат Колебания оптических элек- электронов направлены вдоль оси X Рис. 5.8. Пример хаотически модулированного колебания коснулось лишь малой части атомов. Заметные изменения в амплитуде и фазе накапливаются за время т. Следовательно, и в данном случае величина т, которая имеет здесь смысл среднего периода модуляции, сохраняет свое значение. Такую схему можно обобщить на случай любого закона изменения фаз фь, так как мы вправе считать, что в среднем изменение фазы всегда происходит через время порядка %IN. 143
Итак, действительно имеет смысл говорить о квазимонохромати- квазимонохроматической волне Е = Ео (t) cos [Ы — ср (t)]9 которая в течение времени т сохраняет фазу и амплитуду. При энергетическом описании исследуемой схемы надо оценить среднее значение квадрата амплитуды суммарного колебания <£§@>- Оно оказывается равным Na2. Это очевидное соотношение легко N получается из следующих соображений. Если Е = 2 Ek = = Ео (t) cos [cof — ф@Ь то в результате простых преобразований, аналогичных E.4), имеем £§= E.22) Усредняя это выражение за большой промежуток времени, полу- получаем <S2cos(q>k-q>,)>=0 E.23) и, следовательно, E.24) Здесь важно отметить, что средний период модуляции т не зависит от числа N гармонических осцилляторов, а определяется тем интер- интервалом времени, в течение которого в среднем длится каждое от- отдельное колебание. Рис. 5.9. Усложненная модель колебаний оптического электрона Проведем незначительное усложнение модели. Пусть колебание каждого гармонического осциллятора (оптического электрона) сос- состоит из «вспышек» средней продолжительностью т, следующих одна за другой в среднем через время т', причем от вспышки к вспышке фазасрь меняется хаотически (рис. 5.9). Тогда для суммарного ко- колебания снова применимо соотношение Е = Ео (t) cos [co£ — <р (£)], но при вычислении <£§ @> необходимо учесть соотноше- соотношение между тих'. Введенные параметры тит' имеют смысл средних величин и определяются физическими процессами в источнике света. Основными процессами, характеризующими свечение источника, служат потеря энергии оптическим электроном вследствие излучения с характерным средним временем тИ8Л (~10~8 с) и соударения атомов 144
с характерным средним временем туд. Соударения могут привести к по юре энергии возбужденным атомом, т. е. к тушению свечения. г) юг процесс играет большую роль при большой плотности излучаю- излучающего газа, когда вероятность атомных столкновений велика (туд <^ < ^ т,!зл). Вместе с тем нетрудно представить себе физический экспе- эксперимент, в котором вероятность соударений пренебрежимо мала и время высвечивания атомов определяется тизл. Например, в случае свечения пучка атомов, возбуждаемых скрещенным с ним пучком электронов или светом. Это слабое свечение, наблюдаемое в направле- направлении, перпендикулярном движению атомов, используется в некоторых тонких спектроскопических исследованиях. В случае свечения газоразрядной плазмы низкого давления тоже имеет место неравенство туд ^> тизл, но здесь дополнительно прояв- проявляется хаотическое тепловое движение атомов. Из-за эффекта Доплера (см. § 7.3) излучение каждого из них следует характеризовать своей частотой Eh = a cos ((oht — q>ft). E.25) После сложения таких колебаний оказывается, что средний про- промежуток времени, в течение которого можно считать амплитуду и фазу постоянными, намного уменьшается. Природа явления (эффект Доплера) и способы измерения этого времени (на 1—2 порядка мень- меньшего, чем тизл) будут рассмотрены позже. Итак, мы видим, что ряд физических процессов, происходящих в источнике света, определяет наименьший интервал времени, в те- течение которого фазу и амплитуду квазимонохроматической волны можно считать постоянными. Этот промежуток времени характеризует допустимую временную задержку, в течение которой сохраняется когерентность, т. е. выполняется условие E.5). Назовем этот проме- промежуток временем когерентности и обозначим его через тког. Методы определения тког будут обсуждены в § 5.8. Для обычных (не лазер- лазерных) источников оно равно по порядку величины 10~9—10~10с. Именно из такого значения тког следует исходить при оценке очень важной физической величины — длины когерентности, т. е. расстояния LKOr = стког, на которое распространилась волна за вре- время, пока ее фаза и амплитуда оставались в среднем постоянными*. Очевидно, что (при указанном тког) длина когерентности в оптике сос- составляет 3—30 см и лишь в очень благоприятных условиях может до- достигать примерно 1 м. При разности хода Д < огког может происходить интерференция (хотя пока еще не уточнен конкретный способ ее наблюдения). Этот основной результат можно также использовать и для измерения длины когерентности (см. § 5.8). Следует заметить, что приведенные выше оценки (стког« «3 — 30 см) хорошо согласуются с результатами эксперимента при использовании обычных источников света (например, газоразрядной * При решении некоторых частных задач LKor может совпадать с длиной волнового цуга, равной стИЗл» 145
плазмой низкого давления), но не лазеров. Эффект генерации ё лазере связан с вынужденным излучением, а не со случайными (спонтанными) переходами, которые рассматривались при построении тех или иных статистических схем. Для лазера схиог значительно больше, чем для обычных источников света. Это демонстрируется опытом с неон-ге- неон-гелиевым лазером, в котором интерференция наблюдается при разности хода в несколько десятков метров (см. § 5.8). В радиотехнике также полезно введенное понятие длины когерент- когерентности. Но если исключить различные технические неполадки и не- недостатки схемы и связывать тког только с флуктуациями в генераторе радиоволн, возникающими, например, в силу «дробового эффекта» (см. § 8.4), то для тког по- получается величина порядка Направления колебании электроноб lQQ ч> что соответствует i у£ Т больше размеров солнеч- /^ ной системы, что означает отсутствие принципиаль- принципиального предела дальности ра- Рис. 5.10. Модель возникновения неполяризо- диоинтерферометрических ванного света измерений. Эффективность такого метода будет опре- определяться лишь энергетическими соотношениями (в частности, отно- отношением сигнал/шум) и уже упоминавшимися техническими погреш- погрешностями используемых радиотехнических устройств. Чтобы завершить описание основных явлений в источниках света, снимем сделанное в начале параграфа ограничение, налагаемое на на- направление колебаний оптических электронов. Мы увидим, что это сразу позволит ввести модель возникновения естественного (неполяризо- ванного) света (рис. 5.10). Заметим, что в данном случае термин «ес- «естественный» относится только к характеристике степени поляризации излучения. Частота и длительность всех колебаний по-прежнему одинакова и ею определяется спектральный состав интегрального излучения. Будем считать, что в среднем 1/3 всех электронов колеблется вдоль оси X (назовем их ^-электронами), 1/3 вдоль оси Y и 1/3 вдоль оси Z. Рассмотрим излучение, распространяющееся вдоль оси Z, которое создается х- и ^-электронами (понятно, что г-электроны не излучают в направлении оси Z). Очевидно, что волны Ех и Еу, возникающие в результате колебаний х- и у-электронов, некогерентны вследствие полной независимости колебаний. Запишем их в виде Ех = Еох (t) cos Ш — фх (/)], E.26) Еу = ЕОу @ cos Ш — ф2 (/)]. Вместе с тем <£|> = <jEJ>, т. е. для интенсивности излучения характерна осевая симметрия. Остановимся на этом основном поло- положении несколько подробнее. 146
Конец суммарного вектора Е = Е* + Еу совершает движение по эллипсу в промежутки времени, меньшие тког, когда Еох, ЕОу, Фх и ф2 могут считаться постоянными. Уравнение эллипса получается из правила сложения двух взаимно перпендикулярных колебаний: . _£ 2ху EOx(i)Eoy(t) ■COS —Ф2@1 = E.27) Если проводить измерения за время, меньшее тког (что возможно при наличии безынерционной аппаратуры), то в принципе можно фикси- фиксировать форму и расположение каждого такого эллипса. Но аппара- Рис. 5.11. К вопросу об осевой симметрии непо- ляризованного света Рис. 5.12. Эллиптическая по- поляризация света в случае корреляции фаз q>i(/) и (О* тура всегда в той или иной степени инерционна, и приходится прово- проводить усреднение за время, значительно большее времени когерент- когерентности тког. Поэтому на опыте регистрируется огромное количество различно расположенных эллипсов с разными эксцентриситетами (рис. 5.11), что и обусловливает наблюдаемую осевую симметрию из- излучения — свет не поляризован. Предположим, что фазы исследуемых волн Ех и Еу в силу каких-то физических процессов оказываются скоррелированными [например, <Pi @ — Фг @ = const]. Если при этом (для случая полной когерент- когерентности колебаний) еще и амплитуды колебаний изменяются синхронно, т. е. Eqx (t) = агА (t) и Еоу (/) = a2A (/), то конец результирующего вектора Е будет описывать в разные моменты времени эллипсы раз- разных размеров, но вполне определенной формы (рис. 5.12). Очевидно, что в данном случае нет осевой симметрии, характер- характерной для неполяризованного света, т. е. <.El (t)> Ф <£\ (t)>. В зависимости от того, чему равна разность фаз фх (/) — ф2 (/), получаются все известные виды поляризации излучения. Так, если |ф1 @ —Фг @1 =0, я, ..., fcrt, то возникает линейная поляризация. Если |фх @ — ф2 @1 =я/2, Зя/2, ..., то при аг^аг получается круговая поляризация. Во всех остальных случаях корреляции фаз колебаний [фх (t) — ф3 (f) = const] наблюдается эллиптическая по- поляризация. 147
Все такие случаи можно проиллюстрировать наблюдением сло- сложения колебаний на экране осциллографа. Для этого на вертикаль- вертикальные отклоняющие пластины осциллографа подается напряжение через какой-либо фазовращатель, чем и обеспечивается контролируе- контролируемая корреляция фаз между двумя взаимно перпендикулярными коле- Гкшпямп. Описание этих эффектных радиофизических опытов и прин- цшкж действия соответствующих устройств приведено в книге Г. С. Го- Горелика*. Таким образом, понятие неполяризованного и поляризованного света можно интерпретировать в использованных выше терминах. Эллиптически поляризованный свет представляет собой сумму двух распространяющихся в одном направлении квазимонохромати- квазимонохроматических волн с разностью фаз между взаимно перпендикулярными коле- баними ф2 @ — Фх @> остающейся постоянной за все время наблю- наблюдения (т. е. между фазами существует корреляция). Линейная и кру- круговая поляризации служат частными случаями эллиптической поля- поляризации. Они возникают при определенных значениях разности скор- релированных фаз ф2 (t) — срх (t). Для получения круговой поляри- поляризации необходимо также равенство амплитуд взаимно перпендику- перпендикулярных колебаний. Неполяризованный свет тоже можно представить в виде суммы двух взаимно перпендикулярных колебаний, распрост- распространяющихся в одном направлении, но их фазы фх (t) и ф2 (t) никак не скоррелированы. Используя эти определения, можно представить себе действие любого поляризационного прибора. Например, кристаллическая плас- пластинка, вырезанная параллельно оптической оси, превращает линейно поляризованный свет в эллиптически поляризованный, так как между двумя взаимно перпендикулярными колебаниями со скоррелирован- ными фазами (они родились из одной волны) создается разность фаз, зависящая от толщины пластины. Но если пластинка очень толста и добавочная разность хода А больше длины когерентности стког, то фазы прошедших колебаний уже не будут скоррелированы и из пластинки выйдет неполяризованное излучение. В силу тех же при- причин ясно, что вырезанная таким образом кристаллическая пластинка не может превратить неполяризованный свет в свет какой-либо опре- определенной поляризации, так как в этом случае фазы двух исходных волн не были скоррелированы, а определенная добавка к разности фаз ничего изменить не может. § 5.3. ОСУЩЕСТВЛЕНИЕ КОГЕРЕНТНЫХ КОЛЕБАНИЙ В ОПТИКЕ До сих пор мы не предлагали четко сформулированной идеи опти- оптического эксперимента, в котором можно было бы наблюдать интер- интерференцию, но введенные в §5.2 понятия облегчат решение этой задачи. Рассмотрим колебания, создаваемые одним и тем же источником в двух различных точках пространства Рг и Р2- Если при каких-то условиях опыта эти колебания окажутся когерентными, то можно * См/ Горелик Г. С. Колебания и волны М., «Наука», 1965, из
найти способ свести эти два колебания снова в одну точку, в которой, очевидно, и должна наблюдаться интерференция. Пусть мы располагаем точечным источником света, т. е. источни- источником, линейные размеры которого значительно меньше длины волны и случаемого им света (простые оценки показывают, что в таком малом объеме имеется все же очень большое число атомов). Это упростит решение нашей основной задачи, а в дальнейшем будет установлено, к каких случаях можно отказаться от такого ограничения, наличие которого позволяет не учитывать дополнительную разность хода для двух произвольных излучающих атомов, находя- находящихся внутри источника света. Таким образом, исследуемое излучение экви- эквивалентно излучению одного атома, но фаза и ам- амплитуда волны постоянны лишь в течение корот- короткого промежутка времени тког. Уравнение сфери- сферической волны, излучаемой такой группой тесно расположенных атомов (точечным источником)*, имеет вид t—kr—ylt)]. E.28) Рис. 5.13. К связи Здесь амплитуду следовало бы записать в виде кожмтнож^ко- Ео (t — г/с), т. е. отнести ее к более раннему мо- лебаний в различ- менту, но это несущественно для дальнейших рас- ных точках прост- суждений. ранства и их рас- Пусть точечный источник находится в точке О, СТногоТсто^ ник64 а расстояния до точек Pt и Pj равны гг и г/ (рис. 5.13). Здесь возможны различные случаи: 1. Две точки Р± и Р2у находящиеся на равном расстоянии (rt = rj) от точечного источника, находятся в пределах одного цуга, т. е. коле- колебания в них всегда когерентны — степень когерентности \у12 (At)\ равна единице. 2. Две точки, например Р2 и Р3> Для которых \г2 — г3| > стког, в любой момент времени принадлежат к разным цугам волн. Это значит, что колебания в них некогерентны и степень когерентности равна нулю. 3. Если для каких-либо точек, например Я4 и Р1у О < |г4 — гг\ < < стког» то колебания в них называют частично когерентными. По-видимому, такие колебания тоже обеспечивают возможность наблюдения стационарной интерференционной картины. В этом слу- случае степень когерентности Iyi2 (A0| отлична от нуля и интерференция происходит, но видимость интерференционной картины существенно швисит от |г4 — гх|. Чем меньше |г4 — гг\ по сравнению с стког, тем ближе к единице степень когерентности рассматриваемых колеба- * Очень сложная проблема взаимного влияния столь близко расположен- расположенных излучателей (размеры источника < л) здесь не рассматриваются. Укажем 1ишь, что в радиотехнике, где длина волны много больше, используют это вза- взаимное влияние, чтобы обеспечить увеличение излучаемой энергии, отбираемой ог генератора. 149
Рис. 5.14. Ход лучей в бипризме Фре- Френеля ниП. На рис. 5.5 были изображены графики интенсивности при взаи- взаимодействии двух когерентных, некогерентных и частично когерент- когерентных колебаний. Очевидно, что эти графики вполне подходят для опи- описания наших мысленных экспериментов. Следовательно, используя точечный источник, при разности хода, лежащей в пределах длины когерентности, можно наблюдать интер- интерференцию. Другими словами, для световых волн, излучаемых то- точечным источником, при разности их хода, меньшей длины когерент- когерентности, применима синусоидальная идеализация. Теперь уже не составляет труда сформулировать идею эксперимен- эксперимента для наблюдения интерференции световых волн: от одного точечного источника нужно тем или иным способом получить две системы волн, которые затем следует свести вместе в какой-то области про- пространства. Если при этом для раз- разности хода выполняется условие А = \г2 — гг\ < стког, E.28а) то должна наблюдаться интерфе- интерференция. Фактически эта идея лежит в основе опыта Юнга и построения Френеля, к описанию которого мы сейчас и перейдем. В этом случае для получения двух систем волн используют законы отражения и преломления. Обычно наблюдается интерференция между волнами, исходящими из действительного и мнимого изобра- изображений источника, или между волнами, расходящимися из двух мни- мнимых изображений. Такое различие несущественно — волна, исхо- исходящая из реального источника, с помощью оптического устройства разделяется на две световые волны, интерферирующие в некоторой области. Использование мнимых изображений служит лишь удобным способом определения области перекрывания волн, где можно наблюдать интерференцию. Существует целый ряд различных приборов и устройств, позво- позволяющих наблюдать возникающую таким образом интерференцию. Здесь будут приведены лишь три эксперимента (с бипризмой Френеля, отражением света от тонкой пластинки и зеркалом Ллойда). Выбор именно таких построений, выполненных по методу Френеля, связан как с тем, что их можно демонстрировать в большой аудитории, так и с возможностью введения некоторых новых понятий, необходимых для количественного описания. 1. Бипризма Френеля (рис. 5.14). Для разделения волны на две применяют призму с углом при вершине, близким к 180°. Источником света служит ярко освещенная узкая щель, установленная строго параллельно преломляющему ребру бипризмы. Понятно, что когда в качестве источника света используется длин- длинная и узкая щель, то ограничения размеров относятся только к ее 150
Ширине. Все то*Ши вдоль Щели эквивалентны И интерференция на- наблюдается^ направлении, перпендикулярном щели. Расстояние от эк- экрана до щели произвольно и влияет лишь на масштаб и освещенность наблюдаемой |картины интерференции. ] Важно указать на следующие характерные черты рассматриваемого опыта, общие для всех экспериментов подобного типа: 1) не используются какие-либо линзы или другие оптические уст- устройства для фокусировки излучения*. Интерференционная картина возникает в любой части пространства, где перекрываются интерферирующие пучки; 2) при увеличении ширины щелиj возра- возрастает освещенность экрана, но уменьшается четкость интерференционных полос и они совсем исчезают при определенной ширине щели S. Очевидно, что в этом случае источ- источник света уже нельзя считать, точечным; 3) для улучшения четкости интерферен- интерференционной картины выгодно монохроматизиро- вать свет. Так, например, если освещать Рис- 5Л5- К интерферен- щель S светом ртутной дуги, то при введе- ТотТву^"ей нии фильтра, выделяющего интенсивную зе- тонкой пластинки леную линию спектра ртути К = 5460 А, четкость интерференционной картины заметно возрастает. Однако вопрос о монохроматизации излучения при интерференционных опы- опытах заслуживает отдельного обсуждения, которое будет проведено несколько позднее (см. § 5.6). 2. Отражение света от двух поверхностей тонкой пластинки. В качестве такой пластинки выгодно взять тонкий пласт слюды тол- толщиной около 0,05 мм, легко отделяющийся от основного блока. Источ- Источником света служит ртутная дуга, которая располагается примерно в полуметре от плоскости слюдяной пластинки (рис. 5.15). Никакая фокусирующая оптика не применяется (отчетливая интерференцион- интерференционная картина видна на стене аудитории или на потолке). При этом нет необходимости использовать какую-либо щель для ограничения раз- размеров источника. Последнее обстоятельство необходимо рассмотреть более подробно, так как на первый взгляд оно противоречит сформу- сформулированному выше требованию применения точечного источника све- света. Найдем апертуру интерференции 2ю, т. е. угол между парой ин- интерферирующих лучей, сходящихся после отражения в какой-либо точке экрана: 2со= дуга Р« =-^L. =-i-sin2y> радиус SP лЛ/соэф 2Ап где п — показатель преломления слюды, I — толщина пластинки. Если А & 50 см, / « 5 • 10~3 см, ф « 45°, то 2со — 10 рад. * Линза, иногда устанавливаемая в демонстрационных опытах, служит лишь для улучшения условий наблюдения картины интерферении, существую- существующей независимо от введения в схему линзы. 151
Можно предположить, что столь малая апертура интерференции в этом опыте и приводит к хорошей видимости интерференционной картины при больших размерах источника. Но сопоставление ка- качества интерференционной картины и апертуры интерференции тре- требует более строгого обоснования. Прежде чем его проводить, рассмот- рассмотрим ту1 один эксперимент, в котором зависимость между ними вы- «туи.'кт и явном виде. 3. Зеркало Ллойда. Расходящийся под небольшим углом пучок света от протяженного источника S — обычно ртутная дуга — падает на отражающую поверхность — плоское металлическое зеркало (рис. 5.16). Интерференция на- наблюдается на экране, установ- установленном перпендикулярно плос- плоскости зеркала. При осуществле- осуществлении этого опыта сразу заметна разная четкость интерферен- интерференционной картины на различных участках экрана. Чем больше Рис. 5.16. Схема опыта с зеркалом высота h (расстояние от плоско- Ллойда сти зеркала), тем хуже интерфе- интерференционная картина, а затем она совсем исчезает. Из рис. 5.16 следует, что 2со2<2(о1, т.е. с возрастанием h увеличивается апертура интерференции 2со. Следо- Следовательно, качество интерференционной картины действительно зави- зависит от апертуры интерференции. Установлению количественных соотношений между допустимыми размерами источника и апертурой интерференции посвящен § 5.5, но предварительно укажем на еще одну характерную особенность, выявляющуюся в этом эксперименте. В данном случае хорошо на- наблюдаемая интерференционная картина возникнет лишь в некоторой области пространства — на экране вблизи поверхности зеркала. Та- Таким образом, мы сталкиваемся с вопросом о локализации интерферен- интерференционной картины, который также заслуживает более подробного об- обсуждения. § 5.4. ВОЗМОЖНОСТЬ НАБЛЮДЕНИЯ ИНТЕРФЕРЕНЦИИ ОТ ПРОТЯЖЕННЫХ ИСТОЧНИКОВ СВЕТА Выше было показано, что, используя один точечный источник све* та, можно каким-либо оптическим устройством разделить его излу- излучение на два пучка, способных интерферировать друг с другом. При наличии двух независимых (некогерентных) источников света можно получить две стационарные интерференционные картины и с помощью какого-нибудь оптического устройства свести их в некоторой области пространства. В зависимости от условий опыта они будут создавать разные результирующие картины. Таким образом, в определенной области пространства будет наблюдаться стационарное распределение освещенности, эквивалентное наличию какой-то интерференционной картины (/макс ф /МИц)- Конечно, в результате наложения двух кар- 152
i ни интерференции может наблюдаться также равномерная освещен- освещенность экрана (/макс = ^мин)> эквивалентная отсутствию интерферен- интерференции. Следовательно, для любого результирующего распределения осве- освещенности, полученного при наложении двух интерференционных картин, характерно значение функции видимости, изменяющееся п пределах 0 ^ V ^ 1. Рассчитаем, как будет зависеть функция видимости для суммарной интерференционной картины от геометрии эксперимента. Решение этой задачи представляет само- самостоятельный интерес и, кроме того, облегчает последующее ис- исследование интерференции при использовании протяженного источника света. Пусть два одинаковых неко- некогерентных точечных источника Sx и S2 расположены на расстоя- расстоянии 2d один от другого (рис. 5.17). Будем, как обычно, решать одномерную задачу, т.е. в качестве источников возьмем две самосветящиеся щели St и 52, перпендикулярные плоско- плоскости рисунка; при этом значи- значительно улучшаются условия на- наблюдения интерференции на экране, параллельном плос- плоскости, в которой лежат щели Sx и S2. Разделим пучок, излучаемый Sx (и соответственно из- излучаемый S2), на два с помощью двух параллельных зеркал. Сле- Следовательно, каждый реальный источник света заменяется двумя фик- фиктивными, способ построения которых ясен из приведенного рисунка. Вместо Sx мы получили два когерентных источника S{ и SJ, расстоя- расстояние между которыми обозначено через 2/. Соответственно заменяем S2 на Sf2 и SS с тем же расстоянием 2/ между ними. На экране будут наблюдаться две системы интерференционных полос (от источников S(, Si' и S2, 52); складываясь, они дадут какое-то суммарное распре- распределение освещенности, функция видимости которого и подлежит ис- исследованию. Для того чтобы иметь право использовать все выкладки, проде- проделанные ранее (см. § 5.1), надо установить экран на таком большом расстоянии D от плоскости, на которой расположены источники Sx к S2, чтобы D !> 21. Очевидно, что при этом заведомо будет удовлет- удовлетворяться неравенство D ^> 2d. Из построения ясно, что IID = tg со, 1гричем в силу условия D^>21 апертура интерференции 2со весьма мала. Заметим, что для наглядности масштаб рис. 5.17 сильно искажен. При интерференции двух когерентных источников S{ и SJ, рас- расположенных на расстоянии 2/ один от другого, получаем следующее Рис. 5.17. К наложению интерференцион- интерференционных картин от двух точечных некоге- реитных источников света Дополнительный экран М ограждает область, где наблюдается интерференция от прямого света источников Sx и 52 153
распределение интенсивности на экране в зависимости от высоты h (расстояния от оси симметрии): /2=/0 1+cos •""*"-"' . E.29) Когерентные источники S[ и Si, сдвинутые относительно S£ и S£ на расстояние 2d, образуют на том же экране другую интерференци- интерференционную картину, смещенную относительно картины, образованной SJ и Si, также на расстояние 2d, т. е. + cos4"'%+*>]. E.30) (Предполагается, что источники Sx и S2 идентичны и, следовательно, величина /0 в обоих равенствах одинакова.) Исследуем суммарную освещенность экрана /. Для ее определения надо сложить освещенности 1± и /2 (никакой интерференции здесь нет, так как Sx и S2 — некогерентные источники). Имеем / = 1г + /2, т. е. [^^] E.31а) Запишем соотношение E.31, а) в более простом и удобном для срав- сравнения с опытом виде. Для этого используем полученное ранее выра- выражение для ширины полосы 6ft, которое в наших обозначениях имеет вид 8h = DX/2L Заметим, что IID = tg со, поэтому для ширины поло- полосы справедливо соотношение 8h = Я/B tg со). В дальнейшем мы еще воспользуемся им. Учитывая найденные здесь величины, находим E.316) Интенсивность суммарной картины будет изменяться как функция h по закону, который легко установить из соотношения E.31 б). Очевидно, что максимальная интенсивность будет наблюдаться в тех точках экрана, где cos2nh/(8h) = 1 (если cos 2nd/(8h) > 0). Ми- Минимальная интенсивность будет там, где cos 2nh/(8h) = —1 (при том же предположении о знаке второго сомножителя). Для экстре- экстремальных значений освещенности имеем: |cos-^-|).E.32) Отсюда для видимости суммарной картины находим у==/макС-/мин==|СОз _2я£_ I ш E33) График этой функции представлен на рис. 5.18. Легко заметить, что эффект определяется соотношением между шириной интерферен- интерференционной полосы б/i (она в свою очередь зависит от апертуры интерфе- интерференции 2со) и расстоянием 2d, на которое разнесены два исходных неко- 154
герейтных источника света §± и $2. Функция видимости может при- принимать значения, близкие к единице (если 2d<^fih). Вместе с тем интер- интерференционные полосы на экране могут и совсем исчезать. Они исчез- исчезнут при выполнении условия 2d = S/z/2, т. е. в том случае, когда мак- максимумы одной интерференционной картины точно совпадают с мини- минимумами другой. При дальнейшем увеличении расстояния 2d между источниками Sx и S2 видимость снова станет хорошей, пройдет через максимум при 2d = Sft и снова обратится в нуль при 2d = Зб/г/2. Два предельных случая (V» 1 и V = 0) поясняются рис. 5.19. На нем показана также суммарная кривая для случая 2d <^ 6ft. Она YYV nj2 я Зя/2 Zn 2nd/§h /4 _Jl 6) V Рис. 5.18. Функция видимости суммарной интерференционной картины, создаваемой двумя точечными источниками света Рис. 5.19. Пространственное распределение интенсивности в двух предельных случаях: функция видимости V«l (а) и F= =0 (б) почти подобна интерференционной картине от одного точечного ис- источника (V « 1), но освещенность в максимуме в два раза больше. Перейдем к изучению интерференции света от протяженного ис- источника. Будем наблюдать суммарную картину в тех же условиях, что и в предыдущем случае. Но вместо двух источников света Sx и S2 пусть весь промежуток 2d занимает один протяженный источник све- света, создающий на экране среднюю освещенность /0. Разобьем его мы- мысленно на светящиеся полоски шириной 8|<С^- Такие элементарные источники света, конечно, будут некогерентны. Найдем суммарное действие этих некогерентных излучателей в призвольной точке экра- экрана на высоте ft, учитывая, что произвольный точечный источник, сме- смещенный на расстояние £ от оси, создает в точке экрана на высоте ft освещенность, равную А. 2d Очевидно, что для определения суммарного действия всех таких элементарных источников надо проинтегрировать это выражение в пределах от — d до d: 2я(А-£) 6Л l + -^-sin 2nd 2nd 6Л *?]. E.34) 155
11а экране будут наблюдаться интерференционные полосы. В за- зависимости от h выражение E.34) принимает экстремальные значения: ■* МЯиР. *"~~" А 'макс 'мин— J bh 2nd bh 2nd sin- 2nd sin- 2nd bh l) 21/2 Я 2Я Рис. 5.20. Функция видимости суммарной интерференционной картины, полученной от протя- протяженного источника света Функция видимости суммарной картины определяется выражением J5-sin-**£-. E.35) 2nd 6h v Для функции видимости вновь получается выражение вида |sin х/х\, где х = 2nd/(8h). Как известно, при х = 0 оно обращается в единицу, а с увеличением х монотонно уменьшается, обращаясь в нуль при х — я. При дальнейшем увеличении х функция |sin x/x\ опять возрастает, но до меньшего экстремаль- экстремального значения, и снова обратится в нуль при х = 2я. График зависимости функции видимости суммарной интерфе- интерференционной картины от отношения 2nd/(8h) приведен на рис. 5.20. Из исследования этого графика мож- можно сделать существенный вывод. Рас- Рассмотрим лишь относительно малые зна- значения ширины источника 2d ^ 6ft. Функ- Функция видимости в этом интервале умень- уменьшается от V = 1 до V = 0. Заметим, что V « 2/3 при 2d = 6ft/2. Суммарную картину можно считать достаточно хорошей для наблю- наблюдения интерференционных полос, если V^ 2/3. Легко показать, что в этом случае /макс > 5 /мин. Но такие условия наблюдения реализуются при соблюдении нера- неравенства 2d ^ 6ft/2. Заменяя 6ft = A/Btgco), получаем искомую связь между допустимыми размерами источника, излучающего свет опреде- определенной длины волны Я, и апертурой интерференции в виде 2dtg со < Я/4. E.36) Это неравенство показывает, что чем меньше апертура интерференции, тем больше допустимые размеры источника. Такое количественное соот- соотношение находится в полном согласии с результатами описанных ранее опытов (отражение света от тонкой слюдяной пластинки, зеркало Ллой- Ллойда), в которых удалось наблюдать четкую интерференционную карти- картину при больших размерах источника света. Как уже указывалось, апертура интерференции в этих опытах была очень мала. Становится также понятной рль дополнительной щели в опыте Юнга. Ведь про- произведение 2d tg со, величина которого определена неравенством E.36), связано с угловыми размерами источника света, ограничение которых и позволило Юнгу наблюдать интерференцию света от двух щелей (см. §6.5). 156
Конечно, принятое значение V ^ 2/3 в какой-то степени произ- произвольно. В той же степени произвольно и окончательное условие хоро- хорошей видимости, позволяющее оценить порядок величины допустимых размеров источника света или апертуры интерференции. Но именно потому, что не требуется строгого выполнения этого условия, можно пользоваться им в самых различных случаях. Более того, весь прове- проведенный вывод мы вправе считать доказательством возможности воз- возникновения интерференции с использованием протяженных источников света, состоящих из множества некогерентных излучателей. Условие E.36) или близкое к нему неравенство нетрудно получить из значительно более простых рассуждений, в которых рассматри- рассматривается случай, когда полосы, создаваемые одной половиной источника, гасят полосы, создаваемые другой его половиной. Но недостаток таких качественных рассуждений заключается в том, что заранее предпола- предполагается существование интерференционных полос от протяженного источника (или от его половины), что не очевидно. Проведенный же расчет привел к однозначному выводу о существовании интерферен- интерференционных полос при выполнении условия 2dtg со ^ Я/4. Тем самым мы получили право использовать синусоидальную идеализацию и для протяженного источника света при выполнении в эксперименте усло- условия E.36). Конечно, сформулированное ранее [см. E.28а)] ограничение допустимой разности хода (А < стког) остается в силе и при интерфе- интерференции от протяженных источников света. Таким образом, условие временной когерентности E.28а) дополняется условием пространствен- пространственной когерентности E.36). Полученный результат можно сформулировать в более общих тер- терминах, введенных ранее. Очевидно, что, рассматривая, как наклады- накладываются интерференционные картины, создаваемые элементарными ис- источниками AS*, мы исследовали пространственную когерентность той квазимонохроматической волны, которую испускает однородный про- протяженный источник S. Для данных условий опыта модуль степени ко- когерентности (равный видимости интерференционной картины) меняется по закону | sin xlx\> где х = 2nd/8h, и в зависимости от соотношения между размерами источника и условиями наблюдения может прини- принимать любые значения в интервале от 0 до 1. Степень когерентности мож- можно вычислить непосредственно из выражения E.9а) для функции кор- корреляции*. Общность такого метода, конечно, больше, чем довольно ис- искусственного приема суммирования действия элементарных излучате- излучателей, который был применен выше. Но проведенные вычисления види- видимости суммарной картины представляются более наглядными и про- простыми. В то же время следует указать, что в приведенном выводе исполь- использована оптическая схема, в которой угол, определяемый из равенства tg со = IIDу в силу симметрии совпадает с со — половиной апертуры интерференции. Соотношение E.36) может быть получено при исполь- использовании оптических схем более общего вида, но рассмотрение будет менее наглядным. * В § 6.6 проводится расчет комплексной степени когерентности для квази- квазимонохроматического света с использованием теоремы Цернике. 157
§ 5.5. НАЛОЖЕНИЕ ИНТЕРФЕРЕНЦИОННЫХ КАРТИН, СОЗДАВАЕМЫХ ВОЛНАМИ, ПОЛЯРИЗОВАННЫМИ ВО ВЗАИМНО ПЕРПЕНДИКУЛЯРНЫХ НАПРАВЛЕНИЯХ Все предыдущее исследование проводилось для некоторого вы- выбранного направления колебаний излучающих атомов в источнике све- света, т. е. рассматривалось излучение вполне определенной поляриза- поляризации. Не представляет труда распространить полученные выводы на случай неполяризованного света, но здесь необходимо более тщатель- тщательно исследовать вопрос об интерференции поляризованных лучей. В самом общем случае суперпозиции двух произвольных электро- электромагнитных полей Ег и Е2 (см. §5.1) было установлено, что равенство нулю среднего значения интерференционного члена <ExE2> исклю- исключает возможность возникновения интерференции и в этом случае ин- интенсивности (освещенности) просто складываются. Лишь в тех об- областях пространства, где <Е1Е2> ф 0 происходит интерференция. Но в § 5.4 рассчитывалось наложение независимых интерференцион- интерференционных картин, осуществляемое с помощью простого оптического устрой- устройства. Видимость суммарной картины в некоторых случаях приближа- приближалась к единице. Это получалось тогда, когда при почти одинаковой ши- ширине интерференционных полос максимумы одной их системы совпада- совпадали с максимумами другой. Очевидно, что описанный метод пригоден и для случая Ег -L Е2, к изучению которого мы сейчас и перейдем. Пусть имеются две электромагнитные волны, поляризованные во взаимно перпендикулярных направлениях, не интерферирующие друг с другом. С помощью оптических устройств можно разложить каждую волну на две и получить две системы интерференционных полос, свес- свести их вместе в какой-то области пространства и зарегистрировать от- отличную от нуля видимость суммарной картины. Рассмотрим эту воз- возможность подробнее, исследуя наложение интерференционных полос, создаваемых источником неполяризованного света. Известно, что излучение такого источника представляет собой сум- сумму двух поляризованных во взаимно перпендикулярных направлениях электромагнитных волн, фазы которых никак не скоррелированы. Пусть колебания вектора Е в одной из таких волн происходят в пло- плоскости чертежа (отлично от нуля только Ех), а в другой волне вектор Е колеблется перпендикулярно этой плоскости (отлично от нуля только Исследуем наложение интерференционных картин, каждая из кото- которых создается одной из этих двух некогерентных волн; можно пред- представить себе, что каждая волна состоит из двух когерентных колеба- колебаний (Е* из Eki и Еа2, а Еу из Еу1 и Еу2), которые с помощью устройст- устройства из двух параллельных зеркал (рис. 5.21) можно свести в одну точку и наблюдать интерференцию. Пусть исследуемый источник света экви- эквивалентен точечному, т. е. удовлетворяется условие E.36). Поскольку волны Ех и Еу не интерферируют друг с другом, полу- получим очевидное равенство <£2>=<£*>+ <£*>. E.37) 158
Для каждой волны (Ех или Е^), учитывая, что Еу1 и Еу2 парал- параллельны, а угол между Ех1иЕх2 равен 2<о, можно записать: 1 ЕХш cos 2co>, E.38) Для существования обеих интерференционных картин надо потре- потребовать отличия от нуля интерференционных членов в уравнениях E.38), т. е. (ЕХхЕх%оо§>Ъй}фЪ и (ЕУ1Еу2}фО. E.39) Эти условия в общем случае должны выполняться, так как колеба- колебания Ех1 и Ех2 (или соответственно Еу1 и Еу1) когерентны. Однако для того, чтобы на экране наблюдалась стационарная суммарная картина (V Ф 0), необходимо также, чтобы максимумы одной системы полос не совпадали с минимумами другой. Из равенств E.38) и E.39) следует, что кроме неравенства нулю каждого из интерференционных членов для возникновения интерференции нужно еще потребовать, чтобы и их сумма была отлична от нуля: l Ex% cos 2(o> + (ЕУ 0. E.40) У//////////////////////////. Рис. 5.21. К интерференции волн, исходящих от одного ис- источника и поляризованных в перпендикулярных друг к дру- другу направлениях Кбарцебая пластинка V77//////777/7///' Рис. 5.22. К интерференции волн, поля- поляризованных во взаимно перпендикуляр- перпендикулярных направлениях, после введения квар- кварцевой пластинки, повернувшей плоскость поляризации одной из волн на угол я/2: 00' — оптическая ось пластинки Вообще говоря, для выполнения условия E.40) достаточно, чтобы лишь один из интерференционных членов был отличен от нуля. Если при некоторых условиях эксперимента когерентность одной из взаим- взаимно ортогональных составляющих суммарной картины мала или ин- интенсивность компонент Ех и Еу существенно различна (что, например, может иметь место при исследовании частично поляризованного света), то условие E.40) выполяется и можно наблюдать интерференционную картину независимо от того, совпали или нет максимумы интерферен- интерференционных полос разных компонент. Конечно, в этом случае видимость будет хуже, чем в оптимальных условиях (совпадение максимумов обеих систем). 159
Для неполяризованного света, распространяющегося в изотроп- изотропной среде, условие E.40) соблюдается и при наблюдении интерферен- интерференции могут быть использованы различные оптические схемы. Итак, выяснена возможность наблюдения суммарной картины с видимостью, отличной от нуля, при освещении экрана через какую- либо оптическую систему излучением, состоящим из двух волн, поля- поляризованных во взаимно перпендикулярных направлениях (в частности, источником неполяризованного света). Усложним задачу. Введем на пути одного из лучей (рис. 5.22) квар- кварцевую пластинку, вырезанную перпендикулярно ее оптической оси. Известно, что такая пластинка может вращать плоскость поляриза- поляризации падающего на нее излучения. Пусть ее толщина будет такой, что для данного интервала длин волн (предполагается, что источник излу- излучает свет в небольшом интервале частот) плоскость колебаний повер- повернется на я/2. Но ведь в рассматриваемом направлении распростра- распространяется как #!-, так и */х-волна. Очевидно, что в результате поворота плоскости поляризации на 90° произойдет замена одной волны другой — в плоскости рисунка будут происходить колебания у^волны, а в пер- перпендикулярном направлении будет колебаться вектор Е^. Следова- Следовательно, в одной плоскости наблюдается взаимодействие некогерентных хг и #2"волн> а в Другой плоскости складываются также некогерентные х2- и t/x-волны. Обе исходные интерференционные картины исчезнут, следовательно, исчезнет и суммарная картина. Экран будет равно- равномерно освещен. При этом видимость суммарной картины равна нулю. Сформулируем идею другого опыта, смысл которого еще более ясен. Введем в оба плеча оптического устройства (интерферометра) по поляроиду (или призме Николя), которые не внесут дополнительной разности хода. Если разрешенные колебания параллельны, то види- видимость суммарной картины останется без изменений. Но если скрестить поляризаторы, то интерференционная картина пропадет, так как перпендикулярные друг другу колебания не интерферируют и никако- никакого наложения картин здесь также не получится. Фактически выше была изложена идея знаменитого опыта Френеля— Араго, из результатов которого с неизбежностью следовала строгая поперечность световых волн (перпендикулярность колебаний светового вектора направлению распространения). Истолковать поперечность световых волн в рамках упругостной волновой теории весьма затруд- затруднительно. Появление электромагнитной теории сняло все противоре- противоречия, которые неизбежно возникали при попытках Френеля построить строгую, внутренне непротиворечивую теорию, распространения све- световых волн. Исследуем более подробно интерференцию поляризованного света, прошедшего через анизотропную среду. Классическая схема таких опытов сводится к наблюдению интерференции при введении кристал- кристаллической пластинки между двумя поляризаторами. Наиболее чистые условия эксперимента реализуются при использовании плоскопарал- плоскопараллельной пластинки, вырезанной параллельно оптической оси крис- кристалла и вводимой строго перпендикулярно параллельному пучку света, проходящему через поляризатор Р и анализатор А (рис. 5.23), 160
Какую же роль играет каждый элемент этой схемы? Поляризатор создает поляризованную волну, в кристаллической пластинке обра- образуются две волны, фазы которых скоррелированы, а колебания взаимно перпендикулярны. Анализатор пропускает только составляющую каж- каждого колебания по определенной оси и тем самым обеспечивает воз- возможность наблюдения интерференции. Вращая анализатор, мы заметим изменение интенсивности прошед- прошедшего света, которая благодаря интерференции зависит также от тол- толщины, наклона и ориентации кристаллической пластинки. Особо эф- эффектные явления возникают, рогда установка освещается немоно- немонохроматическим светом (например, излучением какого-либо источника /Г7 Р V \ А Рис. 5.23. Принципиальная схема установки для изуче- изучения интерференции поляри- поляризованного света: ООГ — оптическая ось пластин- пластинки Рис. 5.24. К рас- рассмотрению задачи об интенсивности света, прошедшего через систему, изо- изображенную на рис. 5.23 сплошного спектра). Тогда при вращении поляризатора (или анализа- анализатора) относительно кристаллической пластинки наблюдается измене- изменение окраски прошедшего света. При этом поворот анализатора на я/2 приводит к появлению дополнительной окраски (зеленый цвет прев- превращается в красный, и наоборот). Решим в общем виде задачу об интенсивности света, прошедшего через систему, изображенную на рис. 5.23. Обозначим разрешенные направления колебаний, задаваемые крис- кристаллической пластинкой, через 1 и 2, направления колебаний, пропус- пропускаемых поляризатором Р и анализатором Л, —соответственно через ОР и О А (рис. 5.24). Если <р — угол между направлениями / и ОР9 то амплитуды компонент, пропущенных пластинкой, будут изобра- изображаться отрезками ОБ и ОС, равными ОБ = Ео cos ф, ОС = Ео sin ср. E.41) Поело прохождения анализатора, повернутого на угол *ф относи- относительно поляризатора, амплитуды этих компонент станут меньше; эти амплитуды изображены отрезками OF и OG длиной Е01 - OF Е02 = OG Ео cos ф cos (ф Ео sin ф sin (ф 6 3tH, 1790 E.42) 161
Эти два колебания имеют разность фаз, зависящую от толщины пластинки / и равную 8=^(по-пеI. E.43) В случае наклонных лучей разность фаз 6 зависит также от углов между их направлением и поверхностью пластины. Суммарная интенсивность определяется соотношением /—F% Л-F2 -4-9F F rrv; fi Используя формулы E.42) и учитывая, что cos 6 = 1 — 2 sin2F/2), находим / = El [cos2^ — sin 2ф sin 2(<p — ф) sin2 F/2)]. E.44) Определим интенсивность прошедшего света для двух ортогональ- ортогональных направлений анализатора (поляризатор и анализатор параллель- параллельны или скрещены). 1. Пусть угол ф = 0, т. е. поляризатор и анализатор параллельны. Интенсивность прошедшего света определяется выражением /„ =^Е\[\ -sin2 2Ф sin2 F/2)]. E.45) Пропускание будет максимальным при ср = 0, я/2, я, ... В этом случае / = /0, т. е. весь свет проходит, и можно считать, что при таких ориентациях поляризатора интерференция отсутствует. Нетрудно за- заметить, что при ф = 0, я/2, я... направление колебаний, пропускаемых поляризатором, совпадает с одним из разрешенных направлений коле- колебаний в кристаллической пластинке. Вторая волна в ней уже не воз- возникает. Пропускание будет минимальным при ф = я/4, Зя/4, 5я/4. В этом случае (/„)Мин = ЕЩ — sin2 F/2)] = £gcos2 (fi/2). 2. Пусть ф = я/2, т. е. поляризатор и анализатор скрещены; тогда общее выражение для интенсивности прошедшего света имеет вид 1±^Е20 sin2 2ф sin2 F/2). E.46) Очевидно, что пропускание света будет максимальным при ф = = я/4, Зя/4, ...: E.47) Если же ф=0, я/2, я, ..., то свет вообще не пройдет через анализатор, какова бы ни была толщина пластинки, т. е. (/j_)Mhh = 0. Полученные выражения описывают все возможные случаи при от- относительном вращении поляризатора, анализатора и кристаллической пластинки. В зависимости от толщины пластинки I меняется разность фаз 6, определяющая интенсивность прошедшего света в заданном направлении. Обычно в опытах подобного рода изучают не интенсивность или окраску света, выходящего из системы, а наблюдают изменение ин- интерференционной картины. Для этого необходимо осветить кристал- 162
лическую пластинку, помещенную между двумя николями, непарал- непараллельным пучком света и спроектировать линзой картину на экран. В проходящем свете наблюдаются интерференционные полосы, соответ- соответствующие постоянной разности фаз. Их форма существенно зависит от взаимной ориентации поляризаторов и оси кристаллической пластинки. При анализе условий возникновения полос следует иметь в виду, что из всего множества параллельных пучков лучей, падающих на пластинку под близким к нормальному углом, обычно найдется такой, который удовлетворяет условию появления максимума интерфе- интерференции. Вся система полос будет локализована в бесконечности. Если условия ее наблюдения Рис. 5.25. К интерференции сходящихся лучей поля- поляризованного света: схема установки (а) и фотографии интерференционных кар- картин в случае одноосного (б) и двухосного (в) кристаллов выбраны правильно (например, интерференционная картина наблю- наблюдается без всякой фокусировки на удаленном экране), то она пред- представляет собой типичные полосы равного наклона (см. § 5.6). Интерференционную картину с большим количеством полос можно наблюдать при освещении кристаллической пластинки сильно сходя- сходящимся пучком света. Для этого после поляризатора устанавливают короткофокусную линзу (рис. 5.25, а). Возникающие интерференцион- интерференционные полосы удобно наблюдать не на весьма удаленном экране, а в фо- фокальной плоскости проектирующей линзы, помещенной между крис- кристаллической пластинкой и анализатором. В случае одноосного кристалла с оптической осью, параллельной поверхности пластинки, наблюдается система гипербол. Если плас- пластинка вырезана перпендикулярно оптической оси, то возникает кар- картина, изображенная на рис. 5.25, б. Очевидно, что в данном случае геометрическим местом точек постоянной разности фаз является се- семейство концентрических окружностей. На эту интерференционную картину накладывается характерное распределение интенсивности — светлый или темный крест (рис. 5.25, б). Ориентация этого креста сов- совпадает с ориентацией поляризатора, а интенсивность зависит от угла 163
между направлениями разрешенных колебаний айализатора и поля- поляризатора (светлый крест, когда эти направления совпадают, темный, когда они ортогональны). Возникновение этого своеобразного распре- распределения интенсивности связано с тем, что в каждом из направлений, где оно наблюдается, через пластинку распространяется лишь одна волна, пропускаемая поляризатором, и, следовательно, интерференция не имеет места. Если пластинка изготовлена из двуосного кристалла, то характер интерференционных полос окажется совсем иным (рис. 5.25, в). Из всего изложенного выше следует, что мы располагаем очень чув- чувствительным способом контроля качества оптических изделий, изго- изготовленных из кристаллов. Более того, наблюдение интерференционной картины, возникающей в любой пластинке, помещенной между двумя поляризаторами, может служить способом обнаружения слабой анизо- анизотропии материала, из которого она изготовлена. Высокая чувствитель- чувствительность такой методики открывает возможность различных приложений в кристаллографии, физике высокомолекулярных соединений и в дру- других областях, § 5.6. ЛОКАЛИЗАЦИЯ ИНТЕРФЕРЕНЦИОННЫХ ПОЛОС И ЦВЕТА ТОНКИХ ПЛАСТИН При интерференции двух волн, возникающих в результате отраже- отражения или преломления света, исходящего из точечного источника, по- появляется стационарная интерференционная картина, которая никак не локализована. Иными словами, в любой области пространства, где перекрываются интерферирующие пучки, можно наблюдать интерфе- интерференцию. Эта особенность интерференции, возникающей при исполь- использовании точечного источника света, была, например, продемонстри- продемонстрирована в опыте с бипризмой Френеля. Но при замене точечного источника протяженным сразу же приш- пришлось х>грзничить ту область пространства, где может наблюдаться ин- интерференция. Теперь можно уже более четко сформулировать необхо- необходимое условие локализации интерференционны* полос: при данной ширине 2d источника наблюдение интерференции^ свете с длиной волны X возможно лишь в той области пространства, где со достаточно мало, чтобы выполнялось условие E.36). Полезно напомнить, что опыт с зер- зеркалом Ллойда и привел к качественным соображениям о зависимости видимости интерференционной картины от апертуры интерференции; при анализе этого опыта возник также вопрос о локализации интер- интерференционных полос. Наибольший интерес представляют случаи локализации интерфе- интерференционных полос на поверхности какой-либо пластины, используе- используемой для создания разности хода (полосы равной толщины), и локали- локализация их в бесконечности (полосы равного наклона). Удобно начать изу- изучение этих явлений с исследования интерференции в тонких пласти- пластинах при освещении протяженными источниками света, которую часто называют цветами тонких пластин. Все наблюдали чрезвычайно кра- красивые цвета тонких пленок (например, пленок нефти на поверхности 164
воды) при освещении их солнечным светом. Рассмотрим физику этих явлений, так как она окажется очень полезной для понимания более сложных процессов, происходящих в интерферометрах, интерферен- интерференционных фильтрах и других оптических устройствах. Исследуем отражение и преломление плоской квазимонохромати- квазимонохроматической волны, падающей на поверхность пластины с толщиной / (рис. 5.26). Рассмотрение будет простым, так как надо лишь установить зависимость разности хода А от геометрических параметров (угол падения волны и толщина пластинки). Более подробное изложение (установление фазовых и амплитудных соотношений, а также поляри- поляризации волны) не требуется, хотя, используя фор- формулы Френеля, задачу можно решить сколь угодно полно. Правда, следует помнить, что фор- формулы B.9)—B.11) были получены для одной границы раздела между двумя бесконечно про- протяженными диэлектриками. В тонкой пластинке или пленке имеются две границы, и необходимо применять формулы Френеля для каждой из них. Такой метод краевых значений широко исполь- используют при решении различных сложных задач в электродинамике*. При решении данной задачи (а также при рассмотрении интерферометров) будем приме- применять более наглядный метод суммирования амплитуд. Это удобно для диэлектрических пленок, так как можно учитывать лишь одно отра- отражение — коэффициенты отражения невелики и амплитуды волн при последующих отражениях пренебрежимо малы. Из рис. 5.26 получим основное соотношение Рис. 5.26. К расчету интерференции при от- отражении от тонкой пластинки А = п (AD + DC) — ВС— E.48) Дополнительную разность хода Я/2, возникающую вследствие изме- изменения фазы при отражении волны от оптически более плотной среды, необходимо учитывать при рассмотрении конкретных экспериментов (см., например, вопрос о кольцах Ньютона). Ниже приводятся элементарные выкладки для получения искомой зависимости А от угла падения и толщины пленки: I COS ф2 2nl СО8ф2 Следовательно, COS ф2 2 Y2 2 E.49). E.50) * Пример использования метода краевых значений для решения данной за- задачи приведен в кн.: Зоммерфельд А. «Оптика», § 7. 165
Не будем переходить от угла преломления ср2 к углу падения ф, чтобы не усложнять соотношение E.50). Заметим, что полученная зави- зависимость А = / (/, ф2) имеет достаточно общий характер и в дальней- дальнейшем можно будет применить ее при описании возникновения как по- полос равной толщины, так и полос равного наклона. Ранее нигде не использовалось ограничение, налагаемое на толщи- толщину пленки I. Тонкие пленки позволяют работать с протяженными ис- источниками света, так как в этом случае мала апертура интерференции 2о). Это и объясняет, почему говорят о «цвете тонких пластин». Но здесь существенно еще одно обстоятельство, которое заслуживает специаль- специального рассмотрения. Речь идет о роли монохроматичности излучения. Выше мы исходили из представления о строго мо- монохроматическом излуче- излучении, порождаемом колеба- колебаниями вполне определен- определенной частоты о = 2лс/Х. Но в реальных эксперимен- экспериментах используют источники света, излучающие в доста- Рис. 5.27. К вопросу о связи между степенью монохроматичности источника и наблюдаемым порядком интерференции Пунктиром показаны интерференционные максимумы для излучения с длинами волн, лежащими в интер- интервале ДА, точно широком интервале частот с той или иной сте- степенью монохроматичности излучения. Охарактери- вуем степень монохроматичности величиной ДЯ — интервалом длин золн (от Я до Я + ДЯ), в котором сконцентрировано излучение. В дальнейшем мы ознакомимся с различными приемами монохрома- тизации света (интерференционные фильтры, монохроматоры с дифрак- дифракционной решеткой или призмой и т. д.). На данной стадии изложения важно отметить, что при оптических наблюдениях можно добиться необходимого эффекта не только ограничением интервала излучаемых частот, но и использованием селективного приемника излучения. Дей- Действительно, если применять источник света, излучающий весь набор частот, и приемник, одинаково реагирующий на излучение любой дли- длины волны, то наблюдать интерференцию световых волн невозможно, так как в любой точке экрана, удаленной от оси симметрии на расстояние h = mDX/Bl), окажется максимум освещенности в какой-то длине волны Я. Возможность наблюдения интерференционной картины в види- видимой области невооруженным глазом объясняется тем, что глаз уже является своеобразным монохроматором. В среднем человек способен различить две спектральные линии с разностью длин волн ДЯ « 100 А. Легко установить общую связь между степенью монохроматичности излучения и тем порядком интерференции, который можно наблюдать. Полученная зависимость пригодна как в случае монохроматизации излучения, так и при ограничении селективности приемника. Интерференция не может наблюдаться, если максимум /я-го порядка для (X + ДА,) совпадает с максимумом (т + 1)-го порядка для излуче- излучения с длиной волны Я, т. е. если (рис. 5.27) (т + \)Х = т (X + ДЯ), или ДЯ = Я/т. E.51) 166
Но известно, что порядок интерференционного максимума прямо связан с разностью хода выражением А = т%. Следовательно, чем больше разность хода (выше порядок интерференции), тем меньше должен быть разрешенный интервал длин волн АЯ, т. е. больше необ- необходимая степень монохроматизации. Соотношение E.51) позволяет оценить допустимую толщину пленок для визуального наблюдения интерференции никак не монохроматр- :шрованного (естественного) света. Если Яср « 5000 А, АХ » 100 А, то т = Я/ДА, « 50. Это значение т « 50 определит допустимую разность хода А = = тХу которая в свою очередь зависит от толщины пленки: А = = 2nl cos ф2 — АУ2. Отсюда толщина пленки равна E.52) 2п cos ф2 Полагая, что п « 1,5 и cos q>2 « 1, пренебрегая Х/2 по сравнению с тКу получаем Если наблюдать интерференцию при излучении высокой монохро- монохроматичности, например освещать пластину светом одной линии линей- линейчатого спектра, ширина которой обычно не превышает «0,01 А, то допустимая толщина пластины возрастет в 104 раз. В оптических экспе- экспериментах часто применяют яркую зеленую линию ртути, которую легко выделить из спектра ртути соответствующим фильтром. В этих усло- условиях* не представляет труда наблюдать интерференционную картину со стеклянными пластинами толщиной в несколько сантиметров, кото- которые и используются в различных интерферометрах. Учет высказанных соображений о степени монохроматичности из- излучений позволяет правильно оценить допустимую толщину пластин. Переходя к способам наблюдения интерференционных полос разной локализации, будем считать, что пластины «тонкие», т. е. можно рабо- работать с протяженными источниками света, без каких-либо дополнитель- дополнительных монохроматоров. Рассмотрим отдельно два упоминавшихся выше наиболее важных предельных случая локализации интерференционных полос. 1. Полосы равной толщины. Для наблюдения полос, локализо- локализованных на поверхности пластины, надо спроектировать на экран изо- изображение поверхности пластины. В некоторой точке экрана будет наблюдаться максимум освещенности (в свете с длиной волны Я), соот- соответствующий вполне определенной толщине пластины [см. E.52)]. На рис. 5.28 приведена схема опыта по наблюдению полос, локализован- локализованных на поверхности тонкой пленки, толщина которой меняется по ка- какому-то закону. Апертура интерференции мала, следовательно, пленку можно освещать протяженным источником света. Рассмотрим лучи от * Давление паров ртути в трубке должно быть невысоким, так как в лам- лампах высокого давления линии очень уширены (до нескольких десятков ангстрем). 167
разных точек источника: одни, попадающие в какую-то точку поверх- поверхности пленки, и другие, попадающие в ту же точку после отражения от внутренней поверхности пленки. Эта точка отображается линзой L на экран 3, а геометрическое место таких точек (т. е. точек, для которых толщина пленки / = const) отобразится на экране в виде интерферен- интерференционной полосы, называемой полосой равной толщины. Если источник излучает естественный (немонохроматический) свет, то на экране по- появится система окрашенных полос, так как каждому значению длины волны Xt соответствует по формуле E.52) своя толщина пленки 1г. Очевидно, что если пленка представляет собой клин, то на экране будет наблюдаться система интерференционных полос, параллельных ребру клина. Чем тоньше пленка, тем меньше апертура интерференции и лучше видимость интерференцион- интерференционных полос. Простой опыт, сводя- Рис. 5.28. Схема опыта по на- наблюдению полос равной тол- толщины: 5 — протяженный источник света Рис. 5.29. К образованию колец Ньютона щийся к освещению мыльной пленки, образовавшейся на каком- либо каркасе, иллюстрирует этот эффект. Если каркас вертикален, то пленка толще внизу и, отображая ее поверхность на экран, мы увидим систему интерференционных полос, параллельных ребру образовавше- образовавшегося клина. Их четкость резко падает по мере увеличения толщины пленки. Характерные полосы равной толщины можно наблюдать на примере простого опыта (рис. 5.29). Классический эксперимент был поставлен в середине XVII в. Гуком, наблюдавшим кольцевые интер- интерференционные полосы, возникавшие в воздушном слое между плоско- плосковыпуклой линзой и плоской стеклянной пластинкой. Ньютон установил связь между радиусом гт колец и кривизной линзы, и лишь в XIX в. Юнг полностью объяснил природу этих колец, называемых кольцами Ньютона, и использовал их для определения длины волны интерфери- интерферирующего света. Из рис. 5.29 нетрудно получить основные соотношения. Считая 2R ^> /, находим r2m = 2RI. Для разности хода А =21 — Х/2 запишем условие возникновения максимума освещенности (cos ф2 =1, п =1, так как здесь нормальное падение света на воздушную прослойку) в виде 2/ - Я/2 -- 2т%12, или 2/ = Bт + 1)Л/2. Отсюда E.53) 168
Следовательно, измерив радиус m-го интерференционного кольца и зная радиус кривизны линзы, можно определить длину волны света. Очевидно, что при наблюдении колец Ньютона в отраженном свете центральное пятно будет темным, так как в этом случае геометрическая разность хода равна нулю и лишь теряется полуволна при отражении от плоской стеклянной поверхности. При истолковании колец Ньютона Юнг поставил красивый опыт. Между линзой, изготовленной из легко- легкого стекла (крон), и плоской пластиной из тяжелого стекла (флинт) было введено масло, показатель преломления которого пм удовлетво- удовлетворял неравенству якр < пм <. пфл. В этом случае нет потери полувол- полуволны (вернее, она теряется дважды) и в отраженном свете в центре ин- интерференционной картины наблюдается светлое пятно. В проходящем свете всегда возникает интерференционная картина, дополнительная к появляющейся в отраженном свете. Это положение, легко демонстрируемое на примере колец Ньютона, позволяет еще раз отметить общее свойство всех интерференционных явлений—стацио- явлений—стационарная интерференционная картина всегда возникает в результате перераспределения потока энергии в пространстве. Наблюдение полос равной толщины широко используется в различ- различных задачах техники. В частности, на этом эффекте основан очень простой и удобный способ определения качества полировки оптичес- оптических поверхностей. Исследуемую оптическую пластинку обычно на- накладывают на контрольную с плоскостью известного рельефа и между ними образуют весьма тонкий воздушный клин (для этого достаточно подложить с одного края тонкую полоску фольги). Систему освещают сверху ртутной дугой и наблюдают интерференционные полосы в отра- отраженном свете. Если поверхности обеих пластин идеально плоские, то должны возникнуть совершенно прямые полосы равной толщины, па- параллельные ребру клина. Но обычно поверхности имеют дефекты, ко- которые приводят к искривлению этих полос. Оценивая величину искрив- искривления интерференционной полосы по отношению к расстоянию между двумя соседними полосами, можно при тщательной постановке экспе- эксперимента установить наличие отклонений от плоскости порядка 1/10 длины волны интерферирующего света. Обычно систему освещают мо- монохроматическим светом и ожидают длительное время, пока не уста- установится тепловое равновесие. Усовершенствованным методом удается оценивать отклонения от плоскости порядка 0,01—0,02 длины волны, •по оказывается необходимым в некоторых задачах современной ин- юрферометрии (см. § 5.9). Исследованием полос равной толщины мож- можно также воспользоваться для измерения малых углов между двумя оптическими поверхностями, а также для решения других метрологи- метрологических задач. 2. Полосы равного наклона. Рассмотрим схему наблюдения интер- интерференционных полос, локализованных в бесконечности. Линза, с по- помощью которой эти полосы проектируются на экран, должна быть установлена так, чтобы ее главная фокальная плоскость совпадала г плоскостью экрана. Можно также рассматривать интерференцион- интерференционную картину в подзорную трубу или глазом, «аккомодированным на оесконечность». Схема возникновения полос равного наклона пред- 169
с i.iH.'icna па рис. 5.30. Все лучи, падающие на пластину под определен- определенным углом ф = const (например, луч S и все параллельные ему), со- соберутся на экране в одной точке С. Лучи другого наклона (например, луч S') соберутся в другой точке экрана С. В опыте применяется про- протяженный источник света, поэтому под тем же углом ф будет падать много лучей. Вообще говоря, имеется целый конус таких лучей, по- поэтому на экране получится не одна точка С, а семейство точек, для ко- которых угол ф = const, т. е. получится интерференционная полоса рав- равного наклона. Каждому углу падения соответствует своя полоса рав- равного наклона, локализованная в бесконеч- бесконечности. Выше уже упоминалось (см. § 5.3) об интерференционных полосах, образующих- образующихся при освещении тонкой пластинки слюды произвольным источником света (напри- (например, ртутной дугой). Тогда не имело смыс- смысла обсуждать их локализацию. Интерфе- Интерференционные полосы возникали в любой Рис. 5.30. К образованию точке пространства, где перекрывались полос равного наклона интерферирующие пучки. Но если приме- Экран расположен в главной фо- НИТЬ СПеЦИаЛЬНЫЙ СПОСОб Наблюдения, а кальной плоскости линзы l именно установить линзу (ее не было в первоначальной схеме) и спроектировать картину интерференции на экран, лежащий в главной фокальной плоскости используемой линзы, то из всего многообразия полос можно выделить только те, которые локализованы в бесконечности, т. е. по- полосы равного наклона. Излагая схему этого простого опыта, можно еще раз отметить, что в реальных условиях возникают самые различные интерференционные полосы. При анализе условий их образования часто оказывается по- полезным выяснить, где локализована та или иная группа полос, что достигается выбором определенного способа наблюдения интерферен- интерференционной картины. § 5.7. ДИЭЛЕКТРИЧЕСКИЕ ИНТЕРФЕРЕНЦИОННЫЕ СЛОИ Остановимся на одном приложении явлений интерференции, зна- значение которого за последние годы сильно возросло. Речь пойдет о на- нанесении тонких диэлектрических пленок на оптические поверхности с целью изменения коэффициента отражения. При этом могут решаться следующие две диаметрально противоположные задачи: 1. Просветление оптики. Уже указывалось, что при создании оп- оптических систем с большим числом отражающих поверхностей отно- относительно малый коэффициент отражения на каждой из них (М « 4% для перехода стекло -> воздух при нормальном падении) начинает существенно влиять на общее количество света. Так, например, в сложном объективе, состоящем из нескольких линз, легко потерять половину светового потока. Поэтому сведение к минимуму коэффи- коэффициента отражения на каждой поверхности {просветление оптики) ста- 170
новится важной задачей, которая теперь решается путем использова- использования явлений интерференции. Пусть на поверхность стекла, показатель преломления которого равен п0, нанесен слой диэлектрика оптической толщины nl = Я/4. Показатель преломления этого диэлектрика должен быть меньше п0. Очевидно, что волны, отраженные от внешней и внутренней поверх- поверхностей такого слоя, находятся в противофазе, так как оптическая раз- разность хода между ними составляет Я/4 + Я/4 = Я/2, а изменение фазы на л («потеря полуволны») происходит на обеих поверхностях (рис.5.31). В результате интерференции эти две волны взаимно ослабляются. Наибольшее ослабление (J? « 0) произойдет тогда, когда амплитуды Рис. 5.31. Уменьшение от- отражения света от стекла диэлектрической пленкой (п<п0) с оптической тол- толщиной я/=Л/4 4000 5000 6000 А,А Рис. 5.32. Коэффициент пропу- пропускания света е/ для крона и флинта как функция длины вол- волны до просветления однослой- однослойной пленкой (кривые 1, 2) и по- после просветления (кривые 3, 4) интерферирующих волн близки по величине. Это условие (здесь мы пренебрегаем поглощением в тонком слое диэлектрика и не учитываем многократных отражений) в соответствии с формулой B.4) имеет вид откуда Л+1 п =Vn0 E.54) E.55) Это соотношение указывает, как надо выбирать диэлектрик, при- пригодный для просветления оптики. Но решение задачи усложняется тем, что показатели преломления п и п0 зависят от длины волны и соотно- соотношение E.55) выполняется лишь в некотором спектральном интервале. Обычно просветление оптики проводят для средней (желто-зеленой) области видимого спектра, подбирая такой диэлектрик, показатель преломления которого для этой области удовлетворяет равенству п = Vav Для краев видимого спектра коэффициент отражения Л за- заметно отличается от нуля. Именно поэтому просветленные объекты кажутся в отраженном свете пурпурными, что соответствует смешению красного и фиолетового цветов. Рис. 5.32 иллюстрирует результаты просветления двух сортов стекла (легкий крон и тяжелый флинт). Приведенные на нем кривые показы- показывают зависимость коэффициента пропускания от длины волны при 171
прохождении света через 10 поверхностей крона или флинта до про- икчжчшя и после нанесения просветляющей однослойной пленки из двуокиси кремния. В последние годы разработаны способы многослойного покрытия, обеспечивающего особо эффективное просветление в приборах с боль- большим числом преломляющих поверхностей, когда кроме выигрыша в про- пропускании света нужно избежать заметного изменения спектрального состава проходящего излучения. Возможность получения такой много- многослойной «ахроматической» просветляющей пленки сыграла сущест- существенную роль в различных задачах оптической промышленности. В ка- качестве примера на рис. 5.33 приведена зависимость коэффициента про- Л/ Щ Л/ Ял / к f J г rCN L \ 3 4 h **- 1 1 4000 5000 6009 1000 XfA Рис. 5.33. Зависимость коэффици- коэффициента пропускания света системой от длины волны до (кривая /) и после просветления двухслойной (кривая 2), трехслойной (кри- (кривая 3) пленками Рис. 5.34. Увеличение от- отражения света от стекла диэлектрической плен- пленкой (п>п0) оптической толщины п/=А,/4 Рис. 5.35. Схема многослойного отражающего диэлектриче- диэлектрического покрытия пускания для света, прошедшего сложную систему с 44 преломляющи- преломляющими поверхностями, от длины волны. Применение двухслойной пленки позволило резко увеличить пропускание света лишь в центральной области видимого спектра (Я « 5500 А), тогда как трехслойная пленка обеспечила высокое пропускание света в широкой области спектра, при- причем резко уменьшилось количество рассеянного света. 2. Получение высокоотражающих интерференционных слоев. При п> п0 пленка с оптической толщиной nl = V4, нанесенная на опти- оптическую поверхность, будет увеличивать коэффициент отражения. Действительно, в этом случае потеря полуволны происходит лишь на передней поверхности пленки и обе волны (рис. 5.34) усилят одна дру- другую, так как разность хода составит Я/4 + АУ4 + Я/2 = Я. Но добиться высоких коэффициентов отражения {М> 30%) таким образом практически невозможно. Эффект можно значительно уси- усилить, если перейти от интерференции двух лучей к многолучевой ин- интерференции. В этом случае интерференционные максимумы окажутся более острыми и их интенсивность (/Макс) резко возрастет (см. § 5.9). Для получения таких высокоотражающих интерференционных слоев применяют следующую методику. На стекло наносят ряд пленок с одинаковой оптической толщиной (п^ = Я/4), но ^разными показа- показателями преломления; между двумя слоями диэлектрика с большим 172
показателем преломления пг помещают слой диэлектрика с малым по- показателем преломления п2 (рис. 5.35). Так, например, часто используют комбинацию сульфида цинка (пг « 2,3) и фторида лития (п2 ж 1,3). Нетрудно заметить, что в этом случае все отраженные волны син- фазны и усиливают друг друга. Для некоторой области длин волн, близкой к Ко (удовлетворяющей условию пх1х = я2/2 = Я0/4), мы полу- получим максимумы, ширина которых тем меньше, чем больше число ин- интерферирующих] пучков. Так, например, если нанести семь слоев, то легко добиться коэффициента отражения Л « 90% в области шириной около 500 А. Для получения М ^99% (такие коэффициенты отраже- отражения необходимы в лазерной технике) надо нанести 11—13 слоев. 4000 5000 6000 700080009000 К, А Рис. 5.36. Коэффициент отражения стек- стекла с заданным многослойным покрытием как функция длины волны Рис. 5.37. Схема мно- многослойного поляриза- поляризатора Следует, конечно, учитывать, что подобные интерференционные зеркала отражают в довольно узкой спектральной области, и чем боль- больше коэффициент отражения, тем ^же область длин волн ДА,, внутри которой реализуется такое значение Я (рис. 5.36). Диэлектрические интерференционные слои обычно получают испа- испарением соответствующих веществ в вакууме. Методика нанесения слоев и контроля их толщины описана в ряде руководств. И. В. Гребенщи- Гребенщиков и его ученики показали, что эффективным оказывается также хи- химический метод, позволяющий получать очень прочные стойкие ди- диэлектрические слои при последовательном нанесении на стекло дози- дозированных количеств растворов легко гидролизующихся соединений, что и используется для просветления оптики и для создания высоко- отражающих покрытий. Упомянем здесь также о превосходных поля- поляризаторах света, которые можно изготовить для любой области спект- спектра. Многослойный поляризатор представляет собой систему из двух склеенных прямоугольных призм. На гипотенузную грань призмы наносят чередующиеся слои с высоким и низким показателями пре- преломления (рис. 5.37). Свет, падающий на систему слоев под углом Брюстера, разделяется на два пучка — отраженный и проходящий, — поляризованных во взаимно перпендикулярных плоскостях. В отра- отраженном свете интенсивность колебаний светового вектора, перпенди- перпендикулярных плоскости падения, быстро растет и с увеличением числа слоев приближается к единице (J%± « 1). Составляющая, расположен- расположенная в плоскости падения, уменьшается или исчезает (Л?ц =0). В проходящем свете (при отсутствии поглощения) выполняется обратное соотношение. В идеальном интерференционном поляризаторе 173
рП и проходящий пучки поляризованы во взаимно перпен- перпендикулярных направлениях при 100%-ной степени поляризации каждо- каждого из них. Практические возможности при использовании чередующихся слоев двуокиси титана, двуокиси тория или двуокиси кремния по- позволяют создать интерференционные поляризаторы по этой схеме. Такие поляризаторы былиополучены для различных участков спектра в области от 2000 до 8000 А. Они обеспечивают получение света высо- высокой степени поляризации и обладают способностью избирательно поля- поляризовать свет в спектральном интервале шириной около 0,3 %. На краях интервала степень поляризации понижается. С помощью 9—13 чередующихся слоев были изготовлены поляризующие призмы для различных участков видимой и (что особенно важно) ультрафиолето- ультрафиолетовой частей спектра. Материалом служили плавленый кварц или опти- оптические стекла с разным показателем преломления. Степень поляриза- поляризации составляла 99,2—99,4% при пропускании 40—46% света.* При решении различных задач приходится применять те или иные комбинации слоев, отклоняясь от простейшей схемы, изло- изложенной выше. Так, например, условие пг1г = Я0/4 заменяется други- другими, более сложными соотношениями, получаемыми путем трудоем- трудоемких расчетов и экспериментальных оценок. Мы еще остановимся на значении многослойных диэлектрических слоев при рассмотрении свойств интерферометра Фабри — Перо и интерференционных фильт- фильтров (см. § 5.9). § 5.8. ДВУХЛУЧЕВЫЕ ИНТЕРФЕРОМЕТРЫ Интерферометрами называют оптические устройства, с помощью которых можно пространственно разделить два луча и создать между ними определенную разность хода. После их соединения наблюдается перераспределение потока световой энергии, т. е. явление интерферен- интерференции. Обычно с помощью интерферометров решают вполне определенные физические или технические задачи (например, измерение длин или углов, определение показателя преломления и т. д.) Наблюдение ин- интерференционной картины становится не целью исследования, а сред- средством проведения того или иного измерения. Поэтому оптическая схема интерферометра должна удовлетворять ряду дополнительных требо- требований. Для повышения точности часто вводят значительную разность хода между интерферирующими пучками и работают в высоких поряд- порядках интерференции. В таких случаях используют относительно высо- высокую степень монохроматичности излучения; резко повышаются и тре- требования к юстировке оптической системы. В дальнейшем будет рас- рассказано также об исследованиях, в которых интерферометры приме- применяют для изучения основных характеристик излучения (степени моно- монохроматичности, длины волнового цуга и др.). * См.: Крылова Т Н. Интерференционные покрытия. Л., изд-во «Машино- «Машиностроение», 1973. 174
По-виХимому, любое из приспособлений для наблюдения стацио- стационарной интерференционной картины может послужить основой для создания соответствующего интерферометра. Однако не будем рассмат- рассматривать двухл^евой интерферометр, основанный на результатах опыта Юнга. Читатель .более подготовлен к пониманию действия интерферо- интерферометров, в которых используется отражение или преломление световых волн (т. е. метод Френеля). Исследуем интерференцию двух лучей, отраженных от передней и задней стенок какой-либо диэлектрической пластинки (рис. 5.38). Разность хода этих лучей определяется равенст- равенством E.50). Если пластина достаточно толста, то интерфе- интерферирующие лучи 1 и 2 разведены на значительное расстояние и в любой из них нетрудно ввести кювету с изучаемым веществом или какой-либо другой объект, создающий дополнительную раз- разность хода А', которую можно измерить. Однако с увеличением толщины пластины возникают до- дополнительные трудности, которые были частично охарактеризованы в § 5.6. Для сведения интерфе- интерферирующих лучей и компенсации разности хода, создаваемой пластиной, расщепляющей пучки 1 и 2, удобно использовать вторую стеклянную пла- пластину такой же толщины. Это смягчает требования к монохроматичности света, проходящего через интерферометр. Такая схема из двух толстых стеклянных пластин, разделенных воздушной прослойкой, реализуется в интерферометре Жамена. Пусть две одинаковые плоскопараллельные пластины установлены примерно параллельно (рис. 5.38). Найдем разность хода А для такого оптического устройства. Очевидно, что при раздвоении луча на первой пластине возникнет разность хода Ах = 2nl cos cp£ — А/2, на второй Д2 = 2nl cos ф5 — Я/2. Если пластины строго параллельны, то А = == Дх — Д2 = 0; если же они установлены под малым углом е, то А=2я/ (cos фа — cos фз) = 2nl sin ф2 бф2, E.56) где ф2 = (ф2 + Фг)/2, а малая величина бф2 примерно равна |q>5 — Фг|. Можно показать, что бф2 « е. Условие возникновения максимума интенсивности для исследуе- исследуемого случая имеет вид Рис. 5.38. Схема интерферометра Жамена: /Ci и Кг — кюветы 2n/ sin ф2бф2 = 2т%/2. E.57) Очевидно, что чем меньше 6ф2 « е, тем шире интерференционная полоса. При бф2 -> 0 выполняется условие А = 0, и мы увидим, что все поле зрения окрашено в один цвет — ширина интерференционной полосы больше тех угловых размеров, при которых ведется наблюде- наблюдение интерференционной картины. Тонкой юстировкой относительного положения пластин можно добиться появления интерференционных полос и сосчитать их число в поле зрения. 175
Легко обнаружить, что самые незначительные изменения условий опыта приводят к сдвигу интерференционных полос. Так, например, если поднести руку к пространству между пластинами (незначительно нагреть воздух в этом объеме), то наблюдается интенсивное переме- перемещение полос. Попробуем провести простую оценку чувствительности метода. Ес- Если на пути одного луча вставить кювету длиной 1Ъ наполненную газом с показателем преломления пъ а на пути другого—эквивалентную кю- кювету, наполненную другим веществом с показателем преломления пъ то появится дополнительная разность хода Д' = 1Х (пх — п2). Следо- Следовательно, произойдет сдвиг интерференционных полос. Охарактери- Охарактеризуем этот сдвиг дробью т\ показывающей, на какую часть одного по- порядка интерференции сместились интерференционные полосы. Тогда Д' =т"к. Измеряя сдвиг т', определим Д'. Например, полосы сдви- сдвинулись на 0,1 порядка интерференции, т. е. т' =0,1. Теперь оценим An = Д7/х. Обычно одна из кювет служит контрольной (проводятся относительные измерения). Для простоты будем считать п2 = 1 (ва- (вакуум) и определим An из соотношения Д' = 1г (пг — 1) = 1±Ап. При 1г = 10 см; т! = 0,1; % = 5-Ю см получим An = т'7Лг « 5-Ю-7, т. е. можно измерить изменение показателя преломления в шестом знаке после запятой. Измерение показателя преломления — это особая область метро- метрологии, названная рефрактометрией. Проведенная оценка показывает, что интерференционный метод обеспечивает весьма высокую чувстви- чувствительность относительных рефрактометрических измерений. Это позво- позволяет использовать такой метод для решения разнообразных задач. Вместе с тем ясно, что реализовать столь высокую чувствительность совсем не просто и, чтобы добиться высокой стабильности интерферо- метрических измерений, необходима чрезвычайная аккуратность и тщательность в подготовке эксперимента. В этом плане интерферометр Жамена представляется весьма уязви- уязвимым. Мы видели, что возможность значительного разведения интер- интерферирующих лучей прямо связана с толщиной пластин интерферо- интерферометра, которые должны изготовляться из однородного стекла, не иметь натяжений и т. д. Пластины будут медленно прогреваться до темпера- температуры окружающей среды, и этот процесс приведет к длительному и плохо контролируемому изменению интерференционной картины. Ис- Использование яркого источника света неизбежно еще усложнит установ- установление теплового равновесия, так как часть светового потока, совершаю- совершающего большой путь в стекле, будет поглощаться пластинами интерфе- интерферометра. Крайне затруднена работа в ультрафиолетовой области спектра, так как в этом случае необходимы уникальные толстые и однородные кварцевые пластины. Все перечисленные выше обстоятельства привели к тому, что ин- интерферометр Жамена не нашел серьезного применения. Вместе с тем в работах Маха, Цендера, Прингсхейма и других ученых были разви- развиты идеи, на использовании которых основан этот прибор. Рассмотрим схему интерферометра Д. С. Рождественского, широко применяюще- применяющегося в работах по оптике и спектроскопии в Советском Союзе. 176
Его принципиальная схема приведена на рис. 5.39. Задача создания такого интерферометра решена очень изящно. Он представляет собой два независимых блока, каждый из которых содержит одно полупро- полупрозрачное зеркало и одно полностью отражающее (Аъ АгнА^А 3). Сами блоки могут быть разнесены на значительные расстояния (обычно по- порядка 1 м). Расстояние между зеркалами Аги А2 обеспечивает требуе- требуемое разведение пучков 1 и 2 — его можно довести до нескольких де- десятков сантиметров. В своей последней работе A940 г.) Д. С. Рождест- Рождественский использовал интерферометр с расстоянием между зеркалами Аг и А 2 (соответственно А 3 и Л4) около 40 см. Коэффициент отражения полупрозрачных зеркал Аг и А 3, служащих делителями световых пуч- пучков, невелик D0—50%); желательно, чтобы интенсивность пучков света 1 и 2 была > \ft примерно одинаковой. Эти пластины часто изготовляют из кварца, что позволяет ра- работать в ультрафиолетовой области спект- спектра. Толщина пластин обычно не превышает ^ ^ ^ ■ . 1 см, и значительная часть неприятных Zm J j особенностей, характерных ДЛЯ ИНТерфе- Рис. 5.39. Принципиальная рометра Жамена, здесь заметным образом схема интерферометра Рож- Рожне Проявляется. дественского ВмитапгЬрпптшугпр PnwnppTRPwrK-nrn гтр Справа показана щель спектро- ИНТерферОМетре ГОЖДеСТВеНСКОГО ИС- графа, используемого в комбина- ПОЛЬЗуЮТСЯ ОТНОСИТеЛЬНО НеВЫСОКИе ПОрЯД- Дии с интерферометром ки интерференции. Первоначальная юсти- юстировка проводится по «нулевой полосе», соответствующей А = 0. Правда, в последующих измерениях дисперсии паров обычно вводят дополни- дополнительную разность хода и исследуют интерференционные кривые более высоких порядков. Этот прибор, предназначенный для точных измере- измерений изменения показателя преломления газов или паров вблизи линии поглощения, рассчитан на исследование интерференционной картины в разных длинах волн. Поэтому обычно интерферометр освещают ис- источником непрерывного спектра и исследуют спектр поглощения, ком- комбинируя такой интерферометр со спектрографом. В один из пучков вводится откачиваемая кювета, закрепленная внутри трубчатой электрической печи; изменяя ее нагрев, можно ме- менять плотность паров металла, помещенного внутри кюветы (рис. 5.40). Возможно применение и более сложных устройств типа специальной вакуумной печи а, позволяющей экспериментировать с тугоплавкими и малолетучими веществами при температурах 2000° С (и более). Тем- Температуру внутри печи обычно контролируют оптическим пирометром или специально отградуированными термопарами. Особое внимание уделяется обеспечению однородности поглощающего столба паров. Для этого подбирают дополнительные обмотки на концах печи, про- проводят трудоемкие контрольные опыты. В другой интерферирующий пучок вводят хорошо откачанную компенсационную трубку 6. Ее длина примерно соответствует длине кюветы, а окошки идентична окошкам кюветы с парами металла. Вся предварительная юстировка интерферометра проводится при холодной кювете, т. е. без введения дополнительной разности хода, 177
обусловленной наличием паров исследуемого металла. В процессе юстировки добиваются, чтобы интерференционные полосы, отображае- отображаемые объективом L2 на вертикальную щель спектрографа Sp9 были стро- строго горизонтальны. Особо проверяется наличие в поле зрения «нулевой полосы», для которой порядок интерференции т =0 (рис. 5.41, а). К бакиимной системе -*- I) sp Рис. 5.40. Схема измерения дисперсии в разреженных га- газах и в парах металлов с помощью интерферометра Рождественского Конечно, добиться параллельности нескольких интерференционных полос можно только в относительно небольшом спектральном интер- интервале, так как по мере продвижения в сторону длинных волн расстоя- расстояние между полосами должно увеличиваться (А = тК). Интерферен- Интерференционные полосы высоких порядков, возникающие при большой разности хода, не параллельны нулевой] поло- полосе. Это легко проверить непосредст- непосредственным наблюдением, вводя в один из Рис. 5.41. Интерференци- Интерференционные полосы вблизи ну- нулевого порядка (а) и в высоких порядках (б) Рис. 5.42. Изгиб интерфе- интерференционных полос вблизи линии поглощения пучков плоскопараллельную стеклянную пластинку толщиной в не- несколько миллиметров. Тогда появляется система мелких наклонных полос (рис. 5.41, б). На рис. 5.41, а для сравнения показана группа полос вблизи т = 0, наблюдаемая в подготовленном к работе интер- интерферометре. После завершения предварительной юстировки начинают постепен- постепенно нагревать печь, увеличивая давление паров металла внутри кюветы 178
и добиваясь возникновения линий поглощения на фоне сплошного спектра, д фокальной плоскости спектрографа при этом можно наблю- наблюдать своеобразную интерференционную картину (ее нетрудно также сфотографировать). Вблизи линий поглощения наблюдается изгиб интерференциокных полос, отражающий изменение показателя пре- преломления, так к&к дополнительная разность хода, вносимая парами металла, в данном опыте равна (п — 1I (рис. 5.42). На рис. 5 43, а приве- приведена полученная в таком >4f опыте фотография интерфе- - ^ 1*1 % ренционной картины, соот- \ > ~f~~ "» ветствующей участку спект- спектра титана, содержащему ряд линий поглощения. Вблизи каждой линии на- наблюдается изгиб интерфе* ренционных полос. Изме- Измеряя на фотографии откло- отклонение полосы от горизон- горизонтальной линии в ряде то- точек, для каждой из кото- которых известно значение длины волны, можно полу- получить зависимость п (X) и сравнить ее с расчетной Рис 5 43 Фотографии интерференционных кар- картин для участка спектра поглощения Ti Интерференционные кривые, полученные на интерфе- интерферометре Рождественского без введения дополнитель- дополнительной разности хода (а); то же, при введении дополни- дополнительной разности хода (б), то же, при еще большей разности хода (в). На последних двух фотографиях отчетливо видны «крюки» кривой. Графическим диф- дифференцированием кривой п (Я) можно также получить кривую dnldX или оценить эту величину в каждой точке. Такой метод исследования дисперсии паров различных металлов вблизи линий поглощения применялся некоторыми исследователями. Его недостаток состоит в неизбежном ухудшении точности измерений по мере приближения к линии поглощения, где интерференционные полосы очень резко изменяют свое направление и оказываются почти перпендикулярными первоначальному направлению. Заслугой Д. С. Рождественского является создание нового варианта интерферен- интерференционного метода исследования дисперсии паров в непосредственной близости к линии поглощения — метода «крюков», позволяющего про- проводить измерения с большой точностью. , При измерениях по методу «крюков» в одну из ветвей интерферо- интерферометра (кроме кюветы или компенсационной трубки) вводится стеклян- стеклянная (кварцевая) пластинка вполне определенной толщины. Это при- приводит к дополнительной разности хода, т. е. к возникновению на- наклонных интерференционных полос высокого порядка, которые для некоторой^длины волны компенсируют наклон полос, обусловленный дисперсией паров. В результате вблизи линии поглощения по обе сто- 179
роны от нее образуются характерные изгибы интерференционных по- полос — это и есть «крюки» Рождественского. Чем толще стеклянная пластинка, т. е. чем больше введенная разность хода, тем острее «крю- «крюки». В зависимости от условий эксперимента выгодно использовать пластинку той или иной толщины. На рис. 5.43, б, в показаны «крю- «крюки», образующиеся у линии поглощения титана при использовании двух пластинок разной толщины. Метод «крюков» легко обосновать следующим образом. Ясно, что если интерферометр предварительно настроен на нулевую полосу (см. рис. 5.41, а)у то каждой другой интерференционной полосе на ра- рабочей спектрограмме будет соответствовать определенная разность фаз Аф, обусловленная действием слоя пара с показателем преломле- преломления п, введенного на пути одного интерферирующего пучка, и прозра- прозрачной пластинки с показателем преломления пг, помещенной на пути второго пучка. Математически это записывают следующим образом: E.58) Первый член разности соответствует слою пара толщиной /, а вто- второй — прозрачной пластинке толщиной 1Х. При переходе от одной полосы к другой (соседней) порядок интерференции меняется на еди- единицу, а разность фаз — на 2я. Постоянство Аф вдоль полосы выпол- выполняется для интерферирующих пучков, проходящих через слой пара и пластинку под различными углами. Это значит, что в общем случае длина слоя пара / (а также толщина пластинки 1г) при продвижении вдоль полосы (т. е. при разных К) будет изменяться. Проследим теперь, как изменяется Дф при продвижении вдоль оси длин волн (т. е. при постоянных I и 1г) по направлению к какой-либо линии поглощения (рис. 5.43, б). Нетрудно заметить, что при прибли- приближении к «крюку» будут пересекаться интерференционные полосы, каж- каждая из которых соответствует определенному значению монотонно изменяющегося порядка интерференции. Но при переходе через вер- вершину крюка сразу встретится полоса, пересечение с которой только что наблюдалось. Это значит, что переход через вершину крюка при про- продвижении вдоль оси длин волн связан с изменением знака приращения разности фаз Аф. Следовательно, в точке Я = A,R, соответствующей вершине крюка, наблюдается экстремум зависимости Аф от X и нужно положить L дХ Используя уравнение E.58), при X = Хк получаем ( dX\ X Выполняя дифференцирование, находим ^L=iL Г^-2й=Л + ±zL. E.59а) аХ I I dX I J X х ' 180
Уравнение E.59 а) указывает, что, зная упругость паров и свой- свойства введенной стеклянной пластинки, можно определить дисперсию паров вблизи линии поглощения. В теории метода, развитой Д. С. Рож- Рождественским, на основании расчетов подобного рода было получено соотношение, связывающее расстояние между вершиной крюка и ли- линией поглощения со свойствами исследуемого пара и используемой прозрачной пластинки. Рассматривая фотографии, приведенные на рис. 5.43, б, в, замечаем, что расстояние между «крюками» у интенсив- интенсивной линии поглощения титана C989 А) значительно больше, чем у сла- слабой линии D025 А), хотя условия фотографирования «крюков» были одинаковы. Определяя отношение расстояний между «крюками», можно найти отношение интенсивностей двух исследуемых линий поглоще- поглощения, начинающихся на одном нижнем уровне. Интенсивность линии поглощения определяется произведением числа N поглощающих атомов на силу осциллятора f^ для соответст- соответствующего перехода [см. D.13)]. Следовательно, измерение расстояния между «крюками» позволяет определить произведение Nfih для иссле- исследуемой линии. Если из каких-либо дополнительных опытов оценить число N поглощающих атомов, то применение метода «крюков» позво- позволит измерить силу осциллятора ft^ а следовательно вероятность пере- перехода и связанное с ней время жизни атома в возбужденном состоянии [см. D.13а)]. Существует много способов определения среднего времени жизни возбужденного атома. Остановимся вкратце на очень интересном и получившем в последнее время широкое распространение оптико- магнитном методе. Поясним его 'на классической модели, полностью описывающей явление лишь в некоторых частных случаях, но качест- качественно отражающей и общее решение задачи. Излучающий атом можно представить в виде затухающего осцил- осциллятора, излучение которого поляризовано (см. § 1.7). Поместим этот осциллирующий диполь, состоящий из положительно заряженного ядра и электрона (MHJJmdst ^> 1), во внешнее постоянное магнитное поле Нвнеш. Такой диполь будет прецессировать в плоскости, перпен- перпендикулярной Нвнеш. Если бы можно было следить за поляризацией излу- излучения одного диполя в направлении внешнего магнитного поля, то мы заметили бы, что плоскость поляризации со временем поворачивается. Осциллятор затухающий, поэтому одновременно с поворотом плоскости поляризации будет убывать и интенсивность излучения. Естественно, что чем быстрее затухает излучение (т. е. чем меньше время жизни возбужденного состояния), тем на меньший угол успеет повернуться плоскость поляризации. На опыте наблюдается излучение когерентно возбужденного ансамбля атомов и измеряются его поляризационные характеристики как функции внешнего магнитного поля. После не- несложной математической обработки результатов наблюдения можно определить среднее время жизни атома в возбужденном состоянии. При исследовании монохроматических линий, позволяющих ра- работать с очень большой разностью хода, применяют интерферометр Майкельсона, сыгравший существенную роль при решении как фун- 181
К Рис. 5.44. Принципиальная схе- схема интерферометра Майкель- сона Отражающий слой полупрозрачного зеркала 3' обозначен жирной ли- линией даментальных физических задач, так и различных задач техники. Рассмотрим принципиальную схему этого интерферометра (рис. 5.44). Два плоских зеркала lull укреплены на массивном основании перпендикулярно друг другу. Одно из них (например, //) может пе- передвигаться по салазкам, оставаясь параллельным своему первоначаль- первоначальному положению. Полупрозрачное зеркало 3' (отражающий слой с М « 50%) служит делителем света на пучки 1 и 2. Пластину 3", имеющую такую же толщину, как и пластина 3', вводят на пути луча 7, чтобы создать эквивалентные условия для обоих лучей; в самом деле, из рисунка видно, что луч 2 трижды проходит пластину 3', а луч 1 — лишь один раз, так как отражающий слой нанесен на стороне пластины 3', обращенной к источнику. Если ввести на пути луча 1 пластину 3", то при ра- равенстве плеч интерферометра оптическая длина пути для лучей 1 и 2 одинакова и разность их хода А = 0. При перемещении зеркала // в поло- положение //' возникнет разность хода А, равная удвоенному расстоянию между зеркалами // и //'. Если зеркало // по-прежнему строго параллельно ото- отображению зеркала /, то на выходе полу- получатся кольца равного наклона. Если воз- воздушная прослойка представляет собой клин, то возникнут полосы равной толщины. В обоих случаях полосы можно спроектировать линзой на экран для наблюдения стационар- стационарной интерференционной картины. В первоначальном варианте Май- кельсон наблюдал кольца равного наклона при помощи зрительной трубы. Мы увидим, что такой простой способ регистрации позволил ему обнаружить очень тонкие эффекты. В процессе движения зеркала II происходит перестройка картины интерференции — в поле зрения появляются новые полосы. В зави- зависимости от направления движения зеркала /•/ кольца равного наклона будут разбегаться из центра интерференционной картины или соби- собираться к ее центру. Если скорость перемещения зеркала не слишком велика и при его движении мало сказывается разъюстировка интер- интерферометра, то можно сосчитать число полос, возникших за определен- определенный промежуток времени. Ранее не оговаривались требования, предъявляемые к источнику света, излучение которого можно исследовать с помощью интерферо- интерферометра Майкельсона. Предполагалось, что это монохроматическое излу- излучение вполне определенной частоты v = со/ Bл). Но иногда возникает и более сложная ситуация. Если осветить интерферометр немоно- немонохроматическим светом, то результирующая интерференционная кар- картина, очевидно, должна содержать какую-то информацию о спектраль- спектральном составе исходного излучения. Фактически близкая задача решалась в опытах Майкельсона, про- проведенных в конце XIX в. Он исследовал (фотографически или визуаль- 182
но) изменение видимости интерференционных колец равного наклона при увеличении разности хода вследствие перемещения одного из зер- зеркал интерферометра. После его перемещения на определенный отрезок проводилась проверка юстировки и определялась функция видимости ИНТерфереНЦИОННОЙ КарТИНЫ V = (/макс — /минУ(/макс + /мин) ПрИ данной разности хода А. Сравнение найденной таким образом экспериментальной кривой видимости V (А) с расчетной, полученной при определенных предполо- предположениях о структуре линии, позволяет количественно оценить некото- некоторые параметры исследуемого излучения. В качестве при- примера на рис. 5.45 приведены расчетные кривые видимости V для интерференционной in to 0,5 dv 5) Рис. 5.45. Расчетные кривые видимости для линии с гауссовским распределением интен- интенсивности (а) и для хорошо разрешенного дублета тоже с гауссовскими распределе- распределениями интенсивностей /0' = 2/ J (б) * 5 Ю 15 20 25 Рис. 5.46. Экспериментальная кривая видимости для красной линии Cd, полученная Майкель- соном картины, полученной при освещении интерферометра Майкельсона излучением линии с гауссовским распределением интенсивности / = /0 ехр (—а2^2) (а) или хорошо разрешенного дублета (тоже с гаус- гауссовскими распределениями интенсивности в каждой компоненте), у которого /о = 2/5 (б). Экспериментальная кривая видимости, полученная Майкельсоном для красной линии кадмия (Х=6439А), изображена на рис. 5.46. Как мы видим, наблюдается отличное согласие этой кривой с расчетной для одиночной линии, позволяющее определить ее ширину. Высокая мо- монохроматичность красной линии кадмия была подтверждена после- последующими измерениями, и линия % = 6439 А долгое время использова- использовалась в качестве основного стандарта в метрологических работах. Исследование экспериментальной кривой видимости для желтого дублета натрия, подобной расчетной кривой (см. рис. 5.45, б), позво- позволило Майкельсону установить, что каждая из двух компонент дублета имеет сложную структуру. В этих же опытах было обнаружено расцеп- расцепление на две компоненты красной линии водорода (На). Более поздние измерения показали, что положение и относительная интенсивность 183
компонент тонкой структуры были определены Майкельсоном с боль- большой точностью. Мы обсуждаем эти ранние работы для того, чтобы показать, какие возможности таит в себе интерферометрический метод. Вместе с тем хочется подчеркнуть, что результаты этих работ имеют существенное значение и могут быть интерпретированы с использованием понятий, введенных в предыдущих параграфах этой главы. В связи с этим необ- необходимо сделать следующие замечания. Кривые видимости, приведенные на рис. 5.45, рассчитаны для ква- квазимонохроматического излучения. В §5.4 исследовалась пространствен- пространственная когерентность квазимонохроматических волн, испускаемых про- протяженным источником света. В данной задаче изучаются ограничения, связанные с немонохроматичностью излучения точечного источника. Как уже указывалось, в этом случае обычно говорят о временной ко- когерентности. Можно представить себе качественную аналогию в формировании кривых видимости интерференционных картин от одного точечного источника, излучающего на двух разных частотах vx и v2, и от двух монохроматических точечных источников, излучающих одну и ту же спектральную линию, но пространственно разнесенных на некоторое расстояние (см. рис. 5.17). Если осветить интерферометр излучением от одного точечного источника, содержащим две частоты, то также полу- получится наложение интерференционных картин, приводящее к умень- уменьшению видимости суммарной картины. Поэтому график функции види- видимости (в зависимости от разности частот) будет похож на график, приведенный на рис. 5.18, отображающий условия наложения интер- интерференционных картин от двух пространственно разделенных точечных источников света. В рамках этих представлений можно качественно истолковать ре- результаты описанных опытов Майкельсона, изучавшего изменение кри- кривых видимости с увеличением разности хода. Для источника, излучаю- излучающего две монохроматические линии, зависимость видимости интерфе- интерференционной картины от разности хода (при фиксированной разности частот) должна быть подобна зависимости V от разности частот этих линий (при фиксированной разности хода А). Это будет некая периоди- периодическая функция, аналогичная кривой, изображенной на рис. 5.18. Немонохроматичность каждой спектральной линии (распределение по частотам вблизи vx и v2) приведет примерно к тем же результатам, которые наблюдались в случае интерференции от протяженного источ- источника света. Видимость интерференционной кривой, медленно осцилли- осциллируя, уменьшается с увеличением разности хода. Так как мы рассмат- рассматриваем квазимонохроматическую волну (О <С V < 1), то при таких осцилляциях /мин отлична от нуля и график функции видимости похож на кривую, изображенную на рис. 5.45, б. Из сказанного становится понятным, что при освещении интерферометра одиночной симметрич- симметричной линией с шириной (в шкале частот) 8v, функция видимости интер- интерференционной картины изобразится плавной кривой, показанной на рис. 5.45, айв какой-то степени эквивалентной первому участку кри- кривой на рис. 5.20 (V изменяется от 1 до 0), описывающей наложение ин- 184
терференционных картин от множества некогерентных излучателей, совокупность которых представляет собой протяженный источник света. Чем fme линия, тем при большей разности хода А сохранится отличная от нуля видимость интерференционной картины. Для моно- монохроматического излучения видимость не должна зависеть от разности хода и изобразится прямой линией (V = 1), параллельной оси абс- абсцисс. Сделанные замечания показывают, что разница между пространст- пространственной и временной когерентностью в некоторых случаях довольно условна и введение этих двух понятий в основном связано с нагляд- наглядностью модельных представлений сложного явления когерентности. Введенная функция у12 (Д£) пригодна для описания как временной, так и пространственной когерентности. Таким образом, интерферометр Майкельсона можно использовать для экспериментального определения важнейших характеристик излу- излучателя — длины когерентности LKor и времени когерентности тког. Мы знаем, что интерференция может наблюдаться при разности хода А < LK0P = стког. Определение этой предельной разности хода и является способом измерения длины и времени когерентности для дан- данного излучателя. Рассмотрим такие эксперименты несколько подроб- подробнее. Время когерентности тког обратно пропорционально fiv — ширине той спектральной линии, которая используется в опытах по опреде- определению предельной разности хода: TKOr~l/(8v). Тогда длина когерентности ^ког = <*«* = С/ (8V) = МFХ)9 E.60) где 8Х — ширина той же линии в шкале длин волн. Для того чтобы сравнить оценку LKOr по формуле E.60) с данными опыта, надо выбрать определенный источник света. Пусть интерферо- интерферометр освещается излучением газоразрядной плазмы низкого давления, когда столкновениями можно пренебречь, а основной причиной уши- рения спектральной линии служит хаотическое тепловое движение из- излучающих атомов. Механизм этого доплеровского уширения будет рассмотрен в гл. VII, а сейчас мы ограничимся некоторыми просты- простыми оценками. Нетрудно показать, что контур линии при таком уширении будет гауссовским. Доплеровская ширина спектральной линии 6уДоп за- зависит от длины волны излучаемого света и пропорциональна Vt/M, где Т — абсолютная температура газа, М — его молярная масса. Она в среднем более чем на два порядка превышает естественную ширину спектральной линии, обусловленную процессами излучения. В грубом приближении можно принять 6удоп ^ 1000 МГц = 109 с1. Тогда г/^доп ^ 30 см, что и определяет допустимую разность хода при ин- герферометрических измерениях с использованием в качестве источника света газоразрядной плазмы низкого давления. Полученная Майкель- 185
соном кривая видимости для красной линии кадмия (рис. 5.46) пока- показывает, что вплоть до разности хода А « 20 см видимость интерферен- интерференционной картины отлична от нуля. Следовательно, в данном случае LKor немного больше 20 см. При освещении интерферометра излучением лазера подобные оценки неприменимы. В этом случае внутри «доплеровской линии» наблю- наблюдается ряд аномально узких линий, соответствующих излучению на дискретных частотах, определяемых параметрами лазера (рис. 5.47). Если каким-либо способом выделить одну из таких частот собствен- собственных колебаний («мод») этой сложной системы, то появится возможность проведения интерферометрических из- измерений с очень большой разностью хода. Несколько изменив условия наблю- наблюдения, можно более точно изучить из- изменение интерференционной картины в процессе движения зеркала //. Такая модификация метода наблюдения пред- представляет интерес с различных точек зрения. Исследуем ее подробнее. Направим лучи 1 и 2 (после их сое- соединения; см. рис. 5.44) через диафрагму (или щель) на какой-либо приемник све- света (фотоумножитель, фотоэлемент) и за- зарегистрируем после усиления возник- возникший сигнал на осциллографе. При равномерном движении зеркала // разность хода А монотонно увеличивается, а суммарная интенсив- интенсивность сигнала изменяется по закону ^l E.61) Рис. 5.47. Различные факторы, определяющие ширину линии газового лазера: #УДоп — доплеровская ширина ли- линии излучения газа (^ 109 Гц); 6vpea — ширина резонансного пика резонатора <<~ 107 Гц); бгген — ши- ширина линии генерации (^ 1СН Гц) Если Д/2 = /2 — h — vt (где v — постоянная скорость движения зеркала), то соотношение E.61) примет вид E.62) где / = 2vv/c — частота модуляции наблюдаемого сигнала. Полученный результат очень интересен: интенсивность света, ре- регистрируемого приемником, оказалась периодической функцией вре- времени. Следовательно, при таком способе наблюдения регистрируется не стационарная картина интерференции, а некоторый изменяющийся во времени процесс, характеризующий перемещение интерференцион- интерференционных полос вследствие изменения разности хода. Теперь перейдем к описанию конкретного опыта. Неон-гелиевый лазер Л, использованный для освещения интерферометра, генерирует излучение с X = 6328 Айв нем относительно просто обеспечивается выделение центральной моды ТЕМ00. Интерферометр Манкельсона образован двумя отражателями Тг и Т2 и полупрозрачным зеркалом М± (рис. 5.48). Металлическое зеркало 186
м9 h /И2 укреплено на подвижных винтах, что удобно для юстировки при- прибора. В качестве отражателей Тг и Т2 применяют призмы полного инутреннего отражения — уголковые отражатели. Такая призма представляет собой тетраэдр из стекла с углами между боковыми гра- гранями А, В, С, равными 90° (рис. 5.49). Луч света 1, падающий нормаль- нормально на переднюю грань С, испытывает внутри уголкового отражателя три полных внутренних отражения и возвращается по направлению /'. Падающий 1 и отраженный /' лучи остаются параллельными при небольших перекосах призмы, т. е. при разных углах падения на грань С. Подвижной уголковый отража- отражатель Т2 не связан жестко с осталь- остальными частями оптической системы, и движение его сопровождается малыми перекосами. Однако благо- благодаря упомянутому выше свойству уголкового отражателя это не при- приводит к разъюстировке интерферо- интерферометра. Расстояние Мг Тг « 25 см, а М2Т2 «Юм (см. рис. 5.48). Для приблизительного уравнивания ин- интенсивности интерферирующих лу- лучей в плечо МгТх введен нейтраль- нейтральный фильтр Ф1и Перед фотоумножи- фотоумножителем (ФЭУ) установлен светофильтр (Ф2), обеспечивающий известное снижение уровня шумов на выходе ФЭУ, откуда сигнал через раздели- разделительный конденсатор подается на осциллограф. Существенную роль играет небольшая диафрагма D2. Специальное сканирующее приспособление позволяет перемещать уголковый отражатель Т2 с постоянной скоростью ±v на расстояние «Зсм. Весь механизм установлен на отдельном столе, который можно удалить от интерферометра на расстояние до 15 м. В результате интерференции волн, отраженных от покоящегося Тг и движущегося Т2 отражателей, возникает нестационарная интерференционная кар- картина (бегущие интерференционные полосы). На экра- экране осциллографа появляется отчетливый сигнал, имеющий вид синусоиды (рис. 5.50). Синусоида про- пропадает, если перекрыть одно из зеркал. В этом случае интерферен- интерференционный член равен нулю и интерференция отсутствует. Если оста- остановить движение уголкового отражателя Т2, то синусоида на экране осциллографа также пропадет. Полосы перестанут бежать, возникнет стационарная интерференционная картина, которую надо наблюдать другим методом. Из вида синусоиды нетрудно определить скорость движения зер- зеркала (см. гл. VII.). Наиболее интересна выявляющаяся в описываемом Рис. 5.48. Схема установки с интер* ферометром Майкельсона для изуче* ния нестационарной интерференцион- интерференционной картины Нестационарность возникает вследствие движения отражателя Т2 Рис. 5.49. Уголко- Уголковый отражатель 187
Рис. 5.50. Осциллограмма, харак- характеризующая нестационарную ин- интерференционную картину, по ко- которой может быть определена ско- скорость движения отражателя Г2 эксперименте возможность получения отчетливой интерференционной картины при большой разности хода(Д>20м). Это говорит о том, что длина когерентности для газового лазера велика (много больше 20 м), а время когерентности значительно превышает А/с = 10~7с. По су- существующим в литературе оценкам, пользуясь газовыми лазерами, можно наблюдать интерференцию при разности хода, превышающей несколько километров, что открывает возможность интересных при- приложений. Конечно, такие эксперименты требуют чрезвычайно тонкой юстировки и часто оказывается труд- трудным обеспечить хорошее отношение сигнал/шум. Интерферометр Майкельсона с дви- движущимся зеркалом применяют также при изучении спектрального состава немонохроматического излучения. Для этого он освещается исследуемым излучением, а получившаяся на вы- выходе кривая подвергается Фурье-ана- Фурье-анализу и тем самым преобразуется в распределение интенсивности по ча- частотам. Рассмотренная модификация интерферометра Майкельсона пред- представляет собой простейшую модель так называемого Фурье-спектрометра. В современных приборах подобного типа анализ суммарной кривой проводится быстродействующими электронными машинами. Эта методика исследования, в которой от- отсутствует спектральное разложение изучаемой радиации, обладает рядом особенностей и находит в последнее время все более широкое применение при решении различных физических задач. На рис. 5.51 приведены результаты, которые должны получиться при записи двух квазимонохроматических сигналов (на частотах vx и v2 и суммы 2vn) как обычным способом (спектральное разложение), так и методом Фурье-спектроскопии. Мы уже обсуждали [см. E.17)] при- применение преобразований Фурье при переходе от записи Re F (f) к час- частотному разложению и усматриваем полную аналогию между рис. 5.6 и двумя частями рис. 5.51, а, б. Сложнее выглядит суммарная интер- ферограмма 2vn(pnc. 5.51, в). Также как и более простые графики в верхней части рисунка, она не является непосредственным представ- представлением исследуемого спектра суммарного колебания, но однозначно связана с ним. Чтобы найти этот спектр, представленный в левой части рис. 5.51, в, надо провести Фурье-анализ интерферограммы. В некото- некоторых случаях такая сложная методика оказывается более эффективной, чем прямой анализ спектра. В § 6.7 будет подробно рассмотрена связь между экспериментальной методикой получения спектра и математи- математическим разложением функции F (t) по гармоническим составляющим. Метрологические приложения интерферометрического метода весь- весьма существенны и отражают прогресс науки и техники, достигнутый в XX в. Хорошо известно, что использование в качестве первичного 188
А л АЛА эталона длины метрового платинового стержня, хранящегося в Париже, представляло ряд неудобств. Более эффектно выглядела возможность определить путем последовательных интерферометрических измере- измерений, сколько длин волн какой-либо спектральной линии укладывает- укладывается в одном метре, и затем считать первичным эталоном приведенную к вакууму длину волны Ко этой линии, излучаемой стандартным источником света. Принципиальная схема таких измерений довольно проста. Надо определить число длин волн, уклады- укладывающихся в какой-то стан- стандартной мере. Эту меру (в первичных эксперимен- экспериментах — пластину толщиной / = 0,39 мм) прикладывают к зеркалу интерферометра и наблюдают, как сместит- сместится интерференционная кар- картина, т. е. считают число максимумов, которое прой- пройдет в поле зрения при воз- возвращении к исходной ин- интерференционной картине путем отодвигания подвиж- подвижного зеркала на отрезок длины /. Затем эту меру таким же образом сравни- сравнивают с другой, примерно в два раза большей, и т. д. Таким способом в резуль- результате длительных и трудо- трудоемких измерений было определено число длин волн, укладывающихся в одном метре. Однако окончательное решение проблемы о выборе эталона длины потребовало нескольких десятилетий интенсивной научной работы, проводившейся в ряде лабораторий мира. Это понятно, так как пере- переход к новому эталону длины не может базироваться только на прин- принципиальных соображениях общего характера и требует детального ана- анализа погрешности предлагаемого метода. А добиться малой погреш- погрешности столь сложных и многоступенчатых измерений и стандартизи- стандартизировать условия опыта оказалось совсем не просто. Так, например, на протяжении почти полувека в таких экспериментах использовалась исследованная Майкельсоном красная линия кадмия. Лишь в 1954 г. Международный конгресс метрологов решил принять в качестве этало- эталона длину волны оранжевой линии (К = 6056 А) изотопа криптона с мас- массовым числом 86, которая позволяет обеспечить несколько большую 189 Рис. 5.51. Результаты исследования двух ква- зямонохроматических сигналов частот vi (a), v2 (б) и суммы 2vn (в) при спектральном раз- разложении (левая часть рисунка) и методом Фурье-спектроскопии (правая часть)
точность интерферометрических измерений. Было установлено, что в одном метре укладывается 1 650 763, 73 длины волны в вакууме этой линии изотопа криптона, и тем самым был определен первичный стан- стандарт длины, с которым должны сравниваться все вторичные стандарты. Следует указать, что в последующие годы эти измерения проводились не на интерферометре Майкельсона, а методами многолучевой интер- интерференции (см. § 5.9). Закончим на этом изучение двухлучевых интерферометров, хотя многие их приложения остались вне нашего поля зрения. Но изложен- изложенного материала вполне достаточно, чтобы сделать определенный вывод о широких возможностях интерферометрического метода. Для того чтобы оценить преимущества и недостатки описанных устройств, надо сравнить их с интерферометрами, в которых взаимодействует большое количество пучков. § 5.9. ИНТЕРФЕРОМЕТР ФАБРИ — ПЕРО Переходя к описанию многолучевых интерферометров, ограничимся элементарной теорией интерферометра Фабри — Перо. Это пожалуй, самый простой и вместе с тем весьма эффективный прибор такого типа. В дальнейшем будет кратко рассказано о возможных применениях ин- интерферометра Фабри — Перо, а сейчас обратимся к выводу основных соотношений. Исследуем интерференцию многих световых пучков, возникающую при прохождении плоской монохроматической волны через плоско- плоскопараллельную диэлектрическую пластинку с толщиной / и показателем преломления п (рис. 5.52). Показатель преломления среды вне пластинки обозначим п'. В большинстве случаев можно считать, что исследуемая диэлектрическая пластин- пластинка окружена воздухом, т. е. пг — 1. При й й Рис. 5.52. Прохождение све- светового пучка через плоско- плоскопараллельную пластинку с учетом многократных отра- отражений ру у р расчете суммарной апмлитуды прошедшей волны (Е20) учтем изменение амплитуды и разность фазы между двумя соседними пучками. На границе двух диэлектриков (пла- (пластинка и окружающая ее среда) амплитуда электромагнитной волны изменится. Обозначим коэффициенты отра- отражения и пропускания (по амплитуде) через р и т соответственно. Вве- Введенные ранее энергетические коэффициенты связаны сними очевидны- очевидными соотношениями Я = о2 и_<^_=„т2^ При отсутствии поглощения \^Я + д- = \я t E.63) Постановка задачи близка к случаю прохождения плоской моно- монохроматической волны через диэлектрическую пластинку или отраже- отражения от нее (см. § 5.6). Но тогда учитывалась интерференция только двух пучков света (например, отразившихся от передней и задней по- поверхностей диэлектрической пластинки). Всеми последующими отра- 190
женными волнами пренебрегали, что было справедливо при очень малом коэффициенте отражения р. В приводимом расчете это ограниче- ограничение снимается и необходимо учесть интерференцию многих световых волн постепенно уменьшающейся амплитуды, образующихся при многократных отражениях от поверхностей диэлектрической пластин- пластинки. При каждом прохождении через границу двух диэлектриков ам- амплитуда волны изменяется в т раз, а при каждом отражении от такой границы она изменяется в р раз. Следовательно, амплитуды вышедших из пластинки волн равны Е00%2; £Оот2Р2 и т- Д- (рис. 5.52). Разность фаз между двумя соседними интерферирующими пуч- пучками составляет S=r *L 2nl cos Ф2=— / cos ф2, E.64) где % — длина волны в диэлектрической пластинке. Учтем эту разность фаз введением соответствующего множителя е/б в выражение для амплитуды напряженности электрического поля. Тогда суммарная амплитуда прошедшей волны Е20=Е00 { ^^У ' E'б5) По определению, р < 1. Если число N интерферирующих пучков достаточно велико, то p2N -> 0 и в пределе получается -^- =—£-чг. E.66) Для вычисления изменения интенсивности света, прошедшего через диэлектрическую пластинку /пР//пад| надо умножить E2q/E00 на со- сопряженную величину (Е2о/ЕОо)*: ( )()E 67) /пад V^ Ч^ ' (l^)a+4^sinM6/2) ' V ' Это соотношение называют формулой Эйри. Исследуем ее. Интерферирующие пучки усилят друг друга, если разность хода между ними равна целому числу волн, т. е. справедливо условие 21 cos ф2 = т%, E.68) где т = 0, 1, 2, ... Минимальная интенсивность будет наблюдаться при т = 1/2, 3/2, .. Свяжем порядок интерференции т и введенную разность фаз между напряженностью поля в соседних пучках соотношением m = 2l cos ф<Д = б/ Bя), или 6/2 = тп. E.69) Интенсивность максимальна, если sin F/2) = sin (тп) = 0, где m—целое число. Интенсивность минимальна при sin F/2) == ±1, что следует также из анализа формулы E.67). 191
Легко показать, что функция видимости интерференционной кар- картины V = (/макс — /мин)/(/макс + /мин) и контрастность, определяе- мая как /макс//мин> определяются лишь коэффициентом отражения М. Для этого найдем экстремальные значения отношения /пр//пад, ко- которые оно принимает при sin F/2) = 0 и sin F/2) = 1: \ /пад /макс A-^)а ' V W /Мин 0 + Л)« ' ' ' Следовательно, 'МИН U— E.71) Анализ формулы Эйри приводит к следующим выводам: график за- зависимости изменения /пр//пад от 6 (рис. 5.53) имеет вид системы мак- максимумов, форма которых при достаточно больших R существенно от- отличается от хорошо известной кривой вида cos2 6 [см. E.12)], описывающей освещенность экрана, обусловленную интер- интерференцией двух электромагнит- электромагнитных волн. Чем выше коэффициент отра- отражения J?, тем острее максимумы, разделенные широкими миниму- минимумами. Такое пространственное перераспределение потока энер- энергии с концентрацией его в неко- некоторых преимущественных на- № S/2 Рис. 5.53. График функции Эйри при различных коэффициентах отражения^ правлениях всегда возникает при интерференции многих пучков и четко выявляется, например, при ди- дифракции плоской волны на правильной структуре из N щелей (см. § 6.4). Очевидно, что необходимо как-то охарактеризовать форму контура интерференционной полосы. Для этого вводят критерий резкости F, определяемый как отношение расстояния между двумя соседними мак- максимумами интерференции к ширине полосы е. Для нахождения F за- запишем формулу Эйри, исключив предварительно $Г = 1 — Я: Т 1 1 Пр * /Г *7О\ W 1 + 4^ sin3 F/2)/A — Щ* * К ' ' Шириной полосы е, как известно, называют расстояние между дву- двумя точками, для которых /Пр//пад = 1/2. Такие значения получаются при 6/2=тп ± е/2, где т — целое число (рис. 5.54). Так как 8 мало, то можно считать, что sin (е/2) « е/2. Следовательно, 1—^ 2 откуда ширина полосы равна 192 = 1, E.73)
Для критерия резкости F получается соотношение =я/8=я — Я). E.74) Так же как и функция видимости, резкость F, характеризующая форму контура интерференционной полосы, полностью определяется коэффициентом отражения Я. При Я->-1 имеем F ->■ оо. Если Я « « 0,9 (такое значение Я для зеркал часто используют в реальных ин- интерферометрах), то резкость F оказывается немногим меньше 30 (рис. 5.55). Это значит, что расстояние между двумя соседними макси- максимумами примерно в 30 раз больше ширины каждого из них. Из выражения E.72) следует, что при выполнении условия 6/2 == = тп отношение 1пр/1пад равно единице. Это значит, что в таких тя е/2 (т*1)я+е/2 0 0,10,2 0,5 Рис 5 54 Форма контура ин- интерференционной полосы («%= =0,6, е«0,17 я) Рис 5 55 Зависимость резкости интерференционной картины от коэффициента отражения условиях имеется только проходящая волна, а отраженная волна вообще не образуется. На первый взгляд найденный результат пред- представляется странным. Действительно, уже при первом отражении (см. рис. 5.52) должна возникнуть волна с достаточно большой ампли- амплитудой (например, при Я = 0,9 должно отразиться 90% светового по- потока). Можно предположить, что в результате интерференции с волна- волнами, образовавшимися при последующих отражениях B\ 3', 4\ ... и т. д.), амплитуда суммарной отраженной волны Ех будет близка к нулю, но такое предположение необходимо подтвердить расчетами. При проведении расчета учтем, что первая отраженная волна Г всегда находится в противофазе со всеми последующими. Это положе- положение справедливо при любом п' Ф я, и его просто проверить (см. рис. 5.52), например, при п' < п. В данном случае потеря полу- полуволны происходит лишь при первом отражении, а при всех последую- последующих отражениях от оптически менее плотной среды, которые приводят к возникновению волн 2\ 3\ 4\ никакого дополнительного сдвига фаз нет. Следовательно, амплитуду отраженной волны можно записать в виде = £оо{р рт2 ехр (Й)[1 + р2 exp (IS) + у("-*) exp i (N — 2N]}. 7 6». 1791 E.75) 193
После простых преобразований (при выполнении условия JI + £Г= = 1) получим /пад V^oo ' I ^оо / A-^J+4^ sin* F/2) ' ' Нетрудно заметить, что при sin F/2) = 0 имеем /0Тр^пад == 0» тогда как /пр//Пад = 1- Следовательно, существуют такие направле- направления, при которых распространяется только прошедшая волна. Эти направления определятся соотношением cos ф2 =* т%1 B0 (т~~ целое число). Формула E.76), конечно, согласуется с приведенной ранее оценкой ^ Для проходящего света. Если sin (S/2) = 1, то ('отр//пад)макс = *# /A + Я?- (S.77) При выполнении условия Jf + 3 = 1 имеем (*пр'М1ад)мин Н~ (^отр/-'пад)макс == !• E.78) Выше уже указывалось, что в проходящем свете узкие максимумы разделены широкими минимумами. Соотношение E.78) показывает, что в отраженном свете широкие максимумы будут разделены узкими ми- минимумами. Как и следовало ожидать, интерференционные картины в проходящем и отраженном свете оказываются дополнительными. Этот результат (дополнительность картин в проходящем и отра- отраженном свете) справедлив при выполнении условия E.63), т. е. при отсутствии поглощения в отражающих слоях. Таким образом, изло- изложенная теория, безусловно, применима к тому случаю, когда в качестве отражающих слоев интерферометра используются многослойные ди- диэлектрические покрытия, поглощение в которых пренебрежимо мало (см. §5.7). - Иначе обстоит дело, когда в качестве зеркал интерферометра при- применяют тонкие слои какого-либо металла с высоким коэффициентом отражения в видимой области спектра (серебро, алюминий). Хорошо известно, что металлические пленки сильно поглощают электромагнит- электромагнитные волны (см. § 2.5). В этом случае условие E.63), использованное при выводе формулы E.76), приходится заменять более общим выра- выражением, а именно 1, E.79) где Л — суммарное поглощение света отражающими слоями,'"а вопрос о том, в какой степени интерференционные картины в прошедшем и отраженном свете окажутся дополнительными, требует специального рассмотрения. Заметим, что высоко отражающие многослойные диэлектрические покрытия получили широкое распространение лишь 15—20 лет назад. До этого времени в интерферометрах Фабри — Перо использовались полупрозрачные металлические зеркала. По некоторым причинам их применяют и по сей день. Поэтому представляет интерес обсудить не- 194
которые особенности тонких поглощающих слоев*. Здесь будет изло- изложена лишь постановка задачи и качественно рассмотрены основные выводы. Для учета поглощения в слое введем комплексные коэффициенты отражения и пропускания (по амплитуде): *tk = Pth exp (—iaik) и tih = rik exp (—ifa). E.80) Энергетические коэффициенты отражения и пропускания по-преж- по-прежнему получаются перемножением сопряженных значений, т. е. =рйь £rik=tikt*ik=Th. E.81) Применение двух индексов (I и k) связано с тем, что в данном случае оказывается не эквивалентным прохождение световой волны через ме- металлический слой из стекла в воздух или из воздуха в стекло**. В ре- результате Jlih Ф$ы и их значения колеблются около некоторого сред- среднего значения при увеличении толщины /слоя (рис. 5.56). При расчете интенсивности света, прошедшего через интерферометр и отразившегося , 50 50 40 30 20 10 250 500 750 W001250 1500 1,А 2 3 2 / Рис. 5.56. Зависимость коэффициента отражения от толщины металлическо- металлического слоя, нанесенного на стекло, для волны, падающей на слой со стороны стекла (& 41) и со стороны возду- воздуха (Ллз) Рис. 5.57. Амплитуды напряженности электрического поля нескольких отра- отраженных и прошедших волн для ин- интерферометра с металлическими по- покрытиями, нанесенными на стекло: 1 — стекло; 2 — металл; 3 — воздух от него, надо учесть это обстоятельство. На рис. 5.57 приведены выра- выражения для амплитуды напряженности электрического поля для не- нескольких отраженных и прошедших световых воли. В проходящем через интерферометр свете распределение интенсив- интенсивности близко к тому, которое получается для интерферометра с непо- глощающими слоями, хотя значение /Макс оказывается меньше, чем * См.: Розенберг Г. В. Оптика тонкослойных покрытий. М., Физ- матгиз, 1958. ** В стандартной конструкции интерферометра Фабри—Перо устанавли- устанавливают (с помощью специальных распорных колец) строго параллельно друг другу две хорошо отполированные стеклянные или кварцевые пластинки, на внутрен- внутренние поверхности которых нанесены отражающие слои. Итак, по образному вы- выражению Вуда, получается «воздушная пластинка с посеребренными гранями». Эта конструкция позволяет относительно легко изменять расстояние между от- отражающими поверхностями и имеет широкое распространение. Более простая система — диэлектрическая пластинка, на обе поверхности которой нанесены отражающие слои (эталон Фабри—Перо), используется сравнительно редко. 195
при отсутствии поглощения. Простой расчет показывает, что в таких устройствах 0ПЮСШШ1Ы10 небольшое поглощение света отражающи- отражающими слоями приводит к существенному изменению пропускания. Б самом деле, в этом случае A —.Щ2 = {Л + <£ГJ и интенсивность света в максимуме задается выражением =£1 . . E.82) /пад/макс (^+Л2 Для хороших, только что нанесенных слоев серебра* можно по- получить Л « 0,9. При этом обычно коэффициент пропускания еГ & 0,03 и коэффициент поглощения А « 0,07. Легко оценить, что тогда (Ли/Лтд) макс & 9/100 = 9%. Следовательно, такой интерферо- интерферометр пропускает менее 10% светового потока, который прошел бы через эквивалентный интерферометр с непоглощающими слоями. По- Поэтому интерферометры с металлическим отражающим слоем обычно ис- используют при исследовании ярких источников света, где потеря части светового потока не столь существенна. Внедрение в практику диэлект- диэлектрических зеркал существенно расширило круг задач, которые можно решить с помощью интерферометра Фабри — Перо. Сложнее обстоит дело с распределением интенсивности света, от- отраженного от интерферометра с полупрозрачными металлическими зер- зеркалами. В зависимости от толщины поглощающего слоя экстремумы смещаются на то или иное расстояние, что приводит к нарушению ус- условия дополнительности интерференционных картин в отраженном и проходящем свете. При уменьшении поглощения отражение все лучше описывается формулой E.76), полученной в предположении, что Л + if = 1. Детальное сравнение этой феноменологической теории с данными опыта затруднено тем, что фактически она пригодна для описания лишь достаточно толстых металлических слоев (около 500 А), которые уже не являются полупрозрачными и, следовательно, не могут быть использованы в качестве зеркал интерферометра. В случае более тонких слоев, которые и представляют практический интерес, появ- появляется ряд аномалий, связанных как с усложнением применения урав- уравнений Максвелла («скин-эффект» и др.), так и с нарушением однород- однородности тонкого слоя вследствие его гранулярной структуры . В проведенном рассмотрении учитывалось лишь поглощение радиа- радиации отражающими слоями и не принималось во внимание поглощение света в среде между зеркалами. Можно показать, что наличие такого поглощения не только уменьшает максимальную интенсивность про- прошедшего света (/Макс)> но и приводит к ухудшению резкости интерфе- интерференционной 'картины. * Опыт показывает, что коэффициент отражения серебряных зеркал до- довольно быстро уменьшается при пребывании их на воздухе. Наличие агрессив- агрессивных веществ заметно ускоряет этот процесс, и обычно через несколько дней ко- коэффициент отражения серебряных зеркал не превышает значения 31» 0,8. Нанесение тонких диэлектрических пленок на металлические слои замедляет этот процесс. Кроме того, при выборе параметров двухслойного покрытия иногда удается повысить суммарное пропускание этого сложного слоя. Такой прием используется на практике (см.: Тарасов К. И. Спектральные при- приборы. М., «Машиностроение», 1968). 196
При использовании интерферометра Фабри — Перо необходимо помнить, что интерференционная картина, возникающая при освеще- освещении интерферометра протяженным источником света, представляет собой семейство кривых равного наклона (колец), локализованных в Рис. 5.58. Интерференционная картина, возникающая при освещении ин- интерферометра Фабри —Перо протяженным источником нсмонохроматичс- ского света бесконечности (рис. 5.58). Если кольца равного наклона наблюдать на каком-либо экране, то надо установить объектив L2 (рис. 5.59) так, чтобы плоскость экрана совпадала с главной фокальной плоскостью объектива. Линза Ь±яе влияет на распределение интенсивности в интерференционной картине, но она полезна для увеличения светового пото- потока, проходящего через интерферометр. Свет от протяженного источника падает на интерферо- интерферометр под разными углами, что обеспечивает воз- возникновение интерференционного кольца. При точечном монохроматическом источнике на экра- экране появилась бы одна точка. Точная юстировка интерферометра не менее важна, чем высокое качество поверхности зер- зеркал. Наиболее простой способ юстировки — визуальный просмотр колец, создаваемых раз- различными участками поверхностей зеркал интер- интерферометра. Если поверхности строго параллель- параллельны, то глаз видит кольца одного и того же диа- диаметра. Видоизменение этого метода для более «толстых» интерферометров состоит в наблюде- наблюдении колец в зрительную трубу при передвиже- передвижении диафрагмы малого размера вблизи интерфе- интерферометра. Для еще более «толстых» интерферо- интерферометров применяют способ юстировки, основан- основанРис. 5.59. Схема на- наблюдения интерферен- интерференционных колец равно- равного наклона, возникаю- возникающих в интерферомет- интерферометре Фабри — Перо ный на совпадении многократных отражений изображения удален- удаленного источника в случае параллельности зеркал. Возвратимся к анализу формулы Эйри. Условие возникновения максимума E.68) позволяет более подробно изучить вид интерферен- интерференционной картины на экране: чем меньше угол ср2, тем ближе соответ- соответствующий максимум к центру системы интерференционных колец. 197
Вместе с тем разность хода 21 cos q>2 = trik увеличивается с уменьше- уменьшением угла ф2, а следовательно возрастает порядок интерференции т для исследуемой длины волны X. Наибольший порядок интерференции в центре интерференционной картины. Если для освещения интерферо- интерферометра воспользоваться источником света, излучение которого состоит из двух монохроматических линий с длинами волн Хг и Яа, то, обра- обращаясь к E.68), легко определить, какая из них даст кольца, ближе расположенные к центру интерференционной картины. Наибольшее возможное значение т легко найти, положив cos ф2 = 1. Тогда полу- получаем очевидное соотношение т = 21IX. E.83) Следовательно, чем больше расстояние между отражающими слоя- слоями, тем выше порядок интерференции в центре интерференционной картины. Так, например, т « 20 000 при / = 0,5 см (для видимого света X & 5- 10~б см) и m « 200 000 при / = 5 см. Найдем ширину интерференционной полосы как функцию расстоя- расстояния между отражающими слоями. Дифференцируя E.68) и заменяя бесконечно малое приращение конечным, имеем —21 sin фбф = Х8т. E.84) Полагая 8т = 1, т. е. рассматривая бф как угол между двумя со» седними максимумами, находим бФ=--А_. E.85) 2/sinq> Отсюда следует, что чем больше /, тем меньше бф, т. е. тем уже ин- интерференционные полрсы. В § 6.7 будет показано, что с увеличением порядка интерференции возрастает «разрешающая» сила и поэтому выгодно использовать «толстые» интерферометры, т. е. работать на вы- высоких порядках интерференции. Однако это не всегда возможно. ДелоЪ том, что ширина исследуе- исследуемой структуры не должна превышать расстояния между двумя сосед- соседними максимумами интерференционной картины, иначе произойдет наложение структур из двух соседних порядков интерференции. В §5.6 указывалось, что при ширине исследуемой структуры ДА,, рав- равной XI т> т-й и (т + 1)-й максимумы интерференционной картины совпадут. Таким образом, получается условие АХ = Х/т = Щ21), E.86) связывающее ширину исследуемой структуры и допустимое расстояние между пластинами интерферометра. Значение ДА,, определяемое E.86), обычно называют областью свободной дисперсии интерферометра Фаб- Фабри — Перо. Оценка АХ при выбранных выше значениях (/ = 0,5 см; X ж « 5-Ю" см) приводит к допустимой ширине структуры, примерно равной 0,25 А. При больших значениях / область свободной дисперсии ДА, становится еще меньше. Это значит, что интерферометр Фабри — 198
Перо следует использовать лишь для исследования контуров спект^ ральных линий, выделенных каким-либо более грубым спектральным прибором. Поэтому обычно применяют следующую систему фотографического излучения структуры линий. Интерференционные кольца проекти- проектируют объективом L2 на щель какого-либо спектрографа, в фокальной плоскости которого получается система спектральных линий, пересе- пересеченных интерференционными кривыми равного наклона. Если кольца расположены симметрично относительно щели спектрографа, то каж- каждая линия будет пересечена системой симметричных участков колец, расстояние между которыми (в шкале длин волн) равно XVB1). Если линия состоит из нескольких компонент, то можно измерить, ка- какую долю от АХ составляет расстояние между компонентами, и оценить их {относительную интенсивность. i .... Рис. 5.60. Участок спектра 233U, сфотографи- сфотографированный через интерферометр Фабри — Перо (/=10 мм) Рис. 5.61. Структура линии 233U с Я=5915 А (/=5 мм) На рис. 5.60 представлен образец такой интерферограммы. Это участок спектра одного из изотопов урана B33U), сфотографированный через интерферометр Фабри — Перо. На снимке видна линия 5976 А с четкой структурой, состоящей из шести компонент, расстояние меж- между которыми можно измерить с большой точностью. В теории атомных спектров доказывается*, что такое расщепление линии (сверхтонкая структура) возникает в результате взаимодействия атомного ядра с электронной оболочкой атома. Результаты изучения сверхтонкой структуры позволяют определить основные ядерные константы. В дан- данном случае однозначно определяется механический момент (спин) ядра исследуемого изотопа урана. На той же фотографии видна яркая * См.: Фриш С. Э. Оптические спектры атомов. М., Физматгиз, 1963. 199
линия урана E915 А), ширина которой больше области свободной дис- дисперсии интерферометра Фабри — Перо при / = 10 мм. Поэтому разные порядки интерференции наложились и структура линии не может быть разрешена. На рис. 5.61 показана структура этой линии, полученная при вдвое меньшем расстоянии между зеркалами интерферометра. В этом случае нет переналожения порядков интерференции. Линия хорошо разрешена также на шесть компонент. Если попытаться при таком значении / E мм) сфотографировать линию 5976 А, то столь хорошо разрешенной структуры, как на предыдущей фотографии, не будет. Каждая компонента станет шире, и все они сольются. Дру- Другими словами (см. § 6.7) , разрешающая сила интерферометра в дан- данном случае недостаточно велика. Надо увеличивать коэффициент от- отражения зеркал или (что и было сделано) использовать большее расстояние между зеркалами*ин- терферометра. Выше уже указывалось, что интерферометр Фабри — Перо служит основным прибором для проведения метрологических из- измерений. На рис. 5.62 представ- представлены участки спектра при осве- освещении интерферометра, скрещен- скрещенного со спектрографом, светом стандартного источника света (86Кг-лампа) и неон-гелиевого лазера, генерирующего на одной моде. Мы видим, что, несмотря на очень большое расстояние между отражающими слоями, достигающее 10 см, резкость ин- терферограммы для линии 6058 А изотопа 86 Кг, выбранной в ка- качестве международного стандар- стандарта длины, весьма велика. Еще Рис. 5.62,. Участок спектра стандартного источника света (86Кг-лампа), сфотогра- сфотографированный через интерферометр Фаб- Фабри—Перо (/=10 см): / — первичный эталон длины — оранжевая ли- линия криптона (Аг=6058А); // — красные линии криптона — вторичные эталоны (А,=6458 А и А.-6423А); ///-линия (А,-6328 А) неон-гелие- неон-гелиевого лазера, генерирующего на одной моде • - » — —v сооо « лучше интерферограмма лазер- лазерной линии 6,328 А, иллюстрирующая перспективность использования одномодового излучения лазера в метрологических целях. Однако изучение вопроса о том, сколь постоянна в разных опытах длина волны лазерного излучения, еще нельзя считать законченным. Стремление определить исходный эталон длины с очень' большой точностью, на первый взгляд, представляется неоправданным. Для того чтобы оценить необходимость таких измерений, вернемся к рас- рассмотрению упоминавшейся выше задачи о прецизионном определении важнейшей константы — скорости света в вакууме (см. § 1.5). Напо- Напоминаем, что в этих опытах одновременно измерялись' длина волны и частота стабилизированного инфракрасного лазера и было показано, что погрешность определения с = ^v оказывается непосредственно 200
связанной с точностью первичного эталона длины. Действительно, длину волны стабилизированного неон-гелиевого лазера можно ин- терферометрически измерить с очень малой погрешностью (~10~4 А). Для установления абсолютного значения Я необходимо сравнение ее с первичным эталоном (длина волны спектральной линии Лвак«6058 А изотопа 86 Кг), которое не может быть проведено с точностью, превы- превышающей точность первичного эталона. По некоторым причинам (не- (небольшая асимметрия линии 86Кг, кривизна зеркал интерферометра) первичный эталон определен с относительной ошибкой 3-Ю""9, кото- которая и лимитирует возможность более точного измерения длины волны исследованного лазера. Заметим, что при независимом определении частоты этого лазера также приходилось сравнивать .ее с частотой некоторого первичного эталона. Как известно, в качестве такого «атомного стандарта» в 1966 г. была выбрана частота перехода между двумя сверхтонкими компонен- Рис. 5.63. Интерферограмма красной линии неон-гелиевого ла- лазера, генерирующего на одной (а) и двух (б) продольных мо- модах (/==10 см) тами цезия-133 в нулевом магнитном поле. Эта частота (v0 = = 9 192 631770 Гц) характеризуется воспроизводимостью 2-101. Секунда определяется как единица времени в этой «атомной» шкале. Несмотря на трудности измерения частот в оптическом диапазоне, частоту исследованного лазера можно сравнить с частотой атомного стандарта. Для этого было взято несколько промежуточных источни- источников стабильных частот (лазеры на углекислом газе, парах воды, си- синильной кислоте, клистроны). То, что эти сложнейшие измерения были проведены с суммарной относительной ошибкой 6-10"0 (т. е. меньшей, чем при измерении длины волны), свидетельствует о больших успехах современной радиотехники СВЧ. Приводимые на рис. 5.63 интерферограммы лазерной линии 6328А иллюстрируют возможность использования интерферометра Фабри— 201
Перо для исследования модового состава излучения лазера. Если газо- газовый лазер генерирует на двух модах (рис. 5.63, б), то на интерферо- грамме видны четкие двойные кольца равного наклона. Измеряя ра- радиусы этих колец, можно определить сдвиг частот между двумя гене- генерируемыми модами. 11ри различных приложениях полезен переход от фотографической регистрации интерференционной картины к фотоэлектрической запи- записи. В этом случае исключается трудоемкая и чреватая дополнитель- дополнительными ошибками операция перехода от почернений фотопластинки к ее освещенности. Это важно тогда, когда исследователя интересует не только положение, но и относительная интенсивность компонент изу- изучаемой структуры. Основы фотоэлектрического метода были разрабо- разработаны в 50-х годах нашего столетия группой французских физиков (Жакино, Дюфур, Шабаль и др.). За последние годы фотоэлектри- фотоэлектрический метод получил широкое распро- распространение, особенно в связи с исследова- исследованиями в области лазеров. При фотоэлектрической записи из интерференционной картины выделяют какой-либо диафрагмой некоторый уча- участок так, чтобы в каждый момент вре- времени через нее проходил ограниченный спектральный интервал. Для этого ин- интерференционную картину перемещают каким-либо образом относительно диа- диафрагмы (такая операция называется сканированием). Интерференционная картина, создаваемая интерферометром Фабри — Перо, представляет собой си- систему колец, и поэтому наиболее выгодно и удобно использовать круглую диа- диаграмму, помещаемую в центре интерфе- интерференционной картины. При изменении оптической толщины интерфе- интерферометра в центре интерференционной картины будут появляться (или исчезать) кольца. Следовательно, световой поток через диафрагму будет изменяться и фотоумножитель зарегистрирует это изменение света. Сканирование обычно осуществляют изменением давления газа внутри интерферометра (что приводит к изменению показателя пре- преломления среды) или геометрического расстояния между зеркалами. Последнее может быть достигнуто перемещением одного из зеркал (с помощью пьезоэффекта, термического расширения распорных колец и т. д.) Сканирование изменением давления пригодно лишь для достаточно «толстых» интерферометров, так как если / < 1 мм, то даже при боль- большом изменении давления интерференционная картина смещается мень- меньше чем на один порядок. На рис. 5.64 представлена оптическая схема спектрометра с интер- интерферометром Фабри — Перо, в которой используется такой способ ска- 202 Рис. 5.64. Схема спектрометра с интерферометром Фабри — Перо: / — контурная диафрагма; 2 — ин- интерферометр в камере; 3 — исследу- исследуемый источник света; 4 — предохра- предохранительный клапан; 5 — капилляр; 6 — от баллона высокого давления; 7 — дифракционная решетка
нирования. Интерферометр помещают в герметическую камеру, внутри которой давление может изменяться от нескольких миллиметров ртут- ртутного столба до атмосферного. Для этого из камеры сначала откачи- откачивают ротационным насосом воздух, а потом в нее подают через узкий капилляр газообразный азот, находящийся в баллоне под высоким давлением. Эта простая методика в большинстве случаев обеспечивает удовлетворительную точность результатов. Кольца равного наклона фокусируют объективом в плоскости вход- входной щели монохроматора. В той же плоскости помещают круглую диа- диафрагму, вырезающую заданную часть центрального интерференцион- интерференционного кольца. Чем меньше диафрагма, тем лучше разрешение, но тогда через нее проходит мало света и возникают трудности в обеспечении хорошего сигнала над уровнем шумов фотоумножителя. Обычно ис- используют диафрагмы, выделяющие меньше одной десятой интерферен- интерференционной полосы. Приведенная на рис. 1.9 структура зеленой линии ртути получена при использовании спектрометра с интерферометром Фабри — Перо (/ = 3,6 мм; зеркала очень высокого качества). Полное изложение такой методики исследования спектров и связанных с этим проблем содержится в обзоре*. Своеобразной модификацией интерферометра Фабри — Перо яв- является сферический интерферометр, который был введен в практику спектроскопии П. Конном. Этот интерферометр состоит из двух вогну- вогнутых зеркал одинакового радиуса кривизны, расположенных так, что фокусы зеркал совмещены — «конфокальная» установка. Мы упоминаем о сферическом интерферометре, так как он послу- послужил прототипом современного резонатора для газового лазера. Во- Вопрос о внедрении радиофизических понятий в оптику представляет несомненный интерес. А. М. Прохоров, по-видимому, первым ука- указал, что интерферометр Фабри — Перо является своеобразным резо- резонатором высокой добротности для оптического диапазона. Первый газовый лазер, осуществленный в 1961 г. Джаваном и др., представлял собой газоразрядную трубку с неон-гелиевой смесью, помещенную внутрь интерферометра с плоскими зеркалами с очень высоким коэф- коэффициентом отражения (Я > 99%). В последующих экспериментах был использован резонатор со сферическими зеркалами, так как в этом слу- случае необходимая точность юстировки и требования к точности обработ- обработки зеркал значительно ниже, а стабильность системы заметно выше. Теперь почти все газовые лазеры имеют резонаторы со сферическими зеркалами, причем соотношение радиусов кривизны зеркал варьи- варьируется в широких пределах. При этом получается заметно большая расходимость лазерного излучения, чем в резонаторе с плоскими зер- зеркалами, что легко исправить фокусирующей системой. Теорией оптических резонаторов занимаются многие ученые. При ее построении необходим учет потерь света, выходящего при много- многократных отражениях за пределы зеркал резонатора (дифракционные * См.: Калитеевский Н. И., Чайка М. П. Интерферометр Фс'бри—Перо и некоторые его приложения в спектроскопии. — В сб.: Спектро- Спектроскопия плазмы. М., «Наука», 1969. 203
потери; см. гл. VI). Она существенно отличается от элементарной тео- теории интерферометра Фабри — Перо, в которой надобность в учете дифракционных потерь возникает лишь в тех редких случаях, когда отношение расстояния между зеркалами к их диаметру достаточно велико. В заключение остановимся на принципе действия интерференцион- интерференционных фильтров, получивших за последние годы широкое распростране- распространение. Интерференционный фильтр — это устройство, позволяющее про- пропустить значительную часть светового потока в определенной области длин волн. Ширина полосы пропускания 6Х обычно составляет не- несколько десятков ангстрем. Принцип действия подобного фильтра по- понятен, если представить себе интерферометр Фабри — Перо с очень малым расстоянием / между пла- Inplrnadl i#4 СТИНаМИ. Для получения необходимых оценок обратимся к выражениям л. /1 E.83) и E.86): I = тХ12 = X2/ Если, например, бодной дисперсии X = 5000 А, то *«5.10-4см. Рис. 5.65. Полосы пропускания интер- интерферометра Фабри—Перо малой тол- толщины, используемого в качестве ин- интерференционного фильтра Все побочные максимумы (%о±пЬХ, где л» =1, 2, 3,...) гасятся стеклянными филь- фильтрами область сво- своАХ == 250 А, т = 20 и Итак, толщина / интерферомет- интерферометра оказалась совсем небольшой. Она составляет около десятка длин волн X. Такой интерферометр экви- эквивалентен фильтру, пропускающему излучение в интервале 8Х вблизи длины волны X. Однако изготовить интерференционный фильтр совсем не просто, особенно если необходимо подогнать толщину / так, чтобы фильтр преимущественно пропускал свет вблизи заданной длины волны Хо. Следует также учитывать, что интерферометр подобного типа будет пропускать свет не только с длиной волны, близкой к Яо, но и близкой к А,о ± АЯ, Хо ± 2ДА, и т. д. Иными словами, возникает система мак- максимумов (рис. 5.65), ширина 8% которых определяется коэффициентом отражения зеркал интерферометра. Побочные максимумы обычно гасят подбором соответствующих стеклянных фильтров, что, конечно, приводит к потере части светового потока в основной полосе. Так, например, при 8% « 50 А редко удается пропустить более 70% излу- излучения, хотя для изготовления фильтров, как правило, используются непоглощающие диэлектрические слои, для которых, как известно, (/Пр//пад) -*■ 1- Отделение побочных максимумов затрудняет получе- получение интерференционных фильтров с очень малой шириной полосы пропускания. Так, например, если использовать в качестве такого фильтра интерферометр Фабри — Перо с толщиной / « 5 мм, то необ- необходимо отделить максимумы, отстоящие один от другого на ДЯ « « 0,25 А, что практически невозможно.
ГЛАВА VI ДИФРАКЦИЯ СВЕТА Внимательное изучение распределения освещенности на границе между све- светом и тенью от предметов различной формы уже давно привело ученых к пред- давлению о возможности огибания препятствий светом. Впервые на эти явления обратил внимание знаменитый художник и естествоиспытатель Леонардо да Винчи A452—1519), а в 1665 г. более подробно их описал Гримальди. Впрочем, 4Х наблюдения, по-видимому, не были известны Гюйгенсу, так как он, конечно, воспользовался бы ими в качестве дополнительного довода в пользу волновой 7рироды света в своей монографии, относящейся к 1678 г. Но ?начение дифракции света отнюдь не исчерпыпаегся исследованием гаких переходных областей. При изложении оптики неизбежно возникает проб- 1ема, как согласовать волновую теорию, прекрасно оправдавшую себя при объяснении широкого класса различных задач, с безусловной справедливостью юложений геометрической оптики, оперирующей представлениями о прямоли- *ейно распространяющихся в однородной среде лучах света. Казалось бы, чго jo многих случаях повседневный опыт вступает в противоречие с данными теории \ гонкого эксперимента. Мы увидим, что теория дифракции полностью объясняет )ти кажущиеся парадоксы и в ней вскрывается глубокий смысл предельного терехода от волновой к геометрической оптике. На первый взгляд может создаться впечатление, что дифракция существен- *а лишь для достаточно длинных волн (УКВ-диапазон), а в оптическом диапа- юне встречается чрезвычайно редко. Иногда говорят, что в оптической области *адо искать дифракцию, а в области радиоволн надо искать способы избавиться >т этого явления. Это, конечно, верно, но не следует забывать, что именно в оп- оптической области применение теории дифракции необходимо для исследования тринципов действия и предела возможностей всех оптических и спектральных триборов, а наличие естественных экранов, размеры которых того же порядка, гго и длина волны света, характерно для всех оптических экспериментов на мо- -зекулярном уровне. Таким образом, исследование дифракции световых волн совершенно необ- необходимо. Строгая теория этого явления весьма сложна. Мы ограничимся подроб- подробным обсуждением исходных предпосылок и их следствий (принцип Гюйгенса- Френеля) и уделим внимание приложению теории к решению ряда задач, имею- ших принципиальное значение. § 6.1. ПРИНЦИП ГЮЙГЕНСА-ФРЕНЕЛЯ И НЕКОТОРЫЕ ЕГО ПРИЛОЖЕНИЯ Изложение принципа Гюйгенса — Френеля в данном параграфе существенно отличается от приведенного"в § 3.3, где положение волно- волнового фронта в последующие моменты времени определялось как оги- огибающая элементарных сферических волн, излучаемых каждой точкой, до которой дошел фронт в данный момент (принцип Гюйгенса). Ника- Никакой интерференции между этими сферическими волнами Гюйгенс не учитывал, да и вообще не принимал во внимание фазовых соотноше- соотношений. Поэтому принцип Гюйгенса в его первоначальной форме не мог служить основой волновой оптики. Потребовалось значительное время, чтобы после принципиальных дополнений Френеля оказалось возмож- возможным применить его для истолкования дифракции. Изложим идею 205
принципа Гюйгенса — Френеля в тех терминах и понятиях, которые соответствуют основной задаче курса, посвященного электромагнит- электромагнитной теории света. Строгая математическая формулировка этого прин- принципа, данная Кирхгофом, здесь не приведена*. Окружим исследуемый источник электромагнитных колебаний S воображаемой поверхностью а и рассмотрим возмущение в точке Р, находящейся вне указанной поверхности (рис. 6.1), как результат сов- совместного действия всех элементов do. Таким образом, в точке Р изу- изучается суперпозиция вторичных сферических волн, излучаемых всеми элементами поверхности а. Следует подчеркнуть, что действие реаль- реального источника S заменяется действием совокупности элементов фик- фиктивной поверхности а. Все эти вторичные колебания когерентны (их фазы и амплитуды задаются первичным колебанием), и, следовательно, их амплитуды можно складывать. Запишем высказанные положения на математическом языке, до- дополнив их (согласно Френелю) введением некоего коэффициента k (if), который принимает максимальное значение, когда нормаль п совпа- совпадает с г (ф=0) и обращается в нуль при ij? > я/2. Укажем, что введе- введение такого коэффициента означает отсутствие обратной волны, на- направленной внутрь поверхности а**. Амплитуда колебания, создаваемого в точке Р одним произвольным элементом do, выразится соотношением dEu= к ft) \Ei exp <'*»>] ^*!L da. F.1) Здесь отброшена временная зависимость [при данной форме записи она выглядела бы как ехр (—Ш)] и учтено, что источник испускает сферическую волну, исходная амплитуда которой Eq. Для простоты будем считать, чтр точечный источник S испускает монохроматическую сферическую волну. Но все приближения, сделанные ранее (например, квазимонохроматическая волна, излученная протяженным источником и др.) и позволившие обосновать возможность наблюдения интерферен- интерференционных явлений, конечно, остаются в силе. Вывод можно провести для произвольной поверхности <т, но проще всего предположить, что она совпадает с волновым фронтом от точечного источника, т. е. яв- является сферой радиуса а±. Тогда суммарное возмущение в точке Р определяется равенством <T. F.2) Для того чтобы провести интегрирование, разобьем поверхность о на зоны Френеля (рис. 6.2). Построение выполняется так, что N±P = = а2 + Я/2; N2P = а2 + 2W2 и т.д. В этом случае в точку Р волны от любых двух соседних зон придут в противофазе. * См.: Б о р н М., Вольф Е. Основы оптики. М., «Наука», 1970; Зоммерфельд А. Оптика. ** Заметим, что в строгой теории Кирхгофа этот коэффициент не вводится произвольно, а получается при решении преобразованного волнового уравнения. 206
Легко показать, что площади всех зон примерно одинаковы. Дей- Действительно, обозначив высоту первого сегмента Ь,ъ находим #! — (ai — ^iJ = (а2 + ^/2J — (а2 + fixJ. Пренебрегая X2, получаем hx « а а?а j . Отсюда находим, что пло- площадь сферического сегмента, представляющего первую зону, равна F.3) Если сосчитать таким же способом общую площадь двух первых зон, то вместо а2 + Х/2 будет а2 + 2Я/2 и мы получим 2ла1а2Х/(а1 + а2). Следовательно, площади двух первых зон одинаковы, что справедли- справедливо и для любых других зон. Рис. 6.1. К формулировке прин- принципа Гюйгенса — Френеля Рис. 6.2. Схема разбиения по- поверхности а на зоны Френеля Из тех же соотношений легко определить радиус n-й зоны: а±+а2 Кроме того (см. рис. 6.1), t^z=z(i\ -f- (fli -|" #гJ—2п± (cLi -J- л2) cos ©, гdr■=a1(al + a2) sin ©d0, do—a\ sin ©dedcp=—~— rdrdy. F.4) В пределах одной кольцевой зоны коэффициент к (ф) считаем по- постоянным. Тогда возмущение, создаваемое л-й зоной в точке Р, после интегрирования по азимутальному углу ф Интегрируя по г и выполняя элементарные преобразования, полу- получим F.5) 207
Следовательно, определение интегрального действия всех зон Фре? неля сведется к суммированию знакопеременного ряда вида кг — к2 + к3— ... + (—1)«+1 кп. F.6) Сгруппируем члены этого ряда следующим образом: Легко доказать, что (в зависимости от четности п) такая сумма рав- равна у±"т- Это означает, что амплитуда суммарного колебания в точ- точке Р равна полусумме (или полуразности) амплитуд колебаний, со- создаваемых в этой точке только первой и п-й зонами Френеля: Ео (Р) = 1<£м ± Ев.п). F.7) При полностью открытом фронте E0i7l -> 0, так как коэффициент к (я/2) = 0. Следовательно, в этом случае £o(P) = j£o,i(P). F.8) Это соотношение позволяет получить в явном виде значение коэф- коэффициента кг. Если отвлечься от проведенных построений, связанных с введением фиктивных вторичных центров на поверхности а, то можно утверждать, что точечный источник S, испускающий сферическую вол- волну, должен создавать в точке Р, удаленной от него на расстояние аг + а2, колебания с амплитудой Ео (Р), определяемой равенством F>9) Сравнивая это выражение с F.5), находим, что \, или Kl=—' HEizSsa. F.10) К К Перейдем к рассмотрению совокупности полученных результатов. При полностью открытом фронте амплитуда суммарного колеба- колебания в точке Р равна половине амплитуды колебания, создаваемого в этой точке только первой зоной. Интенсивность излучения пропор- пропорциональна квадрату амплитуды колебаний, и, значит, суммарная ин- интенсивность в точке Р численно равна одной четверти интенсивности, обусловленной первой зоной Френеля. Этот фундаментальный резуль- результат требует подробного обсуждения. Прежде всего оценим размеры первой зоны. Для ее площади было получено выражение F.3). Очевидно, что для оптического диапазона при не очень больших аг и а2 эта площадь невелика. Так, например, при ах == а2 = 1 м она примерно равна 1 мм2. Мы приходим к интересному выводу: в результате явления интерференции как бы уничтожается действие всех зон, кроме первой. Таким образом, намечается ликви- 208
дация указанного выше противоречия между волновой и геометричес- геометрической оптикой (см. § 6.2). Сейчас нас интересует вопрос о возможности введения тех или иных экранов, закрывающих часть зон Френеля. Предположим, что все зоны, кроме первой, закрыты. Тогда интенсивность увеличится в четы- четыре раза по сравнению с полностью открытым фронтом. Если открыты две зоны, то света в точке Р будет совсем мало. Процесс открывания зон можно продолжить, наблю- наблюдая периодическое изменение интенсивности света в точке Р. Представим себе другой опыт. Предположим, что площадь круг- круглого отверстия выбрана так, что при данных аг и а2 она равна площади первой зоны Френеля. Начнем перемещать точку на- наблюдения Р вдоль линии, соеди- соединяющей ее с источником, на- наблюдая периодическое измене- изменение интенсивности света. Оно происходит потому, что в зави- зависимости от расстояния а± + а2 открывается одна, две зоны Френеля и т. д. Столь подроб- подробное обсуждение этого возможно- возможного эксперимента проведено для того, чтобы читатель уяснил себе, что размер зоны Френеля достаточно сложно зависит от аъ аг и Я. При варьировании одной из этих величин (в данном случае увеличении а2) изменяется число зон Френеля, умещающихся на выбранном круглом отверстии, что приводит к периодическому изменению интенсивности света в точке Р. Интенсивность света в точке Р можно увеличить. Изготовим слож- сложный экран — зонную пластинку, которая закрывает все четные (или все нечетные) зоны Френеля (рис. 6.3). Для ее создания надо задаться определенными значениями аг и а2 и воспользоваться формулой F.4). Установив зонную пластинку в строго определенном месте между S и Р, нетрудно получить заметное увеличение освещенности в области про- пространства вблизи точки Р, так как в данном случае в ряду F.6) остают- остаются лишь члены одного знака. Еще больший эффект получится, если каким-либо образом изме- изменить фазы волн, приходящих от соседних зон. Как мы помним, в пер- первоначальном построении эти волны гасили одна другую (оптическая разность хода равна Х/2). Изготовив ступенчатую зонную пластинку (рис. 6.4), можно изменить фазу колебаний от соседних зон на я. Для этого высоту ступеньки 8 необходимо выбрать так, чтобы она удовлет- удовлетворяла соотношению 2яб (п — 1)/А, = я, или б = %12(п — 1), где п — показатель преломления вещества, из которого изготовлена ступен- 209 Рис. 6.3. Зонная пластинка Френеля
чатая зонная пластинка. Заметим, что фокусирующая линза и работает как такая ступенчатая зонная пластинка. Можно также л ^готовить экран, который не открывает первую зону Френеля, а, наоборот, закрывает одну или несколько первых зон, оставляя иго более высокие зоны открытыми. Легко заметить, что и в этом случае весь расчет сохраняет свое значение. Если закрыто т зон Френеля, то суммарная ампли- амплитуда равна Ео (Р) = I (Р) ± Е0)П (Р)\. При данной постановке задачи Е0)П (Р) ->- 0 и, следовательно, Ео (Р)^= х- Ео т+1 (Р). Отсюда выте- Рис. 6.4. Зонная пластинка, из- изменяющая на я фазу волн, при- приходящих от чет- четных зон кает, что в точке Р интенсивность света всегда отли- отлична от нуля. Этот результат на первый взгляд кажется чрез- чрезвычайно парадоксальным. Так, получивший его впер- впервые известный французский ученый Пуассон решил, что он опроверг теорию Френеля, доказав, что она при- приводит к абсурду. Позднее Араго показал на опыте, что при установке круглого непрозрачного экрана в центре тени возникает светлое пятно, предсказы- предсказываемое теорией. Однако история связала с этим от- открытием имя человека, который усомнился в правиль- правильности теории Френеля, а не доказал ее. В литературе это явление известно под названием пятна Пуассона. В книге Р. Поля* приведена копия оригинальной фотографии, полученной автором с помощью стального шарика диаметром 4 см, установленного на расстоянии 12 м от фотографируемого объекта и 18 м от его изображения. В дан- данном случае стальной шарик играл роль линзы. Во всяком случае с его помощью удалось получить изображение вполне удовлетворительного качества. Очень эффектные явления легко наблюдать при использовании достаточно интенсивного источника света, в нескольких метрах от которого устанавливается малый непрозрачный экран или ирисовая диафрагма, позволяющая открывать ряд зон Френеля. Конечно, рас- расстояние аг + а2 от источника света до матового экрана, на котором сле- следует наблюдать дифракционную картину, должно быть достаточно большим (не менее 10—15 м). Эти эксперименты (рис. 6.6) трудно по- показать в большой аудитории без современных технических средств. Многие из описанных выше опытов по дифракции Френеля можно де- демонстрировать с помощью простейшей телевизионной установки, включающей передающую трубку (монитор) и несколько телевизоров, установленных в аудитории. Свет от мощной лампы фокусируется на не- небольшой круглой диафрагме. После дифракции на исследуемом пре- * См.: Поль Р. В. Оптика и атомная физика. М., «Наука», 1966. В этой книге описано множество интересных опытов по интерференции и дифракции света. 210
пятствии свет от этого «точечного» источника попадает на фотокатод монитора и зрители наблюдают на экранах телевизоров сильно увели- увеличенное изображение дифракционной картины (рис. 6.5, 6.6). Не менее эффектно применение для этих опытов УКВ, длина волны которых примерно в 10б раз больше длины волны в оптическом диа- диапазоне. Используя современные источники УКВ, нетрудно пока- показать большой аудитории отчетли- отчетливые дифракционные эффекты - дифракцию от круглого отверстия, от края экрана и т. д. На рис. 6.7 изображена фотография установки для опытов с зонной пластинкой, размеры которой при ах = а2 = 1м и X « 3 см достаточно велики. Строго говоря, при осуществле- осуществлении таких опытов мы несколько от- отходим от первоначальной формулн- ровки задачи (которая, впрочем, не очень уточнялась для упроще- упрощения рассуждений). Дело в том, что свойства экрана должны в какой-то мере сказываться на результатах дифракционных опытов. Рассматривая проводящий экран, надо учесть взаимодействие с ним электромагнитной волны, определить, хорошо Рис 6 5 Фотография изображения шаблона на экране телевизора, полу- полученная в результате дифракции света на металлическом шарике диаметром 3 ММ @1=02=10 ММ) ли он отражает (J? = 1) или плохо {Л 0) и т. д. Применение непро- непроводящего экрана затрудни- затруднительно по другим причи- причинам. Но все приведенные выше оговорки несущест- несущественны, так как опыт пока- показывает фактическую иден- идентичность дифракционных картин во всех подобных случаях. Действительно, нетрудно заметить, что все нарушения возникают лишь в непосредственной близости к краю экрана (на расстоянии одной-двух длин волн), и наблюдать их в оптической области крайне трудно. Поэтому не оговаривались и свой- свойства источника первичных электромагнитных волн, а решалась ска- скалярная задача, в которой не учитывались поляризация излучения, связанная с ней направленность потока энергии и т. д. В опытах в УКВ-диапазоне поляризация электромагнитной волны резко выра- выражена, а пограничная область составляет несколько сантиметров. Рис. 6 6. Дифракция на круглом экране (а) и круглой диафрагме (б) В центре тени от экрана видно светлое пятно (пятно Пуассона), а в центре освещенного участка за диа- диафрагмой — темное пятно 211
Поэтому в данном случае могут наблюдаться некоторые особенности дифракции, совсем не существенные в оптическом диапазоне. Эти осо- особенности связаны также с заметным отличием фронта СВЧ-волны от сферического. Ранее было сделано предположение о том, что при заданном от- отверстии в экране можно произвольно выбрать воображаемую поверх- поверхность а. Обычно она полностью закрывает отверстие, а ее форма была удобна для определения результирующей амплитуды. При этом счи- считают, что амплитуда колебаний всюду на поверхности экрана равна нулю, а в отверстии ее величина та же, что и при отсутствии экрана. Рис. 6.7. Установка для демонстрации с зонной пластинкой в УКВ-диапа- зоне Конечно, это приближение заведомо несправедливо, например, вбли- вблизи границы проводящего экрана, но оно практически не сказывается на распределении интенсивности в остальных частях дифракционной картины. В целом следует указать, что метод Гюйгенса — Френеля являет- является приближением, наиболее пригодным для описания дифракции ко- коротких волн. При формулировке принципа не уточнялись краевые условия для напряженности электромагнитного поля и не учитывался векторный характер поля. Весьма сложен вопрос о разнице описания дифракции волн в двух и трех измерениях (плоская и пространствен- пространственная задачи), что проявляется при дифракции несинусоидальных импульсов*. Практически важный вопрос об оптимальном выборе усло- условий наблюдения дифракции Френеля (соотношение между длиной вол- волны, размером препятствия и расстоянием до источника света) подроб- подробно рассматривается в конце параграфа. * См.: Мандель штам тики. М., «Наука», 1972, с. 72. 212 Л. И. Лекции по избранным вопросам ол-
Обратимся к описанию дифракции электромагнитных волн на пре- препятствиях различной формы. В частности, очень характерная картина наблюдается при дифракции на крае экрана, на щели и т. д. Расчет этих картин очень сложен, и крайне полезным был бы какой-нибудь упрощенный графический метод, позволяющий изучать условия ди- дифракции и сравнивать их с опытом. К обоснованию такого графичес- графического метода мы сейчас и перейдем. При этом каждому элементарному колебанию сопоставим некоторый вектор. Хорошо известно, чго любой вектор задается своим модулем и на- направлением, составляющим некоторый угол с заранее выбранным на- направлением. Этот угол характеризует фазу колебания в определенный момент. Разобьем каждую зону Френеля на такие мелкие участки, что в пре- пределах каждого фаза и ам- амплитуда излучаемой ими радиации могут считаться постоянными. При построении рис. 6.8, а каждая зона дроби- дробилась на шесть участков и а) 5) на самом рисунке показаны шесть векторов, характе- характеризующих амплитуды и фазы соответствующих ко- колебаний, и выполнен предельный переход к спирали с фокусом в точ- точке N (рис. 6.8, б). После сложения всех шести векторов должен полу- Рис. 6.8. Векторная диаграмма для определи ния амплитуды колебаний п читься вектор ЕОд, а сумма 2 Равна Ео- Нас интересует сейчас лишь интенсивность излучения, поэтому достаточно определить лишь эту величину. Вектор Еод повернут на я/2 по отношению к исходному направлен нию, которое указано горизонтальной стрелкой на рис. 6.8. Фазы век- векторов E0j2 и ЕОд должны отличаться на я. Следовательно, вектор E0t2 направлен вдоль той же прямой, что и Еод, но в противополож- противоположную сторону. Приведенная диаграмма позволяет получить тот же ре- результат, что и выполненный ранее расчет: если открыты две зоны, то света в точке Р мало — амплитуда колебаний задается отрезком ON2 = Ео1 — £0|2. Для любого числа открытых зон этим методом легко получить суммарную амплитуду, так как все векторы направ- направлены вдоль одной прямой. Так, например, длина отрезка ON = EOtl/2 соответствует полностью открытому фронту, т.е. согласуется с F.8). Применим графический метод для исследования очень важного случая — дифракции световых волн на крае экрана. Здесь возникает трудность при разбиении на зоны поверхности волнового фронта. На кольцевые зоны делить нельзя, так как экран отрежет по половине от каждой из них. Поэтому попробуем разделить поверхность сфери- сферического волнового фронта плоскостями, параллельными ребру экра- 213
на (рис. 6.9). Проведем эти плоскости так, чтобы по-прежнему излуче- излучение проходило от каждой последующей зоны в противофазе с излуче- излучением предыдущей. Для этого положим МХР — М0Р = Х/2; М2Р — — МгР = Я/2 и т. д. Очевидно, что отрезки дуг не равны между собой, т. е. М^Ф МгМ%Ф М*МЪ. Не равны и площади зон — они убывают сначала быстро, а затем очень медленно. Нетрудно показать, что отношение площадей выбран- выбранных таким образом зон к площади первой зоны (М0Мг) изменяется также, как ряд чисел : 1,00 : 0,41 : 0,32 : 0,27 : 0,23 : 0,22 и т. д. Такое соотношение неизбежно должно сказаться на построении кривой для определения суммарной амплитуды колебаний. При равных площадях зон (например, при дифракции на круглом отверстии) результирующая кривая имела вид спирали. В дан- данном случае получится сложная кривая — вначале она более полога, а затем (когда площади соседних зон становятся примерно одинаковыми) переходит в спи- спираль, фокус которой смещен относительно начала ко- координат. Если отодвинуть край экрана влево (рис. 6.9) и просуммировать колебания, приходящие из откры- открывающихся зон, то получается левая часть кривой, которая симметрична рассмотренной. Эту сложную кривую — клотоиду — называют спиралью Корню, и ее график представлен на рис. 6.10. Аналитические выражения, описывающие такую кривую, называют интегралами Френеля: Рис. 6.9. По- Построение зон Френеля в слу- случае дифракции на крае экрана Применим спираль Корню для изучения распределения интенсив- интенсивности в переходной области от света к тени при дифракции сферичес- сферической волны на крае непрозрачного экрана. Длина отрезка F-F+ соответствует полностью открытому фронту. Обозначим амплитуду световых колебаний в точке Р при отсутствии экрана через Е^. При наличии экрана длина отрезка OF+ = F_F+/2 характеризует освещенность в точке Р на границе света и тени. Ам- Амплитуда колебаний в этой точке Ео =£«,/2 (напомним, что / ~ < |£|2 >, и, значит, освещенность в ней /0 равна /«/4). Для нахождения осве- освещенности вне области тени надо учесть, что в данном случае «работают» вся правая ветвь спирали Корню и часть ее левой ветви. Отрезок F+F', больший F+F-, соответствует максимуму освещен- освещенности (/' > /«,), отрезок F+F" — минимуму освещенности (Г < /J, отрезок F+F"' — снова максимуму, но меньшему, чем первый (/'" > > /„, но /'" < /'). В области тени наблюдаем плавное спадание освещенности (F+FIV> > F+Fy и т. д.). Здесь «работает» лишь правая часть спирали Корню. Эти максимальные и минимальные значения освещенности можно 214
вычислить аналитически или получить графически путем аккуратных измерений с помощью спирали Корню. Найденные величины заметно отличаются от величин освещенности экрана вдали от пограничной области. Так, например, /' превышает 1^ более чем на одну треть (рис. 6.11). Эксперимент дает хорошее согласие с теорией. В данном случае, так же как и при дифракции на круглом отверстии, на распре- распределении освещенности не сказы- сказывается материал, из которого изго- изготовлен экран. Следует иметь в виду, что все проведенные расчеты и построения дифракционных картин справедли- справедливы лишь для источника со сфери- сферическим волновым фронтом с равно- равномерным распределением энергии по фронту (дифракция Френеля). Если источник достаточно мал, т. е. мо- может считаться точечным, то резуль- результаты эксперимента близки к рас- расчетным данным. Но при изменении условий опыта согласие с рассмот- рассмотренной теорией уже не наблюдается. Так, например, на рис. 6.12 при- приведена копия оригинальной фотографии, полученной при дифракции лазерного излучения на крае экрана. В этом случае наблюдается очень четкая дифракционная картина, но отношение интенсивностей макси- максимумов и минимумов существенно отличается от распределения, при- Рис. 6.10. Клотоида (спираль Корню) Внутри тени Вне тени Z Рис. 6.11. Зависимость ин- интенсивности / дифракцион- дифракционной картины от расстояния / до края экрана Рис. 6.12. Фотография, полу- полученная при дифракции ла- лазерного излучения на крае экрана веденного на рис. 6.11, так как для лазерного излучения распределе- распределение энергии по сферическому волновому фронту нельзя считать рав- равномерным. Аналогичные отклонения наблюдаются и при использовании УКВ. В частности, отчетливую дифракционную картину можно получить при дифракции УКВ-излучения на крае какого-либо экрана, но рас- распределение интенсивности оказывается отличным от рассчитанного для сферического волнового фронта, так как установка с клистроном излучает волну, более похожую на плоскую, чем на сферическую, что 215
следует учитывать при обсуждении этого простого и эффектного опыта. Очевидно, что при наличии двух экранов, образующих просвет (щель), должна наблюдаться картина дифракции, изображенная (в ис- искаженном масштабе) на рис. 6.13. В последнем случае предполагалось, что просвет между экранами достаточно велик для того, чтобы дей- ствие^каждого из них можно было рассматривать совершенно незави- независимо." Наблюдать такую дифракционную картину в оптическом диапа- диапазоне чрезвычайно трудно, так как длина волны весьма мала. Вся картина сосредоточена в очень малой области простран- пространства, и переходная область между светом и тенью слишком узка. При не очень вниматель- внимательном изучении распределения освещенности представляется, что изображение щели будет просто описываться законами Рис. 6.13. Распределение интенсивно- интенсивности при дифракции на широкой щели Пунктиром показано распределение интен- интенсивности согласно геометрической оптике. Масштаб по оси X сильно увеличен Рис. 6.14. Распределение интен- интенсивности при дифракции на щелях различной ширины Вертикальный масштаб нижнего графика заметно увеличен по срав- сравнению с другими геометрической оптики. [Однако при ' сближении экранов (сужении щели) дифракционные картины будут накладываться одна на другую и в некоторых условиях можно заметить, что изображение щели рас- расплывается. При дальнейшем сужении щели мы с удивлением обнару- обнаружим, что ее изображение становится все шире, что находится в полном противоречии с законами геометрической оптики (рис. 6.14). Ограничимся здесь лишь упоминанием об этих наблюдениях, так как количественное рассмотрение задачи дифракции на щели будет проведено в § 6.3. В данный момент важно установить основной ре- результат описанных экспериментов: явление дифракции приводит к ис- искажениям изображения, которые можно объяснить лишь с позиций волновой оптики. Следует заметить, что до сих пор рассуждения о связи волновой и геометрической оптики носили качественный характер. Покажем, что, используя введенные выше оценки, основанные на применении 216
принципа Гюйгенса — Френеля, можно подойти к решению постав- поставленной задачи с большей определенностью. Для дифракции сферической волны на круглом отверстии или длинной и уякой щели обычно указывают размер препятствия (радиус отверстия, ширина щели и т. д.) и длину волны К. Например, сравни- сравнивается картина дифракции световых и ультракоротких волн, длины волн которых различаются в 100 000 раз. У читателя может создаться впечатление, что соотношение этих двух величин (длины волны и ли- линейного размера препятствия) нацело определяет условия возникно- возникновения дифракционной картины от точечного источника. Эта ошибка, к сожалению, встречается очень часто. На самом же деле необходимо учитывать третий параметр — расстояние от источника света до пре- препятствия (или расстояние между препятствием и экраном, на котором наблюдается дифракционная картина). Ведь степень приближения к геометрической отике связана с тем, сколько зон Френеля уложи- уложилось на данном препятствии. Если линейные размеры препятствия того же порядка, что н размер зоны Френеля (скажем, радиус первой зоны V гг ^Va^a^KI (аг + а2))> то, по-видимому, проявятся волновые свойст- свойства излучения. Если же размер препятствия значительно больше разме- размера зоны, то выявить дифракцию трудно. Изображение оказывается таким, как этого требует геометрическая оптика. При этом вполне можно положить аг = а2 и, обозначая эту вели- величину через р, сравнивать размер препятствия D cVpX, характеризую- характеризующим (с точностью до множителя V2) линейные размеры зоны Френеля. Следовательно, три величины D, р и X определяют условия дифрак- дифракции и соотношение между ними оказывается решающим при переходе от волновой оптики к геометрической. Для удобства введем понятие параметра дифракции р =yrpX/D. Физический смысл этой величины совершенно ясен. Параметр дифракции показывает, каково соотноше- соотношение между линейными размерами зоны Френеля и введенного препятст- препятствия (или отверстия). Если D ^>VpA,, то р -> 0. В этом случае будем считать щель (или другое отверстие) широкой. Если D « УрЯ, т. е. рфО, то щель узка (препятствие мало). Очевидно, что при р -> 0 трудно выявить дифрак- дифракцию и можно говорить о соблюдении законов геометрической опти- оптики. При D «VpA,, когда р Ф 0, учет волновых свойств должен играть основную роль. Так, например, как уже указывалось, если открыта только одна зона Френеля, то освещенность в центре дифракционной картины в четыре раза больше освещенности, создаваемой полностью открытым фронтом. Отсюда нетрудно получить ряд следствий, имеющих принципиаль- принципиальное значение. 1. При Я->0 всегда D^>VpX. Следовательно, требование X -> 0 можно считать основным условием перехода от волновой оптики к гео- геометрической. Дейсгвительно, при любых конечных расстояниях пара- параметр дифракции всегда мал, т. е. условия наблюдения таковы, что волновые эффекты трудно заметить. 217
Законы геометрической оптики можно использовать во всех слу- случаях, когда справедлива оценка X -> 0. Однако здесь может возникнуть противоречивая ситуация: весь расчет системы необходимо проводить с учетом явлений интерференции, но потери света вследствие дифрак- дифракции учитывать не надо, так как они будут пренебрежимо малы. В таком приближении проводился расчет многолучевой интерферометрии (см. § 5.8). _ 2. Если X велико, то при достаточно малых р также D^VpX и р ->• 0. Это значит, что при малых расстояниях реализуются условия геометрической оптики, а по мере увеличения р надо все в большей степеш учитывать явления дифракции. Определение величины р = =VpVD позволяет сформулировать количественный критерий того, в какой степени эти эффекты должны проявиться на опыте. Последнее замечание раскрывает смысл качественных утверждений, которые де- делались при изложении материала настоящего раздела (например, при обсуждении рис. 6.6 отмечалось, что расстояние до экрана должно быть не меньше 10—15 м, и др.). З.Очевидно, что при изменении расстояния р в q раз и размера пре- препятствия D в Vq раз получится тот же параметр дифракции р = VpX/D и условия наблюдения дифракции останутся прежними. На этих сооб- соображениях основано правило «подобия дифракции», чрезвычайно эф- эффектно проиллюстрированное опытами русского физика В. К. Аркадье- Аркадьева в начале XX в. Если имеется круглый непрозрачный экран разме- размером в обеденную тарелку, то на расстоянии 7 км можно наблюдать от- отчетливую дифракционную картину (пятно Пуассона в центре и т. д.). Аркадьев показал, что при уменьшении размера препятствия примерно в 13 раз столь же отчетливую картину дифракции удается наблюдать в лабораторных условиях при р «40 м (V7000/40 « 13). § 6.2. ОСНОВНЫЕ ПОЛОЖЕНИЯ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ Полученное выше условие перехода от волновой к геометрической оптике (X ->• 0) является прямым следствием основных положений классической теории дифракции. Напоминаем, что при этом предель- предельном переходе линейные размеры препятствия много больше линейных размеров любой зоны Френеля и дифракционные эффекты будут пре- пренебрежимо малы. Это приводит, например, к тому, что при измерении интенсивности света, прошедшего через исследуемое отверстие, труд- трудно установить наличие каких-либо дополнительных максимумов и минимумов на границе света и тени и описание явлений в рамках гео- геометрической оптики оказывается соответствующим опыту. Однако остается невыясненным вопрос о том, в какой мере такое описание соответствует электромагнитной теории света и какое место занимают представления геометрической оптики в этой общей теории. Поэтому рассмотрим более тщательно вопрос о взаимосвязи волновой и гео- геометрической, оптики. Покажем, что уравнения электромагнитной тео- теории света содержат в себе решение, пригодное для описания построе- 218
ний геометрической оптики, оперирующей понятием лучей, которые в оптически однородной среде прямолинейны. Плоская электромагнитная волна характеризуется тем, что на- направление ее распространения и амплитуда повсюду одинаковы. В об- общем случае электромагнитная волна этим свойством не обладает. Тем не менее часто электромагнитную волну можно рассматривать как плоскую в каждом небольшом участке пространства. Это возможно тогда, когда амплитуда и направление распространения волны почти не изменяются на протяжении расстояния порядка длины волны. При выполнении этого условия можно ввести волновые поверхности, т. е. поверхности, во всех точках которых фаза волны в данный момент времени имеет одно и то же значение. В плоской волне волновые по- поверхности представляют собой плоскости, перпендикулярные направ- направлению распространения (лучу). Поэтому и в общем случае можно го- говорить о направлении распространения волны на каждом небольшом участке, считая это направление нормальным к волновой поверхности, и оперировать понятием лучей, т. е. линий, касательная к которым в каждой точке совпадает с направлением распространения волны. В при- приложении к геометрической оптике (X ->■ 0) такое приближение стано- становится особо значимым, так как на бесконечно малом участке любая волна эквивалентна плоской. В плоской монохроматической волне электромагнитное поле опи- описывается уравнением где В выражении F.11) введен единичный вектор луча s, который оп- определяется как s=k/&. Очевидно, что в изотропной среде Но в самом общем случае монохроматического поля можно ввести новую функцию S (г), называемую эйконалом, которую мы будем счи- считать конечной и непрерывной в данной области пространства. Определим функцию S (г), записав Eo(r)=e(r)e<'*o5<r>. F.12) На малых участках пространства можно разложить S (г) в ряд, ограничившись членами первого порядка: 219
t При этом выберем начало координат внутри рассматриваемого участ- участка пространства и значения (gradSH и функции 8 (г) возьмем в начале координат. Тогда для амплитуды произвольной электромагнитной волны получаем Ео (г)=е @) е'* A е'*« <r &rad 5>. F.13) 8 В той области, где в разложении 5 (г) можно ограничиться члена- членами первого порядка, зависимость амплитуды произвольной монохро- монохроматической волны от координат имеет такой же вид, как в плоской волне. Поэтому, сравнивая выражения F.11) и F.13), приходим к формулам, обычно называемым уравнениями эйконала: azs = grad S, или (grad SJ = л2. F.14) Из этих выражений следует, что единичный вектор луча s можно вычислить по формуле * в __ gradS Рис. 6.15. К выво- Рассмотрим некоторые следствия выражений ду выражения F.14). F.16) из уравне- Если показатель преломления одинаков для всех точек области (п = const), то в такой опти- оптически однородной среде лучи будут прямолинейны. В частности, одним из простейших решений уравнения эйконала бу- будет линейная функция S = п (агх + 'а$ + а3г), где alf а2, а3 — направляющие косинусы, для которых всегда справедливо соотноше- соотношение aj + al + aj = 1. Следовательно, такое решение F.14) имеет две произвольные постоянные, т. е. получено уравнение плоскости. Это значит, что семейство нормалей в данном случае является систе- системой параллельных лучей. Решением F.14) с одной особой точкой (при п=const) является вы- выражение S = пг, где r=Vx2 + у2 + z2. В этом случае gradS == п/r и семейство нормалей представляет собой систему лучей, расходящихся из точки г = 0, ортогональных поверхностям равной фазы сферичес- сферической волны. Уравнение F.14) позволяет определить, как искривляются свето- световые лучи в оптически неоднородной среде. Для большей наглядности преобразуем его так, чтобы получить в явном виде зависимость кри- кривизны луча от градиента показателя преломления. Обозначим через dv (рис. 6.15) приращение радиус-вектора г, про- проведенного из начала координат в некую точку на луче. Приращение дуги луча обозначим dl. Тогда dr/dl = s, а уравнение луча п 4L = grad 5. F.15) dl 220
Легко подсчитать, чему равна производная: ^- = -^ ^ = ^ Умножив обе части равенства F.15) на grad S и сравнивая полученное выражение с исходным уравнением эйконала F.14), замечаем: ■f=п. F.16) Это уравнение еще раз указывает, что в оптически однородной среде лучи света представляют собой семейство прямых линий. Простые выкладки позволяют получить более определенные соотношения. Про- Продифференцируем по / уравнение луча F.14): ^ (ns) = -^ (grad S). Правая часть этого равенства легко преобразуется: -^ (grad S) = = grad -тг = grad п. Раскрывая производную в левой части равенст- равенства, имеем где -*L=-*L-iL=(gradtt) s. Тогда dl dv dl iL=-L[grad n-s(sgradn)). F.17) dl n Производная ds/dl = N/R, где N — единичный вектор нормали к лучу, R — радиус кривизны луча. Очевидно, что (Ns) = 0. Умножив обе части F.17) на N, окончательно получаем Это равенство показывает, что луч изгибается в сторону увели- увеличения показателя преломления и кривизна луча будет возрастать с уве- увеличением градиента показателя преломления, т. е. с увеличением оп- оптической неоднородности среды. Пользуясь формулой F.18), можно вычислить кривизну лучей в исследуемой среде, если известен закон изменения показателя преломления п (х> у> г). Многие интересные задачи могут быть решены в очень простом приближении. Так, например, положим, что показатель преломления является линейной функцией одной координаты п = п (у) = == п0 A + ау). Тогда искривление луча, первоначально направлен- направленного вдоль оси X (рис. 6.16), будет описываться так называемой цеп- цепной линией, которая при небольших значениях х хорошо аппрокси- аппроксимируется параболой у = ^ ах*- В рамках такого приближения может быть описано явление миража, при" ко- котором путник в жаркой пустыне «ъидит», например, воду, находящуюся от него очень далеко. В этом случае раскаленная земля создает неоднородность прилегающих слоев воздуха, плотность которого (а следовательно, и показатель преломления) возрастает с увеличением расстояния от поверхности земли. 221
В хорошем приближении можно считать линейной зависимость показателя пре- преломления вблизи земли от высоты над ее поверхностью, что и должно привести к искривлению лучей. Аналогично решается задача об искривлении лучей заходящего Солнца в верхних слоях атмосферы. В данном случае показатель преломления при уве- увеличении высоты убывает, лучи будут изогнуты так, как покачано на рис. 6.17, и заходящее солнце будег казаться выше, чем оно действительно находится. Более того, может создаться ситуация, когда находящийся на земле наблюдатель видит солнце, уже скрывшееся за горизонтом. При истолковании этих явлений, физическая сущность которых совершенно ясна, следует также учитывать пси- психологический эффект, заключающийся в том, что мы настолько привыкли ис- исходить из основного свойства распространения световых лучей в однородной сре- среде — их прямолинейности, что невольно пытаемся перенести его на более слож- сложные случаи, когда лучи будут искривлены. Рис. 6 16. Траектория луча в среде с возрастающим вдоль оси Y показателем преломления Рис. 6 17. Кажущееся S' и действительное «S положения Солнца, наблюдаемого с Земли Показатель преломления возду- воздуха уменьшается с высотой Для обоснования геометрической оптики часто применяют различ- различные постулаты, или принципы. В частности, иногда используют из- известный принцип наикратчайшего оптического пути (или наименьше- наименьшего времени), сформулированный Ферма в середине XVII в. Покажем, что этот принцип следует из уравнений электромагнитной теории света в пределе X -> 0. Будем исходить из уравнения F.14). Проинтегрируем его вдоль произвольной кривой, соединяющей точки А и В: =f-g-dr==S(B)—S(A). F.19) Очевидно, что линейный интеграл в левой части F.19) не зависит от формы пути интегрирования от А к В и равен разности значений эйконала в этих точках. Полученное соотношение называют интеграль- интегральным инвариантом Лагранжа. Назовем оптической длиной некоторой кривой, соединяющей точ- точки Л и Л, интеграл ]ndl. F.20) 222
В том случае, когда рассматриваемая кривая является реальным лучом, проходящим через точки Л и В, ее оптическая длина F.20) совпадает с интегральным инвариантом Лагранжа F.19). В самом деле, при интегрировании вдоль луча ^ =sh левая часть F.19) принимает вид в в в Г п (sdr)= f n (ss) dl= f ndU F.21) i i i Можно показать, что оптическая длина любой другой кривой, со- диняющей точки А и В, будет больше, чем S (В) — S (Л), т. е. опти- оптической длины реального луча. Из свойств скалярного произведения следует, что sdr < dl и, следовательно, в в S (B)—S (А) = Г п (sdr) < Г ndU F.22) А А причем равенство выполняется только в том случае, если направле- направления s и dr совпадают в каждой точке рассматриваемой кривой, т. е. если она является реальным лучом. Таким образом, мы получаем принцип Ферма, согласно которому оптическая длина реального луча между любыми двумя точками А и В короче оптической длины любой другой кривой, соединяющей эти точки. Поскольку dl = -dt, то в в t. F.23) Оптическая длина кривой между точками Л и В пропорциональна времени, требующемуся свету для прохождения вдоль этой кривой. Поэтому принцип Ферма можно сформулировать так же, как и прин- принцип наименьшего времени: свет выбирает из всех возможных путей, соединяющих две точки, тот путь, который требует наименьшего вре- времени для его прохождения. Заметим, что в приведенном доказательстве принципа Ферма было использовано предположение о том, что в исследуемой области через каждую точку проходит только один луч. Таким образом, выпали из рассмотрения такие практически важные случаи, как, например, поле лучей от точечного источника Л в однородной среде, отраженных пло- плоским зеркалом (рис. 6.18), где через любую точку В проходят два луча. Оптическая длина прямого луча АВ является в этом случае абсолютно минимальной, тогда как оптическая длина отраженного луча СВ минимальна лишь по отношению к оптическим длинам кривых, лежа- лежащих в некоторой ограниченной окрестности луча (например, АС В). ' Чтобы включить в рассмотрение и такие случаи, можно сформули- сформулировать принцип Ферма в другой форме: реальный луч отличается от остальных кривых, соединяющих две заданные точки, тем, что соот- 223
ветствующая ему оптическая длина \п&1 имеет стационарное значение, т. е. малое изменение траектории (например, точки падения на зерка- зеркало) не приводит в первом порядке к изменению оптической длины. Другими словами, свет выбирает один путь из множества близлежа- близлежащих, требующих почти одинакового времени для прохожденя. Матема- Математически это выражается тем, что для реального луча первая вариация в интеграла F.20) должна быть равна нулю Fj ndl = 0). Общность этого метода полностью выявляется в аналитической механике, но впервые такой прием был использован именно при описании оптических явлений. Как- уже указывалось, принцип Ферма часто используется для обо- обоснования законов геометрической оптики. Действительно, примене- применением его просто получают законы отражения и преломления света на границе двух сред. Отметим, что в электромагнитной теории света эти законы являются прямым следст- следствием граничных условий в уравне- уравнениях Максвелла, а содержание этого параграфа показывает, что принцип Ферма может также рас- рассматриваться как следствие этой общей теории. Использование принципа Ферма иногда облегчает решение опти- оптических задач. Так, например, очевидны условия фокусировки света при его отражении от эллиптического зеркала. Изображение светя- светящейся точки, помещенной в одном из фокусов эллипсоида вращения Р, всегда получается в фокусе Q, так как суммарная длина РО + OQ (рис. 6.19) будет постоянной для любого положения точки О на по- поверхности эллипсоида. Так же легко понять фокусирующее действие линзы, у которой суммарная оптическая длина пути в стекле и воз- воздухе оказывается стационарной (рис. 6.20). Резюмируя, можно утверждать, что введение понятия эйконала и вывод основных уравнений (для К ->• 0) позволили строго обосновать взаимосвязь геометрической оптики и электромагнитной теории света. Выявилось также, что постулаты, часто используемые для обоснований построений и законов геометрической оптики (например, принцип Ферма), должны рассматриваться как прямые следствия общей тео- теории распространения электромагнитных волн и целесообразность их применения определяется лишь удобством решения тех или иных за- задач. Соотношения F.14) и F.18) оказались полезными для решения сложных задач о распространении света в оптически неоднородной 224 Рис. 6.18. Отражение света точечного источника А от плоского зеркала и построение его мнимого изображе- изображения Л'
среде. В более простых случаях обычно оказывается достаточным ис- использование только законов отражения и преломления света. При этом для описания условий фокусировки световых пучков и построения изображений применяют некоторые приемы, которые упрощают реше- решение типовых задач. В развитие геометрической оптики существенный вклад внес знаменитый математик Гаусс. В силу этого данный раздел иногда называют гауссовой оптикой. При построении изображений предметов и выводе основных формул геометрической оптики, как правило, рассматриваются гомоцентри- гомоцентрические (исходящие из одной точки) пучки света. Лучи, входящие в эти пучки, должны составлять малый угол с оптической осью системы (та- Рис. 6.19. К условиям фо- фокусировки света при от- отражении от эллиптиче- эллиптического зеркала Рис. 6.20. Фокусировка лин- линзой изображения точечного ис- источника света S кие лучи называют параксиальными). Для них допустима замена си- синуса или тангенса угла с оптической осью значением самого угла, что часто упрощает вычисления. При описании построений используют удобный прием («правило знаков»), согласно которому все расстояния отсчитываются от границы раздела двух исследуемых сред и те из них, которые оказываются направленными против распространения луча, считаются отрицательными. Кроме того, учитывается знак угла. По- Положительным считается угол, отсчитываемый от направления главной оптической оси по часовой стрелке, а углам, отсчитываемым в проти- противоположном направлении, приписывается отрицательный знак. Для иллюстрации этих приемов, принятых при решении задач гео- геометрической оптики, рассмотрим преломление света на сферической поверхности (рис. 6.21), являющейся границей раздела между двумя оптически однородными средами с показателями преломления п и п'. В этом случае закон преломления световых лучей имеет вид п ( —i) = n' (—*')• F.24) Учтем показанные на чертеже обозначения углов и расстояний и правило знаков: п (Ф — и) = ri (ф — и9). F.25) Из чертежа следует: —и = — ft/a; и' = ft/a'; q> = hi г. Подстав- Подставляя эти значения в F.25) и группируя члены, находим П' — F.26) 8 Зак. 1729 225
Стоящую в правой части величину Ф = (ri — п)/г называют оп- оптической силой преломляющей поверхности. Тогда выражение F.26) преобразуется: 4—т-ф. F-27> Это равенство может быть представлено в более симметричной фор- форме, если ввести фокусные расстояния, которые определяются, исходя из следующих предпосылок (рис. 6.22). Положим —а = со, тогда п1 П'Т п'—п =/'. F.28а) =/. F.286) Величины f и /' называют передним и задним фокусны- фокусными расстояниями. Как видно, они полностью определяются значениями показателей пре- преломления п' и п и кривизной поверхности, на которой про- происходит преломление световых лучей. Соответствующие точки F и F' будут передним и задним фокусами этой поверхности. Очевидно, что f If = -n'ln. п1 Рис. 6 21. Преломление света на сфериче- сферической поверхности Рис. 6.22. Определение фокусов сферической поверхности Рис. 6.23. Обозначение расстояний при отсчете их от фокусов сферической поверхности При таком построении можно отсчитывать расстояние не от пре- преломляющей поверхности, а от переднего и заднего фокусов (х и х'; рис. 6.23). Тогда соотношение F.26) можно преобразовать к симметрич- симметричному равенству, которое обычно называют формулой Ньютона: XX' = //'• F.29) 226
Нетрудно заметить tcp. F.27) и F.29)], что оптическая сила Ф пре- преломляющей поверхности связана с ее фокусными расстояниями: ф=Л1=г —2L F.30) Г Г Полученные выражения легко обобщаются на другие задачи. Так, например, для сферического зеркала можно положить, что i будет углом отражения, ап' = —п. Тогда закон преломления световых лу- лучей переходит в закон отражения I = —*", а формула F.26) преобра- преобразуется к выражению, позволяющему по положению объекта найти по- положение изображения, даваемого сферическим зеркалом: J-+-L = A. F.31) а' а г В этих же обозначениях легко получаются основные соотношения для линейного увеличения р = у'/у при построении изображений. Ис- Используя рис. 6.24, можно вывести основное соотношение, названное инвариантом Лагранжа — Гельмгольца: F.32) У'п'и' = упи. Далее может быть рассмотрена система центрированных поверх- поверхностей, у которой центры их кривизны лежат на одной прямой. Ока- Оказывается, что все полученные выше соотношения [например, F.32I, Рис. 6.24. К формулировке инва- инварианта Лагранжа — Гельмгольца Рис. 6.25. Построение главных пло- плоскостей МН и М'Н' системы двух центрированных поверхностей будут справедливы и для этого общего случая. Тогда надо ввести по- понятие главных фокусов и главных плоскостей системы, определение которых ясно из построений, приведенных на рис. 6.25. Таким образом, стройная теория, развитая Гауссом, позволяет по- получить все необходимые соотношения и рассчитать положение и разме- размеры изображений в различных линзах (являющихся комбинацией двух поверхностей) и объективах, образованных несколькими центрирован- центрированными поверхностями. Если выполнены все упомянутые выше усло- условия [рассматриваются параксиальные гомоцентрические лучи и не учитывается дисперсия вещества т. е. зависимость п (Я)], то для таких идеальных систем в рамках геометрической оптики должно получиться абсолютно точное изображение плоского объекта. Однако на практике 8* 227
оптические системы не идеальны и неизбежно возникают ошибки (абер- (аберрации). Более того, волновая природа света требует учета явлений дифракции на всех экранах и отверстиях оптической системы и, как будет показано далее, учет этих эффектов необходим для оценки пре- предела разрешения оптических систем. Все эти вопросы будут подроб- подробно рассмотрены в § 6.9. Ограничимся приведенными данными, считая основания геометри- геометрической оптики и ее связь с электромагнитной теорией света охаракте- охарактеризованными достаточно полно, а приведенные сведения о построении изображений — достаточными для самостоятельного решения различ- различных задач геометрической оптики. § 6.3. ДИФРАКЦИЯ ПЛОСКИХ ВОЛН НА ОТВЕРСТИЯХ РАЗЛИЧНОЙ ФОРМЫ Принцип Гюйгенса — Френеля позволил получить ряд существен- существенных результатов и определить критерии выбора правильного описания явления, т. е. условия перехода от волновой оптики к геометрической. Изложенный геометрический метод определения результирующей ам- амплитуды прост и удобен при решении различных задач, тогда как ана- аналитическое решение для сферических волн оказывается весьма гро- громоздким. Математически задача решается проще для случая плоских волн. Поэтому имеет смысл рассмотреть другой способ наблюдения дифракции, при описа- описании которого можно ис- использовать приближе- приближение плоских волн. Принципиальная схе- схема наблюдения дифрак- дифракции плоских волн (ди- (дифракция Фраунгофе- ра) представлена на рис. 6.26. Излучение то- точечного источника S превращается линзой Lx в плоскую волну, которая проходит через какое-либо отверстие в непрозрачном экране Э (щель, прямо- прямоугольник, круг и т. д.). Линза L2 собирает в различных участ- участках своей главной фокальной плоскости все лучи, прошедшие через отверстие, в том числе и отклонившиеся на угол q> от первоначального направления в результате дифракции. Исследуя распределение осве- освещенности в фокальной плоскости линзы L2, можно определить види- видимость дифракционной картиныС Фраунгофер, выдвинувший в начале XIX в. идею о возможности исследования дифракции плоских волн, визуально исследовал распределение освещенности с помощью под- подзорной трубы, «установленной на бесконечность». В этом случае роль линзы L2 играл объектив трубы и образовавшаяся дифракционная кар- картина наблюдалась через окуляр. Нетрудно заметить, что дифракцию Фраунгофера можно рассматривать как предельный случай дифрак- дифракции Френеля при аг ->■ оо и а2 -*• оо. Рис. 6 26 Схема наблюдения дифракции плоских волн 228
ЁсЛи источник 5 нельзй считать точечным, то йадо исследовать ди- дифракцию квазимонохроматической волны и связанное с этим ухудше- ухудшение видимости дифракционной картины. Изменение видимости V мож- можно оценить теоретически и экспериментально. В расчетах освещенности дифракционной картины, проводимых в настоящем параграфе, допу- допустим когерентность освещения всего отверстия. В последующем (на примере дифракции на двух щелях) покажем, как изменяется види- видимость дифракционной картины при учете степени пространственной когерентности, зависящей от размеров источника света. Применение метода Гюйгенса — Френеля в данном случае весьма просто. Будем считать, что воображаемая поверхность а совпадает с плоскостью непрозрачного экрана и целиком закрывает исследуемое отверстие. В наиболее простом случае — нормальное падение исходной волны на поверхность экрана — дополнительная разность хода лучей от различных участков щели определяется углом дифракции ср. Упро- Упрощается и вычисление множителя к (ф), значение которого влияет на интенсивность в центре дифракционной картины и не сказывается на распределении интенсивности. В эксперименте же, как правило, исследуется лишь относительная интенсивность (интенсивность в цент- центре дифракционной картины условно принимается равной единице), так как относительные измерения несравненно проще и надежнее аб- абсолютных измерений распределения освещенности, требующих пред- предварительной градуировки приемников света, учета возможного погло- поглощения и т. д. -тТздшм образом, /расчет освещенности дифракционной картины сведется к учету интерференции между фиктивными элементарными источниками, заполняющими изучаемое отверстие в непрозрачном экране. Все они когерентны, поэтому нужно найти амплитуду сум- суммарного колебания, а затем квадрат этой величины, определяющий распределение освещенности в главной фокальной плоскости линзы L2jHe будем исследовать общую задачу — дифракцию плоской волны на произвольном отверстии, а сразу перейдем к решению одной очень важной частной задачи. Рассмотрим излучение длинной и тонкой самосветящейся нити, каждая точка которой испускает плоскую волну, падающую нормально на щель ширины Ь в непрозрачном экране. Образующие щели парал- параллельны светящейся нити. Примем это направление за ось Y. Ось X про- проведем в плоскости непрозрачного экрана перпендикулярно образую- образующим щели, а ось Z — перпендикулярно этой плоскости. Очевидно, что в данном случае можно решать одномерную задачу без учета интерфе- интерференции вдоль оси F, так как все точки бесконечно длинной самосветя- самосветящейся нити являются совершенно некогерентными источниками. Как это обычно делается, будем решать скалярную задачу*. В дальнейшем мы затронем вопрос о постановке электромагнитной векторной задачи лишь в связи с появившимися за последнее время работами о поляри- поляризации излучения дифракционной решеткой. * С 74.: 3 о м м е р ф е л ь д А. Опгика, § 46. 229
Итак, проведем необходимые расчеты (рис. 6.27): участок dx посы- посылает в направлении Z', составляющем угол ф с осью Z, плоскую волну с запаздыванием по фазе на kx sin <p. При записи амплитуды этой волны учтем, что вся щель в направлении <р = 0 посылает излучение с некоторой амплитудой Ео. Следовательно, участок dx щели шириной Ь пошлет в направлении Z' волну dE<$ с амплитудой Ео dxlb, т. е. й£ф = Ё2*1 еХр [/ (at—kx sin q>)], откуда b Е С £ф=—2- ехр(ш/) \ ехр(—ikx sin ф) dx = о F.33) Соотношение F.33) легко преобразовать к симметричному виду, позволяющему применить формулу Эйлера: Обозначим у £6 sin ф= 5т- sin ф через w. Очевидно, что амплитуда волны, распространяющейся под углом ф к оси Z, равна £ф = £0 sin и/и. F.35) Переходя к интенсивности стационарной дифракционной картины /ф (т. е. устанавливая распределение освещенности), имеем /ф - I0(sinu/uJ. F.36) Исследуем это выражение. Как и следовало ожидать, интенсивность максимальна в центре дифракционной картины. В этом случае ф = 0и и = ?j- sin <р также обращается в нуль. Хорошо известно, что lim (sin и/и) = 1 и, следовательно, /ф==о = /о- При некоторых углах, отличных от ф = 0, будет наблюдаться пол- полное исчезновение света. Это произойдет в тех случаях, когда sin и-~ = 0, а и Ф 0. Отсюда сразу же получается условие возникновения минимумов в распределении освещенности и = ± /шг, где т = 1, 2, 3, ..., или ^тф == ± яЛ. F.37) Заметим, что первый минимум можно наблюдать под углом, удовлетво- удовлетворяющим условию sin ф = ± %/Ь. Из дальнейшего станет ясно, что основная часть потока энергии сосредоточена в этих пределах измене- изменения угла дифракции. 230
Между минимумами расположены побочные максимумы освещен- освещенности, которые, как легко показать, возникают при значениях угла Ф, получающихся при решении трансцендентного уравнения tg и = щ а именно при sin ± 1,43 %lby sin ф2 = ± 2,46 %/Ь и т. д. F,38) С увеличением угла дифракции быстро уменьшаются экстремальные значения функции (sin и/иJ. Если считать /0 = 1000 и обозначить интенсивность первого побочного максимума через 1и а второго — через /2, то получим /0 : 1г : /2 = 1000 : 47 : 17. Следовательно, можно утверждать, что, хотя основной световой поток сконцентри- (sinu/uf Г г к- Рис. 6.27. К исследованию диф- ракции плоской волны на щели -гя-л о я 2 я зя и Рис. 6.28. График функции (sin и/иJ рован в пределах, определяемых значениями sin ф = ± Я/6, некото- некоторая часть его будет распространяться в направлении первых ( « 5% энергии) и даже вторых ( « 2% энергии) максимумов. Распределение освещенности при дифракции плоской волны от щели [график функции (sin и/иJ] показано на рис. 6.28. На опыте легко заметить относительно слабые первые побочные максимумы. Экспе- Эксперимент лучше всего проводить, используя излучение лазера, удовлет- удовлетворяющее всем сформулированным выше основным условиям поста- постановки задачи. Соотношение F.35) позволяет подробно исследовать зависимость ширины дифракционного максимума от линейных размеров отверстия (ширины щели Ь). Чем меньше щель 6, тем шире центральный макси- максимум. Нетрудно заметить, что при Ь « X центральный максимум расплы- расплывается на всю полуплоскость (sin фх « 1, т. е. фх « п/2). Дальней- Дальнейшее уменьшение ширины щели не имеет смысла, так как при этом бу- будет наблюдаться монотонное уменьшение интенсивности прошедшего света. В опытах по дифракции света обычно используют щели, ширина которых b > Я, и, следовательно, угол дифракции ф1э соответствующий первому минимуму, значительно меньше я/2. Мы условились пока не рассматривать роли размеров источника (пространственной когерентности в явлениях дифракции). Однако из сказанного выше можно сделать очевидный качественный вывод: чем уже щель, тем меньше должны сказываться размеры источника на
распределении освещенности в дифракционной картине. Действитель- Действительно, роль размеров источника света отчетливо проявится в том случае, когда суммарное уширение центрального максимума будет в основном обусловлено наложением дифракционных картин от различных уча- участков источника света. Этот случай иллюстирует рис. 6.29, где реаль- реальный источник условно заменен тремя точечными источниками, рас- расположенными в его пределах. Используя полученные выше формулы, легко вычислить распреде- распределение освещенности при дифракции плоской волны на прямоугольном отверстии шириной Ъ и высотой а. Напомним, что при расчете освещен- освещенности дифракционной картины от бесконечно длинной щели все эле- элементы вдоль оси Y считались не- когереитными источниками и соз- создаваемые ими освещенности просто складывались. Очевидно, что в слу- случае дифракции плоской волны на прямоугольном отверстии так де- делать нельзя ..Надо осветить отвер- отверстие удаленным точечным источни- источником или параллельным пучком све- света. При описании опыта необходи- необходимо провести суммирование ампли- амплитуд также и вдоль оси У, т. е. вы- вычислить еще один интеграл вида F.33). Таким образом, здесь при- приходится решать двумерную задачу, параметрами которой служат два угла дифракции. Угол q> по-преж- по-прежнему характеризует распределение интенсивности вдоль оси X, а угол -ф определяет отклонение волны вдоль оси У, причем проведен- проведенный выше анализ соотношения F.366) сохраняет свое значение, т. е. Рис. 6.29. Наложение главных макси- максимумов интенсивности при дифракции на щели света от трех точечных ис- источников Справа — сравнительные размеры главных максимумов в дифракционной картине, со- создаваемой протяженным (сплошная кри- кривая) и точечным (пунктир) источниками та при дифракции на широкой (а) и уз- узкой (б) щелях i/"iJ (sin F.39) Tib . где иг = — sin = — sin Рис. 6.30 иллюстрирует эту зависимость. Важно указать, что если Ъ < а (т. е. высота прямоугольного отверстия больше его ширины), то дифракционная картина будет больше растянута по оси X, чем по оси У. Иными словами, дифракционное изображение такого пря- прямоугольного отверстия тоже будет прямоугольником, высота которого меньше его ширины. Через центральную часть этой двумерной дифрак- дифракционной картины пройдет основная доля потока световой энергии. Относительная интенсивность максимумов вдоль любой из осей будет по-прежнему характеризоваться отношением чисел 1000 : 47 : 17. Интенсивность максимумов в направлениях между осями X и Y будет совсем мала, так как она определится произведением двух малых величин. 233
Задача о дифракции френелевых волн на круглом отверстии в не* йрозрачном экране графически исследовалась в § 6.1. При фраунго- феровой дифракции плоских волн на круглом отверстии получается качественно такая же картина, как в только что разобранной задаче о дифракции на квадратном отверстии. В фокальной плоскости линзы наблюдаются центральное светлое пятно в виде круга и охватывающие его концентрические светлые и темные дифракционные кольца. Матема- Математически (после перехода к полярным координатам ) задача сводится к определению корней функции Бесселя Jx (и), где и = -£ a sin cp, Рис. 6.30. Фраунгоферова дифракция (а) на прямоугольном отверстии Длина волны света Я-5790 А. Справа изображено отверстие (б), ори- ориентированное так же, как и фотография я*— радиус отверстия. Первый корень, соответствующий первому ми- минимуму освещенности (т. е. границе центрального светлого пятна в дифракционной картине), получится при значении sin фх = 0,61 К/а. F.40) Эта формула играет первостепенную роль в дифракционной теории оптических инструментов. Распределение интенсивности при дифрак- дифракции плоской волны на круглом отверстии задается функцией / (и) ~ [2 Jx (и)/и]\ F.41) Оно представлено на рис. 6.31. Мы видим, что и в данном случае ин- интенсивность центрального светлого пятна велика по сравнению с ин- интенсивностью последующих максимумов. Это позволяет не учитывать их при оценке роли дифракции в оптических и спектральных инстру- инструментах. На практике часто встречаются задачи, при решении которых при- приходится отступать от классической схемы дифракции Фраунгофера, представленной на рис. 6.26. В частности, дифракционная картина, аналогичная рассмотренной выше, получается при наблюдении ее в плоскости изображения точечного источника, помещенного вне фоку- 233
са линзы. Распределение интенсивности будет йо-прежнему описывать- описываться найденными выше формулами [например, F.41)]. Следует учитывать, что все приведенные в этом параграфе формулы выведены в предположении о равномерном освещении отверстия. При нарушении этого исходного условия распределение интенсивности в дифракционной картине может быть существенно другим. В частно- частности, так обстоит дело при фокусировке лазерного излучения. Лазер со сферическими зеркалами эквива- эквивалентен точечному источнику (сфери- (сферические волновые поверхности) с си- силой света, распределенной по гауссо- Бому J/ ~ ехр (— & (ДфJ1 закону в небольшом телесном угле. По мере удаления сферической волны от ре- резонатора центр ее смещается вдоль 5 О 5) 10 и Рис. 6.31. Распределение интенсивности в дифракционной кар- картине при дифракции Фраунгофера на круглом отверстии диа- диаметром 6 мм: а —фотография картины (сильно переэкспонированная); б—график функции распределения оси. Можно показать, что в этом случае уравнения лучей (нор- (нормалей к волновым поверхностям), вдоль которых распространяется энергия, представляют семейство гипербол. Такой весьма своеобраз- своеобразный ход лучей представлен на рис. 6.32, где изображены конфокаль- конфокальный резонатор и фокусирующая линза L, преобразующая выходящий из лазера пучок света по законам геометрической оптики. Положение фокусирующей линзы и ее параметры (апертуру и оптическую силу) выбирают в соответствии с решаемой задачей (фокусировка излучения на конечное расстояние, на бесконечность и т. д.). Обычно полезно увеличить сечение пучка света, выходящего из лазера. Для этого у его торца помещают вспомогательную короткофокусную линзу, а затем уже устанавливают фокусирующую линзу, размеры которой выбирают так, чтобы потери света на ней были достаточно малы* 234
В силу явления дифракции никогда не получается фокусировка лазерного излучения в одной точке. Однако распределение интенсив- интенсивности в плоскости фокусировки отлично от закона, задаваемого фор- формулой F.41), и описывается кривой того же вида, какой имело распре- распределение интенсивности по фронту до фокусировки (гауссова кривая другого масштаба). В некоторых приложениях (см. §6.10) используется освещение щели по синусоидальному закону. Пусть распределение амплитуд на щели задается формулой Ех——— 1 —cos — 2пх\ Г F.42) где b — по-прежнему ширина щели. Рис. 6.32. Ход лучей внутри и вне конфокального резонатора при фокусировке линзой лазерного излучения: / — расстояние между зеркалами Нетрудно видеть, что центр щели будет освещен максимально, а амплитуда колебаний на краях равна нулю. Тогда для выяснения вида дифракционной картины придется несколько усложнить вычисле- вычисления, приведенные при выводе F.33), и сосчитать выражение вида ъ £ф= JEL ехр (Ш) Г A —cos —\ exp(—ikx sin <p) dx. F.43) о В результате для интенсивности дифрагированной волны получится ! /ф==/0 ф ° F.44) nb где и = -т- sin ф. Это выражение отличается от F.36) наличием в знаменателе мно- множителя [1 — (а/яJ]2, который обращается в нуль при и = д. Поэтому интенсивность света в этой точке отлична от нуля и впервые обращается в нуль при и=2л;. В результате центральный максимум интенсивности света, дифрагированного на щели с таким пропусканием, будет замет- заметно шире, чем при равномерном освещении щели. § 6.4. ДИФРАКЦИЯ СВЕТА НА ПРАВИЛЬНОЙ СТРУКТУРЕ В § 6.3 была рассмотрена задача о дифракции плоской волны на отверстии в непрозрачном экране. В зависимости от вида отверстия (щель, прямоугольник, круг) меняется характер дифракционной кар- 235
тины, хотя некоторые общие черты явления очевидны (например, уве- увеличение угла расхождения дифрагировавших лучей при уменьшении размеров отверстия). Теперь необходимо также учесть взаимодействие пучков, дифрагировавших на многих однотипных отверстиях в непро- непрозрачном экране. Очевидно, что этот дополнительный интерференционный эффект будет наблюдаться лишь при правильном их распределении, т. е. когда расстояния между отверстиями равны друг другу или изменяют- изменяются по определенному закону. Только в таком случае (при когерентном освещении всей структуры) разность фаз между дифрагировавшими волнами будет сохраняться неизменной и интерференционный член будет отличен от нуля. Если расстояние между отверстиями изменяет- изменяется по случайному закону (они расположены хаотично), то никакой постоянной разности фаз не будет, интерференционный член обратит- обратится в нуль и надо сложить интенсивности всех пучков света, которые посылает в данном направлении каждое отверстие. Следовательно, при хаотическом расположении отверстий распределение интенсивно- интенсивности останется таким же, как и в случае одного отверстия, и никаких дополнительных эффектов, приводящих к изменению суммарной диф- дифракционной картины, не возникнет. Аналогичная ситуация имеет место при некогерентном освещении правильной структуры, так как и в этом случае разность фаз между дифрагировавшими пучками также непостоянна. При использовании частично когерентного света (например, в случае протяженного источ- источника, находящегося в фокальной плоскости линзы, формирующей па- параллельный пучок света, падающего на правильную структуру) по- получится некая промежуточная ситуация @ < V < 1), которую мы будем исследовать позже (см. § 6.6) на более простом примере дифрак- дифракции на двух щелях. Итак, имеется правильная структура из N параллельных щелей* с шириной каждой щели, равной Ь, и расстоянием между соседними щелями, равным d. На эту струк- структуру нормально падает плоская мо- монохроматическая волна. Требуется найти интенсивность света /ф, рас- распространяющегося в направлении, составляющем угол <р с нормалью к плоскости, в которой лежат все N щелей. Как уже указывалось, кро- кроме распределения интенсивности, Рис. 6.33. К исследованию фраунгофе- обусловливаемого дифракцией по ровой дифракции на правильной каждой щели, нужно учесть интер- интерструктуре из N щелей ференцию меад/ этими N пучками. В данном случае по-прежнему мож- f ПН . d , 'inn * Такую правильную структуру щелей называют дифракционной решеткой. Принципы изготовления и основные свойства дифракционных решеток подроб- подробно см. в § 6.5. 236
но решать одномерную задачу, направив ось X перпендикулярно образующим щелей. Рис. 6.33 поясняет задачу. От элемента dx какой-то /i-й щели в исследуемом направлении (на- (направляющий косинус sin ф) распространяется волна вида ь Вся п-я щель пошлет волну вида р ъ —— exp i [©/— k (n — 1) d sin q>] Г ехр (—ikx sin cp) dx. F.45) о Для учета действия всех щелей нужно сложить все образовавшиеся волны. Они когерентны, значит, складываются напряженности элект- электрического поля. При такой схеме расчета автоматически учитывается фаза результирующей волны. Итак, имеем Е N ь —2- ехр (Ш) У е*р I—ik (п — 1) d sin q>] f exp (—ikx sin <p) dx. F.46) Выше было показано [см. F.35)], что ■f-f-PM, и • о где и = nb sin <рА. Вынесем этот множитель, не зависящий от п, за знак суммы, и тогда для определения амплитуды результирующе- результирующего колебания нужно лишь найти сумму: N N exp[— ik(n — l)dsin<p]= ^ exp Г—t —^- (n—l)dsincp|. 1 n=l L •* Обозначим nd sin фД через б. Тогда N 2 exp[—/2б(п—1I=1 +exp(—2Ы) + l + exp(— 4б/) + ... + ехр[—28(N— \)i]. F.47) Это геометрическая прогрессия со знаменателем q = exp 2 S6, сумма которой, как известно, равна 1 — qN/ A — g). Следовательно, 1 1)/]=, х 1-ехр (-26/)' Для оценки /ф нужно вычислить произведение суммы F.47) на сопря- сопряженную ей величину 22*: *— [1-ехр(-28^I[1-ехрBбМI [1-ехр (-26/)] [1-ехр B6/)] * 237
Числитель этой дроби легко привести к более простому виду, а именно: [1 _ехр(-26JV01 [ 1 -expBfiM)]-2 [l - ехр <-wa0+«P <2Ш> ]. Вещественная его часть равна 2 A — cos 2 N6) = 4 sin2 N8. Совершенно аналогичный расчет показывает, что знаменатель выраже- выражения F.48) равен 4 sin26. Следовательно, окончательное выражение для интенсивности света, распространяющегося под углом ср к нормали после дифракции на правильной структуре из N щелей, запишется в виде /ф=/0 (sin и/ и? (sin W5/sin бJ, F.49) где и= — sin (pt 6=^—sin ср. Л» Л» Множитель (sin и/иJ характеризует распределение интенсивности в результате дифракции плоской волны на каждой щели, а множитель (sin JV6/sin бJ учитывает интерференцию между пучками, исходя- исходящими от всех щелей. Множитель /0 определяет интенсивность света, излучаемого в направлении ср = 0, которая зависит от потока энергии, падающего на решетку света. При анализе полученных результатов исследуем сначала интер- интерференцию N пучков, т. е. посмотрим, как меняется множитель (sin iV6/sin бJ в зависимости от угла дифракции ср. Из рис. 6.33 видно, что величина d sin ср равна разности хода Д между волнами, испускаемыми двумя эквивалентными точками сосед- соседних щелей. Если она равна целому числу волн, то колебания усилят друг друга. Поэтому, положив d sin ф = тХ, F.50) где порядок дифракции т = 0, 1, 2, ..., посмотрим, во что обращается исследуемый множитель; имеем б = (ndsirup/k) = тл, т. е. sin N8 = 0 и sin б = 0. Известно, что lim I sin N8/sin б | = N и, sin 6-0 следовательно, (/ф)макс = h (Sin Uluf N\ F.51) Этот очень важный результат заслуживает внимательного рассмот- рассмотрения. При выполнении условия d sin ф == тК интенсивность света, дифрагировавшего на системе из N щелей, возрастает не в N раз по сравнению с интенсивностью света, прошедшего через каждую щель, а в N2 раз. Это есть прямой результат интерференции дифрагировав- дифрагировавших пучков, происходящей при дифракции на правильной структуре. Если бы N щелей располагались хаотически, то интерференционный член равнялся бы нулю и суммарная интенсивность была бы пропор- пропорциональна числу щелей неправильной структуры, 238
Максимумы, возникающие при выполнении условия F.50), назы* вают главными максимумами. Они появляются тогда, когда одновремен- одновременно sin N б = 0 и sin б = 0. Но между двумя главными максимума- максимумами должно возникнуть N — 1 минимумов, где sin N б == 0, но sin б ф 0. Между этими минимумами должны находиться побочные, или дополнительные, максимумы, в которых интенсивность света при достаточно большом N пренебрежимо мала по сравнению с интенсив- ностями главных максимумов. -X/d 0 X/ct si ncp a) -л/а о 5) Рис. 6 34 График функции (sin Nd/sinbJ: Для того чтобы лучше понять, как появляются главные и допол- дополнительные максимумы интенсивности, запишем следующий ряд зна- значений N8 при последовательном их возрастании: #6=0, пу -1)я, Mr, n,...} 2(N-l)n, \ Стрелками показаны главные максимумы (sin 6 = 0, sin N8 = 0), а фигурными скобками — минимумы (sin б Ф 0, sin N8 = 0). Здесь мы снова, как и в § 5.9, наблюдаем интерференцию многих пучков света (многолучевую интерферометрию). В данном случае распределение интенсивности в интерференционной картине оказы- оказывается совершенно другим, чем при интерференции двух волн, при которой для освещенности характерна зависимость вида cos2 б. На рис. 6.34 приведен график функции (sin N б/sin бJ в пределах трех главных максимумов (т = — 1,0, +1) для N = 2 и для N = 8. Конечно, вертикальные масштабы этих двух кривых очень различны, так как они нормированы введением множителя 1/N2 из*за невозмож- невозможности изобразить увеличение интенсивности главных максимумов в N2 раз. При увеличении числа дифрагировавших пучков (заметим, что в современных дифракционных решетках N достигает значения 200 000) главные максимумы становятся очень резкими и разделены широкими промежутками, где интенсивность света можно считать равной нулю. 239
dsmcf До этого использовалась лишь одна характеристика интерферен* ционной картины — функция видимости V == ('макс *мин)' ('макс "т" 'мин/- При дифракции плоской монохроматической волны на правильной структуре видимость равна единице как в случае N = 2, так и при очень больших N. Очевидно, что необходимо использовать какую-то дополнительную характеристику, учитывающую различную резкость интерференционных полос и связанную с ней возможность раздельно наблюдать два максимума. В даль- дальнейшем (см. § 6.7) будет введено понятие разрешающей силы, а сейчас ограничимся констатацией зависимости резкости дифракцион- дифракционной картины от числа интерфери- интерферирующих пучков. Хорошо иллюстрируют иссле- исследуемую зависимость простейшие ди- дифракционные решетки с постепенно возрастающим числом щелей при освещении их светом ртутной дуги. При N « 100 наблюдаются доволь- довольно расплывчатые максимумы. Раз- Разрешение по длинам волн отсутст- отсутствует. Увеличение числа интерфери- интерферирующих пучков в 10 раз приводит к появлению по обе стороны от центрального пятна четких максимумов. Наблюдается ряд линий, составляющих характерный спектр ртути. В этом опыте проявляется также следующая характерная зависи- зависимость: чем меньше d (постоянная решетки), тем больше угловое рас- расстояние между главными максимумами. Способность дифракционной решетки «развести» излучение двух определенных длин волн на некото- некоторый угол также служит важной ее характеристикой, которую тоже следует ввести при количественном описании (см. § 6.7). Заметим, что полученные выражения легко распространить^ и на случай падения плоской волны на дифракционную решетку под неко- некоторым углом. Обозначим через G угол между направлением пучка и на- направлением нормали к решетке. Тогда (рис. 6.35, а) для возникновения главных максимумов вместо d sin q> = mk получается условие d (sin ф — sin 6) = mk, непосредственно следующее из вычисления разности хода А для двух интерферирующих лучей. В дальнейшем будут подробно рассмотрены отражательные дифракционные решетки. Для них (рис. 6.35, б) выражение для разности хода следует записать в виде Рис. 6.35. Косое падение плоской све- световой волны на дифракционную ре- решетку За положительное направление углов при* нят поворот по часовой стрелке d (sin ф + sin в) = mk. F.52) Учтем теперь тот вклад в распределение интенсивности, задаваемое F.49), который вносит каждая щель. Для этого необходимо исследо- 240
вать, как ведет себя функция (sin и/иJ при выполнении условия F.50), что позволит получить относительные интенсивности главных максимумов в разных порядках дифракции. Проведем простые пре- Адл/l \ \ ЛллЛ \ ь S) 2К JA 5Ш(р Л 7 в) 5тср Рис. 6.36. Распределение интенсивности 7//0 при дифракции света на правильной структуре из N щелей: а — обусловленное интерференцией N пучков от разных щелей; б — дифракцией на каждой щели; в — суммарное распределение образования. По определению, и =(nb sin ф)Д. Вместе с тем, согласно условию E.25), sin <р = rrikld, откуда и = ~- ^- = пт j. Тогда у cPsin2 (nmb/d) ~ я2 Ь* т* " Вспомним, что для главных максимумов lim | sin N8/sin 6J| Отсюда интенсивность m-ro главного максимума N. 241
\лллл й-б Анализ этой формулы приводит к следующим выводам: 1. 1Ш ~ 1/т2, т. е. с увеличением порядка дифракции резко умень- уменьшается интенсивность соответствующего главного максимума. В даль- дальнейшем будет показано, что при использовании некоторых специаль- специальных приемов можно изменить эту зависимость и добиться того, чтобы основной поток энергии дифрагировавшего света концентрировался в каком-то определенном направлении. Это достигается в решетках с профилированным штрихом (см. § 6.5). Но пока будем исходить из соотно- соотношения Im ~ 1/т2. 2. Интенсивность света в m-м мак- максимуме существенно зависит от отноше- отношения bid. Действительно, при (bid) m = = т', где т! — целое число, выражение F.53) обращается в нуль, так как sin пт' = 0. Отсюда следует, что интен- интенсивность света в этом главном максимуме равна нулю. Вспоминая, что условие возникновения минимума излучения при дифракции на одной щели имело вид b sin ф = пгку замечаем, что данный слу- случай соответствует совпадению условий возникновения главного максимума ди- дифракционной картины на N щелях и минимума дифракции на каждой щели. Так, например, при bid = V4 выпадает каждый четвертый максимум в дифрак- дифракционной картине, что и показано на рис. 6.36. Итак, при дифракции плоской волны на правильной структуре из N щелей относительная интенсивность максиму- максимумов суммарной дифракционной картины обусловлена как зависи- зависимостью 1т — 1/т2, так и отношением ширины каждой щели b к по- постоянной дифракционной решетки d. Резкость максимумов опреде- определяется числом щелей N, а интенсивность каждого из них пропорцио- пропорциональна N2. Полученные результаты справедливы для решеток с равномерным пропусканием по щели. Если амплитудный коэффициент пропускания т непостоянен, то формула F.49) может иметь другой вид. Так, на- например, интересный результат получается при дифракции света на решетке с гармоническим пропусканием (рис. 6.37). В этом случае можно считать, что решетка образована системой щелей шириной b = d с пропусканием на каждой из них, определяе- определяемым из выражения F.42). Распределение интенсивности света, дифра- дифрагированного на щели, будет задаваться законом F.44) при и = б. Тогда вместо формулы F.49) получим , , sin2 #6 Рис. 6.37. К вопросу о дифрак- дифракции света на гармонической ре- решетке: а— график амплитудного коэффи- коэффициента пропускания; б — разре- разрешенные порядки дифракции (т« =0±1). Волнистой линией условно показано гармоническое пропускание б» II— (в/я)*]» 242
Выражение F.54) показывает, что монохроматическая плоская волна, дифрагирующая на гармонической решетке, имеет лишь три главных максимума 6 = 0, ± я. Другими словами, будут наблюдаться лишь нулевой и два первых (т = ± 1) порядка дифракционного спек- спектра. В § 6.10 мы используем этот результат. § 6.5. СОВРЕМЕННЫЕ ДИФРАКЦИОННЫЕ РЕШЕТКИ Первые дифракционные решетки были созданы Фраунгофером в начале XIX в. Они представляли собой множество параллельно на- натянутых тонких проволок, просветы между которыми и служили пра- правильной системой щелей. Позднее Фраунгофер наносил с помощью примитивной делительной машины равноотстоящие друг от друга про- прозрачные штрихи на стеклянных пластинках. Отражательные решетки несравненно более высокого качества были впервые получены в 80-х годах XIX в. американским физиком Роулендом, наносившим штрихи на металлическую плоскую или вог- вогнутую поверхность* с помощью винтовой делительной машины. Ре- Решетки, изготовленные на машинах Роуленда, в усовершенствовании которых принимали участие Вуд и другие крупные физики, оставались лучшими в мире вплоть до 50-х годов нашего столетия. В настоящее время в СССР усилиями Ф. М. Герасимова и его сотрудников налажен массовый выпуск превосходных дифракционных решеток и разработа- разработаны оригинальные методы их исследования. При характеристике свойств современных решеток мы воспользуемся некоторыми результатами этих исследований. Уточним вначале физические принципы действия таких решеток. Выше уже указывалось, что соотношение Im ~ 1//п2 не является уни- универсальным. Заметим, что при выводе формулы F.49) предполагалось, что плоскость каждой щели совпадает с плоскостью решетки, и не учитывалась дополнительная разность фаз, возникающая при прохож- прохождении плоской волной тела самой решетки. Таким образом, решалась не только одномерная, но и линейная задача, в которой никак не учи- учитывалась форма штрихов, составляющих ту правильную структуру, на которой рассматривается дифракция плоской волны. Все эти огра- ничения приближенно соблюдались в старых решетках, называемых в настоящее время амплитудными, и формула F.49) хорошо согласо- вывалась с данными эксперимента. Современная решетка представляет собой систему штрихов, в кото- которой фактически нет плоских промежутков. На стеклянной или мета- лической поверхности нанесено громадное количество бороздок вполне * Вогнутая сферическая дифракционная решетка одновременно служит фокусирующим зеркалом и не требует объективов для получения изображения шели. Это упрощает конструкцию прибора, и спектрографы с отражательными вогнутыми решетками широко используются для исследований во всем оптиче- оптическом диапазоне. Однако при работе с ней возникают затруднения с получением стигматического изображения щели, что желательно в некоторых задачах. В ли- литературе описаны различные способы установки вогнутых решеток, разработан- разработанные Роулендом и другими физиками (см., например, С о и е р Р. Эксперимен- Экспериментальная спектроскопия. М., ИЛ, 1953). 243
определенной формы (профилированные штрихи), непосредствен- непосредственно примыкающих друг к другу. На рис. 6.38 представлена схе- схема такой решетки (фазовая решетка) в сравнении с обычной ампли- амплитудной решеткой, теория которой была изложена в § 6.4. Плоская волна проникает в профилированный штрих, причем от- отдельные его элементы создадут запаздывание по фазе, так как волновая поверхность достигнет разных участков штриха в различные моменты времени. Это запаздывание по фазе слеует учитывать при расчете диф- дифракционной картины. Оно приводит к тому, что функцию (sin и /(иJ в выражении F.49) нужно заме- ____________ нить другой, более сложной функ- цией, зависящей от геометрии ^ штриха. Соответственно изменится и распределение интенсивности IIIIHIIUI Ж И НИН ™'ч»*>« -м-з-г-м/ 2345т S) В) Рис. 6.38. Амплитудная (а) и Рис. 6.39. Распределение интенсивно- фазовая (б) дифракционные ре- ста при дифракции света на решетках шетки: с различной формой штрихов d ~- период решетки между главными максимумами. Второй множитель в соотношении F.49), определяющий взаимодействие элементарных дифрагировав- дифрагировавших пучков, останется практически прежним. Используя принцип Гюйгенса — Френеля, можно рассчитать рас- распределение интенсивности в дифрагировавшем излучении для заданного угла падения плоской волны на правильную структуру штрихов опре- определенной формы*. Ограничимся тем, что приведем графики, иллюстри- иллюстрирующие результаты таких подсчетов для двух решеток с различной формой штрихов (рис. 6.39). В одном случае при некотором угле паде- падения удается сконцентрировать все излучение в спектре одного порядка (в частности, как показано на рис. 6.39, а, в первом порядке). При другой форме штриха (прямоугольный профиль) получается более сложное распределение потока энергии по главным максимумам (рис. 6.39, б). Как в том, так и в другом случаях соотношение Im ~ ~ 11т2 ни в коей мере не справедливо. Отражательные решетки ступенчатого профиля, изображенные на рис. 6.38, б, часто называют концентрирующими или блестящими. Это связано с тем, что для отражательной решетки максимальная ♦ См.: Зомморфсльд А. Оптика, § 36. 244
интенсивность дифрагировавшего света наблюдается в направлении луча, зеркально отраженного от одной из плоскостей штриха. Это зна- значит, что при угле падения © максимум дифрагировавшего света на- наблюдается под углом ф, который определяется условием ср = 0 + + 2 е, где е — угол наклона исследуемой грани штриха к поверхности решетки (рис. 6.40). Рассмотрим, как преобразуется в этом случае условие F.52) воз- возникновения главного максимума. Наиболее простые соотношения по- получают для достаточно малых углов ф и G в часто используемом на практике случае, когда дифрагировавшая волна распространяется навстречу падающей (автоколлимационная установка решетки). Тогда условие F.52) принимает вид 2dsin е = /тй. F.55) Пользуясь им, можно определить тот порядок дифракционного спектра, в котором должна наблюдаться максимальная интенсив- интенсивность излучения исследуемой ДЛИНЫ ВОЛНЫ А,о: Рис. 6.40. Схема, поясня- поясняющая понятие «угла бле- ffl-r— 2а sine F 56) ска» в отражательной ре- ^0 \ • / щетке с профилирован- профилированным штрихом С удовлетворительным Приближением МОЖ- Пунктиром показана поверх- но считать, что распределение интенсивности ™™ЦеШиТКН отсчиты1Гет^ по главным максимумам как бы сдвинется от- угол падения в носительно прежнего, для которого функция (sin и/иJ имела максимальное значение при т = 0. Так, например, при значении 8, удовлетворяющем условию Bdsin е)М,0 = 3, макси- максимальная интенсивность излучения длины волны Хо наблюдается в третьем порядке (т = 3), где интенсивность света, дифрагировав- дифрагировавшего на амплитудной решетке при соотношении dlb = 3 была бы рав- равна нулю. На рис. 6.41 показано такое распределение интенсивности. В настоящее время для изучения спектров в ультрафиолетовой и видимой областях используют решетки с очень большим числом штрихов на единицу длины C00, 600, 1200, 1800 и даже 2400 штрихов на 1 мм). Совершенно очевидно, что изготовление таких решеток с за- заданным профилем штрихов при очень высоких требованиях к точности их относительного расположения — задача чрезвычайной трудности; это, пожалуй, предел точности механической обработки, достигаемой в настоящее время. Современные делительные машины представляют собой сложней- сложнейшие устройства, а управление ими — весьма своеобразная техниче- техническая задача, рассмотрение которой в рамках настоящей книги не- невозможно. Мы ограничимся лишь характеристикой некоторых физи- физических методов, применяемых при изготовлении и испытании дифрак- дифракционных решеток. Для управления делительной машиной, контроля и исправления ошибок в процессе нарезки решетки используют явление интерферен- интерференции. Один из вариантов этого метода основан на том, что перемещение 245
дифракционной решетки в процессе ее изготовления непрерывно из- измеряется автоматическим устройством, в котором датчиком линейного перемещения служит специальный интерферометр, состоящий из на- нарезаемой и эталонной решеток. Далее действует сложная схема об- обратной связи, позволяющая регулировать перемещение нарезае- нарезаемой решетки, на которую алмазным резцом наносят штрихи вполне определенного профиля (рис. 6.42). Применение интерференцион- интерференционного метода позволило практически исключить различные ошибки, служащие причиной возникновения ложных линий (духов) в спектре дифракционных решеток. Г; У 1 — 2 -<# «<^Jv/\/\/\/ 7 / к' и 2 ^ 4 5 /77 Рис. 6 41. Сдвиг распределения интенсивности, создаваемого дифракци- дифракционной решеткой с профилированным штрихом A) по сравнению с рас- распределением при дифракции на амплитудной решетке B) Наиболее интересен интерференционный метод исследования диф- дифракционных решеток, сыгравший существенную роль в развитии ра- работ в этой области. Сущность метода заключается в том, что плоская волна сравнивается с волной, дифрагировавшей на решетке. Для этого одно из зеркал в интерферометре Майкельсона заменяется от- отражательной дифракционной решеткой, а наблюдение ведется в параллельном пучке монохроматического света. Интерферен- Интерференционная картина подобна полосам равной толщины, однако в данном случае вид ин- интерференционных полос определяется не только юстировкой и отклонением от плос- плоскости зеркал интерферометра, но и погреш- погрешностями в расположении штрихов решетки. На рис. 6.43 приведены интерферограм- мы, иллюстрирующие некоторые типичные ошибки деления. Резкий излом полос (а) свидетельствует о различном значении по- постоянной решетки d справа и слева от из- излома. Интерферограмма б указывает на наличие у решетки сущест- существенных локальных ошибок. Интерферограмма в получена с решеткой, нарезание которой началось одновременно с пуском делительной ма- машины, и показывает, что делительная машина некоторое время нахо- находилась в неустойчивом динамическом равновесии. Интерферограмма г получена с решеткой высокого качества — интерференционные поло- полосы совершенно прямые. 246 Рис. 6 42. Схематическое изображение алмазного резца Внизу показан профиль штриха нарезаемой решетки
Весьма интересны поляризующие свойства дифракционных реше- решеток. Выше уже указывалось, что классическая теория дифракции связана с решением скалярной задачи, в которой, естественно, не учи- учитывается поляризация излучения. Но, как показал еще Герц, радио- 5) Рис. 6.43. Интерферограммы дифрагировавших на решетке пучков, иллюстрирующие некоторые ошибки деления волны, проходящие через систему параллельных щелей, образованную металлическими проволоками (d « Я), поляризованы. Аналогичные эффекты имеют место и в оптическом диапазоне, причем поляриза- поляризационные явления оказываются наиболее выра- выраженными при использовании металлических ди- дифракционных решеток, что нетрудно понять, ана- анализируя граничные условия в уравнениях Макс- Максвелла. Ограничимся рассмотрением лишь двух эффектов, приводящих к поляризации дифраги- дифрагировавшего света. Известно, что для идеального проводника глубина проникновения волны в металл ничтож- ничтожно мала, тангенциальная составляющая электри- электрического поля исчезает (£ц = 0), а тангенциаль- тангенциальная составляющая магнитного поля (#ц) терпит разрыв. В результате прозрачная дифракцион- дифракционная решетка с чередованием проводящих и не- непроводящих элементов ведет себя (для достаточ- достаточно длинных волн) как весьма эффективный по- поляризатор, пропускающий лишь ту волну, в которой вектор Е перпендикулярен штрихам РА 2,5 2,0 15 0,5 0,4 10 к,мнм Рис. 6.44. К поляризу- поляризующему действию отра- отражательной металличе* ской решетки с профи- рованным штрихом решетки (Е±). Такие поляризаторы все шире используются в опти- оптических экспериментах. Разное взаимодействие Еп и Е± с металлической поверхностью и для отражательных решеток. Оно существенно зависит от формы штриха (разное проникновение тангенциальной £ц- и нормальной Я^-состав- 247
ляющйх в глубь тела peiiietKn), й возникает различие в коэффициен- коэффициентах отражения (рд ир^), что приводит к поляризации дифрагировав- дифрагировавшей волны. На рис. 6.44 приведена экспериментально найденная за- зависимость отношения РлУРп от длины волны дифрагировавшего света для решетки с профилированным штрихом C00 штрихов на 1 мм, т. е. d « 3 мкм). Мы видим, что при Я > 1 мкм отношение pj/рц резко воз- возрастает, т. е. решетка начинает работать как поляризатор. Величину эффекта можно изменять, варьируя форму штриха решетки. Очень тонкими опытами было доказано, что при создании на дне штриха плоской площадки шириной от d/ё др d/З ддя обеих компонент напря- напряженности электрического поля (£j и Е±) условия отражения стано- становятся примерно одинаковыми и отношение Рх/рц мало отличается от единицы. § 6.6. ДИФРАКЦИЯ ЧАСТИЧНО КОГЕРЕНТНОГО СВЕТА В § 6.3, 6.4 была описана дифракция на заданном отверстии или правильной системе отверстий плоской монохроматической волны. Теперь нужно выяснить, какова видимость дифракционной картины, создаваемой квазимонохроматической волной. Решим эту задачу на примере дифракции на двух отверстиях. В этом случае можно восполь- воспользоваться соотношениями, относящимися к интерференции двух пуч- пучков, и наглядно представить результаты. Фактически здесь будут рассмотрены различные варианты извест- известного опыта Юнга, о котором неоднократно упоминалось ранее. Поня- Понятие частично когерентного света позволит оценить допустимые угло- угловые размеры источника света, освещающего два отверстия, и выяснить, как зависят эти размеры от расстояния между ними. Мы увидим, по- почему такой на первый взгляд простой опыт следует описывать с исполь- использованием представлений и об интерференции, и о дифракции частично когерентного света. Итак, вспомним, что происходит при дифракции света на двух отверстиях в непрозрачном экране. Как было показано выше, интер- интерференция дифрагировавших пучков приведет к появлению дополни- дополнительных максимумов. При выполнении условия dsincp = trik, где т = 0, ± 1, ± 2, ..., возникают главные максимумы. При dsincp = А/2, ЗЯ/2, 5 Я/2, ... образуются минимумы, расположенные между указанными главными максимумами. Если на структуру падает плоская монохроматическая волна, то интенсивность света в этих ми- минимумах равна нулю, а видимость дифракционной картины окажется равной единице, т. е. У ^макс—*мин. 1 Соотношение между интенсивностями главных максимумов опре- определяется формой отверстий. Если плоская волна дифрагирует на двух длинных параллельных щелях одинаковой ширины Ь9 то распределе- распределение интенсивности главных максимумов будет подчиняться закону /ф ~ (sin и/иI, где и » (пЫХ) sin <p. 248
На рис. C.45 показано распределение интенсивности при дифрак- дифракции плоской монохроматической волны на двух параллельных щелях шириной Ь. Если дифракция приходит на двух круглых отверстиях радиуса а, то интенсивность главнйх максимумов будет изменяться по закону /ф — [2 Jt (и)/и]2, где /х (и) — функция Бесселя первого по- порядка, а и = Bп/Х) asm <p. При освещении двух отверстий излучением протяженного источни- источника света видимость дифракционной картины ухудшится. Это будет диф- дифракция частично когерентного света @< V < 1), описанию которой и посвящено последующее изложение. Пользуясь введенными ранее терминами, укажем, что в данном случае изучается пространственная когерентность. Прежде чем перейти к такому рас- рассмотрению, вспомним выражение E.10) для суммарной освещенности, создаваемой в некоторой точке Р из- излучением двух источников, располо- расположенных в точках Ог и О2: ТУ 2Re//1(P)/2(P)Yl2(A/). Рис. 6.45. Распределение интенсив- интенсивности при дифракции монохрома- монохроматической волны на двух щелях Здесь 1г (Р) и /2 (Р) — интенсивности света от каждого из источников; Yi2 (АО — комплексная степень когерентности для обоих источников; А* = (га— гх)/с, где (г2— гг) — разность хода О2Р — ОгР двух интер- интерферирующих волн. Для простоты считается, что обе волны распро- распространяются в среде с показателем преломления п = 1. Если пФ 1, то вместо \г2 — гг\ следует ввести оптическую разность хода, что спра- справедливо для любой среды (без учета ее дисперсии). Запишем соотношение E.10), вводя в явной форме модуль и аргу- аргумент комплексной степени когерентности: где (АО = |Yi2 (AOIexp {i [a12 (АО - 2 a12 (АО = 2 nvM + arg v12 (At). F.57) F.58) В дальнейшем необходимо учитывать немонохроматичность излу- излучения, используемого для тех или иных интерференционных опытов. В соотношениях F.57) и F.58) v = с/1 означает среднюю (или цент- центральную) частоту, соответствующую максимуму излучения. Очевидно, что 2nvAt = -£ cAt = Y" (r2 — >i) равно разности фаз б и можно в явном виде записать зависимость суммарной интенсивности от б, ко- которая просто определяется в эксперименте. Переходя к тригонометрическим функциям, запишем E.10) в сле- следующей форме: /(Р)=1г(Р) + /2(Р) + 2 Vh(P)h(P)I Yi2(АОI cos [an(At)-б]. F.59) 249
Если |Yi2 (AOI = 1, to интенсивность в точке Р окажется такой же, как и при интерференции двух строго монохроматических волн час- частоты v" с разностью фаз между колебаниями в точках Ох и О2, равной а12 (At). В этом случае можно считать колебания в точках Ог и О2 коге- когерентными, но с соответствующим запаздыванием по фазе одного коле- колебания относительно другого. При | Vi2 (ДО I = 0 интерференционный член обращается в нуль, т. е. колебания в точках Ог и О2 иекогерентны. Если 0 < | у12 (At) \ <. 1, то колебания считаются частично когерентными, т. е. происходит ин- интерференция квазимонохроматических волн. Последний случай будет больше всего интересовать нас при дальнейшем рассмотрении. В случае квазимонохроматического света интерференционный член не равен нулю; а12 (At) и |Yi2 (Л01> зависящие от At = (г2 — гхIс, изменяются относительно медленно. На экране наблюдается не- некоторая стационарная интерференционная картина, соответствующая синусоидальному распределению с почти постоянной амплитудой 2V7x (Р) /2 (Р) \у12 (АО |, накладывающемуся на постоянный фон /i (Р) + /. (Р). Часто можно положить 1г (P)=I2 (P). Такое предположение спра- справедливо, если пренебречь изменением амплитуд колебаний двух иден- идентичных источников при малой разности хода | г2 — гг |; тогда * макет'мин Мы получили ранее это важное соотношение E.16), позволяющее сопоставить экспериментальные или расчетные данные о видимости интерференционной картины с оценкой степени когерентности двух интерферирующих пучков света. Вспоминая рис. 5.5, на котором сопоставлены результаты интер- интерференции двух монохроматических и двух квазимонохроматических волн, можно оценить, как видоизменится при использовании частично когерентного света картина дифракции на двух щелях (V = 1), пред- представленная на рис. 6.45. Очевидно, что если V<. 1, то максимумы будут по величине меньше, а минимумы отличны от нуля (рис. 6.46). Приводи- Приводимые ниже расчеты должны подтвердить справедливость этого качест- качественного рассмотрения. Соотношение F.59) дает некоторую дополнительную информацию об исследуемых источниках света. Действительно, запишем условие максимума функции / (Р) cos [<х12 (Л/) — б] = 1 F.60) в виде X (Г2 - гг) - а12 (АО = 2 тя, F.61) где т == 0, ± 1, ± 2, ... Выражение F.61) отличается от условия B п/К) (г2 — гг) = 2 тл> полученного ранее для двух синфазных ис- источников монохроматических волн. Наличие ап (At) Ф 0 и вытекаю- 25Q
Щее отсюда условие F.61) можно истолковать как запаздывание пб фазе излучения одного из источников по отношению к другому. Такое запаздывание по фазе неизбежно должно привести к сдвигу интерферен- интерференционных полос относительно полос, возникающих при интерференции синфазных монохроматических источников. Этот сдвиг легко оценить. Для конкретности рассуждений рассмотрим схему опыта Юнга, показанную на рис. 6.47. Пусть источником света служит однородный длинный излучатель (самосветящаяся щель) шириной 2а, располо- расположенный симметрично относительно Рг и Р2 на расстоянии Dx. Обозна- Обозначим через D расстояние между экранами А и 5, РгР2 = d\ тогда ши- ширина интерференционной полосы для монохроматического излучения Рис. 6.46. Распределение интенсивности при дифракции квазимонохроматической волны на двух щелях Рис. 6.47. Схема опыта Юнга с длиной волны Я равна 8h = DX/d (см. § 5.1). Но смещение на одну полосу соответствует изменению разности фаз на 2я. Следовательно, наличие а12 (At) в условии F.61) должно привести к сдвигу интерфе- интерференционных полос на расстояние х = j-j ai2(^0 относительно полос, создаваемых двумя синфазными монохроматическими источни- источниками. Измерение этого сдвига в принципе позволяет оценить а12 (At). Итак, видимость интерференционных полос определяет модуль комплексной степени когерентности | у12 (At) |, а положение полос непо- непосредственно связано с аргументом этой функции. Заметим, что для интерференции при очень малой разности хода соотношение F.59) можно записать в несколько иной форме. Допустим, что разность хода \г2 — гг\ значительно меньше длины когерентности \r2-r1\=cAt<cxK0T. F.62) Следовательно, At <^ тког и ввиду медленного изменения у12 при малых А* интенсивность света в точке Р I (Р)=1± (Р) + /2 (Р) + 2 Vh (Р) /«(Р) I Yi2 @) | cos [a12 @) -6]. F,63) Перейдем к исследованию дифракции на двух отверстиях Рг и Р2 в непрозрачном экране при освещении их протяженным некогерентным источником света. 251
Иитейсивйос?ь ё произёольйой точке Р ни экране В задается выра- выражением F.63), для определения которой прежде всего нужно знать величину |Yi2 @)|. Для нахождения модуля комплексной степени ко- когерентности следует воспользоваться теоремой Цернике*. В этой тео- теореме доказывается, что комплексная степень когерентности колебаний в точках Рг и Р2 пропорциональна амплитуде напряженности поля в точке Рх дифракционной картины с центром в Р2, создаваемой пло- плоской волной на отверстии в непрозрачном экране, которое точно сов- совпадает с исследуемым источником (рис. 6.48). Применяя теорему Цер- Цернике, нужно оценить амплитуду напряженности поля при дифракции плоской волны на щели шириной 2а, сле- следовательно (полагая, что Dx >> d), -U Рис. 6.48. Построение, пояс- поясняющее применение теоремы Цернике 2а% . 2nad ^ где х = -j— sin ф == 5Гп~- Заметим, что iTi2 @I можно оценить другим способом — менее общим, но органично связанным с проведенным ранее выводом. В § 5.4 мы находили функцию видимости для самосве- самосветящейся щели, исследуя наложение пучков света, образовавшихся при раздвоении ис- исходного светового потока в результате от- отражения от двух параллельных зеркал (см. рис. 5.17 и 5.20). Два отверстия Рг и Р2 в непрозрачном экране А также делят на два пучка световой поток, исходящий из щели S (см. рис. 6.47). Эти два пучка затем соединяются в точке Р, и в силу пространственной когерентности такой системы на экране В возникает интерференционная картина. Если для обеих установок апертура 2о интерференции одинакова, то для определения видимости интерференционной картины на экране J5, получившейся в результате взаимодействия пучков света от отверстий Рх и Р2> мож" но воспользоваться формулой E.35), полученной для щелевого некоге- некогерентного источника света. Мы имели V = | sin x/x\, где параметр х определялся отношением ширины щели 2а к ширине интерференцион- интерференционной полосы 8h = XDx/d. Тогда х = 2 nadl (KD^ и для видимости ин- интерференционной картины получаем у 1 sin [2nadl(kDi)] I I 2nad/(%D1) I F.65) В данном случае V = |Yi2 @)|- Следовательно, соотношение F.65) дает выражение для модуля комплексной степени когерентности, ко- которое, конечно, совпадает с F.64). График этой функции представлен на рис. 5.20, и, хотя обозначения, принятые здесь и на рисунке, не- неодинаковы, этим графиком можно воспользоваться для решения постав- * Вывод и обсуждение теоремы Цернике см. в кн. Франсон М., Слан- ский С. Когерентность в оптике. М., «Наука», 1968. 252
ленной задачи. При очень малом расстоянии d между отверстиями Рх и Р2 видимость интерференционной картины близка к единице. Затем она спадает до нуля [при d = XDX/ Ba)] и снова возрастает, оставаясь, однако, значительно меньше единицы. Пользуясь этим графиком, легко оценить отношение 2 alDx = 2 а, при котором види- видимость V для данных значений d и % будет не меньше какого-то наперед заданного числа в интервале 0< V<. 1. Так, например, ранее мы получили условие наблюдения интерференции от протяженного ис- источника [см. E.36)], потребовав, чтобы видимость V ^ 2/3. Это дости- достигалось при х ^ 1/2. Если для видимости полос в опыте Юнга исходить из того же условия (V^2/3), то отношение 2 na/Dx = 2яа должно быть меньше АУ Bd). Нетрудно заметить, что 2а = 2a/Dx — это тот угол, под которым видна самосветящаяся щель шириной 2а из отверстия Рх или Pt. Вводя эту величину в формулу F.65), получаем окончательное выра- выражение для модуля комплексной степени когерентности (видимости интерференционной картины): Соотношение F.66) удобно для оценки допустимых угловых раз- размеров в опыте Юнга и будет использовано нами ниже. Для нахождения 1Х (Р) и /2 (Р) в F.63) нужно задаться формой отверстий Рх и Р2- Пусть эти отверстия в экране А представляют собой две щели одинаковой шириной 6, параллельные щелевому источнику S и расположенные симметрично относительно него. Тогда, используя соотношение F.36), описывающее распределение освещенности при дифракции плоской волны на щели шириной 6, имеем* \ F.67) Это выражение преобразуется к более симметричному виду, если ввести следующие обозначения: 2 р = b/D Bp — это угол, под кото- которым видна каждая щель из точки Р) и г « D sin q> — расстояние точки Р от оси симметрии (см. рис. 6.47). Тогда интенсивность, созда- создаваемая каждым из пучков в точке Р, выразится формулой F>68) В этих же обозначениях для разности фаз б между двумя интер- интерферирующими пучками получим = — d SID 4,= —=:—. F.69) ♦ Обычно представляет интерес распределение освещенности на экране, и в последующем изложении константу /0 будем считать равной единице. 253
Очевидно, что сс; = d/D — это угол, под которым видна система двух щелей из точки Р. Для того чтобы было законным использование формул § 6.3, несколько видоизменим схему опыта (рис. 6.49): между источником (щелью) 5 и экраном А введем линзу Ьг так, чтобы щель S находилась в ее главном фокусе. Линза L2 (с тем же фокусным расстоя- расстоянием F, чтб и L±) установлена так, что ее главная фокальная плос- плоскость совпадает с плоскостью экрана В. Непрозрачный экран А с двумя параллельными щелями расположим между линзами LL и L2. it ! У*«—-—*4 Тогда выполняются все условия для наблюдения дифракции Фраун- гофера. При такой геометрии опы- опыта в выражениях, определяющих Рис. 6.49. Модификация опыта Юнга, удовлетворяющая условиям дифрак- дифракции плоских волн углы а, р и а , нужно заменить Dx и D на F. Окончательное «выражение для распределения освещенности при дифракции квазимонохроматической волны, излучаемой щелевым ис- источником света S, примет вид / /т _о Г sin Bф A) I» J 1 + sin |cos[a12@)— 2naz/X]\. F.70) Благодаря симметрии самосветящейся щели S относительно отвер- отверстий Рг и Р2 из теоремы Цернике следует, что yi2 @) — вещественная величина, т. е. нужно, согласно формуле F.63), потребовать, чтобы F.71) Совершенно аналогично можно провести расчет освещенности диф- ракционной картины на экране В при освещении некогерентным круг- круглым источником S двух одинаковых круглых отверстий в непрозрач- непрозрачном экране А. Введем следующие обозначения: р — радиус некоге- некогерентного излучателя; d — расстояние между отверстиями в экране А\ а — радиус круглого отверстия; R — главное фокусное расстояние линз Lx и L2. Фактически можно воспользоваться уже полученным выражением F.70), заменив в нем функцию (sin u/uJ> характеризующую дифрак- дифракцию на щели, функцией Бесселя [2 Jx (u)/u]2, описывающей дифракцию плоской волны на круглом отверстии. По смыслу теоремы Цернике для определения \у12 @)| потребуется заменить (sin х/х\ на |2 Jx (v)/v\, где v = 2 npd/(XR). Тогда для зависимости интенсивности света, дифрагировавшего под углом ф, от расстояния d между отверстиями в экране, на которые 254
падает квазимонохроматическая волна, получим / (фэ d) - 2 [2 Л (и)/и]2 {l + \2J1 (v)/v\ cos [a12 @) — С «ю]>, F.72) где и = BлЛ) a sin <р, у = 2 Jtpd/ (Я#) и константа С = Я/?/ B яра). Для фазы а12 @) справедливы соотношения а12 @) = 0, если 2 Л (u)/t/ > 0, и а12 @) = я, если 2 /2 (i;)/i; < 0. 3 2 1 0 1 2 3 0,8 см 3 2 / 0 1 2 3 4-1Г (B)d4cM \\ 4 J 2 / 0 1 2 3 4V (A)d '0,6 CM \Ут\ '0,593'. oc^O Рис. 6.50. Дифракция частично когерентного света на двух круглых отверстиях: а •— наблюдаемые в «дифрактометре» картины; б — теоретические кривые интенсивности. Средняя длина волны Л=*5790 А; р=0,009 см; 2tf=0,14 см; /?=152 см Соотношение F.72) примерно соответствует результату для диф- дифракции на двух круглых отверстиях, освещаемых некогерентным круг- круглым источником, приведенному в книге Борна и Вольфа «Основы оптики», откуда мы заимствовали интересные фотографии интерферен- интерференционных картин (рис. 6.50,а), полученные на приборе подобного ро- рода (дифрактометре). Фотографии Л, Б, В соответствуют различным значениям расстояния d и показывают изменение видимости интерфе- интерференционных картин. Внизу (рис. 6.50,6) приведены расчетные кривые распределения интенсивности для указанных значений d (тех же, что и на фотографиях). На рис. 6.51 приведена зависимость модуля степени когерентности|уг2 @)| от расстояния^ (при неизменных раз- размерах излучателя), причем буквами Л, Б, В, Г, Д, Е показаны шесть положений, которые частично проиллюстрированы на фотогра- фотографиях на рис. 6.50. Рассматривая эти фотографии и соответствующие им распределе- распределения интенсивности, мы замечаем, как ухудшается видимость дифрак- 255
ционной картины по мере увеличения расстояния d между отверстиями в непрозрачном экране (переход от фотографии А к В). При дальней- дальнейшем увеличении йот Г к Д (см. рис. 6.51) видимость снова возрас- возрастает, оставаясь, однако, меньшей, чем в Л, Б, В. Затем видимость вторично уменьшается почти до нуля, что полно- полностью согласуется с графиком функции \2J1(v)/v\, где v = 2npd/ (XR). Оче- Очевидно, что такое же изменение види- видимости дифракционной картины полу- получается при неизменном d и увеличении радиуса р исходного круглого излуча- излучателя. Интересно также показанное на рис. 6.51 изменение фазы а12. Если на кривых Л, Б, В максимальную интен- интенсивность имеют полосы, находящиеся в центре дифракционной картины, то согласно значению а12 @) = п интен- интенсивность в центре кривой Д должна быть минимальна. Для кривой Е снова а12 = 0 и в центре мало- малоконтрастной картины должен наблю- наблюдаться максимум. Такой дифрактометр пригоден для решения различных задач. Нетрудно исследовалась (с применением новых по- Рис. 6.51. Зависимость степени когерентности двух пучков ча- частично когерентного света от расстояния d между двумя круглыми отверстиями дифрак- тометра заметить, что фактически нятий и терминов) идея известного двухлучевого интерферометра Рэлея, который еще в начале нашего столетия использовался Май- кельсоном для измерения угловых размеров небесных светил. § 6.7. РАЗЛОЖЕНИЕ ИЗЛУЧЕНИЯ В СПЕКТР И ОСНОВНЫЕ СВОЙСТВА СПЕКТРАЛЬНЫХ ПРИБОРОВ В предшествующем изложении использовалась возможность экс- экспериментального разложения произвольного излучения на сумму мо- монохроматических волн, т. е. получение его спектра. Однако не огова- оговаривалось, сколь законна такая операция и как ее нужно осуществлять. Теперь, после рассмотрения законов дифракции световых волн, можно исследовать эту проблему более строго. В экспериментах по получению спектров обычно используют приз- призму или дифракционную решетку. Хорошо известно, что, создав при- примерно 150 лет назад первые дифракционные решетки, Фраунгофер сразу же применил их для изучения спектров различных источников света; в частности, он заметил линии поглощения в сплошном спектре Солнца (линии Фраунгофера). Еще раньше был осуществлен класси- классический опыт Ньютона, впервые разложившего призмой солнечный луч. И по сей день призмы и дифракционные решетки играют основную 256
роль при создании спектральных приборов. Эти диспергирующие эле- элементы обеспечивают разложение излучения по длинам волн. Кроме диспергирующего элемента спектральный прибор должен содержать какую-то фокусирующую оптику, позволяющую создавать четкое изображение входной щели в свете исследуемой длины волны (спсыральную линию). Полученный спектр фотографируется на фото- фотопластинку или пленку. Этот прибор называют спектрографом. Излу- Излучение определенного интервала длин волн можно вывести через выход- выходную щель. Так работает монохроматор. Принципиальная схема простейшего спектрального прибора при- приведена на рис. 6.52. В главном фокусе коллиматорного объектива Lx по- помещена входная щель Ь. При про- прохождении излучения через такую систему образуется плоская волна, падающая на диспергирующий эле- элемент. Второй (камерный) объектив L2 фокусирует излучение разных длин волн (спектральных линий) в определенных точках фотопла- фотопластинки. Не будем заниматься детальным анализом ЭТОЙ оптической схемы. Рис 6 52. Упрощенная схема спек- Подробный расчет даже столь про- трального прибора стого прибора представляет собой трудоемкую задачу. Кроме того, подобная система отнюдь не является единственно возможной* и приведена лишь для конкретизации изуче- изучения основных свойств спектральных приборов. Прежде всего нужно в самой общей форме решить следующие прин- принципиальные вопросы: является ли разложение произвольного излуче- излучения по длинам волн единственным и в какой степени свойства спект- спектрального прибора могут влиять на характер получаемого спектра? При ответе на первый вопрос целесообразно провести сравнение экспериментального способа разложения излучения на сумму монохро- монохроматических волн и известной математической операции получения спектра произвольной функции F {t) — операции, законность кото- которой обоснована теоремой Фурье. Согласно теореме Фурье, любую периодическую функцию F (t) можно заменить конечной или бесконечной суммой гармонических функций вида )=% Cncos(«>nt-an). F.73) * Заметим, что интерференционный фильтр (см. гл. V) позволяет выделить из исследуемого спектра узкую группу волн, и, следовательно, также служит монохроматором. Физические принципы его действия и техническое решение совершенно отличны от данного случая. 9 Зак. 1729 357
Кроме того, эта теорема дает рецепт вычисления коэффициентов и ут- утверждает, что п— 1 Отсюда следует, что если известны амплитуды Съ С2, С3, ... монохро- монохроматических колебаний с частотами %, оз2, со3, ..., то, сложив квадраты амплитуд, можно с определенной точностью найти среднее значение функции F2 (t). Такой же результат получается при проведении опыта по разложению произвольного электро- электромагнитного излучения на монохромати- монохроматические волны. Для сопоставления эксперименталь- ного (физического) и математического разложения функции F(t) на составляю- щие рассмотрим наиболее простой слу- ча**' К0ГДа исследуемая функция состоит из нескольких периодических функций ^ (например, трех) монохроматических wt сиг (о3 и> волн с частотами соь со2 и со3. д) На рис. 6.53, а показаны (в произволь- произвольном масштабе) квадраты амплитуд Cf, Рис. 6.53. Спектр исследуемого С\ и С\. Сложив их, получим точное излучения (а) и распределение значение <С F2 (t) > ♦ сто?а^наВеХоТеТп^ Проанализируем теперь возможность го прибора (б): экспериментального исследования излу- бю —ширина аппаратной функции ЧеНИЯ, СОСТОЯЩЕГО ИЗ Трех МОНОХрОМа- тических волн: настроим монохроматор поочередно на частоты colf co2 и (о3. Эта операция условно отражена на рис. 6.53, б, где изображено распределение энергии светового по- потока по частотам. Неизбежное искажение сигнала, вносимое всеми составными частями спектрального прибора, характеризуется аппа- аппаратной функцией, которая показывает, каков результат измерения частоты монохроматического излучения, поданного на вход спект- спектрального прибора. Очевидно, что вид аппаратной функции будет за- зависеть от свойств спектрального прибора, которые нам еще предстоит исследовать. Для простоты и наглядности рассуждений будем считать, .что раз- разность между (Oj и со2 (а также между со2 и со3) значительно превышает ширину аппаратной функции бш. Тогда измерение интенсивности света на одной частоте не приведет к искажению измерений на другой час- частоте и мы зарегистрируем три максимума. Пусть приемник света в ис- исследуемом интервале частот малоселективен, а поглощение радиации в самом приборе неселективно. Тогда отношение квадратов амплитуд (или отношение площадей под тремя пиками на спектрограмме) будет равно отношению С\: С\ : С|. Если преодолеть трудности с ка- калибровкой прибора, всегда сопутствующие абсолютным измерениям, 258
го сумма указанных площадей определит среднее значение исследуе- исследуемой функции. Следовательно, можно считать, что спектральный прибор, выделив синусоидальные составляющие из исследуемого излучения, как бы провел экспериментальное разложение заданной функции в ряд Фурье. Математическая операция получения спектра функции F (t) и физический эксперимент, заключающийся в разложении электромаг- электромагнитной волны на составляющие, привели к одинаковым результатам и, по-видимому, близки по количеству получаемой информации об ис- исследуемом излучении. Такое же сравнение математического и физи- физического спектров можно провести и в более сложном случае, когда изучаемая функция не является суммой гармонических колебаний, хотя отличная от нуля ширина аппаратной функции усложняет интер- интерпретацию эксперимента и приводит к дополнительным трудностям, которые здесь не рассмотрены. При сравнении математического и физического способов получения спектра произвольной периодической функции возникает следующая интересная проблема: хорошо известно, что разложение функции F (t) можно проводить не в ряд Фурье, а каким-нибудь другим способом с ис- использованием более сложных функций. С точки зрения математика эти два разложения будут эквивалентны, если в обоих случаях выпол- выполнены соответствующие условия сходимости рядов. Физик же всегда оказывает явное предпочтение разложению по гармоническим состав- ющим, исходя из его физической целесообразности*. Действительно, все применяемые на практике приемники света оп- оптимально реагируют на поток излучения, зависящий от времени по за- закону sin2 at. В процессе измерения исследуемый сигнал усредняется, если нужно усиливается, и показания устройства, регистрирующего сигнал на выходе прибора, пропорциональны квадрату амплитуды на- напряженности электрического поля, создаваемого данной монохромати- монохроматической волной. Задача разложения в спектр произвольной непериодической функ- функции F (t) математически решается представлением ее в виде интеграла Фурье, что законно при выполнении некоторых условий, которые были сформулированы ранее**. Физически эта операция получения непрерыв- непрерывной суммы бесконечно большого числа синусоидальных компонент сводится к регистрации спектральным прибором сплошного спектра. Для уяснения природы сплошного спектра предположим, что каким-либо образом удалось осуществить очень короткий световой им- импульс. Как уже указывалось, ему нельзя приписать точно определенную * Рассматриваемые сложлые вопросы разложения произвольного излу- излучения в спектр изложены в неоднократно цитировавшейся книге Горели- Горелика Г. С. «Колебания и волны». С захватывающим интересом читается дис- дискуссия нескольких студентов и преподавателя о современном значении опыта Ньютона, а необходимость прагматического подхода при выборе способа разло- разложения спектра доказана остроумным сравнением отношения математика и вя- вязальщицы к выбору оптимального соотношения между числом пальцев в каждой паре перчаток. Если для математика эквивалентны распределения 5 + 5 и, например, 3 + 7, то вязальщица отнюдь не свободна в этом выборе ** См. §5.1. 9* 259
длину волны. Отсюда следует, что при падении такого импульса пк дифракционную решетку при произвольном угле ф дифракции всегда можно зарегистрировать какой-то сшнал, когорого не было в случае, когда исследовалась одна или несколько монохроматических волн. Точно такая же картина — наличие сигнала при любом угле наблюде- наблюдения—возникает при освещении дифракционной решетки естественным (белым) светом. Заметим, однако, что полученной таким образом ин- информации недостаточно, чтобы решить вопрос о механизме возникнове- возникновения сплошного спектра (ответствен ли за излучение каждый электрон или происходят какие-то взаимодействия), — это задача совсем другого плана. Следует отметить, что во всех приведенных выше рассуждениях го- говорилось о законности физического разложения произвольной фун- функции F (t) в ряд или интеграл Фурье, а не решалась задача ее построе- построения (редукции) по монохроматическим составляющим. Эти две опера- операции не эквивалентны. Построение F(t) затруднено тем, что разложение позволяет установить лишь амплитуды гармонических колебаний, но не их начальные фазы. Это обстоятельство необходимо учитывать при формулировке полученных таким способом результатов. Так, например, нельзя утверждать, что белый свет возникает из семи цветов, хотя раз- разложение солнечного света в сплошной спектр мог наблюдать каждый, кто когда-либо любовался цветами радуги. Сказанного достаточно, чтобы стала ясной необходимость конкрет- конкретного изучения свойств спектрального прибора, используемого для разложения заданного излучения на монохроматические волны. Оче- Очевидно, что любой прибор не только выделяет периодические составляю- составляющие, но и как бы преобразует их, что можно описать при посредстве его аппаратной функции. Для математического описания такого преобра- преобразования обычно используют так называемую свертку, устанавливая связь между суммой произведений аппаратной функции на истинный контур линии и наблюдаемым на опыте распределением по частотам энергии светового потока в пределах исследуемой спектральной линии. Общий вид используемого при этом интегрального уравнения приведен в § 6.9 [см. F.111)], где рассматривается аналогичная задача — иссле- исследование качества изображения оптических инструментов. В некоторых случаях удается исключить влияние прибора, т. е. выявить истинный контур спектральной линии. При этом считается, что спектральный прибор, вообще говоря, не может разделить излучение на двух длинах волн, находящихся в пределах его аппаратной функции. При решении этих трудных задач необходим тщательный выбор параметров спект- спектрального прибора, к рассмотрению которых мы и переходим. 1. Исследуем, на какой угол бф будут разведены диспергирующим элементом два пучка света с длинами волн К± и %2 (\К — k2\ = 8%). Очевидно, что интересующая нас функция, называемая дисперсией, будет характеризоваться производной от угла по длине волны. Опре- Определив таким образом понятие дисперсии Жв1х ' {6J5) 260
найдем ее для основных диспергирующих элементов и укажем, как его можно использовать при различных спектральных измерениях. При оценке дисперсии дифракционной решетки будем исходить из условия возникновения главных максимумов d sin <р = тК. Дифферен- Дифференцируя, получаем d cos ф d cp = mdX, или т dX d cos ф F.76) Проанализируем полученное выражение. Для малых углов диф- дифракции cos ф » 1 и можно считать, что 3) та mid. F.77) Это приближенное выражение удобно для оценок, но при точном определении длины волны исследуемой линии относительно какого- либо репера его следует заменить точным выражением (G.76). Дисперсия дифракционной решетки тем больше, чем меньше d — расстояние между двумя соседними штрихами. Для увеличения дис- дисперсии нужно чаще наносить штрихи. Этим объясняется практикующе- практикующееся за последние годы использование решеток с очень большим числом штрихов на единицу длины A200, 1800 и даже 2400 штрихов на 1 мм) Рис. 6.54 показывает, как возрастает дисперсия спектро- спектрографа при замене решетки с 600 штрихами на 1 мм на ре- решетку с вдвое большим их числом на 1 мм. Заметим, что при оценке дисперсии важно именно чис- число штрихов на единицу длины _ ссл п . . (Nlt\ а не их обшее число N -Рис' 6*54* Сложная структура, сфотографи- \i\ii), <х не ил ишцсс чииии iv. рованная в первом порядке на большом ди- ВЫГОДНО работать В ВЫСО- фракционном спектрографе с решеткой, име- КИХ порядках дифракции, так ющей 600 штрихов на 1 мм (а), и с решет- как 2) ~ т, НО При ЭТОМ не кой> имеющей 1200 штрихов на 1 мм (б) следует забывать, что наи- наибольший возможный порядок дифракции для данной решетки опреде- определяется длиной волны исследуемого излучения; в самом деле, как уже указывалось, т = (d/X) sin <р, и поскольку sin ф ^ 1, то т не должно превышать dl%. Так, например, для решетки, имеющей 1200 штрихов на 1 мм, d = 8 • 10~б см и при ее освещении красным светом (Я « 6,5 • 10" см) можно вести наблюдение лишь в первом порядке. Использование такой решетки даже в близкой инфракрас- инфракрасной области (Я « 1 мкм) уже невозможно. При исследованиях в короткой ультрафиолетовой области выгодно работать с очень малой величиной d. В этом случае существует относи- относительно простой способ эффективного увеличения дисперсии, заклю- заключающийся в использовании наклонного падения света на решетку. При наклонном падении света условие образования главных максиму- 261
мов для пропускающей решетки, как известно (см. рис. 6.35), имеет вид d (sin (p — sin G) = тЯ, или 2d cos - -=тЯ, где 9—угол между направлениями пучка и нормали к решетке, а роль угла дифракции играет угол (<р — Э). Если d^>X, то углы дифракции невелики и можно считать ^эф ^ d cos Э. При исследованиях в далекой ультрафиолетовой области (X ^ 100 А, что примерно соответствует границе мягких рентгеновских лучей) часто при- применяют скользящее падение излучения на поверхность дифракционной решет- решетки. Тогда 0 -> я/2 и йЭф <С d. В данном случае получаются достаточно большие отраженные потоки световой энергии, что очень важно, так как чувствитель- чувствительность приемников света в этой области весьма мала. Оценим теперь дисперсию призмы. Расчет проводится для наиболее просто- простого и обычно используемого на практике случая симметричной установки призмы (рис. 6.55). Нетрудно видеть, что при этом угол ф0 характеризующий изменение направления луча после преломления его в призме, минимален (т. е. призма устанавли- устанавливается под углом наименьшего отклонения) и внутри призмы пучок света распространяется параллельно ее основанию. Если обозначить через А преломляющий угол призмы, то из условия п = sin cp/sin q>2 = = sin cp^/sin q/ легко получается формула n= 8ш[(Л+Фо)/2] sin (Л/2) Рис. 6 55. К определению дис- дисперсии призмы при ее сим- симметричной установке F.78) часто применяющаяся при измерении показателя преломления. При учете зависимости показателя преломления материала призмы (стек- (стекла) от длины волны падающего на нее света получается следующее выражение для дисперсии призмы: dX dn dX Величину dn/dX называют дисперсией вещества (дисперсия стекла). Она [вместе с п(Х)] характеризует основные свойства материала, из которого изготовлена призма. Дифференцируя F.78), можно опреде- определить другой сомножитель в выражении F.79). В самом деле, dn <icp0 со8[(Л+фо)/2] sin (Л/2) F.80) 262
и, значит, <g_ 2 sin (Л/2) dn _ 2 sin (Л/2) dn cos[04+q>0)/2] dX У I— n*sin* (Л/2) * dX Таким образом, при заданной геометрии (угол А обычно составляет примерно 60°, так как при больших углах для некоторых длин волн уже наступает полное внутреннее отражение на второй грани призмы) дисперсия призмы целиком определяется значениями п и dnldX. Оче- Очевидно, что выгодно использовать оптические материалы с большими значениями этих величин. Так как для всех прозрачных веществ пока- показатель преломления увеличивается с уменьшением длины волны (т. е. имеет место нормальная дисперсия), то использование призмы в качестве диспергирующего элемента наиболее выгодно именно в коротковолновой области спектра. Так, например, для синих и фио- фиолетовых лучей дисперсия призмы сравнима с дисперсией обычной диф- дифракционной решетки, но заметно уступает ей в длинноволновой части видимого спектра. Правда, тяжелые сорта стекла (флинты) с наиболь- наибольшими значениями показателя преломления очень сильно поглощают фиолетовые лучи и для исследования в этой пограничной с ультрафио- ультрафиолетом области часто используют более прозрачное легкое стекло (крон), у которого п и dnldX значительно меньше, чем у флинта (см. рис. 6.71). Для ультрафиолетового излучения стекло непрозрачно и призмы (а также всю остальную оптику спектрального прибора) обычно изго- изготовляют изокварца. Дисперсия кварцевой призмы для коротких волн (Я « 2500 А) достаточно велика (она сравнима с дисперсией средней решетки), но при дальнейшем продвижении в ультрафиолетовую об- область прозрачность кварца заметно уменьшается. Для излучения с дли- длиной волны X < 2000 А он уже становится полностью непрозрачным. Из приведенного выше рассмотрения следует, что, сравнивая дис- дисперсию призмы и дифракционной решетки, нужно учитывать, что пер- первая сильно зависит от длины волны излучения, тогда как дисперсию решетки с достаточно хорошим приближением можно считать постоян- постоянной во всем оптическом диапазоне. Полезно также помнить, что призма наиболее сильно отклоняет фиолетовые лучи, а решетка — красные. Поэтому, исследуя сложные явления природы, иногда можно устано- установить, какой именно процесс (дифракция на мелких частичках или пре- преломление световых волн) ответствен за данное явление. Так, напри- например, венцы вокруг Солнца представляют дифракционные явления — их внешний край красного цвета, тогда как гало (светлые круги вокруг Солнца) возникают в результате преломления световых лучей на кри- кристаллах льда в атмосфере. Однако далеко не всегда удается столь четко разделять эти два явления, примером чему служит радуга, детальное объяснение которой весьма сложно. Оценим дисперсию интерферометра Фабри — Перо, так как он чаще всего используется для разложения сложной спектральной линии на ее компоненты. Для вычисления dy/dX (т. е. 25) воспользуемся получен- полученным в § 5.9 основным условием возникновения максимума интенсивно- 263
сти в проходящем свете E.68): 2 / cos ф = rriX. Дифференцируя его, получаем — 2 / sin tpdy = mdX, Jl = 2—. F.82) dX 21 sin ф Дисперсия интерферометра Фабри — Перо оказывается наиболь- наибольшей для центрального кольца, где угол отклонения ф минимален. Из- Измерения обычно производят в области второго или третьего кольца, где дисперсия достаточно велика, но не столь сильно изменяется, как в центре интерференционной кар- картины. Внимательное исследование фор- формулы F.82) приводит к заключе- заключению, что дисперсия интерферометра не должна зависеть от его толщины (расстояния между отражающими слоями). Действительно, подстав- подставляя в F.82) значение т = = B1 cos ф)М,, получаем для диспер- дисперсии следующее выражение: г /1Г\ * Л / ч й) А X Рис. 6.56. Иллюстрация лея: а — линии не разрешены; Л 0.2L X ь критерия Рэ- б — разрешены Это свойство используется при создании сложных интерферомет- интерферометров, представляющих собой ком- комбинацию двух интерферометров Фабри — Перо разной толщины. 2. Введенное понятие дисперсии не позволяет полностью охаракте- охарактеризовать способность спектрального прибора разлагать произвольное излучение на его составляющие. Для решения этой задачи важно не только развести излучение двух близких по длине волн на возможно больший угол, но и добиться того, чтобы каждая составляющая была достаточно узкой. В качестве примера на рис. 6.56 представлены две пары максимумов различной ширины, разведенных на один и тот же угол. В одном случае (рис. 6.56, б) суммарная кривая позволяет наблю- наблюдать провал между максимумами, в другом (рис. 6.56, а) в излучении нельзя обнаружить две компоненты. Очевидно, нужно как-то охарак- охарактеризовать аппаратную функцию, определяющую уширение спектраль- спектральной линии монохроматического излучения, создаваемое диспергирую- диспергирующим элементом. Такой характеристикой служит разрешающая сила. Для количественного введения этого важнейшего понятия нужно прежде всего условиться о критерии разрешения, так как, конечно, здесь нельзя базироваться на каких-либо субъективных оценках. Критерий разрешения был введен Рэлеем, предложившим считать две спектральные линии разрешенными в том случае, когда максимум для одной длины волны %х совпадает с ближайшим минимумом для другой Я2. В этом случае (при равной интенсивности /0 исследуемых симметрич- симметричных максимумов) глубина «провала» между горбами составит 0,2 /0 (рис. 6.56, б). 264
Иногда наличие такого провала @,2 /0) в наблюдаемом результи- результирующем контуре считают критерием разрешения, который, конечно, пригоден лишь при работе с двумя излучениями равной яркости. В некоторых случаях последняя формулировка критерия разрешения оказывается единственно приемлемой, например при использовании интерферометра Фабри — Перо, где острые максимумы интенсивности разделены протяженными минимумами (см. § 5.9). Для дифракцион- дифракционных максимумов обе формулировки критерия Рэлея эквивалентны, чем мы и воспользуемся. Необходимо отметить универсальность критерия Рэлея, сформули- сформулированного выше лишь применительно к задачам спектрального разре- разрешения. Задача разделения двух максимумов возникает и при решении других задач, где не используется спектральное разложение (напри- (например, астронома интересует возможность пространственно разделить изображение двух близких небесных светил). В этом случае столь же необходимо условиться о допустимой величине провала на суммарной кривой при различных способах регистрации сигнала. В качестве исходного постулата используется тот же критерий Рэлея, определяю- определяющий разрешающую силу оптических инструментов. Конечно, любой критерий разрешения (в том числе и критерий Рэлея) следует считать условным. Фактически возможность разреше- разрешения двух близких спектральных линий лимитируется наличием шумов в источнике и приемнике света, ограничивающим точность измерения полезного сигнала. При хорошем отношении сигнал/шум можно изме- измерить провал в суммарном контуре, значительно меньший определяемо- определяемого критерием Рэлея. В § 6.9 рассмотрена принципиальная возможность разрешения изображений двух звезд в том случае, когда критерий Рэлея заведомо не соблюдается, но измерение суммарного контура и определение ап- аппаратной функции могут быть проведены с малыми ошибками. Все эти рассуждения полностью применимы и к разрешению спектральным прибором двух близких по длине волны спектральных линий. Однако вернемся к исследованию свойств спектральных приборов, при котором широко используется критерий Рэлея, и введем основное понятие разрешающей силы диспергирующего элемента. Разрешающей силой (иногда употребляют термин хроматическая разрешающая сила) называют отношение %/&Х, где 6А, — разность длин волн \%2 — ^il между двумя максимумами, для которых выпол- выполняется критерий Рэлея, а Я — средняя длина волны, соответствующая центру провала в суммарном контуре. Очевидно, что отношение Я/бЯ будет характеризовать форму возникающих максимумов, т. е. наблюдаемое в данном опыте уширение линии монохроматического из- излучения в результате действия спектрального прибора. Оценим разре- разрешающую силу основных диспергирующих элементов. При вычислении разрешающей силы дифракционной решетки бу- будем исходить из соотношений, полученных в § 6.4. Рассмотрим два мак- максимума радиации, выделенных дифракционной решеткой с числом штрихов, равным N. Максимуму излучения длины волны ^ соответст- соответствует угол дифракции фмако а максимуму излучения длины волны 265
%2 — угол фм1Кс • Условия возникновения главных максимумов т-то порядка имеют вид d sin Фмакс==^ь d sin Фмакс=/пЯ2. F.84) Легко сообразить, под каким углом будет наблюдаться первый минимум излучения порядка т для длины волны Я2. Известно, что между двумя главными максимумами монохроматического излучения располагается N — 1 минимум. Поэтому для условия возникновения первого минимума имеем Для выполнения критерия Рэлея нужно положить фмакс ~" фмин, от- откуда следует соотношение т Ях = т Я2 + KJN, или —^— =mN. Левую часть последнего соотношения можно с достаточной точно- точностью принять равной отношению Я/6Я. Тогда для разрешающей силы дифракционной решетки находим =mN. F.86) При анализе полученного результата выявляется зависимость раз- разрешающей силы дифракционной решетки от общего числа штрихов, т. е. от числа интерферирующих пучков. В § 5.9 было показано, что переход от интерференции двух волн к многолучевой интерференции приводит к концентрации излучения вблизи определенных направле- направлений и к увеличению темных промежутков между максимумами, т. е. к увеличению разрешающей силы. Соотношение F.86) выражает эту зависимость в явном виде. Важно подчеркнуть, что в отличие от дисперсии (которая зависит от числа штрихов на единицу длины решетки N11) разрешающая сила определяется общим числом штрихов N. Иными словами, чем чаще расположены штрихи дифракционной решетки, тем больше угол, на который разводятся два близких по длине волны максимума излучения, а чем больше общее число штрихов, тем они резче. Нетрудно заметить, что линии на рис. 6.54, б резче и лучше разрешены, чем на рис. 6.54, а. Это понятно, так как использовались решетки практически одинако- одинаковых размеров и общее число штрихов на них различалось примерно в 2 раза G2 000 и 144 000). Если задано число штрихов на единицу дли- длины (т. е. постоянная решетка d), то разрешающая сила будет увеличи- увеличиваться с увеличением длины рабочей области. Поэтому и стремятся изготовлять дифракционные решетки очень больших размеров (рабочая область обычно составляет 8—15 см, а в уникальных экземплярах она доходит даже до 20 см). Легко получить в явном виде зависимость разрешающей силы от длины рабочей области дифракционной решетки /, исключив параметр
т из уравнения F.86). Поскольку I = Nd, где d — постоянная решет- решетки, то, используя условие возникновения максимумов F.50), имеем F.87) Стоящая справа величина представляет собой число длин волн, укладывающихся на разности хода между крайними лучами при макси- максимальном угле дифракции (рис. 6.57). Угол фмакс определяется усло- условиями изготовления решетки (см. § 6.5) и условиями эксперимента, но он, конечно, не может превышать 90°. Рис. 6.58 иллюстрирует, сколь выгодно пользоваться достаточно большими углами фмакс- Следова- ! J J I U I X 1 я Рис. 6.57. К выводу соотноше- соотношения F.87) я Е. <Р ~ 2 макс Рис. 6.58. Зависимость разрешающей силы решетки от угла дифракции тельно, максимальная разрешающая сила решетки всегда меньше длины ее рабочей части, выраженной в длинах волн исследуемого из- излучения, т. е. F.88) макс Зависимость разрешающей силы от порядка дифракции т очевид- очевидна, но при попытках достижения большой разрешающей силы путем использования высоких порядков дифракции возникает ряд трудно- трудностей. Прежде всего следует иметь в виду, что т не должно превышать отношения d/X (мы уже рассматривали этот вопрос в связи с возмож- возможностью повышения дисперсии дифракционной решетки). Но и в тех случаях, когда d/K достаточно велико, не всегда можно использовать высокие порядки дифракционного спектра. В старых (амплитудных) ре- решетках интенсивность дифрагировавшего света изменялась по закону Im ~ 1/m2, что существенно ограничивало возможность использования высоких порядков. При работе с решеткой с профилированным штрихом максимум света заданной длины волны образуется под определенным углом. Ему будет соответствовать порядок дифракции, который можно оценить из соотношения F.56). Использовать более высокие порядки дифракции невыгодно, так как это приводит к резкому уменьшению светового потока. Можно изготовить такую решетку с профилированным штрихом, которая обеспечит значительную интенсивность в 20-м или 30-м поряд- 267
ке, но тогда придется соответственно уменьшить число штрихов на еди- единицу длины. Так работают дифракционные решетки в инфракрасной области спектра (эшелетт). В последние годы были созданы аналогич- аналогичные решетки для видимой и ультрафиолетовой областей (так называе- называемая эшель), которые с успехом используют в оригинальных спектраль- спектральных приборах*. При работе в высоких порядках дифракции неизбежно возникают и экспериментальные трудности, связанные с необходимостью отде- отделить данный порядок от соседних. Действительно, под выбранным уг- углом ф распространяется излучение не только определенной длины волны Я, но и других волн, длину которых %\ V и т. д. можно опреде- определить из очевидного соотношения d sin q> = т X = т"к' = т"Я"... Так, например, в одном и том же направлении будет распространять- распространяться излучение с длиной волны 6000 А (первый порядок), 3000 А (второй порядок), 2000 А (третий порядок) и т. д. Для разделения спектров разных порядков применяют различные приемы (используют стеклянные фильтры, селективные приемники излучения и т. д.). Сравнительно легко отделить инфракрасное излу- излучение от видимого или видимое от ультрафиолетового, но если разность длин волн, соответствующих соседним порядкам дифракции, невелика (а так будет всегда при использовании высших порядков), то прихо- приходится применять достаточно сложную схему монохроматизации излу- излучения. Поэтому здесь (аналогично трму, как делалось в многолучевой интерферометрии) целесообразно ввести понятие области свободной дисперсии АХ - Я/m, ' F.89) которая уменьшается с увеличением порядка дифракции. Разрешающая сила современных дифракционных решеток весьма велика. Она достигает 100 000—200 000. Реализовать такую разре- разрешающую силу в эксперименте достаточно сложно—необходимо распо- располагать высококачественными длиннофокусными объективами настолько большого диаметра, чтобы дифракция на их оправе не лимитировала разрешающей силы спектрального прибора. В силу тех же причин работают с очень узкими спектральными щелями, применяют спе- специальные сорта мелкозернистых фотографических пластинок и т. д. Все подобные приемы подробно обсуждены в руководствах по практи- практической спектроскопии. Мы упоминаем о них лишь для того, чтобы под- подчеркнуть, что разрешающая сила, реализуемая в эксперименте, часто оказывается значительно меньше теоретического значения, вычислен- вычисленного по приведенным выше формулам**. При некоторых исследованиях необходима еще большая разрешаю- разрешающая сила (порядка 106 и более). Как уже указывалось, в этих целях * См.: Тарасов К. И. Спектральные приборы. Л., «Машиностроение», 1968. ** Спектрограмма, приведенная на рис. 6.54, получена на спектрографе с зеркальным объективом, фокусное расстояние которого составляет примерно 4 м. На такой установке удается достичь разрешающей силы дифракционной решетки, равной 0,9—0,95 теоретического ее значения. 268
обычно применяют различные интерферометры. Полученное выражение F.86) можно использовать для оценки разрешающей силы интерферо- интерферометра. В отличие от дифракционной решетки здесь обычно используют- используются высокие порядки интерференции при относительно небольшом числе интерферирующих пучков. Так, например, для интерферометра Майкельсона (см. § 5.8) число интерферирующих пучков N = 2, а по- порядок интерференции т определяется числом длин волн, укладываю- укладывающихся на разности хода между интерферирующими лучами, и может быть очень большим (порядка 106). Для интерферометра Фабри — Перо легко определить порядок ин- интерференционного максимума в центре интерференционной картины т = 2 ИХ, Несколько сложнее в этом случае установить число интер- интерферирующих пучков N. Из соотношения E.83) при постоянной толщи- толщине интерферометра (/ = const) получаем тЬХ + Х8т = 0, или — = 1тЧ- F.90) Считая, что разрешение двух близких интерференционных колец на- наступает при 8т = е/я, где е — ширина интерференционной полосы (см. рис. 5.54), получим в удовлетворительном приближении для разрешающей силы интерферометра Фабри — Перо [см. E.74)] Я/ (8Х) = тп/& = tnF. F.90а) Из сравнения F.86) и F.90а) следует, что число интерфери- интерферирующих пучков N численно равно резкости F = п Vfflli\ — Я). Значит, эффективное число интерферирующих пучков полностью определяется коэффициентом отражения зеркал интерферометра. Ранее (см. рис. 5.55) мы оценили резкость для Л « 0,9. Результат этой оценки теперь можно интерпретировать следующим образом: в данных условиях число интерферирующих пучков в интерферомет- интерферометре Фабри — Перо равно примерно 30. При / = 5 см находим т « 200 000 и, значит, теоретическая раз- разрешающая сила интерферометра превышает 5 «10е. В принципе можно добиться еще больших значений XI8X путем увеличения расстояния между отражающими слоями, но, как уже указывалось, это приве- приведет к дальнейшему уменьшению области свободной дисперсии АХ & «Я2B /), что целесообразно лишь при исследовании очень узких линий. Выше отмечалось, что интерферометр Фабри — Перо можно рас- рассматривать как резонатор высокой добротности (см. § 5.9). Теперь, когда введено понятие разрешающей силы, нетрудно уточнить эту связь между оптическими и радиофизическими представлениями. По-види- По-видимому, Г. С. Горелик одним из первых указал на эквивалентность понятий добротности и разрешающей силы. Увеличение коэффициента отражения зеркал служит мощным сред- средством повышения разрешающей силы, но возможности ее увеличения 269
ограничены в реальном интерферометре несовершенством его поверх- поверхностей. Непараллельность отражающих поверхностей, а также их де- дефекты изменяют распределение интенсивности, создаваемое идеаль- идеальным интерферометром. Форма максимума в несовершенном интерфе- интерферометре будет определяться суммой максимумов, создаваемых отдельными участками его поверхности, которые можно считать параллельными. Так как общее количество света, приходящегося на одно кольцо, одинаково и для идеального, и для реального интерфе- интерферометра, то в последнем случае ширина контура окажется больше, а высота максимума меньше. Поэтому неточность изготовления поверхно- поверхностей и плохая юстировка снижают реальную разрешающую силу и ин- интенсивность света в максимуме. В настоящее время технически возможно создание диэлектрических отражающих покрытий с очень высокими коэффициентами отражения (больше 99%). Однако неизбежные погрешности при изготовлении зеркал ограничивают целесообразность использования столь высоких коэффициентов отражения, поскольку из-за потерь в свете не имеет смысла изготовлять интерферометр, у которого ширина контура це- целиком определяется дефектами поверхностей. Общего критерия для выбора наиболее выгодного коэффициента отражения для данной по- поверхности зеркал привести нельзя, так как он зависит от конкретных особенностей решаемой задачи, но приблизительно можно считать, что уширение из-за дефектов поверхностей должно быть меньше ши- ширины контура идеального интерферометра с теми же покрытиями. Так, например, при погрешности пластин порядка Я/50 обычно не имеет смысла наносить на них слои с коэффициентом отражения, превышающим 90 %. У призмы разрешающая сила обычно значительно меньше, чем у дифракционной решетки, но она оказывается вполне достаточной для решения многих физических и технических задач. Поэтому нельзя счи- считать, что призменные спектрографы и монохроматоры утратили свое 'значение, хотя в спектральном приборостроении бесспорно прогрес- прогрессивна тенденция все более широкого использования дифракционных решеток. Разумеется, соотношение F.86) не годится для оценки разрешаю- разрешающей силы призмы. При выводе соответствующего выражения исходят из того, что грань призмы (при обычном соотношении размеров призмы и объективов спектрального прибора) ограничивает эффективное сече- сечение выходящего пучка света. Расчет проводится для симметричного хода лучей в призме (см. рис. 6.55), и тогда надо решать задачу дифрак- дифракции света на прямоугольном отверстии, ширина которого определяется размерами призмы*. Окончательный результат оказывается весьма простым и наглядным: * См.: .Зоммерфельд А. Оптика, § 41, 270
Мы видим, что разрешающая сила призмы зависит от размера её основания Ъ и дисперсии вещества, из которого она сделана. В спек- спектроскопической практике иногда используют уникальные установки, содержащие несколько очень больших призм, изготовленных из спе- специально подобранных сортов стекла. Разрешающая сила таких устройств близка к разрешающей силе спектрографа с дифракцион- дифракционной решеткой стандартной величины. 3. При сравнении различных диспергирующих элементов следует учитывать, что призма в отличие от дифракционной решетки дает всего один спектр, поэтому не требуется отделения спектров высших порядков. Это облегчает эксперимент и в некоторых случаях позволяет более эффективно исследовать малые световые потоки. Однако здесь возникает весьма сложный вопрос о светосиле спектральных приборов. Ее оценки требуют дополнительного исследования и обоснования. Эту важную характеристику спектрального прибора мы рассмотрим весьма кратко. При любом спектральном исследовании происходит значительная потеря света. Обычно диспергирующий элемент (или весь прибор в це- целом) характеризуют коэффициентом пропускания SF в данном интер- интервале длин волн. Так, например, решетка с профилированным штрихом концентрирует в определенном направлении значительную часть энер- энергии падающей на нее волны. Коэффициент пропускания для таких ре- решеток обычно превышает 50%, что сравнимо с коэффициентом пропус- пропускания для призмы, в которой также имеются потери света на отраже- отражение, поглощение и рассеяние. В интерферометре Фабри — Перо с ме- металлическими зеркалами потери, связанные с поглощением, достигают 90% и резко уменьшаются при использовании многослойных диэлект- диэлектрических покрытий. Но кроме учета потерь света на поглевдение, отражение или рас- рассеяние нужно помнить о том, что те или иные приемники радиации регистрируют разные фотометрические характеристики излучения. По- Почернение фотопластинки пропорционально освещенности в фокальной плоскости камерного объектива спектрографа, а фотоумножитель, термопара и другие измеряют величину светового потока на выходе мо- нохроматора. Поэтому, обсуждая светосилу спектрального прибора, нужно строго оговорить условия эксперимента. В частности, важно знать, исследуется ли источник, испускающий сплошной или линей- линейчатый спектр, измеряется ли световой поток или освещенность и т. д. В качестве примера ограничимся кратким разбором светосилы спектро- спектрографа при исследовании монохроматического излучения. Упрощенная оптическая схема спектрального прибора была пред- представлена на рис. 6.52. Введем следующие обозначения: В — яркость изображения источника в плоскости входной щели; bt — ширина щели; hx — ее высота; S — площадь поперечного сечения пучка, падающего на диспергирующий элемент. Световой поток внутри спектрографа F.92) 271
Площадь изображения щели в фокальной плоскости объектива L2 равна М^Мх/Ш- F.93) Здесь мы считаем, что угловое увеличение равно единице и фокаль- фокальная плоскость L2 перпендикулярна оптической оси. Освещенность в фокальной плоскости с учетом потерь на поглощение и отражение в системе (JT < 100%) имеет вид F.94) Это соотношение показывает, что при данной яркости источника и геометрии установки освещенность резко увеличивается с уменьше- уменьшением фокусного расстояния /а. Как мы видим, она не зависит от дис- дисперсии прибора и ширины щели, тогда как световой поток на выходе, который регистрируют при использовании мо- нохроматора, конечно, должен зависеть от ширины входной щели — сразу ясна разница между светосилами монохроматора и спектро- спектрографа. Иными будут соотношения при иссле- исследовании сплошного спектра. Заметим, что полученный результат спра- справедлив лишь при достаточно широкой щели, К0ГДа можно пренебречь дифракционными эффектами. Пусть ширина входной щели на- р е59 3 столько мала, что объектив коллиматора ока- осТёщенности T^eSe жегся в пределах первого дифракционного Я/6 осТёщенности TeSe р р фр линии от ширины щели максимума, иными словами, <р ж Я/6, т. е. мы спектрографа имеем дело с так называемой нормальной щелью. Тогда при дальнейшем сужении щели значение эффективно используемого светового потока будет резко па- падать. Зависимость освещенности в центре спектральной линии от ширины щели спектрографа (в единицах нормальной щели Ьо) пока- показана на рис. 6.59. Из приведенного на нем графика видно, что при регистрации линейчатых спектров выгодно выбирать щель, ширина которой в 2—3 раза больше ширины нормальной щели. Непрост также выбор оптимального значения фокусного расстоя- расстояния /2. Как отмечалось выше [см. F.94)], освещенность в центре линии обратно пропорциональна /1, т. е. выгодно работать с короткофокус- короткофокусным объективом. Но линейная дисперсия, определяемая как /2 ^ и указывающая, на какое расстояние разведены в фокальной плоскости объектива L2 две близкие по длине волны линии, пропорциональна /2. Если мала линейная дисперсия, то затруднены исследования спектра, а разрешающую силу прибора нацело определяет зернистость фото- фотопластинки. Следовательно, достижение высокой дисперсии и большой разрешающей силы, как правило, сопровождается потерей светосилы. Поиск оптимального их соотношения, позволяющего проводить тре- требуемые измерения при хорошем отношении сигнал/шум, обычно яв- является одной из главных задач в эксперименте. 272
§ 6.8. ДИФРАКЦИЯ НА ПЛОСКОЙ И ПРОСТРАНСТВЕННОЙ СТРУКТУРЕ. РАССЕЯНИЕ СВЕТА В предыдущих параграфах этой главы рассматривалась одномерная задача дифракции плоской волны на правильной структуре из N- па- параллельных Е\елей. При расчете коэффициента пропускания дифрак- дифракционной решетки учитывалась зависимость лишь от одной переменной величины (текущей координаты х). Считалось, что ось X, лежащая в плоскости решетки, направлена перпендикулярно образующим щелей. При перемещении приемника параллельно оси Y никаких ин- интерференционных эффектов не наблюда- наблюдалось — вдоль щели интенсивности скла- складывались. „^ Перейдем к исследованию дифракции в более сложных случаях. Рассмотрим двумерную систему, а именно две дифрак- дифракционные решетки с периодами dx и da- Наложим их одна на другую так, чтобы Рис. 6.60. К рассмотрению щели первой решетки были перпендику- Угла *иф£*?ции ф1 на Аву" лярны щелям второй. Пусть ось X перпен- мер и стРУктУРе дикулярна щелям первой решетки, а ось Y — щелям второй решетки. При описании такой более сложной си- системы будем пользоваться не углами дифракции ср$, а дополнитель- дополнительными к ним углами а, р, у. Это избавит нас от путаницы при опре- определении направления дифрагировавшего луча. На рис. 6.60 показаны угол дифракции ц>г и дополнительный к нему угол а. Очевидно, что sin фх = cos а. Тогда известное условие возникновения главных мак- максимумов F.50) имеет вид йг cos a = тгХ. F.95) Здесь явно фигурирует направляющий косинус. Пусть на такую систему двух дифракционных решеток падает плос- плоская волна. Обозначим через а0, Ро> То Углы между нормалью к падаю- падающей волне и осями X, F, Z. Рассмотрим самый простой случай нормаль- нормального падения (осо = я/2; р0 = Jt/2; Yo = 0)- Условия возникновения главных максимумов для излучения с какой-то произвольной длиной волны X имеют вид dx cos a = тхХ, d2 cos p == m2X. F.96) Углы а, р, у связаны между собой очевидным геометрическим со- этношением cos2 a + cos2 p + cos2 у = 1. F.97) Мы получили систему трех независимых уравнений для определе- определения трех искомых величин a, P, у. Следовательно, при заданных dx и i2 для излучения любой длины волны можно вычислить значения углов х, р и Y» характеризующие направление дифрагировавшего луча для максимумов того или иного порядка. Если в каждой решетке число целей Nt и N2 достаточно велико, то максимумы будут очень острыми 273
к практически вся световая энергия пойдет только по этим «разрешен- «разрешенным» направлениям. На удаленном экране, расположенном за систе- системой из двух скрещенных решеток, получится дифракционная карти- картина, представляющая собой четкие симметрично расположенные свето- световые пятна. Рассмотрим несколько подробнее вопрос об относительной освещен- освещенности этих световых пятен. Охарактеризуем каждое из разрешенных направлений буквами тг и т2у показывающими порядки дифракцион- дифракционных спектров в двух взаимно перпендикулярных направлениях. Рис. 6.61 иллюстрирует систему этих обозначений для нескольких глав- главных максимумов вблизи центра симметрии (тг и т2 изменяются от — 2 до + 2). При постановке задачи мы исходили из утверждения, что световая волна претерпе- претерпевает изменение направления на каждой си- системе щелей (т. е. имеет место дифракция на каждой решетке). Тогда можно записать сле- следующее выражение для интенсивности света, распространяющегося в направлении, опреде- определяемом углами а и Р: , ч sin* (#!«!) sin* (#2 «2) • • -•- • • • • • • • О О о • • • • • • • -•- • • -/ 0 1 Рис. 6.61. Обозначения максимумов при дифрак- дифракции на двумерной струк- структуре Максимумы показаны круж- кружками, размеры которых ха- характеризуют интенсивности Я(сс, sin2 sin2 62 F.98) где 8Х = (ndJX) cos а, б2 = (nd2/X) cos p. При записи общего выражения не делалось каких-либо предположений о форме штриха. В противном случае это привело бы к конкретизации вида функции F2 (а, р, Ьъ 62), определяющей медленное изменение интенсивности световых пятен (огибающая) в зависимости от углов а и р и ширины щелей Ьх и Ь2 каждой из скрещенных решеток. Анализ выражения F.98) показывает, что главные максимумы воз- возникают тогда, когда (dx/tycos а = т1 и одновременно (d2/X) cos р= m2, где mi и т2 — два целых числа. В этом случае / ~ N\Nl. Если только одно из этих чисел (тх или т2) целое, т. е. выполняется условие возник- возникновения главного максимума лишь для одной из решеток, то его ин- интенсивность оказывается много меньше. Эти простые выкладки подтверждают высказанное утверждение о том, что при достаточно большом числе щелей в каждой решетке и при освещении системы монохроматическим светом световые пятна бу- будут весьма четкими. При освещении решеток немонохроматическим светом наблюдаются цветные пятна с характерным для дифракцион- дифракционных спектров распределением цветов (красные лучи отклоняются боль- больше, чем фиолетовые). В зависимости от свойств излучателя, а также от дисперсии и разрешающей силы используемых решеток суммарная картина изменяется, сохраняя, однако, общую симметрию. Наиболее эффектны опыты при освещении скрещенных решеток светом газо- газового лазера, излучающего одну спектральную линию большой ярко- яркости. В качестве модели двумерной решетки можно использовать кусок 274
кисеи или какой-либо другой сетки с очень мелкими ячейками. Легкое натяжение такой сетки в каком-либо направлении приводит к замет- заметному изменению дифракционной картины. Следует заметить, что предположение о взаимной перпендикуляр- перпендикулярности штрихов на решетках было сделано лишь для упрощения описа- описания. Если угол между двумя системами щелей не равен я/2, то распо- расположение цветных пятен отобразит условия опыта (рис. 6 62). Изуче- Изучение распределения главных максимумов позволяет получить сведения о структуре поверхности, на которой произошла дифракция световой волны. «нД**1Л1Л Рис 6 62 Правильная плоская структура (внизу) и картина ди- дифракции на ней (вверху) при Я=5790 А Рис 6 63 Картина дифракции на плоской структуре с хаотическим распределением отверстии (или эк- экранов) Несущественно также введенное выше ограничение для углов паде- падения волны на плоскую поверхность. Если волна падает на нее наклонно (т. е. углы а0 и р0 отличны от я/2), то придется лишь по-другому запи- записать условия возникновения главных максимумов Так, например, для оси X вместо dx cos а = тк получим &х (cos а — cos а0) = тх%. Очевидно, что общий характер дифракционной картины останется прежним Усложнение задачи приводит лишь к изменению масштабов по осям X и Y наблюдаемой дифракционной картины. Конечно, все эти рассуждения справедливы лишь при наличии пра- правильной двумерной структуры. Если же отверстия или экраны хаоти- хаотически распределены по какой-либо плоскости, то суммарная картина будет выглядеть совсем иначе (рис. 6.63). Мы увидим симметричные размытые интерференционные кольца, возникновение которых связа- связано с дифракцией света на каждой частице. Интенсивность этих колец будет пропорциональна числу частиц на единицу поверхности (а не ее квадрату, как в случае дифракции на правильной структуре). Кон- Концентрации светового потока в строго определенных направлениях не 275
будет. Такие явления легко наблюдаются при прохождении солнечного света через запыленное или покрытое слоем инея оконное стекло. Итак, получен интересный результат, а именно открывается воз- возможность экспериментально отличить правильное расположение вы- вызывающих дифракцию центров от хаотического их распределения на какой-то плоскости, где расстояние между ними лишь в среднем постоянно. Более того, детальное исследование симметрии и распреде- распределения интенсивности дифракционной картины позволяет определить характер правильного распределения таких центров на плоскости. Но наиболее значительны и поучительны вопросы ди- дифракции электромагнитных волн на пространствен- пространственной структуре. Итак, пусть имеется правильная трехмерная струк- структура с периодами dXi d2 и d3. Условия падения плос- плоской электромагнитной волны на эту структуру оста- останутся такими же, как и в уже разобранном случае (а0 = Ро = я/2, Yo = О» Т- е- свет падает на струк- структуру вдоль оси Z). Можно сразу же записать следующие два условия возникновения главных максимумов, которые не от- отличаются от условия F.96), потому что нормаль к волне перпендикулярна осям X и Y: dx cos a = тхХ, d2 cos p = т2Х. F.99) Но такие условия уже непригодны для описания дифракции на третьей решетке. Для нее это условие должно иметь вид dz (cos Yo — cos y) = пг3Х. F.100) Учитывая, что Yo = 0, получим третье условие возникновения глав- главных максимумов d3 A — cos y) = пг3Х. F.100а) Рис. 6.64 помогает понять физический смысл последнего условия. Для этих волн, составляющих угол y с осью Z, разность хода d3—d3 cos y равна целому числу длин волн т3Х, т. е. только в этом направлении происходит усиление дифрагировавшей волны. Итак, мы получили систему из трех условий возникновения главных макси- максимумов и прежнего очевидного соотношения между углами: dx cos a = тх Xfd2 cos p = пг2Ху d3 A — cos y) = т3К cos2 а + cos2 p + cos2 у = 1. F.101) Анализ этой системы уравнений приводит к следующим важным выводам: для произвольной длины волны X нельзя удовлетворить всем четырем уравнениям F.101). Следовательно, если осветить данную пространственную структуру излучением с непрерывным спектром, то она избирательно пропустит лишь излучение такой вполне опреде- определенной длины волны X, для которой при структуре, характеризуемой 276 Рис. 6.64. К ус- условию F.100) дифракции пло- плоской волны на пространствен- пространственной структуре
di, d29 d3, четыре уравнения F.101) будут совместны. Нетрудно полу- получить в явном виде уравнение, из которого можно определить эту длину волны. Для этого нужно исключить из системы уравнений F.101) cos a, cos P и cos у. Проведя такую операцию, получим искомую связь между длиной прошедшей волны Xt и параметрами структуры du d2, dz: f]Y f^J ( *M*L (б102) Итак, разложения излучения в спектр на одномерной, двумерной и пространственной структурах совсем не одинаковы. Если осветить одномерную правильную структуру излучением, содержащим все длины волн (белый свет), то такая решетка разложит его в непрерыв- непрерывный спектр, который можно исследовать в первых порядках (в высоких порядках будут мешать трудноустранимые наложения). Двумерная решетка преобразует белый свет в систему цветных пятен, каждое из которых будет своеобразным разложением в непрерывный спектр по двум координатам. Трехмерная структура пропустит из непрерывного спектра лишь излучение с теми дискретными значениями Xt, которые удовлетворяют уравнению F.102), т. е. трехмерная структура работает так же, как узкополосный фильтр. Если осветить одномерную (двумерную) решетку монохроматиче- монохроматическим светом, то получится одномерная (двумерная) картина распре-* деления по дифракционным порядкам, которая будет описываться простыми уравнениями с одним (линейная решетка) или парным индексом (правильная структура на плоскости). Трехмерная решетка вообще не пропустит монохроматическое излучение, если только дли- длина волны его случайно не удовлетворяет уравнению F.102). При экспериментальной проверке этих закономерностей возникла интересная ситуация, приведшая в 1912 г. Лауэ к открытию метода исследования кристаллов, значение которого трудно переоценить. Для того чтобы решетка эффективно разлагала излучение в спектр, ее постоянная d должна быть по порядку величины примерно такой же, как и длина волны Я. Для оптической области желательно иметь струк- структуру с постоянной d порядка 10~4 см. Искусственно подобную про- пространственную структуру можно создать с помощью стоячих ультра- ультразвуковых волн в жидкости или газе, но практическое значение этих эффектных опытов весьма невелико. Вместе с тем в природе сущест- существуют естественные пространственные структуры с постоянной порядка 10~8 см, а именно кристаллы, где атомы или ионы расположены в кри- кристаллических решетках как раз на таких межатомных расстояниях. Электромагнитное излучение с длиной волны в несколько ангстремов относится к рентгеновской области спектра. Чрезвычайно плодотвор- плодотворная идея Лауэ и заключалась в том, чтобы «просвечивать» кристаллы рентгеновскими лучами и, изучая дифракцию на пространственной структуре, определять постоянные кристаллической решетки. На рис. 6.65 представлены соответствующие дифракционные картины для двух различных положений кубического кристалла относительно пуч- 277
ка рентгеновских лучей. Эти снимки были получены в лаборатории М. А. Румша, работы которого в области спектроскопии рентгеновских лучей широко известны. Идея постановки эксперимента для получения рентгенограмм по методу Лауэ относительно проста и состоит в следующем (рис. 6.66). При освещении кристалла излучением с непрерывным спектром решет- решетка сама «выберет» ту длину волны, которая способна дифрагировать на данной пространственной структуре. Рентгеновская трубка излучает как непрерывный (белый), так и дискретный спектры. Если напряжение на трубке относительно неве- невелико B0—30 кВ), то в основном излучается необходимый для описы- Рис. 6.65. Картина дифракции рентгеновских лучей на кубическом кристалле при двух различных его ориентациях относительно падающего пучка ваемых экспериментов непрерывный спектр. Расшифровывая получен- полученную дифракционную картину (лауэграмму), получают сведения о кри- кристаллической решетке. Хотя изложение основ рентгеноструктурного анализа не является задачей этой книги, упомянем здесь об интерференционном методе ис- исследования кристаллов, в котором используют дискретные рентгенов- рентгеновские спектры (характеристические лучи) —резкие пики, появляющие- появляющиеся на сплошном фоне рентгеновского излучения при больших ускоряю- ускоряющих потенциалах. Кристаллографическими исследованиями было уста- установлено, что в любом кристалле можно обнаружить определенные плос- плоскости, в которых атомы или ионы, составляющие его решетку, упако- упакованы наиболее плотно. Такие плоскости будут отражать монохромати- монохроматическое рентгеновское излучение, и, следовательно, может происходить интерференция волн, отраженных различными плоскостями. Очевид- Очевидно, что усиление отраженной волны произойдет лишь под вполне опре- определенным углом 9 (рис. 6.67). Если разность хода (А=АО' + О'В) рав- равна целому числу длин волн, то 2 d sin G = тк. F.103) 278
Это соотношение обычно называют условием Врэгга — Вульфй. Оно позволяет на опыте определить расстояние между плоскостями, в которых находится максимальное число исследуемых центров (для этого, разумеется, необходимо еще точно знать длину волны монохро- монохроматического рентгеновского излучения). Существует ряд эксперимен- экспериментальных методов исследования кристаллической решетки, базирую- базирующихся на применении условия F.103). Кроме того, если для данного кристалла точно известны расстояния между отражающими плоскостями, то это соотношение можно исполь- использовать для определения длины волны рентгеновского излуче- излучения. Этот краткий перечень воз- возможностей рентгеновских иссле- исследований показывает, сколь боль- Рис. 6.66. Схема опыта Лауэ: кристаллическая пластинка, S—■ экран Рис. 6 67. К выводу условия Брэгга — Вульфа шое значение имеет дифракция на пространственной структуре !для решения основных проблем кристаллографии, которая до широкого внедрения методов^рентгеноструктурного анализа оставалась в основ- основном описательной наукой, классифицировавшей кристаллы главным образом по их внешней форме и применявшей косвенные методы. В заключение попытаемся качественно объяснить явление рассея- рассеяния света различными средами. Мы видели, что дифракция электромаг- электромагнитной волны на неправильной плоской (двумерной) структуре при- приводит к отклонению части потока энергии от его первоначального на- направления, т. е. к рассеянию света. Аналогичный процесс должен про- происходить и при дифракции на неправильной пространственной (трех- (трехмерной) структуре — дифракция света на каждой частице приведет к отклонению части пучка. Интерференция отклонившихся от перво- первоначального направления волн (обусловливающая возникновение ос- острых дифракционных максимумов) в данном случае происходить не будет. Весь эффект будет пропорционален концентрации рассеиваю- рассеивающих центров. Главные максимумы, интенсивность которых ~ N2, будут отсутст- отсутствовать и при освещении кристаллической решетки светом, длина волны которого существенно больше ее периода (d < К). Действительно, уравнения F.101) в этом случае не имеют решений для mlt2, з Ф 0. Это значит, что интегральная картина рассеяния света будет (так же как 279
Рассеидамщй объект при хаотическом распределении рассеивающих центров) определять- определяться лишь дифракцией на отдельных центрах, без интерференции дифра- дифрагированных пучков. Поэтому интенсивность рассеянного света и в этом случае пропорциональна концентрации ( ~ N). Часто в такой опти- оптически однородной среде, свойство которой можно охарактеризовать постоянным по объему значением показателя преломления, не проис- происходит дифракции на отдельных молекулах, а наблюдаемый эффект обусловлен рассеянием света на флуктуациях плотности. Наибольшее рассеяние наблюдается при прохождении света в мут- мутных средах (дым или другие твердые частицы, взвешенные в газе; ту- туман, обусловленный присутствием в атмо- атмосфере капель воды; взвесь нерастворяю- щихся жидкостей и ,т. д.). Обычно такое рассеяние называют явлением Тиндаля в честь физика, экспериментально изучивше- изучившего спектральное распределение, индикат- индикатрису рассеяния и поляризацию рассеянно- рассеянного света. Теория явления была дана Рэлеем. В терминах электронной теории можно следующим образом охарактеризовать ме- механизм процесса. Электрическое поле па- падающей волны «раскачивает» заряженные частицы (электроны), и возникает рассеян- рассеянное излучение, которое в грубом приближе- приближении можно описать полученными ранее со- соотношениями для гармонического осцил- осциллятора, излучающего под действием вынуж- вынуждающей силы (см. § 1.7). В частности, сразу понятно, почему наибо- наиболее интенсивно рассеивается коротковолновое излучение. Известно, что интегральная интенсивность излучения диполя пропорциональна четвертой степени частоты (со4 ~ 1/Я4). Следовательно, голубой свет будет рассеиваться значительно сильнее красного (A>Kp/?W ^ *»6). Индикатриса рассеяния должна быть похожей на распределение по- потока электромагнитной энергии в пространстве (см. § 1.7), полученное на основе очевидного положения об отсутствии излучения в направле- направлении движения осциллирующего электрона. Наиболее интересны результаты исследования поляризации рас- рассеянного света. Оказывается, рассеянное излучение, распространяю- распространяющееся перпендикулярно падающей неполяризованной волне, полно- полностью поляризовано. Это также обусловлено направленностью излуче- излучения гармонического осциллятора, что и поясняет рис. 6.68. Вдоль оси Y распространяется неполяризованный свет. Колебания вектора Е происходят в плоскости XZ, причем компоненты Ех и Ez совершенно некоррелированы. Рассеянный в направлении оси X свет полностью поляризован (Ерас направлено вдоль оси Z). До сего времени речь шла о рассеянии света в мутных средах. Однако его можно наблюдать ?акже в газах и жидкостях даже при от- отсутствии каких-либо загрязнений. Это так называемое молекулярное рассеяние, появляющееся в тех случаях, когда в силу тех или иных 280 Рис. 6.68. Возникновение ли- линейной поляризации рассе- рассеянного света, распространя- распространяющегося под прямым углом к падающему пучку неполя- ризованного света
причин в среде, где распространяется свет, имеется оптическая неод- неоднородность. Наиболее характерный пример молекулярного рассея- рассеяния — возникновение голубого цвета неба в результате рассеяния солнечного света. Вопрос о центрах такого рассеяния длительное вре- время дискутировался видными физиками. Рэлей высказал предположе- предположение, что молекулы воздуха обусловливают наблюдаемые дифракцион- дифракционные явления. Мандельштам показал, что это предположение не может объяснить эффект и необходимо искать причину оптической неодно- неоднородности. Лишь после того, как Смолуховский и Эйнштейн развили теорию флуктуации, удалось однозначно истолковать эффект возник- возникновения голубого цвета неба как результат рассеяния солнечного света на флуктуациях плотности в атмосфере. Мы ограничимся этим кратким рассмотрением очень сложного многопланового явления рассеяния электромагнитных волн, которое представляет значительный интерес для самых различных областей современной физики. § 6.9. РАЗРЕШАЮЩАЯ СИЛА ОПТИЧЕСКИХ ИНСТРУМЕНТОВ В § 6.7 была подробно исследована возможность раздельного на- наблюдения двух спектральных линий, близких по длине волны. Был сформулирован также критерий разрешения Рэлея и введено понятие разрешающей силы (Х/8Х — «хроматическая» разрешающая сила); последнюю можно оценить как теоретически, так и экспериментально. Если исследователя интересует не спектральное разложение, а степень четкости изображения, образованного какой-либо оптической системой, и возможность раздельного наблюдения на нем близких частей объек- объекта, то нужно ввести аналогичную функцию — разрешающую силу оптического инструмента. Это понятие непосредственно связано с волновой природой света, так как в приближении геометрической оптики (при ряде упрощающих предположений) можно рассчитать любую оптическую систему, в ко- которой каждой точке объекта соответствует определенная точка изобра- изображения. Но дифракция света на краях линз, оправ и диафрагм лимити- лимитирует возможность получения точечного (стигматического) изображе- изображения. На практике обычно используют круглые оправы и диафрагмы, и при оценке разрешающей силы оптических инструментов, как пра- правило, учитывается дифракция плоских волн именно на круглом от- отверстии. Однако дифракционное размытие стигматического изображения часто маскируется более грубыми эффектами, обусловленными неиз- неизбежными недостатками в качестве оптических деталей, неточностью фокусировки-и т. д. Все погрешности оптических систем (аберрации) следует свести к минимуму, и лишь тогда в полной мере проявятся искажения, связанные с дифракцией света. Таким образом, здесь можно провести очевидную аналогию с известными правилами наладки электронных и радиотехнических систем. Сначала нужно устранить грубые неполадки схемы (плохие контакты и другие паразитные сопро-
тивления) и лишь затем пытаться ограничить влияние более тонких эффектов (дробовой эффект, тепловые шумы и т. д.). Изложение намеченного круга вопросов начнем с краткого анализа аберраций оптических систем и способов их устранения. Затем иссле- исследуем разрешающую силу телескопа и микроскопа. Рассмотрение этих двух очень важных частных задач позволит ознакомиться с основами дифракционной теории оптических инструментов. Очень часто встречается аберрация, приводящая к преобразованию точечного (стигматического) фокуса в две взаимно перпендикулярные фокальные линии аа! и bb' (рис. 6.69). Эта аберрация называется асти- Рис. 6.69. К возникновению астигматизма в результа- результате различной кривизны линзы в двух взаимно перпен- перпендикулярных направлениях: M'llOg о'„ ; аа'\\О± о'± гматизмому а расстояние между фокальными линиями — астигмати- астигматической разностью. При выяснении вопроса о причинах возникновения астигматизма введем основные обозначения. Как указывалось в § 6.2, пучок, сходящийся в точку или исходящий из точки, называется гомоцентрическим. Ему соответствует сферическая волновая поверх- поверхность, которая в любой точке перпендикулярна распространяющим- распространяющимся лучам. Плоская волна служит частным случаем гомоцентрическо- гомоцентрического пучка с бесконечно удаленной точкой схождения. Если в силу каких-либо причин волновая поверхность обладает различной кривизной в разных сечениях, то тогда и возникнет астиг- астигматизм. Из геометрии известно, что два сечения, обладающие мини- минимальной и максимальной кривизной, взаимно перпендикулярны. Это и объясняет появление фокальных линий ad и W на рис. 6.69, заменивших стигматический фокус. Для того чтобы астигматизм не возникал, нужно, чтобы при всех преобразованиях пучок света оста- оставался гомоцентрическим. Этого добиться трудно, так как при любом преломлении (даже на идеально плоской границе) гомоцентричность пучка нарушается. Возникает астигматизм наклонных пучков. Сле- Следовательно, неизбежен астигматизм и при использовании призмы, на преломляющую поверхность которой свет всегда падает наклонно. Не менее распространен астигматизм, связанный с асимметрией фокусирующей системы. Классической демонстрацией, иллюстрирую- иллюстрирующей аберрацию подобного рода, служит фокусировка пучка цплиндри- 282
Рис. 6.70. К возникновению продольной сферической аберрации ческой линзой — две фокальные линии оказываются сильно разведен- разведенными (в пределе астигматическая разность для цилиндрической линзы равна бесконечности). Нетрудно показать, что даже незначительные отклонения от сферы при изготовлении фокусирующей оптики неиз- неизбежно приводят к астигматизму. Таким образом, сведение астигматиз- астигматизма к минимуму является трудной задачей, требующей тщательного контроля за изготовлением оптики и всеми условиями оптического эксперимента. Но если это удалось сделать, то остаются другие по- погрешности оптических систем. Наиболее ясно возникновение сферической аберрации, при которой (так же как в случае астигматизма) в результате прохождения света через реальную оптическую си- систему возникает отклонение вол- волновой поверхности от сфериче- сферической. Пучок света перестает быть гомоцентрическим, и излу- излучение не фокусируется в одной точке. С позиций геометрической оптики возникновение сфериче- сферической аберрации связано с нару- нарушением тех условий, для кото- которых справедливы законы фокуси- фокусировки излучения оптическими системами. Действительно, в геометри- геометрической оптике все основные соотношения выводятся для лучей, состав- составляющих очень малый угол с оптической осью. Такие лучи называют параксиальными. Нарушение параксиальности сразу же приводит к раз- размытию точечного фокуса [рис. 6.70]. Возникает продольная сфериче- сферическая аберрация 8S = S'S"\ она положительна для рассеивающей линзы и отрицательна для фокусирующей, что позволяет предложить способ ее устранения (или, во всяком случае, сведения к минимуму). Фокуси- Фокусирующую систему, представляющую собой комбинацию положительной и отрицательной линз, рассчитывают так, чтобы суммарная продольная аберрация была равна нулю. Этого легко добиться для центра изобра- изображения предмета и труднее на его краях. Если система исправлена на сферическую аберрацию для лучей, исходящих из точечного объекта, расположенного на оптической оси, то такая аберрация может сохраниться при отображении внеосевых объектов. В этом случае изображение точки принимает характерную форму, напоминающую запятую. Подобная аберрация называется комой. Она отсутствует у систем с исправленной сферической абер- аберрацией, если выполняется условие синусов*, что возможно лишь для пары сопряженных плоскостей, называемых апланатическими. Следующая основная погрешность оптических систем — хромати- хроматическая аберрация, природа которой непосредственно связана с зависи- зависимостью показателя преломления оптических материалов (стекло, * Условие синусов будет использовано при рассмотрении разрешающей силы микроскопа, оптика которого всегда рассчитывается с учетом роли вне- осевых пучков. 283
кварц) от длины волны, т. е. с дисперсией вещества. Вследствие дис- дисперсии фокусное расстояние зависит от длины волны, что и приводит к невозможности получить точечный фокус для немонохроматического излучения. Для уменьшения этой погрешности системы используют различную величину хроматической аберрации для разных сортов стекла. Обыч- Обычно тот или иной сорт стекла характеризуют величиной nD— 1 F.104) Здесь индексы F, D и С указывают линии поглощения в непрерывном спектре Солнца (фраунгоферовы линии с длинами волн 4861, 5893 и 6563 А соответственно). На рис. 6.71 приведен график зависимости п (Я), а также значения п^, по 1,65 1,55 150 \ Флинт и пс для двух (флинт и крон). сортов стекла F\J)C 5000 moo л,Л Крон' 1 -Флинт Рис. 6 71. Зависимость п(Х) для офлинта и крона: F=4861 A, £=5893 А, С-6563 А — фраунгоферовы линии Рис. 6.72. Простей- Простейший ахроматиче- ахроматический объектив При переходе от одного сорта стекла к другому А изменяется в пре- пределах 1/60-М/ЗО, что и позволяет ахроматизировать линзу, т. е. свести к минимуму хроматическую аберрацию в некоторой спектральной области. Для этого изготовляют так называемый ахромат (рис. 6.72), например объектив, состоящий из фокусирующей линзы (крон) и рассеивающей (флинт). Если для каких-то двух волн известна разность показателей преломления бп, то легко оценить и разность фюкусных расстояний б/. Для установления этой связи исходят из известной фор- формулы линзы F.105) Отсюда следует, что для линзы с определенными значениями радиу- радиусов кривизны гг и г2 произведение / (п — 1) должно оставаться постоян- постоянным, и сразу получается искомая зависимость F.106) Воспользуемся соотношением FЛ06) для определения параметров ахромата из двух сортов стекла (мы будем отмечать их индексами 1 и 2). 284
Для фокусного расстояния этой системы справедливо соотиошейие -L=-L + ~ . F-107) Варьируя его и полагая б/ = 0, найдем следующее условие ахро- ахроматизации: ^L+~-=0. F.108) /1 /2 Используя выражение F.106), получим окончательное условие ахроматизации для F- и С-линий Фраунгофера в виде /i /2 Это соотношение свидетельсгвует о совпадении фокусных расстоя- расстояний для красных и синих лучей F563 и 4861 А). Для центральной об- области спектра (зеленые лучи К « 5500 А) фокусное расстояние будет отклоняться от указанного значения. Используя более сложную сис- систему, можно добиться совпадения трех фокусных расстояний, т. е. еще более высокой ахроматизации. Труднее изготовить ахроматические объективы для ультрафиолето- ультрафиолетовой области спектра, где оптическое стекло непрозрачно. Здесь ис- используют аналогичные системы линз из кварца и флюорита, которые, однако, очень дороги, так как большие кристаллы флюорита редко встречаются в природе (правда, в последние годы их научились выра- выращивать искусственно). Удовлетворительных результатов удается до- достичь с помощью полых кварцевых линз, заполненных дистиллирован- дистиллированной водой. Такие ахроматы начали применять в последнее время, но качество получаемого изображения часто оказывается недостаточно хорошим. Заканчивая это краткое рассмотрение всевозможных аберраций, мы лишь упомянем о дисторсии — погрешности оптической системы, при которой увеличение неодинаково по всему полю зрения. Такое нарушение масштабов часто наблюдается в телевизионных системах и иллюстрирует этот вид аберраций. Исправление всех аберраций — трудная, а иногда и невыполнимая задача, требующая длительных и трудоемких расчетов и высоких требований к технике изготовления оптических деталей. Обычно ис- исправляют лишь те погрешности, которые мешают решению данной за- задачи. Так, например, объектив коллиматора должен быть хорошо ах- ахроматизирован, а для камерного объектива спектрографа часто это вообще несущественно и можно просто косо поставить пластинку с кас- кассетой, учитывая, что фокусное расстояние для фиолетовых лучей мень- меньше, чем для красных. Вместе с тем необходимо исправление камерного объектива спектрографа на сферическую аберрацию (а иногда и на ко- кому), так как он должен фокусировать на пластинку излучение разных длин волн, которые выходят из диспергирующего элемента под раз- различивши углами к оптической оси. Весьма тщательно исправляется на всевозможные аберрации объектив микроскопа, потому что в дан- 285
ном случае целью эксперимента служит получение высокого разреше- разрешения, а условия фокусировки излучения очень сложны. В дальнейшем изложении элементов дифракционной теории оптических инструментов будем считать, что в исследуемых системах тем или иным способом устранены основные аберрации и нарушение стигматичности изображе- изображения связано лишь с волновой природой света. Рассмотрим разрешающую силу телескопа — прибора, предназна- предназначенного для изучения удаленных небесных светил. Эту задачу можно решить вполне корректно, так как с достаточно хорошим приближе- приближением мы вправе считать, что на объектив телескопа падает плоская волна. Следовательно, применимы формулы, описывающие дифракцию плоской волны на круглом отверстии, которым в данном случае служит оправа объектива*. Рис 6 73 Увеличение разрешающей силы объектива телескопа с увели- увеличением диаметра круглой диафрагмы — становится заметной структура двойной звезды Как уже указывалось, * в центре дифракционной картины (см. рис. 6.31) находится светлое пятно, в котором сконцентрирована основная часть фокусируемого светового потока. Эта «световая гора» окружена первым дифракционным минимумом, соответствующим углу дифракции ф, который удовлетворяет условию sin фх = 1,22 X/D. Радиус этого темного кольца гг будет полностью определяться дли- длиной волны Я, диаметром объектива D и его фокусным расстоянием /: rx = f tg фх « / sin фх = 1,22 / Ш. При f/D « 30 в видимой области (X « 5-Ю см) гг « 0,02 мм. Это вполне заметное дифракционное размытие, которое отчетливо наб- наблюдается как на фотографии, так и при визуальном исследовании изображения звезды через окуляр. Все звезды (за исключением специфических случаев наблюдения звезд необыкновенно большой величины, например «красных гиган- гигантов») будут изображаться в фокальной плоскости объектива телескопа одинаковыми дифракционными кружками, угловой размер которых можно принять за меру разрешающей силы телескопа. Чем больше действующий диаметр объектива, тем меньше угловые размеры свет- светлого пятна в центре дифракционной картины, т. е. тем лучше разреше- разрешение и больше разрешающая сила телескопа (рис. 6.73). Поэтому стре- * Мы полаыем, что читателю известен из школьного курса ход лучей в те- телескопе. 286
мятся строить гигантские телескопы с диаметром объектива в несколь- несколько метров. Конечно, погрешности объектива не должны приводить к размытию стигматического фокуса, сравнимому с дифракцион- дифракционным кружком. Поэтому возникают громадные трудности при расчете и изготовлении таких объективов. В частности, этими обстоятельствами обусловлено использование в очень больших телескопах зеркальных объективов, которые обычно можно сделать так, чтобы они давали мень- меньшие аберрации. Качество изображения в большом телескопе часто ли- лимитируется степенью однородности и прозрачности атмосферы. Поэто- Поэтому обычно обсерватории строят в горных районах, но тогда возникают трудности, связанные с доставкой туда столь больших и сложных систем, как современные телескопы. Рис. 6.74. К определению разрешающей силы телескопа Для оценки разрешающей силы телескопа остановимся на условиях разрешения двух близких звезд Sx и S2. Пусть угловое расстояние между ними равно бф и в фокальной плоскости объектива наблюдается наложение дифракционных изображений от этих двух некогерентных излучателей (рис. 6.74). Для характеристики образовавшейся сум- суммарной картины применяют критерий Рэлея, т. е. считают изображения источников света разрешенными, если дифракционный максимум для одного из них совпадает с первым дифракционным минимумом для другого. Следовательно, угол между исследуемыми излучателями не может быть меньше, чем бфмин « sin <рг = 1,22 X/D. Разрешающую силу телескопа обычно характеризуют величиной 1 D F.110) бфмин 1.22А, ' которая прямо пропорциональна диаметру его объектива. Как уже указывалось, критерий Рэлея имеет несколько условный характер. При хорошей воспроизводимости измерений и малых флук- туациях можно зарегистрировать «провал» в суммарной дифракцион- дифракционной картине глубиной, значительно меньшей величины, соответствую- соответствующей этому критерию. Весь вопрос сводится к тому, какой объем информации несут в себе такие измерения. При изменении условий опыта можно значительно превзойти указанный предел. Так, например, Майкельсон разработал и осуществил оригинальный интерференцион- интерференционный метод наблюдения двойных звезд. Его идея состоит в регистрации такого положения широко раздвинутых дополнительных зеркал (рис. 6.75), при котором интерференционные полосы от первой звезды совпадают с аналогичными полосами от второй звезды. В этом методе 287
измерялось угловое расстояние между компонентами двойной звезды при недостаточной разрешающей силе объектива используемого телес- телескопа. В дальнейшем Майкельсон применил этот метод для определения угловых диаметров некоторых «красных гигантов». За последнее время появились работы, в которых исследуются возможности значительно превзойти общепринятый предел разрешения оптической системы без увеличения диаметра объектива или уменьше- уменьшения длины волны излучения. Это связано с применением для решения данной задачи методов теории информации. Охарактеризуем суть этих весьма перспектив- перспективных исследований в приложении к рассматри- рассматриваемой задаче — возможности увеличения раз- разрешающей силы телескопа, хотя, конечно, они имеют более общее значение. Как уже указывалось, при определении углового расстояния 6<р между двумя удаленны- удаленными звездами критерий Рэлея фактически пред- предполагает возможность их раздельного наблюде- наблюдения при определении величин провала между двумя одинаковыми дифракционными кружка- кружками, соответствующими каждой из звезд. Однако если точно известен вид дифракционных пятен и хорошо измерена освещенность во всех точ- точках суммарной картины, возникающей в резуль- результате их наложения, то можно разложить наблю- наблюдаемую картину на составляющие и тем самым определить ficp, хотя никакого провала на ней нет. Такое разложение может проводиться гра- графически или с использованием вычислительной техники. Математически задача сводится к восстановлению некоторой функ- функции F (x')f которая входит в интегральное уравнение, образуя вместе с аппаратной функцией f (х' — х) так называемую свертку, дающую функцию Ф(#), описывающую измеряемую суммарную картину. Опера- Операцию нахождения F (х') называют решением обратной задачи: Рис. 6.75. Принци- Принципиальная схема интер- интерферометра Майкель- сона, установленного на телескопе-рефлек- телескопе-рефлекторе диаметром 2,54 м = J F(x')f(x'— x)dx'. F.111) Мы усматриваем аналогию с разложением излучения в спектр, которое проводилось для выявления истинной структуры спектраль- спектральной линии, замаскированной уширением создаваемым спектральным прибором, которое также называлось аппаратной функцией. Эта ана- аналогия весьма глубокая, так как обе эти операции основаны на преобра- преобразовании Фурье, имеющем непосредственное отношение к данной проб- проблеме (см. § 6.7). При изучении фотографии удаленной звезды аппаратной функцией в первом приближении является дифракционное пятно, размеры кото- которого определяются диаметром объектива телескопа и длиной волны 288
дифрагирующего света. Однако эта идеализированная картина сущест- существенно усложняется влиянием аберраций, црлное устранение которых представляется практически невозможным. Поэтому аппаратная функ- функция может быть определена только приближенно. Неизбежны также случайные и систематические ошибки при измерении освещенности суммарной картины. Наличие ошибок в измерении f (х' — х) и Ф (я) ограничивает возможносгь восстановления функции объекта F (х') путем решения обратной задачи. В рамках этих представлений для оп- определения функции объекта (например, бср) необязательно добиваться более узкой аппа- аппаратной функции, обеспечивающей выполне- выполнение критерия Рэлея. Пусть эта функция будет широкой, но точно определенной. Если в этих условиях измерить (с малыми ошибками) освещенность суммарной кар- картины (что, как правило, удается при хо- хорошем отношении сигнал/шум), то методами современной вычислительной техники обыч- обычно можно решить обратную задачу, т. е. восстановить с достаточной точностью ин- интересующую нас величину, хотя в этих условиях критерий Рэлея заведомо не вы- выполняется (рис. 6.76). Таким образом, успех решения задачи, в первую очередь, определяется величиной ошибок при измерениях, т. е. уровнем шу- шумов. Следовательно, статистическая обра- обработка результатов измерений и применение различных методов теории информации, ограничивающих влияние шумов, приобретают первостепенное значе- значение в увеличении разрешающей силы оптических инструментов. Использование объективов большого поперечного сечения выгодно также для получения более яркого изображения звезды на фоне неба. Хотя никакая оптическая система не может повысить яркость наблю- наблюдаемых предметов, но выгоднее наблюдать звезду через телескоп. Дей- Действительно, как уже указывалось, все звезды будут изображаться оди- одинаковыми дифракционными кружками. Обозначим: А — освещенность, которую создает исследуемая звезда на поверхности Земли, Д Ф — световой поток через применяемый телескоп диаметром D. Тогда АФ = AnDVA. F.112) Если рассматривать звезду невооруженным глазом, то световой поток через зрачок равен АФ' = AncPM (d — диаметр зрачка). Отношение этих потоков соответствует отношению яркостей изображений на сет- сетчатке глаза, т. е. ДФ/ДФ' = (D/dJ, где D « 102 см и d « 0,3 см. Вместе с тем объективно яркость неба (фон) при наблюдении в телескоп или невооруженным глазом одинакова. Рис. 6.76. Однозначное раз- разложение хорошо измеренно- измеренного суммарного контура ме- методами вычислительной тех- техники на составляющие оп- определенной формы 10 Зак. 1729 289
Значительно сложнее строгая оценка разрешающей силы микро- микроскопа. Во-первых, в данном случае волну, падающую на объектив мик- микроскопа, нельзя считать плоской. Во-вторых, неясно, каким нужно считать освещение исследуемого предмета. Если его размеры меньше дифракционного кружка, обусловленного конденсором осветитель- осветительной системы, то, по-видимому, мы вправе полагать, что освещение пред- предмета когерентно. Но мы имеем дело отнюдь не с точечным осветителем, и неизбежно произойдет наложение дифракционных кружков, созда- создаваемых излучением разных точек источника. И уж во всяком случае некогерентно излучение отдельных точек самосветящегося объекта. Правда, в грубом приближе- приближении, которое оказывается доста- достаточным при решении большин- большинства практических задач, оценки разрешающей силы в обоих слу- случаях (т. е. при рассмотрении ко- когерентного или некогерентного освещения) не расходятся очень сильно. С принципиальной же ^LZl^ZS^J точк* зрения чрезвычайно ин- /- дифракционный максимум объектива О,; ТеРеСН0 Замечание Д. С. РоЖДе- 2 — дифракционный максимум объектива О* СТВеНСКОГО , ВПерВЬЮ ПрвДЛО- жившего считать освещение объекта в микроскопе частично когерентным. О его работах стоит вспомнить теперь, когда понятие частичной когерентности квазимоно- квазимонохроматической волны получило столь существенное развитие, истоки которого часто связывают лишь с формулировкой теоремы Цернике. Уточним постановку задачи об освещении объекта в микроскопе, воспользовавшись введенными ранее понятиями (см. § 6.6). Объектив Ох (рис. 6.77) служит для освещения объекта, который находится в пло- плоскости изображения круглого некогерентного однородного излучателя 5. Исследуем степень когерентности колебаний в двух точках Рг и Р2 объекта, рассматриваемого с помощью объектива 02. Можно показать, что степень когерентности освещения объекта будет определяться углом раскрытия 20! объектива С^.При этом если точки Рг и Р2 лежат в пределах центрального дифракционного максиму- максимума, обусловленного объективом Ои то чем меньше расстояние РгР2> тем выше степень когерентности колебаний | Yi21 в этих точках. Так, например, если РгР2 примерно равно 0,3 ширины указанного дифрак- дифракционного максимума, то степень когерентности колебаний в этих точ- точках составит примерно 90%. Для того чтобы убедиться в справедливости приведенных выше утверждений, снова обратимся к рис. 6.77. Размеры излучателя S ве- велики, он расположен близко к объективу Olf и угол 2 а оказывается достаточно большим, чтобы отношение У B а) было сколь угодно малым. ♦ Первое сообщение акад. Д. С. Рождественского о разрешающей силе микроскопа опубликовано в Трудах ГОИ в 1938 г., т. е. одновременно с работой Цернике. 290
Йо по теореме Цернике это отношение и определяет степейь когерентно- сти колебаний в плоскости Ог. При d = 1,22 К/ B а), значительно меньшем диаметра объектива Olf возникает первый минимум на кривой 17121 и можно считать, что весь объектив Ог освещен некогерентно. Тог- Тогда для выяснения основного вопроса — определения степени когерент- когерентности колебаний в точках Рх и Р2 — нужно решать аналогичную задачу, считая, что объектив освещен некогерентным излучателем, размеры и положение которого в точности совпадают с объективом Ог. Очевидно, что степень когерентности колебаний в плоскости распо- расположения объекта будет определяться отношением К/ B@г), т. е. ши- шириной дифракционного максимума, обусловленного объективом О±. Как уже указывалось, наблюдение точек Рг и Р2 проводится с по- помощью объектива О2, угол раскрытия которого равен 2 в2. Разрешить эти точки можно лишь тогда, когда расстояние РгР2 больше ширины дифракционного максимума, создаваемого объективом О2. Следова- Следовательно, выгодно сделать этот максимум достаточно узким, для чего нужно, чтобы 2в2 было велико. Объективы микроскопов всегда рас- рассчитывают так, чтобы угол раскрытия 2в2 (апертура объектива) был как можно больше. Исследуемый предмет освещен некогерентно, если точки Р1 и Р2 находятся вне дифракционного максимума объектива осветительной системы Ог. Это происходит, когда угол раскрытия 20! велик и поэто- поэтому дифракционный максимум от Ох узок. Разрешение и в этом случае определяется углом раскрытия объектива микроскопа 2в2. Итак, условия освещения объекта определяются раскрытием объ- объектива осветителя 2вь а разрешение зависит от угла раскрытия объ- объектива микроскопа 2в2. Обычно для этих углов справедливо соотно- соотношение 2©х < 2в2 и, если исследование ведется вблизи предела разре- разрешения, можно считать, что любой несамосветящийся объект освещен когерентно. Оценим теперь наименьший допустимый размер dUVLK предмета, который еще можно рассмотреть в микроскоп. Очевидно, что ШМин будет характеризовать его разрешающую силу. Объектив микроскопа рассчитывают и изготовляют так, чтобы вы* полнялось условие синусов ndsln u = n'd'sin u\ F.113) так как это необходимо для устранения некоторых аберраций. В общем случае можно считать п'= 1 и п > I, так как для увели* чения угла раскрытия обычно используют иммерсионные объекти- объективы. Из рис. 6.78 находим, что ^ F.114) Следовательно [см. F.113)], d' = BnS'dsin u)ID. Очевидно, что размер изображения предмета должен превышать ширину дифракцион- дифракционного максимума объектива микроскопа (или в крайнем случае равен ей)* Ю* 291
Таким образом, 1,22— S'<2nS' — sin и. F.115) Отсюда получается окончательное неравенство F.116) Величина п sin и называется числовой апертурой микроскопа. Она равна примерно 1,5 и, значит, d « 0,4 Я, т. е. для видимой области МИН /ч^ £* "**■* Ш| Сравнивая соотношение ШМин ~ (ftsina)A, с выражением для разрешающей силы телескопа [см. F.100)], заметим существенную разницу: разрешающая сила микроскопа зависит не от диаметра объ- объектива, а от угла его раскрытия. Для увеличения разрешающей силы выгодно увеличивать число- числовую апертуру микроскопа. Но возможности увеличения ее ограниче- ограничены. Целесообразно переходить к более корот* ким волнам. Для освещения объектов часто используют синие лучи (например, яркую ли- линию ртути 4358 А) и даже ультрафиолетовое излучение. В этом случае приходится изготов- изготовлять всю оптику из кварца и использовать люминесценцию каких-либо экранов для реги- регистрации изображения, что весьма усложняет измерения. Однако опыты Е.М. Брумберга, создавшего ультрафиолетовый микроскоп, указывают на возможность примерно в два раза увеличить разрешающую силу (по срав- сравнению с обычными микроскопами), что очень существенно в различных биологических при- приложениях. Наиболее эффективным и радикальным способом увеличения разрешающей силы ми- микроскопа является переход к электронной оптике. В этом случае \ = h/(mv) и ускоряю- ускоряющему потенциалу 150 В соответствует длина волны де Бройля поряд- порядка 10~8см, т. е. в 5000 раз меньшая, чем при оптических измерениях*. Хотя в данном случае аппаратурные погрешности, в основном свя- связанные с прохождением пучка электронов через исследуемый объект, лимитируют возможность увеличения разрешающей силы электрон- электронного микроскопа, все же удается примерно в 100 раз уменьшить пре- предельную величину изучаемых объектов B-10~7 см вместо 2-10~6 см). Детальное рассмотрение специфических особенностей и возможностей ♦ Здесь % — длина волны де Бройля, с помощью которой можно описать дифракцию пучка электронов; h —- постоянная Планка; v — скорость электро- электронов в пучке. Обоснование формулы к = hl(mv) см., например, в кн.: Ш п о л ь- с к и й Э. В. Атомная физика. М., Физматгиг, 1963, § 140. 292 \ пи р + f S Рис. 6.78. К вопросу о разрешающей силе ми- микроскопа
применения электронного микроскопа нетрудно найти в ряде спе- специальных руководств. При оценке разрешающей силы оптического микроскопа не учиты- учитывалось никаких эффектов, связанных с когерентным освещением объ- объекта. Следовательно, полученный выше результат годится и для само- самосветящихся объектов. При когерентном освещении объекта получается примерно та же величина разрешающей силы микроскопа. Приводимый ниже расчет Аббе сыграл существенную роль в развитии теории и прак- практики оптических измерений. Пусть объектом служит одномерная дифракционная решетка с по- постоянной d (рис. 6.79). Будем считать ее плоской, что приемлемо, так как в микроскопе исследуются тонкие препа- препараты, а глубина резкости столь сильного — объектива мала. Плоская волна проходит сквозь решетку, распространяясь вдоль опти- оптической оси микроскопа перпендикулярно плоскости решетки. В главной фокальной плоскости объектива получается спектр — со- совокупность дифракционных максимумов и ми- минимумов, — который можно наблюдать, если вынуть окуляр микроскопа. Аббе называет этот спектр первичным изображением объекта. В фокальной плоскости собирающей линзы — окуляра — получается изображение объек- объекта — дифракционной решетки (по Аббе, вто- вторичное изображение). Это изображение возни- возникает в результате интерференции пучков све- света, исходящих из дифракционных максимумов разных порядков. Качество изображения будет определяться числом интерферирующих4 пучков — чем больше максимумов открыто, тем выше качество изо- изображения. В этом легко убедиться на опыте: в фокальную плос- плоскость объектива микроскопа можно ввести диафрагму, закрываю- закрывающую те или иные дифракционные максимумы. Если открыт только один максимум (например, нулевой), то никакого изображения не получится — в окуляр будет наблюдаться равномерно освещенное поле. Зависимость изображения от того, какие максимумы открыты, иллюстрирует следующее интересное наблюдение: если с помощью специальной диафрагмы закрыть все нечетные максимумы и оставить открытыми только четные, то будет наблюдаться ложная структура — изображение будет соответствовать решетке с двойным числом штри- штрихов (т. е. с постоянной d/2, а не d). Действительно, в данном случае условие возникновения максимума sin ф = 2тШ = rrikl (d/2). , Угол раскрытия объектива микроскопа должен обеспечить возмож- возможность взаимодействия хотя бы двух пучков света. Следовательно, апер- апертура микроскопа и должна превышать фх — угол дифракции, соответ- itttitm Рис. 6.79. К дифракцион- дифракционной теории микроскопа Аббе 293
сГвующий максимуму первого порядка: sin и > sin фг = Ш. F.117) Если исследуемый объект (дифракционная решетка) погружен в среду с показателем преломления п (иммерсия), то sin и>Л/ (nd). F.118) Теперь учтем роль наклонных пучков. Можно так осветить решетку, чтобы в поле зрения появились лишь нулевой и один из первых макси- максимумов (m= ± 1). И в этом случае возникает изображение объекта, хотя угол раскрытия становится в два раза меньше: sin «>0,5 X/ (nd). F.119) Последнее неравенство позволяет записать для наименьшего раз- размера предмета d, который еще можно наблюдать в микроскоп при коге- когерентном освещении объекта, следующее соотношение: d>0,5 Л/(я sin и). F.120) В пределах погрешности, сопутствующей подобного рода оценкам, оно не отличается от F.116), которое было получено ранее без предпо- предположения о когерентном освещении объекта. Значение предложенного Аббе метода оценки разрешающей силы микроскопа заключается также в том, что он открывает дополнитель- дополнительную возможность его применения: любой волнистый рельеф можно рассматривать как некоторую фазовую решетку. Для наблюдения ее изображения нужно превратить такую фазовую решетку в амплитуд- амплитудную, т. е. в систему светлых и темных полос. В теории фазовой решетки* доказывается, что это можно сделать, если каким-либо способом умень- уменьшить или увеличить на л/2 разность фаз между волнами, ответствен- ответственными за нулевой спектр и спектры высших порядков. Цернике указал, что для этого достаточно внести тонкую стеклянную пластинку в фо- фокальную плоскость объектива микроскопа. На область в центре такой пластинки, где локализован максимум нулевого порядка, наносится тонкий прозрачный слой, который изменяет на п/2 фазу волны, рас- распространяющейся в направлении только этого спектра. Для осущест- осуществления такого изменения фазы слой вещества с показателем преломле- преломления п должен иметь толщину Я/4 (п — 1). Этот метод, получивший название фазового контраста, позволяет исследовать очень нечеткие структуры и играет большую роль в различных приложениях. В заключение укажем, что представления, сформулированные Аббе, несомненно сыграли роль при создании нового метода получения высококачественного изображения (голография), к рассмотрению ос- основ которого мы сейчас и приступаем. * См.: Зоммерфельд А. Оптика, § 36. 294
§ 6.10. ПРЕДСТАВЛЕНИЕ О ГОЛОГРАФИИ Зернило Голографией называют систему методов записи и воспроизведения пространственной структуры монохроматических (или квазимонохро- квазимонохроматических) оптических полей. Нетрудно усмотреть частичную общность задач голографии и фото- фотографии — запись, хранение и воспроизведение зрительных образов объектов. Однако фотография позволяет записывать лишь подобия плоских проекций распределения поверхностной освещенности объ- объекта, в то время как голография дает возможность точно воссоздать пространственную структуру свето- светового поля, рассеиваемого объек- объектом, т. е. создать его оптическую копию, визуально не отличимую от оригинала. Идея записи и воспроизведения структуры электромагнитных полей была впервые высказана и проде- продемонстрирована Дэннисом Габором в 1948 г. Им же введен термин «голограмма» (в переводе — «пол- «полная запись»). Работы Габора не имели широкого развития до появ- появления лазеров, так как для голо- голографии необходимы источники све- света с высокой пространственной и временной когерентностью при тре- требованиях к мощности, несовмести- несовместимых с возможностью обычных ис- источников света. Как самостоятель- самостоятельная область оптики голография возникла после работ Лейта и Упатниекса A960—1963), впервые продемонстировавших высококаче- высококачественные голограммы сложных дву- двумерных и трехмерных объектов. Независимо от них Ю. Н. Денисюк опубликовал в 1962 —1963 гг. экспериментально подтвержденную идею объемных голограмм, имею- имеющих принципиальное преимущество перед известными ранее. Рассмотрим схему опытов по голографии. Исследуемый объект освещают пучком света лазера, предварительно уширенным простым оптическим устройством. Рассеянная объектом световая волна, а так- также исходная («опорная») волна, отраженная от зеркала, попадают на фотопластинку (рис. 6.80, а), на которой регистрируется возникающая интерференционная картина. Пластинка проявляется и фиксируется обычным образом; она содержит всю информацию о виде исследуемого предмета. Эта пластинка и называется голограммой. Внешне она ничем 295 Дейстдительное изображение Мнимое изображение Рис. 6.80. Схема получения голограмм При облучении голограммы светом лазера получаются действительное и мнимое изо- изображения объектива
не отличается от обычной равномерно засвеченной пластинки. Лишь при рассмотрении ее под микроскопом в некоторых наиболее простых случаях можно заметить упорядоченную микроструктуру, возникаю- возникающую в результате интерференции двух световых волн. Часто на голог- голограмме невооруженным глазом видны кольца или полосы, но они появ- появляются вследствие дифракции света на пыли и не имеют ничего общего с той информацией, которая связана с предметом. Для восстановления волны убирают исследуемый предмет и поме- помещают голограмму в то место, где находилась фотопластинка при фото- фотографировании. Освещая ее светом того же лазера, наблюдают через голограмму изображение предмета, которое получается там же, где находился объект. Если же голограмма несколько иначе ориен- ориентирована относительно направления опорной волны, чем фотопластинка при получении го- голограммы, то изображение окажется смещен- смещенным относительно того положения, где на- находился предмет. Получаемое объемное изо- изображение кажется столь же реальным, как и сам предмет, причем в нем сохраняется такое Рис. 6.81. К вопросу же распределение освещенности. Наблюдатель о возникновении голо- видит Предмет через голограмму как сквозь относительная ориентация дымчатое окно. В пределах голограммы он волновых векторов Ki и к2 может осматривать предмет, меняя точку зре- зрения, что приводит к совершенной иллюзии наблюдения реального объекта. Если голограмма достаточно велика для наблюдения двумя глазами, то объект воспринимается объемно. Полученное изображение можно сфотографировать, что осущест- осуществляется обычными методами. Кроме этого «мнимого» изображения удается обнаружить второе, «действительное» изображение (рис. 6.80, б), которое также можно за- зарегистрировать на фотопластинке, хотя увидеть его невооруженным глазом трудно. «Действительное» изображение будет иметь рельеф, обратный рельефу самого предмета, — все выпуклые места будут выглядеть вогнутыми, и наоборот. Перейдем к описанию теории явления. В основе голографии лежит дифракция света, поэтому для понимания физической сущности записи процессов и восстановления волновых фронтов полезно проследить ее на простейшем примере с привлечением теории дифракции. Пусть требуется зарегистрировать и восстановить плоский волновой фронт с волновым вектором klf нормальным к оси X и направленным под углом 0 коси Z (рис. 6.81). Поместим в плоскостьXOYфотопла- плоскостьXOYфотопластинку. В этом сечении распределение поля плоской волны имеет вид Сведения о направлении волны, содержащиеся в координатной зависимости фазы, полностью пропадают, если регистируется только интенсивность волны, — фотопластинка будет равномерно засвечена, 296
Сохранить информацию о фазе волны позволяет добавление опорйой волны. Пусть опорная волна Uz (r) также плоская и направлена по оси Z. Тогда распределение интенсивности на пластинке, очевидно, имеет вид "Slne F.121) т. е. представляет собой периодическую систему полос, параллель- параллельных оси X с пространственным периодом Я/sin 0. После экспониро- экспонирования фотопластинки и ее обработки получается плоская дифракцион- дифракционная решетка с синусоидальным законом амплитудного пропускания [если амплитудное пропускание линейно связано с освещенностью фото- фотопластинки; см. F.124)]. Это и есть голограмма исходной плоской вол- волны. Действительно, освещение такой гармонической решетки плос- плоской волной, тождественной опорной волне, приведет, как известно (см. § 6.4), к появлению двух дифрагированных плоских волн под угла- углами ± @i по отношению к оси Z. Напомним, что обычное условие диф- дифракции при нормальном падении dsinel = m\ F.122) где т — порядок дифракции для гармонической решетки имеет толь- только значения т = ±1,0 [см. F.54)]. Таким образом, освещение голограммы только опорной волной приводит к появлению как предметной, так и паразитной волны, сим- симметричной исходной. Ее возникновение связано с тем, что на обычной голограмме никак не фиксируется направление записываемой волны: голограмма не изменится, если эта волна будет распространяться в противоположном направлении. Заметим, что объемные голограммы этим недостатком не обладают. Произвольное волновое поле можно представить математически в виде суммы (в общем случае интегральной) плоских волн с различ- различными фазами и направлениями распространения. Каждая такая волна вместе с опорной даст свою дифракционную решетку, наложение кото- которых и является голограммой суммарного волнового поля. При таком описании пренебрегают интерференцией различных плоских состав- составляющих поля друг с другом. Это можно делать при условии, что ин- интенсивность опорной волны много больше, чем предметной, и тем са- самым много больше, чем интенсивность каждой из парциальных пло- плоских волн, на которые разлагается предметная волна. Совершенно аналогично вместо простейшего плоского поля можно рассмотреть голограмму сферической волны. В случае плоского опор- опорного фронта получающаяся голограмма имеет вид синусоидальной зонной пластинки Френеля, которая (см. § 6.1) при облучении плоской волной дает изображение точки—источника сферической волны. Раз- Разбивая произвольный объект на совокупность независимых точечных источников, для каждого из которых справедливы эти рассуждения, 297
Мы приходим к описанию голограммы произвольного поля Через нало- наложение множества зонных пластинок Френеля. Из этих общих соображений о физике процессов вытекают некото- некоторые особенности метода голографии. Так, например, каждый участок голограммы способен восстановить изображение всего объекта, но качество изображения при уменьшении площади голограммы ухуд- ухудшается. Эту важную особенность голографического метода иллюстри- иллюстрирует рис. 6.82. Негативная копия голограммы при ее освещении ис- исходным пучком дает такую же кар- картину, как и позитив. Это понятно, так как темные (неосвещенные) ча- части предмета не создают изображе- изображения, а интерференционные карти- картины от светлых точек воссоздадут изображение объекта как при осве- освещении негатива, так и позитива. Рассмотрение голограммы как некоторого подобия дифракционной решетки позволяет уяснить особен- особенности оригинального метода вос- восстановления волнового фронта, предложенного Ю. Н. Денисюком. В этом методе используют толсто- толстослойные (несколько десятков ми- микрометров) фотографические пла- пластинки. При встречных пучках (опорной и предметной волн) в тол- толще эмульсии возникает стоячая вол- волна. В результате фотохимических процессов в фотоэмульсии под дей- действием монохроматического света и последующей ее обработки получается своеобразная трехмерная диф- дифракционная решетка. Следовательно, можно восстанавливать изобра- изображение, используя источник сплошного спектра, так как трехмерная решетка пропустит излучение только той длины волны монохроматиче- монохроматического света, под воздействием которого она образовалась (см. § 6.8). Если исходное излучение (опорное и предметное) содержало несколько длин волн, то в толще эмульсии возникнет несколько пространствен- пространственных решеток. При освещении такой голограммы источником сплош- сплошного спектра можно получить объемное цветное изображение. Исследуем теперь физическую сущность голографического процес- процесса с несколько других позиций. Рассмотрение, приведенное ниже, при- примечательно тем, что оно является строгим и вместе с тем обходит те- теорию дифракции, которая всегда приближенна. Это достигается тем, что в ходе этого вывода не требуется знания связи вида оптического поля в различных пространственных сечениях — доказывается лишь возможность воспроизведения поля в том же сечении, где оно регис- регистрировалось. Ограничиваясь для простоты случаем двумерных ам- амплитудных голограмм, покажем в общем виде возможность записи и 298 Рис 6 82 Ух>дшение качества полу- получаемого изображения при уменьшении размера голограммы
воссоздания структуры произвольного монохроматического волнового поля. Представим его в виде V (г) = Vo (г) еш, где Vo (r) — комплекс- комплексная величина, характеризующая распределение амплитуды и фазы напряженности поля в пространстве. Поле V (г) создается, например, при рассеянии излучения лазера на поверхности некоторого объекта. Для получения записи (голограммы) поля V (г) необходимо второе поле U (г) = Uo (г) е/@/, называемое опорным или референтным. Чаще всего в качестве опорного поля используется плоская или сфе- сферическая волна. Однако это может быть, например, и поле, рассеян- рассеянное другим объектом. Единственно, что предполагается, — это по- постоянство интенсивности этого поля в некоторой плоскости простран- пространства, в которой производится запись, т. е. | Uo (г) |2 Ф f (r). Запись происходит в плоскости, в которой перекрываются поля V (г) и U (г). В этой плоскости интенсивность суммарного излучения с точностью до коэффициента, зависящего от выбора системы единиц, имеет вид / (г)=| V @ +f/ @12=) Vo (г) J + | f/0 (г) Р + Уо (г) t/S (г) +VS (г) t/0 (r). F.123) Действуя в соответствии с описанной выше методикой опыта, по- поместим в выбранную плоскость С фотопластинку и подвергнем ее дей- действию суммарного излучения (см. рис. 6.80, а), после чего проявим. Известно, что почернение фотоматериала есть сложная функция от экспозиции*). Однако можно выбрать такую область экспозиций, в'ко- торой амплитудное пропускание т приблизительно линейно связано с освещенностью фотопластинки /: т = т0_р/. F.124) Поместим обработанную фотопластинку в ту же плоскость и осве- осветим ее опорным полем U (г) (см. рис. 6.80, б). Поле V (г) уже не су- существует: его воспроизведение является задачей процесса. Непосред- Непосредственно за пластинкой (которая предполагается оптически тонкой) поле U (г) модулировано распределением почернения на пластинке и комплексная амплитуда результирующего доля W (г) имеет вид Wo(r) = *(r)Uo(r). F.125) Учитывая F.123) — F.125), получаем W0(r) = U0(r) [т0 — Р | С/о (г) И-1/0 (г) р|Ув(г)!«- - Р Vo (г) | Uo (г) |2 - р | Uo (г) |2 V*o (r). F.126) Таким образом, поле W (г), прошедшее через голограмму, содержит ряд слагаемых, из которых прежде всего обратим внимание на третье — Р У о (г) I U о (г) |2. Так как | Uo (r) \2 не зависит от координаты г, то это слагаемое описывает копию исходной волны V (г), отличающуюся от нее только постоянным множителем — р | Uo (r) |2. Остальные сла- ** Экспозиция — это произведение интенсивности освещения на время его воздействия на пластинку. 299
гаемые в F.124) описывают поля, которые в общем случае мешают наблюдению интересующего нас поля. Их устраняют различными приемами. Составляющая Uo (г) [т — р \U0 (r) |2] является копией опорного фронта и устраняется геометрически: если опорное и пред- предметное излучения имеют несовпадающие направления распростране- распространения, то, возникнув за голограммой, они быстро пространственно ра- разойдутся. Одновременно при этом устраняется и волна р | Uo (r) \ 2Vo (r) (описывающая, например, в случае плоского опорного фронта дейст- действительное изображение). Составляющая Uo (г) р ) Vo (r) |2 будет несущественной, если соблюсти условие | V (г) | < | U (г) |, которое требуется также для применимости линейного описания фотопла- фотопластинки F.124). Кроме того, она устраняется в связи с разным направ- направлением предметной и опорной волн. Указанный метод разделения полей основан на использовании из- излучения лазера для восстановления голограммы. Другой, более со- совершенный способ устранения неинформативных составляющих рас- рассеиваемого голограммой поля предложил Ю. Н. Денисюк. Созданные им трехмерные голограммы эффективно рассеивают только информа- информативную предметную волну и допускают восстановление изображения без помощи лазера (достаточно иметь яркий источник света с малыми угловыми размерами). Как уже указывалось, это достигается вслед- вследствие особенностей дифракции света на объемных квазипериодических структурах. Как следует из сказанного, голограмма в общем случае представ- представляет собой сложную структуру пятен, расстояние между которыми порядка длины волны. В связи с этим для изготовления голограмм требуются специальные высокоразрешающие фотоматериалы B000— 5000 линий на 1 мм; обычные фотографические пластинки позволяют разрешать около 100 линий на 1 мм). Создание таких мелкозернистых и одновременно достаточно чувствительных пластинок и пленок яви- явилось серьезной задачей для соответствующей области промышленности. При решении некоторых задач голографии нужно также сформулиро- сформулировать дополнительные требования к используемым лазерам, которые, впрочем, не являются исключением по сравнению с требованиями, предъявляемыми в других приложениях (речь идет о модовом составе, определяющем степень когерентности лазерного излучения). Мы коснулись только амплитудных голограмм. Кроме них сущест- существуют фазовые, основанные на преобразовании не амплитуды фронта волны, а фазы. Точно так же объектами голографирования могут быть не только рассеивающие объекты, но и прозрачные (чисто фазовые). Можно, например, изготовить голограмму, которая, как и линза, будет фокусировать свет. Такая голограмма была известна задолго до появления голографии. Это опять зонная пластинка Френеля! Различные применения голографии весьма интересны и разнооб- разнообразны. Так, например, можно заставить интерферировать волну, рас- рассеянную предметом в данный момент времени, с той зафиксированной волной, которая рассеялась в предыдущий момент. Для этого при вос- восстановлении не нужно убирать исследуемый предмет. Тогда можно наблюдать интерференцию восстановленной и рассеянной волн. Если 300
предмет изменился (скажем, произошли какие-то деформации), то его изображение окажется перерезанным интерференционными полосами, по форме которых можно оценить происшедшие изменения. Громадное преимущество такого способа изучения деформаций заключается в том, что все погрешности, вносимые формой предмета, диффузностью отражения и т. д., будут в данном опыте исключены, так как они оди- одинаково искажают обе интерферирующие волны. Но в этом варианте метода нужно точно установить голограмму на место фотопла- фотопластинки. Гораздо проще сфото- Рис. 6 83. Картина, наблюда- наблюдаемая при интерференционно- голографическом исследова- исследовании деформаций Рис. 6 84. Картина, наблюдаемая при интерференционно-голографи- ческом изучении газовых потоков в пламени свечи графировать на одну пластинку предмет в двух его состояниях и проводить восстановление волнового фронта обычным способом. В этом случае важно лишь, чтобы фотопластинка не сдвинулась между двумя экспозициями. Ниже приводятся фотографии, иллю- иллюстрирующие применение такого метода для определения деформаций (рис. 6.83) и изменения показателя преломления среды, создаваемого газовыми потоками в пламени свечи (рис. 6.84). За последнее время существенное развитие получили самые раз- различные направления работ по приложению голографических методов, К числу наиболее перспективных направлений следует отнести прост- пространственную фильтрацию сигналов и опознавание образов, изучение с помощью голографии акустических полей и др. Широким фронтом ведутся работы по созданию голографического кино и телевидения, но большие трудности, связанные с получением динамических голо- голограмм, затрудняют продвижение в этой актуальной области. В прак- практику спектроскопии входят дифракционные решетки, изготовленные голографическим методом.
ГЛАВА VII ОПТИЧЕСКИЕ ОПЫТЫ С ДВИЖУЩИМИСЯ ТЕЛАМИ В настоящей главе, заканчивающей изложение основ электромагнитной теории света, прежде всего рассмотрены классические опыты Физо и Майкель- сона, проведенные в конце XIX в. и многократно повторявшиеся в XX в. Цель этих экспериментов состояла в выяснении возможности установления существо- существования «абсолютного движения», т. е. движения тел относительно некоторой сре- среды, которая может служить единой системой отсчета. Отрицательный результат опыта Майкельсона был сформулирован Эйнштейном в виде исходного посту- постулата специальной тзории относительности. Таким образом, фактически здесь ис- исследуются экспериментальные основания этой фундаментальной теории. Изложение самой теории весьма краткое, так как подробное рассмотрение ее проводится в различных монографиях и общеизвестных руководствах. Вме- Вместе с тем более полно охарактеризованы применения специальной теории отно- относительности для истолкования ряда оптических явлений. В частности, количест- количественно исследован эффект Доплера, который уже неоднократно упоминался в пре* дыдущих главах. § 7.1. ЭКСПЕРИМЕНТАЛЬНЫЕ ОСНОВАНИЯ СПЕЦИАЛЬНОЙ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ Электромагнитная теория света, развитая Максвеллом и его после- последователями, — это стройная система, основанная на представлениях и законах классической физики. Она объединяет классическую меха- механику и электродинамику, включающую в себя теорию оптических и электрических процессов. Как известно, механика зиждется на законах Ньютона, а основой электродинамики служат уравнения Максвелла* При исследовании оптики движущихся тел прежде всего нужно выяс- выяснить, как скажется прямолинейное и равномерное движение среды, в которой происходят те или иные физические процессы, на описание их с помощью уравнений Ньютона и Максвелла. Другими словами, нужно выяснить, равноправны ли две инерциальные системы при опи- описании оптических явлений в рамках классической физики. Напомним читателю, как обстоит дело в классической механике. Пусть имеются две системы XYZ и X'Y'Z', причем равномерное и прямолинейное движение одной системы относительно другой совер- совершается вдоль оси X, совпадающей по направлению с осью X' (рис. 7.1). Для этих двух инерциальных систем справедливы очевидные соот- соотношения между координатами, которые называют преобразованиями Галилея: х' =x — vt, у' =у, г' = г. G.1) Введем также /' = ty хотя в классической механике при переходе от одной инерциальной системы к другой никогда не шла речь о какой- нибудь другой шкале времени, 302
Дифференцируя эти соотношения по /, находим: у' у Г) i/ L/ т! 7 A 9\ л —л с/, у —с/, с —<с. ^/ ,&) Полученный результат выражает связь между скоростями движе- движения в двух инерциальных системах и обычно называется теоремой сложения скоростей в классической механике. Второе дифференцирование по времени преобразований Галилея приводит к результату, который позволяет сделать существенные выводы о законах динамики в двух инер- , циальных системах: х' = х, у' = у\ г' = z, Yi откуда получаем: mx'=m'xt ту'=ту, tnzr=mz. G.3) Но выражения сил в двух инерциальных ^/^ системах должны быть также тождествен- тождественны, так как они зависят только от относи- рИс 7 1 Две инерциальиые тельных расстояний и относительных ско- системы, движущиеся одна ростей: относительно другой со ско- ^ ' р остью v f>x=-_fxj>y=fyyf'z=fz. G.3а) Соотношения G.3) и G.3а) означают, что уравнения Ньютона спра- справедливы в обеих системах или, как принято говорить, уравнения клас- классической механики инвариантны относительно преобразований Га- Галилея. В этом заключается механический принцип относительности движения, сформулированный еще Галилеем, который указал, что никаким механическим опытом нельзя определить, какая из двух систем, движущихся одна относительно другой равномерно и прямо- прямолинейно, покоится и какая движется. Механический принцип относи- относительности движения является обобщением опыта и подтверждается всем многообразием приложений классической механики к движению тел, скорость которых пренебрежимо мала по сравнению со скоростью света. Не будем пока затрагивать проблем, связанных с механикой боль- больших скоростей, а перейдем к оптическим опытам с движущимися телами в приближении v < с. Тут сразу же возникает ряд сложных проблем, для понимания которых необходимо охарактеризовать физические воззрения конца прошлого века. Уравнения Максвелла соответствовали опытным данным при иссле- исследовании электромагнитных явлений в неподвижных телах. Из этих уравнений следовало, что скорость света в вакууме является констан- константой, равной скорости распространения электромагнитных волн в среде, где 8 = ц, = 1. Предполагалась безусловная справедливость уравнений Максвелла при использовании в качестве системы отсчета так называе- называемого светоносного эфира, заполняющего все мировое пространство. Заметим, что электромагнитная теория света, которая заменила упру- гостную волновую теорию, непосредственно связанную с различными конкретными свойствами эфира, не сняла проблемы его существования. По воззрениям самого Максвелла, электромагнитные волны должны 303
распространяться в эфире. Таким образом, к началу XX в. понятие эфира существедно трансформировалось. Из твердой и упругой среды с весьма экзотическими свойствами, необходимыми для получения ос- основных соотношений волновой оптики (например, формул Френеля), эфир превратился в условную абстрактную среду, от которой требо- требовалось лишь выполнение функций системы отсчета, в которой справед- справедливы уравнения Максвелла. Но сразу же возникли трудности с записью законов электродинами- электродинамики в движущихся телах. Фактически подлежали рассмотрению две проблемы: 1) как в неподвижной системе отсчета (эфире) выглядят уравнения, описывающие электромагнитные явления, протекающие на движущих- движущихся телах; 2) как выглядят уравнения в системе отсчета, движущейся относи- относительно эфира. Другими словами, исследовался вопрос о переходе от одной инер- циальной системы к другой. При этом было ясно, что уравнения элек- электродинамики (в отличие от уравнений Ньютона) изменяют свой вид при преобразованиях Галилея. Это трактовалось как проявление не- неприменимости принципа относительности Галилея к электрическим и оптическим явлениям. С позиций электродинамики конца XIX в. никакого равноправия между различными инерциальными системами нет и существует выделенная система отсчета, связанная с мировым эфиром. Такая точка зрения и привела к постановке ряда опытов, имевших своей целью обнаружить «абсолютное движение», т. е. дви- движение приборов, измеряющих эти эффекты, или всей лаборатории относительно выделенной системы отсчета — мирового эфира. При построении теорий распространения электромагнитных волн в эфире исходили из двух противоположных точек зрения: 1) эфир полностью увлекается движущимися телами. На этом пред- предположении базировалась электродинамика, развитая в трудах Герца; 2) эфир неподвижен при движении в нем тел. Из таких предпосылок исходил автор другой теории Лоренц. Вопрос о том, какая из теорий справедлива, должен был решить опыт. Из всего многообразия экспериментальных исследований, свя- связанных с этой проблемой, опишем лишь два принципиальных опыта, критическое исследование которых позволяет прийти к весьма общему выводу, находящемся в противоречии как с электродинамикой Герца, так и с теорией Лоренца. Такое изложение в некоторой степени соот- соответствует формированию идей и накоплению экспериментальных дан- данных, которые нашли свое завершение в создании Эйнштейном специаль- специальной теории относительности. Сначала рассмотрим более простой эксперимент Физо. Принци- Принципиальная схема опыта представлена на рис. 7.2. Луч света от источ- источника S раздваивается на полупрозрачной пластинке Р. В результате внутри прибора свет распространяется как против течения воды (луч У), так и по ее течению (луч 2). После вторичного прохождения пластинки Р лучи 1 и2 снова соединяются и могут интерферировать^ 304
Если эфир полностью увлекается водой, то скорость света по от- отношению к воде ск = с/п одинакова для лучей 1 и 2. Если измерять скорость света относительно неподвижных зеркал интерферометра (т. е. проводить измерения в системе, покоящейся относительно установки), то должны получаться различные значения скорости света в лучах / и 2; а именно; сх + v для луча 2 и сг — v для луча / (постоянная скорость течения воды обозначена через v). Очевидно, что в покоящейся воде (v = 0) скорость света, измеренная по отношению к неподвижным зеркалам, одинакова для обоих лучей. Поэтому можно сравнить положение интерференционных полос на Рис. 7.2. Схема опыта Физо по определению коэффи- коэффициента увлечения выходе установки при покоящейся и движущейся воде и таким обра- образом выяснить, увлекается ли эфир движущейся водой или нет. Величина ожидаемого относительного сдвига интерференционных полос должна быть равна отношению At — времени запаздывания одной волны по отношению к другой—к общему периоду колебаний Т. Если 21 — путь, который проходят лучи 1 и 2 в движущейся (или поко- покоящейся) воде, то для отношения tatIT получим выражение М _ 1 / 2/ 21 \ G.4) Оценим Аф = Д//7\ пренебрегая членами порядка (и/сJ, т. е. учитывая эффект первого порядка относительно р = v/c: ^i. G,5) В экспериментах Физо действительно наблюдался сдвиг интерфе- интерференционных полос при переходе от измерений в покоящейся воде к из- измерениям в движущейся, но его величина была равна примерно поло- половине рассчитанного значения [см. G.5)]. Эти данные неоднократно проверялись самим Физо и другими авторами, но результат оставался неизменным: проявляющаяся в таких опытах скорость vt была меньше скорости v течения воды. Если обозначить vx через av, то для коэф- 305
фицпента увлечения а всегда получилось значение, примерно равное 1/2. Наиболее точные измерения Майкельсона и Морли A886 г.) при- привели к значению а = 0,43 ± 0»02, что находилось в согласии с соот- соотношением а = 1 — 1/п*, G.6) где п — показатель преломления воды. Заметим, что такой результат был предсказан Френелем. Опыт Физо первоначально и ставился для проверки этого соотношения. Зоммер- фельд оценивает предсказание Френеля как гениальную интуицию. К этому можно лишь добавить, что в данном случае имеется еще одно подтверждение того чрезвычайно высокого уровня, которого достигла в первой половине XIX в. упругостная волновая теория в трудах Фре- Френеля, Фраунгофера, Юнга и других выдающихся физиков того времени. Создание Максвеллом электромагнитной теории света позволило уничтожить внутренние противоречия старой упругостной теории и получить основные соотношения, обсуждавшиеся в предыдущих гла- главах, несравненно более простым способом. Но для обоснования приве- приведенного результата (а = 1 — 1/п2) необходимо развитие электромаг- электромагнитной теории. В § 7.2 мы вернемся к истолкованию опыта Физо в рам- рамках специальной теории относительности, а сейчас рассмотрим след- следствия этого опыта с позиций классической физики, на которой базиро- базировались конкурирующие теории в конце XIX в. Очевидно, что теория Герца, исходящая из полного увлечения эфира движущимися телами, не имела экспериментального подтверж- подтверждения. Поэтому нужно было искать возможность проверки теории Лоренца, базирующейся на представлении о неподвижном мировом эфире, в котором движутся исследуемые тела. Особенно интересными представлялись исследования среды с показателем преломления п = 1 (вакуум, воздух), так как в этом случае коэффициент увлечения а = 1 — 1/п2 = 0 и как будто открывалась возможность обнаружения «абсолютного движения», т. е. использования неподвижного эфира в ка- качестве единой системы отсчета для любых оптических и электрических измерений. Соответствующий контрольный эксперимент, сыгравший громадную роль в развитии физических идей, был впервые поставлен Майкельсоном в 1881 г. и неоднократно воспроизводился в XX в. (вплоть до 1964 г.) с непрерывным улучшением точности измерений. Опыт Майкельсона — это тонкий эксперимент, в котором учитывает- учитывается эффект второго порядка, т. е. принимаются во внимание члены по- порядка Р2 = (р/сJ. Проведем элементарное рассмотрение ожидаемых результатов опыта в таком приближении, полагая, что движение Зем- Земли на каком-то отрезке ее орбиты можно считать прямолинейным и рав- равномерным. Показатель преломления воздуха считаем равным единице. Интерферометр Майкельсона, устройство которого было под- подробно рассмотрено в § 5.8, устанавливается так, что одно из его плеч, например AM (рис. 7.3), совпадает с направлением скорости v орби- орбитального движения Земли. Плечо AM' перпендикулярно этому на- направлению. Найдем интервалы времени tt и /2» необходимые для того, чтобы свет прошел участки пути AM + MA и AM' + M'A. Очевидно, 306
что разность этих промежутков времени At = tx — t2, отнесенная к периоду колебаний Т, и определит ожидаемую величину смещения интерференционной картины, связанного с движением Земли по своей орбите. Вычисление промежутка времени tx не представляет труда: с i_ c^v ^ c+v Для оценки t2 учтем, что за время гам^ необходимое для прохож- прохождения светом пути AM', зеркало А переместится параллельно самому себе на отрезок vtAw- Соответствующее удлинение пути легко найти на рис. 7.4: 1 С 1/1 — t 2/ Искомая величина At = tx — t2 определится соотношением с \ 1_ G.8) G.9) Заметим, что в эксперименте измеряется сдвиг интерференционных полос при повороте интерферометра на угол я/2 по отношению к по- м м\ Рис. 7.3. Схема опыта Майкельсона, поставленного для обнаружения аб- абсолютного движения Рис. 7.4. К определению h в опыте Майкельсона ложению, указанному на рис. 7.3. Учитывая это, можно при оценках ожидаемого смещения Дф исходить из удвоенного значения Д/, вычис- вычисленного по формуле G.9): G.10) В первых опытах Майкельсона A881 г.) длина I пути света в интер- ферометре была около 1 м и ожидаемое смещение интерференционных полос, рассчитанное по формуле G.10), составляло примерно 0,04 по- полосы (скорость орбитального движения Земли v = 30 км/с, т. е. р = ф ~ 10~4 и р2 ~ 10"8). Примерно того же порядка была и чув- 307
Анализатор спектра ствительность измерений, т. е. тот наименьший сдвиг полос, который еще можно было обнаружить в данном опыте. В 1886 г. Майкельсон и Морли существенно усовершенствовали эксперимент. С помощью мно- многократных отражений длину I пути света они довели до 11 м, а для уменьшения вибраций и обеспечения возможности легко повернуть установку на 90° интерферометр был установлен на гранитной плите, которая плавала в ртути. Ожидаемое смещение Аф составляло пример- примерно 0,4 полосы, тогда как максимальное смещение, которое наблюда- наблюдалось на опыте, не превышало 0,02 полосы (при среднем смещении, значительно меньшем 0,01 полосы)*. Результаты этого чрезвычайно важного опы- опыта неоднократно проверялись многими исследо- исследователями. В опытах Йоса A930 г.) вся установка была закреплена на упругих подвесах и длина светового пути была около 21 м. Точность изме- измерений оценивалась в 0,001 полосы. Примерно такая же точность измерений была в опытах Кеннеди A926 г.) и др. Все эти эксперименты показали отсутствие смещения интерференцион- интерференционных полос, а наблюдавшееся в некоторых иссле- исследованиях (Миллер, 1925 г.) смещение, очевидно, было связано с какими-то экспериментальными ошибками. В настоящее время опыт Майкельсона вос- воспроизведен с громадной точностью Джаваном, Таунсом и др., исследовавшими в 1964 г. воз- возможное изменение частоты сигнала при пово- повороте на я/2 установки с двумя газовыми лазе- лазерами, расположенными перпендикулярно один другому (рис. 7.5). Ожидаемый эффект второго порядка по р2 составлял 3 МГц, тогда как возможные погрешности опыта не превышали нескольких герц. Было показано, что достигнутая в этом эксперименте точность в 45 раз больше точности упоминавшихся выше опытов Йоса. Таким об- образом, скорость предсказываемого теорией Лоренца «эфирного ветра», возникающего при движении Земли в неподвижном мировом эфире, не может превышать 30 м/с (при скорости движения Земли по орбите, равной 30 км/с) и отрицательный результат опыта Майкельсона может считаться доказанным с большой точностью, не допускающей никакой ревизии изложенного выше основного положения. Отрицательный результат опыта Майкельсона чрезвычайно услож- усложнил решение проблемы в тех рамках, в которых она была поставлена. Теория Лоренца оказалась не соответствующей опыту. Можно было предположить, что эфир полностью увлекается атмосферой Земли при * Приведенные данные взяты из письма Майкельсона к Рэлею, в котором он с уверенностью говорит об отрицательном результате своего опыта. Эти и дру- другие интересные материалы можно найти в сборнике, посвященном пятидесяти- пятидесятилетию создания специальной теории относительности (см. УФН, 1965,86, с. 421). Рис. 7.5. Схема уста- установки на лазерах для проверки результатов опыта Майкельсона 308
ее орбитальном движении, но это предположение ( теория Герца) про- противоречит результатам более простого (эффект первого порядка) опы- опыта Физо и другим оптическим измерениям, например явлению звезд- звездной аберрации (см. § 7.3), которые здесь не обсуждаются. Лоренц сделал попытку истолковать отрицательный результат опыта Майкельсона и тем самым спасти идею «абсолютного движения» в неподвижном эфире, предположив наличие контракции (сокращения) тел в направлении их движения (такое же предположение независимо от него выдвинул Фицджеральд). Он получил уравнения, описывающие изменение длины тел, движущихся прямолинейно и равномерно, — так называемые преобразования Лоренца, относительно которых урав- уравнения электродинамики вакуума оставались инвариантными. Но фи- физическая природа исходного предположения оставалась совершенно неясной, и теорию Лоренца нельзя было принять в качестве основы для истолкнования всех оптических и электрических измерений с ис- использованием движущихся тел. Было необходимо кардинальное физическое решение всей пробле- проблемы, которое и достигнуто в трудах А. Эйнштейна, создавшего в 1905 г. специальную теорию относительности. § 7.2. ПОСТУЛАТЫ ЭЙНШТЕЙНА И ИХ СЛЕДСТВИЯ Критический пересмотр установившихся понятий пространства и времени на базе глубокого анализа всего экспериментального и тео- теоретического материала, имевшегося к началу XX в., привел Эйнштей- Эйнштейна к построению теории, являющейся логическим завершением всей классической физики. Эту систему взглядов он обобщил в двух посту- постулатах, которые можно считать исходными позициями специальной тео- теории относительности. Первый постулат является развитием механического принципа относительности: утверждается, что никакими физическими опытами (т. е. используя не только механические, но и оптические и электри- электрические явления) нельзя установить, какая из двух инерциальных си- систем покоится и какая движется. Таким образом, постулируется бес- бесплодность попыток определения абсолютного движения тел с исполь- использованием любой системы отсчета, в том числе и гипотетического миро- мирового эфира. Второй постулат сводится к утверждению, что существует конеч- конечная максимальная скорость распространения любого взаимодействия, которая равна с — скорости света в вакууме. По принципу относи- относительности эта скорость одинакова во всех инерциальных системах и не зависит от длины волны, интенсивности и относительной скорости движения источника и приемника света. Тем самым отвергаются тео- теорема сложения скоростей в классической механике и различные по- построения, которые выдвигались в свое время для истолкования отри- отрицательного результата опыта Майкельсона — Морли. Для того чтобы стал понятнее глубокий смысл сформулированных выше постулатов, полезны следующие замечания, который вместе с тем позволят ограничить круг рассматриваемых вопросов. 309
Следует учитывать, что специальная теория относительности, ба- базирующаяся на этих постулатах, описывает только инерциальные си- системы. Конечно, в данной системе можно рассматривать ускоренное движение точки [см. формулы релятивистской механики G.28) и др.], но ускоренное переносное движение относится к проблемам, исследуе- исследуемым общей теорией относительности, развитой в последующих работах Эйнштейна A916 г. и позднее). Поэтому обречены на провал иногда встречающиеся в популярной литературе попытки применять фор- формулы специальной теории относительности к разбору всяких парадок- парадоксов, связанных, например, с движением ракет, стартовавших с Земли и вернувшихся на нее после того или иного полета в космосе. Следует помнить, что взлет и возвращение ракеты происходят с громадными ускорениями и поэтому при- применение аппарата специальной теории от- относительности [см. G.20) — G.24)] неза- незаконно. Вращение Земли также не является инерциальным движением, и его можно об- обнаружить как механическим опытом (маят- гФотопластштп ник Фуко), так и тонкими оптическими измерениями; последние ни в коем случае Рис. 7.6. Схема опыта Сань- не следует путать с изложенными ранее яка опытами Майкельсона — Морли и др., где делалась попытка обнаружить абсолютное движение инерциальной системы, которой может считаться Земля при ее орбитальном движении. Схема опыта Саньяка, в котором доказывалась возможность изме- измерить угловую скорость вращения какой-либо системы, представлена на рис. 7.6. Диск с закрепленными на нем тремя зеркалами и полупроз- полупрозрачной пластинкой (делитель пучков света) вместе с источником света S и фотографической пластинкой (на ней регистрировалась интерферен- интерференционная картина) может вращаться вокруг оси О с угловой скоростью Q. Тогда луч, направление обхода которого совпадает с направлением вращения, должен пройти больший путь, чем луч противоположного направления. При вращении системы появляется разность хода меж- между интерферирующими пучками света, пропорциональная угловой скорости Q. Если привести систему во вращение или изменить направ- направление вращения, то возникает смещение интерференционной картины, которое можно измерить на опыте. Для смещения интерференционных полос Дг нетрудно получить выражение где Q — площадь контура, охватываемого световым лучом (т. е, в данном случае площадь квадрата). При выводе G.11) можно исходить из того, что изменение частоты Av света в результате вращения определится формулой Av/v = AULt 310
где AL — изменение Длины пути света в результате вращения систему. Тогда после несложных преобразований получается формула * G.11). Следует отметить, что весь расчет (в приближении v <С £> где v^=rQ — скорость точек на окружности вращающегося диска) проводится в рам- рамках классической (нерелятивистской) физики, но его результаты хо- хорошо согласуются с данными опыта. Этот опыт был усовершенствован Майкельсоном и Гейлем, которым в 1925 г. удалось таким образом измерить угловую скорость вращения Земли. Они определили значение Az = 0,230 ± 0,05 полосы (как среднее из 269 наблюдений), но для этого пришлось пропустить свет внутри «закопанной в землю и откачан- откачанной кольцевой трубы диаметром 1 фут и длиной около 1 мили». Только в таких условиях (приводимые данные иллюст- иллюстрируют масштабы подобных эксперимен- экспериментов) удалось провести измерения угло- угловой скорости Земли с достаточной точ- точностью, так как при измерениях на воз- воздухе при столь большом оптическом пути интерференционная картина ока- оказывалась совершенно нестабильной. В современной технике для анало- аналогичных измерений используют свет га- Рис. 7.7. Схема опыта Саньяка зового лазера, вмонтированного В одно с применением лазера из плеч интерферометра Саньяка (коль- (кольцевой лазер), и измеряют скорость изменения интерференционной картины (в других терминах — сигнал биений разностной частоты; см. § 7.3) в зависимости от угловой скорости вращения системы (рис. 7.7). Установка, как правило, умещается на лабораторном столе, а точность измерений весьма велика. Подобные системы ис- используют для создания лазерных гироскопов, позволяющих с высокой точностью измерять проекцию угловой скорости вращения Земли и тем самым определять географическую широту в данной точке. Эти изме- измерения весьма тонки, и возникают различные эффекты (связанные с взаимодействием двух встречных волн), которые сказываются при очень малых угловых скоростях вращения системы. Так, например, укажем на явление «захвата», приводящее к искривлению эксперимен- экспериментальной кривой на рис. 7.8 и затрудняющее измерение малых угловых скоростей. Исследование с такими кольцевыми лазерами представляет интерес еще и потому, что в данном случае можно наблюдать генера- генерацию на бегущей волне, тогда как в обычных устройствах (где резонатор образован двумя противостоящими зеркалами) внутри резонатора возникает стоячая волна и незначительная часть ее энергии выходит через полупрозрачные зеркала резонатора. Обратимся к рассмотрению второго постулата. Инвариантность и конечность скорости света в вакууме фактически приводят к невоз- * Различные выводы формулы для эффекта Саньяка приведены в обзоре Привалова В. Е. и Фридрихова С. А. (УФН, 1969, 97, с. 377). Формула G.11) имеется также в кн.: Зоммерфельд А. Оптика, §15. 311
можности мгновенной передачи сигнала, характерной для всех теорий дальнодействия, в том числе и теории гравитации Ньютона. Поэтому необходимо как-то синхронизировать часы в двух инерциальных си- системах, движущихся одна относительно другой. Большой заслугой Эйнштейна является детальный разбор понятия одновременности со- событий в двух таких системах. Он показал, что если в одной системе введено местное время, то вследствие постулата постоянства скорости света оно будет иным по сравнению с местным временем во второй инер- циальной системе. Поэтому очевидное соотношение t = t\ которое всегда применялось в классической физике, следует заменить другой, более сложной связью. Для уяснения этих основных положений обратимся к следующему кажущемуся пара- парадоксу, основанному именно на некритиче- некритическом использовании соотношения t = f. Рас- Рассмотрим две инерциальные системы X, У, Z и X', Y'f Z', которые в начальный момент времени совпадали, а потом раздвинулись на отрезок vt (рис. 7.9). Если в момент / = 0 в центре (О = О') была создана сферическая волна, распространяющаяся в вакууме во все стороны со скоростью с, то по прошествии времени t будут наблюдаться две сферические волны с центрами в О и О'. В этом неправильном рассуждении игно- игнорировалась необходимость синхронизации ча- часов в двух исследуемых-..системах. Как уже указывалось, / Ф f и на опыте всегда будет наблюдаться одна сферическая волна. Очевидно, что, для того чтобы сферическая волна оставалась сферической при переходе от одной системы к другой, должны соблюдаться соотноше- соотношения: х2 + у2 + г2 = сН2 (система X, Г, Z, t), х" + у'л+г'*=:с2Г (система X',Y\Z',t'). . G.12) Очевидно, что —c2r=0. G.13) Я Рис. 7.8. Теоретическая (/) и экспериментальная B) зависимости частот биений Ф в лазерном ги- гироскопе от угловой ско- скорости Q вращения си- системы Величину Ух2 + у2 + г2 — сН2 называют интервалом. Она играет важнейшую роль в специальной теории относительности. Нетрудно показать*, что, допуская однородность и изотропность простран- пространства, для любого события, определяемого координатами х> у, г и мо- моментом времени t в одной из инерциальных систем и координатами х\ у\ г' и моментом времени f в другой, всегда можно записать соот- соотношение —с2Г. G.14) • См.: Ландау Л. Д., Лившиц Е. М. Теория поля. М., «Наука», ; Джексон Дж Классическая электродинамика M «Мир> 1965 См.: Лд 1967; Джексон 312 у Л. Д., Лившиц М Тр . М, Наук, Дж. Классическая электродинамика. M.f «Мир>, 1965.
Следовательно, интервал инвариантен при переходе от одной инер- инерциальной системы к другой. Таким образом, устанавливается важней- важнейшее следствие постулатов Эйнштейна, заключающееся в том, что про- пространство и время связаны между собой, образуя четырехмерное про- странство — время. Указанное свойство (инвариантность интервала при переходе от одной инерциальной системы к другой) можно использовать для полу- получения формул, связывающих координаты и время в одной инерциаль- инерциальной системе с координатами и временем в другой инерциальной си- системе. Эти соотношения, как уже указывалось, были впервые получены Лоренцем из требования инва- инвариантности уравнений Максвелла. В специальной теории относитель- относительности они получаются как прямое следствие сформулированных выше постулатов, а сокращение тел в на- направлении движения и изменение промежутков времени следует из самих преобразований. Таким об- образом, выявляется значение откры- открытия Эйнштейна: путем глубокого анализа исходных посылок он пре- превратил разрозненные и противоре- противоречивые наблюдения и гипотезы в стройную и законченную теорию, значение которой трудно переоце- переоценить. Вернемся к рассмотрению двух инерциальных систем (см. рис. 7.1), относительная скорость v которых направлена вдоль ОХ (О'Х). В начальный момент времени (t = 0, f = 0) точки О и О' совпадают. Для координат у п z преобразования будут предельно простыми, так как относительное движение вдоль OY и OZ не происходит, т. е. Рис. 7.9. К вопросу о синхронизации часов в двух инерциальных системах у' = = z. G.15) Наиболее общее линейное* преобразование, связывающее х\ f с х, tf имеет вид х' = а±х + a2t, ? = bxt + b2x. G.16) Коэффициенты а19 а2, Ьх и &2 зависят от v и при v дующие предельные значения: а2 Ьг Ьг 1 0 1 0 0 имеют сле- G.17) * Требование линейности связано с предположением об однородности и изо- изотропности пространства — времени. 313
Положение О' {х' = 0) в системе X, F, Z, t определяется урав- уравнением х = vt. Отсюда следует, что в соотношениях G.16) а2 = — vax. Подставляя G.16) в G.14) и считая выполненным условие G.15), на- находим fax + a2tJ — с2 (b±t + M2 = х2 - сЧ\ G.18) Приравнивая коэффициенты при одинаковых степенях независимых переменных (#3, xt, P), получим систему трех алгебраических урав- уравнений для нахождения коэффициентов alt bx и 62. Решение этой системы дает: G.19) Подставляя G.19) в G.16), получим окончательную'форму преоб- преобразований Лоренца, связывающих координаты в двух инерциальных системах, движущихся одна относительно другой равномерно и прямо- прямолинейно с относительной скоростью v, направленной вдоль оси ОХ (О'Х'), а именно: •,*. *-$S£ G.20, Очевидно, что х, у, г, t можно выразить через штрихованные пере- переменные. Это достигается простой заменой v на — v в формулах G.20) и перестановкой штрихов: Такой же результат легко получается при решении системы урав- уравнений G.20) относительно переменных х> у, z, t. Подчеркнем, что преобразования Лоренца G.20), G.21) получены здесь как прямое следствие постулатов специальной теории относи- относительности без априорных требований о сокращении линейного размера тел в направлении движения. Из анализа преобразований Лоренца можно сделать следующие су- существенные выводы: 1. Уравнения Максвелла инвариантны относительно преобразо- преобразований Лоренца, базирующихся на постулатах, обобщающих резуль- результаты оптических и электрических экспериментов. Непосредственная проверка подтверждает это заключение. 2. При v < с (т. е. когда Р -»- 0) преобразования Лоренца переходят в преобразования Галилея. Следовательно, механика Ньютона, урав- уравнения которой инвариантны относительно преобразований Галилея, справедлива лишь для v С с Для больших скоростей нужно сфор- сформулировать уравнения новой релятивистской механики, инвариантные 314
отйос^ельно преобразований Лоренца и переходящие в уравнений Ньютона при Р ->■ 0. 3. Вместе с тем скорость рассматриваемой системы отсчета всегда должна быть меньше ckopqcth света в вакууме, так как при v ^ с пре- рбразования Лоренца теряют смысл. Следовательно, скорость света в вакууме с = 3 • 1010 см/с является предельной скоростью. Очевидно, что это ограничение распространяется на все возможные случаи перено- переноса энергии. Сдорость сигнала, или групповая скорость, должна быть меньше скорости света в вакууме, но фазовая скорость волны может принимать любые значения, в том числе и превышающие скорость све- света в вакууме. При описании распространения радиоволн в ионосфере, оценке показателя преломления для рентгеновских лучей (п <. 1), а также в ряде других случаев уже указывалось, что и = с/п может быть больше с. Упоминавшееся выше сокращение тел в направлении движения яв- является прямым следствием полученных преобразований. Действитель- Действительно, пусть стержень длины I = х2 — хг покоится в системе X, У, Z. Определим, какую длину этого стержня V = х^ — х[ измерит наблю- наблюдатель, движущийся вместе с системой X', У, Z' со скоростью t>, направленной вдоль Ох (О'Х'). По определению, измерение х'2 и х[ нужно произвести в один и и тот же момент времени f. Воспользуемся для решения этой задачи уравнением x = (xr + vt')l]/~l — р2. Имеем x2VT=P=*X2+vt', x1VT=fL*=x[+vt'. G.22) Тогда l'=xi—xi = (xz—xx) VT^p=/VThP2. G.23) Следовательно, V < /, т. е. длина стержня, движущегося со ско- скоростью v относительно наблюдателя, уменьшилась в ]/ — Р2раз. Есте- Естественно, что к такому же результату мы пришли бы, рассматривая, какую длину стержня, покоящегося в системе X', У', Z', измерит наблюдатель, связанный с системой X, У, Z. После аналогичных пре- преобразований уравнения х' = (х — vt)lY\ — Р2 получим /' >> /, т. е. снова найдем, что стержень длиннее в той системе, относительно ко- которой он покоится. Напомним, что Лоренц был вынужден постули- постулировать такое сокращение тел в направлении движения, чтобы объяснить отрицательный результат опыта Майкельсона — Морли. В специальной теории относительности, как уже указывалось, фигурирует единое пространство — время, поэтому следует ожидать изменения промежутков времени (длительности) между событиями при переходе от одной инерциальной системы к другой. Пусть в точке А (х, у, г) измеряется промежуток времени между двумя событиями т = t2 — t± и требуется определить величину промежутка времени между этими же событиями в системе X', Yf, Z', движущейся равномерно и прямолинейно вдоль оси X со скоростью v относительно системы X, У, Z. Ясно, что нужно найти т' = й — ?и 315
пробедя это измерение времени при одном и тбм же значении кббрди- наты х. Необходимо подчеркнуть, что при решении этой задачи нельзя сразу перейти к штрихованным координатам (х\ у', г'), так как иссле- исследуемые события, промежуток времени между которыми измеряется, происходят в точке А с координатами х> у, z. Поэтому нужно восполь- воспользоваться уравнением f = ""'р ° 'х: F2=t, G.24) т. e. %' > т. Мы установили, что длительность процесса, измеренного в системе, относительно которой исследуемый объект движется, боль- больше, чем в той, относительно которой он покоится. В настоящее время представляется уже бессмысленным говорить о проверке этих соотношений. В технике современного физического эксперимента часто используют скорости частиц, близкие к скорости света с, и пренебрежение выражением G.24) привело бы, например, к тому, что нельзя было бы построить ускоритель частиц типа синхро- синхрофазотрона. Поэтому формулы специальной теории относительности обя- обязательно применяют при инженерных расчетах ускорителей. Совершенно необходим учет изменения промежутков времени между событиями, происходящими в движущихся системах, и в физике косми- космических частиц. Так, например, измерение времени жизни [х-мезона (частица с массой, примерно в 200 раз большей массы электрона, за- зарождающаяся в верхних слоях атмосферы Земли) приводит к значению т0 = 2 • 10"в с*. Даже если считать, что скорость мезонов близка к скорости света, то для них получается весьма малая длина пробега / «сто«600 м, исключающая возможность регистрации их в наземных лабораториях. Однако эта оценка неверна, так как в опытах факти- фактически измеряется время жизни покоящегося мезона, который затормо- затормозился при прохождении толщи атмосферы. Для того чтобы определить среднее время жизни мезона, движущегося с большой скоростью, нужно оценить тдв == то/}/1 — р2, которое при v « с может быть очень большим (тдв > т0). Однако вернемся к рассмотрению оптических экспериментов. Наша задача заключается в объяснении с позиций специальной теории отно- относительности эффекта, наблюдавшегося в опытах Физо. Сначала решим более общую задачу, т. е. получим релятивистскую формулу сложения скоростей. Очевидно, что для этого нужно записать соотношение, свя- связывающее их = dx/dt — скорость тела в системе X,Yf Znu'x — dx'ldt' — его скорость в системе X', Y\Zr. По-прежнему исходим из того, что одна инерциальная система движется относительно другой со скоро- скоростью i>, направленной вдоль ОХ (О'Х'). * См.: Ш п о л ь с к и й Э. В. Атомная физика. Т. 2. М., «Наука», § 318. 316
Из преобразований Лорейца имеем: x' + vdt' d Тогда dx dx'+vdt' dx' fdt' -\-v * Л dt'+(v/c*)dxf l + (v/c*)(dx'/dt') l+vu'x/c* Заметим, что скорость иу и uz связаны со скоростью и'у и и'г не столь просто, как у су' иге г'. В самом деле, а = ^ = 72б Л dt'+(v/c*)dx' l + vu'Jc* ' К ' ; Аналогичное выражение получается и для uz. Из последнего соот- соотношения следует, что иу зависит не только от значения и'у% но и от зна- значения и'х. Конечно, все эти формулы не должны противоречить посту- постулату Эйнштейна, согласно которому скорость света в вакууме должна оставаться одинаковой в обеих инерциальных системах (XYZ и X'Y'Z'). В этом легко убедиться, подставив в G.25), например, и'х = с. Тогда их = (с + v) I [I + (v/c2)c] = с. Для истолкования опыта Физо (см. § 7.1) не нужны преобразования Uz -*■ ti'z и uy -»• u'y, поэтому не будем заниматься более подробным рас- рассмотрением релятивистской кинематики. Введем обозначения: их — измеряемая на опыте скорость света относительно установки, т. е. в так называемой лабораторной системе координат: и'х == с/п — ско- скорость света относительно воды; v — скорость переносного движения воды. Оценку произведем, пренебрегая (v/cf, т. е. учитывая только эффект первого порядка относительно р = vie, что соответствует точности про- проводившихся измерений Тогда G.27) Это соотношение полностью согласуется с рассмотренными ранее экспериментальными результатами. Отметим, что при его выводе не делалось никаких предположений об увлечении эфира и оценки цели- целиком следовали из формул специальной теории относительности. Соот- Соотношение G.27) можно уточнить, если учесть изменение показателя преломления с длиной волны. Проверка уточненной формулы была проведена Зееманом в 1914 г. и показала полное согласие теории и эксперимента. Не будем последовательно излагать релятивистскую динамику и ограничимся лишь упоминанием о чрезвычайно важном вопросе — связи между массой и энергией, 317
Как показал Эйнштейн, основное уравнение динамики запишется в прежнем виде: f = dP/dt, если масса, измеренная в системе коорди- координат, относительно которой исследуемое тело движется со скоростью v, определяется выражением m=s "£_ G.28) а импульс Р = ту. G.28а) Очевидно, что при (J -> 0 получим т -> т0. Следовательно, кон- стайта т0 — это масса в той системе координат, относительно которой тело покоится (масса покоя). Проведем простые преобразования выражения G.28). Умножим обе части равенства на |/ — р2, возведем их в квадрат и умножим на с2: (теJ — (т\J = (т0сJ. Дифференцируя по t и сокращая на 2 т, получаем А<тс2\_ у —(mv)=0 или — (mc*)=(fv). G.29) dt v ; dtyj dt v ' v ' v ' A W7 Заметив, что правая часть G.29) равна —-g—-1, получаем Атс2 = AWm. G.30) Выражение G.30) можно трактовать следующим образом: если тело приобрело скорость v, то его кинетическая энергия будет определяться разностью между W = тс2 и Wo = т0с2 — так называемой энергией покоя. Это соотношение можно обобщить для энергии любого вида и утверждать, что изменению массы Am всегда соответствует изменение энергии Д№, т. е. Д№ = &тс\ G.31) Последнее соотношение чрезвычайно важно для всех разделов со- современной физики. В частности, оно показывает, какая громадная энергия сосредоточена в атомном ядре. Если исходить из среднего значения дефекта масс, примерно равного 0,006 единицы массы на один нуклон*, то окажется, что при объединении этих частиц в ядре выде- выделяется энергия, достигающая около 6 МэВ на один нуклон, что в не- несколько миллионов раз больше энергии обычных химических реакций A — 2 эВ на атом водорода). Значит, энергия связи частиц в ядре очень велика и представляется чрезвычайно заманчивой возможность ре- реализации хотя бы малой ее части. Соотношение G.31) имеет непосредственное отношение к кругу оптических проблем. Достаточно указать, что без его использования нельзя сформулировать понятие количества движения фотона—своеоб- фотона—своеобразной частицы, играющей основную роль в квантовой оптике (см. §8.5). * Дефектом масс называют разницу между суммой масс нуклонов (частиц составляющих ядро) и массой ядра. 318
В заключение упомянем об одном явлении, для описания которого не требуется применения формул специальной теории относительности (т. е. в этом смысле оно не является релятивистским), но открывается возможность яркой иллюстрации высказанного выше постулата о предельном характере скорости света в вакууме. Речь идет об эффекте, открытом в 1934 г. П. А. Черенковым, работавшим под руководством С. И. Вавилова. Теория явления была дана в 1937 г. И. М. Фран- Франком и И. Е. Таммом, позднее получившими за это открытие вместе с П. А. Черенковым Нобелевскую премию по физике. Первоначальная цель опытов Ва- Вавилова— Черенкова состояла в изуче- изучении люминесценции различных раст- растворов под действием 7"излучения. Было замечено, что в этих условиях сами растворители (вода, бензол и др.) испускают слабое свечение, характе- характеризующееся особыми свойствами (на- (направленность и поляризация излуче- излучения), отличающими его от обычной люминесцендии. Было выяснено, что фактически свечение вызывается не Y-излучением, а сопутствующими ему быстрыми электронами. Удалось установить возможный механизм явления, связанный с воздействием быстрых электронов на молеку- молекулы диэлектрика, в котором происходит их движение*. При построении теории явления было установлено, что эффект имеет место лишь в том случае, когда v—скорость электронов (в более поздних опытах использовались также протоны; рис. 7.10) больше фазовой скорости электромагнитной волны в этом веществе (аналогия из газовой динамики—снаряд обгоняет созданную им волну давления). Следовательно, v > с/п, но вместе с тем (в соответствии с теорией относительности) v < с. Таким образом, эффект Вавилова — Черен- Черенкова возникает при движении в диэлектрике заряженных частиц, скорости которых лежат в интервале Рис. 7.10. Схема опыта Черенкова с использованием протонов с/п < v < с. G.32) Соотношение G.32) иллюстрирует сформулированное выше утвер- утверждение, что именно с — скорость света в вакууме — является предель- предельной скоростью, а фазовая скорость электромагнитных волн, с которой не связан процесс переноса энергии, может быть как меньше, так и боль- больше с и ни в коей мере не ограничивает возможности движения тел в ис- исследуемой среде с любой скоростью v <. с. * См.: Шполъский Э. В. Атомная физика. Т. 1. Там же можно ознакомиться с фрагментом из Нобелевской лекции И. Е. Тамма, в которой чрезвычайно интересно обсуждается вопрос о предельной скорости. 319
§ 7.3. ЭФФЕКТ ДОПЛЕРА При рассмотрении интерференции света (см. гл. V) указывалось, что во многих практически важных случаях (например, при свечении плазмы низкого давления) уширение спектральной линии в основном определяется изменением наблюдаемой частоты, связанным с хаоти- хаотическим движением излучающих атомов. Такое уширение линии, лег- легко наблюдаемое на опыте, является следствием эффекта, играющего существенную роль в современной физике и по-разному проявляюще- проявляющегося при изменении условий эксперимента. Этот эффект был пред- предсказан X. Доплером A842 г.) для сугубо частного случая распростра- распространения акустических волн, целиком объясненного с позиций класси- классической физики. В оптическом диапазоне его б Ф й 2 l\ V ф впервые наблюдал Физо, заметивший смеще- смещение спектральных линий в излучении неко- _^п' торых небесных светил. В лабораторных уело- п виях первые наблюдения изменения частоты х спектральных линий при отражении света от *V движущегося зеркала были осуществлены А. А. Белопольским в 1900 г. Значительно Рис. 7.11. К вопросу позже был обнаружен поперечный эффект о продольном эффекте Доплера и тем самым получено эксперимен- Доплера тальное доказательство этого явления, пред- предсказанного теорией относительности. Мы получим здесь общее выражение для преобразования частоты, рассмотрим принципиальное различие эффекта Доплера в оптике и акустике, выясним, как проявляется эффект при направленном хао- хаотическом движении излучающих частиц, и в заключение охарактери- охарактеризуем возможность интерферометрического измерения малой относи- относительной скорости движения излучателя и приемника. Исследуем относительное движение источника электромагнитных волн и приемника, которое всегда можно разложить на продольное движение и движение, направление которого перпендикулярно линии, соединяющей исследуемые два тела. Вычисления ведут в предположе- предположении, что излучатель и приемник движутся равномерно и прямолинейно, т. е. рассматривают две связанные с ними инерциальные системы X, У, Z и X', У, Z'. Дисперсия среды не учитывается, волна распро- распространяется в вакууме (п = 1). Эти упрощения не снижают общности вывода и соответствуют условиям, обычно реализующимся при астро- астрономических измерениях. Проведем расчет продольного эффекта Доплера, используя преобра зования Лоренца. В этом случае относительная скорость движения приемника света и излучателя v и нормаль к плоской волне направлены вдоль одной прямой, которая совпадает с направлением оси Ох (рис. 7.11). Уравнение плоской волны в связанной с излучателем си- системе X, У, Z имеет вид Е - Re£0 exp U2nv (t — х/с)]. G.33) 320
В системе X', У, Z', связанной с приемником света, это выражение преобразуется: \i2nv ( *'+^х' --^Щ1 = L I yP VpvJ G.34) Но очевидно, что в системе X', Y\ Z' уравнение для плоской волны, распространяющейся вдоль оси О'Х\ должно иметь вид Е = Re Ео ехр [iW( f — x'lc)]. G.35) Сравнивая последние два соотношения, получим закон преобразо- преобразования частоты для случая, когда нормаль к фронту волны п и относи- относительная скорость v движения направлены вдоль одной прямой (про- (продольный эффект Доплера): Это выражение можно также записать в виде G.37) Если относительная скорость v мала (v<^c), то в достаточно точном приближении можно пренебречь членом порядка р2. Тогда для изме- изменения частоты получается следующая простая формула, которой обыч- обычно и пользуются при физических измерениях: v' = v (I — vie). G.38) Соотношение G.38) устанавливает линейную зависимость между v7v и р = vie. Следовательно, продольный эффект Доплера является эффектом первого порядка. Пользуясь упрощенным соотношением G.38) и вводя обозначение Av = v' —v, получаем выражение, в ко- котором в явном виде фигурирует доплеровский сдвиг частоты Av как функция р = vie, а именно = — vie. G.39) Учитывая, 4Todv/v = — dk/k> его можно записать в виде ДМ = vie, G.39а) где АХ = К' — X. Очевидно, чю сдвигу в область более длинных волн (v' < v, %' > Я, так называемое красное смещение) соответствует положитель- положительная относительная скорость приемника и излучателя (v > 0), т. е. источник и приемник электромагнитных волн удаляются один от дру- другого. При фиолетовом смещении (v' > v, Л/ < X) имеет место сбли- сближение источника и приемника света. Ниже эти соотношения будут проиллюстрированы примерами из астрофизики. 11 Зак. J729 331
Рассмотрим теперь возникновение поперечного эффекта Доплера. Пусть плоская волна распространяется вдоль OZ', а относительная скорость двух инерциальных систем направлена вдоль ОХ (ОХ'). Предположим, что в системе X, F, Z, связанной с излучателем, нормаль п к исследуемой волне будет составлять некоторый угол у с направле- направлением OZ (рис. 7.12). Запишем уравнение волны в системах X, У, Z и X', У, Z': Е = Re Ео exp [i 2nv' (f — z'/c)l G.40) G.41) Применяя к соотношению G.40) преобразования Лоренца, имеем Сравнивая G.42) и G.41), получаем закон преобразования частоты в данных условиях в виде v или v' = vVT=p. G.43) Разлагая правую часть G.43) в ряд и ограничиваясь членом вто- второго порядка по р, находим Av/v = — |52/2, где Av=v' — v. Следова- Следовательно, смещение спектральной линии равно Av/v = — р2/2, или ДМ = р2/2, G.44) где Av = v' — v, ДА, = Л' — Я. Соотношение G.44) показывает, что 7' о х при фиксации прямого угла между п и v в системе, связанной с приемником Рис. 7.12 К вопросу о попереч- света, поперечный эффект Доплера дол- ном эффекте Доплера жен приводить к красному смещению (ДЛ,>0). Проведенное выше рассмотрение, которое и привело нас к выраже- выражениям G.43) и G.44), базировалось на исходном положении, что направ- направление п распространения волны перпендикулярно скорости v прием- приемника или излучателя при измерении этого угла в системе X', У, Z', связанной с приемником, что обычно удобно при сравнении тео- теории сданными опыта. Если потребовать, чтобы угол между п и v был прямым в системе X, F, Z, связанной с излучателем, то получится другой результат. Действительно, запишем снова уравнение волны в системе коорди- координат X, F, Z при n j_ v: Е = Re£0 exp Ц2 nv( t — z/c)], 322
Если, используя преобразования Лоренца, перейти от системы X,Y,ZkX',Y',Z', to получится или V= Тогда =Pi „ли **-=_£ 2 % 2 G.45) G.45а) Очевидно, что при задании прямого угла между п и v в системе, связанной с излучателем, должно наблюдаться фиолетовое смещение Поперечный эффект Доплера—это эффект второго порядка относительно Р = vie (Av ~ р2), тогда как для продольного характерна линей- линейная зависимость смещения от р. Нетрудно заме- заметить, что поперечный эффект не меняет знака при замене +v на — v. Он много меньше про- продольного, но само его существование представ- представляется очень важным, так как в данном случае имеется качественное отличие от акустики, где никакого поперечного эффекта Доплера нет. Введем угол Т, который составляет (в си- системе, связанной с излучателем) направление нормали п к волне с линией, соединяющей излу- излучатель и приемник света. Тогда для продоль- продольного эффекта cos 4я = 1, а для поперечного cos W = 0. Формулы G.38) и G.45) можно объ- объединить в одно выражение, описывающее эффект Доплера в оп- оптике, а именно Рис. 7.13. К объясне- объяснению явления звездной аберрации v'=v G46) Заметим, что при вычислении поперечного эффекта мы фактически решили еще одну задачу, представляющую интерес для обсуждаемого круга вопросов. Речь идет об уже упоминавшемся явлении звездной аберрации, которое давно известно в астрономии и даже может служить одним из методов измерения скорости света. При наблюдении в телескоп неподвижных звезд приходится наклонять его ось относительно истин- истинного направления на угол у, который зависит от модуля и направле- направления скорости орбитального движения Земли в момент измерения и ис- испытывает годичные изменения (рис. 7.13). Выполняя измерения в раз- разное время года, можно найти тот угол у, под которым должна быть на- наклонена ось телескопа. Наибольшее его значение у = vie. Действительно, из выражения G.42) следует, что cosy = 1/^1 — Р2 или sin у = Р = vie. Если v<^c, то можно считать sin у « у = vie, что и оправдывается при астрономических измерениях. Вернемся к рассмотрению полученных основных результатов. Интересно провести сравнение изменения частоты при относительном движении излучателя и приемника, наблюдающегося при оптических 11* 323
измерениях, с аналогичным акустическим эффектом. Ёыше уже ука- указывалось, что само существование поперечного эффекта позволяет различить эти два явления. Но даже в ТОхМ случае, когда исследуется эффект первого порядка (т. е. пренебрегают членами, содержащими |52), можно обнаружить принципиальную розницу между акустическим и оптическим явлениями. В этом приближении получается внешне одинаковая форма записи продольного эффекта Доплера в оптике и акустике. Действительно, если обозначить vt — скорость приемника и v2 — скорость источника акустических волн9 распространяющихся в среде со скоростью и, то для изменения частоты можно воспользоваться хорошо известным вы- выражением, легко получаемым в рамках классической (нерелятивист- (нерелятивистской) физики*: G.47) U — V2 Обозначая vk — v2 через v> имеем при vx и v2, малых по сравнению с и, ,7.48) Однако между соотношением G.48) и очень похожим на него упрощен- упрощенным выражением G.38) существует следующее неустранимое различие. В акустике можно опытным путем определить как скорость приемника, так и скорость излучателя относительно среды, в которой происходит их движение [т. е. использовать формулу G.47)]. В оптике же в соот- соответствии с постулатами Эйнштейна речь может идти только об измере- измерении относительной скорости приемника света и излучателя, и никакими дополнительными экспериментами нельзя установить их абсолютные скорости. По образному выражению А. Зоммерфельда, природа не знает абсолютного движения ни источника света, ни наблюдателя. Она поступает проще и красивее, объединяя их в выражение типа G.38). Перейдем к исследованию того, как проявляется эффект Доплера при оптических экспериментах. Прежде всего укажем, что следует раз- различать направленное и хаотическое движение излучающих частиц, в котором они могут одновременно участвовать. К сдвигу частоты vie приводит лишь направленное движение ансамбля атомов, и прежде всего мы проанализируем те эксперименты, где проявляется именно этот вид движения. Практически всегда учитывается лишь продольный эффект, т. е. оп- определяется проекция относительной скорости на линию, соединяющую источник и приемник света. В частности, именно такая лучевая скорость звезд измерялась в классических опытах Физо, где сравнивалось по- положение спектральных линий от звезд и земных источников. По сей день измерение доплеровских сдвигов является основным методом * См.: Фриш С. Я., Тиморева А. В. Курс общей физики. Т. 1. М., Физматгиз, 1961. 324
ШООнм/с определения относительных лучевых скоростей Земли и небесйых светил. Продольный эффект Доплера обусловливает также расщепление на две компоненты спектральных линий, излучаемых двойными звез- звездами, т. е. системой из двух тел, вращающихсявокруг одного центра. Расстояние между звездами может быть столь мало, что обычными методами их нельзя разрешить, даже используя самые большие те- телескопы. При проведении астрономических измерений, основанных на эфффекте Доплера, был обнаружен ряд явле- явлений, истолкование которых вызвало широкую дискуссию, еще не исчер- исчерпавшую круг рассматриваемых воп- вопросов. Дело в том, что при наблюде- наблюдении спектров удаленных скоплений звезд (галактик) всегда фиксирует- фиксируется красное смещение, что соответ- соответствует удалению исследуемых све- светил. В некоторых случаях скорость удаления галактик, определенная из доплеровского смещения, была очень велика и достигала 0,3—0,4 скорости света в вакууме (сине- зеленые линии попадали в красную область спектра). Такие измерения иллюстрируются рис. 7.14. Эти наблюдения качественно подтверждали высказанную совет- советским ученым А. А. Фридманом A923 г.) гипотезу о расширяющейся Вселенной, которая может рассмат- рассматриваться как следствие общей тео- теории относительности, но грандиоз- грандиозные масштабы явления требовали его детального осмысливания и об- обсуждения как в физическом, так и в философском плане. В ходе дис- дискуссии были уточнены некоторые астрофизические аспекты проблемы и высказаны предположения о возможных дополнительных причинах наблюдаемого явления. Некоторые из таких предположений должны быть отвергнуты, как противоречащие всей сумме экспериментальных фактов (например, популярная в свое время гипотеза «старения кван- квантов» — изменение частоты света, доходящего от далеких галактик, в результате потерь энергии, увеличивающихся с ростом пути, прой- .:*;** >-? тот ш i nit й flpf UPt QD i •! SLi^ .;. МШтг Рис. 7.14. Спектры пяти галактик, в которых наблюдаются красные сме- смещения Смещения показаны горизонтальными стрелками разной длины 325
денного светом). Подробное исследование современных взглядов по этим сложным вопросам можно найти в специальной литературе*. Продольный эффект Доплера служит причиной смещения спектральных линий ионов, которые в результате воздействия электрического поля могут приобретать очень большие скорости направленного движения. На рис. 7.15 приведены результаты интер- ферометрического исследования смещения линий Аг-И относи- относительно линий нейтральных атомов этого же элемента (Аг-I), возни- возникавшее в результате движения ио- ионов под действием постоянного - **\~ ъ* электрического поля, направленного г£ ^ вдоль оси разрядной трубки. ^ 2| Большие смещения возникают в ё ^ современных установках (так называе- ; мый пинч-эффект), где движение ионов с большими скоростями используется для наблюдения различных эффектов, 'Ж Ar-J Ar-iT Рис. 7.15. Интерферограммы атом- атомной и ионной линий аргона Фотографирование производилось на одной половине щели спектрографа с изменением направления электриче- электрического поля. На ионной линии заметен доплеровский сдвиг Рис. 7.16. Спектр алюминия, по- полученный при большой скоро- скорости ионов: при изменении направления поля на противоположное линия иона АМН смещается, а линия ней- нейтрального атома A1-I остается на месте связанных с передачей энергии и количества движения нейтральным атомам. На рис. 7.16 приведена фотография спектра ионов алюминия в поле, направленном вдоль их движения, позволяющая наблюдать смещение спектральных линий на призменном спектрографе. Справа от исследуемой линии иона A1-III видна линия нейтрального атома A1-I, которая не испытала никаких смещений при переключении электрического поля на противоположное направление. Выявить наличие поперечного эффекта Доплера, как уже указы- указывалось, весьма трудно. Первые опыты такого рода были проведены лишь в 1938 г. и повторены в 1959 и 1961 гг. при наблюдении свечения возбужденных атомов водорода, летящих с очень большой скоростью (v « 3 • 108 см/с). Атомы приобретали эту скорость в результате стол- столкновений с ионами молекул водорода, ускоренными в электрическом поле. Наблюдалось как свечение самих атомов, так и отражение излу- излучаемого ими света от неподвижного зеркала. Остроумная методика позволяла отличить асимметричное смещение спектральной линии, * См.: Зельдович Я. Б. Теория расширяющейся вселенной, соз- созданная А. А. Фридманом. УФН, 1963, 90, вып. 3, с. 357. 326
связанное с наличием поперечного эффекта Доплера, от симметричного смещения, возникающего в результате того, что скорость пучка излу- излучающих частиц могла оказаться не строго перпендикулярной на- направлению наблюдения. Это усложнение методики опыта было необ- необходимо, так как даже малые отклонения от взаимной перпендикуляр- перпендикулярности скорости движения частиц и направления наблюдения приво- приводили к смещению того же порядка, что и исследуемый эффект. Согласно теории [см. G.44I, АУА, = E2/2. В экспериментах 1961 г. это значение было получено с ошибкой около 4%, тогда как в первых опытах ошибка достигала примерно 15%. Перейдем теперь к исследованию сле- следствий хаотического движения излучаю- излучающих свет атомов (ионов). В этом случае возникает уширение спектральной ли- линии, которое часто маскирует те или иные физические эффекты (в том числе и доплеровское смещение частоты, возни- возникающее при направленном движении из- излучающих частиц). Вследствие такого уширения спектральных линий иногда оказывается неэффективным увеличение разрешающей силы и дисперсии спект- спектральных приборов. Рассмотрим более подробно природу доплеровского уширения спектральной линии. Пусть имеется некоторый ансамбль излучающих атомов (ионов), участвующих в хаотическом тепловом движении. Как из- известно, в этом случае скорости частиц распределены по закону Мак- Максвелла, т. е. относительное число частиц dn/n, проекции скорости ко- которых лежат в интервале от vx до vx + dvx, определяется выражением м exp(-JML)dv G.49) 2nRT \ 2RTJ ' где М — молярная масса; R — универсальная газовая постоянная; Т — абсолютная температура; v — проекция скорости на направление наблюдения (лучевая скорость). t В согласии с G.39) запишем v2 = с2 (Av/vJ. Интенсивность излу- излучения / пропорциовальна числу независимо излучающих атомов. Обозначая через /v интенсивность излучения на частоте v, отличаю- отличающейся на Av от центральной частоты, имеем G.50) Рис. 7.17. Гауссовский контур линии, обусловленный эффек- эффектом Доплера при хаотическом движении излучающих частиц *v = J Анализ этого выражения показывает, что в результате хаотическо- хаотического, теплового движения спектральная линия уширилась. Получился колоколообразный контур, который называют еауссовским. Наиболь- Наибольшая интенсивность / = /0 будет в центре линии (рис. 7.17), а по мере увеличения Av/v отношение /v//0 будет стремиться к нулю. Оценим 327
ширину этого контура 6удоп = 2Av0, для чего найдем расстояние (в шкале частот) между двумя точками, для которых /v = /0/2. После подстановки значения Av0 в выражение G.50) находим Мс2 / Ду0 \2 « 2 2RT [ v ) ~ откуда G.51) В шкале длин волн получается следующее простое выражение, при использовании которого нужно подставлять длину волны в сантиметрах: G.52) Легко оценить, что для красной линии водорода На при температуре около 400 К ширина 6Яд0П «0,1 А. Для зеленой линии ртути, иссле- исследуемой при той же температуре, 6А,д0П ^ 0,005А. Следовательно, даже для тяжелых атомов доплеровское уширение существенно пре- превышает естественную ширину спектральной линии, связанную с умень- уменьшением энергии осциллирующего электрона в процессе излучения (в рамках классической физики 6Яест = 10~4А). Это подтверждает приведенные ранее оценки (см. § 5.2), где время когерентности тког сопоставлялось с величиной, обратной доплеровской ширине линии A/бядоп). Подобное приближение оказывается справедливым во всех случаях, когда мы вправе пренебречь уширением спектральных ли- линий вследствие столкновений (например, при свечении газоразрядной плазмы низкого давления). Полученные выражения можно использовать для спектроскопи- спектроскопического определения температуры светящегося газа. Измерив ширину доплеровского контура бА,д0П, по формуле G.52) определяют темпе- температуру газа. Если исследуется разряд при низком давлении, то обмен энергией вследствие столкновений мал и такую плазму нужно харак- характеризовать атомной, ионной и электронной температурами, причем ТйтФ Тион Ф Тьл (см. §8.1). При измерении высоких температур (Т по- порядка 106 К и более—«горячая плазма») обычно исследуют уширение ионных линий, так как при подобных температурах газ практически полностью ионизован. Уширение ионных линий велико, и обычо не требуется использования приборов высокого разрешения. Однако здесь часто возникают трудности, связанные с необходимостью учета направ- направленного движения ионов в электрическом поле, обусловливающего сдвиг спектральных линий.Иногда этот сдвиг выглядит какуширение спектральной линии, которое, конечно, нельзя использовать для оп- определения температуры, так как формулы G.49) и G.50) описывают уширение вследствие хаотического теплового движения излучающих частиц.
Мы упоминаем о таких достаточно специфических опытах, поскольку в них одна форма проявления эффекта Доплера маскирует другую, что иногда приводит к ошибкам в определении температуры горячей плазмы. В частности, по-видимому, такими ошибками были иска- искажены результаты английских исследователей, впервые объявивших в 1960 г. о достижении температуры в несколько миллионов градусов. Доплеровское уширение спект- спектральных линий в значительной степени лимитирует возможности оптической спектроскопии высоко- высокого разрешения. Изестно (см.§ 6.7), что, увеличивая коэффициент отра- отражения зеркал интерферометра при высокой точности их изготовления, повышая расстояния между отра- отражающими поверхностями и исполь- используя сложные интерферометры (мультиплексы), можно довести разрешающую силу интерферомет- интерферометра до значения порядка 107 и даже более. Однако при реализации столь большой разрешающей силы в оп- оптических экспериментах часто воз- возникают серьезные затруднения. Конечно, могут появиться задачи, при которых требуется с высокой точностью записать широкий кон- контур, но если обратиться к возмож- возможности раздельного наблюдения двух близких по длине волны линий при учете неизбежных флуктуации ис- источника, то, даже используя при- прибор высокой разрешающей силы, нельзя их разрешить, если допле- ровские контуры сильно перекрываются. Нетрудно оценить ту об- область, где возникают такие перекрытия: пусть £=5000 А и 6ХДОП== = 0,005 А; тогда ШХ ~ 10е, что и объясняет трудность реализации разрешающей силы, если она составляет несколько миллионов. Для уменьшения доплеровской ширины спектральных линий в спектроскопии высокого разрешения используют излучение специаль- специальных источников света. К числу таких источников относится разрядная трубка с полым катодом, изображенная на рис. 7.18. Применяемая для освещения спектрального прибора часть разряда локализована в металлическом отростке, который охлаждается. Если толщина стенок катода невелика и он изготовлен из металла, хорошо проводящего тепло, то при малых разрядных токах можно достичь достаточно низкой стационарной температуры излучающего газа (менее 200 К), что су- существенно уменьшает доплеровскую ширину спектральных линий. Такой источник света широко используют в спектральных исследо- исследованиях. дода Рис. 7.18. Разрядная трубка с полым катодом: / — полый катод; 2 — анодная часть труб- трубки; 3 — стеклянное окошко; 4 — холодиль- холодильник 329
Рис. 7.19. ^ Направление наблюдения Атомный пучок К методу скрещенных пучков Большие возможности открываются при излучении пучка атомов, возбуждаемых внешним источником света или пучком электронов (рис. 7.19). Наблюдение ведется в направлении, перпендикулярном движению излучающих атомов, и очень малое уширение спектральных линий связано лишь с небольшой расходимостью пучка (т. е. с наличием проекции скорости атомов на направление наблюдения). Правда, экс- эксперименты с использованием такого источника света затруднительны вследствие малой интенсивности исследуемого свечения. Если две близкие по длине волны линии излучаются лазером, то можно существенно улучшить условия их раздельного наблюде- наблюдения. Это иллюстрируется описанными выше интерферометрическими измерениями очень малых расстояний между продольными модами (см. рис. 5.63). Вернемся к рассмотрению прояв- проявления эффекта Доплера при направ- направленном движении. Нас будет интере- интересовать вопрос о том, какую минималь- минимальную относительную скорость движе- движения двух тел по одной прямой можно измерить по доплеровскому сдвигу. На первый взгляд, ответ на этот воп- вопрос не вызывает сомнений: выраже- выражение vie = Av/v связывает измеренное на опыте отношение Av/v с иско- искомым отношением vie. Если считать, что разрешение двух близких ли- линий лимитируется доплеровским уширением каждой из них, и учесть, что 6vдOп/v « 10~б — 10~в, то наименьшее значение v, которое можно определить из таких экспериментов, будет порядка 1 км/с. Известно, что примерно такая точность определения относительных лучевых скоростей Земли и небесных светил реализуется в астрономических исследованиях, основанных на определении сдвига спектральных ли- линий, излучаемых звездой, относительно линий, излучаемых земными источниками. Но при изменении условий эксперимента удается изме- измерить отношение Av/v со значительно большей точностью. Поэтому воп- вопрос о том, какую минимальную скорость относительного движения можно определить из измерений доплеровского сдвига, заслуживает более подробного обсуждения. Хорошо известно, что фазы двух монохроматических волн всегда скоррелированы и, встречаясь, эти две волны близких частот будут ин- интерферировать. Пусть фотоэлектрический умножитель (или какой- либо другой приемник света, работающий как квадратичный детектор) освещен светом двух монохроматических источников с частотами <ох и ш2> т- е« Ех = Е10 cos ((oxt + фх), Е2 = £2о cos (co2* + ф2)> G.53) где фх — ф2 =* яД/<Д + Дф0 — постоянная разность начальных фаз, в которую входит возможная разность хода Д/о двух рассматриваемых волн. 330
При оценке электрического сигнала на выходе фотоумножителя / ~ < (Ег + £2J > учтем, что все высокочастотные колебания (ча- (частоты 2 cdjl, 2 со2, (&>!+ со2) усреднятся приемником света и переменная часть фототока {сигнал биений) будет представлена модулированным сигналом с разностной частотой 2nf = щ — щ. G.54) Для его интенсивности можно написать / ~ Е10 Е20 cos [2 nft + (Д/<Д) я]. G.55 Для экспериментального осуществления интерференции двух волн, фазы которых скоррелированы, используем уже рассмотренную выше установку (см. § 5.8), представляющую собой интерферометр Майкель- сона, одно из зеркал которого может передвигаться с помощью спе- специального приспособления со скоростью ± v по отрезку длиной Д/х. Пусть интерферометр освещается светом фиксированной частоты <olf перед фотоумножителем устанавливается круглая или щелевая диафраг- диафрагма и электрический сигнал регистрируется с помощью осциллографа. В данном случае Дсо/со = ± 2 v/c, так как относительная скорость источника и приемника света при отражении его от зеркала, движу- движущегося со скоростью v, будет 2 v. Интенсивность сигнала имеет вид G.55), а разностная частота / определяется из соотношения 2nf = = ± 2 (vie) (ox. Как уже указывалось ранее, при такой постановке опыта на выходе интерферометра возникает нестационарная (бегущая) интерференционная картина, имеющая на экране осциллографа вид некой синусоиды с частотой /. Таким образом, наблюдается полное совпадение результата про- проведенного ранее (см. § 5.8) исследования интерференции двух волн одной частоты при разности хода, линейно зависящей от времени (Д = vt), и результата, полученного с использованием эффекта Доплера, где вычисляется сигнал биений с разностной частотой Д возникающий при взаимодействии двух волн с частотами (ог и со2 = = % A ± 2 vie). Устройство сканирующего приспособления позволило изменять скорость v в довольно широких пределах. Соответствующие разност- разностные частоты изменялись в пределах 40 -f- 120 кГц, и их без труда можно было измерить различными способами (например, сравнением карти- картины биений с синусоидой, получаемой от генератора стандартных сигна- сигналов). На рис. 5.50 представлена фотография экспериментальной кри- кривой на экране осциллографа при разностной частоте f«50 кГц. В этом опыте была измерена соответствующая данной частоте скорость дви- движения зеркала интерферометра v = ± 1,5 см/с. В описанном эксперименте интерферометр освещался светом неон- гелиевого лазера, излучающего одну частоту. Это позволило удалить подвижное зеркало М2 на несколько метров и таким образом проде- продемонстрировать возможность наблюдения интерференции при столь большой разности хода, так как длина когерентности для лазерного излучения значительно больше LKOr «3 — 30 см, характерной для обычных источников света. Но очевидно, что если зеркало М2 будет 331
передвигаться на расстояние, меньшее LKOr (Д/о близко к нулю—свето- нулю—световые, пути внутри интерферометра примерно равны, А/ меняется в пре- пределах нескольких сантиметров), то аналогичная интерференционная картина будет наблюдаться при освещении интерферометра светом обычного (нелазерного) источника, например спектральной линией, излучаемой газоразрядной плазмой, с шириной 6Хд0П. В этом убеж- убеждают нас, в частности, описанные выше классические опыты самого Майкельсона, который измерял видимость V интерференционных колец при постепенном увеличении разности хода, создаваемой перемеще- перемещением зеркала М2- Но если при остановках зеркала М2 наблюдалась стационарная интерференционная картина, то при его движении в ука- указанных пределах неизбежно должен возникать плавный переход от одной стационарной картины к другой, т. е. ее изменение во времени, и появится бегущая интерференционная картина. Возможность наблюдения сигнала биений при равномерном дви- движении одного из зеркал интерферометра Майкельсона, освещенного светом спектральной линии с шириной Асо, нетрудно подтвердить сле- следующими очевидными соображениями. Каждая волна с частотой (о$ породит соответствующую ей волну с частотой со$ A ± 2 vie), с которой она и будет интерферировать, создавая на выходе модулированный сигнал с разностной частотой 2я/ = ±2(v/c)a>i. G.56) Следовательно, при освещении интерферометра светом обычного источника частоты % по-прежнему будет наблюдаться попарное вза- взаимодействие двух скоррелированных волн с частотами сох и со2, при- причем постоянство скорости поступательного движения зеркала v и бу- будет определять степень их корреляции*. Конечно, при такой постановке опыта ширина сигнала биений уве- увеличивается и сигнал биений станет менее отчетливым. Должна умень- уменьшаться и видимость интерференционной картины, так как исследуется квазимонохроматическая волна и степень корреляции между сог и оJ = % A ± 2 vie) будет тем меньше, чем ближе разность хода А/ к LKOr. Если А/ окажется больше длины когерентности, определя- определяемой доплеровской шириной той линии, которой освещается интерфе- интерферометр, то интерференционная картина совсем пропадет. Возможны также затруднения с реализацией достаточно хорошего отношения сигнал/шум, так как яркость обычных источников заметно уступает яркости лазера. Можно продолжить перечисление технических трудностей, появ- появляющихся при наблюдении сигнала биений, возникающего при осве- освещении интерферометра уширенной спектральной линией, но они ничего не меняют в принципиальной постановке проблемы. Бесспорно, задав тем или иным способом корреляцию между двумя исследуемыми вол- волнами, можно наблюдать их интерференцию. Если частота о>2 задается * Не следует путать описываемый опыт с очень тонкими экспериментами Форрестора A955—1956), исследовавшего взаимодействие некоррелированных сигналов. 332
равномерным движением зеркала, от которого отражается часть иссле- исследуемого излучения, то будет происходить интерференция любой волны с частотой ©х, лежащей в пределах контура спектральной линии, с дру- другой волной частоты ш2, отличающейся от частоты первой на разност- разностную частоту 2 я/. Тогда будет наблюдаться сигнал биений, который позволяет определять сколь угодно малую скорость движения зеркала, так как можно зарегистрировать очень малые изменения интерферен- интерференционной картины. То минимальное значение скорости v9 которое еще можно измерить, определится условиями опыта. Но, конечно, это будут значения на много порядков меньше, чем те громадные скорости, о ко- которых шла речь ранее. Приведенная выше оценка точности астрономи- астрономических измерений лучевой скорости по эффекту Доплера (v ж 1 км/с) соответствует сравнению никак не скоррелированных источников света, которыми являются исследуемая звезда и какой-то земной источ- источник света, излучающий ту же спектральную линию. Возможность оптического определения сколь угодно малой ско- скорости относительного движения двух тел представляет несомненный интерес для практики. Использование в таких опытах излучения ла- лазера позволяет наблюдать интерференцию при большой разности хода, когда исследуемые тела удалены друг от друга на значительное рас- расстояние. Проведенное рассмотрение имело также своей целью в какой-то степени подготовить читателя к пониманию открывшихся за последнее время возможностей реализации исключительно точных оптических измерений, которые проводятся «под крышей доплеровской линии». Изложение таких современных методов оптической спектроскопии (интерференция атомных состояний, некоторые способы лазерной спек- спектроскопии) в рамках этой книги, к сожалению, невозможно.
ГЛАВА VIII ГРАНИЦЫ ПРИМЕНИМОСТИ ЭЛЕКТРОМАГНИТНОЙ ТЕОРИИ СВЕТА И ЭЛЕМЕНТЫ КВАНТОВОЙ ОПТИКИ Электромагнитная теория, дополненная электронными явлениями и уче- учетом релятивистских эффектов, была в начале XX в. единственной теорией света. Проблемы, служившие непреодолимой преградой для развития старой волновой теории, были решены с удивительной простотой и ясностью. Результаты прило- приложения электромагнитной теории к решению самых разнообразных физических задач являлись иллюстрацией, казалось бы, неограниченных возможностей но- новой волновой оптики. Но именно в это время возникли задачи, решение которых в рамках элек- электромагнитной теории оказалось невозможным. Так, например, были безуспеш- безуспешны все попытки количественно описать явление равновесного теплового излуче- излучения, а безупречный с позиций классической физики вывод формулы Рэлея— Джинса приводил к абсурдному результату. Смелая гипотеза Планка привела к решению этой проблемы и позволила сформулировать основы новой теории света, которую обычно называют физикой фогонов или квантовой оптикой. Этот процесс ломки старых понятий явился началом новой эры в развитии физики. При этом выявилась недостаточность некоторых представлений, которые на рубеже XX в. казались незыблемыми. Рассмотрению фундаментальных проблем, определяюших границы применимости электромагнитной теории света, и посвящена эта глава. § 8.1. РАВНОВЕСНОЕ ТЕПЛОВОЕ ИЗЛУЧЕНИЕ Как известно, в эксперименте и технике используют различные способы возбуждения световых волн. В этом разделе нас, в первую очередь, будет интересовать свечение раскаленных твердых тел, при котором убыль энергии тела из-за излучения компенсируется соот- соответствующим количеством теплоты, подводимым к телу. Такое све- свечение характеризуется сплошным (непрерывным) спектром и называет- называется тепловым излучением. Мы выдеяем тепловое излучение, противо- противопоставляя его различным видам люминесценции (свечение тел в ре- результате электрического рязряда, химических процессов и т. д.), так как это единственный вид излучения, который может находиться в со- состоянии теплового равновесия с различными телами. Остановимся подробнее на понятии теплового равновесия, очень важном для последующего изложения, в значительной мере связан- связанного с изучением энергетики процессов излучения и поглощения света. Для этого полезно обратиться к термодинамическому рассмотрению явлений внутри замкнутой полости. Пусть стенки этой полости пол- полностью отражают падающий на них свет. Поместим в полость какое- либо тело, которое будет излучать световую энергию. Внутри полости возникнет электромагнитное поле и в конце концов ее заполнит из- излучение, находящееся в состоянии теплового равновесия с телом. Рав- Равновесие наступит и в том случае, когда каким-либо способом нацело устранится обмен теплом исследуемого тела с окружающей его средой 334
(например, будем проводить этот мысленный опыт в вакууме, когда отсутствуют явления теплопроводности и конвекции). Лишь за счет процессов испускания и поглощения света обязательно наступит равновесие: излучающее тело будет иметь температуру, равную темпе- температуре электромагнитного излучения, изотропно заполняющего про- пространство внутри полости, а каждая выделенная часть поверхности тела будет излучать в единицу времени столько энергии, сколько она поглощает. При этом равновесие должно наступить независимо от свойств тела, помещенного внутрь замкнутой полости, влияющих, однако, на время установления равновесия. Плотность энергии электро- электромагнитного поля в полости, как будет показано ниже, в состоянии рав- равновесия определяется только температурой. Следует заметить, что плотность энергии электромагнитного поля внутри полости не равна объемной плотности тепловой энергии, сосре- сосредоточенной в находящихся там телах (так называемой внутренней энергии, которая определяется тепловым движением частиц тела и зависит не только от температуры, но и от свойств тела). При невы- невысокой температуре (например, 300 К) объемная плотность тепловой энергии тела будет на несколько порядков больше плотности энергии электромагнитного поля в полости, но в условиях равновесия соотно- соотношение между ними остается постоянным, так как тело получает от поля и отдает ему одно и то же количество энергии. Для характеристики равновесного теплового излучения важна не только объемная плотность энергии, но и распределение этой энер- энергии по спектру. Поэтому будем характеризовать равновесное излуче- излучение, изотропно заполняющее пространство внутри полости, с помощью функции Uv — спектральной плотности излучения, т. е. средней энер- энергии единицы объема электромагнитного поля, распределенной в интер- интервале частот от v до v + 6v и отнесенной к величине этого интервала. Эта важная характеристика электромагнитного поля приобретает особое значение в разделе курса, тесно связанном с термодинамикой излучения. Очевидно, что значение Uv должно существенно зависеть от температуры. Строго говоря, понятие температуры применимо лишь для равновес- равновесного теплового излучения, В условиях равновесия температура долж- должна оставаться постоянной. Однако часто понятие температуры также используют для характеристики раскаленных тел, не находящихся в равновесии с излучением. Более того, при медленном изменении параметров системы можно в каждый данный промежуток времени характеризовать ее температурой, которая будет медленно изменяться. Так, например, если отсутствует приток тепла и излучение обуслов- обусловлено уменьшением энергии светящегося тела, то его температура также будет уменьшаться. Заметим, что в современной физике понятием температуры поль- пользуются и в значительно более сложных с термодинамической точки зрения случаях. Так, например, при исследовании газового разряда говорят об электронной температуре Тэл, характеризующей среднюю кинетическую энергию хаотического движения электронов, а также ионной ТИ0Н и атомной Гат температурах, определяющих среднюю 335
кинетическую энергию хаотического движения ионов и атомов. Иногда (например, в плазме низкого давления, когда число столкновений между частицами мало) эти три температуры могут быть существенно раз- различны. При больших давлениях, когда число столкновений велико (на- (например, в плазме дуги, горящей при атмосферном давлении), средние кинетические энергии различных частиц выравниваются и такой источ- источник света можно характеризовать одной температурой. Для описания процессов излучения и поглощения световой энергии пользуются понятиями испускательной и поглощательной способности тел. Остановимся подробнее на этих важных характеристиках. Испускательной способностью г\ на- называют спектральную плотность dO%/dX потока лучистой энергии йФ, излучаемо- излучаемого единичной площадкой 8S во всех на- направлениях в интервале длин волн от Я до % + dk: 20 (8.1) Т=3000 К Ofi 1,2 16 Х,мпм Рис. 8.1. Зависимость испуска- испускательной способности черного тела от длины волны Штриховкой показана видимая об- область спектра Как известно, поток энергии с еди- единицы площади называют энергетической светимостью тела. Следовательно, испу- скательная способность — это энергети- энергетическая светимость тела в единичном ин- интервале длин волн. Испускательная спо- способность тела зависит от температуры этого тела и не зависит от температуры окружающих его тел, а также не зависит от того, находится ли это тело в равновесии с излучением или нет. Как уже указывалось, мы рассматриваем тела, которые излучают непрерывный спектр. Чтобы получить суммарную энергетическую светимость тела #эн, нужно проинтегрировать выражение для потока энергии r%dX по всем длинам волн от 0 до оо (рис. 8.1). Площадь, ограниченная на этом рисунке кривой гя, характеризует светимость R. ,«$Ч. (8.2) В некоторых случаях придется исследовать зависимость испуска- испускательной способности не от длины волны, а от частоты. Для такого опи- описания введем величину rv, подчеркнув этим обозначением, что в данном случае измеряется поток энергии /vfv, излучаемый единичной площад- площадкой в интервале частот от v до v +dv.,Очевидно, что | r^dX | = | /yiv |. Учтем, что dv = — (с/К2) dX. Следовательно, (8.3) 336
В дальнейшем изложении это равенство окажется полезным. Ино- Иногда вместо rv вводят пропорциональную ей величину г@ = с1Ф/с1(о. Очевидно, что г© меньше, чем /у. r<D=rv/Bn). (8.4) Второй важной характеристикой тел, участвующих в процессах поглощения и излучения световой энергии, будет поглощательная способность. Очевидно, что выбранная площадка 8S может не только излучать световые волны, но и поглощать падающий на нее поток световой энергии <1Ф. Однако, как правило, площадка 8S может поглотить лишь часть падающего на нее потока лучистой энергии (обозначим ее d<D'), так как световые волны могут также отражаться или рассеиваться*. Следова- Следовательно, йФ' < йФ. Отметим, что поглощение будет различ- различным для разных участков спектра. Так, например хорошо известно, что тонкий слой сажи практически нацело поглощает излучение в видимой части спектра, но в то же время характеризуется заметной про- прозрачностью для инфракрасных лучей. По- Поэтому, оценивая отношение йФЧйФ, обя- обязательно надо указать тот интервал длин волн (или частот), в котором проводится измерение поглощенного телом светового потока. Назовем поглощательной способ- способностью тела ал,ту часть потока световой энергии, падающего на единичную площад- площадку, которая им поглощается в ^единичном спектральном интервале вблизи длины волны Я. По определению, я* < 1. Тела, способные поглощать в любом интервале длин волн все падающее на них излучение, называют абсолютно черными. Для таких тел поглощательная способность тождественно равна еди- единице (ая = 1). Ниже будут подробно рассмотрены особенности излу- излучения абсолютно черных тел и охарактеризована простая модель теп- теплового излучателя, поглощающего весь падающий на него свет. \ , Вопрос о связи между испускательной и поглощательной способ- способностями различных тел подлежит детальному выяснению. Весьма про- простые опыты показывают, что чем больше энергии поглощает тело, тем больше оно излучает. Для демонстрации этой особенности теплового излучения измеряют поток световой энергии от двух стенок полого металлического куба, заполненного теплой водой (рис. 8.2). Одна из стенок снаружи блестящая — она много света отражает и мало погло- поглощает. Другая стенка зачернена. Ее коэффициент поглощения велик. Рис. 8.2. Куб Лесли * Предполагается, что световые волны не могут проходить сквозь площад- площадку &S. Коэффициент пропускания для нее равен нулю. 337
Фотоприемник (термостолбик), соединенный с чувствительным гальва- гальванометром, поочередно подносится к двум этим стенкам куба, и отброс гальванометра, регистрируемый при измерении интенсивности излу- излучения зачерненной стенки, будет во много раз больше, чем при изме- измерении светового потока от блестящей стенки. Кирхгофу принадлежит заслуга детального термодинамического исследования вопроса о связи между испускательной и поглощатель- ной способностью. Теорема Кирхгофа утверждает, что отношение испу- испускательной способности тела к его поглощательной способности за- зависит только от температуры тела, но не от его природы. В противном случае равновесное излучение не могло бы существовать в полости, где есть тела различной природы. Другими словами, отношение г%1а^ оди- одинаково для всех тел, т. е. является универсальной функцией длины волны (или частоты) и температуры: =(Ih\=...-lJh.)~fbn (8.5) Доказательство теоремы Кирхгофа основано на втором законе тер- термодинамики, по которому тепловое равновесие, установившееся в зам- замкнутой системе, не может быть нарушено простым обменом тепла между частями системы. Пусть в замкнутой полости наряду с другими телами имеется аб- абсолютно черное тело, поглощательная способность которого а-к = 1. Температура всех тел в состоянии равновесия одинакова. Тела, на- находящиеся в полости, обмениваются излучением, но этот обмен не на- нарушает тепловое равновесие. Поэтому излучение r^6S, посылаемое внутрь полости в единицу времени каким-то участком 6S стенки чер- черного тела, равно излучению, поглощаемому им за то же время. Так как черное тело поглощает все падающее на него излучение, то r%8S ха- характеризует все излучение, доходящее до выделенного участка стенки от всех остальных тел, находящихся в полости. Заменим 8S другой площадкой с той же температурой, но не являющейся частью абсо- абсолютно черного тела и характеризующейся испускательной Г\% и по- поглощательной ах\ способностями. За единицу времени эта площадка . 8S по-прежнему получает излучение rx6S, ибо это есть излучение, приходящее от всех остальных тел, оставшееся неизменным. Из этого излучения площадка поглощает только часть, равную a^/ifiS. За это же время она излучает поток энергии r^fiS. Так как тепловое равно- равновесие не может нарушаться этим обменом энергий, то должно быть utf/tfiS = rxiJbS, откуда ггх/аг\ = г\ — отношение испускательной способности к поглощательной, одинаковое для всех тел (т. е. пред- представляет собой универсальную функцию температуры и длины волны) и равное испускательной способности абсолютно черного тела. Методами термодинамики невозможно определить точный вид этой универсальной функции. В последующем термодинамическом иссле- исследовании Вина было показано, что f (К Т) = v*F (v/T), (8.6) где F (v/T) — неопределенная функция отношения частоты к темпе- температуре. 338
Формула Вина (8.6), безусловно, справедлива, так как она была получена исходя из самих общих соображений и законов термодина- термодинамики*. Она оказалась очень полезной при рассмотрении различных проблем, но для конкретизации вида функции F (v/T) было необходимо сделать какие-то предположения о механизме испускания света. Од- Однако вскоре выяснилось, что все попытки решения этой задачи в рам- рамках классической физики не приводят к согласию теории и экспери- эксперимента. В последующем изложении (см. § 8.3) мы подробно продиску- тируем вопрос о том, сколь кардинально должен быть изменен подход к решению этой задачи для того, чтобы такое согла- согласие оказалось возможным. Теорема Кирхгофа играет существен- существенную роль в термодинамике излучения и может быть использована для решения различных задач. В частности, рассмот- рассмотрим свойства абсолютно черного тела. По определению [см. (8.5)], его испуска- тельная способность равна введенной выше универсальной функции: Рис. 8.3. Модель абсолютно чер- r, = f(KT). (8.7) ЙОГ°Тела Это соотношение показывает, что все абсолютно черные тела имеют одно и то же распределение энергии излучения по спектру, а их энер- энергетическая светимость одинаково изменяется с температурой. Следо- Следовательно, открывается возможность экспериментальной проверки следствий закона Кирхгофа и опытного определения вида универсаль- универсальной функции / (А,, Т). Для этого необходимо создать тепловой излуча- излучатель, поглощающий все падающие на него лучи, и исследовать его испу- скательную способность как функцию длины волны и температуры. Экспериментальное решение такой задачи базируется на использова- использовании очень простой модели абсолютно черного тела. Представим себе (рис. 8.3) полое тело с очень маленьким отверсти- отверстием, через которое излучение может попадать внутрь полости и выходить оттуда. Любой луч света, попавший внутрь этой полости, после не- нескольких отражений будет поглощен ее стенками, а вероятность того, что он выйдет наружу, практически равна нулю. Такое полое тело должно с весьма большой точностью удовлетворять условию а% а 1, определяющему основное свойство абсолютно черного тела. Излучение, которое испускает такое тело, будет определяться температурой стенок полости**. * Формула Вина относительно просто выводится включением эффекта Доплера в термодинамическое рассмотрение гипотетической машины с подвиж- подвижными зеркалами (см.: Б о р н М. Атомная физика. М., «Мир», 1965). ** Читатель может заметить, что описываемая модель абсолютно черного тела предусматривает поглощение света стенками полости, температура которых и определяет спектральную плотность равновесного излучения. В этом случае оболочка и будет тем телом, которое находится в равновесии с электромагнит - ным излучением внутри полости. При такой схеме опыта удобнее задавать же- желаемую температуру абсолютного черного тела, чем в рассмотренной ранее мо- модели с зеркальными стенками. 339
Многочисленные примеры подтверждают реальность описанной схемы явления. Если взять коробку, покрашенную внутри белой краской, то малое отверстие в ней будет казаться совершенно черным. Столь же черными кажутся снаружи окна комнат, внутри которых достаточно светло в солнечный день. Бархат или другой материал с раз- разветвленной поверхностью кажется нам более черным, чем выкрашенная в черный цвет гладкая поверхность кожи или дерева. Число таких' примеров велико. На рис. 8.4 изображена схема эксперимента, позволяющего провести детальное исследование зависимости испускательной способности аб- абсолютно черного тела с использованием принятой выше модели. Из- Рис. 8.4. Схема эксперимента по исследованию г^ (к): / — лабораторная модель черного тела; 2— конденсор; 3— входная щель спек- спектрального прибора; 4, 6 — объективы коллиматора и камеры; 5 — призма; 7 —не- —неселективный фотоприемник, расположенный в плоскости выходной щели меряя поток световой энергии в различных спектральных областях и при разных температурах, можно получить семейство кривых, ха- характеризующих искомую универсальную зависимость от длины волны и температуры. На рис. 8.5 представлена лабораторная модель абсо- абсолютно черного тела, позволяющая изменять его температуру в широких пределах. Понятие абсолютно черного тела играет большую роль в термо- термодинамике излучения. Фактически лишь использование различных мо- моделей абсолютно черного тела дает возможность в этом разделе уста- установить связь между теорией и экспериментом. Испускательная способ- способность любого нечерного тела, нагретого до определенной температуры, может значительно отличаться от испускательной способности абсо- абсолютно черного тела. В качестве примера на рис. 8.6 приведена для ра- раскаленной вольфрамовой проволоки зависимость испускательной спо- способности от длины волны, иллюстрирующая, сколь сильно могут от- отличаться испускательные способности абсолютно черного и нечерного тел. Согласно теореме Кирхгофа, испускательная способность произ- произвольного нечерного тела может быть записана в виде Гя=а% f (Я, Т). (8.8) Чем больше отличается от единицы поглощательная способность этого нечерного тела, тем больше отличие его испускательной способ» 340
ности от абсолютно черного тела. Лишь условие а% = 1 ликвидирует это различие. Установим связь между испускательной способностью абсолютно черного тела и спектральной плотностью равновесного излучения. Для этого подсчитаем поток энергии, падающий на единичную площадку, расположенную внутри замкнутой полости, заполненной электромагнит- ^ ^ ной энергией средней плотности Uv. Пусть излучение падает на единичную площадку 6S = 1 в направлении, определяемом угла- углами 9 и ф (рис. 8.7) в пределах телесного угла dQ: dQ = sin &Шф. (8.9) Рис. 8.5. Лабора- Лабораторная модель чер- черного тела: / •— излучающая по- полость; 2 — токоподво- дящие электроды / 2 3 \,мкм Рис. 8.6. Сравнение испускатель- испускательной способности черного тела B) и вольфрамовой проволо- проволоки (/>) Так как равновесное излучение изотропно, то в данном телесном угле распространяется доля, равная dQ/ D п) от всей энергии, запол- заполняющей полость. Поток электромагнитной энергии, проходящий через единичную площадку в единицу времени, cUv— cos9. 4я (8.10) Заменяя dQ выражением (8.9) и интегрируя по ф в пределах @,2 я) и по 9 в пределах @, я/2), получим полный поток энергии, падающий на единичную площадку: 1 4я 2я rt/2 Ci/V \ ^ф \ (8.11) 341
Очевидно, что в условиях равновесия надо приравнять выра- выражение (8.11) испускательной способности абсолютно черного тела rv, характеризующей поток энергии, излучаемый площадкой 8S = 1, в единичном интервале частот вблизи v: rv= — cUv. (8.12) Таким образом, показано, что испускательная способность аб- абсолютно черного тела с точностью до множителя с/4 совпадает со спек- спектральной плотностью равновесного излучения. В заключение укажем, что излу- излучение абсолютного черного тела (на- (например, свет, испускаемый малым отверстием в полости) уже не будет равновесным. В частности, это излу- излучение не изотропно, так как оно рас- распространяется не по всем направле- направлениям. Но распределение энергии по спектру для такого излучения будет совпадать со спектральной плотностью равновесного излучения, изотропно заполняющего пространство внутри полости. Это и позволяет пользовать- пользоваться соотношением (8.12), справедливым при любой температуре. Никакой другой источник света не имеет сходного ^распределения энергии по спектру. Так, например, элек- электрический разряд в газах или свечение под действием химических реакций имеет спектры, существенно отличные от свечения абсолютно черного тела. Распределение энергии по спектру раскаленных тел также заметно отличается от свечения абсолютно черного тела, что было выше проиллюстрировано (см. рис. 8.6) сравнением спектров распространенного источника света (лампы накаливания с вольфра- вольфрамовой нитью) и абсолютно черного тела. dcp Рис. 8.7. К выводу формулы (8.12) § 8.2. ЗАКОНЫ ИЗЛУЧЕНИЯ АБСОЛЮТНО ЧЕРНОГО ТЕЛА И ИХ ПРИМЕНЕНИЕ Указанные выше характерные особенности зависимости испуска- испускательной способности абсолютно черного тела от длины волны и тем- температуры были обобщены в двух законах, наименование которых свя- связано с фамилиями ученых, экспериментально и теоретически иссле- исследовавших эти явления. Закон Стефана — Больцмана. Интегральная энергетическая светимость абсолютно черного тела пропорциональна четвертой сте- степени его температуры: (8.13) 342
В этом равенстве постоянная величина сг определена из данных опы- опыта. Она равна 5,7 • 10~16 Вт/(м2 • К4). Следует отметить, что закон Стефана — Больцмана неприменим к телам, которые не являются аб- абсолютно черными. Для таких тел значение а с ростом температуры не будет оставаться постоянным, и трудно аппроксимировать экспе- экспериментальные кривые указанной зависимостью Т4. Заметим, что энер- энергетическая светимость нечерных тел всегда меньше энергетической све- светимости абсолютного черного тела при данной температуре. Закон смещения Вина. Произведение длины волны А,макс, соот- соответствующей максимуму излучения, и температуры абсолютно чер- черного тела остается постоянным при изменении его температуры: КжсТ = 6. (8.14) Постоянная величина b = 0,2886 см • К определена из опытных дан- данных. Согласно закону (8.14), значение Ямакс будет уменьшаться с ростом температуры. Следовательно, должно иметь место смещение макси- максимума кривой г% в сторону коротких длин волн. Эту особенность аб- абсолютно черного тела иллюстрирует рис. 8.1, на котором изображены спектральные зависимости для двух значений температуры черного тела, отличающихся в два раза. Заметим, что кривые на этом рисунке построены для температур 3000 К (/) и 6000 К (//), примерно соответ- соответствующих температуре нити мощной лампы накаливания (/) и Солнца (//). При повышении в два раза температуры излучателя максимум излучения переместился из инфракрасной области в оптимальную для визуального наблюдения зеленую часть видимого спектра (А,« 5000 А), где, как известно, чувствительность глаза наибольшая. Площадь кри- кривой, характеризующая интегральную энергетическую светимость, при повышении в два раза температуры возросла в 16 раз. Закон смещения (так же как закон Стефана — Больцмана) применим лишь к абсолютно черным телам. Однако для некоторых нечерных тел отклонение максимума кривой г%, от Ямакс, измеренного при этой же температуре черного тела, оказывается относительно небольшим. Этим обстоятельством пользуются для измерения температуры некоторых нечерных тел. Заметим, что максимальная ордината кривой г% с ростом темпера- температуры возрастает еще быстрее, чем площадь, ограниченная указанной кривой и характеризующая энергетическую светимость абсолютно черного тела: Ымакс~7*. (8.16) Как уже указывалось, закон Стефана — Больцмана и закон сме- смещения Вина являются обобщением экспериментов по исследованию зависимости светимости абсолютно черного тела от длины волны и тем- температуры. В то же время они вполне согласуются с охарактеризован- охарактеризованной выше термодинамической теорией равновесного теплового излу- излучения. Для уяснения этого получим законы абсолютно черного тела из термодинамической формулы Вина (8.6). 343
Обозначим отношение х/Т — |. Тогда dv = Td% и (8.16) Интеграл (8.16) не может быть вычислен без дополнительных предположений о виде функции F (£), но бесспорно соответствие выра- выражения (8.16) зависимости RQH ~ T\ выражающей в общей форме закон Стефана — Больцмана. Более того, выбрав ту или иную функцию F(%), можно сравнить значения интеграла в выражении (8.16) и экс- экспериментальной величины а и тем самым оценить степень достоверности развитой теории. Заметим, что именно так поступил Планк при пер- первичной оценке введенной им константы ft, определяющей квант энер- энергии (см. § 8.3). Для того чтобы перейти от термодинамической формулы Вина (8.6) к закону смещения (8.14), решим задачу на экстремум функции /\. Вычислим производную дгх/дХ и, приравняв ее нулю, получим значе- значение Ямакс как функцию температуры: Продифференцируем по длине волны Я полученное выражение: Сократив оба члена равенства (8.17) на cW и обозначив ^ = £, находим IF' (l) + 5F (I) = 0. (8.18) Из-за неопределенности функции F (|) решение этого уравнения невозможно. Однако бесспорно, что если решение существует, то в ре- результате должно получиться некоторое значение I = с/ (ЯмаксТ)= = const, определить которое в рамках термодинамики нельзя. Таким образом, получена зависимость (8.14), постулируемая законом сме- смещения Вина. Так же как и при исследовании закона Стефана — Больц- Больцмана, открывается возможность проверки правильности выбора F (I) сравнением решения этого уравнения с опытным законом Вина (8.14). Обратимся к практическим приложениям рассмотренных законов. В этом плане их значение заключается в возможности использования модели абсолютно черного тела в качестве эталонного источника света, светимость которого вполне определенным образом зависит от длины волны и температуры. Для такого источника можно, измерив инте- интегральную энергетическую светимость или значение длины волны, со- соответствующей максимуму излучения, определить его температуру. Такие измерения, основанные на использовании законов абсолютно черного тела, совершенно законны, и в хорошем приближении погреш- погрешность измерения температуры будет зависеть лишь от воспроизводи- воспроизводимости измерений /?ен или А,макс. На практике, как правило, исполь- 344
зуют источники света, испускательная способность которых в той или иной мере отличается от испускательной способности абсолютно чер- черного тела, а произведение А,максГ не равно константе &, определенной из опытов с абсолютно черным телом. Использовав законы абсолютно черного тела для определения температуры этих нечерных тел, в измерения вводят дополнительную погрешность, имеющую характер систематической ошибки. Для иллюстрации таких отклонений на рис. 8.6 приведена испуска- испускательная способность для различных длин волн лампы накаливания с вольфрамовой нитью A) по сравнению с кривой г% для абсолютно черного тела B). Температура обоих излучателей одинакова (« 2450 К). Отмечаем, что кривая ) проходит ниже кривой 2, отображающей испу- скательную способность абсолютно черного тела, и как бы сдвинута по сравнению с 2 в сторону коротких длин волн. Это значит, что испу- испускательная способность вольфрама в области коротких длин волн (Я < Ямакс) меньше отличается от испускательной способности абсолют- абсолютно черного тела, чем в области длинных волн (А, > Ямакс), что связано с селективностью поглощения этого металла (по закону Кирхгофа, тело должно больше излучать в той области спектра, где оно больше поглощает). Рассмотрение этого рисунка утверждает в мысли, что попытка определить температуру вольфрамовой нити, измерив ее ин- интегральную энергетическую светимость и вычислив ¥Rdn/o, приведет к некоторому значению 7", которое будет отягощено систематической ошибкой, так как закон Стефана—Больцмана для этого излучателя, безусловно, не соблюдается. Другое значение Т" можно получить, если попытаться оценить значение 6/Ямакс, так как отступление от закона смещения для рассматриваемого излучателя очевидно. Кривая / характеризуется по сравнению с кривой 2 дополнительным смещением в область коротких длин волн. Трудности подобного рода при определении температуры нечерных тел возникают во всех случаях. Каждый реальный излучатель будет характеризоваться своими отклонениями от законов абсолютно чер- черного тела и поэтому, приводя значение температуры какого-либо тела, обязательно нужно указать, как она определена. В силу этого обычно различают три способа определения температуры, используя для обо- обозначения полученных значений термины, указывающие на способ ее измерения. 1. Радиационная температура. Схема измерений ясна из рис. 8.8. Интегральную энергетическую светимость измеряют каким-либо мало- малоселективным приемником света, примерно одинаково реагирующим на излучение всех длин волн (например, термопарой или термостолби- термостолбиком). Для того чтобы учесть заниженную (по сравнению с абсолютно черным телом) энергетическую светимость данного нечерного тела, вводят некий коэффициент, показывающий, во сколько раз нужно как бы уменьшить значение а для вычисления температуры этого излуча- излучателя из закона Стефана—Больцмана. Другими словами, при измере- измерениях температуры пользуются интерполяционной формулой 345
в которой RQn измеряют на опыте, а коэффициент k (k < 1) берут из таблиц, составленных для разных материалов, свечение которых сравнивалось с излучением черного тела. Дополнительные затруд- затруднения возникают при определении радиационной температуры Трад тела в широком интервале ее изменения, так как введенные выше нор- нормировочные коэффициенты различны для разных значений темпера- температуры одного и того же тела. Они также существенно зависят от состоя- состояния его поверхности. Чем лучше она отполирована, тем больше отли- отличие от черного ^ела и коэффициент k будет меньше. 2. Цветовая температура. В этом случае используют закон смещения Вина, определяя температуру тела Тцв из равенства Тцв = &/ЯмаКс- Так как выявление максимума на кривой г% требует измерения для не- Рис. 8.8. Схема радиационного пирометра: / — объектив; 2 — малоселективный фотоприемник; 3 — объект, радиационная температура которого определяется скольких длин волн, то обычно определяют не Ямакс, а отношение спек- спектральных плотностей излучения для двух заданных значений длин волн, из которого и вычисляют Гцв. Измерения проводят по схеме, представленной на рис. 8.4. Заметим, что, используя в этой схеме в ка- качестве диспергирующего элемента призму, можно ввести дополнитель- дополнительный источник погрешности, так как ее дисперсия зависит от исследу- исследуемой области длин волн и очень сильно изменяется в инфракрасной области, где и находится Ямакс для всех реальных источников света, температура которых обычно не превышает 3000 К. 3. Яркостная температура. Этот метод мало отличается от рассмот- рассмотренного выше определения радиацонной температуры, так как све- светимость любого тела пропорциональна его яркости, но техническое решение задачи изящнее и заметно упрощается возможность градуи- градуировки прибора по излучению абсолютно черного тела. В этом методе сравнивается яркость тонкой проволоки, находящейся в хорошо отка- откачанной колбе, при изменении силы пропускаемого через нее тока с яр- яркостью изображения исследуемого объекта (рис. 8.9). Задача изме- измерения, проводимого в определенной области спектра, — уловить мо- момент исчезновения нити на фоне изображения объекта. Такой эффект при достаточном навыке фиксируется с хорошей воспроизводимостью. При некотором усложнении схемы эксперимента возможно использо- использование объективных способов регистрации. Этот принцип измерения яркостной температуры используется в приборе, названном оптиче- оптическим пирометром. Такой прибор предварительно градуируют по излу- излучению абсолютного черного тела и на лимб наносят шкалу в градусах, соответствующих проведенной градуировке. Если измеряется излучение тела, распределение яркости которого по спектру близко к распреде- 345
лейию яркости абсолютно черного тела, то полученные значения юм- пературы близки к истинным ее значениям. Чем больше отличаемся исследуемый спектр от свечения абсолютно черного тела, тем больше систематическая погрешность данного метода измерения темпера- температуры. Заключая этот краткий обзор оптических методов измерения тем- температуры раскаленных тел, отметим еще раз, что в общем случае все три измеренные величины (Град, ТЦВ9 Тярк) могут быть различными и само понятие истинной температуры будет довольно неопределенным, особенно если вспомнить, что все эти методы фактически основаны на использовании законов, применимых лишь к излучению абсолютно черных тел. Поэтому представляются некоррект- некорректными иногда встречающиеся в литера- литературе значения температур с очень малой ошибкой, основанные лишь на хорошей воспроизводимости измерений без учета возможных систематических ошибок, связанных с особенностями спектров поглощения и испускания исследуемого тела. Для того чтобы завершить рассмот- рассмотрение стандартных приложений законов абсолютно черного тела, кратко охарак- охарактеризуем эффективность тех или иных источников при использовании их для целей освещения. Хорошо известно, что лампа накаливания с вольфрамовой нитью вошла в практику в конце прошлого столетия и сыграла громад- громадную роль в условиях жизни и труда людей во всем мире. По сей день этот простой и удобный источник света широко используют в быту и на производстве. Многочисленные научные и инженерные исследования позволили увеличить срок службы лампы накаливания и другие ее эксплуатационные качества, но мало что могли изменить в эффектив- эффективности этого источника света, т. е. в увеличении доли энергии, которая может быть использована для целей освещения окружающего прост- пространства. Достаточно взглянуть на рис. 8.1, где изображена свети- светимость абсолютно черного тела для двух температур, а вертикальными линиями ограничена видимая часть спектра D000 — 7000 А), чтобы оценить, сколь малая доля излучения абсолютно черного тела может быть эффективно использована в этих целях, даже в том случае (Т « « 5000 К), когда Ямакс совпадает с зеленой областью спектра, в ко- которой чувствительность глаза наибольшая. Расчеты показывают, что при этих оптимальных условиях лишь около 13% всей излучаемой энергии может быть использовано для освещения. Значительно меньшая часть энергии абсолютно черного тела может быть утилизирована в том случае, когда его температура составляет примерно 3000 К и макси- максимум излучения находится в инфракрасной области спектра (вблизи 1 мкм). Дальнейшее уменьшение температуры абсолютно черного тела 347 Рис. 8.9. Схема пирометра для определения яркостной темпе- температуры: Изображение раскаленной поверхно- поверхности фокусируется объективом / в плоскость нити лампы накалива- накаливания 2. Наблюдатель подбирает силу тока накала такой, чтобы нить исчезла на фоне изображения объ- объекта
прйЁедет к еще более низкому коэффициенту использования излучаемой энергии. Большинство раскаленных тел не могут иметь температуру выше 3000 К, так как при такой температуре плавятся почти все металлы. Поэтому коэффициент полезного действия ламп накаливания совсем невелик и в лучшем случае (мощные лампы с вольфрамовой нитью) со- составляет около 3%. Следует указать, что рассмотренная выше анома- аномалия излучения вольфрама (см. рис. 8.6) является выгодной для повы- повышения светоотдачи в видимой области, так как меньшая часть общей энергии приходится на бесполезную в целях освещения далекую ин- инфракрасную часть спектра. Для того чтобы уменьшить распыление нити при высокой температуре (Т « 3000 К), такие источники света запол- заполняют инертным газом. Все эти усовершенствования позволяют повы- повысить к. п. д. от двух процентов, характеризующих эффективность использования обычной 50-ваттной лампы накаливания, до значения, не превышающего 3%. Учитывая, что значительная часть вырабатываемой электрической энергии используется на питание столь малоэффективных источников света, поиски принципиально новых способов освещения приобретают большое значение. Так, например, безусловно прогрессивно все уве- увеличивающееся внедрение люминесцентных ламп, которые по эффектив- эффективности заметно превосходят отживающие лампы накаливания. Прин- Принцип действия этих ламп сводится к возбуждению люминесценции ве- вещества специально подобранного состава, наносимого на внутреннюю поверхность колбы, заполненной смесью паров ртути. Такая лампа излучает при электрическом разряде мощные ультрафиолетовые ли- линии, вызывающие люминесценцию препарата в видимой части спектра. Варьируя состав и свойства люминофора и светящегося газа, можно добиться хорошего совпадения спектрального состава излучаемого света с привычным излучением Солнца, что является немаловажным дополнительным преимуществом этих ламп дневного света. Очень ин- интересны также созданные в последнее время сверхмощные лампы, при- применяемые для освещения больших улиц и площадей. Обычно приме- применяют свет электрического разряда специально подобранной смеси инертных газов, которые имеют мощные линии в видимой области спект- спектра. Эффективность таких ламп велика, а спектр свечения можно в ка- какой-то степени изменять, варьируя состав смеси и условия возбуж- возбуждения. § 8.3. НЕДОСТАТОЧНОСТЬ КЛАССИЧЕСКОГО ОПИСАНИЯ РАВНОВЕСНОГО ТЕПЛОВОГО ИЗЛУЧЕНИЯ. ФОРМУЛА ПЛАНКА Для того чтобы увязать приведенные ранее термодинамические со- соотношения с результатами экспериментов по определению зависимости испускательной способности абсолютно черного тела от длины волны и температуры, нужно сделать какие-то предположения о механизме испускания света. Проведем такое рассмотрение, исходя из известной модели гармонического осциллятора (см. рис. 1.21), которая, как из- 348
вестно, Широко используется для описания различных атомных про- процессов. Так, например, в рамках этой модели (см. § 4.3) была получена хорошо согласующаяся с данными опыта зависимость показателя пре- преломления от длины волны и описаны многие другие явления. Запишем выражение для №изл — суммарной энергии, излучаемой осциллятором во всех направлениях за 1 с (мощность излучения). Для этого воспользуемся формулами, приведенными в § 1.7: Зс3 ' где Ро — амплитудное значение электрического момента (Р = q\), о) — частота свободных колебаний осциллятора. Мощность излучения Wu3Jl легко связать со средним значением энергии осциллятора: = <1ГП0Т> + <ГКИН>. (8.20) Используя формулы A.41), имеем B7H8a=AJ^5!L<U7>. (8.21) изл 3 тс3 ч ' ч ' Важно отметить, что вследствие потерь энергии на излучение (при отсутствии вынуждающей силы) осциллятор будет затухающим и ско- скорость затухания колебаний определяется его добротностью Q. JB со- соответствии с A.41) VM--IL_JEZ. . (8.22) изл QT Q Для данной задачи (свободные колебания осциллирующих зарядов при наличии затухания) можно записать следующее уравнение дви- движения: x + Y* + <»§x=0. (8.23) При малом затухании решение такого уравнения а выражение для мощности По определению [см. A.41I, добротность Q связана с мощностью соотношением 2f!ZiL (8.24) 4 (-dW/dt)T у Подставив выражение (8.24) в исходную формулу (8.22), имеем ^изл = Y <W>. (8.25) 349
Сравнивая (8.21) и (8.25), замечаем, что коэффициент затухания зависит от заряда и массы осциллирующих частиц и пропорционален квадрату частоты свободных колебаний осциллятора: у = 2 (o2q2/C me3). Несколько изменим постановку задачи, приблизив ее к изучаемой проблеме. Пусть осциллятор находится в равновесии с электромагнит- электромагнитным полем равновесного излучения, изотропно заполняющим при не- некоторой температуре замкнутую полость. Тогда осциллятор будет со- совершать несвободные, а вынужденные колебания, т. е. он не только излучает энергию, но и поглощает ее из окружающего пространства. Для простоты будем рассматривать колебания зарядов под действием монохроматического излучения частоты со. В этом случае вынуждаю- вынуждающую силу запишем как реальную часть: ReF (t) = ReqEox e-lti>t = = qEOx cos со/. Тогда уравнение движения имеет вид х + У* + юо х = — Еох cos со/. (8.26) т Будем искать частное решение этого уравнения, которое описывает установившиеся колебания: Для амплитудного значения х0 получаем выражение, которое было использовано ранее при объяснении хода коэффициента преломления вблизи линии поглощения: Для того чтобы найти Wn0TJl (©) — мощность монохроматического излучения, поглощаемую осциллятором, вычислим интеграл вида т т погл О = "F J F {t) *(t) dt=7" \ gEox *(i) cos Ш1 = . (8.28) = JL Elx 5 Получена зависимость (8.28) поглощаемой осциллятором мощно- мощности от амплитуды ЕЬх воздействующей на него монохроматической волны. Для перехода к произвольному электромагнитному полю сле- следует выразить поглощаемую мощность через энергию этого поля, учитывая, что в этом случае колебания Е происходят не только вдоль оси X, но и по осям Y и Z. При этом з Е*о *ох An 2 4я 2 ' 4я 2 4я ' Несколько сложнее получить выражение для энергии, поглощенной осциллятором, в реальной задаче, когда действующее на него излуче- излучение не является строго монохроматическим, а распределено в спект- спектральном интервале бсо с плотностью £/©. При этом Е1Х в формуле (8.28) должно быть заменено 8л [/© бсо/3 и полную мощность, поглощаемую 350
осциллятором на всех частотах, можно получить интегрированием по ш в пределах @, оо): Г* СО2 U(d "CO J (ф2 — (Оу J -] - V3 ОJ Ряд соображений позволяет существенно упростить вычисление этого интеграла. Подынтегральное выражение состоит из двух сомножителей: медленно изменяющейся функции U® и выражения (о2/[(о>2 — со§J + y2co2], имеющего при достаточно большой доброт- добротности острый максимум вблизи со = соо. Поэтому функцию U® можно в окрестности со = соо заменить постоянной величиной ищ и вынести из-под знака интеграла. Для того чтобы еще упростить вычисления, положим со + соо = 2 соо, т. е. (со2 — со§J = 4 со§ (со — сооJ- Учтем также, что далекие крылья функции поглощения практически не дают никакого вклада в суммарное поглощение. Это позволяет заменить пределы интегрирования в выражении (8.29), сведя задачу к вычисле- вычислению интеграла со 1 dx После всех этих упрощений получаем 00 dco 2я2<72 тг ^погл= —чи<ь9 I у \2 зт • (8.30) 3 2т \ (со—сооJ+ "Г" J V 2 / — 00 Окончательное выражение для энергии, поглощаемой осциллято- осциллятором, на который действует излучение с плотностью Uv, распределен- распределенной в интервале частот dv, просто получается из (8.30). Как известно, U& = Uv /B я). Следовательно, ^погл-у £*/*. (8.31) Теперь можно подвести итоги всем проведенным вычислениям и оценкам. Осциллятор, находящийся в электромагнитном поле, спек- спектральная плотность энергии которого f/v, непрерывно поглощает мощ- мощность в количестве, определяемом выражением (8.31). В то же время он излучает по всем направлениям мощность, определяемую произведе- произведением коэффициента затухания и средней энергии <№> [см. (8.25)]. В условиях равновесия надо приравнять излучаемую мощность той мощности, которую осциллятор забирает от воздействующего на него электромагнитного поля. Это позволит получить искомую связь между плотностью энергии поля Uv и средней энергией осциллятора Проведем соответствующие вычисления: 2_ 3
Тогда (8.32) Используя связь (8.11) между плотностью Uv энергии электромаг- электромагнитного поля и испускательной способностью rv, т абсолютно черного тела, находим r^T=^v\W>. (8.33) с3 Необходимо осмыслить полученные результаты и их физические следствия. Доказано, что плотность Uv электромагнитной энергии и пропорциональная ей испускательная способность rVf т абсолютно черного тела нацело определяются произведением квадрата частоты и средней энергии осциллятора <ZW>. Следовательно, прежде всего надо выяснить, от каких параметров зависит <№>*. На первый взгляд, это рассмотрение не может представить каких- либо затруднений. Хорошо известно, что по закону равнораспределе- равнораспределения кинетической энергии по степеням свободы, являющемуся одним из фундаментальных соотношений классической физики, на каждую степень свободы исследуемой системы приходится kT/2. Осциллятор имеет кинетическую и потенциальную энергию и можно считать Следовательно, его средняя энергия <W> = kT, где k — постоян- постоянная Больцмана (k = 1,38 • 10~16 эрг/К), а Т — температура внутри полости. Напомним, что этот результат сразу получается из применения теоремы Больцмана для вычисления среднего значения интересующей нас величины — энергии осциллятора. Для этого необходимо просум- просуммировать по всем непрерывно изменяющимся значениям энергии W ее произведение на относительную вероятность (e-wfkT) того, что в рав- равновесии встретится состояние, характеризуемое этим значением энер- энергии, и отнести этот интеграл к нормирующему множителю, получаю- получающемуся при суммировании относительной вероятности по всем значе- значениям непрерывно изменяющегося значения W: (8.34) * Соотношение (8.33) проще получить при введении степеней свободы для системы стоячих волн, но проведенный вывод более наглядно иллюстрирует равновесие между излучением и осциллятором, 352
В результате вычисления интегралов в отношении (8.34) легко получается <W> = kT. Подставляя это значение <W> в (8.32) и (8.33), окончательно получаем: сз c2 Эти выражения называют формулой Рэлея — Джинса в честь двух известных физиков, занимавшихся решением данной задачи. Напоминаем читателю, что формула (8.35) была получена приме- применением к равновесному тепловому излучению законов термодинамики и теоремы Больцмана о равнораспределении энергии по степеням сво- свободы. Очевидно, что полученные соотношения удовлетворяют термо- термодинамической формуле Вина (8.6). Для того чтобы удостовериться ( в этом, положим F (v/T) = ^ •—• Тогда в соответствии с (8.35) rv T=v*F(v[T)=—v4T. с2 Однако не представляет труда доказательство того, что формула Рэлея — Джинса резко противоречит опытным данным. Действитель- Действительно, оценим, пользуясь формулой (8.35), значение /?эн — интеграль- интегральную энергетическую светимость абсолютно черного тела: оо оо н= Г rv dv= ^~ kT Г v2 о о oo. (8.36) Интеграл в правой части выражения *(8.36) равен бесконечности, и, следовательно, /?эн (при Т Ф 0) также стремится к бесконечности. Это значит, что при любой температуре, отличной от абсолютного нуля, не может быть достигнуто равновесие, и энергетическая светимость абсолютно черного тела вопреки опыту будет бесконечно велика. Для того чтобы более полно разобраться в пределах применимости формулы Рэлея — Джинса, запишем ее в другой форме, перейдя в вы- выражении (8.35) от частот к длинам волн: kT. (8.37) dv 2пс Зависимость (8.37) показана пунктиром на рис. 8.10 по сравнению с кривой гд, для абсолютно черного тела, отлично согласующейся с дан- данными опыта. Лишь в далекой инфракрасной области спектра можно обнаружить соответствие между экспериментальной кривой и фор- формулой Рэлея — Джинса, а для излучения более коротких длин волн наблюдается резкое расхождение результата, полученного примене- применением классической теории и данными опыта. В частности, из формулы Рэлея — Джинса следует, что вопреки опыту для любой температуры г*, -> оо при Я -^ 0. Эти расхождения теории и эксперимента, обнаруженные на рубеже XIX и XX вв. получили хлесткое название «ультрафиолетовая ката- катастрофа» и явились серьезным предостережением, далеко выходящим за рамки задачи о построении универсальной функции f (Я, Т) = r%t т. 12 Зак. 1729 353
\ Смысл общего вывода заключается в том, что вся классическая физика имеет определенные границы применимости и использование ее законов и методов вне этих границ приводит к противоречию с опытом, яв- являющимся основным критерием правильности той или иной теории. Что касается конкретной задачи о согласовании теории равновес- равновесного теплового излучения и эксперимента, то тут создалась ситуация, которая хорошо характеризуется образным высказыванием знаме- знаменитого физика Лоренца: «Уравне- «Уравнения классической физики оказались неспособными объяснить, почему угасающая печь не испускает жел- желтых лучей наряду с излучением больших длин волн...». Многочисленные попытки найти выход из этого тупика не приво- приводили к успеху вплоть до начала XX в., когда М. Планк сформули- сформулировал гипотезу дискретных кван- квантов энергии, последовательное раз- развитие которой многими физиками (в первую очередь А. Эйнштейном и Н. Бором) в дальнейшем привело к определению границ примени- применимости классической теории и соз- созданию новой квантовой физики, громадное значение которой для развития всех естественных наук общеизвестно. Гипотеза, выдвинутая Планком, заключалась в том, что энергия осциллятора не может принимать произвольные значения, а должна быть кратной некоторой вполне определенной величине WOy именуе- именуемой квантом энергии. Другими словами, энергия W должна быть рав- равной nW0, где п—обязательно целое число (п = 1, 2,3,...). Это зна- значит, что излучаемая и поглощаемая осциллятором энергия также мо- может принимать лишь вполне определенные (квантованные) значения, т. е. излучение и поглощение света происходит не непрерывно, а опре- определенными порциями — квантами. Приняв эту гипотезу, уже нельзя исходить из равнораспределения энергии по степеням свободы и вычислять среднее значение энергии осциллятора указанным выше способом с использованием соотношения вида (8.34). Учитывая дискретное изменение W, нужно заменить ин- интегралы в этом выражении бесконечными рядами и для определения W найти отношение сумм этих двух рядов: Рис. 8.10. Зависимость испускатель- ной способности черного тела от дли- длины волны из опыта (/) и по Рэлею и Джинсу B) (8.38) %-nW,/VtT) 354
Вычисление средней энергии осциллятора легко провести, заметив, что каждый член геометрической прогресси в числителе выражения (8.38) с точностью до знака равен производной по £ = l/(kt) от со- соответствующего члена прогрессии, находящейся в знаменателе эюго соотношения: -lW' w . (8.39) 1 Итак, для среднего значения энергии осциллятора <W> получи- получилось совсем иное значение, чем при использовании закона классиче- классической физики о равнораспределении энергии по степеням свободы. Подставляя (8.39) в исходное выражение (8.32), имеем: (8.40) Для получения окончательных выражений остался всего один шаг. Выражения (8.40) должны удовлетворять термодинамической формуле Вина (8.5). Для выполнения этого требования нужно положить Wo = hv, где h не может зависеть от v и Т, т. е. является константой. После этого простого преобразования получаем формулу Планка: hv 2jiv2 hv ИЛИ r*. г= » Проанализируем эти фундаментальные соотношения. Очевидно, что при hv<^kT можно разложить экспоненциальную функцию в ряд: kT Тогда, ограничиваясь в этом разложении вторым членом, получим формулу Рэлея — Джинса (8.35): 2яу2 , т Значит, при малых частотах (точнее, при выполнении условия hv<^kT) квантовая формула Планка переходит в классическую фор- формулу Рэлея — Джинса. Следовательно, условия малости кванта энер- энергии hv по сравнению с величиной kT определяет границы применимости классической теории. Если нельзя считать hv<^kT9 то использование формулы Рэлея — Джинса незаконно и для описания свойств теплового излучения нужно применять формулу Планка. Переходя от частот к длинам волн, запишем формулу Планка в виде, который удобно сравнивать с данными опыта: t • <8'41а> 12* 355
Оказалось, что формула (8.41а) отлично согласуется с рассмотрен- рассмотренными ранее (см. § 8.1) экспериментальными кривыми: при уменьшении длины волны г% не стремится к бесконечности, а имеет максимум при некотором значении Ямакс. При Я->- О формула Планка предсказывает экспоненциальный спад г^, что также полностью соответствует данным опыта. Используя качественное согласие экспериментальной и теоретиче- теоретической кривых гя, можно добиться полного их совпадения, выбрав опре- определенное значение константы ft, соответствующее опытным данным в формуле Планка. При первичной оценке h Планк воспользовался значениями констант а и & в законах абсолютно черного тела (8.13), (8.14). В дальнейшем эта важнейшая физическая константа была из- измерена различными способами. Некоторые способы определения по- постоянной Планка (из опытов по фотоэффекту и по коротковолновой границе сплошного рентгеновского спектра) будут описаны в после- последующих параграфах этой главы. Наиболее точным считается зна- значение h = 6,626122 • Ю-27 эрг - с. Работа, опубликованная М. Планком в начале XX в., не сразу встретила признание. Многие видные физики того времени были склон- склонны считать предложенный Планком способ вычисления <№> неким математическим фокусом, не имеющим серьезного физического смысла. Большой заслугой Эйнштейна является своевременная поддержка и развитие этой принципиально новой идеи, обусловившей революцион- ные преобразования в физике. В частности, Эйнштейн сразу же предло- предложил использовать формулу Планка для объяснения зависимости тепло- теплоемкости твердых тел от температуры вблизи абсолютного нуля, истол- истолковал опыты по фотоэффекту, введя понятие фотона и заложив тем самым основы квантовой оптики (см. § 8.5). Об этом стоит упомянуть, так как в популярной литературе иногда встречаются попытки пред- представить Эйнштейна ученым, завершившим классическую физику, но не принявшим квантовых представлений. Это совсем неправильная точка зрения. Эйнштейн бесспорно был одним из творцов новой кван- квантовой физики, а его сомнения и поиски смысла вероятностного описа- сания, свойственного дальнейшему развитию квантовой механики, отражают глубину подхода этого гениального ученого ко всем пробле- проблемам естествознания. Другое дело, что по многим причинам, из которых не последнюю роль играли многолетние попытки решить непомерно трудную задачу создания единой теории поля, за последние 30 лет своей жизни Эйнштейн не внес существенного вклада в бурное раз- развитие квантовой физики. В последующие несколько лет исчезли всякие сомнения в значении идей о квантовании энергии и справедливости формулы Планка, которая была использована в самых различных областях физики. Более того, наличие этой формулы стимулировало введение новых понятий, значение которых проявилось лишь в последующие десяти- десятилетия. Для иллюстрации этого приведем основы вывода формулы План- Планка, который был предложен Эйнштейном в 1916 г. В этом выводе было впервые введено понятие вынужденного излучения, играющее основ- основную роль в механизме генерации мазеров и лазеров. 356
Предположив, что энергия может излучаться и поглощаться лишь определенными порциями (квантами), естественно считать, что сущест- существуют какие-то дискретные уровни энергии, при переходе между ко- которыми и происходит излучение и поглощение. Такое развитие кван- квантовых представлений в явной форме фигурировало еще в теории атома, разработанной Н. Бором. Сложнее привыкнуть к представлению о ве- вероятностном характере всех рассматриваемых явлений. При атомном переходе, сопровождающемся выделением кванта ftv, нельзя указать, в каком атоме произойдут такие переходы, а можно лишь говорить о вероятности того, что определенная доля атомов претерпит подобные изменения. Другими словами, нельзя предсказать, какие атомы пре- претерпят изменение, а можно лишь указать, сколько произойдет таких превращений. Будем исходить из того, что исследуемая атомная система нахо- находится внутри полости, изотропно заполненной равновесным излу- излучением спектральной плотности Uv при температуре Т. Рассмотрим атомные переходы между двумя уровнями. Пусть энергия верхнего т.-го уровня Wm, а энергия нижнего п-то уровня Wn. Разность Wm — Wn—hv, где v — частота, на которой происходят переходы атомов между этими двумя уровнями. Скорость уменьшения числа атомов на верхнем уровне dNm/dt за счет указанных переходов (т ->- п) определится произведением ве- вероятности этого процесса А тп и числа атомов, находящихся на данном уровне Nm: dNm = AmnNmdt. (8.42) Такие переходы происходят без какого-либо внешнего воздействия, носят случайный характер и называются спонтанными. Вероятность спонтанного перехода Атп является атомной константой и для двух- двухуровневой системы будет обратно пропорциональна времени жизни атома на данном энергетическом уровне (см. § 5.8). Очевидно, что пе- переходы, в которых участвуют независимые атомы, которые простран- пространственно разделены и высвечиваются в различные промежутки времени, должны приводить к некогерентному излучению. Кроме спонтанных излучательных переходов должны иметь место переходы п-то на m-й уровень, сопровождающиеся поглощением излучения атомной системой. Не составляет труда оценить скорость dNJdt процесса поглощения излучения, используя принятое стати- статистическое описание. Для этого обозначим через Bnm Uv соответст- соответствующую вероятность перехода, а через Nn — число атомов на п-ы уровне. Нужно также учесть, что каждый атом черпает энергию из окружающей среды, т. е. эти переходы происходят под действием некоторой вынуждающей силы. Тогда для процесса поглощения энер- энергии, сопровождающегося вынужденным переходом с n-го на т-й уро- уровень, справедливо соотношение dNn = BnmNnU*dt. (8.43) 357
Однако, как впервые указал А. Эйнштейн, необходимо учесть и обратный процесс — вынужденные переходы с m-го на п-й уровень. Действительно, атомы, находящиеся на m-м уровне (их число, как уже было указано, равно Nт), под действием электромагнитного поля с не- некоторой вероятностью BmnUv переходят на нижний уровень. Этот процесс называют вынужденным излучением или «отрицательным по- поглощением». В принятых обозначениях кине- —ш тику этого процесса можно записать в виде dN'm = Втп N (8.44) Заметим, что такие вынужденные переходы при выполнении некоторых дополнительных условий приводят к когерентному высвечи- высвечиванию системы. Итак, вместо двух процессов (излучение и поглощение света), которые обычно учиты- учитывают в термодинамике излучения, нужно ис- исследовать три возможных вида переходов, введя вынужденное излучение (рис. 8.11). Дальнейшие рассуждения очевидны: считается, что все разно- разнонаправленные процессы в системе, находящейся в равновесии, должны быть скомпенсированы, т. е. число происходящих в единицу времени т-*п должно быть равно числу п ->• /п-переходов. Следовательно, Рис. 8.11 К выводу фор- формулы Планка по Эйн- Эйнштейну Тогда dN t/v=- dNm = dNn. —B (8.45) Числа атомов Nm и Nn на двух интересующих нас уровнях опре- определятся из соотношений Больцмана: Тогда (8.46) Эту формулу легко упростить, исходя из следующих очевидных соображений. При Т-> оо плотность энергии Uv также стремится к бесконечности. Но это может быть лишь, если Втп = Впт. Используя это равенство, получим Учтем, что плотность энергии t/v должна удовлетворять термоди- термодинамической формуле Вина. Для выполнения этого требования нужно, чтобы AmnIBmn = av3, где a — некоторая константа, определяемая 358
из условия, что при hv<^kT выражение (8.47) должно переходить в формулу Рэлея — Джинса. Следовательно, (8.48) При hv<kTe№lkT) = 1 + jy + ... и, сопоставляя (8.48) с (8.35), имеем а = 8 rihlc?. Подставляя это выражение в (8.48), получаем фор- формулу Планка (8.41): hv Этот вывод формулы Планка имеет большое познавательное зна- значение. Для того чтобы получить ее таким способом, потребовалось вве- ввести новое понятие вынужденного излучения. Справедливость оконча- окончательного выражения доказывает существование этого излучения. Это приходится специально отметить, так как долгое время попытки экс- экспериментального обнаружения вынужденного излучения в оптическом диапазоне не приводили к успеху. В то же время в радиодиапазоне превалирует вынужденное излучение, а спонтанное излучение играет роль шума. Разберемся подробнее в этом важном вопросе. Соотношение Anm/Bmn~v3 указывает, что отношение коэффициентов Эйнштейна для спонтанного и вынужденного переходов при переходе от видимой части спектра (Я « 10~б см) к метровым радиоволнам должно уменьшиться примерно в 1020 раз. Поэтому не должна удивлять разница в механизме процессов излучения для этих двух столь различных диапазонов спек- спектра электромагнитных волн. Но и в оптическом диапазоне вынужденным излучением нельзя пренебречь. Действительно, представим себе, что при проведенном вы- выводе не учтено соответствующее число dN'm вынужденных переходов. Тогда нужно было бы приравнять число спонтанных переходов числу актов поглощения и вместо формулы Планка получилось бы некое выражение (которое также часто связывают с именем физика Вина), хорошо описывающее ход rv, т лишь в области малых длин волн (т. е. когда hv^>kT). Учет вынужденного излучения приводит к формуле Планка, отлично согласующейся с опытом во всем оптическом диапа- диапазоне. Таким образом, вынужденное излучение бесспорно существует, а трудность его экспериментального обнаружения в оптическом диапа- диапазоне связана с малой вероятностью этого процесса по сравнению с ве- вероятностью спонтанных переходов, которые всегда будут маскировать это излучение. Возможность наблюдения процессов поглощения, про- происходящих с той же вероятностью (Впт = Впт)9 связана с тем, что в данном случае нет маскирующих процессов, а также с большим числом атомов на основных уровнях. На это обстоятельство указал в 1940 г. В. А. Фабрикант, предложивший проводить поиск вынужденного излучения при неравновесных процессах, когда Nm (число атомов на верхнем уровне) может быть больше, чем Nn. 359
Эти соображения были подтверждены дальнейшим ходом развития атомной физики. В 1954 г. вынужденное излучение было обнаружено Н. Г. Басовым, А. М. Прохоровым и независимо Таунсом в микро- микроволновой области спектра и использовано для создания мазера, а в 1960 г. появились первые лазеры, которые генерировали в видимой области. Во всех этих системах используется тот или иной способ дополнительного (неравновесного) заселения генерирующих уровней—оптическая накачка, избирательное электронное возбуж- возбуждение и др. Формально такое неестественное распределение атомов по энерге- энергетическим уровням, называемое инверсией заселенности, может быть характеризовано введением некой отрицательной температуры. Од- Однако представляется сомнительной целесообразность использования такого термина для описания этого сугубо неравновесного процесса. Важно отметить, что для создания инверсной среды всегда требуется дополнительная энергия, необходимая для «перекачки» атомов на из- избранные возбужденные уровни, заселенность которых затем умень- уменьшается в основном за счет вынужденного излучения. В определенных условиях опыта этот процесс может быть использован для когерент- когерентного усиления сигнала или генерации почти монохроматического излу- излучения. В рамках этой книги много раз говорилось о когерентных свойствах лазеров и лишь сейчас оказалось возможным в какой-то мере охарак- охарактеризовать основной процесс (вынужденное излучение), приводящий к возникновению генерации. § 8.4. ФОТОЭФФЕКТ И ЕГО ИСПОЛЬЗОВАНИЕ В ОПТИЧЕСКИХ ИССЛЕДОВАНИЯХ Как уже указывалось, одним из первых приложений квантовой теории было истолкование законов фотоэффекта. Это явление было от- открыто в конце XIX в. Первичные наблюдения Герца сводились к уста- установлению действия мощного ультрафиолетового излучения на искровой разряд между двумя цинковыми электродами. При освещении элек- электродов ультрафиолетовым светом разряды заметно учащались. В об- обстоятельном исследовании А. Г. Столетова изучалось прохождение тока через конденсатор из двух цинковых пластин при освещении одной из них светом ртутной лампы (рис. 8.12). Эффект наблюдался лишь при освещении отрицательно заряженной пластины, и было высказано предположение, что при этом высвобождаются отрицательные заряды. Сила тока (фототока) в цепи оказалась пропорциональной световому потоку. Было установлено, что на цинковые пластины действуют лишь ультрафиолетовые лучи. Тонкая стеклянная пластинка, введенная на пути возбуждающего света, нацело исключала эффект. Оказалось невозможным заметить какую-то задержку в появлении тока после освещения отрицательной пластины, т. е. явление протекало практи- практически безынерционно. В дальнейших опытах Ленарда и других физиков, проводимых вначале XX в., была детально исследована зависимость силы фото- фототока от напряжения приложенного к пластинам конденсатора. При этих 360
измерениях определялся задерживающий потенциала У^ад» который нужно приложить, чтобы прекратился фототок. К этому времени уже были известны заряд и масса электрона и оказалось возможным пря- прямыми измерениями отношения qlm доказать, что из металла выбивают- выбиваются светом электроны, обладающие различной скоростью. При описа- описании явления основной интерес представляют электроны наибольшей скорости 1>макс, так как в этом случае вся энергия света расходует- расходуется на вырывание их из тела металла и на сообщение им кинетической энергии. Во всех остальных случаях часть световой энергии переходит в тепло и ее трудно учесть при состав- составлении баланса. Рис. 8.12. Схема опытов Столетова Рис. 8.13. Зависимость силы фото- фототока от разности потенциалов ме- между электродами Характерная кридая, получаемая при исследованиях подобного рода, представлена на рис. 8.13. В зависимости от геометрии электро- электродов и других условий опыта она может несколько отклоняться от иде- идеальной кривой 1, но основные характеристики процесса Gнас и Узад) будут одинаковы, что и иллюстрирует кривая 2. Кривая 1 соответ- соответствует тому оптимальному случаю, когда все вылетевшие из катода электроны могут достичь противоположного полюса. Схема опыта подобного рода будет рассмотрена ниже. Если часть вылетевших из катода электронов теряется на пути к аноду, то получается кривая 2. Сила тока насыщения оказалась строго пропорциональной свето- световому потоку. Это очень важное свойство фотоэффекта, на котором ос- основаны различные фотоэлектрические способы измерения световых потоков. Схема физических явлений такова: выбитый светом электрон достигает анода благодаря своей начальной скорости. Для того что- чтобы погасить эту скорость, нужно приложить задерживающее поле. Следовательно, mot зад- (8.49) Для истолкования механизма явления очень важен следующий экспериментальный результат. Оказалось, что У8ад не зависит от све- светового потока и для данного материала катода определяется частотой 361
падающего на него излучения. Если освещать фотокатод светом различ- различной частоты, то наблюдается линейная зависимость между измеряе- измеряемым на опыте задерживающим потенциалом (соответствующим усло- условию i = 0) и частотой падающего света: Узад = fcv - IV (8.50) В полученном из экспериментальных данных выражении (8.50) значение Vo зависит от свойств и материала катода, а коэффициент k> определяющий наклон прямой в координатах (v, У8ад), является не- некоторой константой. Фотоэффект начинается лишь при частотах, удов- удовлетворяющих условию vKP = VJk, (8.51) и эта так называемая красная граница фотоэффекта будет различна для разных металлов (Zn ~ 3700 A, Na ~ 5000 A, Cs ~ 6500 А и т.д.). Поэтому и не наблюдался фотоэффект при освещении цинкового катода видимым светом. В этом случае красная граница лежит в ультрафиоле- ультрафиолетовой области спектра. Если же нанести на цинк тонкий слой какого- либо щелочного металла, то фотоэффект будет иметь место при осве- освещении такого сложного катода видимым светом. Эти экспериментальные результаты никак нельзя объяснить, оста- оставаясь в рамках классической физики. Действительно, предположив, что электрон вылетает из металла под действием световой волны, нужно рассматривать ее как некоторую вынуждающую силу, амплитуда которой должна определять максимальную скорость вылетевших элек- электронов. Следовательно, У3ад должно быть пропорциональным свето- световому потоку, а в эксперименте, как уже указывалось, установлено от- отсутствие такой зависимости. Непонятна также зависимость У3ад от частоты падающего на катод света. Казалось бы, эффект должен иметь резонансный характер и наблюдаться лишь в том случае, когда частота собственных колебаний электрона в металле совпадает с частотой падающего света. Между тем эффект усиливается при v > vKp, а на- наблюдающиеся в некоторых условиях максимумы в зависимости силы фототока от частоты облучающего катод света появляются лишь в специальных условиях эксперимента и не должны влиять на уста- установление основного механизма процесса. Как показал Эйнштейн, эти противоречия снимаются, если явле- явления рассматривать с позиций квантовой теории. В этом случае нуж- нужно записать закон сохранения энергии для элементарного процесса, заключающегося во взаимодействии одного кванта света с веществом, сводящегося к передаче электрону дискретного количества энергии. При этом нужно учесть, что электрон в металле не является свобод- свободным и, чтобы покинуть тело металла, электрон должен преодолеть работу выхода А. При учете этих физически ясных условий легко записать уравнение, описывающее процесс поглощения одного кванта и возникновения электрона с наибольшей скоростью: ^. (8.52) 362
100 75 50 25 У /А / /// Х/Аз V шашшшшшшшт -1,0 ■ -0,5 О 0,5 1,0 Учитывая исходное соотношение (8.49) между потенциалом задерж- задержки и максимальной кинетической энергией фотоэлектрона, имеем Узад=Аг_А. (8.53) я я Выражение (8.53) находится в полном согласии с данными опыта. Коэффициент k = hlq действительно является константой, a V0 = A/q должен зависеть от свойств катода, так как работа выхода электрона характеризуется глубиной потенциальной ямы, в которой находится электрон, и определяется свойствами данного металла. Заметим, что наблюдается совпадение между зна- значением работы выхода, определяе- определяемым из результатов опытов по фото- фотоэффекту, и данных, полученных при исследовании термоэлектрон- термоэлектронной эмиссии — физического про- процесса, в котором работа выхода иг- играет основную роль. Соотношение (8.53) позволяет определить постоянную Планка из измерения наклона прямых, выра- выражающих зависимость потенциала задержки от частоты падающего на фотокатод излучения. Весьма точ- точное определение h таким методом было выполнено П. И. Лукирским и С. С. Прилежаевым в 1930 г. Для измерений использовали сфериче- сферический конденсатор, внутренний шарик которого был изготовлен из ни- никеля и освещался светом ртутной лампы. Спектральные линии ртути, возбуждавшие фотоэффект, выделялись монохроматором с кварцевой призмой. В этих опытах наблюдался относительно крутой спад кривых, характеризующих зависимость силы фототока от приложенного по- потенциала, так как в сферическом конденсаторе практически все фотоэлектроны достигают анода, что уменьшало ошибку в измерении ^вад- При этом автоматически учитывалась контактная разность по- потенциалов. На рис. 8.14 приведены экспериментальные кривые зави- зависимости силы фототока от приложенной разности потенциалов, получен- полученные при облучении катода светом различных ультрафиолетовых ли- линий ртути. Зависимость 7зад от частоты облучающего фотокатод света при- приведена на рис 8.15. Это идеально прямая линия, из угла наклона ко- которой находится постоянная Планка ft = 6,55«10~27 эрг*с. Отличное согласие результатов данных опытов с измерениями этой константы, проведенными совсем другими методами (законы абсолютно черного тела, коротковолновая граница сплошного рентгеновского спектра), являлось доказательством корректности квантового описания фото- фотоэффекта. В этом кратком изложении нарочито упрощена схема явления и не обсуждались два важных момента: Рис. 8.14. Зависимость силы фототока от приложенной разности потенциа- потенциалов при освещении фотокатода раз- различными ультрафиолетовыми линиями ртути 363
„4-10 "Гц. б 8 W V 1) при формулировке квантового условия (8.52) не упоминалась новаторская идея Эйнштейна, предположившего в развитии исходной посылки Планка существование особой частицы — фотона, который образуется при излучении кванта энергии и погибает при его погло- поглощении Свойства фотонов и следствия применения законов сохранения для описания элементарных актов взаимодействия фотонов с вещест- веществом будут подробно обсуждены в § 8.5; 2) рассмотрен наиболее простои механизм процесса — один фотон выбивает из атома один электрон. Современная физика широко ис- использует многофотонные процессы, когда складываются энергии двух и более фотонов. Нашли также при- применение методы, в которых один фотон большой энергии (ренгте- новские лучи или далекая ультра- ультрафиолетовая область спектра) выби- выбивает из атома два электрона V 15 2,0 / /] / / / / А у Рис. 8.15. Зависимость Узад от часто- частоты облучающего фотокатод света 120 80 40 - У «МММ / / - - \ \ Ч В заключение упомянем об одном явлении. В детальных эксперимен- экспериментах было замечено, что при определенных условиях опыта зависимость i (%) не является монотонной и имеет максимум в некоторой области спектра, зависящей от угла падения све- света на фотокатод, а также его поляриза- поляризации. При этом оказалось, что такой се- селективный эффект наибольший в том случае, когда вектор напряженности электрического поля световой волны пер- перпендикулярен поверхности металла, и практически не имеет места в том слу- случае, когда эта компонента Е отсутствует (рис. 8.16; селективный эффект для двух направлений поляризации возбуждаю- возбуждающего света, падающего на сплав калия и натрия под углом 60°). По-видимому, здесь проявляются некие волновые аспекты фотоэффекта, относящиеся к условиям вырывания электрона из ме- металла. В § 8.5 обсужден вопрос о воз- возможности описания одного и того же яв- пяпплй, ления в рамках как волновой, так и квантовой (корпускулярной) оптики на примере давления света, позволяющем более однозначно сформулировать задачу и охарактеризовать условия опыта. Обратимся теперь к весьма важному вопросу о практическом ис- использовании фотоэффекта. В современном эксперименте фотоэлектри- фотоэлектрические измерения световых потоков широко применяют во всем опти- оптическом диапазоне. Измерения базируются на законах фотоэффекта, 364 200 280 560 Ш Ш Рис. 8.16. Селективный фото- фотоэффект Если вектор Е световой волны име- имеет составляющую, перпендикуляр- перпендикулярную поверхности фотокатода, то сила фототока зависит от К не- немонотонно (/). Кривая 2 отвечает случаю, когда Е параллелен поверх- поверхности
Рис. 8.17. Принципиальная схема простейшего фотоэле- фотоэлемента из которых в данном случае наиболее важна строгая пропорциональ- пропорциональность силы тока насыщения и светового потока. Для измерений ис- используют различные устройства, правильная оценка возможностей которых часто оказывается совсем не простой. Простейшим фотоэлектрическим приемником света является фото- фотоэлемент. Принцип его действия ясен из рис. 8.17. Фотоэлемент пред- представляет собой хорошо эвакуированную и затем отпаянную колбу, на часть внутренней поверхности которой нанесен тонкий слой металла, являющегося катодом К- Выбиваемые светом / электроны долетают до анода А и тем самым замыкают анодную цепь, по которой протекает фототок. Приложенная внешняя разность потенциалов должна быть достаточной для того, чтобы наступило насыщение фотото- фототока, который может быть измерен непосред- непосредственно [например, 2] или усилен для реги- регистрации его другим, менее чувствитель- чувствительным прибором. Такое явление часто назы- называют внешним фотоэффектом. Смысл этого названия будет более ясен после характе- характеристики полупроводниковых фотоэлемен- фотоэлементов, в которых носители тока не покидают катод, а лишь перераспределяются по раз- различным его частям. Такое явление обычно называют внутренним фотоэффектом. Для того чтобы удовлетворить требованиям к спектральным свой- свойствам фотоэлемента (т. е. обеспечить достаточную его чувствительность в заданной области спектра), приходится использовать фотокатоды сложного состава. Так, например, для измерений световых потоков в видимой и близкой ультрафиолетовой области обычно применяют сурьмяно-цезиевые фотокатоды, имеющие максимум чувствительности в сине-фиолетовой области спектра (X ж 4500 А). Проводить измерения такими фотоэлементами в красной и инфракрасной области спектра невозможно, и для этих целей обычно применяют кислородно-цезиевые фотокатоды, имеющие максимум чувствительности уже за границей видимого спектра (А,«8000 А). Но если длина волны исследуемого излучения будет больше чем 1,1 — 1,2 мкм, то и такие фотоэлементы уже непригодны и для измерений могут быть использованы фотодиоды, которые будут описаны ниже. Для обеспечения высокой чувствительности измерений нужно пра- правильно выбрать тип фотокатода, конструкцию фотоэлемента, условия его эксплуатации. Обычно эти данные приводятся в паспорте фото- фотоэлемента. Чувствительность фотоэлемента характеризуют силой фо- фототока при стандартных условиях освещения. Вакуумные фотоэле- фотоэлементы обычно имеют чувствительность 50 — 80 мкА/лм. Для повышения чувствительности иногда наполняют колбу фото- фотоэлемента каким-либо газом, не вступающим в реакцию с веществом фотокатода. В таких газонаполненных фотоэлементах выбитые из катода электроны при своем движении к аноду ионизируют атомы газа. 365
Образующиеся в газе ионы и электроны движутся к электродам фото- фотоэлемента, заметно увеличивая исходный фототок. Чувствительность таких устройств велика (она достигает 500 мкА/лм), но их вольт- амперная характеристика имеет более сложный вид, чем обычная за- зависимость силы фототока от приложенной разности потенциалов, и часто не соблюдается пропорциональность силы фототока и светового потока. Другим недостатком газонаполненных фотоэлементов являет- является их инерционность, приводящая к искажению фронта регистрируе- регистрируемого сигнала и ограничивающая возможность измерения модулиро- модулированных и быстроизменяющихся световых потоков. При частоте моду- модуляции в несколько килогерц обычно уже невозможно использование газо- газонаполненных фотоэлементов. Следует подчеркнуть, что обсуж- обсуждаемые свойства фотоэлектрических приемников (спектральная характе- характеристика и чувствительность, линей- линейность, инерционность) весьма сущест- существенны для исследования возможности _ о 1 о тт применения того или иного устройства Рис. 8.18. Принципиальная схема £ оептении ко„коетных яяляч фотоумножителя: ПРИ решении конкретных задач. /С-катод; Д„ Д, - диноды; Л-анод Существенный прогресс В фОТО- электрических измерениях был до- достигнут в 40 — 50-е годы, когда в практику начали широко внедряться фотоэлектронные умножители (ФЭУ). Идея создания таких приборов была выдвинута исследователями еще в 20-е годы, а первый прибор, в котором использован описанный ниже принцип усиления фототока, был создан в 1934 г. и получил в честь его изобретателя название «труб- «трубки Кубецкого». Для усиления фототока в фотоэлектронных умножителях исполь- использовано явление вторичной электронной эмиссии. Оно заключается в том, что бомбардировка пучком электронов поверхности металла, полу- полупроводника или диэлектрика при некоторых условиях вызывает эмис- эмиссию вторичных электронов, которую обычно характеризуют коэффи- коэффициентом вторичной эмиссии а—отношением числа выбитых электронов к числу падающих. Этот коэффициент зависит от многих параметров (вида и состояния поверхности, скорости и угла падения пучка электро- ронов и т. д.) и для некоторых веществ может достигать больших зна- значений A0 и выше). В частности, легко получается значительное уси- усиление сигнала при использовании в качестве материала эмиттеров сплава сурьмы и цезия. Приводимая на рис. 8.18 схема иллюстрирует возможность создания фотоэлектронного приемника света с исполь- использованием усиления электронных токов за счет вторичной эмиссии. Совершенно ясно, что важно не только создать большее число вто- вторичных электронов, но и сфокусировать электронные потоки так, чтобы подавляющее число выбитых электронов достигло следующего эмит- эмиттера. Фокусировка вторичных электронов осуществляется различными способами. Наибольшее распространение получили умножители, в ко- которых конфигурация и расположение фотокатода и эмиттеров подобра- 366
Рис. 8.19. Форма и расположение электродов в фотоумножи- фотоумножителе ФЭУ-38: 1 — фотокатод; 2 — диноды; 3 — анод (коллектор) ны так, что создаваемые ими электрические поля обе- обеспечивают оптимальные условия прохождения элек- электронного пучка (рис. 8.19). Конечно, для этого нужно, чтобы между эмиттерами прикладывалась вполне определенная разность потенциалов, что осу- осуществляется с помощью так называемых делителей напряжения. Коэффициент усиления фотоумножителя при использовании нескольких каскадов достигает значений 105 — 10е. Для того чтобы предохранить 'фотоумножитель от посторонней засветки и экранировать электрон- электронную схему от внешних электростатических полей, его обычно помещают в специально изготовленный металлический кожух. На рис. 8.20 представлен внешний вид распространенного фотоумножителя ФЭУ-38 с кожухом. В нижней части кожуха имеется панель, на которой смонтирован делитель напряже- напряжения. На рис. 8.21 приведена фотография фотоумножителя, подготов- подготовленного к измерениям. Сила тока на выходе ФЭУ может быть усилена обычными радиотех- радиотехническими методами. После этого фототок фиксируется тем или иным способом. Часто используют элек- электронные потенциометры, проводя- проводящие непрерывную запись сигнала. В последние годы для этих целей широко применяют цифровые вольтметры и другие более слож- сложные устройства, позволяющие так регистрировать сигнал, чтобы ре- результаты измерений сразу могли быть обработаны электронно-вы- электронно-вычислительной машиной. Сущест- Существуют методы, позволяющие изме- измерять с помощью ФЭУ очень ма- малые световые потоки (метод счета фотонови др.). За последние годы техника по- подобных экспериментов получила за- заметное развитие и открылись воз- возможности решения новых задач. Но было бы серьезным заблужде- заблуждением утверждение, что любой сколь угодно малый световой сигнал мо- может быть фотоэлектрически изме- измерен и зарегистрирован. В фото- Рис. 8.20. Внешний вид фотоумножи- фотоумножителя ФЭУ-38, смонтированного в ко- кожухе 367
электрическом методе, как и во всех физических измерениях, решаю- решающую роль играет не сигнал, а отношение сигнал/шум, которое часто называют полезным сигналом. Наличие шума, природа которого весьма разнообразна, лимитирует возможность измерения малых сигналов, и, как правило, задачей экспериментатора является соз- создание такой схемы опыта, которая позволяет выделить тем или иным способом сигнал из шума или подавить последний. Для того чтобы были ясны физические идеи, лежащие в основе стандартных рекомендаций по повышению чувствительности фотоэлект- фотоэлектрических измерений, нужно прежде всего разобраться в природе шума. При этом бу- будем игнорировать некоторые достаточно часто встречаю- встречающиеся погрешности в тех- технике эксперимента и выделим основные физические явления, приводящие к флуктуациям измеряемого фототока, кото- которые и проявляются в виде шу- шума при фотоэлектрических из- измерениях. Одна из наиболее очевид- очевидных причин возникновения шума, ограничивающего пре- предел чувствительности фото- Рис. 8.21. Фотоумножитель подготовлен к эксперименту электрических измерений, связана с конечностью заряда электрона q = 4,8 • 10~10 CGSE и имеет образное название дробовой эффект. Суть этого явления следующая: пусть сила измеряемого фототока i. Значит, каждую секунду ilq элек- электронов вылетают из фотокатода и это число подвержено флуктуациям, так как сила тока лишь в среднем остается постоянной. Если бы заряд электрона был исчезающе малым, то число вылетевших из катода элек- электронов было бы велико и относительная величина флуктуации мала. Если (в другом крайнем случае) измеряемый ток переносился бы ма- малым числом частиц с очень большим зарядом, то роль флуктуации была бы велика. Простой подсчет иллюстрирует эти рассуждения. Хорошо извест- известно, что средняя относительная ошибка измерения <е> обратно про- пропорциональна корню из числа флуктуирующих частиц: Пусть, например, измеряемый ток переносится 100 частицами. В ре- результате флуктуации погрешность измерения 10%. Если этот же ток переносят 1010 частиц, то погрешность будет всего 10~3 %. Таким образом, при фотоэффекте анод как бы бомбардируется по- потоком отдельных дробинок, число которых вследствие статистического 368
характера рассматриваемых явлений будет флуктуировать. Теория этого явления при ряде упрошающих предположений приводит к сле- следующей зависимости среднего флуктуационного напряжения дробо- дробового эффекта <м|р > в анодной цепи фотоэлемента: (8.54) где R — омическое нагрузочное сопротивление анодной цепи; А/ — интервал частот, в пределах кототорого регистрируется выбранным измерительным устройством сила фототока (полоса пропускания). Другой не менее очевидной причиной флуктуации измеряемого то- тока является тепловое движение электронов в проводниках, замыкаю- замыкающих анодную цепь. Средний квадрат этого флуктуационного напря- напряжения <и!епл> связан с энергией теплового движения kT и опре- определится выражением (8.55) Можно показать, что эти две причины флуктуации фототока (дро- (дробовой эффект и тепловое движение электронов) являются основными. Тогда для отношения среднего квадрата напряжения сигнала <«?ИГн> к среднему квадрату напряжения шумов получается простое выра- выражение, определяющее чувствительность измерений: _ Используя формулы (8.54) и (8.55), можно оценить относительное влия- влияние тех или иных параметров измерительной установки на величину полезного сигнала. Так, например, для повышения чувствительности фотоэлектрических измерений часто используется уменьшение А/ (частотная полоса пропускания), приводящее к уменьшению флуктуа- флуктуации, возникающих как из-за дробового эффекта, так и теплового дви- движения электронов. В усилителях постоянного тока это достигается увеличением произведения RC (С — емкость конденсатора) и неиз- неизбежно приводит к увеличению времени регистрации (записи) сигнала, что не всегда желательно. В проведенном анализе природы флуктуационных шумов не была отмечена еще одна сторона флуктуации, связанных с тепловым дви- движением электронов, играющая существенную роль в ограничении чув- чувствительности измерений. Дело в том, что существует не только теп- тепловое движение электронов в проводниках, замыкающих цепь, но и в теле фотокатода. В результате такого движения электроны будут спонтанно вырываться из катода, создавая дополнительный шум. Другими словами, кроме фототока в анодной цепи будет циркулировать ток, обусловленный термоэлектронной эмиссией. Этот ток обычно называют темновым, подчеркивая тем самым, что его возникновение не связано с освещением катода. Темновой ток можно замерить при отсутствии сигнала и скомпен- скомпенсировать обычным методом. Но флуктуации темнового тока создают дополнительные шумы и этим тоже ограничивается чувствительность 369
измерения фототока. Для некоторых фотоумножителей уменьшение- флуктуации темнового тока играет основную роль в обеспечении высо кой чувствительности фотоэлектрических измерений, что достигается ограничением размеров фотокатода и его охлаждением. Проведенное рассмотрение природы шумов может быть отнесено как к фотоэлементам, так и к фотоумножителям. Но ряд дополнитель- дополнительных характеристик (в частности, стабильность усиления и возможность исключить влияние внешних полей) определяют преимущества исполь- использования фотоумножителей, обусло- обусловившие их широкое распространение при решении различных научных и технических задач. *<рмакс 0,6 ОА 1 /\ /1 /\ \ ч Г 1 Рис. 8.22. Две принципиальные схемы фотодиодов (а и б): / — р-л-переход; 2 — контакты р- и я-обла- стей; 3 —выводы; 4 —световой пучок 0,4 0,д 1,2 1,6 Х,МИМ Рис. 8.23. Спектральные характеристики фотодио- фотодиодов: / — кремниевого; 2 — герма- германиевого Существенные трудности возникают при использовании фото- фотоумножителей в инфракрасной области спектра. Как уже указывалось, наличие красной границы фотоэффекта делает в этом случае невоз- невозможным применение фотокатодов, прекрасно работающих в видимой и ультрафиолетовой областях. Для измерений в инфракрасной области используют фотодиоды, механизм действия которых основан на внут- внутреннем фотоэффекте. Фотодиод представляет собой полупроводниковую пластинку, внутри которой имеются области электронной (л-область) и дырочной (р-область) проводимости, разделенные электронно-дырочным перехо- переходом. На рис. 8.22 изображены две возможные принципиальные схемы фотодиода. Под действием света, падающего на поверхность полупроводника, в нем образуются пары п-р-носителей (электрон — дырка). Неоснов- Неосновные носители (дырки в полупроводнике n-типа и электроны в р-полу- проводнике) диффундируют в область я-р-перехода, втягиваются в него и образуют пространственный заряд по другую сторону пере- перехода. Таким образом, происходит накопление носителей тока разных знаков в двух противоположных частях полупроводника. Однако этот процесс не может продолжаться сколь угодно долго, так как в резуль- результате накопления зарядов возникает электрическое поле, препятствую- препятствующее дальнейшим переходам. Таким образом, наступает динамическое равновесие между переходами электронов (дырок) в одну и другую сто- 370
рону. В результате образуется постоянная разность потенциалов (фо- (фото- э. д. с), не превышающая ширины запрещенной зоны в полу- полупроводнике, выраженной в вольтах*. Фотодиод может работать в двух различных режимах: с внешним источником напряжения и без него. Для измерительных целей обычно включается внешняя разность потенциалов. Для генерации электриче- электрической энергии (например, в солнечных батареях) используют полу- полупроводниковые устройства без внешней э. д. с, работающие в так на- называемом вентильном режиме. с электростатиче- Рис. 8.24. Принципиальная схема ЭОП ской фокусировкой: 1 — фотокатод; 2 — фокусирующий электрод; 3 — анод; 4 — люми- несцирующий слой Величина фото-э. д. с. существенно зависит от свойств используе- используемого полупроводника и технологии изготовления. Для уменьшения флуктуации темнового тока полезно охлаждение устройства. Широкое распространение получили германиевые и кремниевые фотодиоды. На рис. 8.23 приведены спектральные характеристики таких приемников света. Как видно, максимальная чувствительность германиевого фото- фотодиода наблюдается в такой области длин волн (А,макс~ 1,5 мкм), где ис- использование фотоумножителей практически уже невозможно. В заключение этого краткого обзора фотоэлектрических приемников упомянем о возможности преобразования невидимого излучения (ин- (инфракрасные и ультрафиолетовые лучи) в видимое, что может быть осуществлено с помощью электронно-оптического преобразователя (ЭОП), который также способен выполнять функции усилителя света. Схема действия этого прибора представлена на рис. 8.24. На фотока- фотокатоде происходит преобразование оптического изображения в электрон- электронное. Затем электронные пучки от разных частей фотокатода фокуси- фокусируются и попадают на флуоресцирующий экран, где происходит визу- визуализация изображения. Качество изображения не очень хорошее, так * Более подробное описание физических процессов, происходящих в полу- полупроводниках при освещении их свегом, имеется в ряде специальных руководств (см.: Киттель А. Введение в физику твердого тела.- М., ГИФМЛ, 1962) 371.
как аберрации электронных пучков, как правило, больше оптических, но все же современные устройства подобного типа имеют в центре кар- картины разрешающую способность порядка нескольких десятков линий на миллиметр, что близко к возможностям обычной фотографической пластинки. Электронные пучки легко модулировать, поэтому электронный пре- преобразователь может быть использован в качестве модулятора или опти- оптического затвора, менее инерционного, чем даже ячейка Керра. Рабо- Работает такой затвор с малыми энергетическими потерями, а часто даже с усилением потока электронов. Следует иметь ввиду,что описывае- описываемое устройство не является чисто оптической системой—электронные пучки можно усиливать различными способами, поэтому яркость на выходе электронного преобразователя может заметно превосходить яркость оптического изображения на его входе. Современные ЭОП с сурьмяно-цезиевым фотокатодом позволяют увеличивать яркость изображения до 20 раз. При некотором усложнении электронной схемы может быть проведена временная развертка исследуемых сигналов. При этом временное разрешение достигает значений 10~14 с. Надо думать, что приборы подобного типа в ближайшем будущем будут ши- широко использовать в научном эксперименте и при решении различных технических задач. § 8.5. ФОТОНЫ И ИХ СВОЙСТВА Как уже указывалось, развивая квантовые представления, Эйн- Эйнштейн выдвинул гипотезу, что носителем дискретного кванта энергии света является своеобразная частица, которая получила название фо- фотона. Следовательно, энергия не только излучается и поглощается квантами, но и между этими процессами проявляется в виде частицы, которая возникает при излучении света и погибает при его поглоще- поглощений. Между этими превращениями фотон движется со скоростью, всегда равной скорости света в вакууме (оф = с). •Энергия фотона равна кванту W = /iv, и уничтожение фотона может рассматриваться как элементарный акт передачи его энергии какому- либо другому объекту. Так, например, механизм фотоэффекта пред- представляет собой не что иное, как передачу фотоном своей энергии элект- электрону, а уравнение (8.52) есть закон сохранения энергии, записанный для такого элементарного акта. При этом каждый освобожденный электрон забирает энергию у одного фотона, потому ток насыщения ^нас = Щ (л — число выбитых электронов) строго пропорционален световому потоку. В то же время максимальная энергия вылетевших электронов зависит от энергии фотонов, т. е. от частоты падающего на фотокатод света [см. (8.52)]. Закон сохранения энергии, записанный в виде (8.52), может быть применен к различным процессам, в которых участвуют фотоны. Так, например, можно рассмотреть задачу, обратную фотоэффекту: энер- энергия электрона передается фотону, образовавшемуся при этом элемен- элементарном акте. Такое явление имеет место при торможении быстрых электронов в теле антикатода рентгеновской трубки. Здесь происходят 372 .
сложные процессы, при которых часть энергии бомбардирующих ан- антикатод электронов должна перейти в тепловую, а оставшаяся часть в излучение. Этот процесс не квантован—электрон может потерять любую часть своей кинетической энергии, что и приводит к возникно- возникновению сплошного рентгеновского спектра. Но для вылетевших из анти- антикатода фотонов максимальной частоты имеет место полный переход кинетической энергии электронов в лучистую и можно написать урав- уравнение, которое будет почти аналогичным (8 52). При этом пренебре- гается энергией связи электрона в атоме, которая в данном случае очень больших энер- гий не должна учитываться: mvV2 = qV = (8.57) Ю Это уравнение может быть переписано в виде в qV = (8.58) 1 п 1 / II/ 50пВ \\ \ 25кВ ( \ Оно позволяет определить постоянную План- Планка измерением коротковолновой границы сплошного рентгеновского спектра, которая в соответствии с (8.58) зависит от приложен- приложенной разности потенциалов (рис. 8.25). Такие измерения оказались одним из самых точных способов определения этой константы. Полу- Полученное значение h = 6,624 х 10~27 эрг • с находится в отличном согласии с упоминав- упоминавшимися ранее измерениями, основанными на использовании законов фотоэффекта и абсо- абсолютно черного тела. Это иллюстрирует воз- возможность получения существенных результатов из применения зако- закона сохранения энергии для описания элементарных процессов, про- происходящих при превращениях фотонов. Продолжим рассмотрение свойств фотона. Он должен иметь вполне определенную массу, которая в соответствии с основными положениями специальной теории относительности может быть определена из сле- следующего соотношения: 0,2 0f4 0,6 Ofi ; Рис. 8.25. Тормозной рентгеновский спектр при различных ускоряющих потенциалах т = W/c2 - hv/c2. (8.59) Нельзя забывать, что скорость фотона иф = с. Учет этого основного свойства с неизбежностью приводит к выводу, что фотон не может обладать массой покоя т0. Действительно, в уравнении т = тп при v = с конечная масса т получается лишь для т0 = 0. Итак, фотон всегда находится в движении и не обладает массой покоя. Этим он существенно отличается от электрона, протона и неко- некоторых других элементарных частиц. Поэтому фотон часто называли квазичастицей, что вряд ли оправдано в наше время, когда в физике высоких энергий исследуются не менее экзотические частицы. В част. 373
ности, упомянем, что нейтрино также всегда движется со скоростью v = с и не имеет массы покоя. Оценим импульс фотона. Частица массы т = /tv/c2, движущаяся со скоростью с9 будет иметь импульс К = тс = hv/c. (8.60) Эта характеристика фотонов должна проявляться в физических опы- опытах. В качестве примера рассмотрим объяснение в рамках фотонной теории светового давления. Пусть на исследуемую площадку 8S = 1 в единицу времени падает по направлению нормали N фотонов. Часть из них отражается, часть поглощается. Если, как обычно, обозначить через Л энергетический коэффициент отражения, то каждую секунду отразится ЛЫ фотонов, а A — Л) N фотонов будет поглощено. При отражении каждого фотона произойдет изменение импульса, равное 2 hv/c. При поглощении фо- фотона изменение импульса будет hv/c. Для светового давления, опре- определяемого суммой импульсов, которые переданы площадке 8S = 1, можно записать следующее выражение: р=(\—Я)Ы —+J?W —= W —A+J?). (8.61) с ее Общая энергия фотонов, падающих на площадку Nhv равна плот- плотности потока электромагнитной энергии, т.е. модулю вектора |S|, который просто связан со средней плотностью электромагнитного поля (см. § 2.6). Тогда в полном согласии с результатом, полученным в волновой оптике, имеем р= — (\+Я)=№{\+Я). (8.62) с Отметим простоту и изящность проведенного вывода и укажем- что в рамках волновой оптики (см. § 2.6) получение аналогичной фор- формулы потребовало больших усилий. Однако при решении других задач можно встретиться с обратной ситуацией. Так, например, истолкова- истолкование всех тонкостей интерференции и дифракции света методами фотонной физики оказывается более сложным, чем в волновой оптике. В заключении книги кратко исследовано соотношение электромаг- электромагнитной теории света и физики фотонов, а сейчас продолжим рассмот- рассмотрение элементарных актов взаимодействия света и вещества в рамках физики фотонов. Заметим, что отличное совпадение результатов оценки светового давления с данными опыта получается лишь при строго релятивист- релятивистском описании процесса. Действительно, выражение для импульса фотона hv/c было получено использованием формул релятивистской механики. Следовательно, при формулировке законов сохранения, опи- описывающих элементарные акты, приводящие к возникновению и унич- уничтожению фотона, нужно учитывать эффекты, предсказываемые теорией относительности. Проиллюстрируем это элементарным изложением теории рассеяния рентгеновских лучей в каком-либо веществе. 374
При экспериментальном исследовании этого явления, впервые про- проведенном Комптоном в 1922 - 1923 гг., было установлено, что наряду с закономерностями, хорошо объясняемыми электромагнитной теорией (поляризация рассеянного излучения п ею интенсивность), наблю- наблюдаются эффекты, истолкование которых в рпмких -яой теории невоз- невозможно. Так, например, было обнаружено поиижчшо спушнка у ос- основной линии, совпадающей по длине волны с облучающими объект характеристическими лучами. Было установлено, что смещение АХ этого спутника не зависит от длины волны облучающего света и свойств вещест- вещества, на котором рассеиваются рентгеновские лучи, а целиком определяется углом рассеяния в. Отно- Относительная интенсивность спутника (так же как и смещение) возрастает с увеличением угла рассея- рассеяния (рис. 8.26) и, кроме того, зависит от атом- атомного веса вещества, на котором рассеиваются рент- рентгеновские лучи (интенсивность спутника при рас- рассеянии на легких атомах больше, чем на тяжелых). Эти опытные факты противоречат классической теории, согласно которой частота вынужденных колебаний должна точно совпадать с частотой вы- вынуждающей силы, т. е. частотой облучающего света, и не может возникать никаких спутников. По квантовой теории, столкновение фотона со свя- связанным в атоме электроном должно приводить к частичной потере энергии фотона, в результате чего квант после столкновения (hv') будет меньше исход- исходного (/iv). В зависимости от геометрии эксперимента соотношение между v и v' может измениться. Для количественной оценки рассматриваемого эффекта запишем законы сохранения энергии и импульса. Считаем, что до соударения электрон не двигался (т. е. его энергия была равна т0с2), а после соударения он приобрел скорость v и энергию тс2, где т = — т° . Энергию V б'ЗО1 Рис. 8.26. Эффект Комптона на Л-ли- нии молибдена связи электрона в атоме пока не учитываем. Тогда hv + m0c2=hv'+тс2 (закон сохранения энергии), (8.63) K=K' + mv (закон сохранения импульса), (8.64) где | К | = hv/с; | К' | = ЪЧо. Для совместного решения этих двух уравнений воспользуемся рис. 8.27, где изображены относительные направления всех трех ин- интересующих нас векторов. Используя известную теорему геометрии, можно написать закон сохранения импульса в виде — J^L vv' cos 0. (8.65) 375
После несложных преобразований, в которых используется соотно- соотношение между длиной волны и частотой v = с/Х, получаем Ab J^Lsin2 (8.66) Ab sin . тос 2 Анализ этой простой формулы показывает, что смещение возрастает с увеличением угла рассеяния, достигая максимума в том трудно на- наблюдаемом случае, когда в = я, т. е. рассеянное излучение направ- направлено навстречу возбуждающему. Наличие несмещенной компоненты в рассеянном излучении обус- обусловлено спецификой рассеяния рентгеновских лучей, взаимодейству- взаимодействующих с внутренними сильно связанными в атоме электронами. Про- Проведенный расчет не учитывал этой связи и фактически исследовалось hv ^Jz00*^ рассеяние на легких атомах, где связь с у г^° - очень слабая. В согласии с данными опыта в этом случае интенсивность смещенной компоненты относительно велика. В тяжелых атомах, где имеет- Рис. 8.27. К выводу формулы ся большое число сильно связанных (8 £6' электронов, значительная часть фото- фотонов как бы испытывает упругое столк- столкновение с атомом большой массы. Поэтому в спектре рассеяния бу- будет велика интенсивность несмещенной компоненты. Из приведенного расчета следует, что в результате соударения долж- должны возникнуть свободные электроны, которые часто называют электро- электронами отдачи. Из уравнений (8.64) легко оценить, какую долю энергии рентгеновского кванта унесет этот электрон, и связать изменение от- относительной интенсивности компонент рассеянного излучения со сме- смещением ДЯ. Полученные соотношения находятся в согласии с приведен- приведенными выше опытными данными. Следует заметить, что для не очень жесткого излучения даже при больших углах рассеяния уносимая электроном энергия составляет малую часть энергии фотона, что су- существенно отличает механизм данного процесса от фотоэффекта, где электрон забирал всю энергию налетающего фотона. Наличие элект- электронов отдачи при рассеянии рентгеновского излучения было подтверж- подтверждено опытами Д. В. Скобельцына, наблюдавшего их следы (треки) в камере Вильсона. Остроумное видоизменение методики (помещение камеры во внешнее магнитное поле) позволило измерить энергии элек- электронов. Как уже указывалось (см. § 2.6), электромагнитное поле харак- характеризуется моментом импульса. Для системы, описанной в терминах фотонной физики, должен удовлетворяться закон сохранения момента импульса. Оценивая проекцию момента импульса фотона на направ- направление импульса, можно получить одно из основных свойств электро- электромагнитного излучения—его поляризацию, которая столь просто вво- вводилась в волновой оптике. Более подробное рассмотрение этого воп- вопроса выходит за рамки нашей книги. 376
Ограничимся приведенными примерами использования плкопоп сохранения для описания элементарных актов взаимодействии <|к>томон с электронами. В руководствах по атомной физике подробно исследу- исследуются весьма тонкие эффекты, которые были открыты в результате такого подхода к различным явлениям (эффект Мёссбауера и др.). Там жо обсуждены интересные экспериментальные исследования этих процес- процессов, доказывающие, что законы сохранения справедливы не в среднем, а для каждого элементарного акта. Укажем также, что квантовые представления оказались чрезвычайно полезными при энергетическом анализе процессов взаимодействия света с веществом. Так, например, фотонная теория позволила разобраться в механизме различных фо- фотохимических процессов, что было невозможно при исследовании этих явлений в рамках волновой оптики. Заканчивая изучение свойств фотона, целесообразно кратко сфор- сформулировать следующие общие соображения. Введение понятия фотона привело фактически к созданию новой корпускулярной теории света, хорошо объясняющей некоторые оптические явления, истолкование которых в рамках волновой теории было затруднительно, а иногда невозможно. В то же время при правильном описании явлений эта теория не приводит к противоречию с исходными положениями волно- волновой оптики. В частности, не представляет труда формулировка в тер- терминах корпускулярной оптики закона преломления света, если посту- постулировать, что световые частицы изменяют свое количество движения при переходе из одной среды в другую. Тогда можно описать явления на границе двух сред в терминах как волновой, так и корпускуляр- корпускулярной оптики. Конечно, было бы грубой ошибкой отождествлять ско- скорость электромагнитных волн и скорость корпускул "и пытаться по- поставить какой-либо решающий опыт, позволяющий выбрать одну из двух дополняющих одна другую теорий для описания всех сложных оптических явлений. Следует учитывать, что волновая н корпуску- корпускулярная картины—это классические крайности (пределы) квантово- механической сущности явления, полностью соответствующей дуа- дуализму материи.
Заключение Итак, после реализации новаторских идей Планка, Эйнштейна и других выдающихся физиков начала XX в., широкое распространение получила физика фотонов, ити квантовая оптика, объясняющая ряд явлений, истолко- истолкование которых было затруднительно в рамках электромагнитной теории света. Естественно, что возник вопрос о соотношении между двумя теориями света. Довольно быстро выявилась неразумность противопоставления электромагнит- электромагнитной теории света и фотонной физики. Оказалось, что описание волновых свойств свега (интерференция, дифракция и сопутствующие им явления) по-прежнему целесообразно проводи!ь в рамках электромагнитной теории, тогда как неко- некоторые энергетические характеристики излучения полностью описываются фотон- фотонной физикой. Существует переходная область явлений — давление света, эф- эффект Доплера и некоторые другие, которые можно просто истолковать в рамках как той, так и другой теории. Характерно, что учет релятивистских эффектов обязателен и в электромагнитной теории, и в фотонной физике. Заметим, что в современной физике часто используют так называемый полу классический метод, представляющий собой комбинацию квантового и классического описания явлений. В приложении к проблемам, рассматривае- рассматриваемым в этой книге, этот метод сводится к соединению квантовомеханического ис- исследования среды (свойств атомов и молекул) и использования законов класси- классической электродинамики (уравнения Максвелла) для электромагнитного поля. Такой метод приводит к успеху при решении большинства задач оптики. Лишь в тех случаях, где необходим учет шумов (флуктуации, спонтанное излучение лазера и др.), нужно принимать во внимание не только дискретность процессов поглощения и излучения света атомами, но и квантование электромагнитного поля (т. е. использовать квантовую электродинамику). Интересно отметить, что фотоэффект, при истолковании которого было впервые введено понятие фо- фотона (см. § 8.4, 8.5), может быть полностью описан в рамках полу классического метода. Возрождение на новой основе корпускулярной теории света и то, что она не противостоит волновой теории, а дополняет ее, представляется совершенно естественным. В XX в. спор, который вели в свое время великие физики Нью- Ньютон и Гюйгенс, выглядел бы совершенно нелепым. Хорошо известно, что наличие этих двух внешне противоречивых теорий отражает сложную дуальную природу света, характерную для всей окружающей нас материи. Так, например, общепринято представление о свободном электроле как о частице. Действительно, существование такого электрона можно зафиксиро- зафиксировать соответствующими приборами, приспособленными для регистрации заря- заряженных частиц. Но вместе с тем можно экспериментально выявить волновые свойства свободного электрона, которые описываются волнами де Бройля и ис- используются в технике при расчете электронного микроскопа. Поэтому нельзя отдать предпочтение какому-либо одному способу описа- описания явления, так как нельзя поставить опыт, который позволил бы сделать одно- однозначный выбор между описанием в терминах волн и в терминах корпускул. Развитие современной оптики отражает основные идеи квантовой механи* ки, в которой вероятность нахождения частицы в какой-либо области простран- пространства характеризуется функцией, волновые свойства которой очевидны. Переход от волновой оптики к корпускулярной теории света происходит так, как этого требует квантовая механика, и использование принципа дополнительности Бора представляется в данном случае вполне уместным. Ограничимся высказанными весьма общими положениями, так как во- вопрос о дуализме света подробно рассматривается в большом числе книг, написан- написанных крупнейшими специалистами*. * См., например, заключительные главы третьего выпуска Фейнмановских лекций по физике. М., сМир», 1965. 378
Следует учитывать, что развитие современной оптики —это рлчипиг как электромагнитной теории света, так и физики фотонов Последнее подожги иг необходимо подчеркнуть, так как иногда высказывается точка зрения, пюдищан- ся к представлению об электромагнитной теории света как о науке, завершенной трудами ее создателя Максвелла и других знаменитых физиков, работавших на рубеже XIX и XX вв. Все последующие успехи оптики часто связывают только с развитием физики фотонов. Такая гочкя зрения неправильна и несовремен- несовременна, так как при этом фактически противопоставляются две стороны одного и того же сложного процесса, требующего дуального описания. Для иллюстрации этих общих рассуждений обратимся к истории создания когерентных источников света (лазеров). Как уже указывалось, понятие вы- вынужденного излучения было введено Эйнштейном в 1916 г. при выводе формулы Планка. Об этом важно упомянуть потому, что долгие годы лишь бесспорная справедливость формулы Планка убеждала физиков в том, что вынужденное излучение должно существовать, хотя условия, при которых оно может проя- проявиться в оптическом диапазоне, были совершенно неясны. В то же время со- создание первых когерентных излучателей в инфракрасной области спектра в зна- значительной степени было следствием широкого внедрения в оптику радиофизиче- радиофизических представлений, и сводить эти выдающиеся работы только к развитию фо- фотонной физики было бы совершенно неправильно. Если вернуться к существу рассматриваемой проблемы, то можно заме- заметить, что осмыслить понятие вынужденного излучения с позиций какой-либо одной теории света достаточно трудно. Для того чтобы описать усиление сигна- сигнала («отрицательное поглощение»), удобно пользоваться терминами квантовой оптики, сводя вопрос к рождению новых фотонов при прохождении светом ак- активной среды. Но при последующем описании свойств таких фотонов удобно пользоваться терминами и понятиями волновой оптики, указав, что фазы вто- вторичных волн будут жестко связаны (полностью скоррелированы). Заметим также, что при создании методов и приборов современной оптики физики всегда объединяют в своем мышлении волновую теорию света и фотон- фотонную оптику. В силу этих соображений возникает сложный вопрос о том, как нужно теперь строить изложение курса физической оптики. Следует учитывать, что строгое исследование оптики как синтеза волновых и корпускулярных пред- представлений должно проводиться на базе квантовой механики. Весьма заманчивым представляется создание такого курса, завершающего университетское обучение по некоторым физическим специальностям, но эта задача чрезвычайно трудна. Данная книга преследует более скромные цели и рассчитана на менее под- подготовленного читателя. Представляется, что изучение содержащегося в ней ма- материала совершенно необходимо для всех, собирающихся работать в различных областях современной физики и техники, и что книга подготовляет читателя к более полному и всестороннему рассмотрению различных проблем бурно раз- развивающейся оптики.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Аберрация оптических систем 281 — звездная 323 — сферическая 283 — хроматическая 283 Активность оптическая 103—109 Анизотропия 86 — в электрическом поле 93—95 — при деформациях 92, 93 Апертура числовая 292 Астигматизм 282 Бипризма Френеля 150 Вектор плотности потока энергии 31, 50, 82 Вероятность перехода 118 вынужденного 358 спонтанного 357 Волна бегущая 23 — затухающая 52, 76 — квазимонохроматическая 29, 141—145 и д. — линейно поляризованная 19 и д. — монохроматическая 20—29 и д. — неоднородная 69 — плоская 20—29 —, скорость распространения 6, 34—42 — стоячая 42—46 — сферическая 46 — эллиптическая, поляризованная 19, 20, 72, 76, 88 и д. Волновое число 22 Волновой пакет 36 Голограмма 295—301 Давление световое 80—85 Двойное лучепреломление 87 искусственное 92—95 , объяснение по Гюйгенсу 101—103 , электромагнитной теории 99— 100 Диполь осциллирующий 47—50 Диспергирующие элементы 257 Дисперсии свободной область 268 Дисперсионная кривая 123 Дисперсия 36 — аномальная 39, 111, 122 , измерение 124, 181 — вещества 262, 284 — дифракционной решетки 261 — интерферометра Фабри — Перо 263, 264 — линейная 272 — нормальная 39, 110, 116 — призмы 262, 263 — рентгеновских лучей 119 —, уравнение 113—115 — (функция) 260—264 Дисторсия 285 Дифракционная картина 211, 228 и д. максимумы 228—243 и д. , — главные 239—243 и д. , — побочные 231 распределение интенсивности 214, 233 и д. и д. —, спираль Корню 214, 215 . функция видимости 240, 248 Дифракционная решетка 236 — — амплитудная 244 отражательная 240, 243 и д. , поляризующие войства 247 постоянная 240 — —с профилированным штрихом 243, 248 , современные типы 243—248 фазовая 244 — теория микроскопа 'по Аббе 293, 294 оптических инструментов 282—294 380 Дифракция 205 и д. — квазимонохроматической волны 229. 248-256 — на крае экрана 213—215 , графический метод 213—215 пространственной структуре 273—281 рентгеновских лучей 278—281 щели 216, 217 —, параметр 217 —, порядок 238 н д. —, у юл 230, 231 — УКВ-излучения 15, 216 — Фраунгофера 228—235 на правильной структуре 235—243 щели 229—235, 254 — Френеля 214—218 на круглом отверстии 213, 218 — частично когерентного света 248—256 f видимость 248 на двух отверстиях 251—256 , распределение интенсивности 249—256 Диэлектрическая проницаемость 14 и д. комплексная 78, 122 , тензор 95 Добротность 51, 269 Закон Брюстера 61 — Бугера 75 — смещения Вина 343 — Снеллиуса 58 и д. — сохранения электрического заряда 14 энергии 30 — Стефана — Больцмана 342 — электромагнитной индукции 13 Затухание излучения 52, 349 —, коэффициент 115, 350 Зеркало Ллойда 152 Зона волновая 47 диполя 47 Зоны Френеля 207—214 и д. Излучение диполя 46—52 — вынужденное 138, 358 — тепловое 334 Импульс (волновой пакет) 36 — фотона 374 Инвариант Лагранжа — Гельмгольца 227 Интенсивность 32, 63 и д. Интерференции апертура 151—157 — порядок 137 — условие максимума 137 минимума 137 Интерференционная картина 136 в поляризованном свете 161 , локализация 152, 164—170 нестационарная 187, 188 стационарная 138, 187 , функция видимости 139—141, 153—156, 192 Интерференционные полосы 132 и д. , критерий резкости 192 , локализация 164—170 равного наклона 169 равной толщины 167 , ширина 138, 155, 198 Интерференционный слой 172 диэлектрический 170—174 — фильтр 204 Интерференция 132 и д. — волн квазимонохроматических 141, 250 монохроматических 133, 136 с взаимно перпендикулярной по- поляризацией 158 , условие возникновения 133, 134 — дифрагировавших пучков 235—240, 248 — многолучевая 172, 190—204 — поляризованных лучей 158—164
Интерференция при протяженном источ- источнике 152 -157 —, применение ц мецюлошн 170, 188—190, 200 — рентгеновских лучей 278, 279 Интерферометр двухлучсвоА 174—190 — Жамена \7Ъ — Майкельсона 181, 187 — Рождественскою 17Ь—180 — Фабри —Перо 190-204, 2Ь9 —, дисперсия 261 Когерентность 8, 132 и д — временная 135, 184 —, время 145, 185, 188 —, длина 145, 185, 188, 251 — квазимонохроматических волн 184 — при дифракции 248—256 — пространственная 135, 152—157 —, степень 136, 140, 157, 290 —, — комплексная 136, 140 — частичная 140, 149, 250, 290 Когерентные колебания 134 Кольца Ньютона 168 Кома 283 Контрастность 192 Критерий разрешения (Рэлея) 264, 265, 287—289 Лазер 8, 24, 95, 201, 203, 360 —, излучение 27, 186 —, —, поляризация 28 — импульсный 27 —, ширина линий 27, 186, 200—202 Луч 219 — необыкновенный 87, 88, 102 — обыкновенный 87, 88, 102 Лучи параксиальные 225, 283 Масса покоя 318 Метод Друде 77 Монохроматор 26, 257 — призменный 33 Направление главное*в кристалле 96, 99 Объектив ахроматический 284 Одновременность событий 312 Оптика нелинейная 55, 75 Оптическая длина пути 89, 223 — ось кристалла 87, 96, 101 — разность хода 137 и д. Оптический резонатор 203, 269 Опыт Винера 45, 46 — Кундта — Вуда 124 — Лауэ 278, 279 — Майкельсона 306—309 — Саньяка 310, 311 — Столетова 360 — Фарадея 125 — Физо 304, 305, 316, 317 — Юнга 139, 248—254 Освещение когерентное 249, 290—293 — некогерентное 254, 293—294 Освещенность 32 и д. Отражение 55 и д. —, закон 58, 102 —, коэффициент 56 и д. —, — комплексный 195 — от металла 74—80 —, фазовые соотношения 6, 66 Переход спонтанный 357 , вероятность 357 Период модуляции средний 143 Пирометра схема 346, 347 Пластинка в четверть длины волны 74, 89 — зонная 209, 210, 297 Плоскости поляризации вращения 103—109 магнитное 125—131 Плотность излучения спектральная 335 Плотность тока смещения 13 Поверхность волновая 102 и д. Поглощение света в интерферометре 194— 196 —, коэффициент 123, 124 — металлами 75, 76 Поляризатор 27, 64, 91, 92 — интерференционный многослойный 173 Поляризация света 16, 19, 23 — вещесгЬа 113, 120, 121 —, изменение при отражении от металла 76 —, полном внутреннем 72—74 —, распространении в кристаллах 89 — круговая 19, 88, 89 — линейная 19, 28 —, плоскость 61 —, —, вращение 103—109 —, —, — в магнитном поле 125—131 —1 —. угол поворота 104—106 — при отражении 63—67 преломлении 64, 65 — рассеянного света 280 —, степень 64 — частичная 64 — эллиптическая 19, 28, 90, 98, 147 Постоянная Верде 126, 129 — Керра 94 — Планка 355, 356, 363, 373 Построение Гюйгенса 101—103 — Френеля 150 Постулат Эйнштейна второй 309, 311 ид. , интервал 312 , одновременность событий 312 первый 309 Поток световой 32 Правила Малю 91 Преломление света 53—80 — в кристаллах 87—103 —, закон 36, 57—59, 102 — на сферической поверхности 225 —, показатель 21 и д. —, — для луча необыкновенного 87—103 —, обыкновенного 87—103 —, — комплексный 76—78, 122 —, угол 58 Преобразования Галилея 302 — Лоренца 314—316 Преобразователь электронно-оптический Призма Волластона 91 — Николя 27, 88, 91 — Френеля 73 Принцип Гюйгенса 101—103 — Гюйгенса — Френеля 205—218, 229 — относительности механический (Гали- (Галилея) 303 — Ферма 222, 223 Проводник идеальный 75 Пропускание, коэффициент 56, 63, 190 —, — комплексный 195 Просветление оптики 170—172 Пучки света гомоцентрические 225, 282 Пятно Пуассона 210 Разность хода 137 и д. оптическая 137 Разрешающая сила 264—270, 281—294 дифракционной решетки 240, 265—268 интерферометра 200, 269, 329 , критерий Рэлея 264, 265, 287—289 микроскопа 290 , дифракционная теория 293, 294 оптических инструментов 281—294 призмы 270, 271 телескопа 286, 287 Распространение света 34 и д. в анизотропных средах 95—101 Рассеяние света 280, 281 молекулярное 280 Рентгеновские лучи 9, 277—279 , спектр непрерывный 10, 373 , — линейчатый (характеристиче- (характеристические лучи) 10, 374, 375 381
Свет естественный 26, 259, 260 — неполяризованный 28 Светимость 32 — энергетическая 336 Светосила 271 — спектрографа 271, 272 Светотехнические единицы 32 Сечение главное кристалла 87 Сигнал биений 331—333 Сила осциллятора 118 Скорость волны электромагнитной 34—40 — —в вакууме 34, 35, 200, 201, 309—311 групповая 36—40, 315 — — — в кристалле 98 фазовая 34—40, 315, 319 — — — в кристалле 98 — лучевая 324 — радиоволн в ионосфере групповая 120 фазовая 119 — сигнальная 40 Сложение скоростей в механике класси- классической 303 релятивистской 316, 317 Смещение красное 321, 325 — фиолетовое 321 Спектральные приборы 256—281 Спираль Корню 214, 215 Способность испускательная 336 — поглощательная 337 Тело абсолютно черное 337 Температура радиационная 345 — цветовая 346 — яркостная 346 Теорема Кирхгофа 338 — Цернике 252—254, 290 — циркуляции 12 Теория относительности специальная 302— 333 , исходные постулаты 309—319 — , экспериментальные основания 302-309 Ток смещения 14 Угол Брюстера 61—67, 72 — раскрытия 291 Уголковый отражатель 187 Удельная рефракция вещества 117 Уравнение волновое 21 Уравнения Максвелла 14, 15 и д. для анизотропной среды 97 — материальные 14 Условие Брэгга — Вульфа 279 — синусов 283, 291 Уширение линий 26, 142—146, 185 доплеровское 185, 327—329 столкновениями 144, 145 Фазовый контраст 294 Фокус сферической поверхности 226 Фокусное расстояние 226 Формула Вина 338, 358 — Лоренц— Лоренца 117 — Максвелла 21, 41—42, 122 — Ньютона 226 — Планка 355, 359 — Рэлея 38, 112 — Рэлея — Джинса 353 — Френеля 59—67 для анизотропных сред 98 коэффициента увлечения 306 — Эйри 191, 197 Фотон 364, 372—377 —, закон сохранения энергии 362, 372 —, импульс 374 —, масса 373 Фотодиод 370, 371 i Фотоумножитель 366—370 —, дробовой эффект 368 —, полезный сигнал 368 —, темновой ток 369 —, тепловое движение электронов 369 / Фотоэлемент 365 Фотоэффект 360—372 — внешний 365 — внутренний 365 Фотоэффекта красная граница 362, 370 Фронт волны плоский 24 Функция аппаратная 258, 288 — видимости 139, 141 при протяженном источнике 156 , связь со степенью когерентности 140, 141, 250 — корреляции 136, 157, 252—256 Фурье-спектрометр 188 Цвета тонких пластин 164—169 Частота граничная (плазменная) 120 Шкала электромагнитных волн 6 Эллипсоид Френеля 96 Энергия покоя 318 Эффект Вавилова — Черенкова 319 — Доплера 320—333 поперечный 322, 326 продольный 320, 324, 325 — Зеемана 129—131 — Комптона 375 — Фа радея 125—131 Эйконал 219 —, уравнения 220 Явление Керра 93 — Тиндаля 280 Яркость 32 Ячейка Керра 94
ОГЛАВЛЕНИЕ С.,» Предисловие ко второму изданию 3 Предисловие к первому изданию 3 Введение 6 Глава /. Основные свойства электромагнитных волн 11 § 1.1. Система уравнений Максвелла 11 § 1.2. Поперечность электромагнитных волн 15 § 1.3. Плоские монохроматические волны и возможное!ь их экеперимен- меитального осуществления 20 § 1.4. Энергия, переносимая электромагнитной волной 29 § 1.5. Скорость распространения электромагнитной волны 34 § 1.6. Стоячие электромагнитные волны 42 § 1.7. Излучение электромагнитного вибратора. Сферические электро- электромагнитные волны 40 Глава II. Отражение и преломление электромагнитных волн 53 § 2.1. Нормальное падение электромагнитной волны на границу раздела двух диэлектриков 53 § 2.2. Законы отражения и преломления электромагнитных волн 57 § 2.3. Формулы Френеля 59 § 2.4. Явление полного внутреннего отражения 67 § 2.5. Отражение электромагнитной волны от поверхности металла . 74 § 2.6. Световое давление 80 Глава III. Элементы оптики кристаллов 86 §3.1. Описание основных экспериментов 87 § 3.2. Распространение электромагнитной волны в анизотропной среде 95 § 3.3. Построение Гюйгенса 101 § 3.4. Вращение плоскости поляризации 103 Глава IV. Электронная теория дисперсии ПО § 4.1. Предварительные замечания 110 § 4.2. Уравнения дисперсии 113 § 4.3. Дисперсия вдали от линии поглощения 116 § 4.4. Аномальная дисперсия 122 § 4.5. Механизм магнитного вращения плоскости поляризации . . . 125 Глава V. Интерференция света 132 § 5.1. Когерентность колебаний 132 § 5.2. Статистическое рассмотрение физических процессов в источниках света 142 § 5.3. Осуществление когерентных колебаний в оптике 148 § 5.4. Возможность наблюдения интерференции от протяженных источ- источников света 152 § 5.5. Наложение интерференционных картин, создаваемых волнами, поля- поляризованными во взаимно перпендикулярных направлениях. . . . 158 § 5.6. Локализация интерференционных полос и цвета тонких пластин.. 164 § 5.7. Диэлектрические интерференционные слои 170 § 5.8. Двухлучевые интерферометры 174 § 5.9. Интерферометр Фабри — Перо 190 383
Стр. Глава VI. Дифракция света 205 § 6.1. Принцип Гюйгенса — Френеля и некоторые его приложения . . 205 § 6.2. Основные положения геометрической оптики 218 § 6.3. Дифракция плоских волн на отверстиях различной формы ... 228 § 6.4. Дифракция света на правильной структуре 235 § 6.5. Современные дифракционные решетки 243 § 6.6. Дифракция частично когерентного света 248 § 6.7. Разложение излучения в спектр и основные свойства спектральных приборов 256 § 6 8. Дифракция на плоской и пространственной структуре. Рассеяние света 273 § 6.9. Разрешающая сила оптических инструментов 281 § 6.10. Представление о голографии 295 Глава VII. Оптические опыты с движущимися телами 302 § 7.1. Экспериментальные основания специальной теории относитель- относительности 302 § 7.2. Постулаты Эйнштейна и их следствия 309 § 7.3. Эффект Доплера 320 Глава VIII. Границы применимости электромагнитной теории света и элементы квантовой оптики 334 § 8.1. Равновесное тепловое излучение 334 § 8.2. Законы излучения абсолютно черного тела и их применение . . .342 § 8.3. Недостаточность классического описания равновесного теплового излучения Формула Планка ' 348 § 8.4. Фотоэффект и его использование в оптических исследованиях. . 360 § 8.5. Фотоны и их свойства 372 Заключение 378 Предметный указатель 380 Николай Иванович Калитеевский ВОЛНОВАЯ ОПТИКА Редактор Г. Н. Дьяченко. Художественный редактор В. И. Пономаренко. Технический редактор Э. М. Чижев- Чижевский. Корректор Г. И. Кострикова ИБ № 623 Т-19907 Сдано в набор 15/IV-77 г. Подп. к печати 4/XI-77 г. Формат 60X90Vie. Бум. тип. JSfe 1 Объем 24 печ. л. Усл. п. л. 24 Уч.-изд. л. 25,66 Изд. Ко ФМ-604 Тираж 24.000 экз. Зак. 1729 Цена 1 р. 20 к. План выпуска литературы издательства «Высшая школа» (вузы и техникумы) на 1977 г. Позиция № 41 Издательство «Высшая школа» Москва, К-51, Неглинная ул., д. 29./14, Московская типография № 4 Союзполиграфпрома при Государственном комитете Совета Министров СССР по делам издательств, полиграфии и книжной торговли, Москва, И-41, Б. Переяславская ул., дом. № 46.