Текст
                    Statistical Optics
JOSEPH W. GOODMAN
Professor of Electrical Engineering
Stanford University
A Wiley-Interscience Publication
John Wiley and Sons
New York/Chichester/Brisbane/Toronto/Singapore

Статистическая оптика Перевод с английского канд. физ.-мат. наук А. А. Кокина под редакцией д-ра физ.-мат. наук Г. В. Скроцкого Москва «Мир» 1988
ББК 22.343 Г93 УДК 535 Гудмен Дж. Г93 Статистическая оптика: Пер. с англ. — М.: Мир, 1988. — 528 с., ил. ISBN 5-03-001162-5 Книга известного американского ученого представляет собой учебную мо- нографию, материал которой апробирован при чтении курса лекций по стати- стической оптике в ряде американских и европейских университетов. После введения в общую теорию вероятностей и случайных процессов в ней рассмат- риваются все основные вопросы статистической оптики: теория когерентности первого н высших порядков, влияние частичной когерентности в системах, фор- мирующих изображение, влияние случайных неоднородных сред, теория фото- электрической регистрации света. Для широкого круга оптнков. радиофнзиков н специалистов, работающих в области квантовой электроники, голографии и обработки информации, а также для преподавателей, студентов старших курсов н аспирантов соответствующих специальностей. в™ Редакция литературы по физике и астрономии ISBN 5-03-001162-5 (русск.) ISBN-0-471-01502-4 (англ.) © 1985 by John Wiley and Sons» Inc. All Rights Reserved. Authorized translation from English language edition published by John Wiley and Sons, Inc. © перевод иа русский язык, «Мир», 1988
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА Всем, кому приходится в той или иной мере заниматься когерент- ной оптикой, хорошо знакома вышедшая еще в 1970 г. книга профессора Стэнфордского университета Дж. Гудмена: «Введе- ние в фурье-оптику» (М.: Мир, 1970). Несмотря на то что за истекшее с тех пор время появилось несколько хороших книг, в которых рассматриваются аналогичные вопросы, эта книга да- леко не устарела и не перестает быть настольной у интересую- щегося данной тематикой читателя. Она служит и учебником, и справочником, который можно читать с любого места. Лежащая перед читателем новая книга Дж. Гудмена пред- ставляет собой существенным образом переработанное и значи- тельно расширенное издание вышеуказанной книги. В ней поме- щено много нового материала, который в этой области появился и накопился за два последних десятилетия. Теперь основное внимание в ней обращается на вопросы статистической оптики. Развитие теории когерентности светового излучения и статисти- ческой теории процессов излучения и поглощения света заста- вило автора изложить новые методы анализа корреляционной структуры световых потоков, их преобразования при прохожде- нии через пассивные и активные оптические среды и их реги- страции. Более того, автору, естественным образом, пришлось с новых позиций осветить и ранее изложенные, казалось бы устоявшиеся, вопросы. В результате получилась по сути совер- шенно новая книга, посвященная основным вопросам современ- ной оптической физики. С этим связано и изменение ее назва- ния. Разумеется, объем ее существенным образом увеличился. Статистическая природа оптических явлений проявляется не только при астрофизических исследованиях, как может пока- заться при знакомстве с приводимыми в книге примерами прак- тических применений рассмотренных методов. Знакомство с ними необходимо при создании и разработке лазерных источни- ков света и прецизионных оптических методов исследования структуры вещества. Явления статистического характера иг- рают существенную роль в работе чувствительных фотоприем- ников, во многих новых спектроскопических методах высокой
6 Предисловие редактора перевода чувствительности, в ряде задач голографической и спекл-интер- ферометрии, определяют качество оптических изображений при разработке методов измерения и контроля в производстве мик- роэлектронных и оптоэлектронных устройств, создании оптиче- ских систем связи, обработки информации и т. п. Потребности практики заставляют исследователя все глубже проникать в область статистической оптики, все шире применять ее методы в разных диапазонах длин волн, сравнимых с разме- рами регулярных и нерегулярных неоднородностей. Когда суще- ственную роль начинают играть дифракционные ограничения, особенно заметно сказывается характер когерентности исполь- зуемых световых потоков. Книга Дж. Гудмена — это в первую очередь учебник, хотя по охвату, широте и свежести рассматриваемых вопросов она, не- сомненно, монографична. Она удачным образом дополняет су- ществующие книги и заполняет имеющиеся в них пробелы. В ее основе лежит неоднократно в течение многих лет читанный в разных странах курс лекций. При освещении трудных для пони- мания с первого раза вопросов статистической оптики автор с большим мастерством отобрал, расположил и изложил огром- ный по разнообразию рассматриваемых задач предмет статисти- ческой оптики. Внимательный читатель найдет в этой книге много методических находок, которые полезны не только для облегчения усвоения и запоминания материала, но и для его последующего изложения в аудитории. Многие актуальные конк- ретные задачи (а их число весьма велико) рассмотрены и ре- шены разными методами при разных подходах и в разных при- ближениях. Достаточно подготовленный читатель может читать книгу с любого места, с карандашом в руках выполнить почти все про- пущенные в ней преобразования и удостовериться в справедли- вости приводимых результатов. Решение удачно подобранных практически интересных задач не только позволяет читателю убедиться в том, насколько глубоко он усвоил разобранный ма- териал, но также расширяет его научный кругозор и вселяет уверенность в умении самостоятельно решать практически важ- ные задачи. Оригинальные рисунки и графики существенно до- полняют книгу и иллюстрируют содержание полученных формул. Для изучения содержания книги можно почти не прибегать к помощи дополнительной литературы. Чтение ее доставит вдумчивому читателю много приятных минут. При подготовке перевода книги к печати переводчик и ре- дактор старались по возможности избегать введения новых тер- минов и стремились использовать те, которые уже употребля- лись в руководствах иа русском языке. В особенности это отно- сится к первым, вводным главам книги, где изложены методы
Предисловие редактора перевода 7 современной теории вероятностей, на серьезное знакомство чи- тателя с которыми у нас не было основания надеяться. Перевод многих терминов был сверен и согласован с недавно вышед- шим из печати справочником («Справочник по теории вероят- ностей и математической статистике» В. С. Корюк, Н. К. Пор- тенко, А. В. Скороход, А. Ф. Турбин, М.: Наука, 1985), а также монографией С. А. Ахманова, Ю. Е. Дьякова и А. С. Чиркина «Введение в статистическую радиофизику и оптику» (М.: Наука, 1984). В тексте и в списке цитируемых источников автор неодно- кратно ссылается на оригинальные работы иностранных и совет- ских авторов, существенным образом дополняющие излагаемый материал. Имея в виду советского читателя, мы сочли необхо- димым добавить небольшое число ссылок на отечественные ис- точники и русские переводы некоторых иностранных книг !). При этом мы исходили из единственного желания облегчить знаком- ство читателя с более доступной для него литературой. Редактор русского перевода книги Дж. Гудмена надеется, что она принесет пользу всем, кто в своей деятельности связан с решением задач, в которых каким-либо образом проявляется статистическая природа оптического излучения. Она, несомненно, принесет пользу тем преподавателям университетов и инже- нерно-технических вузов, которые читают лекции по физической оптике и квантовой электронике. Студенты старших курсов и аспиранты физических специальностей найдут в ней богатый ма- териал для самостоятельного изучения предмета. Редактор и переводчик не сомневаются, что эта книга будет долгое время служить настольным руководством и справочни- ком, занимая достойное место в оптических лабораториях и до- машних библиотеках. проф. Г, В, Скроцкий ’) Отмечены звездочкой в списках «Дополнительной литературы».
Посвящается Хон Май, давшей свет ПРЕДИСЛОВИЕ С начала 60-х годов постепенно стало ясно, что современный академический курс по оптике должен содержать серьезное из- ложение принципов фурье-анализа и теории линейных систем. В основу данной книги положен тезис о том, что в настоящее время уже столь же необходимы методы теории вероятностей и статистики и в учебные планы любого курса высшей оптики не- пременно должны входить элементы статистической оптики. За написание своей книги я взялся, чувствуя потребность в соответ- ствующем учебнике для данной области науки. Вопросы, рассматриваемые в книге, хотя и полностью отно- сятся к физике, легко могут быть затемнены математикой. По- этому перед автором такой книги встает задача: как наилучшим образом использовать мощные математические методы, не до- пуская при этом потери физической ясности? Приходится прибе- гать к компромиссам в отношении математической строгости и по возможности чаще снова и снова подчеркивать физический смысл математических величин. Так как одним из наиболее фун- даментальных физических явлений, которые затрагиваются в большинстве из рассматриваемых вопросов, следует считать формирование интерференционных структур, при интерпретации математических формул я старался по возможности опираться на представления об интерференционной картине. Надеюсь, что такой подход будет наиболее подходящим как для инженеров- оптиков, так и для инженеров-электриков, оставаясь вполне яс- ным также и для физиков. Книга может служить руководством для самостоятельного изучения, а также пособием для лекторов по оптике. В ней дается много задач, которые можно задавать на дом. Материал, содержащийся в этой книге, охватывает весьма широкий круг вопросов. Их перечень приводится в гл. 1. Курс, который положен в основу книги, излагался в течение одной 10-недельной академической четверти, но материала, содержа- щегося в книге, достаточно и для полного 15-недельного семе- стра, а возможно, даже для двух академических четвертей. Та- ким образом, задача состоит в том, чтобы решить, какой мате-
Предисловие 9 риал опустить в случае одночетвертного варианта. Если мате- риал проходится в течение одной четверти, то необходимо, чтобы студенты были уже знакомы с теорией вероятностей и теорией стохастических процессов, а также хорошо владели методом Фурье. В таких условиях я предлагаю преподавателю оставить гл. 1—3 студентам для самостоятельного изучения и начать лек- ции непосредственно с изложения оптики в гл. 4. При нехватке времени могут быть опущены или оставлены для выборочного чтения следующие разделы: гл. 5, § 6, п. Г и § 7; гл. 6, § 1, п. В, § 2 и 3; гл. 7, § 2, п. В, § 5; гл. 8, § 2, п. Б, § 6, п. А, § 7, п. Б, § 8, п. В; гл. 9, § 4—6. Замечу, что в некоторых случаях я использовал гл. 2 и З в качестве базы для полного одночет- вертного курса по основам теории вероятностей и теории стоха- стических процессов. Книга возникла из составленных в 1968 г. необработанных конспектов лекций, читавшихся в Станфордском университете, так что она писалась очень долго. Во многих отношениях работа оказалась слишком долгой (с чем, конечно, согласится мой тер- пеливый издатель), так как за период более 15 лет в любой области науки происходят важные изменения. Но я старался излагать материал таким образом, чтобы книга не устаревала со временем. Чтобы дать читателю новейшую информацию, я привожу в конце отдельных глав списки работ, опубликован- ных в последние годы. Переход от необработанных конспектов к более связной ру- кописи начался в 1973/74 учебном году, когда мне посчастливи- лось провести свой годовой творческий отпуск во Франции, в Оптическом институте в Орсэ. Гостеприимство непосредственно принимавшего меня профессора Сержа Ловенталя, так же как и директора института профессора Андре Марешаля, было без- упречным. Они не только создали мне необходимое для продук- тивной работы окружение, но были настолько любезны, что осво- бодили меня от обязанностей, обычно связанных с формальным исполнением должности. Я весьма благодарен им за поддержку и советы, без которых эта книга никогда не получила бы надеж- ного старта. Благодаря той неторопливости, с которой шла работа над книгой, я имел возможность в течение многих лет представлять материал на суд множеству аспирантов с их невероятной спо- собностью вскрывать в рукописи слабые аргументы и находить ошибки. Поэтому я считаю себя во многом обязанным слушате- лям моего курса статистической оптики в Станфорде. Улучшав- шиеся конспекты использовались также в ряде других универ- ситетов, и я благодарен Вильяму Родсу (Технологический инсти- тут шт. Джорджия) и Тимоти Стренду (Университет Южной
10 Предисловие Калифорнии) за «сигналы обратной связи», способствовавшие улучшению изложения. Отношения между автором и издателем часто бывают отчуж- денными, а иногда и неприятными. Ничего подобного не было в данном случае. Беатрис Шьюб, редактор издательства «Джон Уайли», которая убеждала меня начать работу над этой книгой 15 лет назад, не только была исключительно терпелива и полна понимания, но и оказала также большую поддержку в процессе работы и стала моим большим личным другом. Было огромным удовольствием работать с ней. Я должен особо поблагодарить К.-Ч. Чин из Пекинского уни- верситета за то время, которое она щедро уделила чтению ру- кописи, а за предложенные улучшения, а также Юдиф Кларк, на высоком профессиональном уровне перепечатавшую рукопись. Наконец, я не нахожу слов, чтобы выразить свою благодар- ность моей жене Хон Май и моей дочери Мишель не только за их поддержку, но также за многие часы, которые им пришлось проводить без меня, пока я работал над книгой. Станфорд, шт. Калифорния Джозеф В. Гудмен Октябрь 1984 г.
Глава 1 ВВЕДЕНИЕ Оптика как область науки уже давно вступила во второе тыся- челетие своей жизни, но, несмотря на свой возраст, остается еще замечательной юной и полной сил. В середине двадцатого столетия различные события и открытия дали ей новую жизнь, новую энергию и богатство. Особенно важное значение при этом имело: 1) введение в оптику понятий и методов фурье-анализа и теории связи, начавшееся в конце 1940-х годов и продолжав- шееся на протяжении 1950-х годов, 2) открытие лазера и успешное освоение лазерной техники в конце 1950-х годов и 3) появление нелинейной оптики в 1960-х годах. В данной книге проводится тезис о том, что менее бросающиеся в глаза, но столь же важные изменения в области оптики происходили по- степенно (с ускоряющимся темпом) в течение всего столетия за счет внедрения статистических понятий и статистических мето- дов анализа. Роли таких понятий в оптике и посвящена наша книга. Область статистической оптики имеет свою богатую историю Многие фундаментальные статистические проблемы были ре- шены еще в конце 19-го столетия применительно к акустике и оптике Рэлеем. Потребность в статистических методах в оптике исключительно возросла в связи со статистической интерпрета- цией квантовой механики, предложенной Борном. Введенная в 1954 г. Вольфом изящная и общая схема рассмотрения коге- рентных свойств волн явилась основой, которая позволила еди- ным образом изучать многие важные статистические проблемы в оптике. Заслуживает также отдельного упоминания полуклас- сическая теория регистрации света, созданная Менделем, ко- торая связала (сравнительно простым образом) статистические флуктуации классических волновых величин (поля, интенсив- ности) с флуктуациями, характерными для взаимодействия света с веществом. Хотя эта история еще далека от заверше- ния, в отдельных последующих главах мы будем к ней воз- вращаться.
12 Глава 1 § 1. Детерминированное и статистическое описание явлений При нормальном ходе событий любой изучающий физику или технику знакомится с оптикой прежде всего на полностью де- терминистской основе. При этом физические величины представ- ляются математическими функциями, которые либо полностью заранее определены, либо предполагаются точно измеримыми. Эти физические величины подчиняются хорошо определенным преобразованиям, которые видоизменяют их полностью предска- зуемым образом. Например, если монохроматическая световая волна с известным сложным распределением поля падает на прозрачное отверстие в совершенно непрозрачном экране, то рас- пределение поля, возникающего на некотором' расстоянии от экрана, может быть вычислено точно с помощью хорошо изве- стных дифракционных формул волновой оптики. Изучившие такой вводный курс могут почувствовать уверен- ность, что они освоили основные физические понятия и законы и готовы найти правильный ответ почти на любой вопрос, кото- рый встретится на их пути. Конечно, их, вероятно, предупредили, что имеется ряд проблем (возникающих, в частности, при реги- страции слабых световых волн), для рассмотрения которых тре- буется статистический подход. Однако статистический подход к решению задач часто на первый взгляд кажется подходом «вто- рого класса», так как он обычно используется в том случае, когда мы не имеем достаточной информации для того, чтобы найти более изящное «точное» решение. Задача по своей при- роде может оказаться либо слишком сложной для аналитиче- ского или численного решения, либо могут быть плохо опреде- лены граничные условия. Поэтому более предпочтительным спо- собом решения кажется детерминистский способ, обращение же к статистическому методу представляется только свидетельством нашей собственной слабости или ограниченности. Отчасти по этой причине предмет статистической оптики обычно оставляют лишь для студентов повышенного уровня обучения, особенно для тех, кто обнаруживает математические склонности. Хотя происхождение указанного взгляда на вещи совершенно ясно и понятно, вытекающие из него выводы относительно пре- имуществ детерминистского анализа перед статистическим в высшей степени ошибочны и вот почему. Во-первых, трудно представить себе реальную техническую задачу в оптике, которая не содержала бы некоторые элементы неопределенности, требующие статистического анализа. Даже конструктор линз, который вычерчивает ход лучей в них на ос- новании апробированных в течение столетий точных физических законов, в конце концов должен подумать и о контроле качества
Введение 13 линзы! Таким образом, статистику, несомненно, нельзя считать предметом, которым должны заниматься в основном интересую- щиеся более математикой, чем физикой и техникой. Во-вторых, уверенность в том, что применение статистики есть признание своей беспомощности и потому нужно стараться обходиться без нее, основана на слишком узком взгляде на при- роду статистических явлений. Экспериментальные данные пока- зывают (и огромное большинство физиков глубоко убеждены в этом), что взаимодействие света и вещества носит принци- пиально статистический характер и заранее не может быть пред- сказано с абсолютной точностью. Таким образом, статистиче- ские явления играют необычайно важную роль в окружающем нас мире независимо от наших индивидуальных умственных спо- собностей и неспособностей. И наконец, в-третьих, в защиту статистического анализа можно сказать еще и то, что, хотя и при детерминистском и при статистическом подходе для решения задач требуются конкрет- ные математические модели физических явлений, модели, по- строенные для статистического анализа, по самой своей сущ- ности оказываются более общими и более гибкими. К тому же они неизменно включают в себя детерминированную модель в качестве частного случая! Чтобы статистическая модель давала точные осмысленные результаты, в ней должно полностью учи- тываться все, что в настоящее время известно о рассматривае- мых физических параметрах. Наши решения статистических за- дач могут быть более точными, чем те модели, которые мы используем для описания как соответствующих физических зако- нов, так и уровня нашего знания или незнания. Правда, статистический подход несколько сложнее детерми- нистского, поскольку требует знания основ теории вероятно- стей. Но в конечном счете при решении физических задач, имею- щих подлинный практический интерес, статистические модели являются значительно более мощными и шире применимыми, чем детерминированные модели. Надеюсь, что читатель согла- сится с этим, когда закончит изучение данной книги. § 2. Статистические явления в оптике Статистические явления так часто встречаются в оптике, что можно было бы без труда составить длинный список примеров. Из-за широкого разнообразия таких задач трудно найти общую схему для их классификации. Здесь мы попытаемся установить некоторые общие аспекты оптики, которые требуют статистиче- ских методов исследования. Эти аспекты удобно обсудить в связи с проблемой формирования оптического изображения.
14 Глава 1 Большинство проблем, связанных с формированием оптиче- ского изображения, относятся к следующему типу. Пусть, на- пример, природа допускает некоторое выделенное состояние (скажем, определенную совокупность атомов или молекул в не- которой удаленной области пространства, определенное распре- деление коэффициента отражения на поверхности с неизве- стными характеристиками или определенное распределение коэффициента пропускания в рассматриваемом образце). Опе- рируя с оптическими волнами, возникающими в результате Рис. 1,1. Система, формирующая оптическое изображение. этого состояния природы, мы хотим точно узнать, что представ- ляет собой это состояние. Статистика, появляется в этой задаче весьма многогранно, что можно увидеть, обращаясь к рис. 1.1, Во-первых (и это яв- ляется наиболее фундаментальным моментом), данное состоя- ние природы известно нам априори только в статистическом смысле. Если бы оно было известно точно, то не было бы ника- кой необходимости в измерении. Таким образом, состояние при- роды носит случайный характер, и, чтобы правильно оценить, как действует рассматриваемая система, мы должны иметь ста- тистическую модель, в идеале представляющую всю совокуп- ность возможных состояний с соответствующими вероятностями. Обычно бывает достаточным и менее полное описание статисти- ческих свойств объекта. Наша измерительная система воздействует не на само со- стояние природы, а на оптическое представление этого состоя- ния (например, на испущенный, прошедший или отраженный свет). Представление состояния природы посредством оптиче- ской волны имеет само по себе статистические черты, в первую очередь из-за статистических или случайных свойств всех реаль- ных световых волн. В силу принципа статистического характера взаимодействия света с веществом все оптические источники дают излучение, свойства которого тоже носят статистиче- ский характер. В одном предельном случае мы имеем хаотиче-
Введение 15 ское, неупорядоченное, испускание света тепловым источником, таким, как лампа накаливания, в другом — сравнительно упоря- доченное испускание света газовым лазером непрерывного дей- ствия (ЛНД). Такой свет близок к распространяющемуся в определенном направлении монохроматическому излучению. Тем не менее излучение любого реального лазера обнаруживает статистические свойства, в частности случайные флуктуации амплитуды и фазы. Статистические флуктуации света имеют важное значение во многих оптических экспериментах и дей- ствительно играют центральную роль при определении ха- рактера изображения, создаваемого системой, показанной на рис. 1.1. После своего взаимодействия с рассматриваемым состоянием природы излучение распространяется через промежуточную среду, пока не достигнет нашего измерительного прибора. Па- раметры среды могут быть либо хорошо известны, либо совсем неизвестны. Если такой средой является совершенный вакуум, то она не вносит никаких дополнительных статистических эле- ментов в рассматриваемую задачу. Но, если средой является атмосфера Земли, а длина оптического пути составляет хотя бы несколько метров, случайные флуктуации показателя преломле- ния атмосферы могут привести к существенному искажению волн и серьезному ухудшению изображения, создаваемого си- стемой. Чтобы количественно оценить степень такого ухудше- ния, требуются статистические методы. Далее свет попадает в наше измерительное устройство, кото- рое производит над ним ряд необходимых операций перед его регистрацией. Например, световой пучок может пройти через интерферометр, как в случае фурье-спектроскопии, или через систему линз, как при аэрофотосъемке. Спрашивается, насколь- ко хорошо известны «истинные» параметры нашего измеритель- ного прибора? Любая неполнота знаний об этих параметрах должна быть учтена в нашей статистической модели измеритель- ного процесса. Это могут быть, например, неизвестные ошибки в деформации волнового фронта, вносимые при прохождении системы линз. Такие ошибки могут быть обычно смоделированы статистически и учтены при расчете системы. Наконец, излучение достигает фотоприемника, где снова свет взаимодействует с веществом. Случайные флуктуации регистри- руемого сигнала легко наблюдаются, особенно при низких све- товых уровнях; они могут быть обусловлены разными причи- нами, в том числе дискретным характером взаимодействия света с веществом и наличием внутреннего электронного шума фотоприемника (теплового шума). Результат измерения лишь статистически связан с изображением, попадающим на фото- приемник.
16 Глава 1 Таким образом, чтобы полностью определить работу системы на всех ступенях рассматриваемой оптической задачи, включая испускание света, его передачу, формирование изображения и регистрацию, необходимо использование статистических методов. Цель, которую мы преследуем в этой книге, состоит в том, чтобы познакомить читателя с основами статистических методов ана- лиза и продемонстрировать их применение в различных обла- стях оптики. § 3. Общий план книги За введением следует восемь глав. Для тех научных работни- ков и инженеров, работающих в области оптики, которые поже- лали бы повысить свою компетентность в статистических мето- дах, в гл. 2 представлен обзор теории вероятностей, а гл. 3 содержит обзор теории случайных процессов, используемых в ка- честве моделей для статистических явлений, описываемых в по- следующих главах. Читатель, уже знакомый с этими вопросами, может сразу перейти к гл. 4, рассматривая предыдущий мате- риал в качестве справочного. Обсуждение оптических проблем начинается в гл. 4, в кото- рой излагаются статистические свойства «первого порядка» (т. е. статистические свойства в отдельной точке пространства и вре- мени) для нескольких видов световых волн, включая генерируе- мые тепловыми источниками и лазерами. Кроме того, сюда включено введение в формализм, с помощью которого описы- ваются поляризационные свойства оптической волны. В гл. 5 вводятся понятия временной и пространственной ко- герентности (которые являются статистическими свойствами световых волн «второго порядка») и затем рассматривается про- цесс распространения когерентности при различных условиях. В гл. 6 эта теория обобщается на случай когерентности четвер- того порядка и демонстрируется необходимость введения функ- ций когерентности четвертого порядка при рассмотрении разно- образных оптических задач, в частности при классическом ана- лизе интерферометра интенсивностей. Гл. 7 посвящена теории формирования изображения в ча- стично когерентном свете. Излагаются некоторые аналитические подходы к задаче. В этой главе также вводится и используется для понимания характера оптических систем, формирующих изо- бражение, широко применяемое в радиоастрономии понятие ин- терферометрического формирования изображения. Рассматри- вается также вопрос о восстановлении фазы. В гл. 8 речь идет о влиянии хаотических сред, таких, как атмосфера Земли, на качество изображения, формируемого
Введение 17 оптическими устройствами. Рассматриваются причины случай- ных флуктуаций показателя преломления в атмосфере и форму- лируются статистические модели таких флуктуаций. Модели- руется также влияние этих флуктуаций на оптические волны, со статистической точки зрения исследуется вопрос о деградации изображения, вносимой атмосферой. Подробно разбирается звездная спекл-интерферометрия — метод, позволяющий ча- стично подавлять влияние атмосферной турбулентности. Наконец, в гл. 9 излагается полуклассическая теория реги- страции света, которая иллюстрируется на примере анализа ограничений для чувствительности амплитудной интерферомет- рии, интерферометрии интенсивностей и звездной спекл-интер- ферометрии. Приложения А—В содержат дополнительный материал. .
Глава 2 СЛУЧАЙНЫЕ ПЕРЕМЕННЫЕ Поскольку данная книга посвящена в основном статистическим проблемам в оптике, мы начнем с четкого изложения матема- тических методов, используемых при анализе случайных или статистических явлений. Мы будем исходить из того, что чита- тель по крайней мере частично знаком с основными элементами теории вероятностей. В данной главе мы дадим общий обзор наиболее важного материала, установим обозначения и предста- вим ряд конкретных результатов, которыми будем пользоваться в дальнейшем в приложениях теории. Особое внимание обра- щается не на математическую строгость, а на физическую на- глядность. Для более полного изучения теории вероятностей читатель может обратиться к руководствам по статистике (на- пример, [2.1, 2.2]). Кроме того, существует много прекрасных книг технического характера, в которых излагается теория слу- чайных переменных и случайных процессов (например, [2.3— 2.8]). § 1. Определения вероятности и случайных переменных Под случайным экспериментом мы понимаем такой эксперимент, результат которого не может быть предсказан заранее. Пусть совокупность возможных результатов представлена в виде на- бора событий {Я}. Например, если эксперимент состоит в мета- нии сразу двух монет, то возможны следующие «элементарные события»: РР, РО, ОР, 00, где Р — «решка», а О — «орел». Од- нако набор {Л} содержит более четырех элементов, поскольку в него включаются также такие события, как «по меньшей мере одна решка в двух метаниях» (РР, РО или ОР). Если Л[ и Лг— любые два события, то набор {Л} должен также содержать та- кие события, как А\ и Лг, Л[ или Л2, ни Л[ ни Лг. Таким путем на основе элементарных событий выводится полный набор Л. Если мы повторим эксперимент N раз и обнаружим, что конкретное событие Л имеет место п раз, то получим относи-
Случайные переменные 19 тельную частоту события Л, равную отношению n/N. Поэтому может показаться, что вероятность события А следует пони- мать как предел относительной частоты при неограниченно рас- тущем числе испытаний 2V: Р(Л)= Шп£. (2.1.1) К сожалению, такое определение вероятности нельзя считать полностью удовлетворительным. Дело в том, что в нем мы исхо- дим из предположения, что относительная частота каждого со- бытия должна иметь определенный предел при возрастании Nf а этого мы никаким способом не можем доказать. Более того, мы никогда не сможем реально измерить точное значение Р(А), так как для этого потребовалось бы бесконечно большое число экспериментальных испытаний. Вследствие этих и других труд- ностей в теории вероятностей более предпочтительным оказы- вается аксиоматический подход, при котором с самого начала предполагается, что вероятности удовлетворяют определенным аксиомам, причем все они формулируются с учетом соответ- ствующих свойств относительных частот. Эти аксиомы таковы: 1. Все вероятности Р(А) удовлетворяют условию Р(Л)^0. 2. Если S — событие, которое достоверно должно произойти, то P(S)= 1. 3. Если Л1 и Л2 — взаимоисключающие события, т. е. одно из них исключается другим, то вероятность события или Лз» удовлетворяет соотношению Р(Д или Л2) = Р(Д1) + Р(Л2). Теория вероятностей основана на этих аксиомах. Вопрос о приписании конкретных численных значений ве- роятностям разных событий относится не к аксиоматическому подходу, а к нашей физической интуиции. Любое численное значение, которое мы приписываем вероятности данного собы- тия, должно находиться в согласии с нашей интуитивной оцен- кой предельной частоты этого события. Таким образом, мы просто строим некую статистическую модель, которая, как мы предполагаем, должна представлять экспериментальную ситуа- цию. Необходимость прибегать к гипотетической модели не должна нас смущать, поскольку и для любого детерминистского анализа тоже необходимы гипотезы о рассматриваемых физиче- ских реальностях и преобразованиях, которым они подвергают- ся. Наша статистическая модель должна оцениваться по той точности, с которой она описывает результаты многократно по- вторяемых испытаний.
20 Глава 2 Теперь мы подготовлены к тому, чтобы ввести понятие слу- чайной переменной. Каждому возможному элементарному собы- тию А нашего рассматриваемого случайного эксперимента сопо- ставим действительное число и(А). Случайная переменная U есть набор всех возможных значений и (Л) вместе с соответ- ствующей мерой их вероятностей1). Подчеркнем, что в понятие случайной переменной входят как набор величин, так и связан- ные с ними вероятности и, следовательно, оно охватывает всю статистическую модель, которую мы принимаем в качестве ги- потезы для описания случайного явления. § 2. Функция распределения и плотность распределения Случайная переменная U называется дискретной, если резуль- таты эксперимента представляют собой дискретный набор воз- можных чисел. Случайная переменная называется непрерывной, если экспериментальные результаты могут лежать где угодно в некоем континууме возможных значений. Иногда встречается смешанная случайная переменная, когда результаты оказывают- ся либо в дискретном наборе (с определенной вероятностью), либо располагаются в континууме. Во всех случаях удобно описывать случайную переменную U, пользуясь функцией распределения Fu(и), которая определяется следующим образом2): («) = Prob {(/<«}; (2.2.1) таким образом, это вероятность того, что случайная перемен- ная U примет значение, не превышающее конкретного значения и. Опираясь на основные аксиомы теории вероятностей, мы мо- жем показать, что такая функция Гу(ы) обладает следующими свойствами: 1) Гу (и) не убывает с увеличением аргумента. 2) ^(-оо) = 0. 3) ^(+оо) = 1. На рис. 2.1 показаны типичные формы функции Fu(u) в ди- скретном, непрерывном и смешанном случаях. Заметим, что ве- роятность того, что U лежит в пределах а < U Ь, может быть записана в виде Prob {а < U < b} = Fy (b) - Fy (а). (2.2.2) *) Здесь н в гл. 3 мы обозначаем случайные переменные заглавными бук- вами, а конкретные значения случайных переменных — маленькими буквами. 2) Символом Prob { } обозначена вероятность события, указанного в скоб- ках.
Случайные переменные 21 Более важной для нас с точки зрения практического приме- нения будет плотность распределения ри(и), определяемая так1): F„(u Ри(и)^-~-Ри(и). (2.2.3) Когда мы имеем дело с непре- рывной случайной переменной [7, трудностей применения это- го определения не возникает, так как функция Fu(u) всюду дифференцируема. Из того что по определению производ- ной Ри(и)= lim х Ди->0 Fу (u) - (и - Ди) Л Ди мы видим, что при достаточ- но малых Ди Ри (и) \и Fa (и) — — Ри (и — Ди) = Prob {и — — Ди < U и), или, в словесной формулиров- ке, ри(и)\и есть вероятность того, что U лежит в области и — Au < [7 и. Из фунда- ментальных свойств _ функции Fu(u) следует, что Ри(и) должна иметь следующие ос- новные свойства: Pt/(u)>0, Pu(u)du=\. в Рнс. 2.1, Примерные функции распре- деления: а) дискретной, б) непрерыв- ной н б) смешанной случайных пере- менных. (2.2.4) Вероятность того, что U при- мет значение, лежащее в пре- делах от а до Ь, может быть выражена через плотность вероят- ности: ь Prob {а < U Ь} = ри (u) du. а (2.2.5) ’) Символ А, означает «равно по определению». — Прим., перев.
22 Глава 2 Если U — дискретная случайная переменная, то Fu(u)—раз- рывная функция и, следовательно, ри(и) не существует в обыч- ном смысле. Но мы можем включить этот случай в наше по- PuW Площади иг щ а <5 в Рис. 2.2. Примеры плотности распределения: а) дискретной, б) непрерыв- ном и в) смешанной случайных переменных. строение, введя 6-функции Дирака [2.9, гл. 5]. Плотность рас- пределения принимает вид оо Ри («) = Е Р (tiki Ъ(Ц — uk), (2.2.6) причем {«i, «2, • • •, Uk, • • •} есть дискретный набор возможных численных значений, а для 6-функции определены свойства ') 6 (U — Mfe) = О, « #= Ufe, Г (2 2 7) J g(u)t>(u-uk')du = g(u^. 1 ' • Плотность распределения смешанной случайной переменной со- держит как непрерывную, так и 6-образные компоненты. На *) Символом g (uk ) обозначен предел функции g(u) при и, стремящемся к uk слева. В случае непрерывной функции g(u) имеем (wfe) = £(ufe)*
Случайные переменные 23 рис. 2.2 показан характер плотности распределения для этих трех случаев. Для иллюстрации непрерывного и дискретного случаев при- ведем две конкретные плотности распределения, важные для нас в последующем изложении: Гауссовская (нормальная) плотность распределения „ / ч 1 ( (и — й)2 ) Ри («) = - /г- exp 4--—, У2ла ( 2а2 ) Пуассоновская плотность распределения °° k Ри («) = X е~к{> (и ~ fe=0 где й, а и k — параметры. § 3. Совместное распределение двух и большего числа случайных переменных Рассмотрим два случайных эксперимента с наборами возмож- ных событий {Л} и {В}. Если события берутся парами, по од- ному из каждого набора, то получится новый набор возможных совместных исходов; обозначим его через {ДХВ}. Относитель- ную частоту, с которой конкретное событие А наступает совме- стно с конкретным событием В, обозначим через n/N, где N — число совместных экспериментальных испытаний, а п— число случаев, когда события А и В наступают как совместные ре- зультаты двух экспериментов. Введем вероятность совместных событий Р(Д,В) для этой пары исходов, а конкретное значение этой вероятности определим, основываясь на нашей интуитив- ной оценке предельного значения относительной частоты n/N. Поскольку Р(Д,В)—вероятность, она должна удовлетворять аксиомам, приведенным в § 1. Каждому исходу А первого эксперимента припишем числен- ное значение н(Д), а каждому исходу В второго эксперимента — значение v(B). Совместная случайная переменная UV опреде- ляется как совокупность всех возможных совместных чисел (и, и) вместе с соответствующей мерой вероятности. Совместная функция распределения Fuv(u, и) для совместной случайной переменной UV определяется как Fuv(u, v) A Prob {U^u и (2.3.1) а совместная плотность распределения puv(u, v) — как Pvv («» у) Fuv (2-3-2)
24 Глава 2 Здесь частные производные должны рассматриваться либо в обычном смысле, либо в смысле, определяемом свойствами 6-функций, в зависимости от того, является ли переменная Fuv непрерывной или нет. Плотность распределения Puv(u,v) должна иметь единичный объем, т. е. 55 РиЛи, v)dudv = \t (2.3.3) — оо Если мы знаем совместные вероятности всех конкретных событий А н В, то мы можем попытаться определить вероят- ность того, что конкретное событие А происходит при любых сопровождающих его отдельных событиях В. Основываясь не- посредственно на понятии относительных частот, можно пока- зать, что Р(А) = Е Р(А В) Все В и аналогично Р(В) = S Р(А, В). Все А Определенные так величины Р(А) и Р(В) называются марги- нальными вероятностями событий А и В. Аналогичным образом определяются маргинальные плот- ности распределения случайных величин U и V для двух слу- чайных экспериментов, а именно: PuGOA 5 Z (2.3.4) Pv(OA J Puv(u, v)du. — oo Это — плотности распределения одной случайной переменной, когда конкретное значение второй случайной переменной не су- щественно. Вероятность наблюдения события В в одном эксперименте при условии, что событие А уже наблюдалось в другом экспери- менте, называется условной вероятностью события В относи- тельно события А и записывается в виде Р(В/А), Заметим, что относительная частота совместного события (А, В) может быть записана в виде п п jn~ N mN" где и — число случаев, когда совместное событие (А, В) имеет место в N испытаниях, тогда как m— число случаев, когда со-
Случайные переменные 25 бытие А имеет место в N испытаниях независимо от частного значения В, Но отношение m/N представляет собой маргиналь- ную относительную частоту события А, в то время как п/т есть условная относительная частота исходов В, если событие А про- изошло. Из сказанного следует, что должна выполняться «фор- мула умножения вероятностей» Р[А, В) = Р(А)Р(В\А), откуда Р(В\А) = Р (Л, В)/Р (Л). (2.3.5) Аналогично Р(А\В) = Р(А, В)/Р(В). (2.3.6) Из выражений (2.3.5), (2.3.6) следует соотношение р (В | А) = . (2.3.7) называемое формулой Байеса. Следуя приведенным выше соображениям, определим услов- ные плотности распределения U и V как , , v Puv (и' РИо(и1ы).— / । \ Puv Наконец, введем понятие статистической независимости. Две случайные переменные U и V называются статистически неза- висимыми, если знание значения одной из них не влияет на ве- роятности, связанные с возможными значениями второй. Отсюда следует, что для статистически независимых случайных пере- менных мы имеем PF|t/(vl“) = Mv)- (2-3-9) Отсюда в свою очередь получаем Puv(u> v) = PuPv\u(v\u^ = Pu^Pv^> (2.3.10) или, в словесной формулировке, совместная плотность распреде- ления двух независимых случайных переменных равна произве- дению двух маргинальных плотностей распределения1). § 4. Статистические средние Пусть g(u)— функция, которая всякому действительному числу и сопоставляет новое действительное число g(u). Если и — *) При более общем подходе два события А и В статистически незави- симы, если Р(Л, В) *= Р(А)Р(В).
26 Глава 2 значение случайной переменной, то g(u)— тоже значение слу- чайной переменной. Определим статистическое среднее (среднее значение, мате- матическое ожидание) функции g(u) как £(«) = £ [£(«)] A J g(u)pu(u)du. (2.4.1) — 00 , Если мы имеем дело с дискретной случайной переменной, то выражение для ри(и) имеет вид Ри(и) = £ P(uk)t>(u — ик), (2.4.2) так что g («) = Е Р g («Д (2.4.3) k Если же мы рассматриваем непрерывную случайную переменную, то среднее значение следует определять как интеграл. А. Моменты случайных переменных Простейшими средними характеристиками случайной перемен- ной являются ее моменты, которые (если они существуют) по- лучаются подстановкой выражения £(u) = un в формулу (2.4.1). Особенно важны первый момент (среднее значение, математическое ожидание) + <*> й — ирц{и)йи (2.4.4) — оо и второй момент (среднеквадратичное значение) + °° и2 = u2pv(u)du. (2.4.5) — оо Часто наибольший интерес представляют флуктуации слу- чайной переменной относительно среднего значения; они харак- теризуются центральными моментами, которые получаются при g(u) = (u — u)n. (2.4.6) Особую роль играет второй центральный момент, который на- зывается дисперсией и определяется как + оо <т2= (и — ufpy(u)du. (2,4,7)
Случайные переменные 27 В качестве упражнения (см. задачу 2.1) читатель может дока- зать следующее соотношение между моментами случайной пе- ременной: W2 = (Й)2 + <т2. Квадратный корень из дисперсии <т, называемый среднеквадра- тичным или стандартным отклонением величины U, является ме- рой разброса значений случайной переменной U. Б. Смешанные моменты случайных переменных Пусть U и V — случайные переменные, характеризуемые совме- стной плотностью распределения puv(u, v). Смешанные моменты величин U и V определяются выражением +<*> ипит Д unvmpuv(u, v)dudv. (2.4.8) Особый интерес представляют такие моменты, как корреляция случайных переменных U и V 4-со ГУГ = uv = uvpuv (и, о) du dv\ (2.4.9) —оо ковариация величин U и V Cuv = (и — й) (о — о) = Гуу — йй и коэффициент корреляции величин U и V Р=-^. (2.4.10) (2.4.11) Коэффициент корреляции есть прямая мера подобия флук- туаций переменных U и V. Покажем, что модуль величины р всегда лежит в пределах от нуля до единицы. Для этого вос- пользуемся неравенством Шварца, которое выполняется для любых двух (действительных или комплексных) функций f(u, v) и g(u,o)’): f(u, v)g(u, v)dudv Ч-оо 4-°о v)\2dudv lg(u, v) I2 du dv, (2.4.12) — oo *) Мы будем обозначать жирными буквами величины, которые могут иметь комплексные значения.
28 Глава 2 причем равенство справедливо только при условии g(u, u) = af*(u, и), (2.4.13) где а — комплексная постоянная, а «звездочка» означает ком- плексное сопряжение. Выбирая получаем t(u, v) = (u — u)^/puv(u, v), g (и, v) = (V — о) Vpyv(u, и), (2.4.14) (и — «) (о — о) puv (и, о) du dv «С (u — u)2puv(u,v)dudv\ \ (о — v)2 puv (и, и) du dv (2.4.15) или эквивалентное соотношение |Cuv| < QuOv, чем и доказы- вается, что (2.4.16) Если р = 1, то говорят, что величины U и V полностью кор- релированье, это означает, что их флуктуации идентичны с точ- ностью до возможных масштабных коэффициентов. Если р =—1, то говорят, что переменные U и V антикоррелированье, это озна- чает, что их флуктуации идентичны, но противоположны по знаку (снова с точностью до масштабных коэффициентов), на- пример большое положительное отклонение величины U совпа- дает с большим отрицательным отклонением величины V. Если коэффициент корреляции р тождественно равен нулю, то говорят, что величины U и V не коррелированье Читатель может легко показать (см. задачу 2.2), что две статистически независимые случайные переменные всегда некоррелированы. Однако обратное неверно, т. е. из того, что коэффициент корре- ляции равен нулю, не следует статистическая независимость. Классической иллюстрацией этого являются случайные перемен- ные где 0 — случайная переменная с однородным распределением в интервале (—л/2, л/2), т. е. с плотностью распределения О в других случаях.
Случайные переменные 29 Известным значением случайной переменной V однозначно оп- ределяется переменная (7, и поэтому эти две случайные пере- менные статистически зависимы. Читатель может легко убедить- ся (задача 2.3), что величины U и V [формула (2.4.17)] яв- ляются некоррелированными случайными переменными. В. Характеристические функции Характеристическая функция случайной переменной U опреде- ляется как математическое ожидание функции ехр(/йш): + оо Му(а))А ехр(/ши) ри(и)с1и. (2.4.18) — со Таким образом, характеристическая функция есть фурье-образ1) плотности распределения переменной U. Если этот интеграл су- ществует, по крайней мере в смысле, определяемом свойствами 6-функций, то соотношение (2.4.18) обратимо и плотность рас- пределения можно представить в виде + оо Pt/(«) = -^r $ Му(со)ехр(— /(ou)dco. (2.4.19) — оо Следовательно, характеристическая функция содержит всю. ин- формацию о статистических свойствах первого порядка случай- ной переменной U. При определенных условиях характеристическую функцию [а на основании формулы (2.4.19) и плотность распределения] можно найти, зная моменты n-го порядка для всех п. Чтобы продемонстрировать это, разложим экспоненциальную функцию в выражении (2.4.18) в степенной ряд: ехр (/»)==£ «^. Предполагая, что порядок суммирования и интегрирования мо- жет быть изменен, получаем Мс/(<о) = £ S ипРи(и)с1и = ^ (2.4.20) П=0 -сю п=0 (Из условии, при которых допустимо изменение порядка ин- тегрирования и суммирования, произведенное выше, следует, что этот результат справедлив только в том случае, если все 9 Краткая свода фурье-образов приводится в приложении А.
30 Глава 2 моменты конечны, а получающийся ряд абсолютно сходится [2.3].) Кроме того, если существует n-й абсолютный момент + оо \ и \п ри (и) du, то n-й момент переменной U может быть найден, как это видно из выражения (2.4.20), следующим об- разом: (2.4.21) Характеристические функции гауссовского и пуассоновского распределений, как нетрудно показать, имеют вид Гауссовское: Мс/(со) = ехр ехр(/сой), °° ~ k Пуассоновское: Му (со) = e~k exp (/со/г) = = ехр {k (е/й>— 1)}. Иногда мы будем рассматривать совместную характеристи- ческую функцию двух случайных переменных U и V, определяе- мую как 4-00 f&uv fay, cov) = jj $ ехр [/ (соуи + covti)] puv (u, и) du dvf (2.4.22) —oo Совместная плотность распределения вычисляется по М(,ч (юу, toy) путем двумерного обратного преобразования Фурье. При этом совместные моменты величин U и V выражаются в виде (см. задачу 2.5) ---- 1 лп+т иПу,П = -п+т д(Лт МUV (®У> шг) Ly-a-O. (2.4.23) если только | ипит | < оо. Наконец, совместная характеристическая функция п-го по- рядка случайных переменных Ut, th, ..., Un определяется сле- дующим образом: М#>(<Вр <в2, ®„)Д£{ехр[/(<в1«14-(о2и2+ +“„“„)]}• (2.4.24) В эквивалентном матричном обозначении это выражение можно записать так: Му (о) АЕ {exp [/®fu]}, (2.4.25)
Случайные переменные где ш и а — матрицы-столбцы: со = COi со2 (2.4.26) а = «I и2 а верхним индексом t обозначена операция транспонирования матрицы. Совместная плотность распределения n-го порядка ри(и) может быть получена из функции Му (со) путем обрат- ного преобразования Фурье n-го порядка. § 5. Преобразования случайных переменных В практических приложениях важно уметь найти плотность рас- пределения случайной переменной после того, как над ней про- изведено линейное или нелинейное преобразование. Обычно нам известны плотность распределения ри(и) случайной переменной U и преобразование, которому подвергается величина U: z = f(u). (2.5.1) Задача состоит в том, чтобы найти плотность распределения Pz(z). Возможны различные подходы к решению этой задачи в зависимости от вида функции /(«). А. Общее преобразование Рассмотрим сначала наиболее общий случай, предполагая толь- ко, что f(u) — однозначная функция; тогда каждому значению переменной и отвечает только одно значение переменной г. (Но одному значению переменной z может соответствовать много значений переменной и.) На рис. 2.3 показана одна из возмож- ных функций f(u). Самый общий подход к определению pz(z) состоит в следую- щем: нужно сначала найти функцию распределения Fz(z), а за- тем продифференцировать ее по г. Обращаясь к рис. 2.3, вы- берем определенное значение переменной г и введем символ Lz для обозначения совокупности всех точек на оси и, которые отображаются на значения, меньшие значения г или равные ему. (На рис. 2.3 совокупность Lz — отмеченные крестиками уча- стки осн и.) Область Lz зависит, конечно, от выбранного значе- ния переменной г. Вероятность того, что Z г, можно запи- сать в виде Fx(z) = Prob {U<=LZ}. (2.5.2)
32 Глава 2 Тогда плотность распределения pz(z) определяется выражением Pz(z)=-jyProb{l/eLJ. (2.5.3) Как пользоваться этими формулами, лучше всего понять на примере. Пусть U — случайная переменная с известной плот- Рнс. 2.3. Отмеченные крестиками отрезки соответствуют значениям и, при которых случайная переменная Z не превышает указанного конкретного зна- чения г. ностью распределения pu(u)t и пусть z—au2. Требуется найти pz(z). Сначала построим функцию г = аи2 (рис. 2.4). Затем выберем конкретное значение величины г и определим область LZy как показано на рисунке. Ясно, что Fz (г) = Prob {Z < г) = Prob { - д/<U < + aJ(2.5.4) Это выражение может быть переписано в виде Fz(z) = J Pu(u)du— J Put^du. — co —co (2.5.5) Чтобы найти плотность распределения рг(г), остается продиф- ференцировать (2.5.5) по г. Для облегчения решения этой за- дачи воспользуемся общим соотношением (которое пригодится нам и далее в ряде случаев) 8(2) J Pu(u)du = pu[g(z)]-^. (2.5.6) В нашем конкретном примере для первого интеграла мы имеем а для другого dg _ 1 dz 2 Vaz’ dg_ _1 dz 2 Vaz
Случайные переменные 33 Следовательно, (2.5.7) Читатель может разобрать и другие примеры, предложенные в задаче 2.7. Б. Монотонные функции Если преобразование z = f(u) является взаимно однозначным отображением и, следовательно, обратимым (каждое значение переменной и отображается на одно значение переменной г, Z = } Рис. 2.4. Преобразование z = аи2. Отме- ченная крестиками область, ограничен - ная значениями и = ±'х]х^а, соответ- ствует области Lz. Рис. 2.5. Пример взаимно одно- значного преобразования вероят- ности. а каждое значение величины г определяется единственным зна- чением величины и), то возможен более простой способ нахож- дения функции pz(z). Такое преобразование показано на рис. 2.5. Рассмотрим малое приращение Аг в окрестности точки г. Если с помощью этого преобразования мы отобразим обратно эту область приращения, то получим приращение Au в окре- стности точки и = /“1(г)» где — функция, обратная функции f. Теперь воспользуемся тем, что Prob {Z е Аг} = Prob {U е Au). (2.5.8) При малых Ап и Аг это равенство можно приближенно записать в виде Pz (г) Az « Ри (и) Au, (2.5.9) где u = f~l(z). Кроме того, при малых Au и Az имеем Аи«|-^-|Дг. (2.5.10)
34 Глава 2 Подставив (2.5.10) в (2.5.9) и сократив Аг, мы получим соотно- шение, которое становится точным, когда Au и Аг стремятся к нулю: Pz(z) = Pu [Г‘(г)]|4г|- (2.5.11) Так как du/dz — (dz/du)~\ можно написать эквивалентное вы- ражение = (2.5.12) I du | где производная ldz/du[ должна быть выражена через пере- менную г. По формуле (2.5.11) или (2.5.12) можно легко вы- числить функцию pz(z) в любом конкретном случае. Смысл формулы (2.5.12) таков: производной dzjdu функции преобразования определяется то, как плотность распределения в области и переносится на область г. Если \dz/du\— большая величина, то малая область и отображается на большую об- ласть г и поэтому возможные значения редко распределяются в области г. Если \dz/du\—малая величина, то на малую об- ласть оси г отображается большая область оси и и значения г плотно распределяются в этой области. В качестве примера применения этого метода рассмотрим преобразование г = cos и (2.5.13) и плотность распределения ( 1 л | — при 0 < л, Ри№ = ] л (2.5.14) 10 в других случаях. Это преобразование обратимо в области значений и, при кото- рых величина ри(и) отлична от нуля, причем обратная функция имеет вид и = arccos г. (2.5.15) Искомая производная определяется следующим выражением: I du __ 1 I dz 71 — z2 и, таким образом, — —_!при — 1<г^1, W1-Z2 (2.5.16) 0 в других случаях. du dz л На рис. 2.6 представлены график функции pu(u), преобразова- ние г = cos и и получающаяся плотность распределения рг(г).
Случайные переменные 35 Если функция z = f(u) необратима, но состоит из обрати- мых отрезков, то может быть использована процедура, которая сводится к рассмотренной вы- ше. Если на и-м отрезке функ- ция может быть представлена обратимой функцией fn(u), то плотность распределения ве- личины г можно записать в виде р2(г)= а п (г) dz (2.5.17) В качестве конкретного приме- ра мы снова возьмем квадра- тичный закон преобразования г = аи2, который может быть обращен на двух отрезках сле- дующим образом: — приО < и^оо, а г z п — при — оо < и ^0. Для обоих отрезков имеем I du I_ 1 I dz I 2 Vaz и, следовательно, Pz (z) = _ Рс/(л/т) + ^(- л/т) 2 V (2.5.18) в согласии с формулой (2.5.7). в Рис. 2.6. Графики: а) плотности рас- пределения до преобразования, б) за- кона преобразования и в) плотности распределения после преобразования. В. Преобразования многомерных распределений Рассмотрим две случайные переменные W и Z, подчиняющиеся совместному распределению, которые функционально связаны с двумя исходными случайными переменными U и V соотноше-
36 Глава 2 НИЯМИ W — f(u, v), z = g(u, v). (2.5.19) Предположим, что совместная плотность распределения puv(a,v) задана и мы хотим найти совместную плотность распределения Pwz(w, г). В большинстве случаев, представляющих интерес, отображе- ние, описываемое системой уравнений (2.5.19), однозначно [т. е. заданная пара (и, v) отображается только на одну пару (w, г)], но не обязательно взаимно п обратимо. По аналогии с выра- жениями (2.5.2) и (2.5.3) мы можем найти совместную функ- цию распределения FWz{w, г) и затем продифференцировать ее по w и г. Пусть Awz — область плоскости (u, v), на которой вы- полняются оба неравенства W w и Z г. Тогда F^z (^ г) = Prob {(и, и) g= Awz}> (2.5.20) Л2 Pwz (w, г) = Prob {(и, v) е= Awz}. (2.5.21) Поскольку этот наиболее общий подход в нашем дальнейшем изложении не потребуется, мы отнесли рассмотрение примера его применения в задачи (см. задачу 2.8). Если отображения f(u,v) и g(u,v) взаимно однозначны и обратимы, возможен более простой подход. Выразим и и v че- рез w и z следующим образом: и = F(w, z), v = G (w, z). (2.5.22) Вероятность того, что значения и и v лежат внутри бесконечно малого элемента площади AuAv, равна вероятности того, что w и z попадают внутрь элементарной площади AwAz, представ- ляющей собой проекцию элемента площади AuAv, осуществляе- мую обратным преобразованием. Следовательно, PttzZ(^', z) kw Az = puv (u, v)AuAv. (2.5.23) Но при малых (Au, Av) мы имеем Au Av | J |kw kz> (2.5.24) где | J\ — якобиан обратного преобразования; dF dF dw dz 1/1= dG OG , (2.5.25) — dw dz причем двойными вертикальными линиями обозначен модуль детерминанта. Если допускается, что Au и Av могут стать сколь
Случайные переменные 37 угодно малыми, то приближение (2.5.24) становится сколь угодно хорошим. Подставляя (2.5.24) в (2.5,23) и сокращая на A^’Az, получаем в качестве конечного результата Pwz (t^, z) = | / | puv [u = F (w, г), v = G (w, z)]. (2.5.26) В заключение заметим, что якобиан |/| играет ту же роль, что и пройзводная \du/dz\ в уравнении (2.5.11), описывая из- менение плотности распределения в результате преобразования. Пример применения этого результата рассмотрен в следующем параграфе. § 6. Суммы действительных случайных переменных Теперь перейдем к важной задаче нахождения плотности рас- пределения случайной переменной, которая равна сумме двух других случайных переменных. Пусть случайная переменная z является суммой вида Z = -4- V, (2.6.1) и Рис. 2.7. Заштрихована область, в ко- торой Z С z. где U и V — случайные переменные с совместной плотностью распределения puv(u,v). Зная puv(u,v), мы хотим найти pz(z). Для иллюстрации найдем эту величину двумя различными методами. А. Два метода нахождения функции pz(Z) Следуя первому методу нахож- дения плотности распределе- ния pz(z), мы вычислим сна- чала функцию Fz(z) и продиф- ференцируем результат по z. На рис. 2.7 иллюстрируется это вычисление, а именно, вы- брав конкретное значение ве- личины г, мы проводим линию z = u~Fv и определяем область, внутри которой случайная пе- ременная Z меньше или равна z. Функция распределения Fz(z)—вероятность того, что значения (u, v) попадают в эту область. Вычисляя эту вероятность, напишем Fz(z) = 5 5 ^UPuv(U> v)- — со — со (2.6.2)
38 Глава 2 На основании равенства (2.5.6), дифференцируя получаем + °о Pz(z) = $ puv(z — v, v)dv. — СО Fz(z) no z, (2.6.3) Таким образом, мы можем выразить теперь плотность распре- деления pz через заданную совместную плотность распределе- ния puv- Рассмотрим еще и другой метод получения того же самого результата. Для этого воспользуемся выражением (2.5.26) для многомерных преобразований. Поскольку имеется только одно уравнение, связывающее г, а и о, нужно составить второе урав- нение в соответствии с требованиями нашей задачи. Каким точно должно быть второе преобразование, не очевидно, но его можно найти методом проб и ошибок. Выберем простое преобразование w = v, так что у нас будет пара преобразований z = и 4- v, w = v. (2.6.4) Эта пара преобразований обращается следующим образом: и = z — w, V = W- (2.6.5) Якобиан обратного преобразования имеет форму 1/1 = ди ди дг dw до ди dz dw I 1 -1 I o 1 (2.6.6) Поэтому на основании равенства (2.5.26) получаем совместную плотность распределения w и z в виде Pirz (&’, z) = Puv (z — “>)• (2.6.7) Но нас интересует только маргинальная плотность распределе- ния pz(z), которая получается интегрированием pwz по w: -4-00 Pz (z) — Puv (z ~ w’ (2.6.8) — co что идентично предыдущему результату (2.6.3).
Случайные переменные 39 Б. Независимые случайные переменные Если случайная переменная Z равна сумме двух независимых случайных переменных U и У, то функция pz(z) исключительно просто связана с плотностями распределения величин U и У. В случае независимых переменных U и V подынтегральное вы- ражение в формуле (2.6.8) распадается на множители: Pvv (z — w, оу) = Pu (z — ay) pv (ay), (2.6.9) что дает выражение -boo Pz(2) = 5 Pu(z — w)pv(w)dw. (2.6.10) — co Такой интеграл называется сверткой, он встречается настолько часто, что для него мы введем специальное обозначение. Запи- шем свертку (2.6.10) в виде Pz = Pu*Pv (2.6.11) Показать, что функция pz равна свертке функций ри и pv, можно также другим путем — с помощью характеристических функций. Ввиду краткости этого доказательства приведем его здесь. Характеристическая функция переменной Z по определе- нию равна ________ _______________ Mz (со) = exp (/coz) = exp [/со (и + и)]. (2.6.12) Но так как переменные U в V независимы, последнее среднее может быть представлено в виде произведения двух средних: Mz (со) = exp (/сои) exp (/соv) = Му (со) Mv (со). (2.6.13) Таким образом, характеристическая функция переменной Z равна произведению характеристических функций U и V, Чтобы найти pz(z), мы должны выполнить обратное преобразование Фурье функции Mz(co). Но результат обратного преобразования Фурье произведения двух функций равен свертке результатов их отдельных преобразований Фурье. Отсюда мы снова получаем знакомый результат, состоящий в том, что функция pz(z) равна свертке функций ри и pv> Это доказательство хорошо демонстри- рует те упрощения, которые нередко оказываются возможными, если рассматривать характеристические функции вместо плот- ностей распределения. В. Центральная предельная теорема Основной теоремой, представляющей особую важность для нас в последующих приложениях статистики, является центральная предельная теорема. Мы сначала сформулируем эту теорему
40 Глава 2 в нужном нам виде, затем укажем на совокупность достаточных условий, которые гарантируют ее применимость, и, наконец, при- ведем интуитивное и нестрогое ее «доказательство». Пусть U\, U2, ..., Un — независимые случайные переменные с произвольными распределениями (не обязательно одинако- выми), имеющие средние значения zz2, йп и дисперсии а~, а|, ..., а~. Кроме того, пусть Z — случайная переменная, которая определяется следующим образом: Z = —=) < L- (2.6.14) v i ~ 1 1 (заметим, что При любом п величина Z имеет нулевое среднее значение и единичное стандартное отклонение). Тогда при опре- деленных условиях, которые часто встречаются на практике и указываются ниже, при стремлении числа случайных перемен- ных п к бесконечности плотность распределения pz(z) стремится к гауссовской (нормальной) плотности: lim pz(z)=—^e-z2i2. (2.6.15) ri“>oo д/2 л Существует обширная литература по статистике, в которой рассматривается вопрос об условиях, требуемых для выполне- ния этой теоремы. Здесь мы ограничимся формулировкой сово- купности достаточных условий [2.6, с. 201] *). Именно: должны существовать два положительных числа р и такие, что а? > р > 0 ) ? при всех /. (2.6.16) £[1^ —^13]<<7 > Наконец, приведем краткое и нестрогое «доказательство» центральной предельной теоремы. Пусть М/(о)) — характеристи- ческая функция случайной переменной Щ— йс, будем считать, что такая характеристическая функция существует. Из соотно- шения (2.6.13) следует, что характеристическая функция пере- менной Z имеет вид п Mz((o) = TTM/f-7^-Y (2-6.17) *) Могут быть сформулированы менее строгие условия [2.1]. Если пере- менные Ui имеют одинаковые распределения, то достаточно, чтобы среднее и дисперсия этого распределения имели конечные значения. Если переменные имеют различные распределения, то достаточно, чтобы они имели конечные средине значения и конечный (2 4-6)-й абсолютный центральный момент при некотором 6 > 0, а также удовлетворяли так называемому условию Ляпу- нова.
Случайные переменные 41 Согласно первому из условий 42.6.16), все значения а, ограни- чены снизу. Отсюда при любом заданном ю всегда можно найти такое достаточно большое число п, что аргумент функции бу- дет очень малым. Второе из условий (2.6.16) является гарантией того, что при малых значениях аргументов функция МДса/V является выпуклой и параболической [ср. с формулой (2.4.20)]: (О2 (2.6.18) Таким образом, при достаточно большом п характеристическая функция переменной Z принимает вид п м2и~П(1 i = 1 (2.6.19) Допуская, что п неограниченно растет, получаем lim Mz(со) = lim (1 — -^-) =ехр(—-^-), (2.6.20) а преобразование Фурье этого результата приводит к выраже- нию 1 с ^*2 lim pz(z) = -T=exp| — — I. (2.6.21) n->oo V2tc I 2 J Следовательно, плотность распределения переменной Z асимпто- тически стремится к плотности гауссовского распределения. Здесь следует проявить осторожность. Поскольку pz (г) асимп- тотически стремится к плотности гауссовского распределения, последняя может быть, но может и не быть хорошим прибли- жением для pz(z) при конечных значениях и. Это зависит от того, как велико может быть п и как далеко от «хвостов» функ- ции pz(z) мы намерены работать. Сомнительной точности ре- зультаты могут быть получены, когда в приближении гауссов- ского распределения вычисляются вероятности исключительно больших и маловероятных отклонений от среднего значения пе- ременной Z. Тем не менее центральная предельная теорема ока- зывается необычайно ценной в случае задач, содержащих огром- ное число независимых вкладов. § 7. Гауссовские случайные переменные Во многих задачах физики и техники мы встречаемся со слу- чайными явлениями, представляющими собой результат боль- шого числа аддитивных и независимых случайных событий. По- этому в силу центральной предельной теоремы гауссовское рас-
42 Глава 2 пределение играет необычайно важную роль в статистическом анализе физических явлений. В данном параграфе мы отметим наиболее существенные свойства гауссовских случайных пере- менных. А. Определения Случайная переменная U называется гауссовской (или нор- мальной), если ее характеристическая функция имеет вид Му(со) = ехр[/сой — (2.7.1) Путем дифференцирования функции Му (со) можно показать, что и и о — действительно среднее значение и стандартное от- Рис. 2.8. Гауссовская (нормальная) плотность распределения. клонение. случайной переменной U. И вообще можно найти п-й центральный момент: _______ ( 1 • 3 • 5 ... • (п — 1) ст" при четном и, (и-й)" = 1 п (27.2) v 7 (0 при нечетном и. Обратное преобразование Фурье функции Му (со) показывает, что плотность распределения переменной U имеет вид <27'3) График этой функции показан на рис. 2.8. Кроме того, говорят, что п случайных переменных t7j, • •• ...» Un являются совместно гауссовскими, если их совместная характеристическая функция имеет вид (ш) = ехр | /и'со —о/Ссо |, (2.7.4)
Случайные переменные 43 где (2.7.5) а С — ковариационная и X n-матрица с элементами a2ik в /-й строке и /г-м столбце, определяемыми в виде ? = Е [(«<-«/) (“ь -«*)]• (2.7.6) Соответствующая плотность распределе- ния /t-го порядка может быть представ- лена в виде Ру(-) = (2л)"/2 Id'/2 х Хехр {--(«-«/С-1 («-«)}, (2.7.7) ч 2 J где | С | и С"1 — детерминант и матрица, обратная матрице С, а и —матрица- столбец значений и. Наиболее важной для нашего даль- нейшего изложения является форма (2.7.7), когда мы имеем две совместно распределенные гауссовские случайные переменные U и У, каждая из которых имеет нулевое среднее значение и = = ог2, = ог2. В этом случае плотность рас- пределения (2.7.7) становится равной д Г и2 4- v2 — 2puv "I expL~ 2(1 p2)ff2 J Puv (“> у) =--о , г,---2 2mrVl — р2 (2.7.8) Рнс. 2.9. Контуры по- стоянной плотности рас- пределения в случае сов- местной гауссовской плотности с й = v = О, о2и = о2у = а2 н о) р = 0* б) 0 < р < 1; в) р « 1. где рД-^. (2.7.9) На рис. 2.9 показаны контуры постоян- ной плотности распределения и плоско- сти (и, v) для случаев р = 0? 0 < р < 1
44 Глава 2 и р = 1. При увеличении коэффициента корреляции в положи- тельном направлении плотность распределения переходит от кру- говой к эллиптической симметрии с главной осью вдоль прямой линии и = v. При отрицательных коэффициентах корреляции главная ось ориентирована вдоль прямой и = —v. Б, Особые свойства гауссовских случайных переменных Помимо того что гауссовские случайные переменные очень часто встречаются в практических задачах, они замечательны благо- даря многим особым свойствам, позволяющим исключительно легко оперировать с ними. Мы рассмотрим здесь эти свойства, сопровождая их в большинстве случаев доказательствами по крайней мере интуитивного характера. а. Две некоррелированные совместно гауссовские случай- ные переменные являются также и статистически независимыми. Как указывалось в § 4, п. Б, отсутствие корреляции далеко не всегда влечет за собой статистическую независимость. Но для совместно распределенных гауссовских случайных переменных указанные два свойства эквивалентны. Чтобы это продемонстри- ровать, положим коэффициент корреляции р в формуле (2.7.8) равным тождественно нулю; тогда совместная плотность распре- деления принимает вид f u24-v2 1 ехр 1---( ») =------2^------~ = = - ,-2_ ехр f-—Д—ехр (---------Д') = ри (и) pv (и). у/2па 2а2) л/2па 2а2) гихжук. Так как совместная плотность распределения распадается на произведение двух маргинальных плотностей распределения, пе- ременные U и V являются независимыми. б. Сумма двух статистически независимых совместно гауссов- ских случайных переменных сама является гауссовской случай- ной переменной. Предположим, что переменные U и V являются гауссовскими и независимыми с характеристическими функциями Му (со) = ехр Mv (со) = ехр Пусть Z — сумма переменных U и V. Тогда в силу соотношения (2.6.13) имеем Mz (со) = Му (со) Mv (со) = ехр [/со (й + й) — -у- (о^ + <4)]. ’. . ®2а2у _/СОЦ--------г . - “>2<4 /(0у---------—
Случайные переменные 45 Таким образом, величина Z является гауссовской случайной пе- ременной со средним значением u + v и дисперсией (Гу + Оу. в. Сумма двух зависимых коррелированных гауссовских слу- чайных переменных сама является гауссовской случайной пере- менной. Пусть U и V — гауссовские случайные переменные с коэффициентом корреляции р=И=0. Для простоты положим й = и = 0 и а2у = а2у = а2. Тогда Puv (u> v) = exp и2 4- v2 — 2puv 1 2 (1 — pa) ст2 . J 2ла2 V1 — p2 Пусть Z — сумма переменных U и V. По формуле (2.6.3) по- лучим 4-00 PzW = jj puv(z — v, v)dv = — co (z — u)2 -|- v2 — p2 (z — v) V ' _______2(l-p2)o2 2ла2 Vl — p2 Дополним далее до квадрата выражение в показателе экспо- ненты под знаком интеграла, что даст нам Pz(z) = _Г z2 еХР1 4(1+р)Р2 2ла2 V1 “ Р2 dv. Интеграл может быть преобразован к виду (2.7.10) V2nV2(l+p)a2 Таким образом, переменная Z является гауссовской случайной переменной с нулевым средним значением и дисперсией <у2=2(1 + р)<т2. (2.7.11) Если р —> 0, то ст^->2ст2, тогда как при р-> 1 мы имеем <т|->4<т2. г. Любая линейная комбинация совместно гауссовских слу- чайных переменных (зависимых или независимых) является гауссовской случайной переменной. Пусть переменная Z опреде- ляется выражением п Z=^JaiUi, где cii — известные постоянные, a Ui — совместно гауссовские переменные. Путем повторного применения результата (2.7.10) легко убедиться, что переменная Ui является гауссовской.
46 Глава 2 д.. Для совместно гауссовских случайных переменных [7Н U2, ..., Un совместные моменты порядков выше второго могут быть выражены через моменты первого и второго порядков. Мо- мент вида . и* может быть получен путем частного диф- ференцирования характеристической функции следующим обра- зом [формула (2.4.23)]: ---------- । ••• +k UlU2 * * * Un~ +k dii)Pdii)Q _ Так как единственными параметрами, входящими в характери- стическую функцию, являются средние значения и ковариации, момент (р + q + ... +&)-го порядка может быть выражен че- рез эти моменты первого и второго порядков. Продифференцировав характеристическую функцию соответ- ствующее число раз, можно доказать следующие основные свой- ства гауссовских случайных переменных с нулевым средним: ^1^2 • • • ^2й+1 = О, «1«2 • • • «2* = S (UjUmUiUp ... т, (2.7.12) р I ф р 8 где суммирование производится по всем возможным различным парным группировкам из 2k переменных. Можно показать, что существует (2k)l/2kk\ таких различных группировок. В наибо- лее важном случае k = 2 мы имеем ^1^2и3^4 = + U|U3tt2U4 + щи4и2иг. (2.7.13) Это соотношение называется теоремой о моментах для действи- тельных гауссовских случайных переменных. § 8. Комплексные случайные переменные В предыдущих параграфах речь шла о свойствах случайных пе- ременных, которые принимают действительные значения. При изучении же волн часто приходится рассматривать случайные переменные, которые принимают комплексные значения. По- этому будет полезным кратко изложить методы, которые исполь- зуются для описания комплексных случайных переменных. А. Общие сведения В основе определения любой случайной переменной лежат про- странство событий {Д} и множество соответствующих вероят- ностей Р(А). Если каждому событию А сопоставить некоторое
Случайные переменные 47 комплексное число и (Л), то множеством таких возможных комп- лексных чисел с соответствующими мерами вероятностей будет определяться комплексная случайная переменная U. Для математического описания статистических свойств слу- чайной переменной U удобнее всего пользоваться совместными статистическими свойствами действительной и мнимой частей. Так, если U = R + jl — комплексная случайная переменная, ко- торая может принимать конкретные комплексные значения и = г + /7, то для полного описания переменной U нужно ука- зать либо совместную функцию распределения переменных и / Лз(и)А/Ыг, /) A Prob{/?<r и 1^1} (2.8.1) или совместную плотность распределения переменных R и / д2 Ри (и) А рю (г, Z) = (г, /), (2.8.2) либо (в качестве альтернативного варианта) совместную ха- рактеристическую функцию переменных R и I Ми (шг, а/) Д Е [ехр [(/шгг + аЛ’)]]. (2.8.3) Если имеется п комплексных случайных переменных Ui, U2, ...» Uп, которые принимают конкретные значения Ui = = + u2 = r2 + ji2 и т. д., то совместная функция распре- деления может быть записана в виде Fu(u) A Prob {2?^ /?2<г2, ..., (2.8.4) где рассматриваемая вероятность есть совместная вероятность того, что все указанные события имеют место, а аргумент функ- ции Fv представляет собой матрицу-столбец с п комплексными элементами: (2.8.5) и„ __— Совместной функции распределения соответствует совме- стная плотность распределения 2п действительных переменных {Г1,г2, ..., Гн, /1,1*2, in} д2П Р-WA „........... fv(u). (2.8.6)
48 Глава 2 Наконец, это совместное распределение можно задать характе- ристической функцией Ми (о) А£ [ехр (/Wu)], (2.8.7) где ю_и и — матрицы-столбцы с 2п действительными элементами: (2.8.8) Б. Комплексные гауссовские случайные переменные Говорят, что п комплексных случайных переменных Ub U2, ... ..., Urt являются совместно гауссовскими, если их характеристи- ческая функция имеет вид Ми (®) = ехр|/7Ло — у ’ (2.8.9) где о)—по-прежнему одна из матриц (2.8.8), а й — матрица- столбец с 2п действительными элементами, которые являются средними значениями элементов и, С — ковариационная мат- рица 2пХ2и с действительными значениями элементов, опреде- ляемая как С = Е[(и-й)(и-й)*], (2.8.10) С помощью 2м-мерного преобразования Фурье функции Ми (со) находится соответствующая плотность распределения Pv = еХр {~ 2 ~ -)l -1 ’ (2'8,1 1} где |С| и С”1 — детерминант ковариационной (2п X 2п)-мат- рицы Си матрица, обратная ей. Для последующего изложения нам нужно определить спе- циальный класс комплексных гауссовских случайных функций. Но чтобы сделать это, мы должны сначала ввести некоторые новые обозначения. Пусть г \\ 1_—матрицы-столбцы из п эле- ментов, действительных и мнимых частей п комплексных’слу-
Случайные переменные 49 чайных переменных U*(k = 1, 2, ..., п). Тогда (2.8.12) Далее определим следующие ковариационные матрицы: С*"’А Е [(г - г) (г - r)f], С<“>А Е [(/ -7) (/ - 7/], ' Z ~ ~ (2.8,13) С™ А Е [(г - г) (I - £)*], С</г> Д Е [(£- Г) (г - г)*]. Назовем совокупность величин U*(&=1,2, п) совместно круговыми комплексными случайными переменными, если вы- полняются следующие специальные соотношения: 1) 2) (2.8.14) (2.8.15) Чтобы стало ясно происхождение термина «круговая», лучше всего, пожалуй, рассмотреть простой случай одной круговой комплексной гауссовской случайной переменной. Имеем r = r, i=i, С<"> = ст2, С^ = а2, (2.8.16) С*/г) = ст4стгр, С(г° = стгстгр, где ст; и ст2 — дисперсии действительной и мнимой частей пере- менной U, а р — коэффициент корреляции действительной и мни- мой частей. Наложение условий циркулярности (2.8.14) и (2.8.15) приводит к требованиям г = I = О, ст2 = ст| = ст2, (2.8.17) р = 0. Таким образом, ковариационная (2X2)-матрица С определяется выражением Г ст2 0 1 С=[о CT2j. (2.8.18)
50 Глава 2 и в случае гауссовского распределения плотность распределения U принимает вид 1 ( г2 _1_ ;21 (2А19> Контуры постоянной вероятности в плоскости (г, I) оказываются окружностями, а потому U и называется круговой комплекс- ной Гауссовской случайной переменной. Заметим, что действительная и мнимая части круговой комп- лексной гауссовской случайной функции не коррелированы и, следовательно, независимы. Если же Uj и U2— две такие со- вместные случайные переменные, то действительная часть вели- чины Ui может иметь любую степень корреляции с действитель- ной и мнимой частями переменной U2, если только в соответ- ствии с (2.8,15) выполняются условия Г\Г2 ^*2> Г 1^2 = 2* (2.8.20) Круговые комплексные гауссовские случайные переменные часто встречаются на практике. Важное свойство таких случай- ных переменных выражается теоремой о комплексных гауссов- ских моментах, которая может быть доказана на основании тео- ремы о действительных гауссовских моментах [формула (2.7.13)] и условий циркулярности (2.8.14) и (2.8.15). Пусть Ub U2, ... U2ft — совместные круговые комплексные гауссовские слу- чайные переменные с нулевым средним значением. Тогда < • • • u*A+i • • • U2A = S (2.8.21) где суммирование проводится по k\ возможным перестановкам {p,q, ..., г) индексов (1,2, ..., k). В простейшем случае, когда k = 2, имеем ______________________________ uju;u3u4=uju3u;u4 + uju4u;u3. (2.8.22) § 9. Суммы случайных фазоров Во многих областях физики, и в частности в оптике, приходится иметь дело с комплексными случайными переменными, представ- ляющими собой сумму многих малых «элементарных» комплекс- ных вкладов. В роли таких комплексных чисел часто выступают фазоры, характеризующие амплитуду и фазу возмущения моно- хроматической или квазимонохроматической волны. Комплекс- ное сложение многих малых независимых фазоров выполняется, например, при вычислении полной комплексной амплитуды волны, которая формируется при рассеянии на совокупности
Случайные переменные 51 малых независимых рассеивателей. Вообще говоря, такие комп- лексные суммы возникают, когда мы складываем некоторое число комплексных аналитических сигналов, которые определяются и детально обсуждаются в гл. 3, § 8. Здесь же мы рассмотрим свойства сумм комплексных случайных переменных, которые будем называть суммами случайных фазоров. А. Исходные предположения Рассмотрим сумму очень большого числа М комплексных фазо- ров; при этом пусть k-й фазор имеет случайную длину c^/V^ Мнимая часть Рис. 2.10. Сумма случайных фазоров. И случайную фазу q^. Результирующий фазор с длиной а и фа- зой 0 определяется следующим образом (рис. 2.10): a = ae/e = -7U£ (2.9.1) Для упрощения анализа мы сделаем ряд предположений от- носительно статистических свойств суммируемых элементарных фазоров, которые, как правило, выполняются в представляющих интерес практических задачах. 1. Амплитуда akf^/N и фаза qp* элементарного фазора с но- мером k статистически независимы друг от друга, а также от амплитуд и фаз всех других элементарных фазоров. 2. Случайные переменные а* при всех k имеют одинаковые распределения со средним значением а и вторым моментом а2. 3. Фазы qp* распределены однородно на интервале (—л, л). Из указанных предположений первое имеет наиболее важное значение, тогда как второе и третье могут быть смягчены при
52 Глава 2 некоторых изменениях в конечных результатах (см., например, работу [2.10] и приложение Б). Пусть действительная и мнимая части г и i результирующего фазора имеют вид г A Re (2.9.2) {ае‘6} = —!= У ak cos qp*, /А Im {ае16} = Sin<P*' Учитывая, что г и I представляют собой суммы многих незави- симых случайных вкладов, мы приходим к выводу, что в силу центральной предельной теоремы г и I будут приблизительно гауссовскими случайными переменными при больших значениях №). Чтобы определить детальный вид совместной плотности распределения для г и Z, мы должны сначала вычислить г, Z, or? и их коэффициент корреляции р. Б. Вычисление средних значений, дисперсий и коэффициента корреляции Средние значения действительной и мнимой частей г и I вы- числяются следующим образом: Г = -^=- У аА cos <рА = ~^=т У ak cos <pft = V Л? a cosip, Z = VF S aAs>n<PA = -^y ak sin<p* = VF a sin <p. V Jfe=l V k~\ Здесь мы воспользовались тем, что а* и <р* независимы и рас- пределены одинаково при всех k. Но, кроме того, согласно предположению 3, случайная переменная <р однородно распре- делена на интервале (—л, л), что приводит к равенству cos ср = sin ср = 0, а отсюда к равенству г = 7=0. (2.9.3) Таким образом, оказывается, что действительная и мнимая ча- сти имеют нулевые средние значения. 1) Отметим одну тонкость. Хотя очевидно, что маргинальные распределе- ния величин г и I асимптотически являются гауссовскими, нами не доказано, что эти две случайные переменные являются совместно гауссовскими. Такое доказательство приведено в приложении Б.
Случайные переменные 53 Чтобы вычислить дисперсии а2 и a2it достаточно найти вто- рые моменты г2 и I2 (так какг=/ = 0). Поскольку амплитуды и фазы независимы, напишем г2 = — Е Е C0S cos ЧРп- = l п = 1 /2= —Е Еа*а" Sin *<psin <р„. Jfe=lп~1 Кроме того, выполняется соотношение {О при k =И= п, — при k = n, вытекающее снова из однородного распределения фаз. Таким образом, мы имеем __ ? = Г2 = -у-Аа2. (2.9.4) Наконец, вычислим корреляцию между г и /: N N ~i = -ff- Е X а*а’»cos sin(Pn- Jfe = lП=1 Замечая, что cosqp sin qp = (1/2) sin 2<p, получаем ___________ 1 cosqpsinqp = 0 при k Ф n, cos qp^ sin qp« = { i - sin 2qp = О при k = n. Следовательно, действительная и мнимая части результирую- щего фазора являются некоррелированными. При этом нулевые средние значения, равенство дисперсий и отсутствие корреляции имеют место при любом конечном или бесконечном N. Чтобы подытожить наши результаты, покажем, что в пре- деле при очень больших N совместная плотность распределе- ния действительной и мнимой частей суммы случайных фазоров асимптотически (приЛ^->оо) принимает вид Рл/(г. 0 = -^2ехр{--^-}. (2.9.5) где 2 = ^1 2 • о (2.9.6)
54 Глава 2 Согласно терминологии, введенной в § 8, случайная пе- Рис. 2.11. Контуры постоян- ной плотности распределе- ния в плоскости (г, /). результат суммы, является круговой комплексной гауссовской перемен- ной. На рис. 2.11 показаны кон- туры постоянной плотности распре- деления этой величины в плоско- сти (г,/). В приложении Б читатель найдет, г что если вместо однородного распре- деления для фазы элементарного фа- зора выбрано другое распределение, то полученная совместная плотность распределения, вообще говоря, не бу- дет иметь нулевых средних значений, одинаковых дисперсий и нулевого ко- эффициента корреляции. Контуры же постоянной плотности распределения на комплексной плоскости будут эллипсами (см., например, за- дачу 2.10). В. Распределение длины и фазы результирующего фазора В предыдущем параграфе мы говорили о совместном распреде- лении действительной и мнимой частей суммы случайных фазо- ров. Но во многих приложениях больший интерес представляет распределение длины а и фазы 0 результирующего фазора: а = Vf2 + z*2 > 0 = arctgy. (2.9.7) Поскольку переход от прямоугольных к полярным координатам является однозначным отображением, чтобы найти совместное распределение величин а и 0, мы можем пользоваться мето- дами, изложенными в § 5, п. В. Обратные функции имеют вид г = a cos0, i = a sin 0, (2.9.8) а соответствующий якобиан таков; Ц/|| = да di да дг <эе di <39 cos0 — asin0 sin 0 acos0 (2.9.9)
Случайные переменные 55 Таким образом, мы имеем совместную плотность распределения Paq (а, 0) = pm (г = a cos 0, Z = asin0)a, (2.9.10) которая в силу формулы (2.9.5) переходит в “—2 ехр <—z-2-> при — л<0^л, а > 0, 2№ Ч 2a2J н (2.9.11) 0 в других случаях. Теперь могут быть найдены маргинальные плотности распре- делений длины и фазы. Интегрируя сначала по углу 0, полу- чаем a f а2 1 Л ^ехР)~'2^’J ПРИ а>°> 0 в других случаях. (2.9.12) Эта функция называется рэлеевской плотностью распределения, она показана на рис. 2.12. Соответствующие среднее значение РАе<а’ е) = +Я Рл(а) = 5 Рле(а> tydQ = —л Рис. 2.12. Рэлеевская плотность распределения. и дисперсия равны (2.9.13) Чтобы найти руем выражение плотность распределения фазы 0, проинтегри- (2.9,11) по а. Получим ре(0)= OQ 1 С а [ а2 ) , л 2л) 7еХР(-2агГа ПРИ — л<0<л, о 0 в других случаях.
56 Глава 2 Но этот интеграл точно равен интегралу от рэлеевской плот- ности распределения и поэтому должен быть равен единице. Отсюда мы заключаем, что фаза 0 суммы фазоров распределена на отрезке (—л, л) однородно, т. е. {-—г при —л <0< л, 2п (2.9.15) О в других случаях. Заметим, что совместная плотность распределения рд$(а, 0) может быть представлена в виде простого произведения марги- нальных плотностей распределения рд(а) и ре(0). Следова- тельно, Ди© являются независимыми случайными перемен- ными, как и действительная и мнимая части R и /, рассмотрен- ные в п. Б. Г. Постоянный фазор и сумма случайных фазоров Рассмотрим далее статистические свойства суммы, состоящей из известного постоянного фазора и суммы случайных фазоров. Рнс. 2.13. Сумма постоянного фазора и суммы случайных фазоров. Без потери общности можно принять, что известный фазор яв- ляется действительным и положительным и имеет длину s (это просто эквивалентно выбору начала отсчета фазы, которое со- ответствует фазе постоянного фазора). На рис. 2.13 изображена интересующая нас комплексная сумма. Действительную часть результирующего фазора легко пред- ставить в виде Г = s + -j=- £ aft cos <pft> (2.9.16) тогда как мнимая часть остается прежней: 1 Z = —7=" v?/ £ ak sin ф*. (2.9.17)
Случайные переменные 57 Таким образом, единственным следствием добавления известного фазора является изменение величины действительной части ре- зультирующего фазора. В пределе больших N совместное рас- пределение величин R и / остается приблизительно гауссовским, но изменяется среднее значение, т. е. Рл/(г> *)= 2^ехр{- (г —s)a + Z2 2а2 (2.9.18) Снова отметим, что часто интерес представляют в основном распределения длины а и фазы 0 результирующего фазора. Так как преобразование к полярным координатам совпадает с рас- смотренным выше, якобиан преобразования остается равным Л, и мы имеем Рле(«. 0) = а Г 2^еХР| (а cos 0 — s)2 4- (a sin О)2) ---------------------------} при а > 0, —л < 0 л, (2.9.19) О в других случаях. Чтобы найти маргинальную плотность распределения А, следует вычислить л л РА(а)= е(а, 0M0 = -^exp(--^t^) J expcos0) d0. —л —л Интеграл может быть представлен в виде 2л/о(а$/ст2), где /о — модифицированная функция Бесселя первого рода нулевого по- рядка. Таким образом, получим выражение {а / a2 + $2\r/as\ - м пр» “>«. (2.9.20) О в других случаях. Эта функция называется райсовской плотностью распределения. На рис. 2.14 представлены кривые зависимости величины стрл(а) от а/о при разных значениях параметра k = s/a. При увеличении модуля известного фазора плотность распределения изменяется по форме от рэлеевской плотности до рассматривае- мой в следующем пункте параграфа приблизительно гауссов- ской плотности со средним значением, равным S. В последующих главах нам понадобятся два момента рас- пределения, характеризуемого плотностью (2.9.20). Это — сред- нее значение а = \ -£ехр(—^A)/0(£)da (2.9.21) о
58 Глава 2 Рнс. 2.14. Плотность распределения амплитуды А суммы, состоящей из по- стоянного фазора (длиной $) н суммы случайных фазоров (дисперсия а2) [6]. Параметр k = s/a. и второй момент ^exp(-^±/l)/0(-£)da. (2.9.22) о Эти интегралы могут быть вычислены, и результат таков [2.6, § 4.8]: а=Vire-‘/<[(i +£)/.(£)+4'. (£)]• <2-9-23> . а2 = а2 [2k2]r (2.9.24) где /о и Л — модифицированные функции Басселя первого рода нулевого и первого порядков соответственно. Чтобы найти маргинальную плотность распределения р& (0) для фазы, следует вычислить OQ Ре(0)= J Рле(а. ОЖ О Это интегрирование является достаточно сложным, поэтому мы приведем здесь только окончательный результат [2.6, § 4.8]: / । & COS 0 Г k Sin 0 *1 /1 /п л Ре (0) = ----Ь ~Тг~ ехР-------— ф (k cos 0)’ (2.9.25) ЛТС 'у ^71 L J где ь Ф(Ь) = -^ e-^2dy, (2.9.26)
Случайные переменные 59 Рис. 2.15. Плотность распределения pQ (9) суммы постоянного фазора н слу- чайных фазоров [6]. Параметр k = s/a. График функции р©(0) при разных значениях k = s/o представ- лен на рис. 2.15. При k = 0 распределение однородно, а с уве- личением k кривая плотности распределения сужается, сходясь к 6-функции при 0 = 0, т. е. при значении фазы, равном фазе постоянного фазора. Д. Большой постоянный фазор и малая сумма случайных фазоров Если известный фазор по модулю значительно больше суммы случайных фазоров, то результаты, полученные в предыдущем пункте, весьма упрощаются. Здесь мы рассмотрим приближен- ную форму выражений для рл(а) н ре(0), когда s о или когда имеет место эквивалентное неравенство k 1. Один из подходов состоит в том, чтобы применить условие s о к вы- ражениям (2.9.20) и (2.9.25) и найти приближенные формы, учитывая математические упрощения. Однако мы здесь выбе^ рем более физический подход, который приводит к тому же са- мому результату, но более нагляден. Наше приближение основывается на том, что при s а мы имеем дело (рис. 2.16) с малым «облаком» распределения, центр которого совпадает с концом очень длинного известного фазора. В этом случае с очень большой вероятностью длина результирующей суммы случайных фазоров будет намного меньше длины известного фазора. Вследствие этого изменения длины а полного результирующего фазора определяются дей- ствительной частью суммы случайных фазоров, а изменения
60 Глава 2 фазы — ее мнимой частью, которая ортогональна известному фа- зору. Поскольку действительная часть суммы случайных фазо- ров является гауссовской функцией с нулевым средним значе- нием, мы имеем Р.4 (а) ~ ~7^ехр{~ (аГг~|> s»ff- (2.9.27) а ( 2а2 J Что касается фазы 0, то при s о ее флуктуации малы по сравнению с единицей и поэтому 0^tge~^-, (2.9.28) PQ(ty~spf(i = sQ), (2.9.29) или (2А30) В заключение отметим, что при s о как А, так и 0 яв- ляются приблизительно гауссовскими переменными. Для ампли- Рнс. 2.16. Постоянный фазор большой длины s и малое «шумовое облако». туды мы имеем среднее значение a = s и дисперсию o2a = o2t а для фазы 0 = 0 и <т| = l/k2 = a2/s2. Эти приближенные резуль- таты справедливы, если выполняется условие s > <т. Задачи 2.1. Покажите, что для любой случайной переменной U и2 = ст2 + (й)2. 2.2. Покажите, что для любых двух статистически независимых случайных переменных коэффициент корреляции равен нулю.
61 Случайные переменные 2.3. Даны случайные переменные U = cos 0, V = sin 0 с плотностью распределения ( при —£• < . pe(6)=s я 2 2 I 0 в других случаях. Покажите, что р = 0. 2.4. Докажите следующие свойства характеристических функ- ций: а) при нулевом аргументе всякая характеристическая функ- ция равна единице; б) характеристическая функция второго порядка МУ7 (ыу, шу) при ©у = 0 равна характеристической функции Му (со) одной случайной переменной U; в) для двух независимых случайных переменных U и V Муу ((Оу, (Оу) = Му ((Оу) Му ((Оу). 2.5. Покажите, что момент unvm, если он существует, может быть выражен через совместную характеристическую функ- цию Муу(®у, ©у) по формуле ____ 1 дп+т t)nVm = —Г—-------— Муу ((Оу, (Оу) I „ п. jn+m д&уд&у V/|Оу=Щу=0 2.6. Покажите: а) что сумма двух статистически независимых случайных переменных с пуассоновским распределением также описывается пуассоновским распределением; б) что если переменная подчиняется пуассоновскому рас- пределению, то К (К- 1) ... (tf-fc-j-I) = (К)к. 2.7. Выразите плотность распределения случайной переменной Z через известную плотность распределения ри(и), если: a) z = au + b\ {| и | при — 1 < 1, 1 в других случаях. 2.8. Пользуясь методом, примененным при выводе соотноше- ния (2.5.20), найдите совместную плотность распределения
62 Глава 2 pwz(w, г), если W=u2, Z = u + V и puv(u, v) = rect u-rect v, где rect x = 1 при |x|^ 1/2 и rectx = 0 в других случаях. 2.9. Имеются две независимые случайные переменные ©j и ©2 с идентичным распределением, плотность которого такова: {1 при — л < О С л, 2я О в других случаях а) Найдите плотность распределения случайной переменной z = ©1 + ©2. б) Покажите, что если Z — фазовый угол, который может быть измерен только с точностью до 2л, то независимо от результата «а» переменная Z однородно распределена в интервале (—л,л). 2.10. Имеется сумма случайных фазоров, о которой говорилось в § 9, п. А, с одним изменением, заключающимся в том, что фазы ср* однородно распределены в интервале (—л/2, л/2). Найдите следующие величины: г, z, <т2, <т2 и рг.. Нарисуйте примерные контуры постоянной плотности рас- пределения в комплексной плоскости. 2.11. Пусть случайные переменные и U2 являются совместно гауссовскими с нулевыми средними значениями, одинако- выми дисперсиями и коэффициентом корреляции р=А0. Рассмотрим случайные переменные Vi и V2, определяемые преобразованием поворота вокруг начала координат в пло- скости (hi,u2): [Vi I Г соэф sin ф I Г щ " v2 J I. — sin ф cos ф J L и2 J где ф — угол поворота. Покажите, что при ф = 45° вели- чины Vi и V2 являются независимыми случайными пере- менными. Каковы средние значения и дисперсии перемен- ных Vi и V2 в этом случае? 2.12. Имеются п независимых случайных переменных t7j, U2, ... ..., Un, каждая из которых подчиняется распределению Коши с плотностью ри (а) = - . "’['+(?)]
Случайные переменные 63 а) Покажите, что для такой плотности распределения на- рушается одно из условий (2.6.16) применимости централь- ной предельной теоремы. б) Покажите, что случайная переменная t = i подчиняется распределению Коши при всех и. 2.13. В некотором компьютере имеется генератор случайных чи- сел, который генерирует числа с одинаковыми относитель- ными частотами (или с постоянной плотностью распреде- ления) на интервале (0,1). Предположим, однако, что требуется моделировать испытания случайной переменной Z с плотностью распределения pz(z), которая не является постоянной. а) Покажите, что если значения, генерируемые компьюте- ром, представляются переменной и, для которой ( 1 при 0 < и 1, Ри(и) = 1 л v (0 в других случаях, то требуемую функцию pz(z) можно получить посредством монотонного преобразования z=g(u)t и что если и — = G(z) — функция, обратная функции g, то функция G должна быть выбрана так, чтобы выполнялось соотношение G(z)=±^pz (z) dz, где интеграл следует понимать как неопределенный. б) Покажите, что, для того чтобы генерировать случай- ную переменную с плотностью распределения ( е~г при 0^2 < оо, v (0 в других случаях, можно воспользоваться любым из следующих преобразо- ваний: Z = — In U, Z = — in (1 — u). ЛИТЕРАТУРА 2.1. Parzen Е. Modern probability theory and its applications. — N. Y.: John Wiley and Sons, 1960. 2.2. Feller W, An introduction to probability theory and its applications, Vol. 1. — N. Y.: John Wiley and Sons, 1957. [Имеется перевод; Феллер В,
64 Глава 2 Введение в теорию вероятностей н ее приложения. В 2-х томах. — М.: Мир, 1984.] 2.3. Papoulis A. Probability, random variables and stochastic processes. — N. Y.: McGraw-Hill Book Co., 1965. 2.4. Papoulis O. Systems and transforms with applications in optics. — N. Y.: McGraw-Hi!! Book Co., 1968. 2.5. Middleton D, An introduction to statistical communicatoin theory. — N. Y.: McGraw-Hill Book Co., 1960. [Имеется перевод: Миддлтон Д, Введение в статистическую теорию связи. — М.: Сов. Радио, 1961.] 2.6. Thomas /. В. Ап introduction to statistical communication theory.— N. Y.: John Wiley and Sons, 1969. 2.7. Davenport IF. B., Root V/. L. An introduction to theory of random signals and noise. — N. Y.: McGraw-Hill Book Co., 1958. [Имеется перевод: Да- венпорт В. B.t Рут В. Л. Введение в теорию случайных сигналов и шу- мов. — М.: ИЛ, I960.] 2.8. Beckmann Р. Probability in communicotion engineering. — N. Y.: Har- court, Brace and World Inc., 1967. 2.9. Bracewell R. The Fourier transform and its applications. — N. Y.: McGraw- Hill Book Co., 1965. 2.10. Beckmann P., Splzzichtno A. The scattering of electromagnetic waves from rough surfaces. — Oxford: Pergamon Press, 1963.
Глава 3 СЛУЧАЙНЫЕ ПРОЦЕССЫ Естественным обобщением понятия случайной переменной яв- ляется понятие случайного процесса, когда основными непред- сказуемыми, т. е. случайными, событиями являются не числа, а функции (обычно времени или пространственных переменных или и того и другого). Таким образом, теория случайных про- цессов имеет дело с математическим описанием функций, струк- тура которых не может быть заранее детально предсказана. Подобные функции играют чрезвычайно важную роль в оптике; например, амплитуда волны света, излучаемого любым реаль- ным источником, имеет свойства, которые изменяются со вре- менем в какой-то мере непредсказуемо. В данной главе мы из- ложим основные понятия теории таких случайных явлений, де- лая упор на функции времени. Обобщение на случай функций пространственных переменных не вызывает затруднений. § 1. Определение и описание случайного процесса В основе понятия случайного процесса тоже лежит представле- ние о случайном эксперименте с набором возможных событий {Д} и связанной с этим набором мерой вероятностей. Опреде- ляя случайную переменную, мы приписывали каждому элемен- тарному событию А действительное число и (А). Определяя же случайный процесс, мы каждому элементарному событию А при- писываем действительную функцию и(А; t) независимой пере- менной t. Семейство возможных выборочных функций и (A; t) вместе с соответствующей мерой их вероятностей и называется случайным процессом. Как правило, в обозначении случайного процесса [символ U(t)] и соответствующих выборочных функций u(t) зависи- мость случайного процесса от множества событий {Д} явно не указывается. Следует, однако, помнить, что процесс U(t)—это все множество возможных значений u(t) вместе с мерой их ве- роятностей.
66 Глава 3 Существует несколько различных путей математического описания случайного процесса. Наиболее общий из них — полное перечисление всех выборочных функций, образующих случай- ный процесс, с указанием их вероятностей. Мы продемонстри- руем такое полное описание на следующем примере. Пусть рас- сматриваемый эксперимент состоит из двух бросаний «честной» монеты, т. е. монеты, которая с одинаковой вероятностью выпа- дает и «решкой» и «орлом». «Элементарные события» множе- ства {Д} таковы: Ai = РР, Д2 = РО, Д3 = ОР и = ОО. Каж- дому элементарному событию припишем определенную выбороч- ную функцию следующим образом: «(Лр /) = ехр(/), и(А2, 0 = ехР(2/), и(Д3; 0 = ехр(3/), и(Д4; /) = ехр(40. (3.1.1) В каждом случае должна быть вычислена вероятность, связан- ная с соответствующим событием. Заметим, что если одну и ту же выборочную функцию порождают несколько разных событий, то должны быть раскрыты все возможные пути генерации каж- дой выборочной функции и вероятностью, связанной с этой вы- борочной функцией, становится вероятность того, что имеет место любое из этих событий. Таким образом, затратив много труда, мы перечислим все выборочные функции множества вместе с их вероятностями; это и будет полным описанием слу- чайного процесса. Такое полное описание далеко не всегда возможно и даже не всегда желательно. В большинстве практических приложений для вычисления величин, представляющих физический интерес, необходимо лишь частичное описание случайного процесса. Воз- можны различные виды частичного описания. В некоторых при- ложениях оказывается достаточно рассматривать параметр t как фиксированный и можно определить плотность распределения первого порядка случайной переменной которую мы обо- значим символом pu(u;t). Такое описание позволяет найти w, й2 и другие моменты величины U при любом значении t. Чаще же требуется плотность распределения второго по- рядка переменной U при значениях 6 и t2 параметра /< На рис. 3.1 представлен набор возможных функций и указаны два значения параметра /i и /2. Плотность распределения второго порядка — это совместная плотность распределения случайных переменных £7 (Л) и Вообще говоря, указанная плотность распределения зависит как от так и от t2 и поэтому обозна- чается символом pu(ui, где = u2 = u(t2). При
Случайные процессы 67 таком описании мы можем вычислять совместные моменты, на- пример: -1-00 щи2 = 55 uiu2Pu(ui> t2)du{du2. (3.1.2) — оо В некоторых случаях могут потребоваться плотности распре- деления даже более высокого порядка. Чтобы полностью опи- сать случайный процесс U(t), должна существовать возмож- ность определить плотность распределения А-го порядка Рис. 3.1. Ансамбль выборочных функций. Здесь t} и t->— значения параметра, для которых указана совместная плотность распределения и2; /2). Ри(и^ и2, uk; ti, t2, tk) при всех А. Такое описание экви- валентно полному описанию, рассмотренному выше, и его точно так же трудно провести. На практике в полном описании ни- когда не бывает необходимости. В заключение заметим, что случайный процесс есть матема- тическая модель, которая представляет ценность только до тех пор, пока точная выборочная функция u(t) не определена из эксперимента. До эксперимента случайный процесс характери- зует априорное состояние наших знаний. После того как функ- ция u(t) определена из эксперимента, остается только одна представляющая интерес выборочная функция, а именно та, ко- торая наблюдалась.
68 Глава 3 § 2. Стационарность и эргодичность Из бесконечного множества моделей случайных процессов, кото- рые могут быть построены в принципе, основное значение для физических приложений имеет лишь некоторое ограниченное число типов. В данном параграфе определяются и обсуждаются различные ограниченные классы таких моделей. Эту классифи- кацию ни в коей мере нельзя считать полной или исчерпываю- щей, она просто устанавливает определенные типы моделей, с которыми мы встретимся в дальнейшем. Случайный процесс называется строго (в узком смысле) ста- ционарным, если совместная плотность распределения й-го по- рядка pu(ui,U2, ..., uk;ti,t2, ..., tk) не зависит от выбора на- чала отсчета времени при всех k, Формулируя это определение математически, мы потребуем, чтобы выполнялось равенство р£/(«ь ..., uk; t2, ..tk) = = Ри^Цъ ^2» •••» 4 '» •••> T) (3.2.1) при всех k и всех T, Для таких процессов плотность распреде- ления первого порядка не зависит от времени и поэтому может быть обозначена символом ри(и), Аналогично плотность распре- деления второго порядка зависит только от разности времен т = t2 —1\ и может быть обозначена символом ри{и\, U2, т). Случайный процесс называется стационарным в широком смысле, если выполняются следующие условия: 1) Е[и(/)] не зависит от/; 2) Е [и (6) и (/2) ] зависит только отт = /2— Всякий строго стационарный процесс является также стационар- ным в широком смысле, однако стационарный в широком смысле процесс не обязательно является строго стационарным. Если разность [7(^2)—U(ti) строго стационарна при всех /2 и /1, то говорят, что U(t) имеет стационарные приращения1). Если Ф(0—строго стационарный случайный процесс, то новый случайный процесс t U(t) = U (tQ) + J Ф (Ю dl (t > /0) (3.2.2) t9 [который построен с использованием интегралов от выборочных функций процесса Ф(/)] не стационарен, но имеет стационар- *) Мы должны были бы различать здесь приращения строго стационар- ные н стационарные в широком смысле. Однако для простоты мы поста- раемся обходиться без излишних определений, имея в виду тот вид стацио- нарности, который действительно имеет место в каждом конкретном случае.
Случайные процессы 69 ные приращения. Такой случайный процесс играет важную роль в некоторых практических задачах. Так как полное описание случайного процесса редко оказы- вается необходимым и даже не всегда возможно, мы, как пра- вило, будем пользоваться для этого ограниченной совокупностью плотностей распределения (статистикой) конечного порядка, особенно первого и второго. В таких случаях необходимо только знать характер стационарности случайных процессов, описываемых статистикой конечного порядка (например, яв- ляются ли случайные процессы, описываемые статистикой вто- рого порядка, строго стационарными, стационарными в широком смысле или имеют стационарные приращения). В дальнейшем, называя случайный процесс просто стационарным без указания, к какому типу стационарности ои относится, мы будем под этим подразумевать, что используемая в наших вычислениях конк- ретная статистическая величина по предположению не зависит от выбора начала отсчета времени. В зависимости от того, ка- кие вычисления производятся, данный термин может относиться и к другим типам стационарности. В тех случаях, когда воз- можна путаница, мы будем точно оговаривать предполагаемый тип стационарности. Наиболее ограниченным классом случайных процессов и наи- более часто используемым на практике является класс эргоди- ческих случайных процессов. Здесь речь идет о соотношении между свойствами отдельной выборочной функции в процессе ее эволюции во времени и свойствами всего множества функций в один или несколько характерных моментов времени. Иначе говоря, мы рассматриваем вопрос о том, является ли каждая выборочная функция в некотором смысле типичной для всего ансамбля. Дадим более точное определение: случайный процесс назы- вается эргодическим, если всякая его выборочная функция (кроме, может быть, некоторого подмножества их, характери- зующегося нулевой вероятностью) принимает вдоль временной оси (т. е. «по горизонтали») значения с той же самой совме- стной относительной частотой, что и наблюдающиеся во всем множестве функций в любой произвольно выбранный момент или ряд моментов времени (т. е. «по вертикали»). Для того чтобы случайный процесс был эргодическим, он должен быть строго стационарным. Поясним это на примере случайного процесса, который является неэргодическим из-за своей нестационарности. Выборочные функции такого процесса показаны на рис. 3.2. Предположим, что все выборочные функ- ции имеют одинаковое распределение относительных частот на временной оси. Тогда очевидно, что относительные частоты, на-
70 Глава 3 блюдаемые «поперек» процесса в моменты времени ti и 6, не будут одинаковы, поскольку флуктуации всех выборочных функ- ции в момент времени t2 больше, чем в момент Таким обра- зом, не существует единого распределения относительных частот в направлении поперек процесса. Следовательно, относи- тельные частоты, наблюдаемые в поперечном и продольном про- цессу направлении, не могут быть одинаковы во все моменты времени. Следовательно, такой процесс не является эргодиче- ским. Хотя эргодический процесс должен быть строго стационар- ным, не все строго стационарные процессы являются обяза- тельно эргодическими. Мы продемонстрируем это на конкретном примере. Пусть U(t)—случайный процесс вида U (0 = A cos (®/ + Ф), (3.2.3)
Случайные процессы 71 где о) — известная постоянная, а Л и Ф — независимые случай- ные переменные с плотностями распределения рл(а) = уб(а-1)+4б(а-2), рф (<р) = 1 2 л О при — л < л, в других случаях. (3.2.4) В силу однородности распределения переменной Ф на интервале (—л, л), этот случайный процесс является строго стационарным. Но, как показано на рис. 3.3, от- дельная выборочная функция не типична для всего процесса. А именно, существуют два клас- са выборочных функций, один класс имеет амплитуду, равную 1, а другой — амплитуду, равную 2. Каждый класс встречается с вероятностью 1/2. Ясно, что от- носительные частоты, наблюдае- мые «вдоль» выборочной функ- ции с амплитудой 1, отличаются от относительных частот функций с амплитудой 2. Таким образом, не для всех выборочных функций относительные частоты в направ- лении оси времени совпадают с наблюдаемыми в направлении, Рис. 3.3. Пример стационарного, но неэргоднческого процесса. поперечном процессу. Если случайный процесс эрго- дический, то среднее любой ве- личины, вычисленное «вдоль» выборочной функции (т. е. среднее по времени), должно рав- няться среднему той же величины, вычисленному по всему ан- самблю выборочных функций (т. е. среднему по ансамблю). Следовательно, если g(u)—величина, подлежащая усреднению, среднее по времени <g)= lim 4- Г“>оо 2 Г/2 -Т/2 (3.2.5) должно равняться среднему по ансамблю g = 5 g (и) Ри (и) du. — оо (3.2.6)
72 Глава 3 Для эргодического случайного процесса средние по времени и по ансамблю равны и взаимозаменяемы. Остается нерешенным важный вопрос. Каков критерий того, что некоторый модельный случайный процесс, который, как мы считаем, точно представляет исследуемое случайное явление, об- ладает свойством эргодичности? Чтобы установить эргодичность, нужно рассмотреть полный ансамбль выборочных функций. Этот Рнс. 3.4. Иерархия классов случайных процессов. ансамбль может быть назван эргодическим при выполнении сле- дующих условий [2.5]: а) ансамбль строго стационарен; б) ансамбль не содержит строго стационарных подансамб- лей, вероятность которых отлична от нуля и единицы. Заметим, что некоторые случайные явления для правильного моделирования требуют использования неэргодического ан- самбля. Иерархия типов случайных процессов наглядно представлена на рис. 3.4, где показан переход от широкой совокупности всех случайных процессов к весьма узкому классу эргодических про- цессов. Кругами внутри больших кругов изображены подмноже- ства более широких множеств.
Случайные процессы 73 § 3. Спектральный анализ случайных процессов Пусть u(t) — известная функция времени. Можно выделить два различных класса функций времени. Если функция u(t) обла- дает свойством + оо J | и (0 \dt < со, (3.3.1) то мы говорим, что функция «(/) допускает преобразование Фурье. Если же функция u(t) не обладает свойством (3.3.1), но удовлетворяет условию Т/2 lim 4г °2(0 < 00 > Т-*,О° -Т/2 (3.2.2) то мы говорим, что функция u(t) имеет конечную среднюю мощность. В обоих рассмотренных случаях важно суметь прак- тически определить частотное распределение энергии [если выполняется условие (3.3.1)] или средней мощности [если выпол- няется условие (3.3.2)]. Иначе говоря, нужно найти спектраль- ную плотность энергии (спектр энергии) и спектральную плот- ность мощности (спектр мощности) функции и (О1). Аналогичным образом, если U(t) — случайный процесс с вы- борочными функциями, удовлетворяющими условию (3.3.1) или (3.3.2), важно суметь охарактеризовать частотное распределе- ние энергии или средней мощности не только для одной выбо- рочной функции, но и для всего случайного процесса. Так как конкретный вид выборочной функции, которая реализуется в эксперименте, заранее неизвестен, логично говорить об ожидае- мом частотном распределении энергии и средней мощности. Эти ожидаемые, или средние, распределения характеризуются соот- ветственно спектральной плотностью энергии и спектральной плотностью мощности случайного процесса U(t). Различие ме- жду спектральными плотностями известных функций и случай- ных процессов очень важно, оно будет детально рассмотрено далее в следующем пункте. А. Спектральные плотности известных функций Если u(t) — функция, допускающая преобразование Фурье, то величина <M(v)=$ u(t)el2nvtdt (3.3.3) 9 Термины «энергия» н «мощность» имеют здесь условный характер, поскольку конкретная размерность функции u(t) произвольна. — Прим, перев.
74 Глава 3 всегда существует. Далее, по теореме Парсеваля [2.6, с. 380] площадь кривой | 9Z (v) |2 равна полной энергии, содержащейся в u(t)y т. е. 4-00 4-00 j u2(t)dt = J |«(v)|2dv. (3.3.4) — оо —оо Таким образом, величина ^(V) = |^(V)|2 (3.3.5) имеет размерность энергии на единицу частоты, и мы назовем ее спектральной плотностью энергии функции u(t). Предположим теперь, что функция u(t) не допускает преоб- разования Фурье, но имеет конечную среднюю мощность. Тогда, вообще говоря, интеграл (3.3.3) не существует. Однако обре- занная функция Ыг(/) = |ы^ при — (3.3.6) ( 0 в других случаях допускает преобразование Фурье, результат которого мы обозна- чим через «T(v). Величина | (v) |2 характеризует частное рас- пределение энергии для обрезанной функции Ur(t). Следова- тельно, нормированный спектр энергии имеет размерность мощности на единицу частоты, и мы логи- чески приходим к определению спектральной плотности мощ- ности функции u(t) Т-+ОО 1 Такое определение оказывается адекватным для ряда функ- ций. Например, читатель может показать с помощью описанного предельного перехода, что функция u(t) = 1 (при всех /) имеет спектральную плотность мощности S?(v) = ft(v). Таким образом, строго говоря, указанный предел в данном слу- чае не существует, он существует в смысле б-функции. К сожалению, для многих функций этот предел не существует даже в смысле 6-функций. Точнее, в этом случае с возрастанием Т до бесконечности величина 9 т(v) очень сильно флуктуирует
Случайные процессы 75 при любом значении г. Так часто обстоит дело, если u(t) — вы- борочная функция стационарного случайного процесса. Заметим, что представленные выше определения величин <S (v) и ^(v) относятся лишь к отдельной функции и(0, а слу- чайный процесс содержит целый ансамбль различных функций. Ясно, что для случайного процесса определение спектральной плотности мощности должно быть другим. Б. Спектральная плотность случайного процесса Существует простая и логически обоснованная модификация определений спектральных плотностей энергии и мощности, ко- торая оказывается вполне удовлетворительной на практике. По- скольку мы желаем найти спектральное распределение, которое характеризовало бы полный случайный процесс, логичным бу- дет определить такие величины в виде средних по полному слу- чайному процессу. Поэтому мы определим спектральные плот- ности энергии и мощности следующим образом: (3.3.7а) (3.3.76) большинстве Последний предел действительно существует в представляющих интерес случаев. Некоторые основные свойства спектральных плотностей пря- мо следуют из определений (3.3.7): 1) 6?y(v)^0, 0; спектральные плотности энергии и мощности неотрицательны (и действительны); 2) —v) = ^y(v), —v) = ^c(v); спектральные плот- ности энергии и мощности являются четными функциями аргу- мента v при условии, что {7(0 —случайный процесс с действи- тельными выборочными функциями; Ц-со Ц-оо 3) &u(y)dv = u2(t)dt, —оо й2 для стационарного процесса U (/), (и2 (0) Для нестационарного процесса U (t). Свойство 1 следует непосредственно из того, что положительны выражения (3.3.7). Свойство 2 следует из эрмитовости опера- торов <U(v) и ?4г(¥)[т. е, равенств 11 (— v) = И* (v), iWr(— v) = = 11? (v)] при любых действительных значениях и (/). Свойство 3 для спектральной плотности энергии следует из теоремы Пар- $ S?y(v)dv = {
76 Глава 3 севаля после изменения порядка выполнения усреднения и инте- грирования. Свойство 3 для спектральной плотности мощности можно доказать, исходя из того, что 4-оо 4-оо (v) dv= \ lim J Т “>оо — оо — оо £[|<Wr(v)|2] , -------------UV где на последнем этапе была использована теорема Парсеваля. Продолжая, получаем Г 4-00 т/2 lim 4г Л и* (/) dt = lim 4" Efuj,(t)]dt = Т->оо 2 I J I Г->оо 2 J 1 J i-4-оо J -Т/2 __f и2 для стационарного процесса U (/), I (u2(t)) для нестационарного процесса U (/). Таким образом, основные свойства спектральных плотностей до- казаны. В. Спектральные плотности энергии и мощности для линейно отфильтрованных случайных процессов Пусть У(0 — случайный процесс, выборочные функции которого являются результатом прохождения всех выборочных функций случайного процесса U(t) через известный линейный фильтр1). Тогда У(0 называется линейно отфильтрованным случайным процессом. Для случайных процессов с выборочными функ- циями, допускающими преобразование Фурье, найдем соотноше- ние между спектральными плотностями энергии #V(v) на вы- ходе фильтра и ^u(v) на входе фильтра. Если выборочные функ- ции процесса U(t) не допускают преобразования Фурье, но имеют конечную среднюю мощность, то нужно найти соотноше- ние между спектральными плотностями мощности ^v(v) и ^y(v). Сначала рассмотрим волновые формы, допускащие преобра- зование Фурье. Предполагается, что линейный фильтр инвариан- тен во времени; в этом случае выходная выборочная функция выражается через соответствующую входную выборочную функ- цию u(t) формулой свертки 4-оо v(t)= J h(i-t)u®dt, . (3.3.8) J) О свойствах линейных фильтров см., например, [2.9, гл. 9].
Случайные процессы 77 где h(t)—известный отклик фильтра в момент времени t на единичный импульс, поступивший в момент времени t = О [т. е. h(t) — «импульсный отклик» фильтра]. В частотном пред- ставлении это соотношение соответствует простому умножению: F(v) = ^(v)«(v), (3.3.9) где V (v) и 11 (v) — фурье-образы функций v (t) и и (t), а Зв (v) — фурье-образ функции А (0 (называемый передаточной функцией). Применительно к <Fv(v) определение (3.3.7а) теперь принимает вид (v) = Е [ | Зв (v) U (у) |2] = | Зв (v) |2 «’у (v). (3.3.10) Итак, спектральное распределение энергии в случайном про- цессе на выходе фильтра получается путем простого умножения на величину |5£(v)|2- В случае процессов с конечной средней мощностью соотно- шение между спектральными плотностями &v(y) и SFy(v) выво- дится путем более тонких рассуждений. В этом случае фурье- образы y*(v) и 11 (у), вообще говоря, не существуют. Однако обрезанные волновые формы vT(t) и uT(t) имеют фурье-образы Fr(v) и И? (у). Кроме того, хотя и приближенно (из-за «конце- вых эффектов»), мы все же можем написать соотношение + оо ог(/)« J h(t-%)uT(l)dl, (3.3.11) — оо которое тем точнее, чем больше Г1)- В том же приближении в частотном представлении мы имеем соотношение rr(v)^^(v) <UT(v). Спектральная плотность мощности функции v(0 может быть теперь записана в виде Zv _ iim £liy>fl _ lim _ T->0 1 1 T->oo 1 или, что эквивалентно, ^(v) = |^(v)|2^(v). (3.3.12) 1) Приближенность возникает потому, что отклик фильтра на обрезанное возбуждение сам по себе не является, вообще говоря, обрезанным. С увели- чением Г, однако, роль этих концевых эффектов убывает до пренебрежимого уровня.
78 Глава 3 Таким образом, спектральная плотность мощности выходного случайного процесса равна просто произведению квадрата мо- дуля передаточной функции фильтра на спектральную плотность мощности входного случайного процесса. § 4. Автокорреляционные функции и теорема Винера — Хинчина В теории когерентности (гл. 5; очень важная роль отводится корреляционным функциям. Поэтому вначале рассмотрим здесь понятие автокорреляционной функции.' Если задана отдельная известная функция времени и(/), ко- торая может быть одной выборочной функцией случайного про- цесса, то временная автокорреляционная функция, отвечающая функции u(t), определяется следующим образом: Т/2 Ги(т)Д<«(Л-т)«(/)>= lim 4- Ь(Н-т)«(/)Л (3.4.1) Г-*°° -Т/2 Аналогично определяется статистическая автокорреляционная функция, которая, однако, характеризует весь случайный про- цесс U(t): Гу(/2, /1)А«(У“ (0= ы2«1Рц(«1> u2i t2, tl)duidu2 (3.4.2) — оо С физической точки зрения временная автокорреляционная функ- ция есть мера структурного подобия функций и (Г) и и(/ + т), усредненная по всем моментам времени, а статистическая авто- корреляционная функция — мера статистического подобия функ- ций u(/i) и и(/2), усредненная по ансамблю. Для случайного процесса, стационарного хотя бы в широ- ком смысле, Ги является функцией только разности времен т = t2 — h. Для более ограниченного же класса эргодических случайных процессов временные автокорреляционные функции всех выборочных функций равны друг другу, а также равны ста- тистической автокорреляционной функции. Поэтому для эрго- дических процессов Г (т) = Гу(т) (все выборочные функции). (3.4.3) Следовательно, для таких процессов не имеет смысла различать эти два типа автокорреляционных функций. Для процессов, стационарных хотя бы в широком смысле, из определения прямо следуют два важных свойства автокор-
Случайные процессы 79 реляционных функций: (3.4.4) 2) Г„(-т) = Г„(т). Третье свойство 3)|Г„(т)|<Гв(0) (3.4.5) может быть доказано на основании неравенства Шварца [см. рассуждения, приводящие к неравенству (2.4.16)]. Однако основное практическое значение автокорреляционных функций заключается в том, что существует весьма специальное соотношение, связывающее их со спектральной плотностью мощ- ности. В последующем изложении мы покажем, что для процес- сов, стационарных хотя бы в широком смысле, автокорреляцион- ная функция и спектральная плотность мощности являются фурье-образами друг друга: +» £a(v) = j Гу(т)е'2™</т, (3.4.6) Гу(т)= J ^(v)e-^ dv. — оо Данное положение называется теоремой Винера — Хинчина. Чтобы доказать ее, начнем с определения спектральной плот- ности мощности: ад=|1т (3.4.7) Т ->оо Так как «(/) — действительная функция, мы имеем “WJ.(v) = — <UT(— v): далее заметим, что *) + оо <jfr(v) = rect-|-u(£)exp(/2nv|)d£, (3.4.8) ^т(— v)= recty-u(ri)exp(—/2nvt])dT]. — оо Подставив (3.4.8) в (3.4.7), найдем £ [ I <v) I ] = ф j J rect -у rect у-Е [и (g) и (n)] X Xexp[/2nv(£ —T])]d£dn- 1) Функция reel х равна единице при |х| 1/2 н нулю в остальной об- ласти.
80 Глава 3 В этом среднем значении мы узнаем статистическую автокорре- ляционную функцию процесса U(/). Для большей общности мы допустим, чтобы величина зависела как от так и от г), отложив пока что наше предположение о стационарности. В результате получим 4" оо I =J rect _£ recf J. гу exp [/2л V (g — n)l dl dx\. — oo Теперь путем простой замены переменных £ на / + т и г] на t преобразуем интеграл к виду Е г I <ит (v) А 1 t + т t —-—---------- = — J J rect —— rect у Г(/ + т, /) ехр (/2 л vt) dt dr. — оо Спектральная плотность мощности (v) — предел этой вели- чины при Т->оо. Меняя порядок интегрирования по т и вычис- ления предела, а также замечая, что при любом фиксирован- ном т + оо lim ' ( rect —у т rect 4- Г (/ + т, /) dt = (Г (/ + т, t)), Т~*оо * 1 J 7 7 — оо получаем + оо ^(v)= J <Гу(/ + т, /)>e'2 * * * *™dr, (3.4.9) где угловыми скобками, как обычно, обозначено усреднение по времени. Выражение (3.4.9) показывает, что спектральная плотность мощности любого случайного процесса, стационарного и неста- ционарного, может быть найдена как фурье-образ усредненной (по определенному правилу) автокорреляционной функции. Если случайный процесс является стационарным хотя бы в широком смысле, то мы имеем Гу (/ + т, t) = Гу (т) и + оо ^y(v) = Гу (т) ехр (/2лvt) dt, (3.4.10) — ОО что и требовалось доказать. Если данный фурье-образ суще- ствует хотя бы в смысле 6-функций, то из основных свойств пре- образований Фурье следует обратное соотношение + оо Гу(т) = j (?y(v)exp(—/2nvt)dv. (3.4.11)
Случайные процессы 81 Важное значение автокорреляционных функций обусловлено двумя обстоятельствами. Во-первых (и это особенно существен- но в фурье-спектроскопии), автокорреляция сигнала часто мо- жет быть измерена непосредственно, что в конечном счете дает возможность экспериментально определять спектральную плот- ность сигнала. Чтобы найти частотный спектр мощности, в циф- ровой или аналоговой форме выполняют преобразование Фурье экспериментально измеренной автокорреляционной функции. Во-вторых, автокорреляци- онная функция часто позволя- ет аналитически вычислять спектральную плотность мощ- ности для модели случайного процесса, описываемой только статистически. Часто значи- тельно проще вычислить авто- корреляционную функцию по формуле (3.4.2), чем непосред- ственно вычислять спектраль- ную плотность мощности [фор- utt) Рис. 3.6. Автокорреляционная функция н соответствующая спек- тральная плотность мощности. Рис. 3.5. Выборочная функция случайного процесса. мула (3.3.7)]. Если же автокорреляционная функция найдена, то спектральную плотность мощности легко найти путем пре- образования Фурье. Для иллюстрации рассмотрим случайный процесс U(t) с ти- пичной выборочной функцией, показанной на рис. 3.5. Функция u(t) скачкообразно принимает значения +1 и — 1. Предполо- жим, что наша статистическая модель, подсказанная интуитив- ным пониманием физики явления, лежащего в основе рассмат- риваемого процесса, такова: число скачков и, происходящих в интервале времени |т|, подчиняется пуассоновскому распреде- лению Р(п-, |т|) = —(3.4.12) где k — параметр (скорость) процесса (среднее число скачков в 1с). Автокорреляционная функция ГсД/г, Л) определяется
82 Глава 3 выражением Гу (/?. 6) = W (4)и (6) = 1 • Prob {и (/J = и (/2)} — Но — 1 • Prob {и (/,) #= м(/2)}. (четное число скачков 1 Prob {«(/]) = и (/2)} = Prob < . . ? ' ’ (в интервале | т| ) ( нечетное число скачков Prob {и (/() =/= и (/2)} = Prob s . . ' ' и ' } (в интервале | т | Таким образом, ГОй./,)= X Е = т четное т нечетное = е-л|т| Г (~Ит|Г Zu m! m=0 Этот ряд равен просто а потому Га(/2, /1) = Га(т) = ехр(-2/г|т|). (3.4.13) Мы видим, что рассматриваемый процесс является стационар- ным в широком смысле, и путем преобразования Фурье функции Гу(т) находим спектральную плотность мощности: ^y(v) 1/k (3.4.14) '+(т)‘ Автокорреляционная функция и спектральная плотность мощ- ности показаны на рис. 3.6. Чтобы вычислить спектральную плотность мощности, исходя непосредственно из ее определения, потребовалось бы значительно больше труда и времени. Для использования нами в последующем удобно здесь опре- делить некоторые дополнительные величины, тесно связанные с автокорреляционной функцией. Во-первых, мы определим ав- токовариационную функцию: Сц (4, /,) А[«(/2) - й (/2)] [и (О - й (/,)]. (3.4.15) Таким образом, Си (t2, tt) = Г и (t2, Q - й (/2) й (О, (3.4.16) т. е. автоковариационная функция тесно связана с автокорреля- ционной функцией. Второй величиной, находящей частое применение, является структурная функция Du(t2, Л) случайного процесса U(t), опре-
Случайные процессы 83 деляемая следующим образом: Du (t2, 6) А [«(4)-«(А)]2- (3.4.17) Структурная функция и автокорреляционная функция связаны между собой соотношением Du(t2, 6) = ^iW+W0-2r£/(/2, ti). (3.4.18) Структурная функция имеет то преимущество, что она зависит только от задержки т =/2— Л даже для некоторых случайных процессов, не являющихся стационарными в широком смысле. Например, легко показать, что случайный процесс, являющийся нестационарным, но имеющий стационарные приращения, имеет структурную функцию, зависящую только от т. Конечно, функ- ция Du(t2,ti) зависит только от т и для более строгих типов стационарности. Если процесс U(t) стационарный в широком смысле, то 2)у(т) и Гу(т) связаны соотношением Л/(т) = 2Гу(0)-2Гу(т). (3.4.19) В дополнение заметим, что структурная функция £)у(т) может быть выражена через спектральную плотность мощности +» £)у(т) = 2 j ^y(v)[l — cos2nvt]dv. (3.4.20) — оо § 5. Взаимные корреляционные функции и взаимные спектральные плотности Естественным обобщением понятия автокорреляционной функ- ции является понятие взаимной корреляционной функции двух случайных процессов, определяемой следующим образом: rw(/2, /1)А£(«(/2)о(М]. (3.5.1) В дополнение к данному определению среднего по ансамблю мы можем определить взаимную корреляционную функцию, усред- ненную по времени: fw(T)A<u(/ + T)u(/)>. (3.5,2) Случайные процессы U(t) и У(/) называются совместно стационарными в широком смысле, если Гаи (6, Л) зависит только от разности времен т = tz — h; в этом случае ГщД/г» 6) = Гуу(т). (3.5.3)
84 Глава 3 Для таких процессов взаимная корреляционная функция обла- дает следующими свойствами: О (0) = 2) Гуу ( т) = Гуу(т), (3.5.4) 3) I Vuv (т)|<[Га(0)Г, (0)]1/2. Первые два свойства следуют непосредственно из определения. Доказательство третьего требует применения неравенства Шварца. С взаимными корреляционными функциями тесно связаны функции взаимной спектральной плотности, определяемые вы- ражениями , ХА !im е/ у у ( v) A 11ГП -, Г’*°° . . ! (3.5.5) /ХА Г Е I rT^CUT (V)] ^fyu (v) А 11 m —,-----— . Г“>ОО 1 Функция Vyy(v) и Vyyfv)можно рассматривать как меры ста- тистического подобия случайных процессов (J(t) и У(0 при каждом значении частоты v. Взаимная спектральная плотность — это, вообще говоря, комплексная функция. Дополнительно отме- тим, что она имеет следующие основные свойства: 1) е/уу (v) = е/у v (v) /для Любых ДвЙСТВИТвЛЬНЫХ \ ( случайных процессов ). (3.5.6) 2) оу ( v)= ^yy(v) ' U (/) и V (/) Путем таких же рассуждений, как и при выводе формулы (3.4.10), мы можем прийти к важному выводу о том, что для совместно стационарных в широком смысле случайных процес- сов U(t) и У(/) функции Vyy(v) и Гот (т) являются фурье-об- разами друг друга: + оо *t<w(v) = J Гуу(т)е^с?т, (3.5.7) Гуу(т)= J Vyv(v)<?-'2™ dv. — оо Кроме того, так же как в § 3, п. Г, мы можем выяснить дей- ствие линейной фильтрации на взаимную спектральную плот- ность. Предположим (рис. 3.7), что случайный процесс U(t), проходя через линейный, инвариантный во времени фильтр с передаточной функцией ^(v), создает случайный процесс
Случайные процессы 85 а также, что процесс V(/), проходя через линейный инвариант- ный во времени фильтр с другой передаточной функцией (у), создает случайный процесс Z(t). Путем прямого обобщения рас- суждений § 3, п. В, мы можем показать, что Krz(v) = ^I(v)^(v)lf£//(v). (3.5.8) Читателю может показаться непонятным, зачем нужны все функции, введенные в этом пункте параграфа. Дело в том, что взаимные корреляционные функции и вза- имные спектральные плотности играют крайне важную роль в теории оптической когерентности, поскольку они прямо связа- ны со способностью световых пучков обра- зовывать интерференционные полосы. Здесь Рнс. 3.7. Преобразо- вание взаимной спек- тральной плотности при линейной филь- трации. же нам достаточно показать, что эти поня- тия возникают совершенно естественным образом, когда мы рассматриваем случай- ный процесс Z(f), выборочные функции ко- торого z(t) представляют собой суммы вы- борочных функций u(t) и и(/) двух сов- местно стационарных в широком смысле случайных процессов U(t) и 7(0, т. е. z(t) = u(t) + v(t). Для такого процесса спектральная плотность мощности, как легко видеть, дается выражением .• Е l£T (v) SS.T (V)] yz(v)= lim — -----=------ = Г->оо -* = lim £[(^т(у) + Ут(у))«(у) + ^г(у))] (3 5 9) Т-ь.™ Перемножая суммы в аргументе оператора среднего значения Е и усредняя четыре полученных слагаемых по отдельности, по- лучаем (У) = (У) + (у) + (у) + (у). (3.5.10) Соответствующее выражение для автокорреляционной функции процесса Z(/) имеет вид (т) = Гу (т) + Гг (т) + (т) + Гу£/ (т). (3.5.11) Ясно, что автокорреляционная функция и спектральная плот- ность мощности процесса Z(f) зависят не только от соответ- ствующих характеристик процессов [7(f) и 7(f) по отдельности, но также и от статистического соотношения между этими про- цессами, характеризуемого взаимными корреляционными функ- циями и взаимными спектральными плотностями.
86 Глава 3 § 6. Гауссовский случайный процесс Как гауссовские случайные переменные представляют собой наиболее важный вид случайных переменных в физических при- ложениях, так и гауссовский случайный процесс играет необы- чайно важную роль. Причина та же: во многих физических явле- ниях суммируется большое число независимых аддитивных вкла- дов, что в силу центральной предельной теоремы приводит к гауссовскому распределению. Ниже мы кратко рассмотрим наи- более важные свойства гауссовского случайного процесса. А. Определение Случайный процесс U(/) называется гауссовским случайным процессом, если случайные переменные СЦЛ), (/(/г), ... ..., ... являются совместно гауссовскими случайными переменными для любого конечного множества моментов вре- мени. Следовательно, для п моментов времени /ь /2, ...» tn со- вместная плотность распределения имеет вид Ри = (2я)п/' j cyii2 ехР { - 7 (Ц - '(«-«)}. (3.6.1) где (3.6.2) а С — ковариационная матрица с элементом /-й строки и /-го столбца, определяемым выражением =Е [[" (М -“ СО] [«СО -й (Q ] ] (3-6-3) Плотности распределения (3.6.1) соответствует совместная характеристическая функция п совместно гауссовских случай- ных переменных Му (со) = ехр | tefu — у а/Ссо | , (3.6.4) где ш2 п
Случайные процессы 87 Б. Линейно отфильтрованные гауссовские случайные процессы Гауссовские случайные процессы обладают многими уникаль- ными свойствами, которые чрезвычайно упрощают работу сними. Вот одно такое свойство: линейно отфильтрованный гауссовский случайный процесс является также гауссовским случайным про- цессом. Строгое доказательство этого свойства выходит за рамки на- шей книги (см., например, работу [2.7]). Но мы приведем не- строгое доказательство, чтобы показать правдоподобность этого результата. Если У(/)— линейно отфильтрованный случайный процесс, то всякую выборочную функцию v(t) можно связать с некоторой входной выборочной функцией u(t) интегралом су- перпозиции + оо и(/) = J h(t, (3.6.5) — оо где Л(/, g)—отклик фильтра в момент времени t на единичный импульс, приложенный в момент времени g. Интеграл можно представить в виде предела суммы: V(O= lim £ h(t, Д£->0 oo где Ik — точка в k-м подынтервале шириной Ag. Распределение величины u(^k) по ансамблю входных выборочных функций яв- ляется, как мы предполагаем, гауссовским. Так как Л(/, g*)— просто известное действительное число, каждый член суммы в пределах ансамбля подчиняется гауссовскому распределению. Наконец, сумма любого числа гауссовских случайных перемен- ных, зависимых или независимых, сама по себе является гаус- совской случайной переменной. Следовательно, распределение первого порядка переменной и(/) является гауссовским. Таким образом, гауссовский случайный процесс обладает не- которым уникальным видом постоянства. Хотя после прохож- дения через линейный фильтр могут измениться параметры рас- пределения (средние значения, дисперсии, ковариации), гаус- совский характер случайного процесса сохраняется. В. Стационарность в широком смысле и строгая стационарность Последним необычным и важным свойством гауссовского про- цесса является следующее: гауссовский случайный процесс, ста- ционарный в широком смысле, является также и строго стацио- нарным. Доказательство этого свойства не составляет труда.
88 Глава 3 Действительно, плотность распределения n-го порядка (3.6.1) зависит только от средних значений и ковариаций п выбранных величин. Если случайный процесс U(t) стационарный в широ- ком смысле, то среднее значение не зависит от времени, а ко- вариации зависят только от разностей рассматриваемых момен- тов времени. Отсюда прямо следует, что /г-мерная функция плот- ности не зависит от начала отсчета времени при всех п и, стало быть, процесс U(t) является строго стационарным. Поэтому, когда мы имеем дело с гауссовским случайным процессом, обычно не указывают тип стационарности, которым обладает этот процесс, ибо два наиболее важных вида стационарности эквивалентны. Г. Моменты четвертого порядка В некоторых приложениях нужно знать момент 4-порядка вида u2(t)u2(t + т) для стационарного действительнозначного гауссов- ского случайного процесса с нулевым средним. Такой момент нужен, например, для вычисления автокорреляционной функции на выходе квадратичного устройства, для которого выходной v(t) и входной u(t) сигналы связаны соотношением v(/) = u2(/). (3.6.6) Этот момент может быть легко найден с помощью формулы (2.7.13), справедливой для действительнозначных гауссовских случайных переменных с нулевыми средними. На основании этой формулы мы найдем, что Гу (т) = v(/)vWt) = u2(t)u2 (/ + т) = Г2у (0) + 2Г2у (т). (3.6.7) Для момента более общего вида u(/I)u(/2)u(/3)u(/4) имеем u (/J и (/2) и (/3) и (/4) = Гу (/2, /J Гу (/4, /3) + + Гу(^з, 4)Гу(/4, 6) + Гу(/4, /аГу(/3, /2). (3.6.8) В оптических приложениях такие моменты часто вычисляют, но, как правило, для комплекснозначных случайных процессов. Соответствующие формулы несколько отличаются от приведен- ных, что мы продемонстрируем в § 9. § 7. Пуассоновский случайный процесс Во многих оптических задачах огромное значение имеет пуас- соновский случайный процесс. В данном параграфе мы остано- вимся на некоторых основных свойствах таких процессов, чтобы быть готовыми к обсуждению в последующем различных вопро- сов, связанных с регистрацией света.
Случайные процессы А. Определения 89 Рассмотрим случайный процесс U(t)c выборочными функциями u(t) в виде 6-функций Дирака (рис. 3.8, а). Такой процесс бу- дем называть пуассоновским импульсным процессом или, для Рис. 3.8. а — выборочная функция пуассоновского импульсного процесса; б — соответствующая скоростная функция. а краткости, просто пуассоновским процессом, если выполняются следующие два условия. 1. Вероятность /2) того, что К импульсов окажутся во временном интервале {Л < t /2}, дается выражением Р(К-, tu о (3.7.1) где Х(/)— так называемая скорость процесса [Х(0^ 0]- 2. Числа импульсов, приходящихся на любые два непе- рекрывающихся временных интервала, статистически неза- висимы. Примерная форма скорости Л(/), которая соответствует пред- ставленной выборочной функции, показана на рис. 3.8,6. На основании формулы (3.7.1) можно легко показать, что при за- данной функции ХЦ) среднее значение и второй момент числа импульсов (или «событий») во временном интервале (6 < t ^)
90 Глава 3 (3.7.2) даются выражениями ft ^ = ЛЙ-(Ю2 В дополнение укажем, что может быть доказана следующая тео- рема для моментов (см. задачу 2.6): К (К-1) ...(K-k+l) = (K)k. (3.7.3) Можно различать два важных случая. Во-первых, скоростная функция Х(/) может быть известной (детерминированной) функ- цией. Тогда все случайности, связанные с процессом U(t), обу- словлены преобразованием заданной функции Х(/) в выбороч- ную функцию «(/) пуассоновского процесса. Во-вторых, скоро- стная функция Л(/) сама может быть выборочной функцией некоторого случайного процесса Л(/). Такой процесс U(t) часто называют дважды стохастическим пуассоновским процессом. Случайный характер подобного процесса U(t) частично связан с преобразованием конкретной функции Л(/) в выборочную функ- цию u(t), а частично — со статистическими неопределенностями самой функции Л(/). Наконец, заметим, что в большинстве практических прило- жений теории случайный процесс U(t) состоит не из идеальных импульсов единичной площади, а из различных импульсов ко- нечной ширины. Таким образом, каждый импульс вида 8(t — tk) заменяется конечным импульсом й(/ — tk). В некоторых случаях импульсы могут иметь одинаковые форму и площадь. Такой процесс можно рассматривать как результат прохождения пуас- соновского импульсного процесса через линейный инвариантный во времени фильтр с импульсным откликом h(t), как это пока- зано на рис. 3.9, а. В то же время некоторые явления (например, выходные сиг- налы фотоумножителя) требуют моделирования процессом, ко- торый характеризуется случайным изменением формы и пло- щади от импульса к импульсу. Такой процесс может рассматри- ваться как результат прохождения пуассоновского импульсного процесса через случайно изменяющийся во времени линейный фильтр с импульсным откликом Л(/;т), который является вы- борочной функцией некоторого случайного процесса, как это показано на рис. 3.9,6. Оба пуассоновских процесса, описан- ных выше, называются линейно отфильтрованными пуассонов- скими процессами. Чтобы лучше понять, почему пуассоновский процесс имеет столь важное практическое значение, посвятим два следующих
Случайные процессы 91 «КО ад Инвариантный во времена фильтр а Изменяющийся во времени фильтр б U0(t) ЦК*) .А Жци, Рнс. 3.9. Линейно отфильтрованные пуассоновские процессы, а — ннварантный во времени фильтр; б — изменяющийся во времени фильтр. пункта обсуждению эквивалентных условий, которые приводят к пуассоновскому распределению. Б. Вывод пуассоновского распределения из фундаментальных гипотез К статистической модели, описанной в предыдущем пункте, можно прийти, исходя из ряда различных наборов гипотез [2.3, гл. 16]. Совокупность гипотез, рассматриваемая в этом пункте, является, пожалуй, наиболее фундаментальной и наиболее полно физи- чески осмысленной. Наш вывод будет небольшим обобщением вывода, изложенного в работе [2.7, § 7.2]. В этом и следующем пункте скоростная функция Х(0 предполагается известной. Слу- чай стохастической функции Х(0 отложен до п. Д. Начнем со следующих трех основных гипотез. 1. При достаточно малых А/ вероятность того, что одиноч- ный импульс окажется во временном интервале от t до t + А/, равна произведению А/ на действительную неотрицательную функцию Х(/).* Р(1; /, ^ + A0 = X(0At (3.7.4) 2. При достаточно малых М вероятность того, что в интер- вале А/ окажется более одного импульса, пренебрежимо мала (т. е. отсутствуют «многократные» события): Р (0; /, t + АО = 1 - А (/) А/. (3.7.5) 3. Числа импульсов в неперекрывающихся временных интер- валах статистически независимы.
92 Глава 3 Сделав эти предположения, мы можем поставить вопрос: какова вероятность Р(К; t, t 4- т 4- Ат) того, что К, импульсов окажутся во временном интервале от t до /4-т4-Ат? Если Ат мало, то можно лишь двумя способами получить К импульсов в интервале (/, 14- т 4- Ат). А именно, мы можем иметь либо К импульсов в интервале (t, t 4- т) и ни одного импульса в интер- вале (<4-т, f 4" т 4" А*)» либо К—1 импульсов в интервале и один импульс в интервале (^4~т, /4-т4-Ат). Учи- тывая все три указанные выше гипотезы, напишем Р(К; t, t + x + bx) = P(K; t, /4-т)[1-Х(^ + т)Ат]4- + Р(К- 1; t,/4-т)[Х(^4-т)Ат]. (3.7.6) Перегруппировав слагаемые и поделив на Ат, получим Р (К; f, f+ т + Дт)-Р (К; f, f+ т) Дт = Х(/4-т)[Р(А- 1; t, t + x)-P(K\ t, / 4“ т)]. Далее, полагая Ат—>-0, находим, что величина Р(К; t, 14- т) должна удовлетворять дифференциальному уравнению ^(KU.f-bT) =M/ + t)[P(k_i; + />/ + т)]. (3.7.7) Решая это линейное дифференциальное уравнение с граничным условием Р(0; t, t) = 1, приходим к единственному решению П'ч -.к msmJ t+x i, ггт;=-----------— exp|— J X (£) dl I, (3.7.8) I t ) которое совпадает с (3.7.1). В последующем, встречаясь с пуассоновскими процессами, мы будем принимать указанные три фундаментальные гипотезы, когда нам это покажется необходимым. В. Вывод пуассоновского распределения из распределения времен случайных событий Другая модель, которая приводит к пуассоновскому процессу того же типа, основывается на некоторых предположениях отно- сительно статистического распределения времен событий Предположим, что у нас имеется набор большого числа N «событий», которые мы «рассыпали» по бесконечному времен- ному интервалу. Можно построить случайный процесс, если ввести единичную импульсную функцию во временной «точке»
Случайные процессы 93 каждого события. Предположим, что N событий рассыпаны по временной оси в соответствии со следующими гипотезами: N моментов времени /*(& = !, 2, N), отвечающих событиям, во-первых, статистически независимы и, во-вторых, одинаково распределены с плотностью распределения p(tk). Опираясь на эти два предположения, мы легко найдем, что число К событий, приходящихся на любой подынтервал (/ь /2)» подчиняется биномиальному распределению: р ^2 Р ^1 > О = /(| (ДГ _ I Р (£) Предположим теперь, что У->оо и р(0->О, причем Np (/) = X (0 (3.7.9) остается фиксированным для каждого момента времени t. Ве- роятность попадания событий или импульсов в интервал (Л, /2) при любом фиксированном У имеет вид ' 1 2 KIN* -.N-K Полагая N очень большим, получаем N(N-l) ... (N-K+V) N* Таким образом Г 6 1К lim Р (К', tu /2) = L<l -v.—exp J - ( X (g) dg т. e. мы снова получим пуассоновское распределение. Кроме того, так как времена событий tk статистически независимы и существует неограниченный их источник (Af->oo), число собы- тий, попадающих в один интервал, не дает никакой информа- ции о числе событий, попадающих в другой, не перекрываю- щийся с ним интервал. Следовательно, числа событий в непе- рекрывающихся интервалах статистически независимы. Таким образом, мы пришли к одной и той же модели слу-
94 Глава 3 чайного процесса, исходя из двух разных наборов гипотез. В дальнейшем мы будем пользоваться тем набором гипотез, ко- торый будет лучше соответствовать нашим целям. Г. Спектральные плотности энергии и мощности пуассоновских процессов В этом пункте мы будем исследовать спектральную плотность энергии и спектральную плотность мощности пуассоновских им- пульсных процессов. Заметим, что, поскольку такие процессы представляются идеальными 6-функциями, а идеальная 6-функ- ция отвечает бесконечной энергии, интересе этом случае должна представлять только спектральная плотность мощности. Но, как мы увидим, спектральная плотность энергии является полезной величиной, если скоростная функция Х(0 допускает преобразо- вание Фурье, т. е. j \k(f)\dt < оо. Если же скоростная функ- ция не допускает преобразования Фурье, но имеет конечную Т/2 среднюю мощность, т. е. И k(t)\dt = оо, но Нт(1/Г) \ kI 2(t)dt< J Т->оо J —оо — T/2 < оо, то величиной, представляющей наибольший интерес, яв- ляется спектральная плотность мощности. Предположим снова, что K(t) — полностью детерминированная функция, а обобщения отложим до п. Д. Пусть Х(0—функция, допускающая преобразование Фурье. Выборочная функция соответствующего пуассоновского импульс- ного процесса может быть представлена в виде к «(О=£б(/-Ь). (3.7.10) Л-1 т. е. в виде функции £ + 1 случайных переменных, а именно t\, 1г, - 1к и К. Эта выборочная функция имеет фурье-образ к U (v) = ^Е ехр (/2л v^). (3.7.11) Спектральная плотность энергии для этой одной выборочной функции имеет вид к к I (v) I2 = Е Е ехр [/2л v (tk — ^)]. Л = 1 д=\ Таким образом, для спектральной плотности энергии случайного процесса U(t) получаем f К К ^(v) = £[|«(v)|2] = E{ Е Еехр[/2лу(/*-Ш- (3.7.12) к Л-1 <?-1 )
Случайные процессы 95 Теперь вычисление среднего по переменным 6, может быть выполнено в два этапа. Сначала мы выполним усреднение по временам tk, предполагая, что число К задано, а затем — по К- Эта процедура основана на свойстве р«1, t2, .... tK, = t2, .... tK\K)P(K). Таким образом, выражение (3.7.12) можно переписать в виде ( К. К. ") #ц(*) = £И Е Е ^|K{exp[/2Jiv(/ft-/,)]} Г (3.7.13) I q = l ) где символ Ек означает среднее по отношению к К, аЕцк — среднее по отношению к совокупности времен tk при задан- ном К. Вспомним, что времена tk являются одинаково распределен- ными, независимыми случайными переменными. Кроме того, в силу пропорциональности (3.7.9) между p(t) и X(t) мы должны иметь р(4) = — (3.7.14) K(t)dt где нормировка выбрана так, чтобы площадь функции была равна единице. Чтобы выполнить операцию усреднения, удобно рассмотреть два разных набора членов. Имеется К отдельных слагаемых, для которых k = q, и каждое такое слагаемое дает вклад, равный единице. Кроме того, имеется № — К слагаемых с k=£q. На основании формулы (3.7.14) и независимости вре- мен tk и tq находим Et । к {ехр [/2«v (tk — /,)]} = J X(tk)el2nvt4tk J K(tq)e-i2nvt<dtq — oa —oo ___ -f-oo 4"°° b(t)dt K(t)dt I g (v) I2 (v) (K)2 (K)2 (3.7.15) где X(v) — фурье-образ функции A(Z), a — спектральная плотность энергии для функции A(Z) и использовано выражение [формула (3.7.2)] 4-00 J A(Z)dZ = K? (3.7.16)
96 Глава 3 Выполняя окончательное усреднение по К, получаем (3.7.17) Но для величины К, подчиняющейся пуассоновскому распреде- лению, мы имеем № = (/02 + /С, а отсюда ^(v) = 7( + ^(v). (3,7.18) Таким образом, спектральная плотность энергии пуассоновского импульсного процесса состоит из постоянной К и спектральной плотности энергии скоростной функции. Заметим, что из-за на- личия постоянной К полная энергия, связанная с процессом [7(0, является бесконечной, даже если Х(0 имеет конечную энергию. Если скоростная функция не допускает преобразования Фурье, но имеет конечную среднюю мощность, то следует сделать не- которые изменения в предыдущих рассуждениях. Во-первых, мы обрежем случайный процесс U(t) так, чтобы он тождественно равнялся нулю вне интервала (—Г/2, Т/2). Тогда отдельная вы- борочная функция ur(t) может быть снова записана с исполь- зованием К + 1 случайных переменных: к uT(t)=£ (3.7.19) k=l и соответствующий фурье-образ дается выражением к Нт (v) == S ехр (/2nv^). Л-1 (3.7.20) Плотность распределения в моменты времени tk должна быть выбрана в виде T/2 ПРИ 2 < 2 Pt (^)=' (3.7.21) -T/2 0 в других случаях. Спектральную плотность мощности вычисляем, исходя из определения: = lim UT (v)|2] = T->OO 1 p К К -j = Jim т E I Z X exP (k ~ QI •
Случайные процессы 97 Среднее вычисляется так же, как и ранее. Обозначив среднее число событий в интервале Т через Кт, находим / х Г*г I #тI21 ^y(v) = lim |_— +----i-T • Ho К 1 r/2 lim -i= lim — \ (3.7.22) т-x» г-»» _ J/2 lim !JM-V)I2 = ffx(v), (3.7.23) T->oo 1 где <X> — усредненная по времени скорость процесса, a JFx(v) — спектральная плотность мощности скоростной функции Х(/). Та- ким образом, выражение ^(v) = W + ^(v) (3.7.24) определяет искомое соотношение между спектральными плотно- стями мощности процессов U(t) и k(t). На рис. 3.10 в нагляд- Рис. 3.10. Спектральная плотность мощности пуассоновского импульсного процесса. ной форме представлено соотношение между функциями JFu(v) и ^x(v). Заметим, что процесс U(t) отвечает бесконечной пол- ной средней мощности, даже если средняя мощность, отвечаю- щая процессу Л(0> конечна. Заметим также, что пределы, появ- ляющиеся в выражениях (3.7.22) и (3.7.23), предполагаются существующими, по крайней мере в смысле б-функций. Д. Дважды стохастические пуассоновские процессы Предположим, что X(Q—не известная функция, а отдельная вы- борочная функция случайного процесса А(^). Различные мо- менты случайного процесса вычисленные ранее, могут
98 Глава 3 теперь рассматриваться как условные моменты, обусловленные конкретной реализацией функции Л(0- Моменты такого дважды стохастического пуассоновского процесса можно вычислить про- сто путем усреднения предыдущих результатов по статистиче- скому распределению для случайного процесса Л(/)- Проиллюстрируем сказанное на некоторых простых приме- рах. Ранее было установлено [формула (3.7.2)], что для изве- стной функции Х(^) среднее число событий в интервале (G, 6) определяется выражением *2 ЕК]К(К)= J K(t)dt. t, Если X(Z) — выборочная функция стационарного случайного процесса Л(/), то мы должны дополнительно провести усредне- ние по Л,чтобы получить К= j М?) dt = Хт, (3.7.25) используя на последнем этапе стационарность процесса Л (0 и положив т = О —1\. Что касается второго момента числа К, то для заданной вы- борочной функции МО мы получим $2 £ 2 £д|к [К2] = J X (0 dt + J j X (g) X (n) dl it t\ (3.7.26) Вычисляя среднее по ансамблю, представляющему процесс Л(^), находим ^ = Хт+ j $ Гд (£ - т>) (3.7.27) где Гд — автокорреляционная функция процесса Л (0, который предполагается стационарным в широком смысле. Путем сообра- жений, аналогичных тем, которые привели к формуле (3.4.9), мы можем свести двойной интеграл к однократному: «2 Т $$ГЛ(&-П)ад = 2т$(1 -4)ГЛ(О^. (3.7.28) «I о Заметив, что Гл (£) = (Л)2 + Сд (£), где Сд (£) —автокорреляци- онная функция процесса Л (0, получим % Тё = к + (К)2 + 2т J (1 - |) Сл С) d$. (3.7.29) О
Случайные процессы 99 Эквивалентно этому дисперсия числа К определяется как 4 = К + 2т J (1 - |) Сд (?) d?, (3.7.30) о что превышает дисперсию <Тд — /<, связанную с пуассоновским импульсным процессом, скоростная функция Х(0 которого из- вестна. Высшие моменты определяются статистическими флук- туациями, связанными со случайным процессом Л(0- Дальней- шее обсуждение этого обстоятельства, так же как и более де- тальное вычисление мы отложим до гл. 9. Рассмотрим, наконец, модификации выражений (3.7.18) и (3.7.24) для спектральной плотности энергии и спектральной плотности мощности в случае, когда Л(0 — выборочная функ- ция случайного процесса. По определению спектральная плот- ность энергии и спектральная плотность мощности имеют вид ад=1йпЕ[|ад I2, г I (v) I2] (3.7.31) $и (*) = Пт Е ——, Т->оо * где (v) — функция (3.7.20). Вычисление средних значений, входящих сюда сумм способом, идентичным тому, который уже использовался в случае детерминированных скоростных функ- ций, приводит к выражениям ^y(v)= lim {Кт + £[|<tfr(v)I2]}, T->oo g„(v)= T ->oo v * J Наконец, принимая параметр T произвольно большим, полу- чаем __ ^M=5+^(v>, s'oM-i + s.uv), где Л [Л (/)]). Таким образом, мы видим, что в случае сто- хастической скоростной функции обе спектральные плотности содержат постоянное слагаемое и соответствующую спектраль- ную плотность стохастического скоростного процесса. Е. Линейно отфильтрованные пуассоновские процессы В заключение рассмотрим случай линейно отфильтрованного пуассоновского процесса и, в частности, спектральную плотность энергии илн мощности такого процесса. Сначала предположим,
100 Глава 3 что процесс состоит из импульсов одинаковой формы и площади, так что любая обрезанная выборочная функция имеет форму к «Г(0 = rect Y • X Л ('-**)• (3.7.33) k=l Как показано на рис. 3.9, а, такой процесс может рассматри- ваться как возникающий в результате прохождения пуассонов- ского импульсного процесса через линейный, инвариантный во времени фильтр. Если Ж (у) представляет собой передаточную функцию рассматриваемого фильтра, т. е. Н-ОО M(v) = J h^ei^dt, (3.7.34) — оо то формулы (3.3.10) и (3.3.12) позволяют нам представить спектральную плотность линейно отфильтрованного пуассонов- ского процесса в виде произведения величины l^(v)|2 на спек- тральную плотность исходного пуассоновского импульсного про- цесса. В результате имеем для спектральной плотности энергии и спектральной плотности мощности выражения % и (v) = К | Ж (v) |2 + | Ж (v) |2 (v), (3.7.35) (v) = Л | Ж (v) |2 + | Ж (v) |2 (v). (3.7.36) Если импульсы, составляющие процесс t7(/)r имеют случай- ные форму и площадь, то необходимо ввести некоторые измене- ния. Так, при вычислении спектральной плотности энергии бу- дем иметь к U(t)=Z h(t-, tk), (3.7.37) k=l к к l«(v)|2= Е Е ^(v; <?)exp[/2nv(k-Q], (3.7.38) *-l q-l где Ж(у, tk) — фурье-образ формы k-ro импульса: + оо ^(v;/A)= J h(t-, (3.7.39) — оо Среднее выражения (3.7.38) теперь следует вычислять по рас- пределению значений 6, 6, • • •, 1к, К и распределению вели- чины ^(v; fA). Снова рассмотрим отдельно слагаемых, для которых k = q, и К2 — К слагаемых, для которых k =#= q. Для первой части наш предыдущий вклад в энергетический спектр дол-
Случайные процессы 101 жен быть умножен на величину | Ж (v; /*)|2> которую мы предпо- лагаем одинаковой для всех tk и, следовательно, представимой в виде | Ж (у) |2. Для № — /С слагаемых с k У= q мы должны про- извести умножение на Ж(у\ tk)ffi*(y\ tq). Если различные импуль- сы статистически независимы, то этот множитель сводится к [Ж (v)]2. Таким образом, для спектральных плотностей энергии и мощности получаем (v) = КI + IW)]2 (v), (3.7.40) (v) = Л | Ж(^ + [адр(v). (3.7.41) Заметим, что при выводе последних результатов неявно предпо- лагалась независимость распределений величин Ж (v; tk) и Л (0. § 8. Случайные процессы на основе аналитических сигналов В физике и технике действительные сигналы часто представляют в виде комплексных величин. Комплексное представление выби- рается таким образом, чтобы действительная часть комплексной величины совпадала с представляемым ею действительнознач- ным сигналом. Тогда, если над комплексным сигналом выпол- няются только линейные операции, истинный сигнал на каждом этапе можно найти просто как действительную часть комплекс- ного сигнала. Преимущества комплексного представления сигнала перед действительнозначным связаны с одним фундаментальным свой- ством линейных инвариантных во времени систем: собственные функции таких систем являются комплексными экспоненциаль- ными функциями вида ехр(—/2nv0. Таким образом, если ли- нейную инвариантную во времени систему представить опера- тором S?{ }, то можно написать Z {ехр (— /2nv/)} = Ж (v) ехр (— /2nv0, где Ж (v) — передаточная функция системы, вычисленная при значении частоты v (доказательство этого см. в работе [2.9]). Процесс прохождения действительнозначного сигнала через такую систему описывается действием операторов на ком- плексные экспоненты с положительными и отрицательными час- тотами, что связано с громоздкими алгебраическими преобра- зованиями. Учитывая сказанное, вернемся к более детальному матема- тическому исследованию комплексного представления сигнала.
102 Глава 3 А. Представление монохроматического сигнала в комплексной форме Рассмотрим монохроматический (т. е. одночастотный) действи- тельнозначный сигнал u{r)(t) вида и{г) (/) = A cos (2jiv0^ — qp), (3.8.1) где A, vo и ф — постоянные амплитуда, частота и фаза. Комп- лексное представление этого сигнала таково: и (0 — А ехр {— / (2nv0^ — ф)}; (3.8.2) действительная часть этой функции равна истинному сигналу u^(t). Этому комплексному представлению отвечает фазорная амплитуда функции и(0, определяемая выражением АААехр(гф) (3.8.3) и характеризующая амплитуду и фазу монохроматического сиг- нала. Заметим, что мнимая часть указанного комплексного пред- ставления выбрана не произвольно, а в тесной связи с исход- ным действительнозначным сигналом. Какие же именно операции осуществляют переход к конкрет- ному комплексному представлению (3.8.2)? На этот вопрос легче всего ответить, перейдя к частотной области. Разложим наш действительнозначный сигнал на комплексные экспоненты: Д Обозначая оператор преобразования Фурье через }, заме- тим далее, что § (v + v0), gr {e-/2«vo/} = 6(v_ Vo). Поэтому фурье-спектр функции и(г)(0 имеет вид и (v) = у е~1Ч (v + v0) + -у е!ч>д (v — v0). Для комплексного же представления и(0 мы имеем & {и (0} = Ае^Ъ (v - v0). (3.8.4) Итак, соотношение между функциями и(г)(0 и и(0 состоит в следующем: при переходе от u^(t) к и(0 мы удваиваем ампли- туду компоненты с положительными частотами и полностью исключаем компоненту с отрицательными частотами. Такая опе- рация для монохроматического случая показана на рис. 3.11. Именно эта весьма специальная операция устанавливает опре- деленную связь между действительной и мнимой частями и(^),
Случайные процессы 103 Рис. 3.11. Спектры Фурье, а — монохроматический действительнозначный сиг нал; б — его комплексное представление. Б. Представление немонохроматического сигнала в виде комплексного сигнала Предположим, что задан комплексный немонохроматический сигнал u(r)(t) фурье-образом (v) и нужно представить сигнал в виде комплексного сигнала u(Q. Мы можем поступить точно так же, как и в монохроматическом случае, удвоив ком- поненты с положительными частотами и опустив компоненты с отрицательными частотами. Следовательно, приходим к опре- делению оо и (О А 2 $ и (v) dv. (3.8.5) о Функция и(0 называется аналитическим сигнальным представ- лением сигнала u(t). Относительно свойств аналитических сиг- налов см. работы [3.1, 3.2]. Прежде чем переходить к свойствам аналитического сигнала, следует разъяснить одну математическую тонкость. Эта тонкость касается того именно, что делается со спектром при v = 0 в процессе перехода от u(r)(t) к u(Q. Этот вопрос несуществен, если не содержит компонент типа 6-функции при v = 0, так как изменение спектра на конечную величину в отдельной точке не влияет на и(0- Если же u(r)(t) содержит компоненту типа 6-функции при v = 0, то мы будем считать, что эта компо^ нента остается без изменений. Эта договоренность позволяет нам записать операцию перехода от u(r)(t) ки(0 в частотном пред- ставлении следующим образом: где <W(v)->[l + sgn v]«(v), (3,8.6) sgn v A ' + 1 при 0 при — I при v > 0, V — 0, v < 0, (3.8.7)
104 Глава 3 Таким образом, + оо u(0= J [1+sgnv]«(v)e-/2^dv. (3.8.8) — сю Приведенное выше интегральное фурье-представление функ- ции и(0 позволяет нам выявить некоторые важные свойства аналитического сигнала. Обозначив оператор обратного преоб- разования Фурье через }, мы видим, что функцию и(0 можно представить в виде суммы двух членов: U (0 = (U (V)} + ЗГ-1 {sgn v<U (v)}. Первый член — это просто первоначальный сигнал По теореме о свертке второй член можно представить в виде ЗГ-1 {sgn v<U (v)} = ЗГ-1 {sgn v) * T~x {<U (v)}. Замечая, что 9 ’{sgnv} = — j/at (приложение А), находим u (0 = u<'> (t) + + { dl' (3,8,9) — СЮ —oo где символ j- указывает, что интеграл должен быть взят в смысле главного значения по Коши, т. е. +°° / г/— е 4-оо п с с m . Л J g— t — п 8_>()| J g — t J g — t —oo u— oo t+e J (3.8.10) Интегральное преобразование (3.8.10) называется преобразова- нием Гильберта функции u(r)(t) (подробнее о преобразованиях Гильберта см. в работе [2.9]). Исходя из выражений (3.8.8) и (3.8.9), можно теперь уста- новить следующие важные свойства аналитического сигнала: 1) «(r)(0ARe{u(0), (3.8.11) 4* оо 2) «">(0 A Im{u(0) = -T f , (3.8.12) 3) зг {№ (0} = - j Sgn V • ST {и^ (0} = = -/sgnv<W(v). (3.8.13) Итак, действительная часть аналитического сигнала, в самом деле, является действительнозначным сигналом, с которого мы начали. Мнимая же часть аналитического сигнала — это просто
Случайные процессы 105 преобразование Гильберта первоначального сигнала. Спектр мнимой части аналитического сигнала можно получить, умножив спектр действительной части на —/sgnv. Последнее свойство, представляемое формулой (3.8.13), до- пускает полезную интерпретацию. Мнимую часть аналитиче- Рнс. 3.12. Построение аналитического сигнала из действительнозначного сиг- нала. Рис. 3.13. Спектр мощности узкополосного сигнала. ского сигнала можно рассматривать как результат прохожде- ния действительной части через линейный, инвариантный во времени фильтр с передаточной функцией ^(v)= — /sgnv. (3.8.14) Назовем такой фильтр «гильбертовским» фильтром. Построение аналитического сигнала и(0 из действительного сигнала и(г)(0 можно изобразить графически так, как это показано на рис. 3.12. В. Комплексные огибающие или зависящие от времени фазоры Рассмотрим действительнозначный сигнал и(г)(0> который бу- дучи немонохроматическим, характеризуется все же «узкопо- лосным» спектром мощности. Если Av — номинальная ширина спектра в окрестности его центральной частоты vo (рис. 3.13), то данное требование выражается неравенством Av vo-
106 Глава 3 Такой сигнал может быть записан в форме и^ (/) = А (0 cos [2лvQt - ф (/)], (3.8.15) где A (t)— медленно меняющаяся огибающая, а ф(0— медленно меняющаяся фаза. В хорошем приближении удвоение положи- тельно-частотных компонент и отбрасывание отрицательно-ча- стотных компонент приводит к аналитическому сигналу только с одной экспоненциальной компонентой (3.8.15) и (/) = А (0 (3.8.16) По аналогии с монохроматическим случаем определим завися- щую от времени фазорную амплитуду, или комплексную оги- бающую, и(0 как А(0АД(/)^^. (3.8.17) Для любого (широкополосного и узкополосного) сигнала мы можем записать аналитическое сигнальное представление в виде и(/)-А(0е-/м’< (3.8.18) Если сигнал узкополосный, то комплексная огибающая А(/) из- меняется значительно медленнее комплексного множителя ехр(—/2nvoO и I А(0 | приблизительно совпадает с огибающей А(0 в формуле (3.8.15). Г. Аналитический сигнал как комплексный случайный процесс Если действительный сигнал u^(t) является выборочной функ- цией случайного процесса U(t), то аналитический сигнал можно рассматривать как выборочную функцию комплексного случай- ного процесса U(^). В данном пункте мы рассмотрим некото- рые основные свойства такого случайного процесса. Читателя может смутить то обстоятельство, что мы опреде- лили аналитический сигнал через фурье-образ действительно- значного сигнала, а для случайного процесса такой спектр не существует. Но мы можем определить аналитический сигнал иначе, а именно в виде и (0 А [б (0 - * «(г) (0. (3.8.19) в полном согласии с определением (3.8.8), но без введения фурье-образа. Тогда аналитический сигнал, представляющий выборочную функцию случайного процесса, будет действительно хорошо определенным. Для полного описания случайного процесса U(0 нужно за- дать совместное распределение для действительной и мнимой частей процесса для всех возможных наборов моментов вре-
Случайные процессы 107 мени. Однако задать распределение процесса U(0 даже в от- дельный момент времени, вообще говоря, затруднительно, так как совместное распределение действительной и мнимой частей должно отыскиваться на основе известного распределения толь- ко действительной части и соотношения, выражающего преоб- разование Гильберта: f <з-8-2°) -оо Такая задача может быть решена без большого труда только в случае гауссовского процесса, который рассматривается в сле- дующем параграфе. Но независимо от вида соответствующих плотностей распре- деления, как правило, представляют интерес автокорреляцион- ные функции и взаимные корреляционные функции действитель- ной и мнимой частей процесса U(^). Чтобы найти эти функции, прибегнем к интерпретации преобразования Гильберта как ли- нейной фильтрации, описываемой формулой (3.8.14). Пусть функция Гу’г)(т) представляет собой автокорреляционную функ- цию действительного процесса U(t), который предполагается стационарным хотя бы в широком смысле, но в остальном про- извольным. Соответствующая спектральная плотность мощности действительного процесса имеет вид + °о g^,r>(v)= J r(y-°(T)e/2ItvtdT- (3.8.21) — оо Спектральная плотность мощности мнимой части процесса представляется величиной На основании формул (3.3.12) и (3.8.14) находим ° (v) = | — / sgn V I2 $и' r) (v). Кроме того, если случайный процесс U^(t) имеет нулевое сред- нее (т. е. его спектральная плотность мощности не имеет ком- поненты типа 6-функции при v = 0), то можно написать | — / sgn VI2 = 1. Следовательно, ^•‘•>(v) = ^.o(v) и, таким образом, Г^‘»(т) = Г^г,(т). (3.8.22) (3.8.23) (3.8.24)
108 Глава 3 Что касается взаимных корреляционных функций Гц °(т) =а(г>(/ +т)и(°(0, _______________ (3.8.25) Гц ° (т) = ы(0 (/+ т) ы(г)(/) то мы воспользуемся формулами (3.5.8) и (3.8.14), считая, что один фильтр имеет единичную передаточную функцию, а дру- гой— передаточную функцию — ysgnv. В результате получим ^ °(v)A Зг{Г(^‘)(т)} = = !•(+/ sgn v) $и’r) (v) = / sgn v&ur> (v) (3.8.26) и аналогично ^•r>(v) = 3r{r[jr>(T)} = = (- / sgn v) • 1 • && °(v) = - / sgn v • 3#r) (v). (3.8.27) На основании этих результатов мы заключаем прежде всего, что Г((Уг>(т)=-Г(£°(т), (3.8.28) и, кроме того, в силу формулы (3.8.27) имеем । +Г г<г- г> Г(ц,г>(т) = ^ f (3.8.29) — сю Для удобства в последующих приложениях определим авто- корреляционную функцию комплексного случайного процесса Гц(<2, O = u(Ou’(O- (3.8.30) Если действительная и мнимая части процесса U(0 стацио- нарны хотя бы в широком смысле, то величина IY(t), опреде- ленная таким способом, обладает следующими основными свой- ствами: 1) Гу(0) = [ц<о(0]2+[«(г)(0]2> 2) Гц(—т) = Гц(т), (3.8.31) 3) |Гу(т)|<|Гу(0)|. Разложив аналитические сигналы на их действительные и мнимые части, можно легко показать, что величина (3.8.30) принимает вид ГУ (т) = [Г)?г) (т) + Г# °(т)] + / [Г£г) (т) - Г£ ° (т)]• (3.8,32)
Случайные процессы 109 На основании формул (3.8.24) и (3.8.28) непосредственно полу- чаем Гу (Т) = 2Г(у г> (т) + /2Г уг) (т). (3,8.33) Таким образом, действительная часть комплексной автокорре- ляционной функции просто равна удвоенному значению автокор- реляционной функции исходного действительного случайного процесса. Кроме того, учитывая выражение (3.8.29), мы видим, что мнимая часть величины IY(t) — это просто удвоенное пре- образование Гильберта автокорреляционной функции действи- тельного случайного процесса. Рассмотрим теперь фурье-образ функции Г^(т), который мы назовем спектральной плотностью мощности комплексного слу- чайного процесса U(^). Выполняя необходимые преобразования, получаем 9v (v) А ЗГ {Гу (т)} = 23г{Г(£ г) (т)} + 2/ЗГ И’г) (т)} = =2^'>M+2sgnvsi;-w={4»“7'’» (3.8,34) Таким образом, автокорреляционная функция (v) аналити- ческого сигнала имеет односторонний спектр Фурье и сама яв- ляется аналитическим сигналом. Наконец, рассмотрим взаимную корреляционную функцию двух совместно стационарных в широком смысле аналитических сигналов, определяемую как Гуу(т)Д£[и(/ + т)О)]. (3.8.35) Эта конкретная функция играет особо важную роль в теории частичной когерентности. Если ввести обозначения u(0 = «<r>(0 + /«<0 (0, v (0 = о(г) (0 + /ц(,) (0, то формула (3.8.35) дает расширенную форму Гуу (т): Гуу(т) = [г£Л(?) + Г(Д/*(т)] + / [Г^уг>(т) — Г(^(т)]. (3.8.36) Так же как в случае формулы (3.8.33), это выражение можно легко свести к более простому виду Гуу (т) = 2Гу’у> (т) + /2Гу’уг> (т). (3.8.37) Как и автокорреляционная функция, взаимная корреляционная функция двух аналитических сигналов имеет односторонний спектр Фурье и, стало быть, сама является аналитическим сиг- налом, как это можно продемонстрировать, пользуясь формулой (3.5.8).
по Глава 3 § 9. Комплексный гауссовский случайный процесс В наиболее общей формулировке комплексный случайный про- цесс U (/) называется комплексным гауссовским случайным про- цессом, если его действительная и мнимая части являются со- вместно гауссовскими процессами. Рассмотрим действительный гауссовский случайный процесс и соответствующий комп- лексный случайный процесс U(0> состоящий из аналитических сигнальных представлений действительных выборочных функ- ций Так как гауссовский характер распределения со- храняется при линейных преобразованиях вида (3.6.5), мнимая часть ц<б(/) гауссовской случайной функции определяе- мая формулой (3.8.20), тоже подчиняется гауссовскому рас- пределению. Таким образом, действительная и мнимая части процесса обе являются гауссовскими случайными процессами. Следовательно, аналитическое сигнальное представление гаус- совского случайного процесса является комплексным гауссовским процессом. Однако не всякий комплексный гауссовский случай- ный процесс имеет в качестве выборочных функций аналитиче- ские сигналы. В последующих главах нам иногда придется вычислять чет- вертые моменты и* (Л) и* (/2)п (^з) и (/4) комплексного гауссовского случайного процесса. Такие вычисления могут быть выполнены на основе теоремы о комплексных гауссовских моментах при условии, что u(6), и(/2), и(/3) и и(^) подчиняются круговому совместному гауссовскому распределению, т. е. при условиях 1) ^r4^) = ^W^) = 0, т = 1, 2, 3, 4, 2) m, n=l, 2, 3, 4, (3.9,1) 3) ^)(U^^(^)= rn, n= 1, 2, 3, 4. Случайный процесс, удовлетворяющий условиям (3.9.1), назы- вается круговым комплексным случайным процессом. Аналити- ческое сигнальное представление случайного процесса с нуле- вым средним действительно отвечает условиям циркулярности, как показывают формулы (3.8.24) и (3.8.28). При выполнении этих условий четвертый момент дается выражением E[u*(^)u*(Ou(Ou(^)] = = Гу (/з. 6) Гу (t4, о + Гу (/з, t2) Гу (t4, О. (3.9.2) В дальнейшем особый интерес будет представлять случай t3 — ti, ti = t2, в котором Е [| и (О |21 и (О |2] = Гу (tb tx) Гу (t2, t2) +1 Гу (t2, ix) I2, (3.9.3)
Случайные процессы 111 где мы использовали равенство и Г£7(^, /2У Напом- ним читателю еще раз, что эти выражения справедливы только для круговых комплексных гауссовских случайных процессов. § 10. Разложение Карунена — Лоэва В некоторых приложениях, встречающихся в последних главах, нам понадобится разложить выборочные функции u(t) комп- лексного случайного процесса U (t) по системе функций, ортогональных на интервале (—Г/2, Т/2). Ценность такого представления будет больше, если в пределах ансамбля коэф- фициенты разложения будут представлять собой некоррелиро- ванные случайные переменные. Попытаемся найти такое разло- жение. Пусть набор функций {фЦ/), фгЦ), .... фл(0, .} ортонор- мирован и полон на интервале (—Г/2, Г/2). Такая любая выбо- рочная функция u(Z) с достаточно хорошим поведением может быть разложена в ряд оо u(0 = Xb"<p«^’ (З.Ю.1) п=0 где Т/2 ? фт(0ч>;(0^ = {1 при п~,т' (з.ю.2) J 'Гт '/’t-л V/ (0 при п=£т а коэффициенты разложения brt определяются выражением Т/2 brt= J u(t)qn(t)dt, п=0, 1,2,.... (3.10.3) -Т/2 Спрашивается: можно ли для случайного процесса с заданной автокорреляционной функцией Гу (/2,^1) выбрать конкретный на- бор таких ортонормированных функций, что коэффициенты раз- ложения {Ьл} окажутся некоррелированными? Для простоты предположим, что случайный процесс U(£) имеет нулевое среднее значение для всех моментов времени, хотя в других отношениях он, может быть, нестационарен. Сред- нее значение каждого коэффициента разложения равно нулю, поскольку Т/2 £[&„]= $ £[и(0]Ф;(0^ = 0. (3.10.4) -Т/2
112 Глава 3 Таким образом, чтобы коэффициенты разложения были некор- релированы, потребуем выполнения условия E[bb’l = {nm ПРИ mZ.n' (3.10.5) L п mJ to при т #= п. Чтобы выполнялось это . условие отсутствия корреляции (3.10.5), должна быть выбрана должным образом ортонормиро- ванная совокупность функций {фт(0}. Для установления усло- вий, накладываемых на функции {фт(0}> подставим выраже- ние (3.10.3) непосредственно в (3.10.5), что даст нам Т/2 Т/2 £[ЬХ]= $ 5 Е(.ч/,).(У|С(ОМОЛД- -Т/2 -Т/2 Т/2 Г Т/2 = М J Г(/ (^2> (0^1 -Т/2 1--Г/2 «У*. (3.10.6) Предположим теперь, что набор функций {фт(0} выбран так, чтобы удовлетворялось интегральное уравнение Т/2 Гу (^2> О Фт (^1) dtx = %тФт (^)« (3.10.7) -Т/2 Тогда корреляция коэффициентов разложения будет иметь тре- буемый вид Г/2 ( 1 — Е[Ь Ь* 1= ( Xm<Pm(QC(Q^2 = ) А при т~^.П' (3.10.8) L п т\ т'гт\2}гп\2} 2 (Q ПрИ т ф V Требование, налагаемое на набор функций {фт(^)} инте- гральным уравнением (3.10.7), может быть сформулировано ма- тематически следующим образом: требуемый набор функций {фт(0} Должен быть совокупностью собственных функций ин- тегрального уравнения, имеющего в качестве ядра функцию Гу(/2, 6), а совокупность коэффициентов {Хш} должна быть со- ответствующим набором собственных значений. Выше в наших рассуждениях были опущены многие матема- тические тонкости. Порядок операции вычисления среднего зна- чения и операции интегрирования свободно менялся без про- верки выполнения требований к функциям, обеспечивающих до- пустимость этого. Нам здесь достаточно было просто установить, что автокорреляционная функция Гу(^2, 6) должна быть непре- рывной функцией своих аргументов. За более полными мате- матическими обоснованиями отсылаем читателя к работе [3.3].
Случайные процессы НЗ Задачи 3.1. Пусть случайный процесс U(t) задается функцией U (0 = A cos (2nvt — Ф), где v — известная постоянная, Ф — фаза, однородно распре- деленная на интервале (—л, л), и плотность распределения амплитуды А дается выражением Рд(а)=уб(а-1) + 4б(а-2), где Лиф статистически независимы. а) Вычислите величину <ы2(<)> для выборочной функции с амплитудой, равной 1, и выборочной функции с амплиту- дой, равной 2. _ б) Вычислите и2. в) Покажите, что где <u2>i и <и2>2 — результаты п. «а» для амплитуд, рав- ных 1 и 2. 3.2. Рассматривается случайный процесс U(t) = Д, где А — слу- чайная переменная, однородно распределенная на интервале (-1,1). а) Нарисуйте график некоторых выборочных функций этого процесса. б) Найдите временную автокорреляционную функцию про- цесса U(t). в) Найдите статистическую автокорреляционную функцию процесса U(t). г) Является ли процесс U(t) стационарным в широком смысле? Является ли он строго стационарным? д) Является ли процесс U(t) эргодическим случайным про- цессом? Поясните. 3.3. Эргодический случайный процесс с автокорреляционной функцией Гу(т) = (Л/о/2)6(т) поступает на вход линейного инвариантного во времени фильтра с импульсным откликом h(Q. Выходной сигнал V(0 умножается на запаздывающий вариант сигнала U(t), образуя новый случайный процесс Z(0, как это показано на рис. З.Зз. Покажите, что импульс- ный отклик фильтра может быть найден путем измерения зависимости <г(/)> от задержки А.
114 Глава 3 3.4. Рассмотрим случайный процесс Z (0 = U cos nt, где U — случайная переменная с плотностью распределения а) Какова плотность распределения случайной переменной Z(0)? б) Какова совместная плотность распределения переменных Z(0) и2(1)? в) Является ли заданный случайный процесс строго ста- ционарным, стационарным в широком смысле или эргодиче- ским? 3.5. Найдите статистическую автокорреляционную функцию слу- чайного процесса {7 (0 = cos (2jiv^ — OJ + а2 cos (2nv2t — Ф2), где Ль а2, vi, V2 — известные постоянные, а Ф1 и ф2— неза- висимые случайные переменные, однородно распределенные на отрезке (—л, л). Какова спектральная плотность мощ- ности процесса 3.6. Некоторый случайный процесс U(t) принимает равновероят- ные значения +1 или 0 в моменты времени, наступающие случайным образом. Вероятность того, что п изменений зна- чений происходит за время т, известна и равна ^ю-тйНттк-)" "=о. а.--- где и = ат — среднее число изменений. Найдите автокорре- ляционную функцию этого случайного процесса и нарисуйте ее примерный график. Указание: Ь‘=7^И<>. k «о
Случайные процессы 115 3.7. Случайный процесс U(t) состоит из прямоугольных импуль- сов вида p(t — tk) = rect((^—tk)/b)y возникающих co сред- ней скоростью й. Времена их возникновения случайны, число импульсов, приходящихся на интервал Г, подчиняется пуас- соновскому распределению со средним значением й7\ Этот случайный входной сигнал поступает на нелинейный прибор с характеристикой вход— выход вида {1 при и > О, О при и = 0. Найдите: а) величину z; б) функцию Гг(т). 3.8. Предполагая, что U(t)—процесс, стационарный в широком смысле со средним значением й и дисперсией о2, опреде- лите, какие из следующих функций могут быть структур- ными функциями процесса t7(Q: а) Оу(т) = 2о2[1 -е-аИ1]; б) Dy (т) = 2сг2 [1 — а | т | cos ат]; в) (т) = 2а2 [1 — sin ат]; г) О£/(т)=х2а2[1 — cos ат]; д) Dy (т) = 2а2 [ 1 — rect ат]. 3.9. Покажите, что преобразование Гильберта от преобразова- ния Гильберта функции u(t) равно —u(t) с точностью до произвольной аддитивной постоянной. 3.10. Теорема Парсеваля в обобщенной форме устанавливает, что для любых двух функций f(/) и g(T) с фурье-образами ^(v) и V (v) выполняется равенство J f(Og’(O^ = J ^(v)V* (v)dv. — оо —оо Покажите, что если и(^) и v(f) — аналитические сигналы, то -f-oo и (/) v (0 dt = 0. — оо 3.11. Приняв, что автокорреляционная функция аналитического сигнала u(t) равна Гу(т), покажите, что автокорреляцион- ная функция величины (d/dt)u(t) равна —(д2/дт2)Гу(т). Указание: используйте частотное представление. 3.12. Найдите аналитическое сигнальное представление для функции и (t) = rect t.
116 Глава 3 3.13. а) Покажите, что в случае аналитического сигнального представления действительного узкополосного случайного процесса автокорреляционная функция комплексного про- цесса U (0 (предполагающегося стационарным в широком смысле) может быть записана в виде г£/ W = g (т) е_/2Л¥оТ, где g(x)~ медленно по сравнению с комплексным множи- телем меняющаяся функция аргумента т. б) Покажите далее, что если процесс U(0 имеет спект- ральную плотность мощности, четную относительно цен- тральной частоты vo, то g(x) — действительная величина. 3.14. Пусть V(/)—линейно отфильтрованный комплексный слу- чайный процесс с выборочными функциями 4-00 v (/) = h (/ — т) и (т) dx, — оо где U(0—комплексный входной процесс, a h(f) — импульс- ный отклик инвариантного во времени линейного фильтра, а) Покажите, что для стационарного в широком смысле входного процесса Гу (х) = Н (х) * Га (х), где 4-00 Н(т)А J h(^ + T)h*(g)dt — оо б) Покажите, что среднеквадратичное значение |v|2 вы- ходного процесса дается выражением ___ +°° Ivl2= J Н (—т)Гу (т) dr. — оо 3.15. Найдите спектральную плотность мощности дважды стоха- стического импульсного процесса, скоростной процесс ко- торого имеет вид Л (0 = %0 [1 + cos (2лу0^ + Ф)], где Ф —случайная переменная, однородно распределен- ная на интервале (—л, л), а Хо и vo — постоянные.
Случайные процессы 117 ЛИТЕРАТУРА 3,1. Dugundji J. — IRE Trans. Info. Th., 1958. v. IR-4, p. 53. 3.2. Gabor D. — J. Inst. Electr. Eng. 1946. v. 93. Part III, p. 429. 3.3. Loeve M. Probability theory. — NJ: D. Van Nostrand, Princeton, 1955. [Имеется перевод: Лозе M. Теория вероятностей. — М.: ИЛ, 1962.] ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 3.1д . Frieden В. R. Probability, statistical optics and data testing: Problem solving approach. Springer Series in information sciences, Vol. 10. — Hei- delberg: Springer-Verlag, 1983.
Глава 4 НЕКОТОРЫЕ СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ПЕРВОГО ПОРЯДКА СВЕТОВЫХ ВОЛН Рассматривая вопрос о статистических характеристиках оптиче- ского излучения, можно говорить о характеристиках первого по- рядка (т. е. в отдельный момент времени), о характеристиках второго порядка (в два момента времени) и о характеристиках более высоких порядков (в три или большее число моментов времени). В данной главе мы сосредоточим внимание на ха- рактеристиках первого порядка. Начнем с нестатистического слу- чая— с распространения световых волн при различных ограни- чениях на ширину оптической полосы. Затем перейдем к распре- делению первого порядка амплитуды и интенсивности поляри- зованного, неполяризованного и частично поляризованного теп- лового излучения. В заключение остановимся на различных статистических моделях для лазерного излучения. Изложение в этой главе ведется полностью на языке клас- сической физики. Читателю, по-видимому, известно, что наряду с классической теорией флуктуаций существует строгая кванто- вомеханическая теория (см., например, [4.1]). Квантовомехани- ческая теория не излагается здесь отчасти потому, что это по- требовало бы от читателя знакомства с квантовой механикой, а отчасти потому, что классическая теория (вместе с полуклас- сической теорией регистрации света, излагаемой в гл. 9) оказы- вается вполне адекватной с практической точки зрения почти во всех случаях, представляющих интерес для разработчиков опти- ческих систем. В этой главе и даже во всей книге мы будем иметь дело со скалярной теорией световых волн. В рассматриваемых в ней ска- лярных величинах можно видеть отдельные компоненты поляри- зации электрического или магнитного поля, предполагая, что все такие компоненты могут рассматриваться независимо. В этом приближении пренебрегается связью между различными ком- понентами электрического и магнитного полей, которая опреде- ляется уравнениями Максвелла. Эксперименты, описываемые в работе [4.2], показывают, что скалярная теория приводит к точным результатам, если рассматриваются только средние или малые углы дифракции,
Некоторые статистические характеристики первого порядка § 1. Распространение световых волн Н9 Сначала рассмотрим нестатистический вопрос о распростране- нии световых волн как необходимую основу для излагаемого в последующих главах материала. Мы просто сделаем краткий обзор, дополненный сводкой основных результатов. Подробнее по данному вопросу см., например, [4.3, гл. 8; 4.4, гл. 3]. А. Монохроматический световой сигнал поля- моно- поля, связанной*с Пусть u(P,t)— скалярная амплитуда одной компоненты ризации электрического или магнитного хроматическим оптическим сигна- лом1). (В соответствии с подходом, принятым в скалярной теории, мы рас- сматриваем каждую компоненту неза- висимо.) Здесь Р — пространственные координаты (точки), а параметр t — момент времени. Аналитический сиг- нал, связанный с u(P, t), имеет вид u (Р, 0 = U (Р, v)exp(— /2jiv0, (4.1.1) где v — частота волны, a U(P,v) — ее фазорная амплитуда. Пусть эта волна падает слева на не- ограниченную поверхность (рис. 4.1). Мы хотим определить фазорную амплитуду поля в точке Ро справа от этой поверхности через характеристики поля на по- верхности S. Решение этой задачи может быть найдено в боль- шинстве учебников по оптике (см., например, [4.3, 4.4]). Пред- ставим здесь решение в форме, отвечающей так называемому принципу Гюйгенса — Френеля, согласно которому на нии г (см. рис. 4.1), намного большим длины волны X, либо выражение । г г РГ2Л(Г/М и (Ро, V) = -^ и (Р„ V) ^—Г-----X (0) ds, 2 расстоя- справед- (4Л.2) где X = с/у— длина волны света (с — скорость света), г — рас- стояние от точки Р[ до точки Ро, 0 — угол между прямой ли- *) Начиная с этой главы, мы будем одинаково обозначать случайный процесс и его выборочные функции. Хотя в чисто статистических рассужде- ниях имеет смысл обозначать процесс заглавной буквой, а выборочную функ- цию — строчной, такое различение, как правило, не требуется в физических приложениях теории. Лишь для плотности распределения мы сохраним обо- значение в виде заглавной буквы, отвечающей рассматриваемой случайной переменной.
120 Глава 4 нией, соединяющей Ро и Рь и нормалью к поверхности S, а х(0) — «коэффициент наклона»: х(0)=1 и 0^/(0)^ 1. Принцип Гюйгенса — Френеля можно интерпретировать на- глядно следующим образом. Каждая точка на поверхности S действует как новый «вторичный источник» сферических волн. Напряженность поля вторичного источника в точке Р{ пропор- циональна (Рь v), и этот источник излучает с амплитуд- ным коэффициентом направленности %(0). Принцип Гюйгенса — Френеля, выражаемый формулой (4.1.2), будет играть для нас роль фундаментального физического за- кона, описывающего распространение монохроматического света. Кроме того, как мы увидим далее, он позволяет найти аналогич- ные соотношения для немонохроматического света. Б. Немонохроматический световой сигнал Пусть и(Р,/)— немонохроматическая волна, описываемая ана- литическим сигналом u(P, I). Хотя функция и(Р,1), вообще го- воря, не допускает преобразования Фурье, мы можем обрезать ее на границах интервала (—Т/2, Т/2) и получить функцию ит(Р, допускающую преобразование Фурье. Теперь ит(Р, t) может быть представлена аналитическим сигналом иДР, t), до- пускающим преобразование Фурье даже в том случае, если его мнимая часть остается необрезанной. В соответствии с основными свойствами аналитических сиг- налов, в частности с формулой (3.8.8), мы имеем оо иг(Р, /)= J 2UT(P, v)e~l2nvt dv, (4.1.3) о где ‘Ut(P, v) — фурье-образ действительного сигнала ц7(Р,0- На основании этого соотношения мы теперь выразим и(Ро, 0 через и(Рь /), где Pq и Pi— точки, показанные ранее на рис. 4.1. Для начала заметим, что оо U (Ро, О = lim ит (Ро, t) = lim ( 2«г (Ро, v) e~/2llv( dv. (4.1.4) Г “> ОО Г ОО J Но в силу принципа Гюйгенса — Френеля [формула (4.1.2)] имеем ^т(Рп, v) = -^\\<UT(Pl, v)^—r----Х(9)rfs. (4.1.5)
Некоторые статистические характеристики первого порядка 121 С учетом выражения (4.1.3), изменив порядок интегрирования н заметив, что К = c/v, напишем оо Ur (Ро0 = $ (Ро, v) е-/2,м dv = о Cf 2Х(8) J J 2лсг — /2nv) <UT (Pit v) e-l2™ K-W dv dS. (4.1.6) Дифференцирование выражения (4.1.3) no t приводит к выра- жению оо AUr(p|( t) = 2^-j2nv)<Ur(Pi, v)e~,2mt dv, (4.1.7) о и, следовательно, величина в квадратных скобках в (4.1.6) может быть выражена через производную по В результате имеем 2ncr формуле времени. (4.1.8) При Г->оо мы получим отсюда фундаментальное выражение, описывающее распространение немонохроматических волн: U(Ро, 0 = И х(0)ds (4.1 9) J J лJ LC• 2 В заключение напомним читателю, что в нашем выводе ис- пользована форма принципа Гюйгенса — Френеля, справедливая в случае, если расстояние г (см. рис. 4.1) намного больше длины волны X, и поэтому аналогичные ограничения относятся и к фор- муле (4.1.9). Это условие хорошо выполняется во всех задачах, с которыми мы встретимся далее. В. Узкополосный световой сигнал В качестве еще одной последней формулы, которая понадобится в будущем, найдем специальную форму выражения (4.1.9), от- носящуюся к случаю немонохроматического светового сигнала с узкополосным спектром, т. е. света с шириной полосы Av, на- много меньшей, чем центральная частота v. Согласно формуле (4.1.6), мы можем написать оо ит (Ро, О = И J v<Ur (Рь v) е->2™ dv dS. (4.1.10) s oJ
122 Глава 4 Поскольку Av v, в хорошем приближении можно написать 2 2«Г(Р|> vje-^V-^dv X(Q)dS. (4.1.11) Величина в фигурных скобках равна просто Ur [Pi,t — (г/с) ]. Та- ким образом, определяя и устремляя Т к бесконечности, находим и(Ро,0~$$^и(р1( <-^-)x(e)dS. (4.1.12) Это выражение будет играть роль нашего фундаментального закона, описывающего распространение узкополосного сигнала. Снова подчеркнем, что оно справедливо только при г X. Этим мы заканчиваем наше обсуждение нестатистических за- конов распространения световых волн. Представленные формулы особенно понадобятся нам в гл. 5. Теперь же обратимся к ста- тистическим свойствам первого порядка для различных типов световых волн. § 2. Поляризованное и неполяризованное тепловое излучение Подавляющее большинство оптических источников как есте- ственных, так и искусственных испускают свет, спонтанно излу- чаемый совокупностью возбужденных атомов или молекул. Так происходит, например, в случае Солнца, ламп накаливания и газоразрядных ламп. Большое число атомов и молекул, переве- денных в состояния с высокой энергией за счет термического, электрического или другого возбуждения, случайно и незави- симо друг от друга переходят в состояние с низкой энергией, испуская при этом свет. Такое излучение, состоящее из большого числа независимых вкладов, называется тепловым. Хаотической волне, испускаемой тепловым источником, мож- но противопоставить весьма упорядоченное вынужденное излуче- ние, испускаемое лазером. Возбужденные атомы или молекулы, находящиеся внутри резонатора, излучают синхронно, т. е. «в унисон», упорядоченно и взаимозависимо. Такое излучение, которое будем называть просто лазерным, рассматривается в § 4. Как тепловое, так и лазерное излучение состоит из волн, ко- торые случайно флуктуируют во времени. Таким образом, свет обоих типов должен в конечном счете рассматриваться как слу- чайный процесс. В данном параграфе мы ограничимся стати- стическими характеристиками первого порядка для амплитуды и интенсивности теплового излучения.
Некоторые статистические характеристики первого порядка 123 А. Поляризованное тепловое излучение Рассмотрим излучение, испускаемое тепловым источником и про- ходящее через анализатор поляризации, который выделяет на- правление поляризации, например вдоль оси X. Действительно- значная функция их (Ру t) есть х-компонента вектора электриче- ского поля, наблюдаемого в точке Р в момент времени t. Благо- даря наличию анализатора поляризации ^-компонента поля Uy(Pyt) равна нулю. В последующем мы будем называть такое световое поле поляризованным тепловым излучением, хотя в дальнейшем (§ 3) будет дано более общее определение поляри- зованного излучения. Поскольку рассматриваемый источник является тепловым, временную функцию их (Ру t) можно рассматривать как сумму большого числа независимых вкладов: ux(P,t)= 2 (4.2.1) Все атомы где Ui(P,t)—х-компонента поля, создаваемого t-м атомом. Так как число излучающих атомов обычно очень велико, на основа- нии центральной предельной теоремы мы приходим к выводу, что Ux(Py t) есть гауссовский случайный процесс для поляри- зованного теплового источника. Часто удобнее всего бывает иметь дело с аналитическим сиг- нальным представлением поляризованной волны их(Ру t), или, говоря другими словами, с комплексной огибающей Ах (Р, t) = ux (Р, t) е^, где v — центральная частота волны. Для такого представления справедливы выражения Ux(P, 0= 2 Щ(Р, I), (4.2.2) Все атомы Ах(Р,0= 2 АДР, 0, (4.2.3) Все атомы где иДР, t) и АДР, 0 — представления в форме аналитического сигнала и комплексной амплитуды соответственно волновых компонент, создаваемых t-м элементарным излучателем. Если применить центральную предельную теорему к действительной и мнимой частям выражений (4.2.2) и (4.2.3), то в предположе- нии о случайном характере фаз и независимости различных вкладов функции ux(P, t) и АХ(Р, /) будут круговыми комплекс- ными гауссовскими случайными процессами. На рис. 4.2 показана комплексная огибающая АХ(Р, t) в за- данной точке Р и в момент времени t, состоящая из большого числа независимых комплексных фазоров. Поскольку между фа-
124 Глава 4 зами отдельных атомных вкладов нет никакой связи, мы можем считать фазы функций АДР, t) статистически независимыми и Рнс. 4.2. Комплексное представле- ние поляризованного теплового из- лучения в фиксированный момент времени и в фиксированной точке пространства. рат модуля аналитического однородно распределенными в интервале (—л, л) Д. Таким об- разом, функция А% (Р, t) имеет все свойства суммы случайных фазоров, рассмотренных в гл. 2, § 9. В частности, ее действитель- ная и мнимая части являются независимыми, одинаково рас- пределенными гауссовскими слу- чайными переменными с нулевы- ми средними значениями. Фотоприемники обычно ре- агируют не на напряженность поля, а на интенсивность света. Поэтому практический интерес представляют статистические свойства интенсивности оптиче- ской волны. Мы определим мгно- венную интенсивность h(P, О поляризованной волны как квад- сигнального представления поля: lX (Р, О AI «х (Р, О I2 = I Ах (Р, 012. (4.2.4) Термин же «интенсивность» мы сохраним для средней по вре- мени или (в предположении эргодичности) для средней по ан- самблю мгновенной интенсивности Ix(P, t), т. е. для /х(Р)А</х(Л0> = 7х(Р). (4.2.5) Мгновенная интенсивность, конечно, случайный процесс. Поскольку величина Ix(P,t) есть квадрат длины суммы случай- ных фазоров, мы можем воспользоваться сведениями, изложен- ными в гл. 2, § 9, чтобы определить ее плотность распределения первого порядка. Для краткости в последующем введем обозна- чения АД|АХ(Р,О|, /Д/х(РЛ). Мы знаем, что величине А отвечает рэлеевская плотность рас- пределения рл(Л) = (^ехр(-/!!/2”,!) пр" -4>°- (4.2.6) to в других случаях, *) Если время прихода излучения от заданного атома совершенно не- предсказуемо, то фаза излучения однородно распределена на главном интер- вале.
Некоторые статистические характеристики первого порядка 125 где ст2 — дисперсия действительной и мнимой частей величины АХ(Р,/). Преобразование 1 = А2, А = -\/1 является монотон- ным на интервале (0,оо), и поэтому мы можем с учетом фор- мулы (2.5.11) написать 2ff2 еХР ( 2о2 ) О при /^>0, в других случаях. (4.2.7) Таким образом, мгновенная интенсивность имеет экспонен- циальное распределение с отрицательным показателем степени. Такое распределение имеет то важ- ное свойство, что его стандартное отклонение <Т/ равно его среднему значению J и оба равны 2а2: ог; = 7 = 2а2. (4.2.8) Поэтому в несколько более ком- пактном виде можно написать Р/(/) = =1техр(—Т") при /^0, в других случаях. ГлСЛ Рнс. 4.3. Плотность распреде- ления мгновенной интенсивно- сти поляризованного теплового излучения. (4.2.9) График такой плотности распределения представлен на рис. 4.3. Познакомившись со свойствами поляризованного теплового излучения, обратимся теперь к неполяризованному тепловому излучению. Б. Неполяризованное тепловое излучение Чтобы излучение теплового источника можно было считать не- поляризованным, должны выполняться два условия. Во-первых, интенсивность излучения, прошедшего через анализатор поляри- зации, который расположен в плоскости, перпендикулярной на- правлению распространения волны, не должна зависеть от угло- вой ориентации анализатора. Во-вторых, необходимо, чтобы для любых двух ортогональных компонент поля ux(P, t) и иу(Р, /) выражение (их (/ +т) и*(0) было тождественно равно нулю при всех угловых ориентациях координатных осей X и Y и при всех задержках т. (Дальнейшее рассмотрение свойств неполяризо-
126 Глава 4 ванного света см. в § 3.) Удовлетворяющее этим условиям из- лучение часто называют также «естественным» излучением. Поскольку излучение создается тепловым источником, для каждой отдельной компоненты поляризации справедливо все изложенное в предыдущем пункте, откуда следует, что u%(P, t) и Uy(P, 0—круговые комплексные гауссовские случайные про- цессы. Кроме того, поскольку они некоррелированы при всех от- носительных задержках времени, оба процесса статистически независимы. Мгновенная интенсивность волны определяется как / (Р Л) АI Их (Р,t) I2 + I Ur (Р ,0 I2 = = 1 АХ(Р,/|2 + |АГ(Р, 0|2 = /х(Р, 0 + /у(Р, 0. (4.2.10) Согласно изложенному в п. А, каждая из величин Ix(P,t) и Iy(P, 0 имеет экспоненциальное распределение с отрицатель- ным показателем. Кроме того, из определения неполяризован- ного света следует, что IX(P, t) и lY(P,t) имеют одинаковые средние значения /х(Р) = 7г(О = 4/(Р1 (4.2.11) и являются статистически независимыми случайными процес- сами. Чтобы найти плотность распределения первого порядка полной мгновенной интенсивности, мы должны найти плотность распределения суммы двух независимых случайных переменных, имеющих одинаковые плотности распределения 2 / /у \ (/x)=jexp^-2-^J, 2 / \ P/r(/y) = -=-exp^-2^J. (4.2.12) На основании формулы (2.6.10) и рис. 4.4 запишем требуемую свертку в виде />/(/) = ИЛИ J(-=-Jexp(-2 ехр [-у (/_£)] при 7>0, 0 в других случаях при /^0, в других случаях. (4.3.13) График этой плотности распределения представлен на рис. 4.5.
Некоторые статистические характеристики первого порядка 127 Заметим, что для неполяризованного теплового излучения ве- роятность очень малого значения мгновенной интенсивности зна- чительно меньше, чем для поляризованного. Кроме того, можно легко показать, что отношение стандартного отклонения <Т/ к Рис. 4.4. Множители в подынтеграль- ном выражении для свертки. Рис. 4.5. Плотность распределения мгновенной интенсивности неполяри- зованного теплового излучения. среднему значению 7, которое было равно единице в случае по- ляризованного теплового излучения, для неполяризованного теп- лового излучения уменьшается до V1/2. § 3. Частично поляризованное тепловое излучение Рассмотрев выше свойства поляризованного и неполяризован- ного теплового излучения, мы можем спросить себя, существует ли более общая теория, пригодная для описания и промежуточ- ных случаев частичной поляризации. Такая теория, действитель- но существует, и мы изложим ее. Но для этого потребуется предварительно познакомиться с матричным методом, очень удобным для описания частично поляризованного излучения и преобразований, которым оно может быть подвергнуто. Подроб- нее об общих свойствах частичной поляризации см. работы [4.3, § 10.8; 4.5]. А. Прохождение узкополосного светового сигнала через устройства, чувствительные к поляризации Рассмотрим теперь математический метод, позволяющий опи- сывать влияние различных оптических устройств на поляриза- цию проходящего света. Это очень удобный метод, вначале раз- работанный Джонсом [4.6] для монохроматических волн. Он может быть использован и для узкополосного света при усло- вии, что спектральная ширина света светового сигнала мала и,
128 Глава 4 следовательно, рассматриваемый прибор воздействует на все его спектральные компоненты одинаково [4.7]. Пусть их(0 и Цг(0 будут X- и /-компонентами электриче- ского и магнитного полей в некоторой точке пространства Р. Состояние этого поля представляется двухрядной матрицей- столбцом U: и = ГМх(01 - Lur(oJ (4.3.1) Предположим, что свет проходит через оптическое устройство, которое содержит элементы, чувствительные к поляризации (по- ляризаторы, фазовые пластинки и т. д.), и рассмотрим поле в точке Р' на выходе данного устройства, которая является гео- метрическим изображением точки Р. Состояние этого поля опи- сывается матрицей U7, аналогичной (4.3.1), но с элементами Uj(0 и Uy (/). Если рассматриваемое устройство содержит толь- ко линейные элементы, как чаще всего и бывает, то матрицу IP можно выразить через матрицу U по очень простой матричной формуле “ где L — поляризационная 2\2~матрицау описывающая действие устройства. Матричные представления некоторых очень простых типов физических операций пригодятся нам в дальнейшем. В каче- стве первой и, пожалуй, самой простой операции рассмотрим поворот координатной системы X — Y. Эту простую операцию можно рассматривать как действие «устройства», которое пре- образует перйоначальные компоненты поля и%(0 и Ur(0 в но- вые компоненты и^(0 и Uy(/) в соответствии с матричным опе- ратором где 0 — угол поворота (рис. 4.6). Второй важный тип простого устройства — фазовая пластин- ка, которая благодаря свойствам двулучепреломляющего мате- риала вводит относительный сдвиг фазы между двумя компо- нентами поляризации. Если скорости распространения X- и /-компонент поляризации равны Vx и иг, то пластинка толщи- ной d вносит для компоненты X относительно компоненты / вре- менную задержку (4.3.4)
Некоторые статистические характеристики первого порядка 129 В согласии с условием узкополосности мы потребуем, чтобы ве- личина %d была намного меньше 1/Av. В этом случае действие фазовой пластинки может быть представлено матрицей (для простоты записанной в симметрии- у, ной форме) есть фазовая задержка Х-компонен- \ ты относительно У-компоненты. \ Кстати заметим, что как матрица поворота (4.3.3), так и матрица фазового сдвига (4.3.5) являются унитарными матрицами, т. е. они обладают свойством LL+ = где L+ — эрмитово-сопряженное значение матрицы L, a f — единичная матрица: Рис. 4.6. Старая (X, У) и но- вая (Xх, Y') системы коорди- нат после поворота на угол 0. (4.3.7) L(a) = В качестве последнего примера мы укажем без доказатель- ства (см. задачу 4.12), что матричное представление анализа- тора поляризации, ориентированного под углом а к направле- нию оси X, имеет вид cos2 a sin а cos а 1 о 0, . . 9 I * (4.0.0/ — sin acos a sin2a J Таким образом, каждому типу поляризационного устройства соответствует свое собственное матричное представление. Кроме того, если свет проходит через ряд таких устройств, их общее действие может быть представлено одной матрицей, равной про- изведению соответствующих отдельных матриц. Следовательно, если свет проходит через устройства, характеризующиеся мат- рицами Li, L2, .Ln, то мы будем иметь Uz = Ln . _L2£iU (4.3.9) и общий эффект будет эквивалентен действию одного устрой- ства, характеризуемого матрицей L = LN ... L2Lb (4.3.10) где выполняются обычные правила перемножения матриц.
130 Глава 4 Б. Матрица когерентности Рассмотрим теперь вопрос об описании состояния поляризации отдельной волны. Вообще говоря, направление электрического вектора может флуктуировать со временем сложным детерми- нированным или случайным образом. Здесь подходит способ описания, основанный на так называемой матрице когерентно- сти, введенной Винером [4.8] и Вольфом [4.7]. Рассмотрим (2 X 2)-матрицу JA(UU+), (4.3.11) где угловые скобки означают, что каждый элемент произведения матриц усреднен по бесконечному временному интервалу. Мат- рицу J можно также представить в виде j=[J/x (4-312> L Jf/X Jyy J где Jxx A <Uj (0 ux (/)), Jyx A <uy (t) Ux (0>’ 3 ! 3 Jxj/ A (“% (0 u*y (0), JwA<Uy(0uy(0>- Такая матрица J называется матрицей когерентности волны. Элементы главной диагонали матрицы J — это, очевидно, сред- ние интенсивности X- и У-компонент поляризации. Недиагональ- ные же элементы — это взаимные корреляции двух компонент поляризации. Некоторые фундаментальные свойства матрицы когерент- ности можно установить чисто математически. Во-первых, из (4.3.13) явствует, что Jx* и Jyy— всегда неотрицательные дей- ствительные величины. Во-вторых, элемент Jyx равен комп- лексно-сопряженному элементу Jxy. Таким образом, J — эрми- това матрица и может быть записана в виде Г 1 J = I i* i (4.3.14) L *xy Jyy J Кроме того, на основании неравенства Шварца, примененного к определению матрицы Jxy, мы можем написать UxJ<[JxAJ1/2- (4.3.15) откуда следует, что детерминант матрицы J неотрицателен: det[J] = JxJ^-lM>0- (4-3.16) Другими словами, J — неотрицательно определенная матрица. И наконец, матрица J имеет то важное свойство, что ее след
Некоторые статистические характеристики первого порядка 131 равен средней интенсивности волны: Tr[JJ = Jxx + J^=7. (4.3.17) Когда оптическая волна проходит через поляризационное устройство, ее матрица когерентности, вообще говоря, изме- няется. Пусть J' — матрица когерентности на выходе устрой- ства, a J — матрица когерентности на входе. Как J' и £ соотно- сятся друг с другом? Ответ легко найти в случае узкополосного света, подставив выражение (4.3.2), описывающее преобразова- ние волновых компонент, в определение (4.3.11) матрицы коге- рентности. Получим J' = LJL\ (4.3.18) где учтено равенство (LU)'t' = UfLf. Конкретные формы матрицы когерентности, отвечающие раз- личным условиям поляризации, могут быть легко выведены из определения их элементов. Вот некоторые очевидные примеры: Линейная поляризация ,____тГ 1 О’] в Х-направлении - 2 7 [ о о J ’ Линейная поляризация , j-Г О О’] в Y-направлении £ ' [ о 1 J * Линейная поляризация -___Г 1 11 под углом 45° к оси X _ Y [ 1 1 J (4.3.19) (4.3.20) (4.3.21) Менее очевидны формулы в случае света, поляризованного по кругу. Волна поляризована по кругу, если ее средняя интен- сивность на выходе из анализатора поляризации не зависит от угловой ориентации анализатора и если электрический век- тор волны вращается с постоянной угловой скоростью 2nv и периодом 1/v. Круговая поляризация называется правой, когда направление вращения вектора совпадает с направлением часо- вой стрелки, если смотреть навстречу волне (т. е. на источник света). Круговая поляризация является левой, если вращение происходит в противоположном направлении. В случае правой круговой поляризации аналитические сиг- налы Ux(0 и Uy(f) принимают вид их(0 = А(0в-^, иу(0 = А(/)е-И2^+^2)1> где A(f) — медленно меняющаяся комплексная огибающая. За- метим, что в течение временного интервала А/ <gC 1/Av величина А(0 приблизительно постоянна, а электрический вектор быстро вращается. Матрица когерентности для такого вида света легко
132 Глава 4 находится путем подстановки выражений (4.3.22) в определение (4.3.13), что приводит к результату Правая круговая поляризация: J = -5-Г ! . 1. (4.3.23) — * I — / 1 I В случае левой круговой поляризации соответствующие фор- мулы таковы: их (/) = А(/)е-^, иу (0 = А(0е-/!2я^-(я/2)!, (4.3.24) Левая круговая поляризация: J =у 1 J ' Заметим, в частности, что для обоих типов круговой поляризации средние интенсивности двух компонент поляризации одинаковы; кроме того, эти две компоненты полностью коррелированы, по- скольку их коэффициент корреляции равен (по модулю) еди- нице: I и I A I 1 _ 1 L хх yyi Далее рассмотрим важный случай «естественного» света. Та- кой свет обладает двумя важными свойствами. Во-первых, по- добно свету, поляризованному по кругу, естественный свет имеет одинаковую среднюю интенсивность во всех направлениях, т. е. если волна проходит через анализатор поляризации, то среднее значение прошедшей интенсивности не зависит от угловой ориен- тации анализатора. Но в отличие от случая круговой поляриза- ции направление поляризации естественного света случайно флуктуирует во времени, так что все направления равнове- роятны. Аналитическое сигнальное представление двух компо- нент поляризации естественного света может быть записано в виде (4.3.26) ux(0 = A(0cos0(0e-/2lt* ur (0 = А (0 sin 0 (/) е~/2я^, где А(0 — медленно меняющаяся комплексная огибающая, опи- сывающая фазорную амплитуду электрического вектора в мо- мент времени t, а 0(0—медленно меняющийся угол между на- правлением поляризации и осью X. Если значения угла 0(0 однородно распределены в интервале (—л, л), то матрица коге- рентности легко определяется и j-^Г - 2 [о где J — единичная матрица. (4.3.27) вид имеет 01 , 1] = т/> (4.3.28)
Некоторые статистические характеристики первого порядка 133 Нетрудно показать (задача 4.3), что если свет, характери- зующийся матрицей когерентности (4.3.28), проходит через не- которое устройство, описываемое унитарной поляризационной матрицей (например, матрицей поворота координат или фазо- вой пластинки), то матрица когерентности сохраняет форму (4.3.28). Следовательно, если матрица когерентности имеет та- кую форму, то никаким устройством, описываемым унитарной поляризационной матрицей, невозможно ввести корреляцию между X- и /-компонентами поля. В заключение укажем еще, что элементы матрицы когерент- ности являются измеряемыми величинами. Ясно, что элементы Jxx и Луу, т. е. средние интенсивности X- и /-компонент поляри- зации, могут быть прямо измерены при помощи анализатора поляризации, ориентированного в направлении осей Хи/. Чтобы измерить комплексный элемент ЛХу, потребуется два из- мерения. Если анализатор поляризации установлен под углом 45° к оси X, то интенсивность проходящего света равна (за- дача 4.4) h = ~2 [”Ь *уу “F **у + Jxу\ = ~2 [J** + Jyyl ”Ь Re {(4.3.29) Так как элементы Jxx и Луу известны, тем самым определяется действительная часть элемента ЛХу. Если ввести четвертьволно- вую пластинку, чтобы сдвинуть фазу /-компоненты по отноше- нию к Х-компоненте на л/2 радиан, а за ней установить анали- затор поляризации ориентированным снова под углом 45° к оси X, то интенсивность проходящего света будет равна (задача 4.5) ^2 = “2 [ Jxx + Луу j (Лху Лху)] = -g [ Jxx + Луу] “h Im {Jxtj , (4.3.30) откуда можно найти мнимую часть элемента Jxy. Так как = ЛхУ) тем самым задается полная матрица когерентности. В. Степень поляризации С эстетической и с практической точки зрения весьма жела- тельно иметь один параметр в качестве характеристики степени поляризации волны. В случае линейно-поляризованной волны такой параметр должен принимать максимальное значение (ко- торое для удобства можно считать равным единице), поскольку такая волна является полностью поляризованной при любом приемлемом определении. В случае света, поляризованного по кругу, он тоже должен принимать максимальное значение, по- скольку такой свет может быть превращен в линейно-поляризо-
134 Глава 4 ванный без потери энергии при помощи четвертьволновой фа- зовой пластинки. В случае же естественного света этот параметр должен быть равен нулю, так как направление поляризации совершенно случайно и непредсказуемо. Параметр, которым определяется степень статистической за- висимости между двумя компонентами поляризации, идеально подошел бы для нашей цели. Но, вообще говоря, такой пара- метр требует, чтобы было известно совместное распределение компонент Ux(0 и иу(0. Для простоты пользуются менее общей характеристикой поляризации, требующей измерения только кор- реляционных параметров Jxx, и Jxy матрицы когерентности. Такого определения степени поляризации полностью достаточно для большинства приложений, особенно если мы имеем дело с тепловым излучением. Однако нетрудно найти пример све- товой волны, которая имеет такую же матрицу когерентности, как и естественный свет, при полностью детерминированном и предсказуемом поведении направления своей поляризации (за- дача 4.6). Учитывая возможность таких затруднений, мы рас- смотрим определение степени поляризации Ф, основанное на свойствах матрицы когерентности. В чем существенные различия между матрицами когерент- ности для света, который мы логически назвали бы полностью поляризованным (например, линейно или по кругу), и для света, который мы логически назвали бы неполяризованным (напри- мер, естественного света)? Эти различия не только в наличии или отсутствии недиагональных элементов, ибо такие элементы равны нулю как в формуле (4.3.19), так и в формуле (4.3.28), хотя первая из них соответствует полностью поляризованному свету, а вторая — неполяризованиому. Можно сделать следующие замечания физического харак- тера. В случае света, поляризованного под углом 45° к оси X, матрица когерентности диагонализуется путем простого пово- рота координат, приводящего, например, от формулы (4.3.21) к формуле (4.3.19). Аналогично в случае света, поляризованного по кругу, четвертьволновая пластинка, дополненная поворотом системы координат на 45°, приводит к свету, линейно-поляризо- ванному вдоль оси X, и к диагональной матрице когерентности. В обоих случаях недиагональные элементы исключаются путем преобразования (без потерь энергии поляризации). Поэтому основная разница между поляризованным и неполяризованным светом, вероятно, — в той форме, которую матрица когерентности приобретает после диагонализации. Эта мысль подтверждается некоторыми общими результа- тами теории матриц. Можно показать, что для всякой эрмито- вой матрицы J существует унитарное матричное преобразование
Некоторые статистические характеристики первого порядка 135 Р, такое, что + ГМ1 PJP + = L л (4.3.31) L J где Xi и Х2— действительнозначные собственные значения мат- рицы J [4.9]. Кроме того, можно показать, что любая матрица когерентности неотрицательно определена, а поэтому Xi и Х2— неотрицательные величины. Если физически интерпретировать эти результаты, то для каждой волны существует поляризацион- ное устройство (без потерь энергии), которое исключает все корреляции между X- и /-компонентами поляризации. Струк- тура требуемого устройства (т. е. требуемое преобразование Р) зависит от начальной матрицы когерентности J, но оно всегда может быть реализовано в виде сочетания поворота системы ко- ординат с фазовой пластинкой [4.10]. Если величины Xi и Х2 одинаковы (как в случае естествен- ного света), то ясно, что степень поляризации (каково бы ни было ее определение) должна равняться нулю. Если же вели- чина Xi или Х2 равна нулю (как в случае света, линейно-поляри- зованного вдоль оси X или У), то степень поляризации должна быть, очевидно, равна единице. Чтобы прийти к логическому оп- ределению степени поляризации, заметим, что диагонализиро- ванная матрица когерентности может всегда быть записана сле- дующим образом: Х| 0 I Г Х2 0 ] Г Xj — Х2 о о A, J = L 0 Х2 J + L 0 0. (4.3.32) где мы приняли (без потери общности), что Xi Х2. Первая матрица в правой части представляет неполяризованный свет со средней интенсивностью 2Х2, а вторая — линейно-поляризован- ный свет с интенсивностью Xi — Х2. Таким образом, свет с про- извольной поляризацией может быть представлен в виде суммы поляризованной и неполяризованной составляющих. Определим степень поляризации волны как отношение интенсивности поля- ризованной компоненты к полной интенсивности: Xi — Х2 Xi 4“ Х2 А (4.3.33) Таким образом, мы дали общее определение 1)- Степень поляризации может быть выражена более явно че- рез элементы первоначальной матрицы когерентности, если это 9 Четкое изложение теории поляризации световых волн см. в работе [4д]. — Прим. ред.
136 Глава 4 потребуется. Чтобы сделать это, заметим, что собственные зна- чения Xi и Лг по определению являются решениями уравнения det[J-^] = O. (4.3.34) Прямое решение получающегося квадратного уравнения для X приводит к выражению 1 Р Г / det [J] 1 42 = yTr[J][l± у 1-4^^]. (4.3.35) Таким образом, степень поляризации может быть записана в виде det [ЗТ '-4W' (43,36) Нетрудно показать, что любое унитарное преобразование матрицы когерентности не изменяет следа этой матрицы. Следо- вательно, мы можем всегда рассматривать интенсивность ча- стично поляризованной волны как сумму интенсивностей и Хг двух некоррелированных полевых составляющих. Средние ин- тенсивности этих составляющих выражаются через степень по- ляризации следующим образом: х, = у7(1 , _ (4.3.37) А2 = у/(1-П где мы просто учли, что Tr[J] = 7, и подставили выражение (4.3.36) в (4.3.35). Если мы имеем дело с тепловым излучением, то отсутствие корреляции означает статистическую независи- мость как полевых компонент, так и соответствующих интен- сивностей. Изложенное выше о свойствах частично поляризованного света нельзя считать исчерпывающим, поскольку мы опустили многие интересные моменты. Отметим, в частности, параметры Стокса и матрицы Меллера. Ни те, ни другие не рассматрива- лись здесь. Мы ограничиваемся лишь теми вопросами, которые будут полезны нам при изложении последующего материала, а за более полной информацией читатель отсылается к литера- туре [4.3, гл. 10; 4.5, 4.11]. Г. Статистические характеристики первого порядка мгновенной интенсивности Мы закончим обсуждение свойств частично поляризованного света выводом плотности распределения мгновенной интенсив- ности теплового излучения с произвольной степенью поляриза-
Некоторые статистические характеристики первого порядка 137 ции SP. Как мы видели в предыдущем пункте, мгновенную интен- сивность частично поляризованной волны всегда можно предста- вить в виде суммы двух некоррелированных составляющих ин- тенсивности: /(Р, 0 = Л(Л О + МЛ /). (4.3.38) Кроме того, если мы рассматриваем тепловое излучение, то со- ставляющие интенсивности также статистически независимы вследствие независимости соответствующих комплексных гаус- совских полевых компонент. Средние интенсивности этих двух составляющих, согласно формуле (4.3.37), равны 71=|(1+^)7, 72=4(1-^)Л (4.3.39) где 7 — полная средняя интенсивность. Так как 1\ и /2— квадраты модулей круговых комплексных гауссовских полей, каждая из этих величин подчиняется экспо- ненциальному распределению с отрицательным показателем: = Д7Жехр{ ',-W = 77^rexp{ 2Л ) Г 2/2 1 (1 - Я “ J (4.3.40) при Ц 0 и /2 0. Плотность распределения полной интенсив- ности I легче всего найти, вычислив сначала характеристиче- скую функцию Mi(o)). Поскольку /1 и /2 независимы, мы можем представить характеристическую функцию в виде произведения двух характеристических функций (задача 4.2): [1 -/-y(l+^)Z J[1 -/^-(1-^)/ (1 + ff)/2ff_______(1 |-/-^-(1 + ЯГ 1 (1-^)7 ’ (4.3.41) где на последнем этапе было использовано разложение на пар- циальные дроби. Обратное преобразование Фурье приводит к плотности распределения вида = -k {ехр [- ттттут] - ир [- тггит]} (4-ЗЛ2) График этой плотности распределения при разных значениях & показан на рис. 4.7. Как нетрудно видеть, эти результаты согла-
138 Глава 4 суются с представленными на рис. 4.3 и рис. 4.5 для случаев & = 1 и SP = 0. Рис. 4.7. Плотность распределения мгновенной интенсивности теплового излу- чения со степенью поляризации Наконец, в случае частично поляризованного теплового излу- чения можно легко показать (задача 4.7), что стандартное от- клонение о/ мгновенной интенсивности равно = (4-3.43) § 4. Лазерное излучение От статистических характеристик первого порядка для тепло- вого излучения, являющегося типичным примером света, наибо- лее часто встречаемого на практике, мы теперь перейдем к бо- лее трудной задаче моделирования свойств света, генерируемого лазером. Задача оказывается трудной не только из-за сложного характера физического принципа действия даже простейшего вида лазера, но также из-за громадного разнообразия типов су- ществующих лазеров. Ни одна из моделей не позволяет на- деяться точно описать статистические свойства лазерного света во всех возможных случаях. Лучшее, что мы можем сделать,— это предложить модели, которые описывают лишь определен- ные, идеализированные свойства лазерного света.
Некоторые статистические характеристики первого порядка 139 Напомним и кратко опишем на интуитивной основе принципы действия лазера. Любой лазер содержит совокупность атомов или молекул («активная среда»), возбуждаемых источником энергии («накачка») и находящихся внутри объемного резона- тора, который обеспечивает обратную связь. Спонтанное излу- чение активной среды отражается от граничных зеркал резона- тора и проходит через активную среду, где оно усиливается благодаря дополнительному вынужденному излучению. Вклады вынужденного излучения от различных прохождений через активную среду конструктивно интерферируют только для опре- деленных частот, или мод. Происходит ли генерация данной моды —это зависит оттого, превышает ли усиление активной среды различные внутренние потери на частоте конкретной моды. Мы говорим, что данная мода находится «вблизи порога», если для нее усиление равно потерям. Усиление можно увеличить, увеличив мощность на- качки. Но, когда начинается генерация, нелинейности процесса приводят к насыщению коэффициента усиления, так что он пе- рестает возрастать с увеличением мощности накачки. При этом, как мы увидим, статистические свойства испускаемого излучения определяются степенью превышения порогового уровня накачки. Кроме того, с увеличением мощности накачки, вообще говоря, порога достигают и другие моды резонатора и на выходе появ- ляется ряд генерируемых линий с разными частотами. Вначале мы ограничимся случаем одномодового колебания лазера, а позднее обратимся к более общему, но более труд- ному случаю многомодового колебания. А. Одномодовое колебание Предельно идеализированной моделью лазера является чисто монохроматический генератор излучения известной амплитуды S, известной частоты vo и фиксированной, но неизвестной абсо- лютной фазы Действительнозначное представление такого сигнала, предполагаемого линейно-поляризованным, имеет вид и (0 = S cos [2лу0^ — qp]. (4.4.1) Чтобы учесть то обстоятельство, что мы никогда не знаем абсо- лютную фазу колебания, следует рассматривать <р как случай- ную переменную, однородно распределенную на интервале (—л, л). В результате получаем представление случайного процесса, который является как стационарным, так и эргоди- ческим. Распределение первого порядка для мгновенной амплитуды легче всего найти, вычислив ее характеристическую функцию. Так как процесс стационарный, мы можем положить / = 0; в
140 Глава 4 этом случае л Му (со) = Е [ехр (/coS cos <p)J =-^ ехр (/aS cos ср) dtp = /0 (coS), -Л (4.4.2) где Jo — функция Бесселя первого рода нулевого порядка. Об- ратное преобразование Фурье этой функции приводит [4.12] к плотности распределения (рис. 4.8, а) , , ( [л VS2 — и2] ' при |u|<S, .. . Ри(и) = < 1 у н (4.4.3) (.0 в других случаях. Что касается интенсивности сигнала u(t), то мы имеем / = | S ехр | — j (2jcv0/ — <р) I2 = S2. Таким образом, плотность распределения интенсивности / мо- жет быть записана в виде (рис. 4.8, б) р,(/) = б(/— S2). (4.4.4) Чтобы получить более близкую к реальности модель, нужно учесть, что реальная генерация никогда не имеет строго постоян- Рнс. 4.8. Плотности распределения: а) амплитуды ри(и) н б) интенсивности pi(I) полностью монохроматической волны с неизвестной фазой. ной фазы. Точнее фаза претерпевает случайные флуктуации во времени, величина которых определяется типом лазера и мерами, принятыми для повышения его стабильности. Таким об- разом, формула (4.4.1) принимает вид и (0 = S cos [2лл>(/ — 0 (f)], (4.4.5) где 0(f) — случайная составляющая фазы. Случайно изменяющаяся фазовая составляющая 0(f) может быть обусловлена рядом причин, включая акустически связан- ные колебания граничных зеркал лазерного резонатора и соб- ственные шумы, присущие выходу любого возбуждаемого шу- мом нелинейного генератора. Во всех случаях флуктуации фазы
Некоторые статистические характеристики первого порядка 141 могут рассматриваться как возникающие благодаря случайным флуктуациям частоты колебания. Чтобы сформулировать сказанное более точно, представим полную фазу колеблющейся моды ф(0 в виде ф (0 = 2nv0^ — 0 (t). (4.4.6) Мгновенная частота генерации может быть теперь определена выражением = (4.4.7) из которого видно, что она состоит из среднего значения v0 н случайно флуктуирующей составляющей (4.4.8) В большинстве случаев, представляющих интерес, физиче- ский процесс, вызывающий флуктуации частоты, может рассмат- риваться как источник генерации стационарных флуктуаций Vfi(t) мгновенной частоты с нулевым средним значением. От- сюда следует, что t 6(0 = 2л J vR®dt> (4.4.9) является нестационарным случайным процессом, хотя следую- щие рассуждения показывают, что он является стационарным в первых приращениях. Структурная функция 0(0 не зависит от начала отсчета времени, что видно из выражения ____________ (7 Ь-СЧг91 Г ад,О = [е(О-0(О]2=4лМ \ recti---------т—7—-К(£)#Г = I J и. *2 *1 j I 4 — оо z Т = 8л2т J (1 - -J) Tv (n) dri, (4.4.10) oJ где Tv — автокорреляционная функция частоты v/?(0> т = 0 — 0 и выполнены преобразования, аналогичные использованным ра- нее при выводе формулы (3.4.9). Если время задержки т на- много больше времени корреляции то структурная функ- ция принимает вид оо D6 (т) « 8л2т J Tv (n) dr], (4.4.11) о или, в словесной формулировке, средний квадрат разности фаз линейно зависит от времени разделения т. Такое соотношение
142 Глава 4 характерно также для процесса диффузии и броуновского дви- жения свободной частицы. Что касается плотностей распределения амплитуды и интен- сивности волны с постоянным уровнем и случайно изменяющей- ся фазой, то они идентичны тем, которые приведены на рис. 4.8, так как фаза оказывается снова однородно распределенной в интервале (—л,л), а интенсивность остается постоянной. Последнее усложнение модели связано с допущением, что амплитуда моды флуктуирует случайно во времени (это в ка- кой-то степени неизменно имеет место на практике). Решение линеаризованного уравнения Ван дер Поля [4.13], которое опи- сывает лазер непрерывного действия, работающий при доста- точном превышении порога, показывает, что излучаемая волна имеет временную структуру типа и (0 = S cos [2лvQt -6(0] + иЛ), (4.4.12) где S и vo рассматриваются как известные постоянные, 0(0 — случайно изменяющаяся во времени фаза рассмотренного выше диффузионного типа, a un(t) — слабый стационарный шумовой процесс с относительно узким (Av vo) спектром, центральная частота которого равна vo- Напряженность шумовых компонент уменьшается по мере того, как лазер работает все далее выше порога. Можно показать, что с физической точки зрения первый член в формуле (4.4.12) представляет вынужденное излучение, а вто- рой— малую остаточную величину спонтанного излучения. В этом случае логично приписать величине un(t) гауссовское распреде- ление и предположить, что эта величина не зависит от 9(0- В фиксированный момент времени первый член имеет плотность распределения, определяемую формулой (4.4.3), тогда как вто- рой член имеет гауссовскую плотность распределения. При ра- боте достаточно далеко за порогом гауссовская функция имеет стандартное отклонение о, намного меньшее S. Поэтому свертка двух функций плотности приводит к слегка сглаженному ва- рианту приведенных на рис. 4.8, а зависимостей для плотности распределения амплитуды. Что касается интенсивности одномодового колебания, то за- метим, что она равна квадрату длины интенсивного фазора с по- стоянной амплитудой и случайной фазой S и слабого кругового комплексного гауссовского фазора АЛ, представляющего комп- лексную огибающую гауссовского шумового члена. Плотность распределения интенсивности I можно найти, если заметить, что 7 = | S + А„ |2 « | S |2 + 2 Re {S*A„}. (4.4.13) Теперь учтем, что S=Se16, ка = Апе{^,
Некоторые статистические характеристики первого порядка 143 где АП) 9 и независимы, а 0 и ф„ однородно распределены на интервале (—л, л). Действительная часть величины 2S*An является гауссовской случайной переменной1) с нулевым сред- ним значением и дисперсией а2 = 4S24£ cos2 (6 — <р„) = 4IsTn | = 2IsTn. (4.4.14) Мы приходим к выводу, что интенсивность I (приблизительно) описывается гауссовской плотностью распределения 1 Pi (Л ~ —т== ехР •у 4л/SIN (z - у (4.4.15) Эта формула справедлива при Is » 7^. Другое решение для плотности распределения интенсивности лазера, работающего выше или ниже порога, было найдено Рискеном [4.14], который решал нелинейное уравнение Фок- кера—Планка, вычисляя непосредственно плотность распреде- ления. В результате для плотности распределения было полу- чено выражение (------------ехр •! — I —=— р;(7)=ч л/0 1 -I- erf w ( Wn /о I О до)2) при 7^0, в других случаях (4.4.16) где /о — средняя пороговая интенсивность, w — параметр, кото- рый изменяется от большого отрицательного значения при ра- боте значительно ниже порога до нуля вблизи порога и до боль- шого положительного значения далеко за порогом, a erf и; — обычное обозначение функции ошибок: О> 2 г erf w ——\ ехр(— x2)dx, erf (— w) = — erf w. (4.4.17) J Средняя интенсивность на выходе лазера связана со средней пороговой интенсивностью соотношением + (4.4.18) Если w 0, то лазер работает в состоянии значительно ниже порога и pi(I) приблизительно является экспонентой с отрица- :) Заметим, что Re{S*4n) = S4ncos(<pn — 0). Так как фаза <рп однородно распределена, а Ап имеет рэлеевское распределение, получающееся произве- дение подчиняется гауссовскому распределению,
144 Глава 4 тельным показателем, как и для теплового излучения: । ' ехр j------при /^0, рАП (4.4.19) I 0 при I < 0. Если аи=О, то лазер работает вблизи порога и pi(I) имеет форму половины гауссовской кривой: {2 ( ----ехр я/о-I о при при (4.4.20) Наконец, в наиболее общем случае, когда лазер находится в состоянии далеко за порогом, w 0 и р}(/) имеет форму гаус- Гш=-7,77 '^0 Рнс. 4.9. Решение Рискена для плотности распределения интенсивности лазера (одна мода). совской плотности со средним значением I = W'x/kIq. Pi(I) ~ 1 ----ехр л/0 0 ! — w Ул /0 Ул /0 при при />0, /<0 (4.4.21)
Некоторые статистические характеристики первого порядка 145 Напомним, что предыдущее приближение (4.4.15) предсказы- вало аналогичный результат, а' это указывает на соотношение Is w л/пЦ 7 V„/o (оу » 0). (4.4.22) N 4w График общей плотности распределения, описываемой форму- лой (4.4.16), при нескольких значениях w представлен на рис. 4.9. В дальнейшем мы часто будем для удобства принимать, что лазер работает далеко за порогом и флуктуации интенсивности незначительны. Поэтому для излучения, генерируемого одномо- довым лазером, чаще всего используется выражение в виде ко- синуса со случайно модулированной фазой (4.4.5). Б. Многомодовое лазерное излучение Одномодовый режим генерации может быть осуществлен лишь в некоторых лазерах, если приняты особые меры; обычно же лазеры генерируют целый ряд поперечных и продольных мод. Если лазер работает значительно выше порога, то в качестве разумного выражения для стационарного выхода можно взять формулу вида и (0 = Ё 5/ COS [2nvf/ - ег (/)], (4.4.23) i = l где W— число мод, Si и vz — амплитуда и центральная частота z-й моды, а 0ДО — изменяющаяся во времени фаза, связанная с этой модой. В наиболее общей модели, чаще всего используемой для мно- гомодового лазерного излучения, принимается, что колебания мод независимы и происходят без заметной фазовой синхрони- зации. Но такой моделью следует пользоваться с большой осто- рожностью. Если флуктуации фазы обусловлены колебаниями граничных зеркал лазера, то ясно, что флуктуации различных мод будут статистически зависимыми. Кроме того, если фазо- вые флуктуации являются неотъемлемой частью механизма ко- лебаний, то лазер является существенно нелинейным прибором и в результате этих нелинейностей может возникать значитель- ная связь между модами. Например, некоторая фазовая синхро- низация имеет место, если частотная компонента, генерируемая за счет нелинейного взаимодействия между двумя модами, со- впадает с частотой некой третьей моды. Такие эффекты особенно существенны в лазере, работающем значительно выше порога, где нелинейности особенно велики. (Относительно методов на- меренного введения синхронизации мод в лазерах см., например, работу [4.15].)
146 Глава 4 Сознавая, что рассматриваемая модель во многих случаях, оказывается непригодной, мы тем не менее рассмотрим свойства излучения, испускаемого лазером, в котором генерация охваты- вает несколько независимых мод. Такие условия существуют в случае газового лазера, генерирующего чуть выше порога, хотя, строго говоря, в этом случае в выражение (4.4.23) должен быть добавлен член, описывающий гауссовский шум, обуслов- ленный спонтанным излучением. (Следует, однако, заметить, что чуть выше порога лазер может хорошо генерировать в одно- или двухмодовом режиме.) Характеристическая функция для амплитуды отдельной моды определяется, согласно формуле (4.4.2), выражением М£ (со) =/0 (©Si). (4.4.24) В случае W независимых мод характеристическая функция имеет вид Му(со) = П/о(®5г), (4.4.25) 1 = 1 и, если все моды имеют равные амплитуды 's/l/N, в резуль* тате получим (©) = /" («в Vf)- (4-4.26) Чтобы найти плотность распределения, нужно выполнить преоб- разование Фурье характеристической функции. Ходара [4.16] и Мандель [4.17] показали, что для двух мод одинакового уровня плотность распределения амплитуды имеет вид . О в других случаях, где К( )—полный эллиптический интеграл первого рода. Мы здесь просто выполним численное преобразование Фурье выра- жения (4.4.26) и представим график плотности ри(и) при раз- ных значениях W на рис. 4.10. По мере того как добавляется все большее и большее число независимых мод, видно, что плотность распределения прибли- жается к гауссовской форме, как и должно быть в соответствии с центральной предельной теоремой. При N & 5 еще видна раз- ница между истинной плотностью распределения и гауссовской. С точки зрения классических статистических характеристик (ха- рактеристик первого порядка) различие между многомодовым лазерным излучением (W :> 5) и тепловым излучением мало,
Некоторые статистические характеристики первого порядка 147 Рис. 4.10. Плотность распределения амплитуды волны, состоящей из № равных по уровню независимых мод. Полная интенсивность Т поддерживается по- стоянной и равной единице. Гауссовская кривая неотличима на этом графике от кривой для У = 10. Рис. 4.11. Фазорная диаграмма (к вычислению /). если выполняется основное предположение об отсутствии фазо- вой синхронизации. Что касается плотности распределения интенсивности много- модового лазерного света, то задача ее нахождения еще
148 Глава 4 труднее, чем в случае амплитуды. Рассмотрим сначала случай двух независимых мод с интенсивностями kl и (1 —k)T. На осно- вании рис. 4.11 и закона косинусов полную мгновенную интен- сивность можно представить в виде J = k7+(\ -k)i~+ 2дД(1 -^)7cOS1|5 = = 7 [1 + 2 cos 1|)]( (4.4.28) где Ф = 2д (v2 - V1) t - е2 (t) + 0! (/). (4.4.29) В случае однородного распределения фаз 02 и 01 и их статисти- ческой независимости фаза ф оказывается однородно распреде- ленной на интервале (—л, л). Таким образом, характеристиче- ская функция мгновенной интенсивности имеет вид М/ (о)) = ехр {/ш/ [1 + 2 ^/k (1 — k) cos ф]} с/ф = -л = ехр (/©7) /0 (2<о7 дД(1 -k)). (4.4.30) Обратное преобразование Фурье приводит к следующему выра- жению для плотности распределения: [лд/(27 д//г(1 - /г)2- (7 - 7?]'при7[ 1 -27^(1-/г)] < Р/ <I<J < [1 +2 7/г(1 - Л)], . 0 в других случаях. (4.4.31) График этой функции плотности при различных значениях па- раметра k показан на рис. 4.12. Штриховой линией здесь пред- ставлено экспоненциальное распределение с отрицательным по- казателем, связанное с интенсивностью флуктуаций теплового излучения. Сплошные линии приближаются к этой кривой с уве- личением числа независимых мод. Хотя плотность распределения интенсивности / при наличии более чем двух мод еще не найдена, можно вычислить стандарт- ное отклонение для интенсивности при наличии N равных по уровню независимых мод и сравнить его со стандартным откло- нением для / в случае теплового излучения. Читателю предла- гается убедиться (задача 4.11), что отношение стандартного отклонения к средней интенсивности для N равных по уровню независимых мод равно
Некоторые статистические характеристики первого порядка 149 Эта зависимость от W показана на рис. 4.13. Заметим, что с увеличением W отношение о//7 приближается к значению, равному единице, характерному для поляризованного теплового излучения. Если имеется более пяти независимых мод, то это интенсивности двух независимых мод с долей k полной интенсивности в одной и (! — k) в * другой модах. дартного отклонения а/ к средней интенсивности Т из- лучения лазера, генерирую- щего N независимых мод равного, уровня отношение в пределах 10 % соответствует значению для тепло- вого излучения. Таким образом, мы снова видим, что прибли- жение к «квазитепловому» излучению происходит очень быстро с увеличением числа мод. Наконец, подчеркнем снова, что сходство многомодового ла- зерного света и теплового излучения имеет место только в том случае, если различные моды колебаний являются несвязан- ными. Практически ситуация, в которой это предположение вы- полняется, вероятно, встречается весьма редко. В. Квазитепловое излучение, образующееся при прохождении лазерного света через движущийся рассеиватель Световое излучение с классическими статистическими характе- ристиками первого порядка, не отличающимися от характери- стик поляризованного теплового излучения, можно получить, пропуская лазерное излучение (одно- или многомодовое) через движущийся рассеиватель. Такое излучение отличается от теп- лового главным образом значительно большей энергией, которой
150 Глава 4 оно обладает во временном интервале, характерном для флук- туации («время корреляции»); этот вопрос более детально ис- следуется в гл. 9. На рис. 4.14 представлена схема экспериментального устрой- ства для создания квазитеплового излучения такого типа. Ла- зерное излучение падает на рассеиватель, например на матовое стекло. На очень малом пространственном масштабе рассеива- тель вводит исключительно сложные и нерегулярные искажения Лазер Точка наблюдения •Ро Рис, 4.14. Получение квазитеплового излучения из лазерного излучения при помощи движущегося рассеивателя. падающего волнового фронта с изменениями фаз, вообще го- воря, намного превышающими 2л радиан, В удаленной точке Ро свет может рассматриваться состоящим из многих независимых вкладов от различных «корреляционных областей» на рассеива- теле, где рассеиватель рассматривается как одна из конкретных реализаций, выделенная из ансамбля возможных рассеивате- лей. Эти вклады сфазированы случайным образом, а отсюда наблюдаемое сложное световое поле может рассматриваться как сумма случайных фазоров. Таким образом, это поле подчиняется комплексному гауссовскому распределению, а интенсивность волны — экспоненциальному распределению с отрицательным показателем в пределах ансамбля микроскопически разнород- ных рассеивателей, поскольку предполагалось, что деполяриза- ция света незначительна. Если теперь рассеиватель непрерывно движется, то поле и интенсивность флуктуируют со временем, осуществляя много независимых реализаций соответствующего статистического рас- пределения. Таким образом, интенсивность света флуктуирует случайным образом во времени, подчиняясь экспоненциальному распределению с отрицательным показателем, как и в случае поляризованного теплового излучения. Более подробно вопрос о соотношении между такого рода излучением и обычным теп- ловым излучением рассматривается в работе [4.18].
Некоторые статистические характеристики первого порядка 151 Задачи 4.1. Исходя из формулы (4.1.10), покажите, что если Av v и г < c/Av при всех Pi, то для описания процесса распро- странения волны u(P, t) может быть использовано выра- жение f г /2Л(г/Х) u(P0, —U(P1, Ox(0)dS. J2J /Лг 4.2. Покажите, что характеристическая функция интенсивности поляризованного теплового излучения имеет вид м/(й>) = —-LT. 1 — /со/ 4.3. Покажите, что матрица когерентности естественного света не изменяется при любом унитарном преобразовании поля- ризации. 4.4. Вычислив след преобразованной матрицы когерентности, по- кажите, что интенсивность света, прошедшего через анали- затор поляризации, установленный под углом 45° к оси X, может быть представлена в виде / = 4lJxx + JJ + Re{M, где JXx, iyy и Jxy — элементы матрицы когерентности па- дающего света. 4.5. Вычислив след преобразованной матрицы когерентности, по- кажите, что интенсивность света, прошедшего четвертьвол- новую пластинку, дополненную анализатором поляризации, установленным под углом 45° к оси X, может быть пред- ставлена в виде где Jxx, Луу и JXy — элементы матрицы когерентности па- дающего света, а также предполагается, что четвертьволно- вая пластинка приводит к запаздыванию по фазе состав- ляющей Uy относительно составляющей и% на 90°. 4.6. Для световой волны, X- и У-компоненты поляризации элек- трического поля которой в точке Р определяются выраже- ниями uY(/) =ехр[— /2л (v — -у-) ф иу (/) = ехр[— /2л (v + -у-) /],
152 Глава 4 покажите: а) что в момент времени t электрический вектор составляет угол 0 (/) = arctg< cos 2л cos 2л с осью X и поэтому направление поляризации оказывается полностью детерминированным; б) что такой свет имеет матрицу когерентности, идентичную матрице для естественного света, для которого направление поляризации полностью случайно. 4.7. Покажите, что стандартное отклонение о/ мгновенной ин- тенсивности частично поляризованного теплового излучения определяется выражением [формула (4.3.43)] 4.8. Рассмотрите аналитическое сигнальное представление мо- нохроматического сигнала и (0 = S exp [— j (2nv0^ — ф)], где S и vo—известные постоянные, а ф— случайная пере- менная, однородно распределенная на интервале (—л, л). Пусть и{г) (0 = Re {и (/)} = S cos [2лу0/ — ф], (/) = Im {и (0} = — S sin [2лv0/ — ф]; а) покажите, что условная функция плотности распределе- ния при данном определяется выражением Pi Iu<r)) = V-S2 - (ur)2 6 l(U(‘))2 + (u<r’)2 - S2]; б) покажите, что совместная плотность распределения p(u{r\ u{i)) определяется выражением р и<‘>) = 6 [(ы(г>)2 + (u<‘>)2 - s2]; в) покажите, что u(i) описывается той же плотностью рас- пределения, что и u(r), т. е. РЛ«"'1= <I««>KS); л Vs - (z/(0) г) покажите, что если Е [и(г)и(й] = 0, то u(r) и незави- симы.
Некоторые статистические характеристики первого порядка 153 Указание: MZW| = £ Все корни I I *п f(x) * аХ \* = хп (см. работу [2.4]). 4.9. Докажите, что тепловое излучение при распространении до удаленной точки наблюдения остается тепловым излуче- нием, но лазерное излучение может и сохранять, и не со- хранять форму и (0 = S ехр {— / [2nv0/ — 9 (0]} • 4.10. Для излучения, испускаемого одномодовым лазером и опи- сываемого аналитическим сигналом и (/) = ехр {— / [2nv0Z — 6 (/)]}, покажите: а) предполагая, что А0(О—эргодический случайный про- цесс, что автокорреляционная функция и(0 определяется выражением Гу(/2, /1) = е-^Мде(1), где Мде(о)) — характеристическая функция разности фаз де = е(м—0(6); б) что для гауссовского процесса с нулевым средним зна- чением 6(0, возникающего из стационарного процесса с мгновенной частотой, справедливо выражение Гу(т) = е“/2Л^"(1/2>^(Й, где Dq(x) — структурная функция фазового процесса 9(0- 4.11. Пусть излучение, испускаемое лазером, который генери- рует на W равных по уровню, но независимых модах, пред- ставляется в виде w и (/) = s ехр {— / (2nvkt — <р*)}, Й = 1 где фазы ф* однородно распределены на интервале (—л, л) и статистически независимы. Найдите выражение для отно- шения стандартного отклонения интенсивности о/ к сред- ней интенсивности I, выразив результат через 4.12. Покажите, что матрица Джонса для анализатора поляри- зации, установленного под углом -фа к оси ^определяется выражением [cos2 a sin а cos а sin а cos а sin2 а J Является ли эта матрица унитарной?
154 Глава 4 4.13. Покажите, что второй момент 72 интенсивности излучения не равен четвертому моменту | uto |4 действительной ампли- туды этой волны; эта разница обусловлена действием упо- мянутой ниже фильтрующей операции (и изменением мас- штаба в 2 раза), которые подразумеваются в определении интенсивности. ЛИТЕРАТУРА 4.1. Glauber R. J. Photon statistics. — In: Laser Handbook, Vol. 1, eds. F. T. Arecchi, E. O. Schulz-Dubois. — Amsterdam: North-Holland Publi- shing Company, 1972. 4.2. Silver S. — J. Opt. Soc. Am. 1962, v. 52, p. 131. 4.3. Born M., Wolf E. Principles of optics. — N. Y.: McMillan Company, 1964. [Имеется перевод: Борн AL, Вольф Э. Основы оптики —М.: Наука, 1973, с. 720.] 4.4. Goodman J. W. Introduction to Fourier optics. — N. Y.: McGraw-Hill Book Company, 1968. [Имеется перевод: Гудмен Дж. Введение в фурье-оптн- ку. — М.: Мир, 1970.] 4.5. Klein М. V. Optics. — N. Y.: John-Wiley and Sons, 1970. 4.6. Jones R. C. — J. Opt. Soc. Am., 1941, v. 31, p. 488; 194!, v. 31. p. 500; 1942, v. 32. p. 486; ! 947, v. 37, p. ! 07; 1947, v 37. p. 110; ! 948, v. 38. p. 671. 4.7. Wolf E. — Nuovo Cimento, 1959, v. 13, p. 1165. 4.8. Wiener N. — J. Math. Phys. (MIT), 1927—1928, v. 7, p. 109. 4.9. Murdoch D. C. Linear algebra for undergraduates. — N. Y.: John Wiley and Sons, 1957. 4.10. Parrent G. B., Roman P.— Nuovo Cimento, 1960, v. !5. p. 370. 4.11. O'Neill E. L. Introduction to statistical optics. — N. Y.: Addison-Wesley, Reading, MA, 1963. [Имеется перевод: О'Нейл Э. Введение в статисти- ческую оптику. — М.: Мир, 1966.] 4.12. Bracewell R. М. The Fourier transform and its applications. — N. Y.: McGraw-Hill Book Company, 1965. 4.13. Armstrong J. A., Smith A. W. Experimental studies of intensity fluctua- tions in lasers. — In: Progress in Optics, Vo!. VI, ed. E. Wolf. — Amster- dam: North-Holland Publishing Company, 1967, p. 211—257. 4.14. Risken H. Statistical properties of laser light. — In: Progress in Optics, Vol. VIII, ed. E. Wolf. — Amsterdam: North-Holland Publishing Company, 1970, p. 239—294. 4.15. Allen L., Jones D. G. C. Mode locking in gas lasers. — In: Progress in Optics, Vol. IX, ed. E. Wolf. — Amsterdam: North-Holland Publishing Company, 197!, p. 181—233. 4.16. Hodara H. — IEEE Wescon Proceedings, paper 17.4, 1964. 4.17. Mandel L. — Phys. Rev., 1965, V. !38, p. B753. 4.18. Martienssen W., Spiller E. — Am. J. Phys. 1964, v. 32, p 919. ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 4.1д. Daino В., Spano P., Tamburrini M.t Piazzolla S. Phase noise and spectra! line shape in semiconductor lasers, IEEE J. Quant. Electron, 1983, Vol. QE-19, p. 266. 4.2д*. Ландау Л. Д., Лифшиц Е. М. Теория поля. — М.: Наука, 1973.
Глава 5 КОГЕРЕНТНОСТЬ ОПТИЧЕСКИХ ВОЛН Статистические свойства света весьма существенны, поскольку ими определяются результаты большинства оптических экспе- риментов. Но на практике во многих случаях удовлетворитель- ное описание эксперимента можно построить на основе далеко не полной статистической модели. Очень часто для предсказания результатов эксперимента оказывается достаточным знать лишь некоторые средние значения (моменты) второго порядка, назы- ваемые функциями когерентности. В данной главе мы сконцен- трируем внимание на свойствах таких средних второго порядка. Происхождение современного понятия когерентности можно проследить в научной литературе до конца XIX и начала XXсто- летия. В частности, заслуживающие внимания ранние резуль- таты были получены в работах Верде [5.1], фон Лауэ [5.2], Бе- река [5.3], Ван Циттерта [5.4], Цернике [5.5] и др. В более позднее время исследования большой важности были приведены в работах Хопкинса [5.6], Бланк-Лапьера и Дюмонте [5.7], а также Вольфа [5.8]. Этими несколькими ссылками, конечно, не исчерпываются важнейшие достижения в данной области, но интересующийся читатель может обратиться к двухтомному сбор- нику оригинальных статей с обширной библиографией, вышед- шему под редакцией Манделя и Вольфа [5.9]. Прежде чем переходить к подробному изложению, мы кратко остановимся на различии между двумя типами когерентности, а именно временной и пространственной когерентностями. При рассмотрении временной Когерентности мы интересуемся спо- собностью светового пучка интерферировать с запаздывающим (но не смещенным в пространстве) вариантом этого пучка. На- зовем такое разделение светового луча делением амплитуды. Когда же речь идет о пространственной когерентности, мы ин- тересуемся способностью светового пучка интерферировать со смещенным в пространстве (но не задержанным во времени) вариантом этого пучка. Назовем такой тип разделения света делением волнового фронта. Ясно, что возможен и более общий случай как временного, так и пространственного смещения
156 Глава 5 пучков, что приводит нас к понятию функции взаимной когерент- ности. Тип когерентности, необходимый в каждом конкретном случае, зависит от характера того конкретного эксперимента, который мы пытаемся описать аналитически. Подробнее об этом будет сказано в последующих параграфах. Изложение большей части материала, рассматриваемого здесь, читатель может найти в работах [5.10—5.14]. § 1. Временная когерентность Пусть u(Р, 0—комплексное скалярное представление оптиче- ского сигнала в пространственной точке Р в момент времени t, С функцией u(P, t) связана комплексная огибающая А(Р, t). Так как и(Р, 0 имеет конечную ширину полосы Av, амплитуда и фаза огибающей А(Р, 0 должны изменяться со скоростью, определяемой Av. Если нас интересует конечный временной ин- тервал т, то величина А(Р,0 должна, очевидно, оставаться относительно постоянной величиной в течение этого интервала т, если т 1/Av. Другими словами, временные функции А(Р, 0 и А(Р, / + т) являются сильно коррелированными, т. е. коге- рентными, если т намного меньше «времени когерентности» Тс ~ 1/Av. Более точное определение и более полное раскрытие содер- жания понятия временной когерентности возможно при рассмо- трении интерференции световых волн в интерферометре, предло- женном впервые Майкельсоном [5.15]. А. Интерферометр Майкельсона Рассмотрим интерферометр, показанный на рис. 5.1. Свет точеч- ного источника S коллимируется (т. е. преобразуется в парал- лельный пучок) линзой L\ и падает на светоделительное (полу- прозрачное) зеркало BS. Часть падающего света отражается и направляется на подвижное зеркало Этот свет отражается от зеркала Mi, снова падает на светоделительное зеркало, и часть его снова пропускается на этот раз по направлению к линзе L2, которая фокусирует лучи на фотоприемнике D, Одновременно часть первоначального светового пучка источ- ника S пропускается светоделительным зеркалом, проходит че- рез компенсирующую пластинку С, падает на неподвижное зеркало М2, отражается от него и снова проходит через компенси- рующую пластинку. Часть этого света отражается от светодели- тельного зеркала и, наконец, фокусируется на фотоприемнике D линзой Л2. Таким образом, интенсивность света, падающего на
Когерентность оптических волн 157 фотоприемник, определяется интерференцией световых пучков, пришедших из двух плеч интерферометра. Компенсатор С нужен для того, чтобы свет в обоих плечах интерферометра проходил одинаковые расстояния в стекле, т. е. чтобы оба пучка претерпевали одинаковую дисперсию на пути от источника до фотоприемника. Если зеркало Mi сместить из положения, при котором оба плеча интерферометра имеют одинаковую оптическую длину Рис. 5.1. Интерферометр Майкельсо- на. S — точечный источник, Ц и L2 — лннзы, Mi и М2— зеркала, BS — све- тоделитель, С — компенсатор, D — фотоприемник. Рис. 5.2. Интенсивность света, падаю- щего на фотоприемник Р, в зависи- мости от нормированного смещения зеркала /i/Л, где X — средняя длина волны. Огибающая интерферограммы проведена штриховой линией. пути, то один из двух интерферирующих пучков приобретет ка- кое-то время задержки относительно другого. При непрерыв- ном движении зеркала свет, падающий на фотоприемник, пере- ходит от состояния конструктивной интерференции (увеличение полной амплитуды) к состоянию деструктивной (уменьшение полной амплитуды) и снова к конструктивной интерференции после каждого смещения зеркала на величину X/2 (X — оптиче- ская разность хода), соответствующую расстоянию между свет- лыми интерференционными полосами. На эту быструю осцилля- цию интенсивности накладывается модуляция с постепенно сужающейся огибающей интерференционной структуры, обуслов- ленная конечной шириной полосы источника и постепенной де- корреляцией комплексной огибающей амплитуды световой волны
158 Глава 5 по мере увеличения оптической разности хода. Типичная кар- тина интерференции показана на рис. 5.2, где представлена за- висимость интенсивности света от смещения зеркала относи- тельно положения, соответствующего одинаковым оптическим длинам путей. Такая кривая зависимости интенсивности от опти- ческой разности хода называется интерферограммой. Показанную общую форму интерферограммы можно очень просто объяснить с физической точки зрения. Протяженный спектр источника будем рассматривать как составленный из большого числа монохроматических компонент. Каждая такая компонента дает строго монохроматический вклад в интерферо- грамму, но с периодом, зависящим от ее конкретной оптической частоты. При нулевой оптической разности хода (h — 0) все та- кие компоненты складываются в фазе, создавая большой цен- тральный пик на интерферограмме. Когда же зеркало смещает- ся из положения, соответствующего нулевой задержке, каждая монохроматическая компонента интерференционной структуры испытывает фазовый сдвиг, который зависит от ее конкретной временной частоты. Результатом являются частично деструктив- ное сложение элементарных интерференционных структур и вы- текающее из этого уменьшение глубины полос на интерферо- грамме. Когда относительная задержка становится достаточно большой, сумма элементарных интерференционных структур оказывается почти полностью деструктивной и интерферограмма выходит на свой постоянный средний уровень. Из сказанного выше явствует, что уменьшение глубины по- лос на интерферограмме можно объяснить двумя эквивалент- ными способами: либо «расфазировкой» элементарных интер- ференционных структур, либо потерей корреляции из-за конечной оптической разности хода. Роль автокорреляционной функ- ции светового излучения станет более ясной при последующем простом анализе. Б. Математическое описание эксперимента Отклик фотоприемника D определяется интенсивностью опти- ческой волны, падающей на его поверхность. Практически во всех приложениях, использующих подлинно тепловое излучение, можно считать, что фотоприемник производит усреднение за бес- конечно длительный промежуток времени. (Эффекты, связанные с усреднением по конечному промежутку времени, которые мо- гут быть существенными в случае квазитеплового излучения, рассматриваются в гл. 6, § 2.) Учитывая, что луч в плече с дви- жущимся зеркалом приобретает относительную временную за- держку 2h/c, интенсивность света, падающего на фотоприемник,
Когерентность оптических волн 159 может быть записана в виде Id (Л) = (| Х.и (0 + Х2и (/ + -^) |2) , (5.1.1) где /G и К2— действительные числа, определяемые потерями в обоих плечах, а и(^)—аналитическое сигнальное представле- ние света, испускаемого источником. Раскрыв это выражение, находим ID (Л) = О U (0 |2> + “ (' + -?-) f) + + Х,Х2 (и (, + ^-) и- (0) + ХЛ2 (и- + У- ) и (о) (5.1.2) Таким образом, становится очевидной важная роль автокорре- ляционной функции светового поля, определяющей распределе- ние наблюдаемой интенсивности. Поскольку усреднение по времени в формуле (5.1.2) играет фундаментальную роль, для соответствующих средних вводятся особые символы. В частности, мы введем обозначения /о А < I и (О I2) = (| и 0 + Т") |2) ' (5,1,3) Г(т) = <и(/ + т)и-(0>. (5.1.4) Функция Г(т), т. е. автокорреляционная функция аналитиче- ского сигнала и(0, называется функцией собственной когерент- ности оптического сигнала. Пользуясь такими сокращенными обозначениями, запишем для регистрируемой фотоприемником интенсивности выражение = (*? + KSI, + К,К,Г (-^) + К,К,Г (-^) = = (К; + Л|)/0 + 2К,КгКе{г(-7-)}- <5J-5) Во многих случаях удобнее работать с приведенным (норми- рованным) вариантом функции собственной когерентности, а не с самой функцией собственной когерентности. Заметив, что /о = Г(0), мы приведем величину Г(т) к этому значению и по- лучим нормированную величину ^т»=Ж’ (5Д-6) которая называется комплексной степенью когерентности света. Отметим для дальнейшего ее важные свойства: Y(0)=I, |Y(T)|< 1 (5.1.7)
160 Глава 5 [ср. с формулой (3.4.5)]. Интенсивность на фотоприемнике, вы- раженная через эту величину, имеет вид (5.1.8) Чтобы получить аналитическое выражение, которое непосред- ственно описывало бы интерферограмму типа показанной на рис. 5.2, представим комплексную степень когерентности в сле- дующей общей форме: у (т) = у СО ехр {— j [2nvT — а (т)]}, (5.1.9) где у(т) = |у(т) |, v — центральная частота света и а(т)А arg{v(r)} + 2nvr. Используя это выражение, предполагая оди- наковыми потери в обоих плечах интерферометра (Ki = /G = К) и замечая, что v/c = 1/Х, можно записать выражение для интер- ферограммы в виде ID (Л) = 2К210 { 1 + у (-у-) cos [2 л (-р) - а (-у-)] } . (5.1.10) Выражение (5.1.10) может быть теперь сопоставлено с рис. 5.2, на котором представлена типичная интерферограмма. В окре- стности нулевой оптической разности хода (h ж 0) мы, согласно формуле (5.17), имеем y(2h/c)zz 1 и a(2/i/c)^0. Таким обра- зом, вблизи начала координат интерферограмма представляет собой полностью модулированную косинусоиду с интенсив- ностью, колеблющейся в пределах от 4№/0 до нуля относи- тельно среднего уровня 2/<2/о. С увеличением оптической раз- ности хода h амплитуда модуляции y(2h/c) падает от единицы до нуля и, кроме того, интерференционная структура может под- вергаться фазовой модуляции а(2А/с), обусловленной формой спектра света. Для глубины интерференционных полос, наблюдаемых в ок- рестности произвольной оптической разности хода Л, имеется количественная характеристика — видность интерференционных полос, впервые введенная Майкельсоном. Видность синусоидаль- ной картины полос определяется как /маке^Лпш (5.1.11) /макс “Г * мин где /макс и /мин — интенсивности в максимуме и минимуме интер- ференционной структуры. При малых смещениях зеркала h, если потери в обоих плечах одинаковы, интерферограмма (5.1.10), как нетрудно убедиться, должна иметь видность ^(Л) = Н(^)|=У(^)- (5-1.12)
Когерентность оптических волн 161 Читатель может легко показать, что в случае неравных потерь видность равна = )• (5.1.13) При сильном увеличении оптической разности хода 2h вид- ность полос убывает и говорят, что относительная когерентность двух лучей уменьшается. Если видность упала почти до нуля, мы говорим, что оптическая разность хода превысила длину ко- герентности света или, иначе, что относительное время задержки стало больше времени когерентности. Теперь ясно, что понятие временной когерентности связано со способностью двух световых лучей, обладающих относитель- ной задержкой, создавать интерференционную картину. Заме- тим, что во всех предыдущих определениях усреднение произво- дится по времени. Если же рассматриваемые случайные про- цессы являются эргодическими, то вместо этого можно произ- водить усреднение по ансамблю. Кроме того, в ряде случаев приходится, имея дело с неэргодическимп волновыми полями, проводить только усреднение по ансамблю (гл. 7, § 5, п. Б). В следующем пункте мы более детально исследуем связь между интерферограммой и спектральной плотностью мощности све- тового луча. В. Связь между интерферограммой и спектральной плотностью мощности светового пучка Как мы видели, форма интерферограммы, возникающей в интер- ферометре Майкельсона, определяется собственной функцией когерентности Г(т), или, иначе, комплексной степенью когерент- ности у(т) света, испускаемого источником. Дополнительно к этому нам известно (гл. 3, § 4), что для стационарного случай- ного процесса существует прямая связь между этими функциями корреляции и спектральной плотностью мощности источника. В частности, из формулы (3.8.34) мы имеем Г (т) = J (v) e-t'2™ dv, (5.1.14) о где ^(r’r>(v) — спектральная плотность мощности действительно- значного оптического сигнала u^(t). Другими словами, мы мо- жем выразить комплексную степень когерентности у(т) через
162 Глава 5 H(v): 4^(r’ r> (у) e~i2mv dv 4^r,r>(y)dy 0 oo J ^(v)e-^dv, (5.1.15) о где & (v) — нормированная спектральная плотность мощности: ff(f- r) (V) со j r) (v) dy о при v > 0, (5.1.16) W = в других случаях. Заметим, что нормированная спектральная плотность мощности имеет единичную площадь: оо J §(v)dv=l. (5.1.17) о Зная соотношение между у(т) и (v) [формула (5.1.15)], можно легко предсказывать форму интерферограммы при раз- ной форме спектральной плотности мощности света. Рассмот- рим несколько конкретных примеров. В случае газоразрядной лампы низкого давления форма спектра мощности отдельной ли- нии определяется прежде всего доплеровскими сдвигами фазы света, испускаемого движущимися излучателями, которые ис- пытывают редкие столкновения. В этом случае, как известно, спектральная линия имеет приблизительно гауссовскую форму [5.16]: _ g(v)~ 2^;-ехрГ-(2 71п2 (5.1.18) ул Av L \ Av J J где нормировка выбрана так, чтобы выполнялось равенство (5.1.17), a Av — ширина полосы на половине высоты. Такой спектр показан на рис. 5.3, а. Выполнив простое обратное пре- образование Фурье, мы получим соответствующую комплексную степень когерентности: V (т) = ехр [ — (у^=у)2] ехР (— /2лут). (5.1.19) Заметим, что фаза а(т) в этом случае равна нулю и, следова- тельно, интерферограмма состоит из полос с постоянной фазой, но с видностью, уменьшающейся пропорционально модулю ве-
Когерентность оптических волн 163 личины у(т): (5.1.20) как показано на рис. 5.3,6. В случае газоразрядной спектральной линии опре- деляется в основном от- носительной частотой столкновений излучаю- щих атомов или молекул. Можно показать, что в этом случае спектральная линия имеет лоренцев- скую форму [5.16]: ^(v)« 2 (л Av) 1 (5.1.21) где v — центральная ча- стота линии, a Av — ши- рина полосы на половине высоты (см. рис. 5.3, а). Легко показать, что соот- ветствующая комплекс- ная степень когерентности имеет вид Y(r) = ехр[—л Av|т |] X Рис. 5.3. а — нормированная спектральная плотность мощности 3 (v); б — огибающая у(т) комплексной степени когерентности. 1 — прямоугольная форма линий; 2 — гаус- совская форма линий; 3 — лоренцевская форма линий. Хехр [—/2лут]. (5.1.22) В этом случае интерфе- рограмма, наблюдаемая в интерферометре Майкель- сона, тоже состоит из полос с постоянной фазой, но с огибаю- щей, убывающей по закону у(т) = ехр[ — itAv | т | ]. (5.1.23) Эта огибающая показана на рис. 5.3,6, где по оси абсцисс откладывается параметр Avr. Иногда в теоретических вычислениях для удобства прини- мают прямоугольную форму спектральной плотности: ^(v)=-^rect (5.1.24)
164 Глава 5 Простое преобразование Фурье показывает, что соответствую- щая комплексная степень когерентности имеет вид Y (т) = sine (Avt) ехр (— /2nvx), (5.1.25) где sine х .A sin лх/лх. В этом случае огибающая интерферен- ционной картины такова: у (т) = | sine Avt I, (5.1.26) а фазовая функция а(т) не равна нулю при всех т. Точнее а(т) испытывает скачки между Ойл радиан при переходе от ле- пестка к лепестку функции sine: ( 0 при 2п < | Avt | < 2п + 1, а(т) = < п I 1 I A I n I п n = 0, 1, 2, . . .. (л при 2и + 1 < | Avt | < 2и + 2, (5.1.27) Графики спектральной плотности мощности $(у) и огибающей у(т) показаны на рис. 5.3. Во всех приведенных примерах интерферограммы являются четными функциями разности хода Л. Это — универсальное свой- ство таких интерферограмм: не имеет значения, какой из двух лучей отстает относительно другого. Дополнительно заметим, что во всех примерах комплексная степень когерентности имеет вид функции ехр(—/2л^т) с дей- ствительным коэффициентом. Это — следствие нашего выбора формы линий в виде четных функций переменной (v — v) (т. е. линий, симметричных относительно v). В более общем случае асимметричного профиля линии мы получим величину у(т) в виде произведения ехр(—/2л^т) на некоторую комплексную функцию. Таким образом, фазовая функция а(т) может прини- мать и значения, отличные от 0 и л. Во многих приложениях необходимо точное и четкое опреде- ление «времени когерентности». Такое определение может быть основано на понятии комплексной степени когерентности, но воз- можны разные варианты определения (см. [5.17], гл. 8, где обсуждаются различные возможные способы измерения «ши- рины» такой функции, как у(т)). Тем не менее в последующем мы будем чаще всего исходить из одного определения, которое представляется наиболее естественным. Именно, следуя Ман- делю [5.18], мы определим время когерентности тс сигнала и (О как оо ГС А $ lv(T)|2dr. (5.1.28) -оо Чтобы такое определение имело смысл, величина тс должна быть одного порядка с 1/Av. В том, что это условие выполняет-
Когерентность оптических волн 165 ся, можно убедиться, подставив выражения (5.1.19), (5.1.22) и (5.1.25) в формулу (5.1.28) и выполнив в каждом случае тре- буемое интегрирование. Получим следующие результаты: V2 !п 2 1 0,664 „ < — -----= - д--- Гауссовская форма линии, = ~Av.. Лоренцевская форма линии, (5.1.29) tc=I/Av Прямоугольная форма линии. Таким образом, порядок величины тс действительно согласуется с нашей оценкой, и поэтому в дальнейшем мы будем исходить из определения (5.1.28). (См. задачу 5.2, где вычисляются ти- пичные значения тс для некоторых конкретных источников.) Г. Фурье-спектроскопия Мы видели, что форму интерферограммы, наблюдаемой в интер- ферометре Майкельсона, можно полностью определить, если известна спектральная плотность мощности света. Такая тесная связь между интерферограммой и спектром мощности может быть использована в практических целях. А именно, зарегистри- ровав интерферограмму, можно найти спектральную плотность мощности падающего света. На этом принципе основана важ- ная область оптики, называемая фурье-спектроскопией (см. об- зорные работы [5.19, 5.20]). Процедура получения спектра света методом фурье-спектро- скопии в общем состоит в следующем. Сначала регистрируют интерферограмму. Для этого перемещают подвижное зеркало, обычно под интерферометрическим контролем, из положения с нулевой оптической разностью хода в область больших значе- ний оптической разности хода. При этом измеряют интенсив- ность света как функцию времени, а получающуюся интерфе- рограмму преобразуют в цифровую форму. Преобразование Фурье, выполняемое в цифровой форме (обычно методом «бы- строго преобразования Фурье»), дает искомый спектр. Типичная интерферограмма представлена на рис. 5.4, а на рис. 5.5 пока- зана спектральная плотность мощности, полученная из этой ин- терферограммы. Фурье-спектроскопия дает ряд преимуществ перед более пря- мыми методами (например, перед методом дифракционной спек- троскопии), существенных в некоторых случаях. Во-первых, это преимущество большей светосилы (геометрического фактора1)), на котором мы здесь не задерживаемся [5.19]. Большой интерес 1) В оригинале throughput. Преимущество в геометрическом факторе иначе называют выигрышем Жакино [5.3д]. — Прим, перев.
166 Глава 5 для нас представляет показанное впервые Фелджетом [5.22] преимущество более высокого отношения сигнала к шуму в по- лученном спектре. Это преимущество фурье-спектроскоппя дает, когда основной вид шума — аддитивный шум фотоприемника. Но такого преимущества нет, если шум определяется флуктуа- циями числа фотонов. В силу сказанного фурье-спектроскопия представленная в двух разных мас- штабах по горизонтальной оси [5.35]. По вертикальной осн отложена на- блюдаемая интенсивность, а по гори- зонтальной — оптическая разность хо- да. Максимальная оптическая раз- ность хода равна 0,125 см. 4000 3Z00 Z400 1600 800 Волновое число, Рис. 5.5. Фурье-образ интерферограм- мы рис. 5.4, т. е. спектр источника [5.35]. По вертикальной оси отложена спектральная плотность мощности, а по горизонтальной — оптическое вол- новое число 2л/Л (см-1). Разрешение равно 8 см-1. находит довольно широкое применение в инфракрасной области спектра, где она часто позволяет работать без охлаждения фо- топриемника. § 2. Пространственная когерентность Рассматривая вопрос о временной когерентности, мы заметили, что спектр всякого реального источника характеризуется конеч- ной шириной полосы; поэтому при достаточно большом времени задержки т аналитические сигналы u(P, t) и и(Р,/ + т) оказы- ваются некоррелированными. Чтобы можно было говорить о вре- менной когерентности, мы принимали, что источник, испускаю- щий излучение, является идеально точечным. На практике же лю- бой реальный источник имеет конечные размеры, и эти размеры нужно принимать в расчет. Это приводит нас к понятию про- странственной когерентности. Теперь мы рассматриваем два аналитических сигнала u (Pi,/) и и(Рг,/), наблюдаемые в двух
Когерентность оптических волн 167 точках пространства Pj и Р2 с нулевым (в идеальном случае) относительным временем задержки. Если Р\ — Р2, то оба сиг- нала, очевидно, полностью коррелированы. Если же точки Р{ и Р2 разнесены, то, вообще говоря, возможна та или иная потеря корреляции. Соответственно этому мы говорим, что волна, ис- пускаемая источником, имеет ограниченную пространственную когерентность. Все изложенное можно лучше усвоить, рассмот- рев интерференцию света в классическом «опыте Юнга» [5.23]. А. Опыт Юнга Рассмотрим схему эксперимента, представленную на рис. 5.6. Протяженный источник S освещает непрозрачный экран, в кото- ром в точках Pi и Р2 проколоты два очень малых отверстия. На некотором расстоянии за экраном с отверстиями помещен вто- рой экран, на котором можно наблюдать картину интерферен- ции света, проходящего через два отверстия. Лучи света, проходящие через отверстия, достигают экрана наблюдения, приобретая временные задержки п/с п г2/'с. Если разность задержек (г2— п)/с намного меньше времени коге- рентности Тс света источника, то на экране наблюдения должны возникать интерференционные полосы с глубиной модуляции (видностью), зависящей от степени корреляции между свето- выми волнами, падающими на отверстия. Таким образом, вид- ность наблюдаемых полос должна сильно зависеть от взаимной корреляционной функции <u(Pi, t + r)u* (Р2, 0>. Как и в случае интерферометра Майкельсона, существует другая, эквивалентная точка зрения, став на которую мы мо- жем лучше понять характер наблюдаемых полос.' Если свет приблизительно монохроматический и исходит из одного точеч- ного источника, то на экране наблюдения видны синусоидальные интерференционные полосы высокого контраста. Если затем до- бавить второй точечный источник с той же длиной волны, что и первый, но излучающий независимо, то образуется вторая картина полос. Период этой интерференционной структуры та- кой же, что и у первой, но положение нулевой оптической раз- ности хода сдвинуто относительно соответствующего положения первой структуры (рис. 5.7). Если расстояние между отверстиями мало, то интерферен- ционные полосы оказываются очень широкими, а сдвиг одной полосы относительно другой составляет пренебрежимо малую часть периода. Если же расстояние между отверстиями велико, то расстояние между полосами мало и полосы сдвинуты на зна- чительную часть периода (может быть, даже на много перио- дов). Обе интерференционные картины могут тогда частично га- сить друг друга, и при этом видность уменьшается. Если источ-
168 Глава 5 Рис. 5.6. Интерференционный опыт Юнга, Рис. 5.7. Уменьшение видности интерференционных г.олос с увеличением рас- стояния между отверстиями. д--при малом расстоянии между отверстиями; б — при большом расстоянии между отверстиями.
Когерентность оптических волн 169 ник представляет собой протяженный набор многих независимых излучателей, то деструктивная интерференция (гашение полос) может привести при больших расстояниях между отверстиями почти к полной потере видности. Это показано на рис. 5.7,6. Чтобы подвести под все сказанное более прочную основу и выявить те предположения, которые могут быть скрыты в наших качественных рассуждениях, проведем простой математический анализ опыта Юнга. Б. Математическое описание опыта Юнга Попробуем теперь вычислить интенсивность света, приходящего в точку Q на рис. 5.6. Как и ранее, примем, что время усредне- ния практически бесконечно (это условие выполняется в случае истинно теплового излучения). Искомая интенсивность опреде- ляется выражением /(Q) = <u*(Q, Ou(Q, ф. (5.2.1) Нам нужно детализировать форму функции u(Q, t). Лучше всего это сделать, выразив ее через аналитические сигналы и(Рь 0 и и(Рг, 0, достигающие отверстий Pj и Рг. В этом месте обычно делается предположение, что функцию u(Q, t) можно представить в виде взвешенной суперпозиции функций u(Pi, f) и и(Рг, 0 с соответствующим запаздыванием у каждой: u (Q, t) = KiU (pb t - -J-) + K2u (р2, t - -^), (5.2.2) где Ki и К2 — постоянные (возможно, комплексные). С учетом сказанного в гл. 4, § 1, п. В становится ясным, что такое выра- жение действительно можно написать при условии, что световой сигнал является узкополосным, а отверстия не слишком велики. В частности, на основании формулы (4.1.12) напишем И ^dSt, К2« U ^ds2, (5.2.3) J J /Ли _ J J /ЛГ2 Отверстие Отверстие Pi Р2 где Qi, 02, r\ и г2 — величины, указанные на рис. 5.6. (Случай широкополосного света рассматривается в задаче 5.4.) В выра- жениях (5.2.3) неявно предполагается, что отверстия малы и поле падающего света в пределах отверстий не изменяется. В случае круглых отверстий диаметром 6 и источника с макси- мальным линейным размером D данное предположение допу- стимо, если (5.2.4)
170 Глава 5 где z — расстояние (по нормали) от источника до экрана с от- верстиями. На основании формул (5.2.2) и (5.2.1) легко показать, что интенсивность света в точке Q имеет вид /(Q) = l К, |2(|u (р„ |2) + | К2|2<|и (р2, /--Cl)|2) + + K1K2(u(pl> Z_-£L)u-(p2, t --?-)) + + к;к2(и’(р„ t—£-)u(p2> /--?-))• (5.2.5) Из соображений удобства мы снова введем специальные обо- значения для величин, имеющих важное практическое значение. В случае стационарного оптического источника введем обозна- чения AI К. I2(|u (Р„ <-4г)Г)- ,\ ( гП,2\ (5-2.6) /(2>(Q)AIK2|2(|u(p2, для интенсивностей света, приходящего в точку Q от отверстий Р\ и Р2 в отдельности. Чтобы учесть интерференционный эффект, введем обозначение Г12(т) Д<и(Рь / + т)и*(Р2, 0) (5.2.7) для взаимной корреляционной функции света, достигающего от- верстий Pj и Р2. Эта функция, впервые введенная Вольфом [5.8], называется функцией взаимной когерентности света, она играет фундаментальную роль в теории частичной когерентности. Пользуясь новыми обозначениями, интенсивность света в точке Q можно теперь записать в более компактной форме: / (Q) = Р» (Q) + /(2) (Q) + К1КТ12 (-^1) + к:к2г21 ). (5.2.8) Но, как нетрудно показать, для Г|2(т) выполняется равенство Г21 (— т) = Г;2 (т). Далее, из того что Ki и Кг — чисто мнимые числа [формула (5.2.3)], следует равенство К1К2 = К*К2 = К1К2, где K = |Ki| и К2 =|К2|. Таким образом, выражение для ин- тенсивности в точке Q принимает вид / (Q) = Л» (Q) + /<2> (Q) + :К,К2Г12 (Ы) + ККгГЪ (-^-) . или, что эквивалентно, I (Q) = /’ (Q) + /2(Q) + Re {Г 12 )} . (5.2.9)
Когерентность оптических волн 171 Дальнейшее упрощение возможно, если ввести нормировку функции когерентности так же, как это было сделано в случае интерферометра Майкельсона. В силу неравенства Шварца имеем I Г12(т) |<| Г„ (0)Г22(0) |1/2, (5.2.10) где Гц(т) и Г22(т) — функции собственной когерентности падаю- щего света в отверстиях и Р2. Заметим, что величины Ги(0) и Г22(0) — это интенсивности света, падающего на два отверстия. Неравенство (5.2.10) позволяет нам определить нормированную функцию взаимной когерентности в форме V.2 СО А-----—пу; (5.2.11) ' — [Г,, (0)Г22(0)]1-'2 эта величина называется комплексной степенью когерентности. [Строго говоря, величину y*i2(t) следовало бы, пожалуй, на- звать комплексной степенью взаимной когерентности, а вели- чину у(т) из § 1 — комплексной степенью собственной когерент- ности, но такое различие обычно не очень существенно.] Из не- равенства (5.2.10), как легко видеть, следует, что 0<| Y12(t) |< 1. Далее, замечая, что /<»(Q) = ^ri|(0), /<2>(Q)=X2r22(0), мы можем сразу же переписать выражение (5.2.9) для /(Q) в более удобной форме / (Q) = /<» (Q) + (Q) + 2 V/<»(Q)/(2>(Q)Re {vi2 (^)} • (5-2.14) Чтобы дальше продвинуться в исследовании интерференцион- ной картины, заметим, что комплексная степень когерентности, которая является нормированной взаимной корреляционной функцией двух случайных процессов с центральной частотой v, может быть всегда записана в виде V12 СО = V12 ("0 ехр {— / [2лут — а12 (т)]}. (5.2.15) Подставив это выражение в формулу (5.2.14), найдем / (Q) = /<'>(Q)+/<2>(Q) + + 2 V/<»(Q)/(2)(Q) Y|2 (-^р) cos [2nv - a12 (£5l£l)] • (5.2.16) Хотя мы еще не в состоянии указать точную форму интер- ферограммы, мы уже можем сказать, какова должна быть ее общая форма. Первые два члена в выражении (5.2.16) — это интенсивности, соответствующие каждому отверстию в отдель- (5.2.12) (5.2.13)
172 Глава 5 ности. В случае отверстий конечного размера величины и /(2)(Q) будут изменяться в плоскости наблюдения в соот- ветствии с картиной дифракции на малых отверстиях, но в рас- сматриваемом случае мы принимаем, что отверстия малы и эти интенсивности постоянны в пределах области наблюдения. На этот постоянный уровень интенсивности налагается система ин- терференционных полос, период которой определяется частотой v и другими геометрическими факторами, а амплитуда и фаза которой медленно изменяются. В области нулевой оптической разности хода (г2— п = 0) интерференционные полосы имеют классическую видность r~ ^<°>- <5-2Л7> Поскольку величина yi2(0) представляет собой коэффициент взаимной корреляции рассматриваемых сигналов и (Л, t) и и(Р2, 0, мы заключаем, что yi2(0) (или F, когда /(1) = /(2)) есть мера когерентности двух оптических колебаний. Следова- тельно, заданием зависимости величины yi2(0) от расстояния между точками Pi и Р2 мы характеризуем пространственную когерентность света, проходящего через экран с отверстиями. Заметим, что рассмотренная выше при анализе общая форма интерферограммы в опыте Юнга определяется эффектами как пространственной, так и временной когерентности. При нулевой оптической разности хода огибающая интерферограммы указы- вает на эффект пространственной когерентности, а в ее посте-1 пенном убывании до нуля (сужении интерферограммы) при больших оптических разностях хода находит выражение эффект временной когерентности. Позднее мы разделим эти два эф- фекта, но сначала нам нужно учесть геометрические соображе- ния, которые позволят нам в большей степени конкретизировать форму интерферограммы. В. Некоторые геометрические соображения Чтобы выяснить более де- тальную форму интерфе- рограммы, необходимо связать разность задер- Рнс. 5.8. Геометрия интерференционного опыта Юнга. жек (г2 — Ci)/с с различными геометрическими факторами, в том числе с расстоянием между отверстиями, с расстоянием до пло- скости наблюдения и с координатами точки наблюдения Q. Такое соотношение можно найти, рассмотрев рис. 5.8. Пусть
Когерентность оптических волн 173 отверстие имеет поперечные координаты (gi,T|i), а отверстие Р2 — поперечные координаты (g, т}2) в плоскости непрозрачного экрана. Экран в плоскости наблюдения предполагается располо- женным параллельно непрозрачному экрану с отверстиями на расстоянии г2 от него. Координаты точки наблюдения Q на экране наблюдения обозначим через (х, у). Расстояния Г1 и г2 даются выражениями Г, = V21 + & - х)2 + (П1 - У)2 > Г2 = л/22 + & - Х)2 + (п2 - У}2 • (5.2.18) Чтобы получить простой результат, мы воспользуемся обычным параксиальным приближением, приемлемым в случае, когда от- верстия и точка наблюдения находятся близко к оптической оси. В частности, мы предположим, что выполняются условия г2 > д/?2 + П2- z2 » д/х2 + у2, z2 » дД2 + п2, В таком приближении получаем (5.2.19) и аналогично (1.-х)2 , (i).-y)2 z2 22 г2 г2 , I (ё,-х)« 22 + 2z2 hi — у)2 2z2 (5.2.20) (Лг — У)2 2z2 Тогда оптическая разность хода принимает вид Г г ~ - *)2 + (П2 -У)2-(^-х)2-(11- ~^)2 г2 _ Г|-------------------------------------- или, что эквивалентно, ~ КМ + « - И + Ч?) + 2 (£, - У * + 2 (Ч, - Ч2) 4 (5.2.23) Г2 ~ 22 + 2z2 (5.2.21) (5.2.22) Наконец, введем обозначения для расстояний от отверстий до оптической оси и —Si, АпАПг — П1 (5.2.24) (5.2.25) для расстояний между двумя отверстиями в направлении коор- динатных осей | и т|. Тогда оптическая разность хода запишется в виде г2— Г1 ~ 2zT [р2 ~ Р2 — 2 ~ 2 Д|1Л • (5.2.26)
174 Глава 5 Вернувшись к общему выражению (5.2.16) для распределе- ния интенсивности в плоскости наблюдения, мы можем теперь, пользуясь выражением (5.2.26), установить детальную интерфе- ренционную картину в плоскости (х,у). Обращаясь к рис. 5.9, а, Рис. 5.9. Геометрические свойства интерференционных полос. который соответствует случаю, когда величина cti2 постоянна, найдем, что светлые и темные интерференционные полосы должны располагаться перпендикулярно прямой, соединяющей точки Pj и Р2 с пространственным периодом L = ~, (5.2.27) где Z = c/v и d = V(A£)2 + (Ал)2 — расстояние между двумя от- верстиями. 'На рис. 5.9,6 показан типичный профиль интенсивности по- лос вдоль оси х', проходящей через точки Pj и Р2, вычисленный
Когерентность оптических волн 175 в предположении, что и /(2)(Q) постоянны в рассматри- ваемой области, а а12 и л(р2 —p2)/Xz2 тождественно равны нулю. Отметим некоторые особенности этой интерферограммы. Оги- бающая интерферограммы центрирована в точке, которая соот- ветствует нулевой относительной оптической разности хода и ко- торая принята за начало отсчета по оси х'. Период структуры дается формулой (5.2.27), а полуширина интерференционного «пакета» вдоль оси х' составляет V “ (5.2.28) Полное число полос под сужающейся огибающей равно (5.2.29) L Av 7 Из изложенного выше ясно, что вид интерференционной кар- тины в опыте Юнга зависит от эффектов как пространственной, так и временной когерентности. Поскольку же мы хотим сосре- доточиться в данный момент на эффектах пространственной ко- герентности, необходимо наложить дальнейшие ограничения на свойства света, которые сделают эффекты временной когерент- ности пренебрежимыми. Г. Интерференция квазимонохроматического света Чтобы можно было представить поле падающего света в точке наблюдения Q в виде простой суперпозиции полей (с соответ- ствующей задержкой) на отверстиях, нам пришлось принять, что световой сигнал является узкополосным. Теперь мы добавим еще одно предположение. А именно, предположим, что длина ко- герентности света намного больше максимальной оптической разности хода, возникающей при прохождении света от источ- ника до рассматриваемой области интерференции. В качестве математической формулировки мы потребуем, чтобы для всех точек источника и всех точек рассматриваемой области наблю- дения выполнялись условия Av v, (гг + гг)-(г| + г1) (5.2.30) где для различных расстояний приняты обозначения, показан- ные на рис. 5.6. Говорят, что такой свет удовлетворяет усло- виям квазимонохроматичности. Сделанное выше второе предположение гарантирует, что кон- траст интерференционной картины будет постоянным в преде- лах рассматриваемой области наблюдения. Данное предположе-
176 Глава 5 ние позволяет сильно упростить форму функции взаимной коге- рентности и комплексной степени когерентности. Эти величины могут быть теперь записаны в виде rl2(T)«Jl2e-^, Vi2(T)«gl2e-/2JlV\ (5.2.31) где величина J,2 А Г|2(0) = <и(Рь /)u*(P2, 0) = <A(Pb 0A-(P2. 0) (5.2.32) есть так называемая взаимная интенсивность света в отверстиях Pi и Р2, а величина |112ДТ12(0) =----------77Г (5.2.33) есть так называемый комплексный коэффициент когерентности света. Величину J12 можно рассматривать как фазорную ампли- туду пространственной синусоидальной интерференционной структуры, а Ц12 — это просто приведенная (нормированная) ве- личина J12, лежащая в пределах 0 < | ц121 < 1. (5.2.34) Заметим, что в определении (5.2.32) и дальнейшем неявно пред- полагалось, что выполняются сразу два условия (г2 — т^/с <С тс и (jz — r'^/c <С тс; это несколько более жесткие условия, чем неравенства (5.2.30). Вид интерференционной картины можно конкретизировать^ подставив выражения (5.2.31) в формулы (5.2.9) и (5.2.14). В предположении о выполнении параксиальных условий [раз- ность г2 — Г1 определяется выражением (5.2.26)] и о малости отверстий [/(1)(Q)=/(1), /(2)(Q) =/(2), интенсивности Л1) и /(2) являются постоянными] интерферограмму в плоскости (х, у) можно представить в виде /(х, ^ = /(1>_|_/(2>_|_2К1К2У12С08Г-^-(Д^4-Дт1!/) + <Р121. (5.2.35) или I (х, у) = /<" + 1& + 2 V7<W И12 cos Г-р- №х + Дт^) + ф121, (5.2.36) ГДе /,2 = | J|2 I, Ц|2 = | Ц12 | и <P12 = arg{JI2}(Р2- Р2) = а12(0) - ^Чр2- р2). (5.2.37) Л<2 Л<2 При условии квазимонохроматичности света и при условии, что и /(2) — постоянные, наблюдаемая интерференционная картина имеет постоянную видность и постоянную фазу в пре-
Когерентность оптических волн 177 Рис. 5.10. Картины интерференционных полос, полученные при различных значениях комплексного коэффициента когерентности (/(2) == делах области наблюдения. Видность У3 может быть выражена через модуль комплексного коэффициента когерентности ц12 сле- дующим образом: Г 2a//W2> т = /<» 4- /(2> И12 При 1 ° /<2)’ (5.2.38) . Ц12 при /(О=/(2)в Если Ц12 = 0, то интерференционные полосы исчезают; в этом случае говорят, что две световые волны взаимно некогерентны. Если же Ц12 = 1, то две волны полностью коррелированы; такие две волны называются взаимно когерентными. При промежу- точных значениях ц12 две волны являются частично когерент- ными. На рис. 5.10 показаны интерферограммы, получающиеся при разных значениях gi2 и ф12 и в предположении, что /(1) = /(2>. Отметим, что положение полос, соответствующее значению Ф12 = 0, произвольно, но, будучи выбрано однажды, оно должно оставаться одним и тем же для всех интерферограмм.
178 Глава 5 Таблица 5J. Названия и определения различных характеристик когерентности Символ Определение Название Временная или пространственная когерентность Г„(т) (U (Р„ t + Т) и’ (Р„ /)> [Заметим, что Функция собствен- ной когерентности Временная Г„(0) = /(?,)] Vii (*) Г„(т) Ги (0) Комплексная сте- пень (собственной) когерентности » Г12(т) (и (Pitt + r)u'(P2,t)) Функция взаимной когерентности Пространственная и временная V12(0 Г.2(Т) Комплексная сте- То же [Г,, (0) Г22 (О)]1'2 пень когерентности J12 (и(Р„ /) и’ (Р2, /))=Г,2(0) Взаимная интен- сивность Пространственная квазнмоиохроматн- ческая Hl2 J|2 — Комплексный коэф- То же фициент когерент- ности В этом и предыдущих пунктах параграфа был введен целыц ряд новых величин. Сводка названий и определений дана в табл. 5.1. Д. Влияние конечных размеров отверстий Выше предполагалось, что отверстия в интерференционном опыте Юнга малы и центральные зоны их дифракционных кар- тин полностью перекрывают всю область наблюдения. Поэтому при условии квазимонохроматичности света возникает интерфе- рограмма с постоянной амплитудой максимумов, налагающаяся на плавно меняющийся уровень интенсивности, который можно считать постоянным в рассматриваемой области. Недостатком столь малых отверстий является, конечно, то, что к плоскости наблюдения приходит мало света; поэтому нам нужно выяснить, к чему приведет увеличение размеров отверстий. Предполагая отверстия еще достаточно малыми для того, чтобы в плоскости наблюдения возникала картина фраунгофе- ровской (но не френелевской) дифракции, мы можем легко найти распределение интенсивности, создаваемой каждым от- верстием. В случае круглых отверстий диаметром 6 интенсив-
Когерентность оптических волн 179 и /(2>(Q), создаваемые каждым из отверстий по выражаются следующим образом через функции ности /<l)(Q) отдельности, Эйри [5.24]: где Si и z2— расстояния, показанные на рис. 5.11, а, величина А = л(6/2)2 есть площадь отверстия, a I (Pi) и / (Р2)— интенсив- ности света, падающего на отверстия. Предполагается, что ис- точник достаточно мал и эта дифракционная картина не «сма- зывается». Это условие выражается неравенством Kz 1 “Т" (5.2.40) где D — максимальный линейный размер источника. v На рис. 5.11,6 показаны перекрывающиеся дифракционные картины, о которых идет речь. Каждая картина имеет ширину 2,44Xz2/6, отсчитываемую между первыми нулями, а центры картин разделены расстоянием d' = zi + z.2dt (5.2.41) где d — расстояние между отверстиями. Таким образом, почти полное перекрывание двух дифракционных картин должно на- блюдаться при 2,44X2*2 j j-x 2,44Л2?12?2 /г d«—— или rf<<(^+W <5-2-42) Если же отверстия слишком далеки друг от друга, то интен- сивности и /(2> (Q) не будут одинаковы даже при ЦР{) = = ЦР2). Кроме того, видность полос не будет постоянна и модулю комплексного коэффициента когерент- коэффициент |ni2 можно вычислить по измерен- зарегистрированной дифрактограмме, пользуясь не будет равна НОСТИ |Hi2. Хотя ной видности и формулой /<>«?)+ /<2>(Q) у 2 V/(“(Q)/(2*((2) (5.2.43)
180 Глава 5 Плоскость наблюдения Рис. 5.11. а — геометрия эксперимента; б — частично перекрывающиеся ди- фракционные картины. Экран с малыми отверстиями Плоскость наблюдения а Рнс. 5.12. Оптическая система для интерференционного опыта. данный поправочный множитель зависит от того, в какой части интерферограммы измерялась видность, а кроме того, он изме- няется при изменении расстояния между отверстиями. Эти трудности отпадают, если интерференционные измере- ния проводить с несколько иной оптической системой (рис. 5.12). В этом случае источник помещается в передней фокальной пло-
Когерентность оптических волн 181 скости собирающей линзы, экран наблюдения — в задней фо- кальной плоскости второй линзы, а экран с отверстиями — ме- жду линзами. В случае круглых отверстий диаметром б, рав- ных интенсивностей ЦРг) = = /(Р2)=1 и квазимоно- хроматического света интер- ферограмма имеет вид Xcos[^(Agx + Any) + a12j |. (5.2.44) Заметим, ЧТО такая опти- рис 533. Фотография интерференци- ческая система обеспечивает онной картины [5.36]. не только полное перекры- вание двух дифракционных картин, но и сокращение фазового множителя (лД/) — р2). На рис. 5.13 представлена фотогра- фия интерференционной картины, полученной при помощи такой системы. Здесь видность полос одинакова во всех точках интер- ференционной картины. § 3. Взаимная спектральная чистота Многие задачи теории когерентности упрощаются, если комп- лексная степень когерентности рассматриваемого излучения мо- жет быть представлена в виде произведения компоненты, зави- сящей только от пространственных координат, и компоненты, зависящей только от временной задержки. Такая функция коге- рентности называется приводимой. Это условие, как мы увидим, эквивалентно некоторому условию в спектральном представле- нии, называемому условием взаимной спектральной чистоты. Данное понятие было введено Манделем [5.25]. Для большей ясности мы сначала (п. А) рассмотрим общую задачу: какова форма полной спектральной плотности мощности при наложе- нии двух разных световых пучков с одинаковой нормированной
182 Глава 5 спектральной плотностью мощностью ^(v)? Затем мы перейдем к понятию взаимной спектральной чистоты и условиям, при ко- торых она возможна (п. Б). В п. В мы приведем пример све- тового пучка, который не удовлетворяет требованию взаимной спектральной чистоты. А. Спектр мощности суперпозиции двух световых пучков Рассмотрим два узкополосных, статистически стационарных све- товых пучка, представляемых аналитическими сигналами u (Рь t) и и(Р2, 0- Эти волны могут рассматриваться как идущие от двух отверстий в точках А и Р2 в интерференционном опыте Юнга. Обе волны налагаются друг на друга, приобретя за- держки Ti и Тг, в результате чего возникает световая волна u(Q, /)=К1и(Р1, t — + K2u (Р2, t — т2) (5.3.1) в фиксированной точке Q. Предположим, что спектральные плотности мощности волн Ui(0 и и2(0 одинаковы. Математически это означает, что должны быть равны их нормированные спектры мощности [фор- мула (5.1.16)]: A(v) = ^2(v) Д f(v). (5.3.2) Наша цель — найти соотношение между нормированным спек- тром в точке Q и нормированными спектрами двух налагаю- щихся пучков. Рассмотрим сначала функцию (собственной) когерентности света в точке Q. Имеем rQ(T) = <u(Q, / + t)u*(Q, 0> = = /С1Г11 (Т) + ^Г22 (т) + (т2 — Т1 + т) + + /СЛ2Г21 (Ti — т2 + Т), (5.3.3) где ^ = |^|, К2 = \К2\ и Г;/(т) = <и.(^ + т)и;(/)). (5.3.4) Вспомнив, что Г21 (т) — Г*2 (— т), мы можем записать (т) в виде (т) = АГп (т) /с|Г22 (т) + /С1/С2Г12 (т2 — Т1 + т) + + ^2П2(Т2-Т1 + Т). (5.3.5) Нормируя полученное выражение на rQ(0) и замечая, что, по- скольку нормированные спектры обоих пучков одинаковы, их комплексные степени собственной когерентности тоже должны быть одинаковыми, получаем для комплексной степени когерент-
Когерентность оптических волн 183 ности в точке Q выражение ( х _ Vn(T) + 4Re {у12(Т2-г,+т)} Yq( ' 1 +ЛКе{у12(т2-т1)} ’ (5l3,b) где А — постоянная, которая определяется следующим образом: <5'3-7> Если перейти к спектральному представлению, то преобразова- ние Фурье функции (5.3.6) дает для нормированного спектра мощности в точке Q выражение & /ЧЛ (v) + А Re {^12 (V) exp [j2rtv (ti - т2)]} /е о fix (v) =--------1 + л Re{Yl2(r2-r,)}------' <5'3'8) Заметим, что знаменатель в выражении (5.3.6) не зависит от т и поэтому не изменяется при преобразовании Фурье. Кроме того, мы использовали здесь соотношение {Re {Vl2 (т)}} = {2у& о (т)} = Re {V12 (v)}. (5,3.9) [Нужно вспомнить формулу (3.8.37) и учесть, что величина V12 (v) сама является односторонним спектром аналитического сигнала.] Итак, формула (5.3.8) дает нам спектр комбинированного светового пучка в точке Q. Сравним этот спектр со спектром двух исходных световых пучков. Б. Взаимная спектральная чистота и приводимость Пользуясь формулой (5,3.8), мы можем теперь исследовать условия, при которых нормированный спектр Vq(v) суперпози- ции двух световых волн равен нормированному спектру V(v) компонент. Когда оба указанных спектра одинаковы, говорят, что свет взаимно спектрально чистый; этот термин заимствован из области генетики и означает, что два прародителя (исходные пучки, которые налагаются друг на друга) дают потомство (но- вый световой пучок), обладающее теми же свойствами, что и у прародителей, по крайней мере относительно формы рассмат- риваемой спектральной плотности мощности. Вычислим разность рассматриваемых спектров ф /vx_ Л Re {ff/j2 (v) е ;'2 Tt*v — Yu (т2 — Ti) (у)} /г о im ^q(v)-^(v)- 1 4- Л Re {Y12 {T2-T0J * (5.ЗЛО)
184 Глава 5 Чтобы эта разность была равна нулю при всех и Л2> и не зависела от тг — Ть должно выполняться условие V12 (v) - Y12 (т2 - Tj) 9 (v) = 0. (5.3.11) Это условие может быть выполнено, например, если свет в точ- ках и Р2 полностью некоррелирован при всех т2— Ть Тогда ^12(v) = 0, Yi2(t2-t1) = 0. (5.3.12) Но это слишком жесткое требование. Очевидно, что условие (5.3.11) не может выполняться в са- мом общем случае, поскольку первый член в левой части ра- венства неограниченно осциллирует при уменьшении (т2— Ti), а второй стремится к нулю. Поэтому нам нужно, по-видимому, на- ложить некоторые ограничения на разность задержек, чтобы добиться приближенного выполнения данного условия. Запишем разность задержек в виде т2 — Xi = т0 + Ат (5.3.13) и будем пока что считать величину то произвольной, а величину Ат намного меньшей 1 /Av, где Av — ширина полосы света. Бу- дет ли при таком ограничении выполняться требуемое равен- ство? Можно показать, что в малом интервале допускаемых зна- чений величины Ат выполняется соотношение Y12 (т0 + Ат) ~ V12 (то) ехр {— /2nv Ат}, (5.3.14) где v — центральная частота взаимного спектра V12(v). Дока- зательство этого утверждения таково. Нужно: 1) написать Y12 (т0 + Ат) = If 12 (v) dv; (5.3.15) о 2) положить v = v + 6v (— Av/2 < 6v < Av/2); 3) приближенно написать ехр {— /2ji6vAt} ~ 1. Все это дает формулу (5.3.14). Подставив это приближенное выражение для Yi2(to + At) в формулу (5.3.11), получим сле- дующее соотношение, которое должно выполняться, если мы хо- тим, чтобы нормированный спектр двух налагающихся световых пучков был равен нормированному спектру каждого из исход- ных пучков: V12 (V) = Vl2 (То) § (v). (5.3.16) Прежде чем продолжать, сделаем некоторые замечания. Чи- татель может спросить, может ли вообще выполняться равенство (5.3.16), левая часть которого осциллирует с частотой v из-за
Когерентность оптических волн 185 наличия экспоненциального множителя, а правая будет неосцил- дирующей при любой монотонной функции ^(v). Вообще говоря, это возражение справедливо, но оно может быть снято, если мы правильно выберем задержку то. В самом деле, если за- держки, приобретаемые светом на своем пути от источника до двух отверстий, различаются более чем на 1/Av, то взаимный спектр V12 (v) сам будет осциллирующим (см. далее). Но если разность задержек то, приобретаемых после прохождения от- верстий, выбрать так, чтобы компенсировать задержки, приобре- таемые светом на пути к отверстиям, то экспоненциальный мно- житель в правой части равенства (5.3.16) будет точно компен- сировать осцилляции самой функции V12(v). Поэтому, чтобы обеспечивалось равенство в соотношении (5.3.16), задержка то должна быть выбрана так, чтобы полные задержки от источ- ника до плоскости наблюдения были одинаковы. Иначе говоря, величину то следует выбрать так, чтобы была максимальна ве- личина Yi2(r0). Утверждение о том, что взаимная спектральная плотность V12(v) может быть сама осциллирующей, лучше всего проил- люстрировать на примере двух световых пучков в точках Pi и Ра, которые совершенно идентичны, но имеют относительную задержку т. Предположим, что один пучок приобрел опереже- ние на т/2, а второй — запаздывание на т/2. Оба пучка имеют один и тот же спектр мощности $^(v). Задержки во времени мо- гут быть учтены и в выражениях для передаточных функций в частотном представлении. Соответствующие - передаточные функции имеют вид Hj(v) = ехр|Д- /2nvу] (запаздывание на т/2), * (М.17) H2(v) = exp —/2jtvy (опережение на т/2). На основании выражения (3.5.8) для взаимной спектральной плотности двух линейно-отфильтрованных случайных процессов мы получим нормированную взаимную спектральную плотность V12 (v) = § (v) ехр {/2nvf}, (5.3.18) которая имеет осциллирующий множитель. Таким образом, мы видим, что если на пути до отверстий пучки приобретают отно- сительную задержку, то взаимная спектральная плотность све- тового поля будет иметь осциллирующий множитель и при над- лежащем выборе задержки т0 в формуле (5.3.16) этот осцил- лирующий множитель будет скомпенсирован,
186 Глава 5 Заметим, что, как нетрудно показать, суперпозиция двух идентичных световых лучей, имеющих лишь относительную за- держку т, приводит к новому нормированному спектру ^z(v) вида ^'(v) = 4^(v)[l + cos2nvr]. (5.3.19) Такой спектр представлен на рис. 5.14. Ясно, что, если за- держка т удовлетворяет условию f > 1/Av, новый спектр будет Рис. 5.14. Спектры мощности ^q(v) и 2/JF(v), обнаруживающие отклонение от взаимно спектральной чистоты. иметь интерференционную структуру и, следовательно, будет отличаться от перво- начальных спектров компо- нент. (Спектральные интер- ференционные структуры та- кого типа использовались Олфордом и Голдом [5,26] при измерении скорости све- та.) Чтобы достигнуть вза- имной спектральной чистоты света, нужно устранить та- кую спектральную интерфе- ренционную структуру пу- тем подходящего выбора ве- личины То- Выбрав должным обра- зом параметр задержки то и потребовав, чтобы параметр задержки Ат был намного меньше 1/Av, мы можем до- биться выполнения равен- ства (5.3.16). Рассмотрим форму этого равенства во временном, а не в частотном представлении. Обратное преобразование Фурье обеих частей этого равенства приводит к соотношению Vi2(t + t0) = Y12(t0)v(t). (5.3.20) О комплексной степени когерентности, удовлетворяющей та- кому равенству, говорят, что она приводима, и мы видим, что в пределах сделанных выше приближений и ограничений, при- водимость эквивалентна взаимной спектральной чистоте. Свой- ство приводимости комплексной степени когерентности и есть то свойство, которое мы намеревались исследовать. Точнее, мы хотели выяснить, при каких условиях комплексная степень коге- рентности может быть представлена в виде произведения про- странственной и временной частей. Так как то — постоянная ве-
Когерентность оптических волн 187 личина, равенство (5.3.20) является именно тем свойством фак- торизации, которое мы искали. Коснемся вопроса о физическом смысле спектрального пред- ставления (5.3.16). Левую часть этого равенства можно рас- сматривать как функцию взаимной корреляции между спек- тральными компонентами в окрестности частоты v для каждого из двух пучков, имеющих относительную задержку т0. Тогда ра- венство означает, что эта функция взаимной корреляции про- порциональна величине У12(то). Множитель ^(v) —это просто нормировочный коэффициент, он характеризует относительную величину мощности, Соответствующую частоте v. Таким обра- зом, равенство (5.3.15) имеет следующий смысл: для того чтобы два пучка были взаимно спектрально чистыми, все частотные компоненты одного пучка должны иметь одинаковую нормиро- ванную функцию взаимной корреляции с соответствующими ча- стотными компонентами другого пучка. Поскольку задержка то выбрана так, чтобы величина у12(то) была максимальной, ясно, что условия квазимонохроматичности выполняются, и мы можем переписать соотношение приводи- мости (5.3.20), используя комплексный коэффициент когерент- ности Ц12: Vi2(t + t0) = gl2v(T). (5.3.21) Факторизация комплексной степени когерентности приводит к значительным упрощениям во многих задачах, в которых важ- ную роль играет как временная, так и пространственная коге- рентность. Такая факторизация возможна, если свет является взаимно спектрально чистым. Нередко предположение о взаим- ной спектральной чистоте принимается просто без всякого обос- нования, только потому, что оно приводит к упрощению. Но такое предположение не всегда соответствует действительности. Например, в случае источника, спектр излучения которого зави- сит от угла, свет не обладает взаимной спектральной чистотой. Такого рода источник рассматривается в п. В. В. Лазерный свет, рассеиваемый движущимся рассеивателем Примером света, не являющегося взаимно спектрально чистым, может служить свет, проходящий через движущийся рассеива- тель (скажем, матовое стекло), на который падает идеальный лазерный свет. Геометрия эксперимента показана на рис. 5.15. Лазер непрерывного действия создает плоскую волну почти монохроматического света. Рассеиватель движется с постоян- ной скоростью v в вертикальном направлении. В непосредствен- ной близости к рассеивателю расположен непрозрачный экран
188 Глава 5 с двумя малыми отверстиями и Р2, что дает возможность проводить интерференционный опыт Юнга со светом, прошед- шим через рассеиватель. Наша цель — установить, можно ли комплексную степень когерентности yi2(x) света, проходящего Рис. 5.15. Измерение функции взаимной когерентности света, прошедшего через движущийся рассеиватель. через движущийся рассеиватель, представить в виде произве- дения ¥12Ц) = И12¥('г), (5.3.22) т. е. определить, обладает ли прошедший свет взаимной спек- тральной чистотой. Рассеиватель можно характеризовать амплитудным коэффи- циентом пропускания tA(x,y). Для простоты предположим, что отверстия расположены на вертикальной оси у, и поэтому зави- симость tx от х отсутствует1). При единичной интенсивности нормально падающей плоской волны рассеиватель создает опти- ческое поле с амплитудным распределением и (г/; О = U {у — v^)exp(— /2jiv/), (5.3.23) где v — частота падающего лазерного света. Если рассматриваемые отверстия расположены в точках с координатами у^ и г/2, то интересующая нас функция взаимной когерентности имеет вид Г12 (т) = г (У1> У» т) = (У1 ~vt- vr) Гл (у2 - е-'2яЧ (5.3.24) Пренебрегая малым поглощением в рассеивателе, получаем <1Ь(*/ - vt) |2>= 1, (5.3.25) откуда Г(г/!, у2, т) = у(г/1( у2\ т). 9 Здесь неявно предполагается, что отверстия намного меньше деталей тонкой структуры функции U.
Когерентность оптических волн 189 Статистические флуктуации прошедших световых полей обу- словлены статистической структурой рассеивателя. (Детальная пространственная структура рассеивателя заранее не известна.) Сделаем представляющееся разумным предположение о том, что случайный процесс tx(r/) является пространственно эргоди- ческим (а следовательно, и пространственно стационарным) по переменной у и имеет автокорреляционную функцию Ъ (Az/) А ЩТ+ЖЗД- (5.3.26) Мы можем выразить через нее комплексную степень когерент- ности т) прошедшего светового поля: Y(*/i, Уъ т) = ъ(Ду — ит)е~/2я*т, (5.3.27) где Ау = у\—у% есть расстояние между отверстиями. Такая комплексная степень когерентности, вообще говоря, не может быть представлена в виде произведения пространственного и временного коэффициентов, как это требуется для взаимной спектральной чистоты. Например, если корреляционная функция у* (Л#) рассеивателя имеет гауссовскую форму Vt (At/) = exp [— a (At/)2], (5.3.28) то, как нетрудно показать, комплексная степень когерентности принимает вид у(г/ь Уъ т) = e~a(A^2e~a(v^'e2avx Ауе^/2^х. (5.3.29) В качестве интересного упражнения читателю предлагается доказать (задача 5.8), что если лазерное излучение проходит через два близко расположенных рассеивателя, движущиеся в противоположных направлениях с равными скоростями, то прошедший свет является взаимно спектрально чистым, коль скоро функция корреляции \t(Ay) имеет гауссовскую форму. § 4. Распространение взаимной когерентности Детальная структура оптической волны изменяется при распро- странении волны в пространстве. Изменяется и детальная струк- тура функции взаимной когерентности, и в этом смысле гово- рят о распространении функции взаимной когерентности. В обоих случаях физическая причина распространения лежит в волновом уравнении, которому подчиняются сами световые волны. В дан- ном параграфе мы сначала выведем некоторые основные законы *) В силу пространственной эргодичности можно считать, что все про- странственные средние равны соответствующим средним по ансамблю.
190 Глава 5 распространения взаимной когерентности, а затем покажем, что функция взаимной когерентности подчиняется системе двух ска- лярных волновых уравнений. А. Решение, основанное на принципе Гюйгенса — Френеля Проще всего вывести законы распространения взаимной коге- рентности исходя из принципа Гюйгенса — Френеля (гл. 4, § 1). Зная, что таким уравнениям удовлетворяют комплексные поля, Рнс. 5.16. Геометрия про- цесса распространения вза- имной когерентности. Угол — это угол между отрез- ком PiQi н нормалью к по- верхности в точке 02 — соответствующий угол для отрезка P2Qs. можно легко вывести соответствующие соотношения для взаимной когерент- ности. Интересующая нас общая задача иллюстрируется схемой, представлен- ной на рис. 5.16. Световая волна с про- извольными свойствами когерентности распространяется слева направо. Зная функцию взаимной когерентности Г(РьР2;т) на поверхности 2Ь мы должны найти функцию взаимной ко- герентности r(Qi,Q2;x) на поверхно- сти S2. Иначе говоря, наша цель — предсказать результаты интерферен- ционного опыта Юнга на отверстиях Qi и Q2, если известны результаты интерференционных опытов Юнга на всевозможных отверстиях Pi и ?2. Мы будем рассматривать случаи узкополосного света (гл. 4, § 1, п. В). Результаты же, относящиеся к широкополосному свету, бу- дут приведены далее в данном параграфе. Начнем с того, что взаимная функция когерентности на поверхности по опреде- лению имеет вид г (Qb Q2; т) = (u (Q„ t + т) u* (Q2) 0>. (5.4.1) Значения полей на поверхности S2 могут быть выражены через значения полей на поверхности Si по формуле (4.1.12), спра- ведливой для узкополосного света. В частности, мы имеем u(Ql( / + т)= j JJ-u(p1( < + T-^)x(e1)dS1, u* (Q2, /) = ^ J (P2> t ~ у) X (62) dS2.
Когерентность оптических волн 191 Подставляя (5.4.2) в (5.4.1) и изменяя порядок выполнения опе- раций интегрирования и усреднения, находим 21 (Л)2Г1Г2 Xx(01)x(O2)rfS1dS2. (5.4.3) Среднее по времени в подынтегральном выражении может быть выражено через функцию взаимной когерентности на поверх- ности Si, что приводит к основному закону распространения взаимной когерентности (в предположении узкополосностн света): r(QbQ2; т)=И ПГ(Р„ Р2; r + j j \ С / Лг: Лг2 2i Xi (5.4.4) Читатель может легко показать (задача 5.9), исходя из фор- мулы (4.1.9), что в случае широкополосного света соответствую- щее соотношение имеет вид r(Qb Q2; t) = -J J J J^-r(pb P2; r + ^^)x 2i Si xdS2. (5.4.5) 2rtcri 2rtcr2 1 2 v Возвращаясь к случаю узкополосного света, вспомним те- перь второе условие квазимонохроматичности: оптическая раз- ность хода должна быть намного меньше длины когерентности света. Опираясь на это предположение, мы можем найти соот- ветствующие законы распространения света для взаимной ин- тенсивности. Если условия квазимонохроматичности выполняют- ся, то взаимную интенсивность на поверхности S2 мы найдем, заметив, что J(Qi, Q2) = r(Qb Q2; 0). (5.4.6) На основании формулы (5.4.4) при т = 0 и соотношения [фор- мула (5.2.31)] Г(РЬ Р2; -) = J(Pb Р2) ехр [-/-у-(г2 - И)] (5.4.7) получаем выражение J(Q>, Q2) = =И ИJРг)ехр Г- ' т-(Г2 _ ri)]dSi> dS* 2i 2а •” J АГ: ЛГг (5.4.8)
192 Глава 5 которое и будет основным законом распространения взаимной интенсивности. Распределение интенсивности на поверхности S2 можно легко найти, положив Qi->Q2 в формуле (5.4.8). Таким образом, /(« = $$ UJ(P„ Р2)ехр[-/^р1Шф1^„ dS,, J J J J L Л J лГ. ЛГп 2i Si 12 (5.4.9) где г', г'» и 02— величины, отличающиеся от гь r2, 01 и 02 на рис. 5.16 тем, что Qi и Q2 совмещены. Новая геометрия по- казана на рис. 5.17. Итак, мы нашли основные законы распространения взаимной когерентности и взаимной интенсивности. Подчеркнем, что, по- скольку они выведены из принципа Гюйгенса — Френеля, должны Рис. 5.17. К вычислению интенсивности на поверхности 2г. выполняться предположения, на которых основан этот принцип. В частности, расстояния и г2 (или г' и г') должны быть на- много больше длины волны; это условие выполняется во всех приложениях, рассматриваемых нами здесь. Б. Волновые уравнения, описывающие распространение взаимной когерентности Основные законы распространения взаимной когерентности были выведены из принципа Гюйгенса — Френеля, но интересно было бы исследовать задачу о ее распространении на более общей основе. В данном пункте мы начнем со скалярного волнового уравнения, описывающего распространение полей, и покажем, что функция взаимной когерентности удовлетворяет системе двух волновых уравнений (это впервые было установлено Воль- фом).
Когерентность оптических волн 193 В свободном пространстве действительный волновой сигнал и(г)(Р,0 удовлетворяет дифференциальному уравнению в ча- стных производных V2«U’(P, 0 = 0, (5.4.10) где V2 = д2/дх2 + д2/ду + д2/дг2 есть оператор Лапласа. Если обе части этого уравнения подвергнуть преобразованию Гиль- берта, то после изменения порядка действия операторов получим V2W(O(P( 0 = 0, (5.4.11) где 0 — преобразование Гильберта функции u(r)(P,f). Отсюда следует вывод, что как действительная, так и мнимая части аналитического сигнала u(P, t) подчиняются этому волно- вому уравнению и, следовательно, V2u(P, 0-4--&“(P> 0 = 0. (5.4.12) Но по определению функция взаимной когерентности дается выражением Г]2(т) = (u, (t -ф т) и’(0), где (/) А и (Рр 0 и и2(0Ди(Р2, /). Пусть оператор V2 определен в виде а точка Pt имеет координаты (хь уь zj. Подействовав опера- тором V2 на функцию Г12(т), получим V?ri2 (т) = V2 (u, (t + т) и; (/)> = <V2U1 (t + т) и; (0). (5.4.14) Но так как , (5.4.15) МЫ ВИДИМ) что1) viri2 w=& “«w)=(-г и: (о) - = Уфг(«,(' + т)и;т)- (5.4.16) Величина в угловых скобках (означающих усреднение по вре- мени)— это просто функция взаимной когерентности, а потому V2r|2(x)=-l-^-ri2(T). (5.4.17) *) При преобразовании правой части этого соотношения мы учли равен- ство ^Ц1(/ + т) д2Ц1(/ + т) д (/ -|- т)2 дт2 ’ которое легко доказать исходя из определения производной.
194 Глава 5 Аналогично можно подействовать на функцию Г12(т) опера- тором V2 = d2jdx2 + д2/ду2 + d-jdzl, что приводит ко второму уравнению 1 л2 V|ri2(T) = ^^ri2(r), (5.4.18) которому функция Г12(т) также должна удовлетворять. Следо- вательно, функция Г12(т) распространяется в соответствии с си- стемой двух волновых уравнений. Формулы, полученные в п. А, фактически представляют собой некоторые частные решения этой системы уравнений. Относительно ее точных общих реше- ний см. работу [5.10, разд. 10-7]. В качестве упражнения (задача 5.10) читателю предлагается убедиться в том, что взаимная интенсивность Jj2 распростра- няется в соответствии с системой двух уравнений Гельмгольца V1J12 + (&)2 J12 = 0, 9 - 9 (5.4.19) V2*I12+(&) J12 = 0, где & = 2л/Л. В. Распространение взаимной спектральной плотности В своем анализе мы опираемся (как и далее будем опираться) на законы распространения функции взаимной когерентности и взаимной интенсивности. Но те же самые задачи можно решать, рассматривая распространение взаимной спектральной плот- ности, т. е. фурье-образа функции взаимной когерентности. Здесь мы кратко остановимся на соотношении между такими реше- ниями и решениями, которые дает наш анализ. Согласно определению (3.5.5) взаимной спектральной плотно- сти, функция взаимной когерентности может быть представлена как фурье-оригинал функции взаимной спектральной плотности: г12 (т) = J V12 (v) e~/2Jtvx dv, (5.4.20) о где V12 — функция, равная нулю на отрицательных частотах. Зная уравнения распространения взаимной интенсивности [фор- мулы (5.4.17) и (5.4.18)], мы можем приложить их к выраже- нию (5.4.20) и найти соответствующие законы для взаимной спектральной плотности. Изменение порядка выполнения опера- ций дифференцирования и интегрирования позволяет записать
Когерентность оптических волн 195 новые уравнения в виде оо S № - 7F-S-] ^.2 (v) e~l2nvx dv = О, 1 2 (5.4.21) 5 № - 4--Я ^12 wе-/2яуг dv=°- О Так как эти уравнения должны выполняться при всех задерж- ках т и при любых взаимных спектральных плотностях, подын- тегральные выражения должны обращаться в нуль Вычисляя производные по т от экспоненциальных множителей, где только и содержится зависимость от этой переменной, получим систему двух уравнений Гельмгольца, которым должна удовлетворять взаимная спектральная плотность: V^12(v) + (-^)2VI2 (v) = 0, \ , (5.4.22) V^12(v)+(-^) V12(v) = 0. Значение этого результата станет ясным, если сравнить его с уравнениями (5.4.19), т. е. уравнениями Гельмгольца, кото- рым удовлетворяет взаимная интенсивность Ji2. Вспоминая, что к = 2т/с, мы видим, что взаимная спектральная плотность и взаимная интенсивность удовлетворяют одним и тем же урав- нениям Гельмгольца. Единственная разница состоит в том, что в уравнения (5.4,22) входит частота v, а в уравнения (5.4.19) должна входить центральная частота v. На этом основании мы делаем следующий общий вывод: Взаимные спектральные плотности подчиняются тем же законам распространения, что и взаимные интенсивности. Чтобы найти решение для взаимной спектральной плотно- сти, можно пользоваться соответствующими формулами для взаимной интенсивности, заменяя лишь параметр v парамет- ром у. При исследовании вопросов когерентности в частотном пред- ставлении на основе понятия взаимной спектральной плотности иногда полезно ввести еще одну характеристику когерентности, которая называется [5.27] комплексной степенью спектральной когерентности и определяется как g|2 (v) = ,.2-, (5.4.23) (v) (v)]1/2 где (v) и ^22(v)—спектральные плотности мощности света в точках Pi и Р2. Можно показать, что комплексная степень
196 Глава 5 спектральной когерентности удовлетворяет неравенству lMi2(v) I < 1. (5.4.24) Читателя, интересующегося доказательствами этих соотно- шений, отсылаем к работе [5.27]. Мы решили рассматривать в своем анализе взаимные интенсивности, а не взаимные спек- тральные плотности потому, что функции J12 непосредственно описывают амплитуду и фазу пространственной интерференцион- ной структуры, тогда как взаимная спектральная плотность не является прямой характеристикой такой структуры. § 5. Предельные формы функции взаимной когерентности В данном разделе мы рассмотрим некоторые предельные слу- чаи когерентности, которые могут служить полезными идеали- зациями при практических вычислениях. В частности, дадим определения когерентного и некогерентного волновых полей. А. Когерентное поле В рамках определений когерентности, уже введенных выше, можно утверждать, что оптические волновые формы, наблюдае- мые в точках Pi и Р2 с относительной временной задержкой т, являются полностью когерентными при условии I Yi2(t) |= 1. (5.5.1) Этим условием определяется полная когерентность для двух конкретных точек (Л, Р2) и конкретной временной задержки т, но нам хотелось бы найти более общее определение, которое позволило бы называть все волновое поле в целом полностью когерентным. В качестве одного из возможных определений можно на- звать следующее: волновое поле полностью когерентно, если I Vi2 (т) I = 1 Для всех (^ь Р2) и при всех т. (5.5.2) Но это очень жесткие условия, так как никакой реальный экс- перимент не охватывает сразу всех значений задержек т. Кроме того, как нетрудно показать, они выполняются только для монохроматических волн, что вынуждает нас искать менее же- сткие условия и более широко применимое определение. Менее жесткие определяющие условия были предложены Манделем и Вольфом [5.28]. Волновое поле называется пол- ностью когерентным, если для всякой пары точек (Л, Р2) суще- ствует задержка щг [функция точек (Л, Р2)], такая, что
Когерентность оптических волн 197 | Vi2(Ti2) | = 1* "В математической записи это требование имеет вид max | V12 (т) 1= 1 Для всякой пары (Ри Р2). (5.5.3) т Если поле является взаимно спектрально чистым, то, как не- трудно видеть, существует эквивалентное определение |ц12|=1 Для всякой пары (Рь Р2). (5.5.4) В определение полной когерентности можно внести больше ясности, если выразить условие |yi2 (лиг) |= 1 через комплексные огибающие двух волновых возмущений. На основании определе- ния комплексной степени когерентности имеем V12(Tp)| =----(5.5.5) Поскольку и(Р, /) = А(Р, (5.5.6) мы можем написать в эквивалентном виде I v /т \ I_____I f + Tiz) А* (Рг, 0) I (5 5 7) |V12(T12)I [<| А (Р„ t + т12)Р><| А (Р2, 0 12>Г/2 ‘ ( } Теперь воспользуемся неравенством Шварца | J f (/) g’ (/) dt | < [ J | f (/) |2d/ Jj g (t) |2 d/]‘/2, (5.5.8) которое справедливо co знаком равенства в том и только в том случае, если g(/) = kf(/), (5.5.9) где к — комплексная постоянная. На основании соотношений (5.5.8) и (5.5.9) из выражения (5.5.7) получим, что |yi2 (тиг) |= 1 в том и только в том случае, есл и А(Р2, /) = k12A(Pb ^ + т12), (5.5.10) где ki2—комплексная постоянная, которая, вообще говоря, за- висит от точек Pi и Р2. Сформулируем полученный выше результат: волновое поле называется полностью когерентным при том и только при том условии, что для всякой пары точек Pi и Р2 существует времен- ная задержка п2, такая, что комплексные огибающие двух сиг- налов с относительной задержкой п2 различаются только не за- висящим от времени постоянным комплексным множителем. Если на рассматриваемое волновое поле налагаются условия квазимонохроматичности, то ситуация несколько упрощается. В любом конкретном эксперименте речь может идти о некото- ром множестве различных расстояний между отверстиями. Если
198 Глава 5 мы требуем выполнения условий квазимонохроматичности, то мы подразумеваем, что они должны выполняться для всех пар отверстий, возможных в эксперименте. Это означает, что для всех точек (Pi, Р2) требуется одно и то же время задержки Т12, чтобы исключить эффекты временной когерентности. Кроме того, если отверстие Pi приближать к отверстию Р2, допуская тем са- мым пренебрежимо малые (и нулевые) расстояния между от- верстиями в нашем эксперименте, то нам станет ясно, что еди- ная задержка Т12, требуемая для максимизации величины | Г12 (т) |, должна быть тождественно равной нулю. В этом слу- чае комплексные огибающие в точках Pi и Р2, согласно формуле (5.5.10), связаны соотношением А(Р2, /) = к12А(Рь 0, (5.5.11) где ki2 снова зависит от положения конкретных точек (Рь Р2). Таким образом, комплексные огибающие во всех точках изме- няются «в унисон», различаясь только не зависящими от вре- мени амплитудами и фазовыми множителями. Полезную формулу для взаимной интенсивности, относящую- ся к случаю полностью когерентного квазимонохроматического света, можно получить, если выразить комплексные огибающие А(РЬ t) и А(Рг, 0 через комплексную огибающую А(Р0) t) в за- ранее выбранной точке отсчета Ро* Определим не зависящие от времени фазорные амплитуды A(Pi) и А(Рг) через комплекс- ную огибающую в точке Ро следующим образом: А<р" = АР П <5-5-12) А(Р2, /) = А(Р2) ( °’ ' 2 ’ ' [/(Ро)]1/2 Тогда взаимная интенсивность дается выражением Ji2 = (A(P1( /)А*(Р2> /)> = А(Р1)А*(Р2). (5.5.13) Можно также действовать иначе — записать комплексный коэф- фициент когерентности в виде Миг = ехр {/[ф (Pi) — ф (Р2)]}, (5.5.14) где q>(Pl) = arg{A(Pl)}> <p(P2) = arg{A(P2)}. (5.5.15) В случае полностью когерентного квазимонохроматического из- лучения интерференционная картина, возникающая в интерфе- ренционном опыте Юнга с каждой парой отверстий (Рь Р2), описывается выражением /(Q) = /(I»(Q) + /,2)(Q) + + 2 Vp»(q)/2(Q) cos Г2я(гГ" - + Ф (Л>) ~ Ф (Pi)l • LA J (5.5.16)
Когерентность оптических волн 199 Если интенсивность волны постоянна, то видность полос всегда равна единице, но фаза интерферограммы изменяется при изме- нении положения отверстий и Р2. Б. Некогерентное поле В случае полностью когерентного поля флуктуации комплекс- ных огибающих волн в точках Р{ и Р2 полностью коррелиро- ваны при условии, что введена соответствующая задержка т12. Понятию полностью когерентного поля противоположно понятие не когерентного поля. Поэтому было бы логично считать поле не- когерентным, если выполняется условие [Г12(т)[ = 0 для всех Рг =# Р2 и при всех т. (5.5.17) Но такое определение оказывается не имеющим реального смысла. В самом деле, подставим Г(Рь Р2\ т + (гг— fi)/c) в вы- ражение (5.4.4). Если его затем проинтегрировать сначала по поверхности то подынтегральное выражение во втором ин- теграле будет равно нулю всюду, кроме точек Р\ = Р2, где оно имеет конечное значение. Таким образом, второе интегрирование даст нуль, и мы получим Г (0и Q2; т) = 0. (5.5.18) Если положить т = 0 и Q2 = Qi, то из равенства (5.5.18) будет следовать: /(Qi) = /(Q2) = 0. Таким образом, если волновое поле на поверхности Si некогерентно по указанному выше определе- нию, то оно не достигнет поверхности S2! Физическая причина этого кажущегося нефизического ре- зультата состоит в явлении затухающей волны. Волновое поле, некогерентное в смысле определения (5.5.17), имеет бесконечно малую тонкую пространственную 'Структуру. Но пространствен- ная структура с масштабом, меньшим, чем длина волны, соот- ветствует нераспространяющнмся затухающим волнам (см., на- пример, [5.24]). Следовательно, полностью некогерентный по- верхностный источник не излучает. Если принять в расчет явление затухающей волны, то можно показать, что в случае распространяющейся волны когерент- ность должна существовать в пределах линейного размера, пре- вышающего по крайней мере длину волны. В случае квазимоно- хроматического света взаимная интенсивность, наилучшим обра- зом аппроксимирующая некогерентность, но соответствующая еще распространяющейся волне, дается выражением [5.11] j (р„ рг) - [2 ] - <5-5J9)
200 Глава 5 где Pi и Р2 — точки, лежащие в одной плоскости и имеющие координаты_(хь r/i)_ и (х2, r/2), Ji(x)—функция Бесселя первого порядка, а к = 2л/Х. Формула (5.5.19) слишком громоздка для практических вы- числений. Если волна с такой взаимной интенсивностью прохо- дит через оптическую систему, разрешение которой в плоскости (х, у) меньше X, то точный вид функции J (Pi, Р2) не имеет зна- чения. В этом случае для взаимной интенсивности, соответ- ствующей некогерентному полю, можно пользоваться прибли- женным выражением J (Л> Р2) = х7(Р|)д(х| — х2, У1—У2), (5.5.20) где 6(.,.)— двумерная дельта-функция Дирака. Постоянная х должна быть выбрана так, чтобы обеспечить равенство интегра- лов по объему от (5.5.20) и (5.5.19). Это значение таково: х = -^. (5.5.21) Если когерентность охватывает расстояния больше одной длины волны, но используемая оптическая система не может разрешить площадь когерентности, то представление функции J (Рь Р2) в виде 6-функции еще допустимо, хотя соответствую- щее значение величины х уже не равно Х2/л. Так как постоян- ная х в конечном счете влияет на уровень интенсивности, а не на пространственную структуру, ее для простоты часто заме- няют единицей. Но поскольку эта постоянная имеет размерность квадрата длины [формула (5.5.21)], то чтобы обеспечить согла- сованность размерностей, мы сохраним эту постоянную в даль- нейших математических выражениях. § 6. Теорема Ван Циттерта— Цернике Почти во всех задачах оптики, в которых не рассматривается лазерный свет, исходный источник света представляет собой протяженную совокупность независимых излучателей. Такой ис- точник можно с приемлемой точностью рассматривать как не- когерентный в смысле определения, данного в предыдущем параграфе, лишь при условии, что оптические элементы, через которые проходит свет, не способны разрешить отдельные излу- чающие элементы источника. Характер функции взаимной коге- рентности, создаваемой некогерентным источником, полностью описывается теоремой Ван Циттерта — Цернике, которая, не- сомненно, является одной из наиболее важных теорем совре- менной оптики. Как следует из названия, эта теорема впервые была доказана в работах Ван Циттерта [5.4] и Цернике [5.5].
Когерентность оптических волн 201 А. Математический вывод Ограничившись случаем квазимонохроматического света, мы показали выше, что взаимная интенсивность распространяется в соответствии с законом J(Q1, Q2)= Ц Ц J(P1, Р2)ехрГ-/^(г2-гЛ x(9z) dStdS2 L Л J Ar 1 ЛГ2 (5.6.1) независимо от начальной степени когерентности, характеризуе- мой функцией J(PbP2). В частном случае не когерентного источ- ника мы имеем далее [формула (5.5,20)] J(P1, Р2) = иЦР1)6{\Р1-Р2\). (5.6.2) Простая подстановка и «отсеивающие», или «избирательные», свойства 6-функции приводят к выражению для взаимной ин- тенсивности j (Qi, Q2) = И / (Л) ехр Г - /2я<у-Г|>1 dS> (%r J2J L Л J Г; гг (5.6.3) в которое входят геометрические величины, показанные на рис. 5.18. Рис. 5,18. К выводу теоремы Ван Циттерта — Цернике. Чтобы далее упростить это выражение, прибегнем к некото- рым предположениям и приближениям, а именно при’мем сле- дующее. 1. Размеры источника и области наблюдения намного мень- ше расстояния г, разделяющего их. Таким образом,
202 Глава 5 2. Рассматриваются только малые углы. Таким образом, X(0i)~X(92)~ 1. (5.6.5) Выражение для взаимной интенсивности в наблюдаемой области теперь принимает вид J (Qb Q2) = И1 (Р|) ехр Г- i - ri)lds- (5-6-6) (Лг)2 LX J Далее мы примем планарную геометрию, показанную на рис. 5.18, т. е. будем предполагать, что источник и область на- блюдения лежат в параллельных плоскостях, разделенных рас- стоянием z. Кроме того, В соответствии с предположениями (5.6.4) и (5.6.5) мы введем «параксиальное» приближение, в ко- тором г,= 'г = -Рг2 + (х, — s)s + (у, — ’1F “ г + 1,1 - + ~1>‘ . * Наконец, введем обозначения Ах = х2— Xi, &y = y2 — yi и бу- дем считать, что величина /(£, т]) равна нулю, если (£, т]) лежит вне конечной области источника S. Тогда окончательное выра- жение для теоремы Ван Циттерта — Цернике принимает вид j (*1, уу, х2, i/2) = -^-A j T])exp^/-^-(Axa + (5.6.8) Здесь фазовый множитель ф дается выражением = Xl(F+й) - К + й)] = К - й). <5-м> где р2 и pi — расстояния от точек (х2, у2) и (х^у{) до оптиче- ской оси. Часто для удобства эту теорему представляют в нормирован- ной форме, записывая комплексный коэффициент когерентности в виде Н-00 р (g, n)expp’-?|-(A.vg + Ayr])jdgdr] У1‘, х2, у2) — +“ - " J p(L n)rfUn (5.6.10) благодаря чему исключаются неудобные масштабные множи- тели. В большинстве практических задач с некогерентными ис-
Когерентность оптических волн 203 точниками с хорошим приближением выполняется равенство /(хь t/i) / (х2, у2), а потому величина | g(xi, уй х2, у2) | есть также и классическая видность интерференционной картины, которая возникла бы в опыте Юнга. Б. Значение теоремы и следствия из нее Теорема Ван Циттерта — Цернике, выраженная математически формулой (5.6.8), может быть сформулирована следующим об- разом: с точностью до множителя ехр(—/ф) и масштабных по- стоянных взаимную интенсивность J (xi, уг, х2, у2) можно найти, выполнив двумерное преобразование Фурье распределения ин- тенсивности по поверхности источника. Такое соотноше- ние можно сравнить с соотношением между распределением поля в пределах когерентно освещаемого отверстия и распреде- лением поля, наблюдаемым в картине дифракции Фраунгофера на этом отверстии, хотя имеются в виду совершенно разные фи- зические величины. В этой аналогии распределение интенсив- ности /(£, т]) аналогично распределению поля в отверстии, а взаимная интенсивность J (хь ух\ х2, у2) аналогична полю в кар- тине дифракции Фраунгофера. Соотношение (5.6.8) совпадает с соответствующей формулой для дифракции Фраунгофера. Под- черкнем, однако, что это лишь математическая аналогия, по- скольку физические ситуации, описываемые одними и теми же формулами, совершенно различны, как и входящие в них физи- ческие величины. Заметим далее, что в силу приближения (5.6.7) соотношение между величинами J (хь у^ х2, Уъ) и /(£, т]), имеющее форму преобразования Фурье, справедливо для более широкой области расстояний, чем аналогичная формула, опи- сывающая дифракцию Фраунгофера, так как параксиальное приближение допустимо не только в случае дифракции Фраун- гофера, но и в случае дифракции Френеля [5.24, гл. 4]. Замечая, что модуль комплексного коэффициента когерент- ности |ц| зависит только от разности координат (Ах, Az/) в пло- скости (х, z/), можно ввести понятие площади когерентности Ас света совершенно аналогично определению (5.1.28) времени когерентности тс. В нашем случае площадь когерентности опре- деляется выражением + оо ДСА |р.(Ах, \y)^d\xd\y. (5.6.11) — 00 Читатель может сам доказать (задача 5.15), что для некоге- рентного источника площадью произвольной формы с од- нородной яркостью площадь когерентности Ас на расстоянии г
204 Глава 5 от источника равна (5.6.12) где Qs — телесный угол, в котором виден источник со стороны области наблюдения. Возвращаясь к общему выражению (5.6.10) для ц, рас- смотрим условия, при которых множитель ехр(—/ф) может быть опущен в выражении для комплексного коэффициента ко- герентности. Поскольку Ф=-£-(р!-р?)’ (5.6.13) можно выделить три разных случая. 1. Если расстояние z настолько велико, что Z 2 [(р^— — Pi)/А]» то ф < л/2 и ехр (— /ф) ~ 1. 2. Если точки измерения Qi и Q2 находятся на одинаковом расстоянии от оптической оси (хотя расстояние между ними может быть любым по величине и направлению), то фаза ф тождественно равна.нулю. 3. Если отверстия лежат не на плоскости, а на сфере ра- диусом z с центром на источнике, то фаза ф равна нулю. В таких случаях фазовый множитель конечно, может быть опущен. В заключение напомним читателю, что математический ре- зультат, связывающий pi2 с распределением интенсивности ис- точника, можно качественно объяснить, рассмотрев простой опыт Юнга с протяженным источником. Как точечный источник дает систему интерференционных полос полной видности, так и каждая точка некогерентного источника будет давать отдель- ную систему интерференционных полос высокой видности. Если размеры источника очень велики, то такие элементарные ин- терференционные картины складываются, имея весьма разли- чающиеся пространственные фазы, и контраст всей интерфе- ренционной картины снижается. Математическое выражение теоремы Ван Циттерта— Цернике представляет собой просто точную запись этого соотношения между распределением ин- тенсивности в источнике и контрастом интерференционной кар- тины, возникающей при заданном расположении отверстий. В. Пример В качестве примера применения теоремы Ван Циттерта — Цер- нике вычислим комплексный коэффициент когерентносуи pi2 для света, испускаемого некогерентным квазимонохроматиче-
Когерентность оптических волн 205 скпм источником с однородной яркостью, имеющим вид круга радиусом а. Таким образом, распределение интенсивности ис- точника, по нашему предположению, имеет вид /(£, п) = Л) circ• п , (5.6.14) где circ сС ’Д < 1/2 при при при W < I, w= 1, W > 1. (5.6.15) 1 0 Чтобы найти Z(xb z/i; х2, z/2), мы должны выполнить преобра- зование Фурье этого распределения. Заметим, что [5.24] _Д . V^2 + п2 1 2 Л (2ла VУ>х + Vy ) fF < arc------------? = а2 —-— Y ... j—- (. а ) а -у у2% + Vy (5.6.16) где ..} — оператор двумерного преобразования Фурье: 4-00 (T{g(£, n)}Aj Jg(L X])el2n(^+^ d^dT], (5.6.17) — oo a / ^ (*)——функция Бесселя первого рода н первого порядка. Кроме того, в соответствии с масштабными коэффициентами в экспоненте формулы (5.6.8) мы должны подставить Дх Ду ’'=77- v' Т7- <5-6-18) В результате получим для взаимной интенсивности выражение •НХ1> У\1 х2> У2) ла2/0* е-/Ц) (Az)2 У, 7(Дх)2+ (Д!/) о V Az______________ V(Ax)2 + (Д)/У (5.6.19) а для соответствующего комплексного коэффициента когерент- ности — выражение И(*ь Уй х2, у2) = е~^ Л У(Дх)2 + (Д1/)2 2—> ___________ V(Л*)2 + (Л</)2 Az (5.6.20) Заметим, что первый множитель e~J'^ зависит и от (лд, z/i), и от (х2, z/2), а второй — только от расстояния между этими дву- мя точками s = V(^x)2+ (kyf* Таким образом, модуль |ц12| зависит только от Ах и Az/; эта зависимость показана на рис. 5.19. Первый нуль функции /1 (2лар) отвечает значению
206 Глава 5 р = 0,610|а|, а, следовательно, первый нуль модуля |gi2| имеет место при so = O,61O-^, (5.6.21) С учетом нашего приближения малых углов угловой диаметр 0 источника, наблюдаемого со стороны плоскости (х, z/), оказы- вается равным 0 « 2a|z|. Таким образом, расстояние, отве- 1 Л/2 I Рис. 5.19. Зависимость модуля комплексного коэффициента когерентности |gi2| от разностей координат Ах и At/ в плоскости (х, у). чающее первому нулю величины |pi2|, можно представить в виде s0= 1,22-j-. (5.6.22) Площадь когерентности света, испускаемого таким источ- ником, можно найти, пользуясь результатами задачи 5.15. Для некогерентного источника в форме круга радиусом а площадь когерентности на расстоянии г равна Учитывая, что в нашем анализе рассматриваются только ма- лые углы, для телесного угла, в котором виден источник с пло- скости (х, у), получаем (5.6.24) Итак, выражение для площади когерентности может быть пред- ставлено в виде (5.6.25) как это было принято ранее в формуле (5.6.12).
Когерентность оптических волн 207 Предположим, что точки (xi,^) и (х2, Уъ) соответствуют отверстиям в не- прозрачном экране и что на некотором расстоянии позади экрана наблюдает- ся интерференционная картина. Зная вид функции Ц12, мы можем предска- зать характер интерференционных по- лос, получаемых при любом возмож- ном расстоянии между отверстиями s. Предположим для простоты, что (хь z/i) и (х2, z/2) всегда одинаково удалены от оптической оси и, следо- вательно, ф = 0. Предсказываемая ин- терференционная картина, получаемая Интенсивность Расстояние Ин тепе и вность I при разных расстояниях между отвер- стиями, показана на рис. 5.20. Отме- тим увеличение пространственной ча- стоты полос с увеличением s, исчезно- вение контраста интерференционной структуры при расстоянии s, равном Sg, и обращение фазы структуры при Расстояние Интенсивность л расстояниях s, соответствующих пер- Расстояние вой отрицательной лопасти функции Бесселя. Фотографии интерференцион- ных структур, полученные при разных расстояниях между отверстиями, по- казаны на рис. 5.21, ограниченный размер интерференционных картин Рис. 5.20. Интерферограм- мы, создаваемые некогерент- ным источником в форме круга при разных расстоя- ниях между отверстиями st, $2> $3» $4- обусловлен конечной шириной дифракционных изображений ма- лых отверстий. Во всех наших рассуждениях предполагалось, что центр ис- точника круглой формы лежит на оптической оси. Если же источник смещен от этого положения на А£ и Ат] в плоскости (£, т]), то по теореме смещения фурье-анализа [5.24] новый комплексный коэффициент когерентности ц'2 можно следую- щим образом выразить через старый комплексный коэффициент когерентности gi2 (источник с центром на оси): К2 = Н12ехр [/^-(А^Ах +Д^Дг/)]. (5.6.26) Таким образом, модуль |gi2| комплексного коэффициента ко- герентности не зависит от смещения источника, но фаза интер- ференционных полос изменяется пропорционально прираще- ниям смещения источника (А£, Ат|) и расстоянию между отвер- стиями (Ах, Az/).
в
Рис. 5.21. Фотографии интерферен- ционных картин, полученных в слу- чае некогерентного источника в форме круга при разных расстояниях между отверстиями (5.36]. Расстояние между отверстиями возрастает при переходе от а к ж.
210 Глава 5 Г. Обобщенная теорема Ван Циттерта — Цернике *) При выводе теоремы Ван Циттерта—Цернике для представле- ния некогерентного источника использовалась 6-образная фор- ма функции взаимной интенсивности источника. Рассмотрим теперь более общую форму теоремы Ван Циттерта — Цернике, которая применима к ограниченному классу частично когерент- ных источников, включая некогерентный (в указанном выше смысле) источник как частный случай. Роль малой, но ненуле- вой площади когерентности источника будет ясна из этих ре- зультатов. Предполагается, что функция взаимной интенсивности ис- точника имеет вид J&, П.; Ъ, n2) = [/&, n.)/a2, n2)]1/2H(Ag, Ап)- (5.6.27) При записи в такой форме предполагается, что комплексный коэффициент когерентности ц зависит только от разности ко- ординат (А£, Ат|) в плоскости (£, rj). Это часто встречающийся на практике случай (см., например, гл. 7, § 2). Излучатель, имеющий взаимную интенсивность вида (5.6.27), называется квазиоднородным источником. В качестве следующего приближения мы примем, что источ- ник по своим размерам намного больше своей площади коге- рентности Ас и что любая пространственная структура в рас- пределении интенсивности источника является «грубой» по сравнению с Ас. Все это позволит нам воспользоваться для функции взаимной интенсивности источника приближенным вы- ражением J т; £2, П2)«/ (I п) и (Ag, Ап), (5.6.28) A£ = £2-U t = - J1+J2 0 ’ Ат] = П2 — П1, n- _ П1 + Пг 2 (5.6.29) 1) Данный результат в элементарной форме, излагаемой здесь, был впер- вые получен в работе [5.29]. Более изящный и более полный результат был найден в работе [5.30]. Обзор по данному вопросу (теория когерентности и радиометрия) см. в работе [5.31]. 2) Это эквивалентно следующему: = | - Ag/2, Ь = И Ag/2, t)i = — f| — А4/2, 42 = Ч 4- Дт|/2.
Когерентность оптических волн 211 Это приближенное выражение мы подставим в формулу 4-00 j (Х1, Ух, Х2> У2) = -^2- J S J J 7 ^1’ Яь Ъ, П2) X — 0О X exp j^— (r2 — Г.)] dTh dZ,2 di\2, (5.6.30) которая представляет собой общий закон распространения (5.4.8) для взаимной интенсивности, записанный в параксиаль- ном приближении. При таких условиях разность r2 — и прини- мает приближенную форму -r. “ 7г [ W + «D - И + й) + ® + ч?) - ® + Ч?) - - 2 (х2£2 + у2т\2) + 2 (х& + t/jTii)] = = [(х2 4- Х|) (х2 — х0 + (у2 + Ух) (у2 — Ух) + 4" (£2 4" £i) (£2 £i) 4“ (Лг 4" Л1) ("Пг Лi) — 2 (х2£2 — Х&) — 2 (у2т]2 — z/^i)]. (5.6.31) Теперь используем предыдущие определения для £, т}, Д£ и Дт| и дополнительно введем обозначения х = ---Ф-*2, Дх = х2 — X], ’ (5.6.32) У, + Уг А,, = и _ ,, У 2 * ^У У?- У^' В таких обозначениях выражение (5.6.31) принимает вид г2 — Г| ~ Y [хД X 4- у\ у 4- |Д£ 4- Г]Дп — — Д х| — хД£ — Дг/fj — уДт}]. (5.6.33) Теперь для удобства примем (об этом предположении будет подробнее сказано ниже), что г>4-ф-, г>4 П|П' (5.6.34) А А при всех Д£, Ат], £ и т|, представляющих интерес в эксперимен- те. Это предположение позволяет нам опустить третий и чет- вертый члены в формуле (5.6.33). Теперь, если подставить выра-
212 Глава 5 X ^н(Л£> Mexpp-g жения (5.6.33) и (5.6.28) в интеграл (5.6.30), то с учетом изме- нения переменных интегрирования мы получим J (*ь Ух, х2> у2) = 4-^- j $ /(i, П)ехр р-g (Д х| + Д ух\)j 4 dr\ X — 0О + оо (хА£ + //Ат])J dA^dAr], (5.6. где — ф есть величина, равная (2лД)/(хАх + уАу), что экви- валентно нашему прежнему определению (5.6.9). Чтобы легче было сравнить результат с ранее рассмотрен- ной формой теоремы Ван Циттерта—Цернике, мы введем спе- циальное обозначение для последнего двойного интеграла: + оо х (х, у) = ц (Дх, Дг/) ехр р g- (хД£ + УДт})] d^> d^< (5.6.36) — оо Тогда взаимная интенсивность будет иметь вид j (*ь УГ, Х2, у2) = = *(*’(g)2~ $ $ / (I П) ехр р -g (Дх| + Дут))] dldx\. (5.6.37) — 0О Таким образом, постоянная х предыдущей формы теоремы Ван Циттерта — Цернике становится функцией координат (х, у). Как следствие этого модуль |ц| комплексного коэффициента когерентности больше не является функцией только разности координат (Ах, Ау). Наша физическая интерпретация обобщенной теоремы Ван Циттерта — Цернике состоит в следующем. Так как функ- ция ц(А£,Ат]) имеет более резкую зависимость в плоскости (Ag, Ат]), чем функция /(£, т]) в плоскости (|, т]), коэффициент х(х,у) будет плавной функцией в плоскости (х,у), тогда как интеграл будет резким в плоскости (Ах, Аг/) в силу соотноше- ний между обратными ширинами пар преобразований Фурье [5.17]. Интегральный множитель мы интерпретируем как пред- ставляющий корреляционные свойства света в зависимости от расстояний между двумя исследуемыми точками (хьг/1) и (х2, Уз), тогда как множитель х(х,у) описывает плавное изме- нение средней интенсивности в плоскости (х, у). Точно так же как и в случае некогерентного света, площадь когерентности наблюдаемой волны определяется размером источника, но в дополнение к этому площадь когерентности источника влияет на распределение средней интенсивности в плоскости (х, у).
Когерентность оптических волн 213 Мы закончим данный параграф замечаниями относительно условий (5.6.34), которые были приняты при выводе обобщен- ного результата. Если D — максимальный линейный размер ис- точника, a de — максимальный линейный размер площади ко- герентности источника, то требуемые условия будут выпол- няться при z > 2-ДЙ-, (5.6.38) Л где было учтено, что 7(g, fj) падает до нуля при лД2 + я2> >0/2, а ц(А£, Ат]) падает до нуля при V^S2 + Л^2 > dc. Нера- венство (5.6.38) можно интерпретировать как требование, чтобы расстояние до области наблюдения было не меньше геометри- ческого среднего расстояний до области дальнего поля для от- верстий диаметром D и dc. В качестве конкретного примера предположим, что D = 10~2 м, dc = Ю“3 м и X = 5*10-7 м; то- гда г должно удовлетворять требованию г > 0,4 м. Читатель может убедиться (задача 5.16), что если между источником и плоскостью наблюдения помещена собирательная линза с фо- кусным расстоянием f и если плоскость наблюдения является задней фокальной плоскостью этой линзы, то в ограничениях (5.6.34) больше нет необходимости, и, следовательно, обобщен- ная теорема Ван Циттерта — Цернике справедлива в более ши- роком числе случаев, чем это указывалось выше. § 7. Дифракция частично когерентного света на отверстии Предположим, что квазимонохроматическая волна падает на непрозрачный экран с отверстием (рис. 5.22). Вообще говоря, эта волна может быть частично когерентной. Мы хотим вычис- лить распределение интенсивности света /(х,у), наблюдаемое Рис. 5.22. К расчету картины дифракции на отверстии.
214 • Глава 5 в параллельной плоскости, расположенной на расстоянии z за экраном с отверстием. А. Влияние тонкой структуры пропускания отверстия на взаимную интенсивность Отверстие, изображенное на рис. 5.22, можно описать ампли- тудной функцией (коэффициентом) пропускания вида '1, tx (£, п) = < если (£, т]) на поверхности S, (5.7.1) 10 в других случаях. В более общем случае в отверстии могут быть поглощающие или вносящие сдвиг фаз структуры, которые характеризуются произвольной комплексной амплитудной функцией пропускания в пределах отверстия1), с единственным ограничением 0 С|М< 1. (Подробнее вопрос об амплитудном пропускании рассматривается в гл. 7, § 1, п. А.) Спрашивается: как, зная функцию взаимной интенсивности падающего света Jz(£i, тр; £2, П2), найти форму функции взаим- ной интенсивности J/(£i, тр; £2, Л2) прошедшего света? Если ком- плексная огибающая падающего света равна А/(£, т|; t), а ком- плексная огибающая прошедшего света равна A/(g, щО, то эти две величины могут быть связаны между собой амплитуд- ной функцией пропускания А/ & п; 0 = Ь & n) Az (t n; t - т0), (5.7.2) где То — среднее время задержки, связанное с этой структурой. Таким образом, взаимная интенсивность прошедшего света принимает вид (£Р Л1*> £2» (£р Яр 0 (^2> Я2> 0) (£р Я1) ^д (^2> Я2) X X (А; V, t - т0) a; (g2, n2; t - т0)). (5.7.3) Отсюда следует общее соотношение между взаимной интенсив- ностью падающей и прошедшей волн: •h (£р Яр ^2> Яо) = *д (^р Я1) *д (£2> Яг) (£р Яр ^2’ Яг)- (5.7.4) 1) Мы предполагаем, что эта амплитудная функция пропускания не зави- сит от длины волны в пределах узкой спектральной полосы падающего света.
Когерентность оптических волн 215 Б. Распределение интенсивности в области наблюдения Чтобы найти распределение интенсивности в области наблю- дения, начнем с выражения (5.4.9), которое мы упростим, при- няв, что само отверстие и область наблюдения намного мень- ше г. Тогда получим выражение — 0О X ехр / у (r\ — г')] d%2 dp2. (5.7.5) Заменив амплитудную функцию пропускания b отверстия функцией «зрачка» Р(£,т]), которую для общности мы считаем комплексной, подставим (5.7.4) в (5.7,5) и получим + оо /(х, у) «$$ J J Ря.)р*Т|2) J/(U Th; £2, Th) X — 0О X exp / у (г' — <)] d^ dr}, dl2 dx\2. (5.7.6) Для простоты мы предполагаем, что функция взаимной интен- сивности может быть представлена в форме Ш.т1.;ит12) = 7оМЛ1> Ап). (5.7.7) Такой случай имеет место во многих практически интересных случаях1). Например, это справедливо, если свет некогерент- ного источника достигает отверстия, проходя через конденсор- ную систему Кёлера (гл. 7, § 2, п. А). Кроме того, в обычном параксиальном приближении Г'2 - i [(И + Т|2) - + я?) - 2 (Ш + //Ап)] = = 4-[tA£ + fiAT|-xA£-J/ATlb (5.7.8) 1) В более общем случае следует написать J/ (gb Яь Ь. Яг) = A (gt, Т]1) А* (Ь. Яг) Hi (Ag. АП).' Коэффициенты A(|i, гр) и A*(g2, Яг) могут рассматриваться включенными в P(gi, Я1) и Р*(ьг, Яг)-
216 Глава 5 где использованы обозначения (5.6.29) для | и п- Учитывая выражение (5.7.7) для J(, получим х Н/ (AL An) ехр {— j Э- (|Д1 + fjАп)) X X ехр (/ (хА£ + //An)) df dfj d/£ dAn. (5.7.9) Теперь для удобства мы снова воспользуемся приближением (5.6,34) или, короче говоря, предположим, что г не меньше гео- метрического среднего из расстояний до области дальнего поля при соответствующих размерах отверстия и площади когерент- ности. Это позволяет нам опустить первый экспоненциальный множитель в формуле (5.7.9) и получить более простое выра- жение 4-00 I (х, у) « И & (Ag, An) Hi (AL An) X (Лг) J J ' ' —on X ехр р (хА£ + //An)] dM dAn, (5.7.10) где & — автокорреляционная функция комплексной функции зрачка Р: «^•(AL Ап)Д р (t--у-> n-4L)P* (t + 4M + ^-)d|dn. (5.7.11) Таким образом, распределение интенсивности в дифрак- ционной картине можно найти, выполнив двумерное преобра- зование Фурье произведения функций и Этот результат иногда называют теоремой Шелла [5.32, 5.33]. Мы постараем- ся объяснить физический смысл этого результата в следующем пункте, но сначала остановимся подробнее в настоящем кон- тексте на условии (5.6.34). Во-первых, нетрудно показать, что необходимость наложе- ния данного условия отпадает, если в контакте с плоскостью отверстия находится собирающая линза с фокусным расстоя- нием f = г. Если же такая линза отсутствует, то этим условиям для z в данном случае удовлетворить гораздо труднее, чем в случае, рассмотренном в § 6, п. Г, поскольку там было явно принято, что площадь когерентности намного меньше площади источника, а здесь подобного предположения не было сделано.
Когерентность оптических волн 217 Если D — максимальный линейный размер отверстия, a dc — максимальный линеййый размер когерентной ячейки на апер- туре, то требуемые условия будут выполняться, когда W2 I 2Ddc Л при dc > Z), при dc < D. (5.7.12) Заметим, что условие z > 2D2/X идентично условию дифракции дальнего поля, т. е. дифракции Фраунгофера; оно должно быть наложено, если освещение отверстия приближается к пол- ностью когерентному. В. Анализ полученных результатов Результат, названный нами теоремой Шелла [формула (5.7.10)], дает нам более общую формулу для расчета дифрак- ционной картины, возникающей при частично когерентном осве- щении отверстия. Физический смысл этого результата лучше всего уяснить себе, рассматривая некоторые предельные случаи. Сначала предположим, что отверстие освещается отдельной однородной падающей по нормали плоской волной (такое осве- щение, конечно, является полностью когерентным). Комплекс- ный коэффициент когерентности в этом случае равен еди- нице при всех значениях аргументов, и выражение для интен- сивности наблюдаемой дифракционной картины имеет вид 4-00 1 ^Х' * Дг)7 S S еХр [7 7z (5.7.13) где автокорреляционная функция функций зрачка Р. Ряд соображений, следующих из автокорреляционной теоремы фурье-анализа [5.24], показывает, что этот результат пол- ностью эквивалентен более привычной дифракционной форму- ле Фраунгофера, записанной для комплексных полей; 2 = И р ехр [7 Й + (5.7.14) Рассмотрим далее другой крайний случай, когда освещение имеет площадь когерентности, много меньшую, чем размер от- верстия. В этом случае функция имеет приблизительно свое
218 Глава 5 максимальное значение А (площадь апертуры) в пределах всей области значений (Ag, Ат]), для которых ц/ =/= 0. Следовательно, 4-00 1 у>> ~ 7^7 5 5Лт^ехр [; "ё + Лп^] — оо (5.7.15) Таким образом, форма наблюдаемой картины интенсивности определяется в основном комплексным коэффициентом коге- рентности ц/ и практически не зависит от формы отверстия при условии, что D de- ft промежуточных случаях, когда форма функции 1(х,у) определяется обеими величинами и мы можем заметить, Рис. 5.23. Картина дифракции на круглом отверстии при разных состояниях поперечной когерентности [5.34]. Параметр С — отношение площади круглого отверстия к площади когерентности. Предполагается, что иекогерентный источник имеет форму круга. Переменная х— приведенная величина. что, поскольку Цх,у) выражается через фурье-образ произве- дения форма функции Цх,у) будет определяться сверт- кой фурье-образов величин & и Ц;. Окончательный результат состоит, вообще говоря, в «сглаживании» дифракционной кар- тины по мере постепенного уменьшения площади когерентности. На рис. 5.23 показано постепенное сглаживание картины, опи- сываемой функцией [2/i(p)/p]2 (соответствующей дифракции когерентного света на круглом отверстии), при постепенном уменьшении площади когерентности. В заключение отметим, что совершенно эквивалентный ре- зультат можно получить другим путем, если считать, что ча-
Когерентность оптических волн 219 стично когерентное .освещение отверстия создается некогерент- ным источником. Можно полагать, что каждая точка такого источника создает полностью когерентное освещение отверстия и соответствующую ему дифракционную картину, но центр ка- ждой дифракционной картины зависит от положения соответ- ствующей точки источника. Поскольку источник является не- когерентным, все дифракционные картины складываются по интенсивности, что приводит к новой дифракционной картине, которая оказывается частично сглаженной из-за конечных раз- меров источника. Второй метод вычисления имеет преимущество концептуаль- ной простоты, но его недостаток—в меньшей общности. В частности, источник сам может быть частично когерентным, и в этом случае теоремой Шелла можно пользоваться, но вто- рой метод требует изменения: нужно сначала найти «эквива- лентный» некогерентный источник, который обеспечивал бы тот же самый комплексный коэффициент когерентности, что и реальный частично когерентный источник. Задачи 5.1. Идеализированное выражение для (нормированной) спектральной плотности мощности газового лазера, гене- рирующего N аксиальных мод равной интенсивности, имеет вид (V-D/2 ^(v) = -^- 6(v —v + nAv), п = —(Л/ —1)/2 где Av — разность частот соседних мод (равная двойной длине резонатора, деленной на скорость света для акси- альных мод), v- частота центральной моды и AZ— целое число (для простоты считаем его четным). а) Покажите, что соответствующая огибающая комплекс- ной степени когерентности имеет вид м _ I sin(^nAvT) I — I N sin («Avt) Г б) Постройте зависимость у от Avt при tV = 3hO^t^1 /Av. 5.2. Газовая смесь в гелий-неоновом лазере (краевые зеркала исключены) излучает свет на длине волны 633 нм с доп- леровской шириной спектра порядка 1,5-109 Гц. Вычислите
220 Глава 5 Рнс. 5.3з. время когерентности тс и длину когерентности 1С = — схс (с — скорость света) для этого света. Повторите то же для.длины волны 488 нм аргонового лазера, кото- рый имеет доплеровскую ширину линии порядка 7,5-109 Гц. 5.3. (Зеркало Ллойда.) Точечный источник света помещается на расстоянии s над полностью отражающим зеркалом. На расстоянии d на экране наблюдаются интерференцион- ные полосы, как показано на рис. 5.3з. Комплексная сте- пень когерентности света имеет вид у | т I e-/2HVT t Найдите в предположении, что s<d и х ис уче- том изменения знака поля при отражении (предполагает- ся, что поляризация параллельна зеркалу): а) пространственную частоту интерферограммы; б) классическую видность интерферограммы как функ- цию координаты х, предполагая одинаковой интенсивность интерферирующих пучков. 5.4. Рассмотрите интерференционный опыт Юнга, выполняе- мый с широкополосным световым сигналом. а) Покажите, что выражение для напряженности поля света, падающего на экран, имеет вид К,- И i-e отверстие где А,- — площадь i-ro отверстия.
Когерентность оптических волн 221 б) Используя результат п. «а», покажите, что выражение для интенсивности света, достигающего экран, имеет вид HQ) = + P>(Q) - 2К& Re {-^ Г12 . где в) Покажите, что в случае узкополосного света предыду- щее выражение сводится к выражению (5.2.9). 5.5. Как показано на рис. 5.5з, в интерференционном опыте Юнга в контакте с экраном, в котором имеются два ма- лых отверстия, находится собирающая линза с фокусным расстоянием f. В случае квазимонохроматического света наличие линзы можно учесть с помощью амплитудного коэффициента пропускания, имеющего в параксиальном приближении вид Н(р) = ехрГ-/^-р21. L Л/ J Предполагая источник пространственно-некогерентиым, найдите соотношение между zi, Z2 и f, при котором про- странственная фаза наблюдаемой системы интерферен- ционных полос зависит только от вектора расстояния ме- жду двумя отверстиями, но не от их абсолютных положе- ний относительно оптической оси. 5.6. Рассмотрите интерферометр Майкельсона, входящий в си- стему фурье-спектрометра. Чтобы получить высокое раз- решение в вычисленном спектре, необходимо зарегистри- ровать интерферограмму до больших оптических разно- стей хода, при которых сигнал интерференции становится очень малым. а) Покажите, что при таких условиях спектр света, па- дающего на фотоприемник, существенно отличается от спектра света, входящего в интерферометр. Рис. 5.5з.
222 Глава 5 Рис. 5.8з. б) Вычислите спектр света, падающего на фотоприемник, зная, что спектр света на входе в интерферометр имеет вид (v) = nr- rect —г—. v 7 Av Av 5.7. В интерференционном опыте Юнга (рис. 5.7з) спектраль- ная плотность мощности света § (v) измеряется в точке Q при помощи дифракционного спектрометра. Известно, что волна в плоскости Р\, Р2 является взаимно спектрально чистой, т. е. ' Vi2H) = Mi2V(t). Покажите, что при (г2 — ц) /с » тс, когда интерферен- ционные полосы не наблюдаются, величину gi2 можно определить, рассматривая полосы, которые существуют в спектре света в точке Q. Укажите как могут быть определены модуль и фаза Ц12. 5.8. Монохроматическая плоская волна падает по нормали на «сандвич» из двух рассеивателей. Рассеиватели движутся в противоположных направлениях с равными скоростями, как показано на рис. 5.8з. Предполагается, что амплитуд-
Когерентность оптических волн 223 ный коэффициент пропускания Ь (х, у) пары рассеивате- лей может быть представлен в виде (х, у) = tl (*, У — vt) t2 (X, у + vt), где tj и t2 могут рассматриваться как относящиеся к ста- тистически независимым ансамблям (поскольку, зная один, ничего нельзя сказать о другом). Покажите, что если каждый из рассеивателей имеет автокорреляционную функцию гауссовской формы Vt (Ах, At/) = ехр {— а [(Ах)2 + (At/)2]}, то прошедший свет является взаимно спектрально чистым. 5.9. Исходя из формулы (4.1.9), покажите, что для широко- полосного света функция взаимной когерентности Г(<21, Q2; т) на поверхности S2 рис. 5.16 может быть пред- ставлена в виде Г (Qb Q2> т) = = -(( f CJL(P„Pi:t + z^)x<el> x(e.>rfs J J J J дх2 \ и 1 c J 2лсГ1 2rtcr2 1 2 Si st 5.10. Покажите, что при выполнении условий квазимонохрома- тичности взаимная интенсивность Jj2 подчиняется системе Двух уравнений Гельмгольца Vl J12 + (k)2 J12 = 0, V2J12 + (k)2 J12 = 0, где k = 2л/Х и V 1 === ~ 2 “Г а 2 ' д 2 * *2 2 "~Г" п 2 ’ д 2 * Эху ду\ dz\ dxg ду^ dz% 5.11. Интерференционный опыт Юнга проводится в соответ- ствии с геометрией, показанной на рис. 5.Из. Диаметр отверстий равен 6, расстояние между ними равно s. Ис- точник имеет ширину полосы Av и среднюю частоту v, фокусное расстояние линзы равно f. К затуханию интер- ференционных полос при удалении от оптической оси при- водят две причины: а) конечный размер отверстий; б) ко- нечная ширина полосы источника. Насколько мала долж- на быть относительная ширина полосы Av/v, чтобы при заданных 6, s и f эффект «а» преобладал над эффектом <сб»? 5.12. Покажите, что любая монохроматическая волна является полностью когерентной (в смысле среднего по времени).
224 Глава 5 5.13. Условный диаметр солнечного диска при наблюдении с Земли равен 32' (0,0093 рад). Предполагая, что средняя длина волны равна 550 нм, вычислите диаметр площади когерентности солнечного света, наблюдаемого на Земле (считая, что выполняются условия квазимонохроматично- сти). 5.14. Диафрагма с диаметром отверстия 1 мм расположена не- посредственно перед некогерентным источником. Свет, прошедший через отверстие, используется в дифракцион- ном эксперименте, в котором требуется когерентно осве- щать далеко расположенную диафрагму с диаметром от- верстия 1 мм. Приняв X = 550 нм, вычислите минимально допустимое расстояние между отверстием-источником и диафрагмой, на которой происходит дифракция. 5.15. Рассмотрите некогерентный источник, излучающий свет с пространственным распределением интенсивности /(£, т]). а) На основании теоремы Ван Циттерта — Цернике и тео- ремы Парсеваля из фурье-анализа покажите, что выра- жение для площади когерентности света (со средней дли- ной волны X) на расстоянии z от источника имеет вид Н-ОО J $/*(£, n) dgdT) = -----------чг И/и. nMgdJ б) Покажите, что если некогерентный источник имеет рас пределение интенсивности Hl y]) = IQP(t т])>
Когерентность оптических волн 225 где Р(£, я) — некоторая функция со значениями, равными 1 и 0, то где — площадь источника. 5.16. Приняв для собирательной линзы с фокусным расстоя- нием f амплитудную функцию пропускания 4G, п) = ехрГ- (I2 + п2)] L Af J и считая, что эта линза находится в контакте с частично когерентным источником, покажите, что если наблюдение ведется в задней фокальной плоскости этой линзы, то обобщенная теорема Ван Циттерта — Цернике применима без ограничений (5.6.34). 5.17. Найдите в параксиальном приближении выражение для комплексного коэффициента когерентности ц(Л, Р2) све- та, создаваемого квазимонохроматическим точечным ис- точником, если Pi и Р2 — две точки плоскости, находя- щейся на расстоянии z от источника. ЛИТЕРАТУРА 5.1. Verdet Е. — Ann. Sclent. 1’Ecole Normale Superieure, 1965, v. 2, p. 291. 5.2. Von Laue AL—Arra. Phys., 1906, Bd. 20, S. 365; 1907, Bd. 23, S. 1; 1907, Bd. 23, S. 795; 1909, Bd. 30, S. 225; 1910, Bd. 31, S. 547; 1915, Bd. 47, S.853; 1915, Bd. 48, S. 668. 5.3. Berek M. — Zs. Phys., 1926, Bd. 36, S. 675; 1926, Bd. 36, S. 824; 1926, Bd. 37, S, 387; 1927, Bd. 40, S. 420. 5.4. Van Cittert P. Н,— Physica, 1934, v. 1. p. 201; 1939, v. 6, p. 1129. 5.5. Zernike F.— Phvsica, 1938, v. 5, p. 785; Proc. Phys. Soc., 1948, v. 61, p. 158. 5.6. Hopkins H. H. — Proc. Roy. Soc., 1951, v. A208, p. 263, 5.7. Blanc-Lapierre A., Dumontet P.— Conipt. Rend. (Paris), 1954, v. 238, p. 1005. 5.8. Wolf E. — Nature, 1953, v. 172, p. 535; Proc. Roy, Soc., 1954, v. A225, p. 96; Nuovo Cimento, 1954, v. 12, p. 884, 5.9. Selected Papers on Coherence and Fluctuations on Light, Vols. 1, 2, eds. L. Mandel, E. Wolf. — N. Y.: Dover Publ., 1970. 5.10. Born At., Wolf E. Principles of Optics. — N. Y.: Mac-Millan Company, 1964, Ch. 10. [Имеется перевод: Борн M., Вольф Э. Основы оптики.— М.: Наука, 1973.] 5.11. Beran М. L, Parrent О. В, Theory of Partial Coherence. — Prentice-Hall: Englewood Cliffs, NJ, 1964. 5.12. Mandel L.t Wolf E.— Rev. Mod. Phys., 1965, v. 37, p, 231, [Имеется перевод: Вольф Э., Мандель Л. Когерентные свойства оптических по- лей. — УФН, 1965, т. 87, вып. 3, с, 491; 1966, т, 88, вып. 2, с. 347; 1966, т. 88, вып. 4, с. 619.]
226 Глава 5 5.13. Petina J, Coherence of Light. — London: Van Nostrand Reinhold Company, 1972. [Имеется перевод: Перина Я. Когерентность света. — М.: Мнр, 1974.] 5.14. Frangon М. Optical Interferometry. — N. Y.: Academic Press, 1966. 5.15. Michelson A. A. — Phil. Mag., 1891, v. 31 [5], p. 338; 1892, v. 34, p. 280. 5.16. Mitchell A. C. G., Zemansky M. U7. Resonance Radiation and Excited Atoms. — London: University Press, 1961, Ch. 3. [Имеется перевод 1-го издания; Митчелл Л,, Земанс&ий М„ Резонансное излучение и возбу- жденные атомы. — М.: ОНТИ, 1937.] 5.17. Bracewell R. The Fourier Transform and its Applications. — N. Y.: McGraw-Hill Book Company, 1965. 5.18. Mandel L. — Proc, Phys. Soc. (London), 1959, v, 74, p. 223. 5.19. Vanasse G. Л., Sakai H, Fourier Spectroscopy. — Ln: Progress in Optics, v. 6. — Amsterdam: North-Holland Publ. Co., 1967, p. 261. 5.20. Mertz L. Transformations in Optics. — N. Y.: John Wiley and Sons, 1965. [Имеется перевод: Мертц Л. Интегральные преобразования в оптике. — М.: Мир, 1969.] 5.21. Cooley J. W., Tukey J. W.— Math. Computaiton, 1965, v. 19, p. 296. 5.22. Fellgett P. Thesis, University of Cambridge, 1951. 5.23. Young T. — Phil. Trans. Roy. Soc. (London) [xcii], 1802, v. 12, p. 387. 5,24. Goodman J. W. Introduction to Fourier Optics. — N. Y.: McGraw-Hill Book Company, 1968. [Имеется перевод: Гудмен Дж. Введение в фурье- оптнку. — М.: Мир, 1970.]. 5.25. Mandel L — J. Opt. Sol. Am., 1961, v. 51, p. 1342. 5.26. Alford W. P., Gold A, — Am. J. Phys., 1958, v. 56, p. 481. 5.27. Mandel L., Wolf E. — J. Opt. Soc. Am., 1976, v 66, p. 529. 5.28. Mandel L., Wolf E. — J. Opt. Soc. Am., 1961, v. 51, p. 815. 5,29. Goodman J. W. — Proc. IEEE, 1965, v. 53, p. 1688. 5,30. Carter W. H., Wolf E, — J. Opt. Soc. Am., 1977, v. 67, p. 785. 5.31. Wolf E. — J. Opt. Soc. Am., 1978, v. 68, p. 6. 5.32, Shell A. C. Ph. D. Thesis, Massachusetts Institute of Technology, 1961. 5.33. Singh K,> Dillon H. S. — J. Opt. Soc. Am., 1969, v. 59, p. 395. 5.34. Shore R, Л., Thompson B. /., Whitney R. E. — J. Opt. Soc. Am., 1966, v. 56, p. 733. 5.35. Griffiths P. R. — Science, 1983, v. 222, p. 297—302. 5.36. Thompson B, J., Wolf K.— J. Opt. Soc. Am., 1957, v. 47, p, 899. ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 5.1 д. Marathay A. S. Elements of Optical Coherence Theory.— N. Y.: Wiley- Interscience, John Wiley and Sons, 1982. 5.2 д. Shumaker Л B, Introduction to Coherence in Radiometry—In: Self-Study Manual on Optical Radiation Measurements, Part I, ed. F. E. Nicodemus,— Washington, D. C., National Bureap of Staudarts, 1983. 5.3 д. Bell Rt J. Introductory Fourier Transform Spectroscopy. — N. Y.: Acade- mic Press, 1972. [Имеется перевод: Белл P. Дж. Введение в фурье- спектроскопню. — М.: Мир, 1975.] 5.4 д. Steel W. Н. Interferometry. — Cambridge: University Press, 1983.
Глава 6 НЕКОТОРЫЕ ЗАДАЧИ, СВЯЗАННЫЕ С КОГЕРЕНТНОСТЬЮ ВЫСШЕГО ПОРЯДКА В гл. 5 мы рассматривали вопросы, связанные с когерентностью только второго порядка, т. е. с функцией взаимной когерентно- сти Г12(т). Такие функции когерентности лишь в ограниченной мере описывают статистические свойства рассматриваемых вол- новых полей. Два весьма различных типа волновых полей вполне могут характеризоваться одинаковыми функциями взаимной интенсивности; чтобы различать такие две волны, не- обходимо рассмотреть функции когерентности порядка более высокого, чем второй. Мы увидим далее, что функции коге- рентности порядка более высокого, чем второй, совершенно естественным образом появляются в некоторых физических за- дачах. Вначале определим функции когерентности (п + т)-го по- рядка волны и(Р, 0 следующим образом: Г1. 2. .n-j-m (6j ^2» • , tn + m) = (U (Pi, /1) ... U (Рп> tn) U (Рл + 1, /п + i) ... U (Рп + т, in + tn)\ (6.1) причем для эргодического случайного процесса — в виде соот- ветствующего среднего по ансамблю. Вычисление средних выс- шего, чем второй, порядка является, вообще говоря, трудной математической задачей, так как для их вычисления нужно знать плотности распределения (м + т)-го порядка и часто бы- вает очень трудно выполнить окончательное интегрирование. Но весьма важный случай теплового излучения оказывается исключением из этого правила. Для такого излучения на осно- вании теоремы моментов для круговых комплексных гауссов- ских случайных переменных [формула (2.8.21)] можно напи- сать Г1. 2. ..., 2п (Л, • • • > ^2л) — (*Ь ^р)Г*2<7 (^2> ^) • • • (fn, tr)9 Л (6.2) где означает суммирование по п\ возможным перестанов- кам (р, 7, г) индексов (1, 2, ..., п).
228 Глава 6 Эта теорема, позволяющая произвести факторизацию в слу- чае теплового излучения, часто приводит к упрощению задач, которые иначе были бы исключительно трудными. Теоремы факторизации различных форм существуют также и для опреде- ленных негауссовских процессов (см., например, работу [6.1]). В следующем параграфе мы приведем три примера задач, содержащих когерентность более чем второго порядка. Снача- ла мы рассмотрим статистические свойства интегральной по времени интенсивнЪсти поляризованного теплового излучения. Этими результатами мы воспользуемся в дальнейшем при ис- следовании статистики счета фотонов в гл. 9. Затем мы рас- смотрим статистические свойства взаимной интенсивности с конечным временем усреднения. И наконец, в заключение мы представим полный классический анализ интерферометра ин- тенсивностей. § 1. Статистические свойства интегральной интенсивности теплового и квазитеплового излучения В ряде задач, в том числе при анализе статистики счета фото- нов (статистики фотоотсчетов), встречаются конечновременные интегралы от мгновенного значения интенсивности. Кроме того, совершенно аналогичная задача возникает при рассмотрении статистических свойств средних по конечному пространству от мгновенного значения интенсивности. Здесь мы сформулируем задачу применительно к интегралам по времени; для интегра- лов по пространству анализ оказывается почти таким же. Пусть I(t)—мгновенное значение интенсивности волны, на- блюдаемой в некоторой точке Р. Нас интересует здесь прежде всего связанная с ним величина t W(t) = J /(g)dg, (6.1.1) t-т т. e. величина I(t), проинтегрированная по конечному интер- валу наблюдения (t — T, t). Заметим, что любая оценка сред- ней интенсивности волны обязательно должна быть основана на определении среднего по конечному времени, которое яв- ляется не чем иным, как измеренным значением W, нормиро- ванным на время усреднения Т. Мы всюду будем предполагать, что рассматриваемый свет является тепловым или квазитепловым и что он адекватно мо- делируется эргодическим (а следовательно, и стационарным) случайным процессом. Вследствие этого статистические свой- ства величины IF не зависят от конкретного значения времени наблюдения t. Для удобства в математических выкладках мы
Некоторые задачи, когерентность высшего порядка 229 выберем 1 = тогда выражение (6.1.1) примет вид Т/2 r= J 7(g)dg. (6.1.2) -Т/2 Сначала мы будем считать, что свет поляризован, а позднее мы исследуем случаи частично поляризованного и неполяризо- ванного света. Последующий материал разделяется на три части: в первой мы выводим точные выражения для среднего значения и дис- персии интегральной интенсивности W, во второй находим при- ближенное выражение для плотности распределения первого порядка величины IF, а в третьей даем точное решение для этой плотности распределения. А. Среднее значение и дисперсия интегральной интенсивности Наша начальная задача состоит в нахождении выражений для среднего значения W и дисперсии интегральной интенсив- ности. Большой интерес для нас представляет также средне- квадратичное отношение сигнала к шуму Ч^/скв (6.1.3) связанное с интегральной интенсивностью и позволяющее оце- нить величину флуктуаций W относительно среднего значения Ж. Для ознакомления со смежными проблемами читатель мо- жет обратиться к работам [6.2, 6.3]. Вычисление среднего значения W проводится совершенно элементарно. Среднее значение выражения (6.1.2) находим, изменяя порядок выполнения операций интегрирования и усред- нения, что приводит к результату Г/2 Г = J ldl = ~IT, (6.1.4) — Т/2 который совершенно не зависит от поляризации волны. Вычисление дисперсии стк? требует несколько больших уси- лий. Имеем Г / Г/2 \2П Г/2 <4 = ЕИ J -(Г)2 = J J 7(^)7(n)^dn-(W = Ь\_Г/2 / J -~Т/2 Т/2 — Г/2 (6.1.5)
230 Глава 6 где Г/ — автокорреляционная функция мгновенной интенсивно- сти. Так как подынтегральное выражение является четной функцией разности (£ — т]), двойной интеграл может быть све- ден к однократному интегралу точно так же, как это было сде- лано при выводе выражения (3.4.9). Таким образом, мы имеем + оо <?v=T J Л (-£-) О (г) dr -(W. — оо где 1 — | т | при I Т I 1, 0 в других случаях. (6.1.6) (6.1.7) Здесь необходимо полностью использовать то обстоятель- ство, что рассматриваемые поля создаются тепловым (или ква- зитепловым) источником. Функция корреляции Г\(т), которая фактически эквивалентна функции когерентности четвертого порядка рассматриваемых полей: Г, (т) = Е [и (/) и* (0 и (t + т) и* (t + т)], (6.1.8) может быть в этом случае выражена через функцию когерент- ности второго порядка полей. На основании формулы (6.2) в случае полностью поляризованного света получим Г! (Т) - (7)2 [ 1 + | V (т) |2], (6.1.9) где у(т)—комплексная степень когерентности света. Подста- новка этого соотношения в (6,1.6) приводит для поляризован- ной волны к результату [+оо -jr J Л (4) | у(т) I2dr “ОО (6.1.10) Мы знаем, что в случае частично поляризованной волны мгновенная интенсивность может быть выражена через две не- коррелированные интенсивности: Ц/) = /1(0 + /2(0, (6.1.11) причем средние значения величин li(t) и Л(0 имеют вид 7| = ±7(1+П (6.1.12) 72 = 4;(1-П Подставляя эти выражения в определение величины Г/(т), по- Г/ (т)=2/,72 + (Л)2 [ 1 +1V (т) |2] + (72)2 [ 1 +1V (т) f2] (6.1.13)
Некоторые задачи, когерентность высшего порядка 231 ИЛИ Г/ (т) = (7)2 + 4 (1 + ^) I V (т) Г (6.1.14) Дисперсия а и? в случае частично поляризованной волны со сте- пенью поляризации определяется выражением а27 = 1±^(Ц7)2Г1- J А (-01 у (т) |2 dr L — оо (6.1.15) Большой интерес с физической точки зрения представляет среднеквадратичное (СКВ) отношение сигнала к шуму [фор- мула (6.1.3)], Используя (6.1.4) и (6.1.15), мы непосредственно находим, что (6.1.16) где Ж — параметр, который определяется выражением А ( у-)| Y (т) |2 dx (6.1.17) Этот параметр имеет важное значение здесь и в дальнейшем, а потому мы кратко остановимся на его физическом смысле. Физический смысл параметра Ж легче всего уяснить, рас- смотрев его предельные значения. Замечая, что ширина функ- ции А(т/Г) равна 2Г, тогда как ширина функции |у(т) |2, гру- бо говоря, в 2 раза больше времени когерентности, т. е. равна 2тс, мы можем легко показать, что при Т тс [4-00 -1 —1 -L J |Y(T)|2dT = £- (Г»тс). (6.1.18) — оо J Таким образом, в этом предельном случае параметр Ж есть число интервалов когерентности, укладывающихся в пределах времени измерения Т, В противоположном случае, когда Т <С тс, находим [4-00 “I— 1 -Г- J A(^-)dT =1 (Т<£хс). (6.1.19) — ОО Этот результат показывает, что при уменьшении времени из- мерения число интервалов когерентности, влияющих на резуль- тат эксперимента, асимптотически приближается к единице. Значения параметра Ж, меньшие единицы, невозможны, по- скольку результаты экспериментов всегда определяются состоя- ниями полей по крайней мере в одной ячейке когерентности.
232 Глава 6 В согласии с проведенными рассуждениями в общем случае, когда время измерения Т может быть любым по сравнению с временем когерентности тс, мы интерпретируем параметр v# как число ячеек когерентности световой волны, которое влияет на конечный результат эксперимента. Чтобы конкретизировать значение Л в этом общем случае, необходимо прежде всего знать |у(т) |2 или, что эквивалентно, спектральное распреде- ление света. В случае гауссовского (задача 6.5) и лоренцев- ского (задача 6,6) контура спектральной линии возможны ана- литические решения. Соответствующие результаты для пара- метра Л имеют следующий вид: Гауссовский контур: ^ = (-y-erf (Ул^) —а-(у-)2(1 — е“яС/хс)2)| *, (6.1.20) где erf (х) — стандартный интеграл ошибок: erf (х) = -уД Ул J e-^dz, Лоренцевский контур: Л = {£ +1(У)’ [<Г=-11}“'. (6.1.21) В случае прямоугольного контура линии соответствующий ре- зультат может быть получен путем численного интегрирования [6.4]. Все три случая продемонстрированы на рис. 6.1, где по- казана зависимость параметра Л от Г/тс [6.5]. Зависимость величины Л от точной формы спектральной линии довольно слабая, и ее можно игнорировать вне области 0,1 < Г/т6 < 10. Возвращаясь к вопросу о среднеквадратичном отношении сигнала к шуму, связанном с измерением величины W, в слу- чае поляризованного источника напишем (4-)«.= V-*- <61-22> Зависимость (S/W)ckb от Т/хс тоже показана на рис. 6.1. В слу- чае частично поляризованной волны все значения должны быть увеличены в V-/(l +^2) раз. Результаты, полученные в данном пункте параграфа, часто оказываются практически приложимыми. Например, предполо- жим, что мы хотим оценить интенсивность поляризованной теп- ловой световой волны с точностью 1%. Так как W/T—это усредненная по конечному времени интенсивность, мы требуем измерения W со среднеквадратичным отношением сигнала к
Некоторые задачи, когерентность высшего порядка 233 шуму порядка 100. Обращаясь к рис. 6.1, мы видим, что в этом случае __ следовательно, требуемая точность достигается при Т — = 10 000тс Если средняя длина волны X источника равна 500 нм и разброс значений длины волн — порядка 0,1 нм, то время когерентности тс=Х2/сАХ составляет около 10-11 с. Та- ким образом, время интегрирования Т — 10-7 с. Такая продол- жительность легко может быть достигнута и даже превышена Рис. 6.1. График зависимости Л от Г/тс, точные решения для гауссовского, лоренцевского и прямоугольного контуров спектральной линии. в большинстве экспериментальных ситуаций. Но если мы имеем дело с квазитепловым излучением, то его ширина полосы мо- жет легко уменьшиться до 1СН Гц, и требуемое время инте- грирования становится равным 10 с. Это условие на практике может выполняться, но может и не выполняться в зависимости от условий эксперимента *). Б. Приближенная форма плотности распределения интегральной интенсивности В ряде приложений (см., например, работы [6.4, 6.6.]) недоста- точно знать только среднее значение и дисперсию интегральной 0 Как показывается в гл. 9, в случае истинно тепловой световой волны практически будут преобладать флуктуации типа дробового шума, а не шума, рассмотренного здесь. В случае же квазитеплового источника часто домини- руют шумы рассмотренного здесь типа.
234 Глава 6 интенсивности. Необходима полная плотность распределе- ния этой величины. В этом пункте мы выведем приближенную формулу для этой плотности распределения, следуя подходу, использованному в работах Райса [6.7] и Манделя [6.6]. Прежде чем приступать к выводу этих приближенных ре- зультатов, сделаем некоторые замечания относительно пре- дельных форм плотности распределения. Во-первых, при вре- мени интегрирования Г, намного меньшем времени когерент- ности тс тепловой волны, интегральная интенсивность с очень хорошей точностью равна просто произведению мгновенной ин- тенсивности на время интегрирования Т: Т/2 W = J /(g)dg«/(O)r. (6.1.24) -Т/2 Поэтому с точностью до масштабного множителя плотность распределения величины W совпадает с плотностью распреде- ления мгновенной интенсивности, даваемой (в зависимости от поляризации волны) формулами (4.2.9), (4.2.13) или (4.3.42). В другом крайнем случае, когда время интегрирования на- много больше времени когерентности, то обстоятельство, что в пределах интервала Т имеет место много независимых флук- туационных всплесков мгновенной интенсивности, приводит к тому, что в соответствии с центральной предельной теоремой распределение величины W является асимптотически гауссов- ским. Как и во всех таких случаях, основывающихся на цент- ральной предельной теореме, нужна, однако, осторожность при использовании «хвостов» гауссовского распределения. Чтобы найти приближенную форму плотности распределе- ния pw(W) интегральной интенсивности, которая была бы при- годна при произвольных значениях Т и тс, мы прибегнем к сле- дующему «квазифизическому» методу. Плавно флуктуирующую кривую мгновенной интенсивности I (t) на интервале ( — Т/2, Т/2) приближенно можно заменить «многоступенчатой» функцией (рис. 6.2). Интервал ( — Т/2, Т/2) разобьем на m подынтервалов равной длины. Внутри каждого подынтервала примем для I(t) приблизительно постоянное значение; на кон- це каждого подынтервала приближенная функция скачком пе- реходит к новому постоянному значению, и при этом все ее предыдущие и все последующие значения считаются статисти- чески независимыми. Плотность распределения многоступенча- той функции внутри каждого интервала принимается равной плотности распределения мгновенной интенсивности в отдель- ный момент времени t [т. е. (4.2.9), (4.2.13) или (4.3.42) в за- висимости от состояния поляризации].
Некоторые задачи, когерентность высшего порядка 235 Интегральная интенсивность теперь аппроксимируется пло- щадью многоступенчатой кривой: Г/2 т т w= J = (6.1.25) -Т/2 i = l i = l где \t — ширина одного подынтервала многоступенчатой функ- ции, а //-—значение многоступенчатой функции в i-м интервале. Согласно принимаемой гипотезе, плотность распределения ка- ждого значения Л полагается равной плотности распределения Рис. 6.2. Аппроксимация плавно меняющейся мгновенной интенсивности /(/) «многоступенчатой» функцией мгновенной интенсивности. Кроме того, принимается также, что различные значения Л статистически независимы. В случае поляризованной тепловой волны характеристиче- ская функция переменной Л принимается (в соответствии с ре- зультатами задачи 4.2) равной М(й)= ' (6.1.26) 1 — Из наших гипотез прямо следует, что характеристическая функция величины W приближенно дается выражением мг(®)«Г—U- I 1 „ - L ' т “im (6.1.27) Из таблицы пар одномерных фурье-образов (приложение А) явствует, что соответствующая плотность распределения имеет
236 Глава 6 вид PwW)~ при Г>0, в других случаях, (6.1.28) где Г(т)—гамма-функция аргумента т. Плотность распреде- ления такого конкретного типа называется плотностью гамма- распределения, а о случайной переменной W говорят, что она (приближенно) относится к галглш-типу. Если далее рассматривать случай поляризованной волны, то остается еще один вопрос: параметры плотности распределения (6.1.28) должны быть выбраны таким образом, чтобы прибли- женные результаты лучше всего соответствовали истинной плотности распределения величины W. Единственные два из- меняемых параметра в выражении (6.1.28)— это I и т. Наи- более общий подход [6.4, 6.6, 6.7] таков: выбрать параметры I и m так, чтобы среднее значение и дисперсия, вычисленные на основе приближенной плотности распределения, точно равня- лись истинным среднему значению и дисперсии переменной W. Можно легко показать, что среднее значение и дисперсия в слу- чае гамма-распределения (6.1.28) имеют вид W = 1Т> (6.1.29) Таким образом, это среднее значение согласуется с истинным средним значением (6.1.4). Для дисперсии в случае прибли- женного распределения в согласии с истинным значением дис- персии (6.1.10) потребуем, чтобы выполнялось равенство [+°° Т 5 Л (т ) IY (т) I2 — оо АХ (6.1.30) Иначе говоря, число подынтервалов многоступенчатой функции должно быть выбрано равным числу ячеек когерентности, ко- торые влияют на результат измерения интегральной интенсив- ности. Заметим, что наши «квазифизические» соображения, кото- рые привели к приближенному распределению (6.1.28), ока- зываются в определенном смысле неверными, поскольку, во- обще говоря, параметр Л не есть целое число, тогда как мы предполагали, что число подынтервалов многоступенчатой функции целое. Поэтому здесь нам лучше отказаться от на-
Некоторые задачи, когерентность высшего порядка 237 глядной картины и рассматривать плотность гамма-распреде- ления как общее приближение к истинной плотности распреде- ления с параметрами, выбранными так, чтобы обеспечивалась максимальная точность приближения. Заметим далее, что хотя выбор параметров путем подбора среднего значения и диспер- сии представляется логичным, заранее нет оснований полагать, что такой выбор обязательно приведет к наилучшему согласию между истинной и приближенной плотностями распределения Рис. 6.3. Приближенная плотность распределения интегральной интенсивности поляризованного теплового излучения при разных значениях Л. при каждом значении W. Тем не менее такой подход, будучи простым, чаще всего используется. Итак, приближенную плотность распределения интегральной интенсивности поляризованного теплового излучения можно окончательно записать в виде при в других случаях. (6.1.31) График этой функции аргумента W при разных значениях М представлен на рис. 6.3. На основании рис. 6.1 величину Ж можно связать с Г/тс, если известен спектр света. Если тепловое излучение частично поляризовано, можно ввести аналогичную приближенную плотность распределения
238 Глава 6 интегральной интенсивности. При этом снова интегральная ин- тенсивность аппроксимируется многоступенчатой функцией, но принимается, что в t-м подынтервале интенсивность в этом слу- чае имеет характеристическую функцию М/(<о) = [(1 (1 + ^)7) (1 -/f (1 - Я/)]"1 (6.1.32) в соответствии с формулой (4.3.41). Тогда характеристическая функция интегральной интенсивности определяется выражением м» W ~[(1 -(I + -)т<) -(6.1.33) Возможны два подхода к отысканию плотности распреде- ления интегральной интенсивности. Один состоит в обращении в случае неполяризованного излучения. характеристической функции методом разложения на простые дроби, а другой — в простом вычислении свертки одномерных плотностей распределения интегральных интенсивностей ка- ждой поляризационной компоненты. Второй подход приводит к плотности распределения полной интегральной интенсивности вида _ V* Г 11/2 р (_ 2ЛЦУ А V Pw- ‘ 1(1— J (1 — ^2) ¥ У л <6Л34)
Некоторые задачи, когерентность высшего порядка 239 при W 0, где Л — снова величина (6.1.30), a —моди- фицированная функция Бесселя первого рода порядка Л — 1/2. В случае полностью неполяризованного света (5^ = 0) ха- рактеристическая функция сводится к виду ~2М (6-1.35) Детальный анализ показывает, что в этом случае выражение (6.1.34) принимает вид W'^-'exp (— / ‘2 Л _____________У______/ k W J Г (2Л} о при W 0, в других случаях, (6.1.36) в чем нетрудно убедиться, выполнив обратное преобразование Фурье выражения (6.1.35). На рис. 6.4 представлен график этого распределения при нескольких разных значениях Л В. Точное выражение для плотности распределения интегральной интенсивности Приближенными формами плотности распределения интеграль- ной интенсивности можно пользоваться во многих приложе- ниях, но интерес представляют также точные формы этих плот- ностей распределения. Точные результаты могут быть факти- чески найдены для определенных форм линий с применением разложения Карунена — Лоэва, рассмотренного в гл. 3, § 10. С некоторыми соображениями по данному вопросу читатель может ознакомиться в работах [6.8—6.10]. Мы рассмотрим здесь только случай полностью поляризованного теплового из- лучения. Начальные рассуждения будут носить совершенно об- щий характер, но затем мы сосредоточим свое внимание на случае излучения с прямоугольным контуром линии. Ранее мы выразили интегральную интенсивность W через аналитический сигнал и(0: Т/2 W = $ u(0u*(0^, (6.1.37) -Т/2 но здесь удобнее выразить W через комплексную огибающую и(0 = Т/2 W = J А(/)А*(0^> (6.1.38) —Т/2
240 Глава 6 для чего достаточно подставить величину и (/) = А (/) (6.1.39) в формулу (6.1.37). В то время как функция и(0 имеет поло- совой спектр, величина A(Q имеет спектр с преобладанием низ- ких частот, как это будет показано ниже в случае прямоуголь- ного контура спектральной линии. Начнем с того, что выполним разложение Карунена — Ло- эва [формула (3.10.1)] комплексной огибающей А(0 на ин- тервале (—Т/2, Т/2): оо A(/) = £b„q>„(0. RKp (6.1.40) п=0 Подставив это разложение в выражение (6.1.38), с учетом ор- тонормированности функций ^«(0 [формула (3.10.2)] получим оо оо Т/2 оо “7=ZEbx S Ф,(0Ф;«)л=^|ь,|г. (6.1.41.) n-Q m—Q — Т/2 п=0 Таким образом, случайная переменная W может быть точно представлена в виде бесконечной суммы случайных переменных |ЬЛ|2. Рассмотрим статистические свойства таких случайных переменных. Заметив, что в силу формулы (3.10.3) справедливо выра- жение Т/2 b„ = J A (t) <(/) dt, (6.1.42) -Т/2 читатель может убедиться (задача 6.10), что, поскольку ком- плексная огибающая А(/) поляризованного теплового излуче- ния ведет себя как круговая комплексная гауссовская перемен- ная, так же ведут себя и комплексные коэффициенты brt. Кроме ТОГО, при ТОМ условии, ЧТО функции ф/г(0 являются решениями интегрального уравнения т/2 J Гл(/2 —/|)ф„(/2)(//2 = Х„ф„(/1)) (6.1.43) -Т/2 коэффициенты Ь/г не коррелированы и, поскольку они являются гауссовскими переменными, независимы Что касается коэффи- циентов |Ь/г|2, то они тоже должны быть независимыми. Так как величина |Ь„|2 есть квадрат модуля круговой комплексной гауссовской случайной переменной, она должна подчиняться экспоненциальному распределению с отрицательным показатс-
Некоторые задачи, когерентность высшего порядка 241 лем. Из формулы (3.10.5) следует, что £[|Ь„|2] = Х„; (6.1.44) поэтому плотность распределения и характеристическая функ- ция величины |Ь«|2 таковы: hi. |2\ J-jT ь« 12/х« при |Ь„|2>0, Р|Ь |2(lb„l) = S Е (6.1.45) 1 л| 10 в других случаях, М|Ьп|2((0) = [1-/(оХ„]-1 (6.1.46) Таким образом, нам удалось представить интегральную ин- тенсивность W в виде суммы бесконечного числа статистически независимых случайных переменных, для каждой из которых известна характеристическая функция (предполагается, что собственные значения известны). Характеристическая функ- ция величины W соответственно этому дается выражением М1Г(<0) = П[1-М„]-1. /1=0 (6.1.47) Обращение этой характеристической функции дает точную плотность распределения в форме Pv (W) — "° П ('~v) (6.1.48) m=Q m n 0 в других случаях. Чтобы конкретизировать численные значения функции pw(W) при каждом значении W, нужно знать контур спек- тральной линии для данной оптической волны. Мы рассмотрим здесь только случай прямоугольного контура линии; случай ло- ренцевского спектра рассматривается в работах [6.11, 6.12]. Если первоначальная действительнозначная волновая форма имеет спектральную плотность мощности вида ^(Г. г) (v) = 2^0. |-rect 2 v rect , (6.1.49) то аналитический сигнал и(/) имеет спектр мощности (F (v) = 2Af0 rect (6.1.50)
242 Глава 6 О 2 4 6 в Ю 12 К 16 18 20 22 2k 26 с Рнс. 6.5. Зависимость от с при разных значениях п. Отсюда следует, что спектральная плотность мощности ком- плексной огибающей А(0 имеет вид ^(v) = 2^rect^, (6.1.51) а корреляционная функция дается выражением Гл(т) = 2Уо---"АуТ • (6.1.52) Соответственно этому функции <рл и постоянные должны быть собственными функциями и собственными значениями ин- тегрального уравнения Т/2 2Уо j ??пд"^2 ~<Р„ (О dt2 = Ш (6). (6.1.53) —Т/2 Решение интегрального уравнения Т/2 С Sin y, -/,) фп dt2 = % (fi) (6 ! 54) J -И- 02 — Н/ -Т/2 хорошо исследовано в литературе [6.13—6.16]. Собственные функции фл(0 действительнозначны и называются вытянутыми сфероидальными функциями. Собственные значения Хп (тоже действительные) протабулированы и опубликованы также в гра- фической форме (см. работы [6.13, 6.14]. Как q>„(0, так и зависят не только от и, но и от параметра (6.1.55)
Некоторые задачи, когерентность высшего порядка 243 На рис. 6.5 представлены кривые зависимости от с при раз- ных значениях п. Замечая, что IF = мы можем теперь рассчитать график зависимости Wpw(W/W) от W/W по фор- муле V \ 1 'FlJ. (6.1.56) m*=0 m^n Такой график при с =0,5, 1, 2, 4 и 8 представлен на рис. 6.6. Интересно провести сравнение точной и приближенной плот- ностей распределения при нескольких значениях Т/тс. Для удобства выберем сначала совокупность значений с, для ко- торых имеются таблицы, и затем преобразуем эти значения с в эквивалентные значения Т/тс, пользуясь формулой. (6.1.55). В случае значений с = 0,5, 1, 2, 4 и 8 мы имеем Т/хс = 0,319, 0,637, 1,273, 2,546 и 5,093. Затем по кривой для прямоугольного контура спектральной линии на рис. 6.1 определим с макси- мально возможной точностью значения Ж, соответствующие этим значениям Т/хс. В данном примере эти значения таковы: Ж = 1,05, 1,22, 1,80, 3,07 и 3,65. Наконец, по формуле (6.1.31) рассчитываются приближенные плотности распределения и на- носятся на график вместе с точными плотностями распределения. Рис. 6.6. Точное распределение интегральной интенсивности прн с = 0,5, 1, 2, 4. 8.
244 Глава 6 Рнс. 6.7. Точные и приближенные распределения интегральной интенсивности. Сплошные линии — точные результаты, штриховые линии — приближенные ре- зультаты. На рис. 6.7 показаны такие графики. Нетрудно видеть хо- рошее согласие между приближенными и точными плотностями распределения при малых и больших Г/тс, но при значениях Г/тс, близких к единице, наблюдаются заметные расхождения. § 2. Статистические свойства взаимной интенсивности при конечном времени измерения Комплексную взаимную интенсивность квазимонохроматической волны всегда можно интерпретировать физически, рассматри- вая амплитуду и пространственную фазу интерферограммы. Как теоретический, так и практический интерес представляет вопрос о предельной точности, с которой параметры такой ин- терферограммы могут быть измерены экспериментально. Дру-
Некоторые задачи, когерентность высшего порядка 245 гими словами, вопрос в следующем: какова в принципе пре- дельная точность, с которой может быть измерена взаимная интенсивность? Можно говорить о двух фундаментальных пределах этой точности. Один обусловлен дискретным характером взаимодей- ствия падающих волн и измерительного прибора. Это ограни- чение доминирует в любом эксперименте с истинно тепловым излучением и подробно рассматривается в гл. 9. Второе огра- ничение связано с классическими статистическими флуктуация- ми самого волнового поля и с (неизбежно) конечной длитель- ностью процесса измерения. Это последнее ограничение, которое часто играет основную роль в случае квазитеплового излучения, составляет содержание данного параграфа. Ниже мы рассмотрим статистические свойства взаимной ин- тенсивности, усредненной по конечному времени, Г/2 Л2(П = т i “(Р.. О и’ (Рг, (6.2.1) -Т/2 и в частности зависимость этих статистических свойств от дли- тельности измерения Г. Величина Ji2(T) является, конечно, про- сто мерой истинной взаимной интенсивности, которую здесь мы обозначаем через Jj2. Ясно, что при неограниченном увеличе- нии времени измерения Г, согласно определению величины Ji2, мы имеем lim J12(T) = J12. (6.2.2) T“>OQ Будем далее предполагать, что рассматриваемое излучение поляризовано и является тепловым или квазитепловым. Такое излучение моделируется эргодическими круговыми комплексны- ми гауссовскими процессами с нулевым средним. В конечном счете желательно знать статистические флук- туации амплитуды и фазы величины Ji2(T), но удобнее начать со статистических свойств действительной и мнимой частей ве- личины J12 (Т): 3?12(D = Re{JI2(r)}, /12(Г) = 1тр12(Г)Г Для облегчения анализа выразим 5?i2 и /12 через JI2(Z) и рассматриваемые поля1): ^12(Л = ур12(П + 4(П] = Т/2 , = j [u(P|t 0u’(P2, O + uVi. 0u(P2, t)]dt. (6.2.4) __________ -Г/2 l) Другой метод анализа см. в работе [6.17].
246 Глава 6 Аналогично для / 12(Г) мы имеем Z,, (D=-£-[.>,,(n-j;,(DJ = = 4г ( ')”'№ 0 — п*(^„ ')и(₽2. 01Л. (6.2.5) -Т/2 Наша первая задача — просто найти различные моменты ве- личин $?12(Г) и /12(Г). А. Моменты действительной и мнимой частей функции Ji2(T) Чтобы выяснить статистические свойства функции J12(Z), нуж- но сначала найти некоторые простые моменты действительной и мнимой частей $?12(Г) и /12(Г). Особенно важное значение имеют следующие моменты: 1) Средние значения 5?12 (Г) и у*12(Г); 2) Дисперсии ---------- -------- (6.2.6) ^=Я2(П-[Л2(П]2; 3) Ковариация С& = [Я12 (Г) - 3?|2(Т)] [/12 (Г) - >12 (Г)]. (6.2.7) Средние значения могут быть вычислены очень быстро и легко. Мы просто усредним выражения (6.2.4) и (6.2.5) по ста- тистическому ансамблю, что приведет к выражениям 0u’(P2, 0 + uV>. 0u(P2, f)]dt, (6.2.8) Zi2(n = -257 j [«(Pi, 0u’(P2. 0-u’(Pi> 0u(P2, 0И*. —T/2 Замечая, что u(P„ Ou*(P2. 0 = J12, (6.2.9) мы видим, что ^m=-j-[j,,+j;j=r= {•>„}. ______ , (6.2.10) Z12 (T) — ~2j~ [ J[2 J[2] = P12).
Некоторые задачи, когерентность высшего порядка 247 Таким образом, средние значения действительной и мнимой частей усредненной по конечному времени взаимной интенсив- ности равны действительной и мнимой частям истинной взаим- ной интенсивности. Вычисление дисперсий и ковариаций требует значительно большего труда. Мы проиллюстрируем это на вычислении а затем просто приведем результаты для и С^. Сначала вычислим второй момент &22(Т), из которого затем вычтем квадрат среднего значения [^12(Т)]2. Начнем с выражения [u (Pi, ^)и’(Р2. £) + u’(Pi, 1)и(Р2, &)]Х Х[и(Рь П)и*(Р2. П) + и*(Р1. П)и(Р2, я)]^^П- (6.2.11) .И Вычисляя среднее значение обеих частей уравнения, получаем W) =тМ $ 1“(P1’ S)“’(P2. £)u(Pb n)u*(P2, n) + -Т/2 + u(P|t S)u*(P2, g)u*(Pi, n)u(P2> n) + + u’(Plt &)u(P2, &)u(P„ n)u*(P2, П) + + u’(Plt g)u(P2, g)u’(P„ n)u(P2, я)] dl dn- (6.2.12) Каждый из четвертых моментов может быть разложен по тео- реме о моментах для комплексных гауссовских переменных, что приводит к выражению win =h[Г12 (о) Г12 (0)+Г12 & -п) Г12 (п _ Ю]+ + [Г12 (0) rj2 (0) 4- Г„ (g - я) Г22 (я -1)] + + [П2 (0) Г12(0) + Гц (т) — £) Г22 (В — т|)] + + [г;2 (0) г;2 (0) + г;2 (g - П) г;2 (П - g)]} di (6.2.13) где Гп (т), Г22(т) и Г12 (т) — функции собственной и взаимной когерентности полей и (А, 0 и и(Р2» 0» Теперь нам нужно сделать некоторые специальные предпо- ложения относительно характера функции взаимной когерент- ности Г12(т). Во-первых, предположим, что свет обладает взаимной спектральной чистотой. Тогда функцию взаимной ко- герентности можно записать в виде Г12(т) = У7^>12у(т). (6.2.14)
248 Глава 6 Во-вторых, без потери общности мы можем предположить, что комплексный коэффициент когерентности gi2 является действи- тельным, Это предположение просто равноценно выбору начала отсчета/ фазы, которое совпадает с фазой Ц12- После подста- новки (6.2.14) в (6.2.13) второй момент величины 5?12(Г) при- нимает вид Т/2 [H?2 + n?2v(g-n)v(n-g) + + Hf2 + v(£ — n) v(n — £) + Н?2 + v(n — ^)v(? — Tl) + + jif2 + jif2v(fc —n)v(n —l)]dgdr]. (6.2.15) Замечая, что у(Л — В) = V*(£ — л)» и приводя подобные члены, получаем Т/2 <(П = //2К?2 + тй- [1 + Н?2] $ $ I v (I - n) М dr]. (6.2.16) -Т/2 Среднее значение величины 5?12 (Т) равно просто VЛЛ Н12- Вычитая отсюда квадрат среднего значения, для дисперсии по- лучаем Т/2 4 (П = 4Й11 + Н?2] j J I V U - n) I2 dg dn. (6.2.17) -Т/2 Последнее упрощение связано с тем, что ]у|2 — четная функ- ция своего аргумента; это позволяет привести двойной инте- грал к одинарному [формула (6.1.6)]: ^(П = Л/2-Ц^ - $ л(у-)| y(t) |2dr . (6.2.18) L — СО J Заметив, что величина в скобках, согласно формуле (6.1.17), равна просто J?-1, получим конечный результат в виде 4(П = /,4-Ц^-. (6.2.19) Выполнив таким же образом вычисление дисперсии ог^ мни- мой части, найдем а2(Г) = //1=А. (6.2.20) Наконец, аналогичные вычисления показывают, что ковариа- ция С#/действительной и мнимой частей тождественно равна нулю: СЯ; = 0. (6.2.21)
Некоторые задачи, когерентность высшего порядка 249 Рнс. 6.9. Облака вероятностей для Л12(Г) при Т = 10тс н при разных значе- ниях Ц12-
250 Глава 6 В заключение данного пункта мы дадим сводку выражений для различных моментов, которые были выведены выше: ='х/1\12 Н12> У*12 (?) = 0, _,2 т т * ~Е ^12 о т т * ~ Нг /g о 22) 2Л ’ а> 2Л ’ * ’ С^/ = 0. Эти результаты могут быть сделаны более понятными с фи- зической точки зрения, если представить измеряемую величи- ну Ji2(T) в виде фиксированного фазора с длиной JI2=V^i^2 Hi2> направленного вдоль действительной оси, окруженного на своем конце «шумовым облаком». Измеренное значение Л12(Г) попа- дает в шумовое облако, и этим Ji2(F) отличается от истинной взаимной интенсивности Ji2. Если время измерения Т меньше времени когерентности тс, то, согласно рве. 6.1, мы имеем Л ж ~ 1. Шумовые облака, получающиеся при разных значениях pi2, показаны на рис. 6.8. Отметим, в частности, продолговатую форму шумовых облаков при значениях близких к единице, обусловленную различием, значений и ог^ в этом случае. Особый интерес представляет то обстоятельство, что если Ц12 = 1, то <rz = 0, и шумовое облако сжимается, становясь вы- тянутым вдоль действительной оси. Таким образом, при pi2 = 1 ошибок в фазе Ji2(T) не будет, каково бы ни было время ин- тегрирования! Этот математический результат просто указы- вает на то, что при |ni2 = 1 два интерферирующих пучка полностью когерентны и имеют постоянную разность фаз, не за- висящую от времени. Поэтому фаза интерференционной струк- туры, которую они создают, всегда равна истинной фазе взаим- ной интенсивности и не зависит от времени интегрирования. Если время интегрирования намного больше времени коге- рентности, то параметр Л становится равным Г/тс. Размеры шумовых облаков, показанные на рис. 6.8, соответственно это- му уменьшены в 'x/TjXc раз. На рис. 6.9 представлены резуль- таты для случая Т = 10тс. Б. Распределение модуля и фазы функции J12(T) при большом времени интегрирования и малых значениях Ц12 Предположим, что время интегрирования Т намного больше времени когерентности хс, как это обычно имеет место на прак-
Некоторые задачи, когерентность высшего порядка 251 тике. Тогда мы имеем УГ2 2 Т * а 1-Н12 (6.2.23) 2 Т • Кроме того, поскольку Т » Тс, величина Ji2(^) определяется как результат интегрирования величины u(Pj,/)и*(Р2, О по многим независимым флуктуационным интервалам. Непосред- ственно из центральной предельной теоремы следует, что при таких временах интегрирования величину Ji2(Z) приближенно можно считать комплексной гауссовской случайной переменной. Однако комплексная гауссовская случайная переменная не яв- ляется, вообще говоря, круговой (т. е. =/= <rz) и ее среднее значение не равно нулю. Благодаря отсутствию корреляции между величинами 5?i2(7) и Zi2(^) (и, следовательно, в пред- положении о гауссовском распределении, благодаря их стати- стической независимости) мы можем написать приближенно совместную плотность распределения в виде Ря^ (^12’ /|2) = 7^- еХР { “ (3г‘2 } Х X^-expJ-f^l. (6.2.24) Читатель, возможно, уже заметил сходство статистических свойств функции Ji2(Z) со статистическими свойствами суммы, состоящей из постоянного фазора и суммы случайных фазоров (гл. 2, § 9 п. Г). Однако имеется существенная разница между данным случаем и рассмотренным в гл. 2, § 9, п. Г. В рас- сматриваемом здесь случае действительная и мнимая части не равны друг другу, тогда как в предыдущем случае они равны. Поэтому, вообще говоря, статистические свойства величины и фазы функции Ji2(Z) не совпадают со статистическими свой- ствами случайных переменных А и 9 в гл. 2, § 9, п. Г. Статистические свойства суммы, состоящей из постоянного фазора и суммы случайных фазоров с различными дисперсиями вдоль действительной и мнимой осей, исследовались ранее в литературе [6.18]. Плотность распределения такой суммы ока- зывается зависящей от двух ключевых параметров — «коэффи- циента асимметрии» ^2Д4. = 1±ф (6.2.25)
252 Глава 6 и «отношения сигнала к шуму» Д-2Д (^2)^„+1F.2)2 =ц22Х. (6.2.26) аЯ + тс В данном пункте мы рассмотрим только случай, когда коэф- фициент асимметрии приблизительно равен единице, т. е. ко- гда |И12 < 0,3. В следующем пункте мы рассмотрим случай, ко- гда коэффициент асимметрии имеет любое значение, но отно- шение сигнала к шуму К? намного больше единицы. Эти два частных случая сравнительно легко проанализировать и объ- яснить с физической точки зрения. Если ц12 < 0,3 (л^2 ~ 1), то мы имеем ~ аи совместная плотность распределения действительной и мнимой частей ве- личины J12 (Г) принимает вид где <т2 = уЛ72^- (6.2.28) Отождествляя символы a, s, 0 и k2 из гл. 2, § 9, п. Г с новыми параметрами: a~|J12(7)|, s~VM2Hi2, 6 ~ arg {J12 (Г)} и k2 ~ ~ 2/(2, мы видим, что плотность распределения величины |Л12(Г)| определяется выражением (2.9.20), а величины arg{Ji2(T)} —выражением (2.9.25). Плотности распределения величин |Ji2(T) | и arg{Jj2(Т)}, которые мы теперь знаем при |Hi2 < 0,3, могут дать некоторую информацию, необходимую экспериментатору. Прежде всего отметим, что среднее значение величины |J12(T) | не совпадает с модулем истинной взаимной интенсивности |Ji2|, если интер- вал измерения Т конечен. В любой оценке величины |Ji2(T) |, выполненной с конечным временем, имеется детерминирован- ное смещение, обусловленное тем, что длина суммы, состоящей из фазора постоянной длины и случайного фазора, с большей вероятностью больше длины постоянного фазора, нежели мень- ше (рис. 6.10). Следовательно, если величину |J12(0 | много- кратно измерять путем определения амплитуды интерферограм- мы в интерференционном опыте с конечным временем измере- ния, то арифметическое среднее результатов таких измерений не будет точно равно амплитуде интерферограммы, которая получается при конечном времени интегрирования, даже если измерения с конечным временем повторить бесконечное число раз! Детерминированное смещение можно найти, вычислив сред- нее значение |Л12(Г)|. Разность величин |Л12(Г) | и [Ji2| ока-
Некоторые задачи, когерентность высшего порядка 253 зывается точно такой же, как и разность параметров а и s в гл. 2, § 9, п. Г. Если ввести «относительное смещение» А для нашей оценки в виде ______ д = I I — I J»?L ~ > (6.2.29) I J12 | то из выражения (2.9.23) мы получим (при /г2 = 2№) д=VS- '° (4-)+(-¥-)] -L <6-2-зо) График зависимости А от № представлен на рис. 6.11. Заме- чая, что = (6.2.31) мы видим, что с увеличением времени интегрирования Т отно- сительное смещение А монотонно уменьшается. Рнс. 6.10. Сумма, состоящая нз по- стоянного фазора s и кругового ком- плексного гауссовского фазора. Пло- щадь контура постоянной плотности распределения, лежащая слева от штриховой линин, пропорциональна вероятности того, что длина суммар- ного фазора меньше длины s, а пло- щадь, лежащая справа, пропорцио- нальна вероятности того, что длина суммы больше s. Рнс. 6.11. Зависимость отно- сительного смещения А от №. В дополнение к детерминированной ошибке, характеризуе- мой смещением А (см. рис. 6.11), существуют также случайные ошибки, обусловленные конечным временем интегрирования Т. Их удобно характеризовать среднеквадратичным отношением
254 Глава 6 сигнала к шуму, связанным с измерением величины |Ji2(T) |: / \ __________I Ji2 (Г) |____„ ~ а _______ /g 2 32) Itf/CKB [ । (D I2 “ [ I J12W ]2]1/2 Va2-(a)2 ’ Используя формулы (2.9.23) и (2.9.24) для а и а2 и снова подставляя k2 = 2№2, получаем Этот результат представлен ствует среднеквадратичному на рис. 6.12. Он точно соответ- отношению сигнала к шуму при Рис. 6.12. Среднеквадратичное отношение сигнала к шуму, ха- рактеризующее измерение вели- чины |Л12(Г)|. Асимптотиче- ское значение 1,913 слева — это отношение среднего значения к стандартному отклонению для рэлеевского распределения, Рис, 6,13. Зависимость стан- дартного отклонения а0 фазы величины □12(7') от №. Асимп- тотическое значение 1,814 рад— это стандартное отклонение фазы, однородно распределен- ной на интервале (—л, л). Н12 < 0,3. Заметим, что при К2 > 5 среднеквадратичное отно- шение_сигнала к шуму растет с увеличением К пропорциональ- но V2 К и, следовательно, пропорционально квадратному кор- ню из времени интегрирования. Рассмотрим, наконец, статистические свойства фазы Ji2(T). Поскольку площадь контуров плотности распределения фазы этой величины выше и ниже действительной оси на рис. 6.10 одинакова, фаза величины {Ji2(^)} есть, очевидно, несмещен- ная оценка фазы J12. Иначе говоря, ^[arg {J12 (Г)}] = arg{J12}. (6.2.34) Это следует также из симметрии плотностей распределения фазы, показанных на рис. 2.15. Экспериментальные ошибки измерения фазы характери- зуются стандартным отклонением этой фазы ое. Чтобы найти ое, нам нужно вычислить второй момент довольно сложной
Некоторые задачи, когерентность высшего порядка 255 функции — плотности распределения фазы, определяемой вы- ражением (2.9.25). Это стандартное отклонение можно найти путем численного интегрирования при каждом значении К2] результаты таких вычислений представлены на рис. 6.13. При малых К2 величина ое стремится к значению, равному 1,814 рад, — стандартному отклонению для случая фазы, одно- родно распределенной в интервале (—л, л). При больших же значениях К2 величина ое уменьшается по закону (V2K)-1. И здесь результаты являются точными только при щг < 0,3. Напомним читателю, что все выводы, сделанные в данном пункте, справедливы тодько в том случае, если время интегри- рования Т намного больше времени когерентности тс света (на- пример, Т> 10тс). При меньших же временах интегрирования предположение о комплексном гауссовском распределении J12 (Т), вообще говоря, неверно. В. Статистические свойства модуля и фазы функции J12(Т) при большом отношении сигнала к шуму Хотя общая задача о характере распределения величин I Ji2(O | и arg{J 12(Г)} при произвольном Ц12 здесь не рассмат- ривается, даже когда Т тс, в одном частном случае, пред- ставляющем интерес, мы можем установить, каково это рас- пределение. Предположим снова, что Т тс и, следовательно, распределение величин 5?12(Г) и можно считать гаус- совским. Однако здесь мы допустим, что коэффициент асим- метрии может иметь любое значение между 1 и оо (или, что то же самое, что (ulI2 может иметь любое значение между 0 и 1). Мы потребуем только, чтобы было большим отношение сигнала к шуму К2 1, или —»4- (6-2-35) н12 причем практически достаточно, чтобы это отношение было по- рядка 10. Если К 2 1, то величина Ji2(T) всегда будет очень близка к идеальному значению J12, так как шумовое облако имеет раз- меры, малые по сравнению с длиной постоянного фазора. Как следствие этого, в согласии с изложенным в гл. 2, § 9, п. Д, с хорошей точностью можно рассматривать флуктуации вели- чины |Л12(Г) |, как обусловленные главным образом действи- тельной частью шумового фазора, а флуктуации величины arg{Ji2(r)}—мнимой частью шумового фазора. Следуя рас- суждениям, которые привели к формуле (2.9.27), мы приходим к выводу, что в силу гауссовского распределения величины 5?12(Г) величина |Л12(Г)| является приближенно гауссовской
256 Глава 6 с плотностью распределения Р, ( I J.2(DI) = -7=— expf - (lJ'2(nl -V777H.2)21 ( (6 2 36) где снова ^='Л-ЦА-г- <6-2-37) Среднеквадратичное отношение сигнала к шуму, связанное с | J12 (Г) |, определяется выражением / \ Р12 _ Г 2Н12 Т Л1'2 ХЛ^СКВ L 1+М12 Хс J Заметим далее, что, как явствует из симметрии гауссовской плотности распределения (6.2.36) относительно среднего зна- Рис. 6.!4. Зависимость стандартного отклонения а0 фазы величины Ji2(P) от К2 при разных значениях gi2. чения (Ji2|, детерминированное смещение, связанное с |Л12(Г)|, при большом отношении сигнала к шуму пренебре- жимо мало. Что касается фазы величины Ji2(T), то мы предположим, что ее флуктуации обусловлены в основном флуктуациями ве- личины Zi2(^), дисперсия которых такова: а2=7,72-Ц^^-. (6.2.39) Поскольку величина /12(Г) является гауссовской с нулевым средним, тангенс угла arg{J12(7)} также является гауссовской переменной. Далее, в приближении большого отношения сиг- нала к шуму тангенс и угол приблизительно равны. Следова- тельно, если 0 = arg{J12 (Т)}, то мы имеем Ре (6) 1 ( е2 1 = 7--------еХР <-------9" > ’ ае } 2П0 ) (6.2.40)
Некоторые задачи, когерентность высшего порядка 257 где (Т Г 1 — LL2 11/2 ___ __ 1 Н12 I IJ12I — L № J (6.2.41) Приближения, использованные здесь, весьма точны при ое < 0,2 рад и при любом значении К2, большем 10. На рис. 6.14 представлены кривые зависимости от К2 при разных значе- ниях Ц12. По этим кривым можно определить максимально воз- можную точность измерения arg{J12(T)} при № > 10. Еще раз обращаем внимание читателя на то обстоятель- ство, что при приближении комплексного коэффициента коге- рентности Ц12 к единице ошибки в величине 0 стремятся к нулю. Как указывалось ранее, в этом находит выражение просто то, что разность фаз двух в высокой степени когерентных пучков остается почти постоянной. § 3. Классический анализ интерферометра интенсивностей Понятия пространственной и временной когерентности световых волн естественным образом возникают при рассмотрении опы- тов с интерференцией двух световых пучков. Эффекты коге- рентности могут также наблюдаться в несколько менее про- стом (но зато в некоторых отношениях более удобном) интер- ференционном устройстве — так называемом интерферометре интенсивностей. Такое устройство, идея которого была предло- жена и впервые осуществлена Брауном и Твиссом [6.19—6.23], для понимания своего принципа действия требует использова- ния понятия когерентности более высокого, чем второй, поряд- ка. В книге Брауна /[6.24] описывается как замечательная история возникновения идей, лежащих в основе такого интер- ферометра, так и технические разработки, которые привели к созданию большого астрономического инструмента подобного рода в Наррабри (Австралия). Мы сначала будем вести изложение на качественном уров- не, концентрируя внимание прежде всего на основной схеме интерферометра. Затем перейдем к анализу, который покажет, как с помощью, интерферометра интенсивностей можно полу- чить информацию о модуле комплексного коэффициента коге- рентности. В заключение кратко обсудим одну составляющую шума, связанную с выходом интерферометра. Все изложение будет вестись исключительно в рамках классических представ- лений. Такой анализ непосредственно приложим к радиодиа- пазону спектра. Однако читатель должен иметь в виду, что для полного анализа возможностей и ограничений такого интер-
258 Глава 6 ферометра на оптических частотах необходима детальная мо- дель процесса преобразования светового сигнала в фототок фо- топриемника. Такие вопросы, касающиеся дискретного харак- тера взаимодействия света с веществом, будут рассматривать- ся в гл. 9, где снова пойдет речь об интерферометре интенсив- ностей. А. Амплитудный интерферометр и интерферометр интенсивностей Ранее мы видели (гл. 5, § 2), что в случае квазимонохромати- ческого света комплексный коэффициент когерентности Ц12 света, падающего в две точки Pi и Р% пространства, можно из- мерить, проведя интерференционный опыт Юнга. Световые вол- ны, достигающие точек Pi и Р2, разделяются при помощи двух малых отверстий. После прохождения через эти отверстия две составляющие света распространяются как сферические волны, перекрываясь в конечном счете на экране наблюдения или на непрерывном фотоприемнике, таком, например, как фотографи- ческая пленка. Обе волны складываются по амплитуде, а за- тем регистрируются фотоприемником, чувствительным к интен- сивности, т. е. квадратичным детектором. Такой процесс реги- страции характеризуется большой постоянной времени, что приводит к усреднению. Пространственное распределение усредненной по времени интенсивности представляет собой си- нусоидальную интерферограмму, видность которой несет ин- формацию о модуле комплексного коэффициента когерентности |ц1г|, а пространственное расположение — информацию о фазе величины Ц12. Возникает вопрос: а нельзя ли изменить порядок выполне- ния некоторых операций, осуществляемых в интерференционном опыте Юнга? В частности, нельзя ли получить информацию о Ц12, если регистрировать световые волны фотоприемниками непосредственно в точках падения Pi и Р2, затем складывать два флуктуирующих фототока в нелинейном электронном устройстве, а результат такого сложения усреднять во време- ни? Как мы увидим ниже, это возможно, но, вообще говоря, получаемая информация будет неполной. На рис. 6.15 представлена общая схема интерферометра ин- тенсивностей. Высокочувствительные и широкополосные фото- приемники (обычно фотоэлектронные умножители — ФЭУ) не- посредственно регистрируют свет, падающий в точки Pi и Р2. В простейшей классической модели процесса регистрации, в которой не учитывается дискретный характер взаимодействия света с фоточувствительнымн элементами (так же как и дру- гие возможные причины шума), фототоки, генерируемые двумя
Некоторые задачи, когерентность высшего порядка 259 фоточувствительными поверхностями, пропорциональны мгно- венным интенсивностям света, падающего на них. Эти токи подвергаются временному сглаживанию из-за конечных времен отклика (или ограниченной ширины полосы пропускания) структуры фотоумножителя и соответствующей электронной схемы. Эти неустранимые операции сглаживания на схеме представлены линейными фильтрами с импульсными отклика- ми h(t), которые для простоты мы будем считать одинаковыми в обоих плечах интерферометра. Поскольку информацию относительно корреляции и коге- рентности двух световых пучков несут только флуктуации двух Рис. 6.15. Интерферометр интенсивностей. фототоков относительно их постоянных, или средних, значений, постоянные составляющие этих двух токов исключаются до их сложения. При помощи фильтров с импульсными откликами a(t), которые производят усреднение по большим временам ин- тегрирования [т. е. фильтр a(t) имеет значительно меныпую ширину полосы, чем h(t)], формируются постоянные состав- ляющие фототоков и вычитаются из двух электрических сиг- налов, как это показано на рис. 6.15. Эти постоянные состав- ляющие необходимы далее для нормировки, а потому они так- же представлены на выходе электрической схемы. Оставшиеся флуктуирующие составляющие АгДО и А/2(/) складываются и поступают на схему умножения, выполненную на основе нелинейного электронного устройства. Произведение двух фототоков Ati (QAj2(0 затем подвергается усреднению за большое время снова посредством фильтра с импульсным от- кликом Таким образом, интерферометр дает три выход- ных сигнала: два пропорциональны средним значениям фото- токов, а третий — ковариации этих двух фототоков. Детальное обсуждение преимуществ и недостатков интерфе- рометра интенсивностей в сравнении с более простым ампли- тудным интерферометром мы отложим до гл. 9. Здесь же про-
260 Глава 6 сто скажем, что интерферометр интенсивностей менее чувстви- телен к несовершенствам оптических элементов, к неполному равенству оптических путей и эффектам «видения» через ат- мосферу (гл. 8), нежели амплитудный интерферометр. Главный недостаток интерферометра интенсивностей — сравнительно низкое отношение сигнала к шуму, из-за чего обычно требуют- ся большие времена измерения. Б. Идеальный выходной сигнал интерферометра интенсивностей В данном пункте мы найдем выражение для идеального сиг- нала на выходе интерферометра интенсивностей. Мы говорим об идеальном сигнале в том смысле, что пренебрегаем всеми видами шума. Время усреднения фильтров с импульсным от- кликом a(t) будем предполагать бесконечно большим. В соответствии со схемой рис. 6.15 и полностью классиче- ским характером нашего анализа представим флуктуирующие токи в виде (6.3.1) а/2(0 = «2 J А(/ ——<4(0>, —со где <Х1 и аг — постоянные двух фотоприемников, и /2(/) — мгновенные интенсивности падающего света в точках Pi и Р2, a h(t)—импульсный отклик, определенный ранее. Предполо- жим, что случайные процессы п(/) и t2(0—эргодические; то- гда усреднение по бесконечному времени можно заменить усреднением по ансамблю. Наша цель в том, чтобы найти ма- тематическое ожидание (среднее значение) тока на выходе ФЭУ, поскольку это та величина, которая даст информацию о комплексном коэффициенте когерентности. Усредненное произведение Ам(/) и А/2(/) можно записать в виде z = A/I(0A/2(0 = + 00 = «,0, h (t -1) h (t - n) /t(g)/2(n) dg dx\ - //2, (6.3.2) — CO где изменены порядки выполнения операций усреднения и ин- тегрирования. Чтобы далее преобразовать это выражение, мы должны выбрать определенную форму для второго момента мгновенных интенсивностей.
Некоторые задачи, когерентность высшего порядка 261 В этом месте мы сделаем очень важное предположение о том, что на наши фотоприемники падает поляризованное теп- ловое излучение. Тогда на основании теоремы о моментах для комплексных гауссовских переменных можно показать, что Л (5)/2(n)=M)u;(g)u2(n)u;(n) = г__ (о) г22 (о) +1 г12 (g - П) |2, (6.3.3) где Гц(т), Г22(т) и Г]2(т)—две собственные и одна взаимная функция когерентности случайных полей. Подстановка выра- жения (6.3.3) в формулу (6.3.2) с учетом того, что 4- со а1а2Ц/1(/-5)/1(<-п)Ги(0)Г22(0)4^т1 = Ц2> (6.3.4) — со приводит к результату 4-со z=№ J J h(t-l)h(t - п)|Г12(? - n)l2 dgdn. (6.3.5) — co Дальнейшее упрощение возможно, если предположить, что па- дающий свет обладает взаимной спектральной чистотой. Тогда 4-со z = 1 м1212 Ц h (t — g) h (t — n) I V — n) I2 dx\- (6.3.6) — oo Тем самым мы уже показали, что средний ток, или постоянная составляющая тока, на выходе схемы умножения пропорцио- нальна квадрату модуля комплексного коэффициента когерент- ности. Остается вычислить коэффициент пропорциональности. Чтобы взять двойной интеграл в формуле (6.3.6), произве- дем вначале замену переменных £ = £ — Ц, которая (зада- ча 3.14) приводит к следующему выражению: 4- со 4- со j $M/-£W-n)lv(£-n)l2dUn= 5 Я(£)1У©М, (6.3.7) — со —со где 4-оо Я(0= $ + (6.3.8) —оо Чтобы продвинуться дальше, сделаем некоторые довольно спе- циальные предположения относительно спектральной’плотности мощности света и передаточной функции фильтров Ж(v). Для простоты предположим, что нормированная спектральная
262 Глава 6 плотность мощности света имеет прямоугольный вид с централь- ной частотой у и шириной полосы Ду: (6.3.9) Предположим, что электрические фильтры имеют прямоуголь- ные передаточные функции с нулевой центральной частотой и частотами обрезания ±В: 3r{ft(/)} = ^(v) = rect-^-. (6.3.10) Для истинно теплового излучения оптическая ширина полосы— порядка 1013 Гц или более, тогда как электрическая ширина полосы фотоприемников и схемы редко бывает больше ~108Гц. Следовательно, условие Av В хорошо выполняется. Чтобы взять интеграл в формуле (6.3,7), мы по теореме Парсеваля из фурье-анализа вычислим площадь кривой произ- ведения фурье-образов функций Н(х) и |у(т) |2. На основании автокорреляционной теоремы из фурье-анализа получаем 3r{/7(T)} = |^(v)|2 = rect-^-, 4 сю ^{Iv(t)I2}= J + (6.3.11) — сю где А(х)=1—|х| при |х|^1 и А(х) = 0 в других случаях. Итак, интересующий нас интеграл может быть записан в виде 4-оо 4-00 $ W(S)IV©M = ^ ( ™‘(-йг)л(^)Л—£. (6.3.12) — сю —сю где знак приближенного равенства справедлив при В <С Ду, Результаты нашего анализа могут быть теперь подытожены следующим образом. В соответствии с предположениями, сде- ланными выше, среднее значение, или постоянная составляю- щая, сигнала на выходе схемы умножения дается выражением z = ala2/i/2lHi2l2^7- (6.3.13) Последний усредняющий фильтр пропускает эту составляющую без изменений. Кроме того, мы имеем на выходе отдельные сигналы фототоков Ц и i2, которые (при сделанных предполо- жениях) могут быть представлены в виде [формула (6.3.4)] 4-сю И=а1Л 5 — = — сю i2 = а2/2. (6.3.14
Некоторые задачи, когерентность высшего порядка 263 Нормировка выходного сигнала коррелятора на эти две вели- чины приводит к выражению ? = ^- = |ц12|2-^-. (6.3.15) Зная В и Av, мы можем найти | р12|. Заметим, что на выходе интерферометра нет сигнала фазы величины ц12. Следствия потери фазовой информации мы рассмотрим в гл. 7, где речь пойдет о методах формирования изображения на основе ин- терферометрических данных. В. «Классический», или «собственный», шум на выходе интерферометра Существуют различные виды шума, которыми ограничиваются возможности интерферометра интенсивностей. В случае истин- но теплового излучения в оптической области спектра основным видом шума почти всегда является дробовой шум, связанный с выходным сигналом фотоприемника. Этот вид шума детально изучается в гл. 9. Вторым видом шума, который может быть основным в диапазоне радиочастот и который, вообще говоря, нельзя считать пренебрежимо малым в случае квазитепловых оптических источников, является «классический», или «собствен- ный», шум, обусловленный конечной шириной полосы усредняю- щих фильтров. Он возникает из-за случайных флуктуаций самих оптических волн. Полный анализ эффектов усреднения по конечному времени должен включать оценку неопределенностей всех трех средних значений <г2> и <А6Аг2>. Но мы для простоты пренебрежем неопределенностями величин <й> и <г2>. Предположение о том, что две последние величины известны гораздо точнее, чем <A/iAt2>, часто соответствует действительности, поскольку обыч- но приходится проводить исследования при нескольких или многих различных значениях расстояния между отверстиями, и поэтому величины <и> и <г2> наблюдаются на гораздо большем числе интервалов усреднения, чем величина <AiiAz2>, отвечаю- щая какому-либо одному значению расстояния. Общий подход к вычислению отношения сигнала к шуму на выходе интерферометра состоит в следующем. Сначала вы- числяют автокорреляционную функцию Гг(т) сигнала на выходе умножителя. Затем выполняют преобразование Фурье этой вели- чины, чтобы получить спектральную плотность мощности вели- чины г, после чего пропускают этот спектр через усредняющий фильтр, чтобы найти мощности выходного сигнала и собствен- ного шума. Отношение этих величин дает требуемое отношение сигнала к шуму.
264 Глава 6 Автокорреляционная функция выходного сигнала схемы умножения дается выражением Tz (т) = м\ (t + т) АЛ (t + т). (6.3.16) Так как (/) = ik (/) — ik (/) (&=1, 2), вычисление величины Гл(т) требует определения четвертого, третьего и второго сов- местных моментов величины Л(0. Кроме того, поскольку 4- оо ik(t) = ak J h(l-V\Uk(g)\2dl, (6.3.17) — со вычисление величины Гг(т) потребует в конечном счете исполь- зования восьмого, шестого, четвертого и второго совместных моментов полей. Такие моменты можно найти в случае тепло- вых источников (теорема о моментах для комплексных гауссов- ских переменных), но подобные вычисления требуют очень много труда и времени, и поэтому мы изложим здесь несколько более простой приближенный подход. Вычисления упрощаются, если предположить, что оптиче- ская ширина полосы Av падающего излучения намного больше ширины полосы В электрических сигналов, поступающих на вход схемы умножения. Такое предположение уже делалось в предыдущем пункте по другим соображениям. Оно хорошо вы- полняется для истинно тепловых источников, но требует осто- рожности в случае квазитепловых источников. Если действи- тельно Av В, то из выражения (6.3.17) видно, что электри- ческий ток ik(t) в любой момент времени равен интегралу по большому числу интервалов корреляции полей падающих волн. Поскольку поля падающих волн рассматриваются как ком- плексные круговые гауссовские случайные процессы (тепловое излучение), отсутствие корреляции означает их статистическую независимость; каждый ток в действительности равен сумме большого числа статистически независимых вкладов, а вслед- ствие этого в силу центральной предельной теоремы токи u(f) можно в хорошем приближении считать действительнозначными гауссовскими случайными процессами. Коль скоро ik (f) — приблизительно гауссовский случайный процесс, чтобы упростить выражение для Гг(т), можно вос- пользоваться теоремой о моментах для действительных гауссов- ских случайных переменных [формула (2.7.13)]. Приняв для ковариационной функции /-го и &-го токов (/ = 1, 2; /г=1, 2) определение Clk (т) = А/ДОА/^ + т), (6.3.18) для интересующей нас автокорреляционной функции получим rz (т) = С?2 (0) + Ct, (т) С22 (т) + с?2 (т) (6.3.19)
Некоторые задачи, когерентность высшего порядка 265 с учетом того, что (т)= С]2(—т)= С12(т), так как токи — действительные величины. Величина С/*(т) вычисляется тем же способом, что и х (см. выше). Так как г = С12(0), нужно лишь при повторении вычислений вставить в соответствующие места величину т. В результате получим 4-00 См(т) = а/а//7А|ц/А|2 J Я (£ + т)| у (£) М, (6.3.20) где Н — по-прежнему величина (6.3.8). Подставляя С/*(т) в выражение для Г/(т), находим j- 4-°° Гг(т) = |а|а27172|ц|2|2 J Н (£) | у (&) I2 + L — со J _ Д-со — 2 + |а1а2/1/"2 J Я(£4-т)|у(£)М + |- СО —|2 + |a1a27/2|g12|2 J Я(& + т)|у(?)М • (6.3.21) Первый член в этом выражении представляет собой квад- рат среднего значения величины г; так как он не зависит от т, он вносит компоненту типа 6-функции в спектральную плот- ность мощности ^z(v). Площадь кривой этой функции равна мощности, связанной с «сигнальной», или идеальной, компо- нентой выходного сигнала. Используя те же предположения и приближения, что и в предыдущем пункте, для мощности вы- ходного сигнала получаем выражение вида [ср. формулу (6.3.13)] Ps=[ala2/'l/’2|gl2|2-^-]2. (6.3.22) Чтобы найти шумовую мощность на выходе усредняющего фильтра, мы должны выполнить преобразование Фурье послед- них двух членов в выражении (6.3.21) и умножить полученное спектральное распределение на квадрат модуля передаточной функции усредняющего фильтра. Сначала заметим, что в слу- чае спектра вида (6.3.9) и передаточной функции вида (6.3.10) теорема Парсеваля позволяет нам написать [формула (6.3.12)] 4-00 4-00 5 Щ£ + г)|у(£)12^= $ rect^A(^)e-^dv. (6.3.23) —оо —оо
266 Глава 6 Очевидно, что фурье-образ этой величины (по переменной т) таков: И J Я($ + т)|у©мЛ = [-^гес1-^-]л(^-)« Ч —оо ) ~дТгес11Т (5«Av). (6.3.24) В соответствии с автокорреляционной теоремой фурье-образ квадрата этого интеграла должен иметь вид Z Г* Ч" 00 —| 2 X оо Н й+ т) V© |=dtj | = (^-)' red (iti) rect А</р= =-ДЛШ- (6ЯЯ> Следовательно, согласно формуле (6.3.21), спектральная плот- ность мощности шумовой составляющей сигнала на выходе схемы умножения определяется выражением №z (V)k = Ж(1 + I И.214) Л (-^). (6.3.26) Этот шумовой спектр проходит через усредняющий фильтр с предполагаемой передаточной функцией e*(v) = rect-^- (&<В). (6.3.27) Прошедшая через фильтр шумовая мощность определяется как 4-00 PN = J l^(v)|2[^(v)]wdv, — оо откуда с помощью интегрального тождества 5 rectl& Л (‘2В’) dv = 26 (1 — ‘4В’) — ОО (справедливого при Ь^.В) найдем (6.3.28) Итак, отношение мощностей сигнала и шума при предположениях, а именно при 8« Av, равно ps 1НгГ в/ь pN » + IW (1-А-) ' (6.3.29) (6.3.30) сделанных (6.3.31)
Некоторые задачи, когерентность высшего порядка 267 Среднеквадратичное значение отношения сигнала к шуму на выходе равно квадратному корню из этой величины: (—) = -J-Hid2- /—S/&----- (6.3.32) WCKB V' + lfMl4 У (1 -b/iB) Очевидно, что чем шире полоса пропускания фильтра В до перемножения сигналов и чем уже полоса b после перемноже- ния, тем больше окончательное отношение сигнала к шуму. Мы видим далее, что в предположении В < Av оптическая ширина полосы не влияет на отношение сигнала к шуму. Если модуль комплексного коэффициента когерентности меньше ~0,4, то первый множитель в выражении (6.3.32) с точностью до 1 % равен | Ц12|2. Когда же_ |р12| стремится к единице, этот множи- тель стремится к 1/V2* В заключение напомним читателю, что полученное выраже- ние для отношения сигнала к шуму учитывает только класси- ческий, или собственный, шум. Отношение же сигнала к шуму на оптических частотах обычно определяется в основном фо- тонными флуктуациями, о которых речь пойдет в гл. 9. Даль- нейшее обсуждение интерферометрии интенсивностей мы отло- жим до этой главы. Задачи 6.1. Покажите, что в случае квазимонохроматического стацио- нарного теплового излучения функция когерентности чет- вертого порядка Г1234^Ь ^2> ^3> Ц) = Е [и (рь ^)и(Р2> ^2) и (Ль /з)и (?4> ^)] может быть представлена в виде 1*1234(6. z2. <3. Q = VW3/4 [Н13Ц24 + Ц14Ц23] где £[и(Рт, /)и*(Ря, /)] Цтп .V£[|u(Pm, /) |2]£ [ | и (Р„, 0121 ' 6.2. Выходное излучение одномодового хорошо стабилизиро- ванного лазера проходит через пространственно-распреде- ленный фазовый модулятор (например, прозрачную аку- стическую кювету). Поле, наблюдаемое на выходе моду- лятора в точке Pk, имеет вид О = л/Ik ехр {— / [2jcv0^ — ф (Рк, 0]}, где vo — частота лазера, 1к— интенсивность в точке Pk и (f>(Pk,t)—фазовая модуляция, сообщаемая волне в точке
268 Глава 6 Р*. Фазовая модуляция рассматривается как стационар- ный гауссовский случайный процесс с нулевым средним. Заметив, что Аф = <p(Pi, /)—ф(Рг, О тоже стационарный гауссовский процесс с нулевым средним, покажите, что функция когерентности второго порядка модулированной волны имеет вид Г,2 (ti — t2) = -y/TJ^ e"/2ltV0 (''!)е"°ф[1''1ф(РГ Р2- где — дисперсия величины <р(Р,/) (предполагается не зависящей от Р), а — нормированная взаимная корре- ляционная функция величины ф(Рь/) и ф(Р2, О- 6.3. Покажите, что в случае излучения задачи 6.2 для функ- ции когерентности четвертого порядка выполняется тео- рема факторизации Г1234 (^b hi Q = ехР { /2Л¥0(^+4—h ^)} X у I Угэ (^2 — /з) Via (Л h) V24 (?2 ~~ h) V14 (Л ^4) | 24 I V12(/l-/2)V34(/3-/4) Г 6.4. Время корреляции %с некоторого квазитеплового источни- ка равно 10~4 с. Интерференционный опыт Юнга выпол- няется в условиях квазимонохроматичности при (uli2 ~ 0,01. Амплитуда и фаза интерферограммы измеряются при ко- нечном времени интегрирования Т. а) Как велико должно быть время интегрирования Т, чтобы относительное смещение А было меньше 0,01? б) Как велико должно быть Г, чтобы амплитуда интер- ферограммы измерялась со среднеквадратичным отноше- нием сигнала к шуму, равным 100? в) Как велико должно быть Г, чтобы фаза 0 интерферен- ционной структуры измерялась со стандартным отклоне- нием сте, меньшим 2л/100? 6.5. Покажите, что в случае гауссовского контура спектраль- ной линии параметр Ж в формуле (6.1.17) точно равен выражению 6.6. Покажите, что в случае лоренцевского контура спектраль- ной линии параметр Л дается выражением 6.7. Как явствует из рис. 6.5, зависимость от п обнаружи- вает довольно резкий порог. В частности, очень прибли-
Некоторые задачи, когерентность высшего порядка 269 женно можно написать ( 1 при п < пкрнт, "~(,0 При п > Пкрит, где Пкрит = 2с/л. Покажите, что такое приближенное рас- пределение приводит к гамма-распределению величи- ны W. Сравните число пКрит с параметром Л. 6.8. Предположим, что в интерферометре интенсивностей, опи- санном в § 3, фильтры на выходе фотоприемников имеют импульсные отклики Zt(/) = y- rect-jr, а (/) = 4- rect -4-. -*2 *2 В тех же предположениях, что и в § 3, п. Б и В, вычис- лите: а) г; б) Pn\ в) (S/N) СКВ- 6.9. Как изменится выражение (6.3.32), если свет, падающий на фотоприемники, частично поляризован? 6.10. Рассмотрите статистические свойства коэффициентов Ьл, определяемых выражением (6.1.42): Т/2 ь„= j а(/)ч>;(ол, -Г/2 где A(t)—стационарный круговой комплексный гауссов- ский случайный процесс, а <рп(/)—произвольная ком- плексная весовая функция. На основании чего можно утверждать, что действитель- ные и мнимые части величин Ьп являются гауссовскими случайными переменными? С учетом свойства циркулярности процесса А(0 пока- жите: а) что E[Re(b„)] = E[Im(b„)] = 0; б) что E{[Re(be)H = E{[Im(b„)n; в) что Е [Re (b„) 1ш (Ь„)] = 0. Указание: см. формулу (2.8.20). ЛИТЕРАТУРА 6.1. Picinbono В,, Boileau Е. — J. Opt. Soc. Am., 1968, v. 58, p. 784. 6.2. Mandel L. — Proc. Phys. Soc., 1958, v. 72, p. 1037. 6.3. Lowenthal S., Joyeux У. — J. Opt. Soc. Am., 1971, v. 61, p. 847.
270 Глава 6 6.4. Goodman J. IT. — Proc. IEEE, 1965, v. 53, p. 1688. 6.5. Bures J., Delisle C., Zardecki A.— Can. J. Phys., 1972, v. 50, p. 760. 6.6. Mandel L.— Proc. Phys. Soc., 1959, v. 74, p. 233. 6.7. Rice S. O. — Bell Syst. Tech. J., 1945, v. 24, p. 46. 6.8. Condle M. A. An Experimental Investigation of the Statistics of Diffu- sely Reflected Coherent Light, thesis for the degree Engineer, Department of Electrical Engineering.— California: Stanford Univ., 1965. 6.9. Mehta C. L. — J. Opt. Soc, Am., 1968, v. 58, p. 1233. 6.10. Mehta C. L. Theory of Photoelectric Counting. — In: Progress in Optics, Vol. VIII, ed. E. Wolf. — Amsterdam, North-Holland Publishing Comp., 1970, p. 373. 6.11. Slepian D. — Bell. Syst. Tech. J., 1958, v, 37, p. 163. 6.12. Slepian D., Pollak H. O. — Bell Syst. Tech. J., 1961, v. 40, p. 43. 6.13. Slepian D. — Bell Syst. Techn. J., 1964, v. 43, p. 3009. 6.14. Slepian D. — J. Opt. Soc. Am., 1965, v. 55, p. 1110. 6.15. Slepian D.— J. Math. Phys., 1965, v. 44, p. 99. 6.16. Frieden B. Roy. Evaluation, Design and Extrapolation Methods for Opti- cal Signals, Based on Use of the Prolate Functions. — In: Progress in Optics, Vol. IX, ed. E. Wolf.Amstredam: North-Holland Pub!. Comp., 1971, p. 311. 6.17. Goodman J. W. — Appl. Phys., 1973, v. 2, p. 95. 6.18. Beckmann P., Spizzichino A. The Scattering of Electromagnetic Waves from Rough Surfaces. — Oxford, Pergamon Press, 1963, p. 125. 6.19. Brown R. Hanbury, Twiss R. Q. — Phil. Mag., 1954, v. 45, p. 663. 6.20. Brown R. Hanbury, Twiss R. Q. — Proc. Roy. Soc., 1957, v. A242, p. 300. 6.2!. Brown R. Hanbury, Twiss R. Q. — Proc. Roy. Soc., 1957, v. A243, p. 291. 6.22. Brown R. Hanbury, Twiss R. Q. — Proc. Roy. Soc., 1958, v. 248, p. 199. 6.23. Brown R. Hanbury, Twiss R. Q. — Proc. Roy. Soc., 1958, v. 248, p. 222. 6.24. Brown R. Hanbury. The Intensity Interferometer. — London, Taylor and Francis, 1974.
Глава 7 ВЛИЯНИЕ ЧАСТИЧНОЙ КОГЕРЕНТНОСТИ НА СИСТЕМЫ, ФОРМИРУЮЩИЕ ИЗОБРАЖЕНИЯ Вообще говоря, назначение системы, формирующей изображе- ния, в том, чтобы давать наблюдателю визуальную информа- цию, более детальную или более точную, чем та, которая мо- жет быть получена невооруженным глазом. В других случаях роль такой системы может состоять просто в том, чтобы про- изводить «документальную» (например, фотографическую) запись рассматриваемого объекта. В обоих случаях весьма большое значение имеет точность, с которой изображение пе- редает информацию об объекте. Чтобы установить количественные соотношения между объектом и его изображением, недостаточно знать свойства объекта, касающиеся прохождения, отражения или испускания света, и законы, которые управляют прохождением световых волн через оптический прибор. Нужно знать еще и когерентные свойства света, падающего на объект или испускаемого объек- том, поскольку эти свойства существенным образом сказывают- ся на характере наблюдаемого изображения. В данной главе мы и намерены логически раскрыть соот- ношение, которое существует между объектом и его изображе- нием, полностью принимая в расчет когерентные свойства све- та, который отражается или испускается объектом. Кроме того, мы хотим выяснить, при каких условиях система, формирующая изображение, может рассматриваться как некогерентная систе- ма (линейная по интенсивности), при каких она ведет себя как когерентная система (линейная по комплексной амплитуде), а при каких возможна некоторая промежуточная форма поведе- ния. Далее, мы хотим объяснить принцип действия интерферо- метрических систем формирования изображения, которые позво- ляют определять когерентные характеристики падающего на них излучения и на основании этой информации «восстанавли- вать» изображение. (Такие системы, формирующие изображе- ние, широко применяются в радиоастрономии.) И наконец, мы познакомим читателя с понятием «спекл-структуры» в когерент- ных системах, формирующих изображение и рассмотрим
272 Глава 7 вопрос о том, каким образом ее свойства можно характеризовать когерентностью, усредненной по ансамблю. Прекрасный обзор по вопросу формирования изображения в частично когерентном свете был опубликован Томсоном [7.1]. Этот вопрос рассматривался также в различных книгах по тео- рии когерентности [7.2—7.4]. Рекомендуем также читателю по- знакомиться с пионерными работами Гопкинса [7.5, 7.6]. § 1. Некоторые предварительные соображения Прежде чем приступать к детальному анализу связи между объектом и его изображением, мы приведем сначала несколь- ко основных соотношений, известных в теории когерентности, которые будут полезны в дальнейшем. Эти соотношения ка- саются влияния, оказываемого на частичную когерентность све- та пропускающими объектами и простыми оптическими систе- мами, через которые он проходит. А. Влияние, оказываемое на взаимную когерентность тонким пропускающим объектом Во многих оптических системах изображения объекты просве- чиваются и изображения формируются в проходящем свете. Здесь мы рассмотрим вопрос о том, какое влияние на взаимную когерентность света оказывают «тонкие» пропускающие объекты. Мы будем называть пропускающий объект «тонким», если луч света, входящий в объект (рис. 7.1, а) в точке с координа- тами (х, у), выходит из объекта практически с теми же самыми поперечными координатами. Понятно, что ни один объект нельзя считать абсолютно тонким в указанном здесь смысле, так как луч, входящий под некоторым углом к оси 2, всегда будет выходить в точке с несколько иными поперечными коор- динатами. Кроме того, если толщина объекта не во всех точках строго одинакова или показатель преломления изменяется от точки к точке, то положение точки, из которой данный луч вы- ходит, будет изменяться из-за преломления внутри объекта. Тем не менее многие объекты приближенно могут считаться тонкими в указанном нами смысле, и введенное понятие тон- кого объекта служит полезной идеализацией. Чтобы проанализировать влияние таких объектов на взаим- ную когерентность, мы прежде всего выясним связь между па- дающим и прошедшим световыми лучами. Представим себе (рис. 7.1,6), что объект помещен в однородную непоглощаю- щую среду с (действительным) показателем преломления п\.
Влияние частичной когерентности 273 Предполагается, что сам объект имеет переменную толщину d(xty)t переменную действительную часть показателя прелом- ления п2(х,у) (что приводит к переменной скорости распро- странения света внутри объекта, поскольку v = с/п2) и пере- менный показатель поглощения, который мы будем учитывать посредством действительного множителя В(х,у) перед ампли- тудой прошедшего поля. Для простоты будем считать, что п2 и В не зависят от длины волны. Проведем две плоскости, перпендикулярные оси г и распо- ложенные по разные стороны нашего объекта на расстоянии dQ Рис. 7.1. Пропускающий объект. друг от друга (рис. 7.1,6). Нам нужно найти соотношение ме- жду полем iu(x, y\t) волны, падающей на левую плоскость, и полем ш(х, y\t) прошедшей волны на правой плоскости. За- держка, приобретаемая волной в точке с координатами (х, у), равна = d(X у) _|_ do-d(x, у) (7Д.!) с/п2 (х, у) с/ги ' 7 или й = ^(х, y) — ni]d(x, у) (7д 2) (во втором выражении опущен постоянный член do^i/c, кото- рый не зависит от свойств объекта). Учитывая уменьшение ам- плитуды световой волны, описываемое множителем В(х, у), мы видим, что поля падающей и прошедшей световых волн связаны соотношением Щ(х, у, t) = B(x, у)и{(х, у; t — t>(x, у)), (7.1.3) где 6(х, у)—величина (7.1.2).
274 Глава 7 Чтобы установить, как влияет пропускающий объект на функцию взаимной когерентности света, подставим выражение (7.1.3) в определение функции взаимной когерентности: Г,(Р„ Р,-. T) = iu,(pt, < + t)u;(p„ <)) = = В(Р,)В (Р,) (u, (Р„ I + т - 6 (Р,)) < (Л ‘ - 6 (Р,))}. (7.1.4) где Pi Р2 ~(Х2,У2)< Выразив среднее по времени че- рез функцию взаимной когерентности падающего света, найдем следующее фундаментальное соотношение между функциями взаимной когерентности падающего и прошедшего света: ГДРЬ Р2; т) = В(Л)В(Р2)ГДР1, Р2; 7-6^) +б (Р2)). (7.1.5) Если световой сигнал рассматривать как узкополосный, то можно выразить аналитический сигнал через зависящий от вре- мени фазор: иДР, 0 = АДР, 0е-/2™\ (7.1.6) где v — номинальная центральная частота распределения. Ис- пользуя такое представление для полей, запишем функцию взаимной когерентности Г/ падающих световых волн в форме ГДР,, Р2; т) = (АДР„ /4-т)АДР2, (7.1.7) Тогда из выражения (7.1.5) получим (Pi, Р2; т) = В (Р,)е^^В (Р2) е~^йX Х(АДР„ / + т-д(Р1) + д(Р2))АЦР2> (7.1.8) Далее, если |д(Р,)-6(Р2)| <-±- « тс (7.1.9) при всех Р1Рг, то среднее по времени не будет зависеть от 6(Pi) и б(Р2). При таком условии получим Г,(РЬ р2; T) = t(P1)t‘(Р2)ГДРИ Р2; т), (7.1.10) где t(P)—амплитудный коэффициент пропускания объекта в точке Р, определяемый следующим образом: ЦР)^В(Р)е!2™б(Р\ (7.1.11) Соотношение (7.1.10) между функциями взаимной когерентно- сти падающего и прошедшего света широко используется в ли- тературе, но, как следует из проведенных выше рассуждений, строго говоря, оно применимо только в случае, если все раз- ности задержек, вносимые объектом, намного меньше времени когерентности света [см. условия квазимонохроматичности, приведенные в формуле (5.2.30)].
Влияние частичной когерентности 275 Для последующего будет полезным произвести дальнейшее упрощение. Если задержка т, существенная в данном физиче- ском эксперименте, всегда намного меньше времени когерент- ности тс, то из соотношения (7.1.10) следует, что взаимные ин- тенсивности падающего и прошедшего света связаны равен- ством JJPi, p2) = t(P1)t*(P2)J/(P1, Рг), (7.1.12) Этим соотношением пользуются во всех случаях, когда выпол- няются условия квазимонохроматичности. Б. Временные задержки, вносимые тонкой линзой Рассмотрим линзу, ограниченную сферическими поверхностями (рис. 7.2) и «тонкую» в смысле определения, данного в преды- дущем пункте. Вычислим временную задержку 6(х. у), которую приобретает свет, проходящий через линзу в точке с попереч- ными координатами (х, у). Чтобы получить результаты, кото- рые были бы применимы к различным типам линз, мы усло- вимся, если свет распространяется слева направо, считать ра- диус кривизны каждой встречающейся на его пути выпуклой поверхности положительным, а каждой вогнутой — отрицатель- ным. В случае линзы, показанной на рис. 7.2, радиус поло- жителен, a R2 отрицателен. Линза состоит из материала с показателем преломления п? п помещена в среду с показателем преломления /и; оба пока- зателя преломления считаются не зависящими от частоты в рассматриваемой частотной полосе. Полная временная задерж- ка, приобретаемая лучом, распространяющимся между двумя параллельными плоскостями, представленными штриховыми
276 Глава 7 линиями на рис. 7.2, определяется (в приближении линзы) выражением б ( j n2d (х, у) । nAdo — d^x, у)\ «тонкой» (7.1.13) Простые тригонометрические выкладки [7.7] показывают, что толщина линзы в точке с координатами (х, у) дается вы- ражением __________ d (X, у) = d0 - /?! (1 - д/1 -^^р) + + R? (1 - a/1 ' (7< 1 •14) Здесь для удобства мы введем параксиальное приближение, в котором квадратные корни выражения (7.1.14) представляются первыми двумя членами их биномиальных разложений. В рам- ках такого приближения функция толщины d(x,y) принимает вид (7.1.15) Подставляя этот результат в выражение (7.1.13), для задерж- ки получаем Определив фокусное расстояние линзы f соотношением Т А ("2-",) (7.1.17) найдем конечное выражение для задержки, приобретаемой лу- чом в точке (х, у): (7.1.18) Часто удобно иметь выражение для амплитудной функции пропускания, которая описывает тонкую линзу. В рамках при- нятых выше приближений это выражение имеет вид (*2 + У2)1, (7.1.19) {Л — /77 Л/ причем в конечном выражении опущен коэффициент, не зави- сящий от (х, у). В соответствии со сказанным в предыдущем пункте это представление, строго говоря, справедливо только в том случае, если ширина полосы Av света удовлетворяет со- отношению |б(х2-!/2)-б(х1,//1)1 < д-7 (7.1.20)
Влияние частичной когерентности 277 при всех рассматриваемых значениях (хь у{) и (х2,У2). В за- дачах же, в которых рассматривается распространение света до линзы, прохождение через линзу и дальнейшее распростра- нение вне линзы, условию, аналогичному (7.1.20), должна удовлетворять разность полных задержек времени на трех участках распространения. Если такое условие «полного вре- мени задержки» выполняется, то выражение для амплитудного коэффициента пропускания (7.1.19) будет давать правильное соотношение между начальной и конечной взаимными интен- сивностями, даже если бы условие (7.1.20) и не выполнялось для самой линзы. В. Соотношения между когерентностями в двух фокальных плоскостях В данном пункте мы выведем соотношение между взаимными интенсивностями в передней и задней фокальных плоскостях тонкой собирающей линзы. Как показано на рис. 7.3, эти пло- Рис. 7.3. К вычислению соотношений между когерентностями в передней и задней фокальных плоскостях. скости перпендикулярны прямой, проходящей через центры кривизны обеих поверхностей линзы (т. е. оптической оси), и расположены на расстоянии f от линзы по обе стороны от нее. Свет, выходящий из передней фокальной плоскости, пред- полагается квазимонохроматическим и имеющим взаимную ин- тенсивность Jo (£Р Лр Л2). Пользуясь формулой (5.4.8), кото- рая описывает влияние процесса распространения на взаимную интенсивность, можно вычислить взаимную интенсивность Jz(xi, ух\х2, У2) света, падающего на линзу. Чтобы по возмож- ности упростить расчет, воспользуемся параксиальным, или малоугловым, приближением, которое позволяет принять в фор-
278 Глава 7 муле (5.4.8) X(6i) « Х(02) « 1. _ _ ~ (*2 — Ь)2 + (У2 — Т]2)2 — (*1 — £l)2— (i/1 — ’ll)2 г2 _ Г|---------------------- . Таким образом, для взаимной интенсивности света, падающего на линзу, найдем Jz (хР У{ S £,>) = 7П7ехР{“ 'V [(*2 + + У?)]1 х х 4,1 п2) ехр {- i ,да+И) - да + п;)]} X bid’ll. dl2dTr\2. (7.1.22) Прохождение света через линзу описывается амплитудной функцией пропускания линзы (7.1.19). Тогда взаимная интен- сивность света, выходящего из линзы, имеет вид (Хр Ур Х2, У2) = j; (Хр у;, Х2, у2) ехр р [(%2 + Z/2) - (%2 + Z/2)]} . (7.1.23) Наконец, взаимная интенсивность света, выходящего из линзы, должна распространяться на дополнительное расстоя- ние f до задней фокальной плоскости. Используя снова закон распространения (5.4.8), в параксиальном приближении полу- чим для взаимной интенсивности на задней фокальной плоско- сти выражение Jf(«p v.;,u2, v2)=-~expp^[(U_2 + v2)-(U2 + v2)]|x \Л/ У \ Л/ J + °° X (J JHx|t t/i; х2, у2)х dxx dyx dx2 dy2. (7.1.24) В таком виде соотношение между взаимными интенсивно- стями в двух фокальных плотностях содержит восемь интегра- лов. Но четыре из них могут быть исключены, что дает срав- нительно простое соотношение между двумя интересующими нас величинами. Для этого выполним сначала интегрирование по хь г/i, х2 и #2. Приводя подобные члены, зависящие от этих / -=7 [ы?х2 + v2y2 — Uixt — V\yx Л/
Влияние частичной когерентности 279 переменных, для интересующего нас интеграла получим г = $ П S “р {-' # [«+« - w+»?)]} х "ОО X ехр ' . 2 л /“FT 1х2 (£2 “1“ ыг) “1“ Уг (Лг “1“ ^г) — — х, (h + Ui) — у} (П1 + v J] I dx, dy{ dx2 dy2. (7.1.25) С помощью формулы преобразования Фурье (приложение А, табл. А1) / 4-х2ф/2я'”с dx^'xj— fif е+’я^ (7.1.26) Л/ / {2л /77 [?2«2 + 1]2V2 — — ТЦУ1 Л/ ,можно вычислить эти четыре интеграла, что приводит к сле- дующему результату: Z = (Xf)2expf/y- [(£2 + ыг)2 + (Лг + ^г)” — (£1 + ui)2 — (Л1 4" wi)2]l (7.1.27) Подставив это выражение в остающийся четверной интеграл, получим выражение + оо (WP U2’ V2$ = ^2 5 S S S ^2’ ^2) dx\i d%2dT\2. (7.1.28) Данное соотношение между J/ и Jo— конечный результат нашего анализа. Хотя на первый взгляд это соотношение мо- жет показаться сложным, оно очень просто выражается сло- вами: взаимные интенсивности в передней и задней фокальных плоскостях тонкой собирающей линзы (с точностью до масштаб- ных множителей) связаны между собой четырехмерным пре- образованием Фурье, Пространственные частоты оператора дан- ного преобразования Фурье таковы: Ui Vi = —, Vi v2 =-----=—, U2 V3 = "77”, v2 (7.1.29) Интерес представляют также интенсивность света, падаю- щего на заднюю фокальную плоскость, и ее связь с взаимной
280 Глава 7 + V (П2 - П.)]} d4l dl2 dx\2. (7.1.30) интенсивностью на передней фокальной плоскости. Полагая u1 = u2 = ^ и Vi = v2 = v в формуле (7.1.30), находим + OQ (и'v}=тЬ? 5 5 И J° л,; х X ехр р И наконец, рассмотрим вопрос о том, насколько строго должны выполняться условия квазимонохроматичности, чтобы был справедливым результат (7.1.28). Потребуем, чтобы раз- ность полных задержек от точки (£i,r|i) Д° точки (ui,Vj) и от (g2, Ц2) до (^2, и2) была намного меньше времени когерентности света. Эта разность задержек выражается в виде т2-т1 = ^- + д2-д1 + -^-> (7.1.31) где г2 и Г\ — расстояния, которые проходят лучи от передней фокальной плоскости до линзы, г2 и — расстояния, которые проходят те же лучи от линзы до задней фокальной плоскости, а 62 и 61 — временные задержки, вносимые линзой. Заметим, что луч, проходящий через точку (£,Л) в передней фокальной пло- скости, достигнет точки (и,и) в задней фокальной плоскости только в том случае, если он составляет определенный угол с оптической осью. Учитывая эти геометрические соображения, ограничиваясь всюду параксиальным приближением и опуская постоянные множители, мы видим, что требуемое соотношение принимает вид I+ | с Тс> (7 ! 32) I /С I Если рассматриваемые области в .плоскостях (£, ц) и (u, v) имеют размеры Lo X Lq и Lf X Lf, т0 требуемое условие будет выполняться во всех рассматриваемых точках при условии, что (7.1.33) где 1с = etc есть длина когерентности света. Например, при Lo = Lf = 5 см и f = 1 м длина когерентности света должна быть значительно больше 2,5 мм, что является довольно жест- ким условием. В заключение заметим, что соотношение в виде четырехмер- ного преобразования Фурье между взаимными интенсивностями на передней и задней фокальных плоскостях совершенно ана- логично соотношению в виде двумерного преобразования Фурье между комплексными полями в фокальных плоскостях пол-
Влияние частичной когерентности 281 ностью когерентной оптической системы [7.7, § 5.2]. Четырех- мерное соотношение носит более общий характер, поскольку оно справедливо для частично когерентных систем. Г. Соотношения между когерентностями в плоскостях объекта и изображения для одиночной тонкой линзы. Найдем соотношение между взаимными интенсивностями в пло- скостях объекта и изображения для одиночной тонкой линзы. Геометрия задачи показана на рис. 7.4. Принятый способ вы- Рнс. 7.4. Формирование изображения. числения взаимной интенсивности в плоскости изображения аналогичен использованному в предыдущем пункте. Взаимная интенсивность распространяется до линзы, здесь вводится ам- плитудная функция пропускания линзы, а затем прошедшая взаимная интенсивность распространяется до плоскости изо- бражения. Амплитудная функция пропускания линзы берется в форме U(X, t/)= Р(х, t/)exp Г— i-^-(x2 + z/2)l, (7.1.34) где конечная апертура линзы учитывается тем, что принимает- ся Р = 0 вне апертуры линзы; фаза множителя Р учитывает все аберрации лиизы, а его модуль |Р| может изменяться в пределах апертуры соответственно предусмотренной аподиза- ции. Чаще всего мы будем принимать |Р|= 1 и arg{P} = 0 в пределах апертуры. Снова везде используется параксиальное приближение. Поскольку достаточно детальный анализ был проведен в предыдущем пункте, многие детали здесь опу- скаются. Если Jo снова представляет собой взаимную интенсивность света, выходящего из плоскости объекта, a z0 — расстояние от плоскости объекта до линзы, то взаимная интенсивность J<
282 Глава 7 света, выходящего из линзы, определяется выражением (Хр У\> Х2* У%) = \2 Р (ХР #1) Р (Х2> У2) X х ехр{”' X “ В + ® к + ’91}х X 5J» ft' •>,: Ч;) ехр {- [И + Чй - ft + П?)]} X — оо X ехр (/у2- [х£2 4- у2ц2 — х& — у}Л|]| dg, dni dg2 dr\2. (7.1.35) \ a2Jq J Рассматривая распространение света на дополнительное рас- стояние г-, до плоскости изображения, мы приходим к следую- щему громоздкому результату: Л «2. v2) = - (£? (57ехр {-' й [(“’+« - «+М х х 5 5И Пр i2, п2) х — оо xexP{-/-g-[ft+.®-ft+4?)]}x \ A£q ) + 00 х И ИdX| dy'dX2 dy^ y'}p* ^2> y^ —00 x exp {-1X (i+X- ~ t) [ w - «+’91} x x M'T Hx+z)+<+z) -Xi Ox+-it) - - ’>(xr + Ij-)]} >7L36) Теперь задача в том, чтобы упростить этот результат. Сначала учтем, что если плоскость изображения действи- тельно расположена на расстоянии, необходимом для образо- вания изображения, то должно выполняться уравнение линзы J- + J-_l=0 (7.1.37) ZQ zi I и экспоненциальные множители с квадратичными по х2р у\у и у2 фазами становятся равными единице. Далее введем
Влияние частичной когерентности 283 амплитудную функцию размытия системы в виде exp I j (и2 + о2)! exp f j (|2 + т]2) К (U, V, L П) = ---------------------- + °° X J $ р (X, у) ехр — оо (7,1.38) (Лзо) с помощью которой выражение для взаимной интенсивности в плоскости изображения может быть сведено к виду + оо J( («,, v,; u2, v2) = J J $ $ Пр П2) К (u,»,; П1) X . -оо X К’ («2. »2; £г. 11г) dT]i d%2, dr\2. (7.1.39) Распределение интенсивности на плоскости изображения нахо- дится путем подстановки щ~и2 = и и vi = v2 = v в преды- дущий результат, что приводит к выражению + оо л (“.»)=$$$ $ jo (£р л,; п2) к («, v, П1) х ХКЧм. у;&2. ПгМ^П^МПг- (7.1.40) Установим теперь, какие ограничения должны быть нало- жены, чтобы обеспечивалось выполнение условий квазимоно- хроматичности при проведенном выше вычислении взаимной интенсивности. В этой задаче нам помогает то обстоятельство, что в случае безаберрационной системы оптические длины пу- тей, проходимых всеми лучами от данной точки объекта до точки его гауссовского изображения, одинаковы [7.8]. Поэтому нам достаточно будет рассмотреть длины путей, проходимых центральными лучами, показанными на рис. 7.4. С точностью, определяемой приближением тонкой линзы, расстояния, прохо- димые внутри линзы, одинаковы для всех центральных лучей. Отсюда полная оптическая разность хода для указанных лучей равна просто г2 + г'2 —— г'г Используя параксиальное прибли- жение для всех четырех рассматриваемых величин, найдем, что условие квазимонохроматичности будет выполняться для всех рассматриваемых точек при (7141)
284 Глава 7 где 1с — длина когерентности света. Если поле объекта имеет размеры Lo X ^о, а поле изображения — размеры Ц X Li, то для наихудшего случая получаем требование £2 ч ч (7.1.42) При Lq = Li = 2 см и Zq = Zi — 20 см длина когерентности должна быть значительно больше 1 мм. В заключение заметим, что, хотя мы нашли соотношение между взаимными интенсивностями в плоскостях объекта и изображения, мы еще не в состоянии полностью определить интенсивность изображения, которая возникает от конкретного объекта. Чтобы сделать это, потребуется учесть когерент- ные свойства освещения объек- та или, иначе, характер источ- ника, который освещает объект. Такими вычислениями мы зай- мемся в § 2. Рис. 7.5. Входной н выходной зрачки. Д. Соотношение между взаимными интенсивностями в выходном зрачке и в плоскости изображения В качестве последнего важней- шего соотношения для коге- рентностей в процессе форми- рования изображения рассмот- рим зависимость взаимной ин- тенсивности в плоскости изо- бражения от взаимной интен- сивности в выходном зрачке для системы весьма общего вида. Во всех системах формиро- вания изображения независимо от их детальной структуры обязательно имеется апертура, ограничивающая угол, в пре- делах которого пучок лучей к идеальному точечному изображению. сходится в направлении Изображение этой апертурной диафрагмы, формируемое опти- ческими элементами, которые следуют за ней, называется вы- ходным зрачком системы формирования изображения. Точно
Влияние частичной когерентности 285 Рис. 7.6. К вычислению взаимной ннтенснвностн в изображении. так же изображение апертурной диафрагмы, формируемое опти- ческими элементами, расположенными перед ней, называется входным зрачком. Сказанное иллюстрируется схемами рис. 7.5. На рис. 7.5, а ограничивающая апертура — это сама линза; в этом случае физическая апертура, выходной зрачок и входной зрачок совпадают друг с другом. На рис. 7.5,6 перед линзой расположена апертурная диафрагма; в этом случае входной зра- чок совпадает с этой «физической» апертурой, но выходной зра- чок представляет собой изображение этой диафрагмы, что пока- зано штриховыми линиями. Наконец, на рис. 7.5, в выходной зрачок совпадает с физической апертурой, тогда как входной зрачок является ее изображением, представленным штриховой линией. Все сказанное относится и к системам произвольной сложности. Наша цель состоит в том, чтобы найти соотношение между распределением взаимной интенсивности в выходном зрачке и распределением взаимной интенсивности в изображении. Ре- зультаты будут иметь простейший вид, если мы запишем взаим- ную интенсивность зрачка на сфере радиусом Zi (расстояние от выходного зрачка до плоскости изображения) с центром в на- чале координат плоскости изображения. На рис. 7.6 показана эта геометрия. Соотношение между двумя рассматриваемыми взаимными интенсивностями можно; найти, если исходить из основного соотношения (5.4.8), которое мы перепишем в виде J. («,, v,; и2, v2) = J J ( J J; (%,, </,; х2, у2) X Si Sj Xexpf—/4? (r2 — r t)l -4^- dxi dyi dx2 dy2. (7.1.43) (, A J ЛГ l ЛГ 2
286 Глава 7 Здесь Jp —взаимная интенсивность, прошедшая через выход- ной зрачок, a Si — ограничивающая апертура этого зрачка. В обычном малоугловом приближении имеем х(0.) « Х(0з) « 1, Zr, я» Xr2 « Xz;. (7.1.44) Кроме того, как явствует из схемы, показанной на рис. 7.6, пол- ное расстояние г от точки (х, у) на выходной сфере до точки (ы, v) в плоскости изображения дается выражением «2,Г1 г = д/г?4-ы2+ V2 — 2хи — 2yv ~ , и2 + V2 хи 4- yv 1 2г? z? J' (7.1.45) Таким образом, соотношение между двумя взаимными интен- сивностями принимает вид J, (»,, г,; и„ vs) = ' expp-i [(U? + «;) - (4 + »’)]} X (AZ.) I AZ, J + °° $ $ $ $ (Xp ^l’ %2’ ^2) — oo Xexpf/-^- (x2u2 + y2v2 — xxux — dxxdyxdx2dy2, (7.1.46) Хехр где мы включили конечные пределы, задаваемые поверхностью Si, в определение величины Jp- Заметим, что если нас интере- сует в основном интенсивность изображения (а не взаимная интенсивность), то выражение (7.1.46) сводится к виду Л<“’ ”,= ДИНИЯР / [(*2 — -«1)«(У2 — У1) у]) dyx dx2 dy2. (7.1.47) Л2! J Этим соотношением между интенсивностью в плоскости изо- бражения и взаимной интенсивностью в зрачке мы часто бу- дем пользоваться, когда речь пойдет о формировании изобра- жения с интерферометрической точки зрения (§ 4). Пока будем смотреть на результаты (7.1.46) и (7.1.47) просто как на важ- ные соотношения, к которым мы можем обратиться в дальней- шем, если это понадобится.
Влияние частичной когерентности 287 § 2. Методы вычисления интенсивности изображения Излагая теорию формирования изображения в частично коге- рентном свете, мы хотим показать, каким образом можно вы- числить распределение интенсивности в плоскости изображения в любой заданной экспериментальной ситуации и при этом вы- яснить, какую роль играют в таком процессе по отдельности освещение, объект и оптика, формирующая изображение. Мож- но надеяться, что это позволит более правильно интерпретиро- вать результаты эксперимента. Ниже мы излагаем ряд разных методов анализа, которые дают возможность предсказывать распределение интенсивности на изображении в тех или иных условиях эксперимента. А. Интегрирование по источнику Когда объект освещается квазимонохроматическим простран- ственно-некогерентным излучением, как это чаще всего и бы- вает, интенсивность изображения можно вычислять методом, (и, и) Источник Осветительная оптика Оптика системы, формирующей изображение Плоскость Плоскость объекта. изображения Рис. 7.7. Осветительная система и система, формирующая изображение. который отличается особой простотой. Каждая точка источника рассматривается отдельно, вычисляется интенсивность изобра- жения, создаваемая светом от отдельной точки, а вклады в ин- тенсивность изображения от всех таких точек складываются с весами, пропорциональными распределению интенсивности ис- точника. Простое сложение распределений интенсивности изо- бражения возможно вследствие предполагаемой некогерентно- сти первоначального источника. Рассмотрим геометрию, представленную на рис. 7.7. Объект расположен в плоскости (£, т]) и освещается с помощью опти-
288 Глава 7 ческой системы, расположенной слева от этой плоскости. Изо- бражение формируется в плоскости (u, v) оптической системой, расположенной справа. Предположим, что при наличии усло- вий квазимонохроматичности каждая оптическая система мо- жет быть представлена некой амплитудной функцией размытия (испульсным откликом). Для обозначения таких функций раз- мытия систем освещения и изображения соответственно исполь- зуем символы F(£, т); а, 0) и К(ц, v; g, tj). Отдельная точка с координатами (а,0) на источнике ис- пускает свет, который можно характеризовать зависящим от времени фазором As (а, 0;О- Свет из этой точки достигает объекта и проходит его, создавая зависящую от времени фа- зорную амплитуду Ао= (£, tj; а, 0; /) (справа от объекта), опре- деляемую выражением Ao(g, n;a, = n;a, Р) to а, П) As (а, 0; t- 6.)- (7.2.1) где 61 — временная задержка, которая зависит от (L'H) и (а,0), a to (6, Л) —амплитудный коэффициент пропускания объекта, который предполагается не зависящим от положения конкретной точки источника, обеспечивающего освещение. На- конец, зависящая от времени фазорная амплитуда света, ис- пускаемого точкой источника с координатами (а, р) и дости- гающего точки с координатами (и, и) на плоскости изображе- ния, имеет вид 4-00 А, (и, и; а, 0; 0 = К («, о; 6, n) t0 (£, П) X — оо X F (£, п; а, 0) As (а, 0; t - 6j - 62) (7.2.2) где 62 — временная задержка, которая зависит от (u, v) и (МЛ Интенсивность света, испускаемого точкой источника (а, 0) и достигающего точки с координатами изображения (и, v), мо- жет быть вычислена следующим, образом: It (и, V, а, 0) = (| A, (u, V, а, 0; /) |2) = 4-00 = j j j j К (“’ П>) К’ (“’ И; to ‘° ^2’ Х — со XF(^, m; a, P)F*&, П2; а, Р)Х X <А; (а, 0U - 6, - б2) А’ (а, PU - в; - Ъ'2У) dx\2. (7.2.3) В рамках квазимонохроматического приближения разности за- держек удовлетворяют неравенству |б|4-д2-б;-д;|<те, (7.2.4)
Влияние частичной когерентности 289 так что зависящая от времени величина в формуле (7.2.3) сво- дится к /s(a, Р)—интенсивности источника в точке с коорди- натами (а,Р). Наконец, проинтегрировав парциальную интен- сивность Л (и, v;a, Р) по координатам источника (а, Р), мы по- лучим в результате 4-00 4-00 Л («. о) = j J Л? (а, 0) J j J J К («, о; £1, П1) К* (и, и; g2, т]2) X — оо — со XFGi.m; а. 0)F*(U V.a, 0) X Xt0&, n,) (S2. i^dl^d^d^dadp. (7.2.5) Зная Is, F, К и to, можно вычислить распределение интенсив- ности изображения. На практике часто встречаются два разных случая освеще- ния объекта. Первый (рис. 7.8, а)—когда некогерентный ис- Zf.......—Я а Рнс. 7.8. Две обычно встречающиеся схемы системы освещения: а — критиче- ское освещение; б — кёлеровское освещение. точник относительно однороден и освещающая оптика способ- на просто сформировать изображение источника на объекте, возможно, с некоторым увеличением или уменьшением. В слу- чае простой системы из отдельной линзы, показанной на рис. 7.8, а, амплитудная функция размытия F имеет тогда
290 Глава 7 вид (7.1.38) J ехр// -р-(а2 + Р2)| ехр Г -Д-(g2 + r)2)l F а, п; а> 0)=—Н—L —-----------------L X + ОО X Рс(х, 5)ехр|—/4^-[(g + A1a)x + (T] + Alp)y]|dxdy> (7.2.6) где Рс— функция зрачка линзы Ц (может быть задана апер- турной диафрагмой, а не размером самой линзы), M = z2/zi — увеличение системы освещения, а (х, у) —координаты в плоско- сти линзы Ль Такая оптическая система, расположенная ме- жду источником и объектом, используемая для освещения в микроскопе, называется конденсорной системой. Система, по- казанная на рис. 7.8, а, создает критическое освещение [7.2, § 10.5.2]. Другой класс систем освещения в упрощенном виде пока- зан на рис. 7.8,6. В этом случае источник эффективно отобра- жается на бесконечное расстояние от объекта. Вследствие этого неоднородности распределения яркости источника не отобра- жаются на объекте и тем самым достигается высокая однород- ность поля освещения. Этот общий класс системы изображения при использовании в микроскопе создает так называемое кё- леровское освещение [7.2, § 10.5.2; 7.9]. Из свойств преобразо- вания Фурье для тонкой собирательной линзы следует, что ам- плитудная функция размытия для простой системы, показанной на рис. 7.8,6, имеет вид F (I П; а, 0) = у? ехр {/ (£а + П0)}, (7.2.7) если пренебречь влиянием конечных размеров апертуры линзы. В заключение данного пункта заметим, что, хотя метод ин- тегрирования по источнику в принципе прост, на практике он не обязательно будет самым простым. В любой конкретной за- даче нужно рассматривать различные возможные подходы, по- скольку в одной задаче может быть более простым один под- ход, а в другой—другой. Перейдем теперь к второму методу вычисления. Б. Представление источника с помощью функции взаимной интенсивности падающего света Несколько более общим является подход к вычислению рас- пределения интенсивности изображения, при котором исклю- чается явное интегрирование по источнику, а вклад источника
Влияние частичной когерентности 291 представляется функцией взаимной интенсивности, описываю- щей свет, падающий на объект. Предположим, что в рамках квазимонохроматического приближения зависящая от времени фазорная амплитуда At (и, и;/) света, достигающего координат изображения (и, и), может быть следующим образом выражена через зависящую от времени фазорную амплитуду Ао(£, света, падающего на объект в точку с координатами (£, т)): 4-00 Аг (и, о; /) = J $ К (и, v, t n) t0 G, и) Ао (£, dl di}, (7.2.8) —ОО где К “ амплитудная функция размытия для системы, форми- рующей изображение, to — снова амплитудный коэффициент пропускания объекта, а б — временная задержка, которая зави- сит о.т (£,л) и (щи)- Таким образом, интенсивность в точке с координатами (u, v) определяется выражением Л(«, v) = (|A,(a, о; 012) = 4-00 = S S S Sк (ы> v; п>)к’ о; х — оо X <А0 (£р Пр t - ftj) А* (&2, n2; t - 62)) d^ rfT), dl2 dx\2. (7.2.9) В квазимонохроматическом приближении мы имеем 16j — 62|<С Тс, и отсюда (A0(gp Пр п2; <-б2)) = J0(^p Пр1 ^2. П2), (7.2.10) где Jo — распределение взаимной интенсивности света, падаю- щего на объект. Конечное выражение для интенсивности изо- бражения теперь принимает вид 4-00 Л («, и) = j J J J К (и, V-, П1) К* (и, V, 12, п2) to (11, Hl) X — оо х t; п2) Jo (£р Пр ъ П2) dl2 di}2. (7.2.11) Зная К, to и Jo, можно вычислить И Л. Теперь можно было бы сказать, что, хотя выражение (7.2.5) для Л требует вычисления шести интегралов, а (7,2,11) —толь- ко четырех, последнее на самом деле не проще первого, по- скольку для определения Jo требуется, вообще говоря, четыре интегрирования, Это совершенно правильно; но при выводе формулы (7.2.5) предполагалось, что источник некогерентный, и если подобное предположение сделать здесь, то вычисление Jo потребует вычисления только двух интегралов, т, е, полное
292 Глава 7 число интегралов, которые должны быть вычислены, равно ше- сти, что мы сейчас и проиллюстрируем. Предположим, что, как показано на рис. 7.9, некогерентный источник расположен на произвольном расстоянии г\ перед тонкой собирающей линзой, а освещаемый объект лежит на расстоянии г2 позади линзы. Предполагается, что линза видна со стороны источника под достаточно большим углом, так что, согласно теореме Ван Циттерта — Цернике, площадь когерент- ности света, падающего на линзу, очень мала по сравнению с Конденсорная линза Рис. 7.9. Схема осветительной системы. Объект площадью линзы. Используя (5.6.24) и (5.6.25), мы можем за- писать это требование в виде AXsXXz,)2’ (7.2.12) где Ас и — площади линзы и источника соответственно. По- кажем далее, что при определенных условиях, включающих требование (7.2.12), апертура линзы сама может рассматри- ваться как источник приблизительно некогерентного освещения и что взаимная интенсивность Jo освещения может быть вычис- лена более просто путем применения теоремы Ван Циттерта — Цернике к зрачку линзы как к источнику. Чтобы критически оценить это утверждение, заметим преж- де всего, что в силу теоремы Ван Циттерта — Цернике, приме- ненной к некогерентному источнику с распределением интенсив- ности /s (а, Р), взаимная интенсивность падающего на линзу света дается выражением [формула (5.6.8)] х ехр {“1 Т~ № + ~ + р‘)]) Л (•*!» 5i> *2> Уг!= --------1—7j—7J---------------- X (*Zi) +00 X U Л; (а, р)ехр(/-^-(Аха + \y$)\dad$, j j J — CO (7.2.13)
Влияние частичной когерентности 293 где Дх = х2— Л и ^у = у2 — у\. Взаимная интенсивность све- та, прошедшего через линзу, определяется выражением J'i (*,. Уг м у=рс (*р уд р; (*2« у2) х X ехр /-g- [(х2 + у*) - (х* + £2)]} Jz(хр у{‘, х2, у2), (7.2.14) где Рс(хи У1) = Рс(х> У) ехр[— jW (х, #)] есть комплексная функ- ция зрачка конденсорной линзы, a W(x, у)—медленно меняю- щаяся аберрационная фаза, описывающая отклонение волново- го фронта от совершенной гауссовской сферы отсчета. Но вследствие очень малой площади когерентности света, падающего на линзу, определяемой малой спектральной ши- риной фурье-образа в выражении (7.2.13), взаимная интенсив- ность прошедшего света не равна нулю только при очень малых Ах и А#. Поэтому мы можем сделать следующие предположе- ния, допустимые при достаточно малых Ах и Ау (задача 7.1): ехр{“ 'Iу)1Я + й) - Я + й)]} ~ 1. <7-2-15а) рдй. й) ₽:я. ад ~ яла. й)|2- <7.2.150 Тогда взаимная интенсивность прошедшего света принимает вид Й-). где (vx, vr) — двумерный фурье-образ распределения интен- сивности источника 7$ (а, р). В силу предположения (7.2.12) величина fsikxlhz^ kyl^z^ является исключительно узкой функцией переменных (Ах, А^), Следовательно, выражение (7.2.16) описывает взаимную интен- сивность нового источника (зрачок линзы), который практиче- ски можно считать пространственно-некогерентным и распре- деление интенсивности которого пропорционально | Рс(хь у{) |2, Применим теперь теорему Ван Циттерта — Цернике к новому источнику, что позволит нам записать взаимную интенсивность падающего на объект света в виде , „ /«Р{-/я-[(ЕМ)-(Й+ •>?)!} Jo (11, Пр 62, Пг) =_i___™2.___________________L у (W Л 4-00 X И I Pc (xtyt) |2ехр (/ m + МУ4 dxt dy{. (7.2.17) J J Г Л2^2 J
294 Глава 7 Заметим, в частности, что в соответствии с приближением (7,2.156) взаимная интенсивность падающего на объект света не зависит от аберраций в системе совещания; на это впервые указал Цернике [7,10]. Задача вычисления взаимной интенсив- ности света, падающего на объект, свелась к задаче преобра- зования Фурье квадрата модуля функции зрачка линзы, Если линза не аподизирована (т. е. | Рс | = 0 или | Рс | = 1), то | Рс|2 = I Рс| и достаточно подвергнуть преобразованию Фурье саму апертурную функцию. Дополнительно заметим, что если все предположения, использованные при выводе уравнения (7,2.17), остаются справедливыми, то взаимная интенсивность Jo света, падающего на объект, не зависит от расстояния г\ ме- жду источником и линзой, Конечно, функция в формуле (7.2,16) никогда не яв- ляется бесконечно узкой. Применение обобщенной теоремы Ван Циттерта — Цернике к выражению (7.2,16) показывает, что наши выводы сохраняют свою применимость в случае ко- нечной ширины функции при условии, что (задача 7.2) 02.)% >4, (7.2.18) где Ао — площадь объекта. Мы закончим этот пункт обсуждением другого условия, при котором сравнительно легко вычислить Jo. Предположим, что иекогерентный источник и объект на рис, 7,9 находятся в фо- кальных плоскостях линзы (т, е, Zj — z2 = f). Дополнительно предположим, что линза значительно больше источника и объекта, так что конечным размером зрачка линзы можно пре- небречь. Представив взаимную интенсивность источника в виде •Ь(аь Pi; «2, P2) = «/s(al, 0,) 5 (cti — ct2, Pj — p2), (7.2.19) мы воспользуемся четырехмерным преобразованием Фурье вы- ражения (7,1.28) (в котором Jo заменим величиной Js, a Jf — величиной Jo) для вычисления взаимной интенсивности света, падающего на объект, В результате такого простого вычисле- ния получим 4-СО Jo (&, An) = J J Is (a, Р) ехр {/ (aAS + рДт])} da dp , (7.2.20) — сю где А£ — и Ат] = т]2 —Ль Таким образом, взаимная ин- тенсивность света, падающего на объект, является функцией только разности координат в плоскости объекта и может быть легко найдена путем преобразования Фурье распределения ин- тенсивности источника. Во многих приложениях формулы (7.2,20) и (7.2.17) оказываются сравнительно простыми для
Влияние частичной когерентности 295 вычислений, так что основная трудность задачи расчета ин- тенсивности изображения состоит в вычислении четырех инте- гралов уравнения (7.2.11), Соответствующие примеры отложим до § 3, В. Четырехмерный линейно-системный подход В § 1, п. Г мы видели [формула (7,1.39)], что если система формирования изображения описывается амплитудной функ- цией размытия K(u, и; g, т]), представляющей амплитуду поля в точке с координатами (и, и) изображения, которое возникает от объекта, описываемого 6-образной амплитудой в точке (g, т]), то взаимные интенсивности объекта и изображения связаны между собой соотношением 4-00 Jz Vp и2, и2) = Jo (gp Т]р g2, Т)2) X — оо X K(«1, Vi, g|, i)i)K‘(«2, v2> I2, TkNIi Л]1^2<^12- (7.2.21) Данное выражение можно назвать четырехмерным суперпози- ционным интегралом, оно характерно для линейной системы. Таким образом, операцию формирования изображения можно рассматривать как четырехмерную линейную систему, на входе которой мы имеем взаимную интенсивность, пропускаемую объектом, а на выходе — взаимную интенсивность, появляющую- ся в плоскости изображения, Величину К(^ь Vi; gi, Th) K*(u2, u2; g2,42) можно рассматривать как импульсный отклик этой си- стемы, т, е. как взаимную интенсивность, наблюдаемую в точке изображения с координатами (ub u2, и2) при поступлении на вход взаимной интенсивности объекта, представляющей собой импульс в точке с координатами (gb t)i, g2, т]2), При некоторых условиях можно свести общий суперпози- ционный интеграл (7.2.21) к несколько более простому инте- гралу свертки в виде J. («,, и,; и2, v2) = j J J J J'o (£,, Пр U П2) К - Ip V, - Th) X — 00 XK (и? |2, у2 Л2) dtii ^T)2, (7.2.22) В котором импульсный ОТКЛИК K(«1 — 11, V] — Th) К‘(ы2 — l2> v2 — Лг) зависит только от разностей координат (щ — £,), (v, — т^), («2 —12) и (v2 — tj2). В таком случае говорят, что система яв- ляется пространственно-инвариантной, или изопланатной, Ясно, что если амплитудная функция размытия К инвариантна в пространстве двух измерений, то импульсный отклик
296 Глава 7 рассматриваемой здесь четырехмерной системы тоже будет про- странственно-инвариантным. Условия, при которых можно предполагать пространствен- ную инвариантность амплитудной функции размытия К, нетри- виальны и далеко не всегда выполняются, Например, функция рдзмытия К в формуле (7,1.38) далека от пространственно-инва- риантной в том виде, в каком она там представлена. Вообще говоря, для того чтобы можно было сделать предположение о пространственной инвариантности, должны выполняться следую- щие условия, 1. Координаты объекта (£, т]) должны быть нормированы таким образом, чтобы увеличение при переходе между коор- динатными системами (£,т]) и (u, v) было равно единице, 2. Оси координат объекта должны быть направлены так, чтобы из математических выражений были исключены эффекты обращения изображения, 3, Амплитудная функция размытия К не должна содержать изменяющихся в пространстве фазовых множителей, таких как множители ехр{/(л/Xzo) (£2 + Л2) и ехр{/ (л/Хз£)(ц2 + v2)} в фор- муле (7,1,38). Условия 1 и 2 легко выполняются при подходящем выборе масштабов и направления осей координат объекта. Требова- нию 3 удовлетворить значительно труднее, Можно показать, что эти фазовые множители не входят в амплитудную функцию размытия двухлинзовой телецентрической системы изображе- ния [7.11], Кроме того, фазовый множитель, зависящий от (£2 + т]2), может быть исключен путем соответствующего вы- бора освещающей оптики [7.12], Оба фазовых множителя мо- гут быть исключены, если перед плоскостями объекта и изобра- жения поместить собирающие линзы с надлежащими фокус- ными расстояниями. Или же фазовые множители величин К и К* могут компенсировать друг друга в пределах интересую- щих нас расстояний при наличии когерентности в пределах ма- лых площадей в плоскостях объекта и изображения. Если условия 1—3 выполняются, то для описания отображе- ния Jo на J/ может быть использована четырехмерная свертка (7.2,22). В этом случае совершенно естественно было бы ис- следовать форму данного соотношения в фурье-представлении, в котором свертки имеют вид простых произведений фурье-об- разов [7.7], Соответственно этому определим четырехмерные фурье-спектры взаимных интенсивностей объекта и изображе- ния как '(v,, V2,V3, v4)AST{j'}( (7.2.23) t(yt, v2, v3, v4)A^ {JJ,
Влияние частичной когерентности 297 где { } — оператор вида 4-00 } ехр [/2л + v2x2 + v3x3 + v4x4)] dx} dx2 dx3 dx4, (7.2.24) a (xh x2, x3, x4)—немые переменные интегрирования, представ- ляющие четыре аргумента функций взаимной интенсивности, расположенные в том порядке, в котором они записаны, Подобным же образом мы определим четырехмерную пере- даточную функцию пространственно-инвариантной линейной системы: Ж (vb v2, v3, v4) = {К (xb x2) K* (x3, x4)J, (7.2.25) где учтено, что в пространственно-инвариантном случае каждая амплитудная функция размытия зависит только от двух не- зависимых переменных. Благодаря разделению четырехмерной функции размытия на два множителя функция Ж также раз- деляется на два множителя, а именно: ^(vb v2, v3, v4) = a?T(vb v2)5T(-v3, - v4), (7.2.26) где ЯС — двумерный фурье-образ амплитудной функции размы- тия: 4-00 ^(vb v2) = J J K(x„ dXi dx2. (7.2.27) —00 Итак, влияние системы, формирующей изображение, в четырех- мерной частотной шкале представляется функцией Л (Vl> V2> V3> V4) = ^(Vl> V2) (- V3> - V4) X (V>- V2- V3- V4)‘ (7.2.28) Но, поскольку aZf — двумерный фурье-образ функции К, а в силу формулы (7.1.38) функция К связана с двумерным фурье-образом функции зрачка Р, должно существовать более прямое соотношение между ЗС и Р. И действительно, если условия 1—3 для пространственно-инвариантного случая выпол- няются, то амплитудная функция размытия K(w —I, v — т]) принимает вид [формула (7.1.38)] 4-00 K(u-l v-n) = cJJ Р(х, У)Х — оо X ехр {- /2 л Г (и - g) 4- + (Ц - п) %-, (7.2.29)
298 Глава 7 где С — постоянная. Двумерное преобразование Фурье этого выражения приводит с точностью до несущественной масштаб- ной постоянной С к выражению (vb v2) = Р (Лг^ь Кгм), (7.2.30) и соотношение между спектрами взаимных интенсивностей (7,2.28) принимает вид ft (Vl> V2> V3> VJ = = P (xzzvp xzzv2) P* (- vzv3, - £zzv4) X (vp v2> v3> v4). (7.2.31) Ясно, что данная передаточная функция падает до нуля, когда vi, v2, V3 или v4 превышают некоторые предельные значения, от- вечающие функциям зрачка. К сожалению, соотношением Фурье (7,2,31) трудно пользо- ваться в таком виде, поскольку спектр зависит от свойств, и объекта, и освещения. Поэтому нужно дополнительно иссле- довать характер функции ^0, чтобы выяснить роль, которую играет каждый из этих двух физических факторов в отдель- ности, Предположим, как и ранее, что объект освещается сзади (т. е. просвечивается) и что он имеет амплитудный коэффи- циент пропускания to. Предположим также, что взаимная ин- тенсивность Jo света, падающего на объект, зависит только от разностей координат Ag = |2 — Ат] = т]2 — т]ь как это часто имеет место на практике. Таким образом, взаимная интенсив- ность прошедшего света дается выражением •№> Пр 12, П2) = ЛЖ An) t0П,) t; (S2, l2). (7.2.32) Четырехмерный фурье-образ функции Jo таков: Х(*р v2, v3, V4)= J JJ J J0(AL An)t0(^p nJt;(g2, П2) X — oo X exp {/2л (v^! + v2t|| + v3£2 + v4n2)} dli ^Hi dr\2. (7.2.33) После замены переменных g2 = A£ + L> П2 = Ап + П1 он прини- мает вид 4-00 X (V,, v2, V3, V4) = dri.to П,) */2я 5'+(Vi+v‘> X — oo 4-oo X J J dtf, dAnJ0 (A?. An) t; (£, + Ag, П, + An) е'2я . (7.2.34)
Влияние частичной когерентности 299 Последний двойной интеграл представляет собой фурье-образ произведения двух функций, а потому может быть вычислен как свертка их отдельных фурье-образов, После необходимых выкладок найдем, что второй интеграл может быть представ- лен в виде 4-00 J J Л (Р, я) (Р - V3, q - v4) е-'2я (va-PHm (VA-P)l dp dq, (7.2.35) —oo где £Г0 — двумерный фурье-образ функции t0. Подстановка это- го выражения в формулу (7,2.34) приводит к окончательному результату X(VPV2> V3> V<) = 4-00 = ^(PH-Vp <7 4-v2)^;(p-v3> v4)/0(p, <7) dp dq. (7.2.36) Каков смысл данного выражения, мы выясним, обратившись к рис. 7,10. Предположим, что амплитудный коэффициент про- Рис. 7,10. Перекрывание функций /0, д' Q н пускания to объекта есть функция с ограниченной частотной полосой, т, е. его спектр частот отличен от нуля только внутри круга радиусом р0 в двумерной частотной шкале. Кроме того, если освещение создается большим некогерентным источником, то в согласии с рассуждениями, которые привели к формуле (7.2.17), функция Д(р, q) с точностью до масштабного мно- жителя равна квадрату модуля функции зрачка конденсорной
300 Глава 7 (или осветительной) оптики: Л (р, q) = С | Рс (- iz2p, - kz2q) J2, (7.2.37) где С — постоянная, а г2 — расстояние от конденсорной линзы до объекта. Таким образом, функция тоже отлична от нуля только в конечной области значений своих аргументов, Как показано на рис. 7.10, спектр взаимной интенсивности про- шедшего света находится путем интегрирования произведения трех частично перекрывающихся функций $0(р, ?), ^0(p + vb q + v2) и ST* (р — v3, q — v4), Ясно, что с увеличением частот vi, V2, V3 и v4 степень перекрывания уменьшается и четырехмерный спектр о убывает. Комбинируя полученные выше результаты, в частности вы- ражения (7.2.28) и (7,2.36), мы можем теперь выразить че- тырехмерный спектр взаимной интенсивности изображения через двумерные спектры различных других встречающихся ве- личин. Получаем fl (VP V2> V3> V<) = (Vl> V2) (~ V3- - V4) X 4-00 X J J (P 4- Vp q + v2) £T0‘ (p - v3, q - v4) $0 (p, q) dp dq. — oo (7.2.38) Напомним читателю, что функция ЗС может быть выражена через функцию зрачка изображающей линзы и при обычных условиях (некогерентный источник больших размеров) функ- цию можно выразить через функцию зрачка конденсорной линзы. Теория, изложенная выше в данном пункте, позволяет вы- числять четырехмерный спектр взаимной интенсивности изобра- жения. Чаще требуется знать интенсивность изображения Л(и, v) или же ее двумерный спектр Фурье vv). По- этому займемся теперь приложением этой теории к задаче на- хождения указанных двух величин, Взаимную интенсивность J/ можно, конечно, найти, выполнив обратное преобразование Фурье спектра который в свою очередь может быть вычислен на основе изложенной выше теории. В качестве простого упражнения предлагаем показать, что если положить Ui = u2 = и и Vi = v2 = v в формуле этого обратного преобразования, то можно выразить Л(и, v) через
Влияние частичной когерентности 301 v2> v3, v4) (задача 7,3): 4-00 V2- V3> V4)X — co X exp {— /2л [u (Vj + v2) + v (v2 + v4)]} dv{ dv2 dv3dv4. (7.2,39) Найдя изложенными выше методами величину мы можем затем по формуле (7,2.39) вычислить интенсивность изобра- жения. В некоторых случаях может оказаться более желательным найти двумерный спектр Фурье интенсивности изображения, т. е. 4-00 Л (vi/> v0 = Л (ы>у) ехР {>2п (?ии + v/v)} du dv- (7-2-40) — оо Конечно, можно было бы просто выполнить это преобразова- ние для функции Л, которую мы научились вычислять ранее. Но можно и прямо связать ^(v^, vz) с Д (vp v2, v3, v4), ис- ключив тем самым некоторые промежуточные преобразования. Снова простое упражнение в преобразованиях Фурье приводит к тому, что из выражения (7.2.39) мы получаем выражение (за- дача 7.4) 4-00 Л (vy> vv) = J J Л (vi> v2> vu - vi> vv - v2) dvi dv2- (7.2.41) — oo Подставляя теперь (7.2.38) в (7.2.41) и переходя к переменным интегрирования Zi = р + Vi, г2 = q + v2, получаем следующее выражение для спектра интенсивности изображения: 4-00 h (vu> v0 = 5 5 dzi dz^0 (2i> 2г) (2i - vy> 22 - vv) x — oo Г-4-00 X Ш dp dqVC (Z[ — p, z2 — <?) X L —oo X JC - p - vut z2 - q - vz) Д, (p, <?)] (7.2.42) Заметим, что величина в квадратных скобках совершенно не за- висит от свойств объекта и полностью описывает влияние опти- ческой системы в пределах от источника до плоскости изо- бражения. Эта величина часто называется взаимным коэффи- циентом пропускания [7.2, 7.1]. Его вычисление сводится
302 Глава 7 к интегрированию трех частично перекрывающихся функций, во многом аналогичному вычислению, которое проиллюстрировано на рис. 7.10. В заключение заметим, что «линейно-системное» исследова- ние формирования изображения в условиях частичной когерент- ности — не простая задача, по крайней мере в сравнении с чаще применяемыми линейными системными подходами в случае пол- ной когерентности и полной некогерентности. Тем не менее для тех, кто хорошо знаком с теорией двумерного преобразования Фурье и способен «экстраполировать» свои знания на случай четырехмерных систем, такой метод может оказаться полезным при анализе частично когерентных систем формирования изо- бражения. Г. Некогерентный и когерентный пределы В данном пункте мы рассмотрим свойства изображения, пред- сказываемые описанной теорией в предельных случаях как пол- ностью некогерентного, так и полностью когерентного освеще- ния объекта. Мы найдем выражения для Л в этих двух слу- чаях, пользуясь методом, изложенным в п. Б. Кроме того, для иллюстрации мы, используя результаты, приведенные в п. В, найдем соответствующие выражения для двумерного спектра интенсивности изображения. И в заключение остановимся на физических критериях, позволяющих определить, может ли дан- ная система рассматриваться как полностью некогерентная или полностью когерентная с практической точки зрения. Случай полной некогерентности освещения объекта матема- тически может быть описан взаимной интенсивностью падаю- щего на объект света в виде Jo (AL АП) = х/об (AL An), (7.2.43) где x — постоянный множитель, 10 — постоянная интенсивность, а б — двумерная б-функция Дирака. Подставив это выражение в (7.2.11), в предположении пространственной инвариантности системы найдем 4 сю h (и, v) = х/0 J J | К (и -1 v - я) I2110 (L я) I2 dl di\. (7.2.44) — сю Таким образом, интенсивность изображения оказывается равной (с точностью до постоянного множителя) свертке коэффициен- та пропускания по интенсивности объекта |t0|2 с функцией раз- мытия по интенсивности |К|2. Ясно, что некогерентные системы линейны по интенсивности. Чтобы найти спектр Фурье интенсивности изображения, мы могли бы просто вычислить фурье-образ приведенного выше
Влияние частичной когерентности 303 результата. Но для иллюстрации мы вычислим по формуле (7.2.42). Преобразование Фурье взаимной интенсивности Jo в выражении (7.2.43) дает Л(р, q) = nlo. (7.2.45) В этом случае спектр принимает вид z2 — vv)dzidz2 X аТГ (р', q') JC* (р' — V(J, q' — vv) dp' dq' (7.2.46) после того как во втором интеграле произведена замена пере- менных р' = Z\ — р, q' — z2 — q. Интеграл в первых квадрат- ных скобках представляет собой фурье-образ коэффициента пропускания интенсивности на объекте, а во вторых — фурье- образ функции размывания интенсивности. Переход от частотных компонент интенсивности на объекте к интенсивности изображения определяется выражением во вто- рых скобках в формуле (7.2.46). Для удобства представим этот множитель в нормированном виде: +°° (р', q') JC* (р' - q' - vv) dp' dq' vv) A —-----------------------------------------(7.2.47) \<K(p',q')\*dp'dq' В такой форме он называется оптической передаточной функ- цией (ОПФ) и введен Дюффье [7.13]. Это комплексный коэф- фициент, описывающий действие системы, формирующей изо- бражение, на комплексную компоненту интенсивности объекта с частотами (vu,vv), отнесенный к коэффициенту перед компо- нентой с нулевой частотой. Из равенства (7.2.30) следует, что функция пропорциональна комплексной функции зрачка Р изображающей оптики. Таким образом, ОПФ может быть также представлена в виде нормированной автокорреляции комплекс- ной функции зрачка: 4-00 р (pS /) Р* (р' - dp' dq' vv) = —-----------. (7.2.48) $ $ I P(P", Ф) \2dp'dq'
304 Глава 7 Это хорошо известный результат, имеющий важное значение. Переходя теперь к случаю полностью когерентного освеще- ния, представим взаимную интенсивность освещения объекта в виде J0(A£, АП) = /О, (7.2.49) предполагая тем самым, что на объект по нормали падает пло- ская волна. Подставляя это выражение в (7.2.11) и рассмат- ривая снова пространственно-инвариантную систему, получаем 2 1{(и, v) = l0 (7.2.50) Если мы теперь определим инвариантное во времени фазорное распределение амплитуды изображения АДы, v)AV77 J5 K(«-g, v-n)t0(L (7.2.51) то увидим, что распределение амплитуды А/ пропорционально свертке амплитудной функции размытия К с амплитудным коэф- фициентом пропускания t0 объекта. Ясно, что полностью коге- рентная система линейна относительно комплексной амплитуды. Обобщение этого результата см. в задаче 7.9. Чтобы найти спектр Фурье интенсивности изображения, прежде всего заметим, что преобразование Фурье обеих частей равенства (7.2.49) приводит к результату &(р. <?) = Л,Ш <?)• ' (7.2.52) Подстановка этого выражения в (7.2.42) приводит к спектру ин- тенсивности изображения 4-00 vv) = /o 55 ^о(2Р г2)^Г(г,. z2-vv)X X sTT* (zt — vv, z2 — vv) dZi dz2. (7.2.53) В согласии с автокорреляционной теоремой фурье-анализа мы рассматриваем величину (7.2.53) как автокорреляционную функцию спектра <Уи, vv) = д/70 (уи, vv) (yUt vy). (7.2.54) Сравнение с выражением (7.2.51) показывает, что есть фурье-образ распределения амплитуды изображения А/. С точностью до постоянного множителя передаточная функ- ция когерентной системы, формирующей изображение, дается просто выражением H(vt/, vv) = ЗС (уи, Vr) = Р (AZfVt/, Zzfvv). (7.2.55)
Влияние частичной когерентности 305 Эта передаточная функция называется амплитудной передаточ- ной функцией или когерентной передаточной функцией. Перейдем наконец, к вопросу о том, при каких условиях можно практически считать, что система, формирующая изо- бражение, ведет себя в основном так, как это предсказывается изложенными выше идеализированными некогерентной и коге- рентной теориями. Ответ нам даст формула (7.2.11), которую мы перепишем здесь для случая пространственно-инвариантной системы и некогерентного источника в виде + оо h (и, v) = К (« — t v — я) К* (u — I — At v — n — Ari) X — оо X t0 (t n) t; G + At П + An) jo (At An) dl d^d^d An- (7.2.56) В случае когерентного освещения мы потребуем, чтобы ве- личина J0(A£, Ат]) была почти постоянной во всем интервале значений (AgAn), в котором подынтегральное выражение (7.2.56) заметно отличается от нуля. Ясно, что подынтеграль- ное выражение обращается в нуль, если величина А£ или Ат] больше ширины объекта, так как тогда t0 (L n) t*0 (В + AL П + Ап) = 0.. (7.2.57) Однако практически во всех случаях, представляющих интерес, амплитудная функция размытия К имеет ширину в плоско- сти (Ln), намного меньшую, чем ширина объекта. Следова- тельно, если А£ или Ат] превышает ширину К, то подынтеграль- ное выражение становится очень малым, поскольку K(u-L v-n)K*(u-g-AL v-n-An)^0 (7.2.58) Вывод таков: система будет вести себя приближенно как пол- ностью когерентная, если некогерентный источник света на- столько мал, что площадь когерентности на объекте значитель- но больше площади, отвечающей амплитудной функции размы- тия в плоскости объекта. Другими словами, мы требуем, чтобы угловой размер источника, видимый с объекта, был значительно меньше углового размера входного зрачка изображающей оптики. В некогерентном случае мы потребуем, чтобы величина Jp(ALAt]) была отлична от нуля только тогда, когда величины (AL Ат]) настолько малы, что к (« — t V—п) К* (и—£ — At V—n—An) t0 (t п) to (£ + At п+Ап)~ «|K(u-t v - П) I21 t0(L n)l2- (7.2.59) Необходимое условие состоит, очевидно, в том, чтобы площадь когерентности освещения объекта была меньше одновременно
306 Глава 7 площади, покрываемой амплитудной функцией размытия, и пло- щади наименьшей структуры в амплитудном коэффициенте пропускания объекта t0. Другая возможная формулировка та- кова: угловой размер 0$ некогерентного источника, наблюдае- мого с объекта, должен быть значительно больше углового раз- мера 0Р входного зрачка изображающей оптики и углового размера 0О пучка лучей, которые образуются объектом при нор- мальном падении плосковолнового освещения (т. е. углового размера спектра объекта). Таким образом, мы требуем, чтобы выполнялись условия е.>еР, е.>ео. (7.2.60) Путем изложенных рассуждений мы нашли необходимые условия формирования изображения при некогерентном осве- щении; достаточные же условия требуют несколько более де- тального обсуждения. Так как в формуле (7.2.59) перемно- жаются выражения, содержащие К и t0, на самом деле нужно рассмотреть свертку угловых спектров величин К и t0, чтобы найти достаточны^ условия для рассматриваемых угловых раз- меров. Сделав это, мы получим одно необходимое и достаточ- ное условие е,>о0 + еР. (7.2.61) Физический смысл этого требования состоит в следующем: угол, под которым виден источник из точки, отвечающей наи- большему углу дифракции, вносимому объектом, должен быть не меньше углового размера входного зрачка изображающей оптики. См. задачу 7.10, в которой рассматривается один из частных случаев. В заключение заметим, что особо важное значение имеет за- дача (которая, кстати, широко обсуждалась в литературе) о том, при каких условиях микроденситометр (прибор для изме- рения мелкомасштабной структуры плотности почернения фото- графических транспарантов) можно рассматривать как некоге- рентную систему (формирующую изображение). Для детального ознакомления с этим вопросом рекомендуем обратиться к лите- ратуре [7.14, 7.15]. § 3. Примеры Ряд методов вычисления интенсивности изображения был из- ложен в § 2. Теперь мы покажем, как пользоваться этими методами, на конкретных примерах.
Влияние частичной когерентности 307 А. Изображение двух близко расположенных точек Рассмотрим в качестве объекта экран с двумя малыми отвер- стиями. Предположим, что амплитудный коэффициент пропу- скания такого просвечиваемого объекта хорошо аппроксими- руется выражением т|) = аб(&-т. п) + аф + 4- т’)’ <7-ЗЛ> где а — постоянный множитель a S—расстояние между двумя «точечными» отверстиями. Будем считать, что на этот объект слева падает частично когерентный свет с взаимной интенсивностью J0(A£, Ат]) и его (М) (£,?) (“,и) Источник Объект Зрачок Изображение Рис. 7.11. Телецентрнческая система, формирующая изображение. Все линзы имеют одинаковое фокусное расстояние /. изображение формируется пространственно-инвариантной си- стемой, показанной на рис. 7.11. Подставив (7.3.1) в (7.2.56), после некоторых преобразований получим h (и, v) = Ц [ | К (ы — 4 > у) |2 + | К (« + 4 и) f + + 2Re{gK (« 4 • v)k‘(«+4’ °)}]’ где 11 = аЦ,(0, 0), g=-£j0(S, 0). (7.3.2) (7.3.3) При выводе выражения (7.3.2) мы исходили из того, что рас- пределение интенсивности источника описывается действитель- ной функцией; для фурье-образа этой функции выполняется со- отношение j0(-s, o)=j;(s, о). (7.3.4)
308 Глава 7 Амплитудная функция размытия К следующим образом вы- ражается через комплексную функцию зрачка Р: 4-00 Р (х, z/)expf — j — оо %-(ux + vy)]dxdy. (7.3.5) ЛГ ) Если функция зрачка Р имеет эрмитову симметрию [т. е. Р(—х, — у) = Р* (х, у) ], что справедливо в случае безаберра- ционного круглого зрачка, то К (u, v)—действительная величи- на (К = К). Тогда интенсивность изображения принимает вид Ш ») = /1[к2(«-у. v) + №(«+4- w) + 4- 2цК (и — 4> °)^(ы + 4’ и) C0S(p]- (7.3.6) где |и = |ц| и ф = arg{g}. В частном случае круглого зрачка амплитудная функция размытия принимает вид 7ХГ2 К К v) = K(p) = ^- 2пгрр (7.3.7) К где р= -\/u2-\-v2 и гр — радиус выходного зрачка. Граймс и Томсон [7.16] вычислили распределение интенсив- ности изображения при разных расстояниях между двумя точ- ками и разных комплексных коэффициентах когерентности. На рис. 7.12 показаны такие распределения в случае безаберра- ционного круглого зрачка, причем комплексный коэффициент когерентности пробегает значения от 1,0 до —1,0 с шагом 0,2, а расстояние между двумя точками дается выражением S = 0,6366 Д (7.3.8) гр (это несколько больше так называемого рэлеевского предела разрешения S = 0,6098Zf/rp). Заметим, что при ц= —1,0 обе точки освещаются когерент- но, но с разностью фаз 180° и интенсивность в средней точке между ними падает до нуля независимо от расстояния между ними. Если освещение объекта создается некогерентным источ- ником посредством конденсорной системы, то существует некий эффективный размер источника, при котором ц максимально по абсолютной величине и, следовательно, максимален провал кривой распределения интенсивности на плоскости изображе-
Влияние частичной когерентности 309 ния. Оптимальный эффективный размер источника зависит от расстояния между двумя точками и от распределения интен- сивности, характеризующего эффективный источник. (При не- которых распределениях интенсивности источника невозможны Рис. 7.12. Распределение интенсивности на изображении двух точечных источ- ников при разных значениях комплексной степени когерентности. Распределе- ние интенсивности симметрично относительно точки х = 0; интенсивность нормирована. Расстояние между двумя точечными источниками равно S = 0,6366Х/7гР. Нормировка выбрана так, что К(0, 0)= 1. отрицательные значения ц.) Все это рассматривается далее в задачах 7.5 и 7.6. В заключение заметим, что вопрос о том, при каких усло- виях два близко расположенных точечных источника минималь- но разрешаются, довольно сложен и допускает некоторую субъективность в решении. Согласно так называемому рэлеев-
310 Глава 7 скому критерию разрешения, две точки одинаковой яркости минимально разрешаются, если первый нуль функции Эйри для изображения одной точки точно совпадает с центральным мак- симумом функции Эйри для изображения второй точки. При таком условии интенсивность в средней точке распределения интенсивности изображения на 26,5 % меньше, чем в каждом максимуме. Иначе определяется критерий Спарроу: два точеч- ных источника минимально разрешены, если вторая производ- ная распределения интенсивности изображения обращается в нуль в средней точке между гауссовскими изображениями ис- точников. На самом деле возможность различить два точечных источника существенным образом зависит от отношения сиг- нала к шуму, при котором регистрируется распределение ин- тенсивности изображения, а потому критерии, не принимающие в расчет шум, субъективны. Тем не менее они пригодны для грубой предварительной оценки при проектировании аппара- туры. За дальнейшей информацией по этим вопросам отсылаем читателя к литературе [7.1]. Б. Изображение синусоидального амплитудного объекта Рассмотрим далее объект, амплитудный коэффициент пропуска- ния которого имеет вид t0U. n) = y[l + cos2nv0g]. (7.3.9) Такой объект часто называют синусоидальной амплитудной ре- шеткой. Заметим, что коэффициент пропускания интенсивности такого объекта равен IЫ2 = у + у cos 2jlvo£ 4- у cos2 2л Vol = = 4 + 4- e°s 2nv0| + -Г cos 4nv0|. (7.3.10) о Z о Мы хотим сравнить распределение интенсивности в изображе- нии такого объекта с коэффициентом пропускания интенсивно- сти (7.3.10), учитывая частичную когерентность освещения объекта [7.17]. В этой задаче удобнее всего проводить анализ в частотном представлении. Начнем с того, что выполним обратное преоб- разование Фурье выражения (7.2.42), записав интенсивность
Влияние частичной когерентности 311 изображения в следующем виде: Н-ОО I((v, v) — dvu dvv ехр {— /2л (uvy + uvv)} X “ОО + оо X J J dzx dz^T0 (z,, z2) sr; (z, - Vy, z2 - vv) X — oo + oo X dpdqJC(zx — p, z2 — q}JC*(zx — p — vUt z2 — q — vy)X (7.3.11) Для нашего объекта [формула (7.3.9)] мы имеем следующий спектр амплитудного коэффициента пропускания: (Zi. z2) = у d(zb z2) + -J-d (zx — v0, z2)+^6 (Zi + v0, z2). (7.3.12) Подставим такие выражения типа d-функций для :T0(zx, z2) и 9^(z, — vy, z2 —vu) в форму (7.3.11) и изменим порядок вы- полнения интегрирования. Интегрируя сначала по (vy, vv), затем по (г,, г2), а затем по (р, q) и используя выделяющие свойства d-функций, получаем I (и, v)= А + В cos 2nv0u + С cos 4лvou, (7.3.13) где при действительных значениях + Ж и £а = имеем Н-ОО -<?) + — оо + 4^2(-Vo-Р, -q)]dpdq, S = 4!i$ ЫР’ -Я)^^о-Р> -<?)] + + s?T(— р, —q)^C(—v0, — р, —q)dpdq, (7.3.14) + оо С = -Н5 ^(Р. (~\~Р’ -qjdpdq, “ оо Хотя частично когерентная система, формирующая изобра- жение, нелинейна, иногда полезно вводить кажущуюся пере- даточную функцию, определяемую следующим образом: (vlh Vy) = (VU> VV> mi (VU> vv) ’
312 Глава 7 где mi(vu> vy) и то(уи, vy) — коэффициенты модуляции компо- ненты с частотами (vy, v^) на входе и выходе. Для объекта, который мы рассматриваем, Рнс. 7.13. Кажущаяся передаточ- ная функция на частотах v0 (а) и 2v0 (б), где Vo — частота ампли- тудной решетки, при разных сте- пенях когерентности [7.17]. Вели- чина vc = Ор/Х — частота обреза- ния амплитудной передаточной функции. входной коэффициент модуляции с частотой vo? согласно формуле (7.3.10), равен т, = 4/3, тогда как выходной коэффициент моду- ляции равен т0 = В/А. Отсюда Для данной частотной компонен- ты и частоты 2vo соответствую- щий результат таков: ^(2v0) = ^. В работе [7.17] была рассчитана зависимость этих величин от vo в случае щелевого некогерентного источника и щелевой функции зрачка. Если 0S— угол, под кото- рым виден источник, а 0Р— угол, под которым виден зрачок си- стемы, формирующей изображе- ние, со стороны объекта, то З^а (vo) и З^а (2vo) оказываются функциями отношения 0P/0S (так же как и vo)- Это указывает на то, что характеристики системы зависят от когерентных свойств освещения объекта. На рис. 7.13 представлены кривые кажущихся передаточных функций на частотах vo и 2vo при раз- ных значениях отношения 0P/0S. Заметим, что условие 0P/0S~>O соответствует приближению к полностью некогерентному осве- щению, а условие 0p/0s->oo — приближению к полной коге- рентности. § 4. Формирование изображения как интерферометрический процесс Характер изображения, формирующегося при разных условиях освещения, становится более понятным, если процесс формиро- вания изображения рассматривать как интерферометрический процесс. Такой подход ведет также к различным новым мето- дам регистрации данных об изображении. Такой интерферомет- рический подход уже много лет используется в радиоастроно-
Влияние частичной когерентности 313 мии, поскольку изображения с наивысшим разрешением радио- объектов в большинстве случаев удается получить лишь с по- мощью интерферометров, а не непрерывных отражающих ан- тенн [7.18, 7.19]. На важное значение интерферометрической точки зрения в оптике в случае полностью некогерентного объекта уже давно указывал Роджерс [7.20]. А. Система, формирующая изображение, как интерферометр Мы знаем, что в интерференционном опыте Юнга свет, прохо- дящий через два малых отверстия, может интерферировать, давая синусоидальную интерферограмму с пространственной частотой, зависящей от расстояния между отверстиями. Но вы- ходной зрачок системы, формирующей изображение, можно мысленно разбить на множество отверстий, а наблюдаемое рас- пределение интенсивности изображения рассматривать как суперпозицию множества синусоидальных интерферограмм, даваемых всеми возможными парами таких отверстий. По край- ней мере от одной пары отверстий в выходном зрачке с рас- стояниями Ах = Аг/ = должна возникать частотная компонента интенсивности изобра- жения с пространственными частотами (vy, vv). Амплитуда и фаза синусоидальной интерферограммы, создаваемой парой от- верстий с координатами (xi,r/i) и (х2, г/2), определяются ампли- тудой и фазой взаимной интенсивности J' (хр ух\ х2, */2), про- шедшей через выходной зрачок. Поскольку в выходном зрачке много пар отверстий с расстояниями (Ах, Аг/), полные ампли- туду и фазу спектральной компоненты vv) интенсивно- сти изображения нужно вычислять путем сложения всех интер- ферограмм с частотами (vu,vy), соответствующим образом учитывая как их амплитуды, так и их пространственные фазы. Чтобы дать математическую формулировку всего сказанно- го, свяжем сначала с помощью формулы (7.1.47) интенсивность изображения с взаимной интенсивностью в выходном зрачке. Поскольку нас интересует главным образом спектр Фурье интенсивности изображения, выполним преобразо- вание Фурье выражения (7.1.47) по переменным (u, v). Изме- (7.4.1)
314 Глава 7 няя порядок интегрирования, находим + оо A(vt/> vv) = (Щ2 5 5 5 5 dxi йУх dxi аУгУр (*1> У1' х2> У2) х if — оо 4-00 (7.4.2) Последний двойной интеграл равен просто d (vy + [(х2 — x^/Xz,], vy + [(z/2 — #i)AzJ}. Интегрируя далее по (х2, у2) и используя выделяющие свойства d-функции, получаем + оо Л(УУ’ vv)=$J Jp(xi- У1’ xt-^zivU’ Уг-^z^^dx^dx^ (7.4.3) — оо Таким образом, чтобы найти комплексный спектр изображения для частот (vu,vn), мы должны проинтегрировать (или просум- мировать) все возможные значения взаимной интенсивности при фиксированных расстояниях (Az/Vy, Аг,уи), заставляя сво- бодные переменные (х^у^) пробегать по всей плоскости зрачка. Это полностью эквивалентно сложению всех интерференцион- ных картин Юнга, даваемых парами отверстий с расстояниями (Ах — Az/Vu, Аг/ == kziVv) между ними. Ясно, что на практике выходной зрачок имеет конечные раз- меры. Взаимную интенсивность J', покидающую выходной зра- чок, можно следующим образом выразить через взаимную ин- тенсивность Jp, падающую на выходной зрачок: J'p(xp у;, х2, ^2)=Р(хр ^)Р’(х2, f/2)jp(xp у^, х2, у2), (7.4.4) где Р — комплексная функция зрачка, которая определяется границами выходного зрачка, предусмотренной аподизацией, а также фазовыми ошибками или аберрациями, связанными с системой. Конечными размерами выходного зрачка ограничи- вается площадь, в пределах которой могут изменяться текущие переменные (xbyi) при любых фиксированных значениях (Azxvy, Az/Vy), Это становится более ясным, если подставить (7.4.4) в (7.4.3): + оо Л (Vy> Vv) = 5 J Р (ХР Уд Р* (Х1 - ^ZiVU’ - ^ZiVv) X — СО X Jp (*ь УГ, Х{ — IziVy, у{ — Kztvv) dXi dxx. (7.4.5)
Влияние частичной когерентности 315 У1 Рис. 7.14. Область интегрирования при вычислении спектра интенсивно- сти [частота (у и, Vy)]. В случае открытого круглого выходного зрачка радиусом гР область интегрирования по соответствует заштрихован- ной площади на рис. 7.14. Таким образом, можно представить себе, что фиксированное рас- стояние, показанное на рис. 7.14, скользит по заштрихован- ной площади, занимая всевоз- можные положения, в которых оно не выходит за ее пределы но сохраняя свою ориентацию (т. е. без изменения вектор- ного интервала) между отвер- стиями. Если исходный объект осве- щается некогерентным излуче- нием, то вычисление величины J. (v„,vv) становится особенно простым. Согласно теореме Ван Циттерта — Цернике, рас- пределение взаимной интенсивности, падающей на проведен- ную мысленно сферу радиусом z0 во входном зрачке (рис. 7.15), зависит только от расстояний Ах и Аг/ в этом зрачке. (Квадра- тичные фазовые множители, связанные с теоремой Ван Цит- терта — Цернике, выпадают благодаря введению такой вспо- Рис. 7.15 Входной и выходной зрачки. могательной сферы.) Выходной зрачок является просто изобра- жением входного зрачка. Следовательно, в пределах границ зрачка взаимная интенсивность Jp, падающая на сферу радиу- сом Zt в выходном зрачке, равна (если не считать возможного увеличения изображения) взаимной интенсивности, падающей на вспомогательную сферу во входном зрачке, а поэтому JP зависит только от разностей координат (Ах, Аг/) и не зависит от (*ь У\) В таком случае выражение (7.4.5) для J/(vt/, vv)
316 Глава 7 принимает вид Vv) = ip^ZiVU’ 4vv)X + ОО X р (Xt, у J P* (xt — XZiVy, yt — kZiVv) dxx dy{. (IAS) — oo Это означает, что в случае некогерентного освещения объек- та и оптической системы, свободной от аберраций (т. е. в слу- чае действительной и неотрицательной функции зрачка) при перемещении пары отверстий, разделенных фиксированным векторным интервалом, по выходному зрачку фазы вкладов интерферограмм Юнга будут одинаковы во всех положениях. Поэтому такие «элементарные интерферограммы» складывают- ся, давая полную интерферограмму с увеличенной амплитудой. Весовой множитель, придаваемый оптической системой компо- ненте с частотами (v^, v^), равен просто автокорреляционному интегралу в выражении (7.4.6), который (в отсутствие аподи- зации) сводится к площади перекрытия двух выходных зрач- ков, смещенных на векторный интервал (Xz/vt/, A-ZxVy), как по- казано на рис. 7.14. Оптическая передаточная функция системы равна этой площади перекрытия, нормированной на площадь перекрытия при vy = vn=0 (т. е. на площадь выходного зрачка). Если освещение объекта некогерентное, но система имеет аберрации, то при перемещении пары отверстий по выходному зрачку элементарные интерферограммы, определяемые фикси- рованным векторным интервалом, будут, вообще говоря, иметь разные пространственные фазы в разных положениях пар от- верстий. Поскольку такие интерферограммы не будут склады- ваться конструктивно, весовой множитель, вносимый оптиче- ской системой на этой частоте, уменьшается в соответствии с автокорреляционным интегралом в выражении (7.4.6). В этом случае оптическая передаточная функция принимает вид + оо р (Х1, ух) Р* (Xi — Az.Vy, у{ — dx{ dy} ^(vUtvv) = ^-----------. (7.4.7) I Р (*1. Ух) l2dx, dy, — СО Наконец, если освещение объекта частично когерентное, то ситуация становится более сложной. Взаимная интенсивность Jp теперь зависит как от расстояния между отверстиями, так и от их положения, и, следовательно, ее уже нельзя вынести за знак интеграла в формуле (7.4.5). В этом случае амплитуды
Влияние частичной когерентности 317 и фазы элементарных интерферограмм могут изменяться при перемещении пар отверстий по выходному зрачку, даже если система свободна от аберраций. Поэтому нельзя ввести весо- вой множитель, связанный только с самой системой, для ка- кой-либо компоненты с заданной пространственной частотой. Тем не менее выражение (7.4.5) очень ясно показывает, как строится компонента с частотами (v^, vv) из элементарных ин- терферограмм, даже если амплитуды и фазы последних весьма сложно зависят от того, какую часть зрачка мы рассматри- ваем. За более подробным анализом случая частично когерент- ного света рекомендуем читателю обратиться к работе [7.21]. Б. Применение интерферометров для получения информации об изображении Здесь мы будем рассматривать лишь полностью некогерентные объекты. Ранее мы видели, что в случае таких объектов и без- аберрационной оптической системы одна пара отверстий, по- мещенных в выходной зрачок и разделенных векторным интер- валом (hZiVu, teiVv), дает интерферограмму, амплитуда которой пропорциональна модулю функции Jp взаимной интенсивности в зрачке, а пространственная фаза совпадает с фазой этой функции. Но, согласно теореме Ван Циттерта — Цернике, вели- чина Jp пропорциональна двумерному фурье-образу распределе- ния интенсивности на объекте. Следовательно, измерив указан- ные параметры этой отдельной интерферограммы, мы получаем (с точностью до действительного коэффициента пропорциональ- ности) спектр объекта на частотах (vu, v^). Разные пары от- верстий с одним и тем же векторным интервалом дают одина- ковые интерферограммы. Поэтому избыточность оптической системы (т. е. большое число вариантов расположения отдель- ного векторного интервала в зрачке) лишь повышает отноше- ние сигнала к шуму при измерении, но не дает новой инфор- мации. Если же оптическая система содержит аберрации или на- ходится в неоднородной среде, которая создает аберрации, то наличие такой избыточности может даже оказаться вредным. В этих условиях интерферограммы Юнга, отвечающие одной и той же пространственной частоте, складываются с разными пространственными фазами, что приводит к уменьшению кон- траста и точности, с которой может быть измерена амплитуда интерферограммы [7.22]. В известных случаях желательно расширить пределы изме- нения векторных интервалов, наблюдаемых с помощью оптиче- ской системы, без применения дополнительных линз или зер- кал с большой апертурой. Как будет далее показано более
318 Глава 7 подробно, это приводит нас к апертурному синтезу и применению интерферометров для получения информации об объекте. В ряде случаев нас удовлетворила бы лишь часть той ин- формации об объекте, которую несет его детальное изображе- ние. Так, если нам известно, что объект — однородный круглый излучатель, то достаточно было бы определить его угловой диа- метр. Если известно, что объект состоит из двух точечных ис- точников, то нам достаточно знать, скажем, угловое расстоя- ние между ними и их относительные интенсивности. В таких Основной Диафрагма Плоскость коллектор зра у на изображения Рис. 7.16. Звездный интерферометр Физо. случаях требуемая информация может быть получена из мо- дуля спектра объекта, и мы можем игнорировать фазовую ин- формацию. Простейший вид интерферометра, пригодный для получения пространственной информации, — это звездный интерферометр Физо [7.23], схема которого показана на рис. 7.16. В задачах астрономических измерений, для которых этот интерферометр впервые нашел применение, объект располагается на исключи- тельно больших расстояниях от наблюдателя, а плоскость изо- бражения совпадает с задней фокальной плоскостью зеркаль- ного или линзового телескопа. Для построения интерферометра Физо в изображение зрачка телескопа помещается маска, эф- фективно пропускающая только два малых пучка лучей, разде- ленных средним интервалом (Ах, А//) на основном коллекторе, которые интерферируют в фокальной плоскости. Контраст, или видность, интерферограммы в фокальной плоскости опреде- ляется модулем комплексного коэффициента когерентности све- та, падающего на два эффективных зрачковых отверстия; 1 J (Дх, Дг/) I = 0) (7Л8) где Jp — взаимная интенсивность света, падающего на апер- туру основного коллектора.
Влияние частичной когерентности 319 В случае круглого источника однородной яркости радиусом rs, удаленного на расстояние г, комплексный коэффициент коге- рентности света, падающего на зрачок телескопа, имеет вид Ир (Ах, At/) = 2 7(Дх)»+(Д//)2>) \ Лг_________________/ 7(ДХ)’ + (Д^ Кг (7.4.9) Это выражение можно также переписать, используя угловой диаметр 0S = Ътз/г источника: gp (Ах, At/) = 2 л(-д^7(Дх)2 + (д</)2' 7(Дх)2 + (Д(/)2 Л (7.4.10) Заметим, что контраст интерферограммы полностью исчезает (|цр| = 0), если интервал $ = V(AX)2 + (Ду)2 отвечает нулю функции Бесселя Наименьший интервал такого рода равен *»-1.22 А, (7,4.11) Таким образом, можно измерить угловой диаметр источника, постепенно увеличивая интервал между двумя отверстиями до тех пор, пока не исчезнут интерференционные полосы. Тогда диаметр источника вычисляется по формуле 6S=1,22—. (7.4.12) So Читателю может показаться непонятным, почему звездный интерферометр Физо, в котором используется только часть апертуры телескопа, оказывается более подходящим для изме- рения углового диаметра удаленного объекта, нежели методы, использующие полную апертуру. Дело в том, что нужно учи- тывать эффекты случайных пространственных и временных флуктуаций в земной атмосфере («видение» через атмосферу), о чем подробно говорится в гл. 8. Здесь же мы скажем лишь, что момент исчезновения контраста интерференционной карти- ны при наличии атмосферных флуктуаций легче зафиксировать, чем определять диаметр объекта по его изображению с нечет- кими границами. Основной недостаток звездного интерферометра Физо со- стоит в том, что он пригоден только для измерения диаметров сравнительно больших источников. Максимальные интервалы, которые могут быть проанализированы, определяются диамет- ром телескопа, и поэтому звездных источников, диаметр кото-
320 Глава 7 рых может быть измерен даже самыми большими телескопами, крайне мало. Пределы интервалов, допускаемых обычными телескопами, были сильно расширены при появлении интерферометра, изо- бретенного Майкельсоном [7.24], который называется звезд- ным интерферометром Майкельсона. Как показано на рис. 7.17, Рис. 7.17. Звездный интерферометр Майкельсона. в самом типичном случае телескопа-рефлектора на длинной жесткой поперечине смонтированы два подвижных зеркала. Свет от этих двух зеркал направляется на основной коллектор телескопа, и два острых пучка лучей соединяются в фокальной плоскости точно так же, как и в интерферометре Физо. Теперь, однако, входные интервалы $ не ограничиваются апертурой те- лескопа, и поэтому могут измеряться диаметры источников на- много меньших размеров. Шестиметровый интерферометр та- кого рода был сконструирован и успешно использован Май- кельсоном [7.25] и Майкельсоном и Пизом [7.26]. Был также построен 15-метровый интерферометр, но он работал не столь хорошо, как ожидалось. Трудности, которые встречаются в работе со звездным ин- терферометром Майкельсона, далеко не тривиальны. Весь при- бор должен быть тщательно отъюстирован, и оптические раз- ности хода в двух плечах должны быть одинаковы с точностью до некоторой доли длины когерентности света. Чтобы собрать
Влияние частичной когерентности 321 насколько возможно больше света, приходится максимально расширять спектральную полосу света, а это означает, что ис- ключительно мала длина когерентности света. В дополнение к этим трудностям случайные пространственные изменения по- казателя преломления земной атмосферы вносят аберрации, из-за чего максимальный полезный диаметр зеркал интерферо- метра может быть не более — 10 см. Случайные временные из- менения атмосферных эффектов вносят зависящую от времени разность фаз для двух путей, в результате чего фаза интерфе- рограммы быстро изменяется во времени. Очень удачно ока- залось то, что время интегрирования человеческого глаза до- статочно мало и Майкельсон был в состоянии определять на- личие или отсутствие интерференционных полос, несмотря на быстрое их движение. Более современные варианты оптических звездных интерфе- рометров, предложенные и нашедшие применение в последние годы [7.27, 7.31], в том числе и интерферометр интенсивностей, рассматриваются в гл. 6 и 9, а звездный спекл-интерферометр— в гл. 8. В. Важное значение фазовой информации Простейшим возможным применением звездного интерферомет- ра Майкельсона является определение того интервала $0> при котором интерференционные полосы начинают исчезать, и, сле- довательно, углового диаметра удаленного источника. Более заманчивым было бы измерить модуль комплексного коэффи- циента когерентности |цр| для всей области двумерных интер- валов и извлечь из этих данных более детальную информацию об изображении, нежели просто угловой диаметр. Еще более заманчивым было бы попытаться измерить как модуль, так и фазу величины для всей области двумерных интервалов, и на основании этих более полных данных построить изобра- жение. Ясно, что если бы были измерены и модуль, и фаза вели- чины то мы могли бы найти спектр Фурье объекта по край- ней мере до предельной пространственной частоты, соответ- ствующей максимальному значению допускаемого интервала. Обратное преобразование Фурье измеренной зависимости цр(Ах, Аг/) дало бы нам нужное изображение с разрешением, определяющимся максимальным значением интервала. К сожалению, на практике из данных интерферометрических измерений невозможно извлечь точную информацию о фазе. Хотя в принципе и можно измерить положение фиксированной интерферограммы относительно выбранного начала отсчета, фаза интерферограммы претерпевает случайные флуктуации во
322 Глава 7 времени из-за случайных флуктуаций атмосферы и механиче- ских нестабильностей самого интерферометра. Более реальной задачей была бы попытка измерить только модуль величины на двумерном множестве интервалов либо путем проведения целого ряда последовательных измерений, либо при помощи многоэлементного фотоприемника. Тогда есте- ственно возникает вопрос: какая именно информация об объек- те, может быть извлечена из данных измерения модуля по его спектру Фурье? (О более ранних работах в оптике, связанных 4(C) Рнс. 7.18. Следствия потерн фазовой информации. с этим вопросом, см. статьи [7.32, 7.33].) Чем нам приходится платить за потерю фазовой информации? То, что фазовая информация, вообще говоря, исключитель- но важна для формирования изображения, можно продемон- стрировать на простом примере. Рассмотрим одномерный объект с прямоугольным профилем интенсивности (рис. 7.18). Соответствующий комплексный коэффициент когерентности есть просто функция sine. Заметим, что отрицательные лепест- ки функции sine соответствуют изменению на 180° фазы интер- ферограммы, создаваемой интерферометром, а такие изменения фазы не могут быть обнаружены по причинам, выясненным ра- нее. Таким образом, результаты измерения соответствуют мо- дулю функции sine. Если, считая эту информацию о модуле истинным спектром объекта, мы подвергнем его обратному преобразованию Фурье, то получим «изображение», показанное
Влияние частичной когерентности 323 на рис. 7.18,6. Ясно, что в нем мало сходства с исходным объектом! Имеется ряд случаев, когда отсутствие фазовой информации несущественно. Например, если фурье-образ объекта действи- телен и неотрицателен, то спектр не содержит фазовой инфор- мации. Примером может служить объект с гауссовским рас- Точечный источник Рис. 7.20. Особый случай, в котором возможно полное восстановление изображения по автокорре- ляционной функции интенсивности объекта, а — объект; б — автокорреляционная функция. Рис. 7.19. Определение расстояния между двумя малыми источниками по автокорреляционной фун- кции объекта, а — рас- пределение объекта; б — автокорреляционная фун- кция. пределением интенсивности (а следовательно, и с гауссовским спектром) Ш Я) = 7ехр{-^^-}. (7.4.13) В задаче 7.7 читателю предлагается доказать, что, зная только модуль спектра, можно восстановить любое симметричное од- номерное распределение интенсивности, если провести соответ- ствующую обработку исходных данных. Мы получим более правильное представление о том, какая именно информация об объекте содержится в модуле спектра, если рассмотрим обратное преобразование Фурье не просто мо- дуля ||ЛР |, а величины |gp(Ax, Аг/) |2. В этом случае, согласно автокорреляционной теореме фурье-анализа, «изображение»,
324 Глава 7 которое можно восстановить, имеет вид + ОО Л (ы, о) = 10 а, п) /о а - И, П - У) (7.4.14) — оо т. е. восстановленные данные — это автокорреляционная функ- ция распределения интенсивности объекта. Такая информация может быть полезной, например, при измерении расстояний ме- жду двумя малыми звездами, как это показано на рис. 7.19. Расстояние А может быть четко определено по автокорреля- ционной функции. Существует одно специальное условие, при котором авто- корреляционная функция может дать полную информацию об объекте независимо от симметрии последнего [7.34, 7.35]. Оно состоит в том, чтобы возле интересующего нас объекта на определенном расстоянии от него находился точечный источник света. Тогда автокорреляционная функция содержит два изо- бражения объекта (рис. 7.20), а также ненужную информацию точно так же, как в случае голографических изображений. Г. Восстановление фазы На очень интересное возможное решение вопроса о потере фа- зовой информации указал Вольф в 1962 г. [7.36]. Хотя тогда речь шла о фурье-спектроскопии, данный принцип приложим и к пространственной интерферометрии. Для простоты мы рас- смотрим случай одной переменной, но возможно обобщение и на случай функций двух переменных. Более детально с одно- мерной задачей можно ознакомиться в работах [7.37, 7.38]. По предположению заранее известно, что рассматриваемый некогерентный объект является пространственно ограниченным, т. е. интенсивность объекта /0(£) не равна нулю только в пре- делах конечного интервала на оси g. Без потери общности мы можем выбрать начало координат так, чтобы выполнялось условие /о(|) = 0 при всех (7.4.15) [Соответствующее условие в двумерном случае состоит в за- дании ненулевых значений 10 в верхнем правом квадранте пло- скости (£, л)-] Комплексный коэффициент когерентности р(Дх) = рг(Дх) +/ц((Дх) (7.4.16) есть нормированный фурье-образ функции /0. Из теории ана- литических сигналов мы знаем, что действительная и мнимая части фурье-образа функции, удовлетворяющей условию (7.4.15), должны быть связаны между собой преобразованием
Влияние частичной когерентности 325 Гильберта ’) MM-j- f (7.4.17) — оо Представим теперь комплексный коэффициент когерентности в виде функции комплексного аргумента z = Ax + /<7- Тогда функция g(z) оказывается связанной с 10(%) односторонним преобразованием Лапласа: li(z) = b J I0(l)e^dly (7.4.18) о где s = —/2nz есть обычная переменная преобразования Ла- пласа, а b — постоянный множитель. Как нетрудно сообразить, величина |и(г) обязательно должна быть аналитической (не иметь полюсов) в верхней половине комплексной плоскости z — вследствие односторонней формы функции /0. Отсюда и назва- ние «аналитический сигнал» для такой функции* 2). Очевидно, что мы можем воспользоваться соотношением (7.4.17), чтобы вычислить действительную часть ц по известной мнимой части. Мы можем также вычислить мнимую часть по действительной, выполнив обратное преобразование Гильберта = f (7.4.19) Но ни то ни другое соотношение не помогает нам в решении рассматриваемой задачи, а именно в определении фазы коэф- фициента ц по известному значению его модуля. Чтобы продвинуться в направлении решения этой задачи, рассмотрим формулу для комплексного логарифма функции ц(Ах). Если ц (Ах) = | ц (Ах) | ехр [/а (Ах)], (7.4.20) то In [ц (Ах)] = In | ц (Ах) | + /а (Ах). (7.4.21) Теперь, если бы можно было показать, что 1п[ц(Ах)] —анали- тический сигнал, то, зная модуль, можно было бы восстано- *) Сравнивая формулу (3.8.20) с формулой (7.4.19), следует помнить, что в первой мы имеем дело с функцией, имеющей односторонний спектр, а во второй — со спектром односторонней функции. 2) Если величина /0(&) тоже равна нулю при g, больших некоторой верх- ней границы, то p(z) тоже не имеет полюсов в нижней комплексной полупло- скости г.
326 Глава 7 вить фазу с помощью преобразования Гильберта а(Ах)=—Ь J dt>. (7.4.22) — оо К сожалению, аналитичность функции g(z) в верхней ча- сти комплексной полуплоскости z не может служить достаточ- ным условием для аналитичности функции 1п|ц(г)| в той же области. Наиболее очевидной причиной потери аналитичности является возможное наличие нулей функции g(z) в верхней по- луплоскости, которые приводят к сингулярностям функции ln|g(z) |. Тщательный математический анализ этой задачи [7.39] по- казывает, что если функция ц(Ах) квадратично интегрируема, т. е. 4-00 J |g(Ax)|2dAx< оо, (7.4.23) —оо а также если функция ц(Ах) удовлетворяет «условию Пэли — Винера» 1 X'+l' ^<°°- (7.4.24) — СЮ то фаза а (Ах) дается выражением а(Дх) = —1 X 1п|и^)1 dg+^arg (7Л25) л J £ — Ах | Ах — z„ | -оо ® п V п > где zrt — нули функции g(z) в верхней половине плоскости г. В некоторых случаях функция ц(г) может не иметь нулей в верхней полуплоскости, и тогда применимо так называемое решение с минимальной фазой (7.4.22) [7.40]. Но, вообще го- воря, нули имеются и они заранее неизвестны. Было сделано много попыток устранить некоторые из неопределенностей в положении нулей путем наложения дополнительных физиче- ских ограничений на /0(£) (иапрнмер, требования положитель- ности), но и при таких ограничениях в общем случае неодно- значность сохраняется. В последние годы удалось добиться больших успехов в ре- шении двумерного варианта этой задачи о «восстановлении фазы». В работах [7.41, 7.42] был применен метод итераций и было показано, что в большинстве случаев, включающих функ- ции /0(£, т]) значительной сложности, итерации сходятся к пра- вильному решению. Это указывает на то, что неоднозначности в решении в двумерном случае не так велики, как в одномер-
Влияние частичной когерентности 327 ном. Такой вывод подтверждается и аналитическими расчета- ми [7.43]. Тем не менее можно найти двумерные случаи, в ко- торых имеются неоднозначности [7.44]. Простейший вариант итерационных вычислений, о которых шла речь, проводится в числовой форме на основе следующих предположений: 1) модуль |ц(Ах Ау) | комплексной функции ц измерен и, следовательно, известен; 2) интенсивность объекта /□(£, т]) тождественно равна нулю вне заданной области на Рнс. 7.21. Пример применения итерационного алгоритма восстановления фазы [7.45]. а — первоначальный объект (синтезированное изображение космиче- ского корабля); б — модуль спектра Фурье объекта; в — изображение, вос- становленное в результате применения итерационного алгоритма. плоскости (L'n)i 3) интенсивность объекта /о(£,т])—неотрица- тельная функция (/0(£, Т|)Эг 0). В качестве первой оценки фазы функции ц(Ах, Ау) можно взять набор случайных фаз [предполагается, что модуль |ц(Ах, Аг/) | известен для дискретного набора положений на плоскости (Ах, Аг/)]. Фурье-оригинал этого набора, обозначен- ный через ц(1)(Ах, Аг/), дает спектр /^(В, т])» который, вообще говоря, отличен от нуля вне области определения истинного спектра 10 и имеет некоторые отрицательные значения. Если отрицательные значения исключить (например, положив их рав- ными нулю), а ненулевые значения лежащие вие извест- ной области определения, заменить нулем, то фурье-образ та- кого видоизмененного распределения интенсивности дает функ- цию ц(2>(Ах, Аг/), которая имеет новое распределение фаз, а также распределение видоизмененного модуля. Если мы заме- ним теперь распределение модуля первоначальным распределе- нием, которое, как мы знаем, является точным, но оставим но- вую фазовую информацию, то будем иметь вторую оценку ц(2)(Ах, Аг/) для комплексной функции ц. Такой процесс повто- ряют, надеясь что Нт /(“>(£, т]) = /о(£, т]). Действительно, по- П->оо добный процесс итераций почти всегда сходится, и остается
328 Глава 7 лишь под вопросом, сходится ли он к правильному решению. Как отмечалось выше, правильное решение получается в очень большом числе случаев. На рис. 7.21 [7.45] представлен пример применения алго- ритма, подобного описанному выше. На рис. 7.21, а показан ис- ходный объект — синтезированное изображение космического корабля. На рис. 7.21,6 показан модуль спектра Фурье этого изображения, а на рис. 7.21, в — изображение, реконструирован- ное с использованием итерационного алгоритма. Различия ме- жду изображениями айв трудно обнаружить на этих репро- дукциях, и они действительно весьма малы1). § 5. Спекл-эффекты при когерентном формировании изображения Когда изображение сложного объекта формируют с помощью высококогерентного света, генерируемого лазером, сразу же об- наруживается очень важный вид дефекта изображения. Если поверхность объекта шероховата в масштабе оптических длин волн (а это справедливо для большинства оптических объек- тов), то изображение кажется зернистым, с множеством свет- лых и темных пятен, которые не имеют видимой связи с мак- роскопическими рассеивательными свойствами объекта. Такую хаотическую и неупорядоченную структуру принято называть «спекл-структурой». Спекл-структура обнаруживается также в изображениях прозрачных объектов, на которые падает коге- рентный свет через неподвижный рассеиватель. Типичная спекл-структура в изображении равномерно отражающей по- верхности показана на рис. 7.22. Хотя детальный анализ свойств спекл-структур, создавае- мых лазерным светом, был начат в начале 60-х гг., исследова- ния подобных явлений можно найти в значительно более ран- ней научной литературе по физике и технике. Следует особо отметить исследования «корон», или фраунгоферовских колец, в работах Верде [7.46] и Рэлея [7.47]. Позднее в серии статей, посвященных рассеянию света большим количеством частиц, фон Лауэ [7.48—7.50] установил многие основные закономер- ности явлений, аналогичных образованию спекл-структуры. Существует ряд довольно обширных современных работ, по- священных спекл-структуре [7.51—7.53]2). Для полного и стро- 1) Задача восстановления изображения по спектру Фурье относится к классу некорректных задач. Разработка методов их решения в значительной мере заслуга советских математиков. Смотри по эюму поводу |7,8д]. — Прим, перев. 2) Физические особенности спекл-структуры описаны также в работах [7.9д--7.11д].--77/пм(. ред.
Влияние частичной когерентности 329 того понимания физики спекл-структуры требуется детальное исследование свойств электромагнитных волн, отражаемых или Рис. 7.22, Спекл-структура на изображении объекта однородной яркости [7,52]. рассеиваемых шероховатыми поверхностями [7.54]. Но, чтобы получить качественное представление о свойствах спекл-струк- туры, можно обойтись менее строгим подходом. А. Причины возникновения спекл-структуры и ее статистические характеристики первого порядка Причины возникновения спекл-структуры были установлены уже в ранних работах, посвященных лазерам [7.55, 7.56]. Огром- ное большинство поверхностей, естественных и искусственных, являются сильно шероховатыми в масштабе оптических длин волн. При освещении монохроматическим светом волна отра- женная от такой поверхности, оказывается состоящей из вкла- дов большого числа различных рассеивающих точек или пло- щадок. Как показано на рис. 7.23, элемент изображения, фор- мируемый в данной точке плоскости наблюдения, представляет собой суперпозицию множества амплитудных функций размы- вания, каждая из которых отвечает своей рассеивающей точке на поверхности объекта. Вследствие шероховатости поверхности различные складывающиеся функции размывания имеют замет- но различающиеся фазы, что приводит к очень сложной интер- ферограмме.
330 Глава 7 Сказанное относится и к случаю прозрачных объектов, осве- щаемых через диффузный рассеиватель. Из-за наличия рассеи- вателя фронт волны, покидающей объект, весьма неровен и имеет исключительно сложную структуру. На изображении та- кого объекта мы тоже находим большие флуктуации интенсив- ности, обусловленные перекрыванием множества расфазиро- ванных функций размывания. Поскольку мы не знаем детальной микроскопической струк- туры сложного волнового фронта, покидающего объект, при- Расфазировахные амплитудные функции размывания Шероховатый объект Линза Плоскость изображения Рис. 7.23. Образование спекл-структуры иа изображении шероховатого объ екта. ходится подходить статистически к вопросу о свойствах спекл- структуры. Рассматривается статистическое распределение для ансамбля объектов с одинаковыми макроскопическими свой- ствами, но различающихся в микроскопических деталях. Так, если мы поместим фотоприемник в определенную точку пло- скости изображения, то измеренная интенсивность не может быть заранее точно предсказана, даже если макроскопические свойства объекта точно известны. Мы можем найти только ста- тистическое распределение этой интенсивности для некоего ан- самбля шероховатых поверхностей. Наиболее важной статистической характеристикой спекл- структуры является, по-видимому, плотность распределения ин- тенсивности /, наблюдаемой в некоторой точке изображения. Какова вероятность наблюдать светлый максимум или темный минимум интенсивности? На этот вопрос можно ответить, учи- тывая аналогию нашей задачи с классической задачей о слу- чайном блуждании [7.57—7.59], которая довольно подробно рассматривалась в гл. 2, § 9. Данная задача также полностью аналогична задаче определения статистических характеристик первого порядка интенсивности теплового излучения, рассмот- ренной в гл. 4, § 2. Как говорилось в гл. 4, § 2, если фазы от- дельных вкладов рассеяния на объекте приблизительно одно- родно распределены в интервале (—л, л) (т. е. если объект
Влияние частичной когерентности 331 действительно является шероховатым в масштабе одной длины волны), то поле, связанное с отдельной линейной компонентой поляризации изображения, должно быть круговой комплексной гауссовской случайной переменной, а интенсивность ее должна подчиняться экспоненциальному распределению с отрицатель- ным показателем: ( 4гехрfпри О, Р/(/) = ] / Ч I ) (7.5.1) 10 в других случаях, где I — средняя интенсивность, связанная с этой компонентой поляризации. Если рассеянная волна частично деполяризована, то могут быть использованы методы, совершенно аналогичные использованным в гл. 4, § 3, п. Г, показывающие, что плотность распределения интенсивности I равна разности двух экспонент с отрицательными показателями [формула (4.3.42)]. Однако здесь мы будем рассматривать случай полностью поляризован- ной спекл-структуры. Тот факт, что плотность распределения интенсивности имеет вид экспоненты с отрицательным показателем, означает, что флуктуации относительно среднего значения оказываются до- вольно заметными. Если мы определим контраст С спекл- структуры как отношение стандартного отклонения интенсив- ности к ее среднему значению, то для поляризованного света получим С = ^-=1. (7.5.2) Из-за столь высокого контраста спекл-структура чрезвычайно мешает наблюдателю, особенно если его интересует тонкая структура изображения, и приводит к значительному ухудше- нию эффективного разрешения. В заключение отметим, что распределение средней интенсив- ности 7(х, у) в изображении когерентно освещаемого шерохо- ватого объекта совпадает с интенсивностью, которая .наблюда- лась бы, если бы объект освещался пространственно некоге- рентным светом с той же самой спектральной плотностью мощ- ности. Некогерентное освещение можно считать эквивалентным быстрой временной последовательности пространственно-коге- рентных волновых фронтов, эффективная фазовая структура каждого из которых исключительно сложна и совершенно не зависит от фазовой структуры других членов последовательно- сти. Таким образом, проинтегрированная по времени интенсив- ность изображения, наблюдаемая при пространственно-некоге- рентном освещении, идентична усредненной по ансамблю ин- тенсивности 7 (х, у) (в предположении одинаковой ширины по-
332 Глава 7 лос). Следовательно, любой из методов анализа распределения интенсивности изображения для некогерентных систем, форми- рующих изображение, может быть применен для расчета рас- пределения средней интенсивности спекл-структуры в изобра- жении когерентно освещаемого шероховатого объекта. Б. Когерентность, усредненная по ансамблю В предыдущих параграфах и главах световые волны рассмат- ривались как эргодические случайные процессы. Иначе говоря, предполагалось, что среднее по времени тождественно равно среднему по ансамблю и, стало быть, эти два типа процесса усреднения можно произвольно заменять один другим. Суще- ственно, что если на оптически шероховатый объект падает монохроматический свет, то отраженные волны уже нельзя рас- сматривать как эргодически случайный процесс, ибо средние по времени и по ансамблю уже не совпадают. Отсутствие эргодичности в этом случае легко продемонстри- ровать, рассмотрев два разных интерференционных опыта Юнга. Пусть в первом опыте свет, рассеиваемый стационарной шероховатой поверхностью, падает на экран с двумя отвер- стиями и мы ведем наблюдения за интерферограммой, форми- руемой на другом, удаленном экране. Поскольку свет монохро- матический, он пространственно-когерентен (задача 5.12) и видность интерферограммы определяется следующим образом: Т _ 2Ул77 Л + ^2 (7.5.3) где 1\ и /2— интенсивности света, падающего на отверстия. От- сюда следует, что модуль комплексного коэффициента коге- рентности |ц12| должен быть равен единице, по крайней мере при обычном определении степени когерентности усреднением по времени. Исключительно сложное распределение амплитуды и фазы, придаваемое волне шероховатой поверхностью, не уменьшает степень когерентности света, поскольку это распре- деление не изменяется во1 времени. Рассмотрим теперь второй интерференционный опыт Юнга. В этом случае мы проведем усреднение по ансамблю, последо- вательно помещая объекты с одной и той же макроструктурой, но с разной микроструктурой (профилем поверхности) в осве- щающий пучок и интегрируя по времени на фотографической пластинке все интерферограммы, создаваемые последователь- ностью объектов. Хотя видность любой из этих отдельных ин- терферограмм соответствует значению |gi2|= 1, видность су- перпозиции интерферограмм, вообще говоря, будет иной, по- скольку фазы отдельных компонент будут изменяться от реали-
Влияние частичной когерентности 333 зации к реализации. Таким образом, интерферограмма, усред- ненная по ансамблю, вообще говоря, даст значения |gi2|, весьма отличные от единицы. Поскольку существует разница в средних по ансамблю и по времени для такого типа волн, нам приходится тщательно раз- личать усредненную по времени и усредненную по ансамблю степень когерентности. Поэтому мы оставим обычные символы для когерентности, определяемой при усреднении по времени, а чертой над символом будем отмечать величины, усредненные по ансамблю. Таким образом, у нас будут две функции взаим- ной когерентности Г(Р1,Р2;т) и Г(Р1,Р2; т), две взаимные ин- тенсивности J (Pi, Р2) и J (Pi, Р2) и т. п. Волновое уравнение, описывающее распространение света, ко- нечно, остается одним и тем же независимо от того, интере- суют ли нас в конечном счете свойства света при усреднении по времени или по ансамблю. Из этого следует важный вывод: законы, описывающие распространение функций когерентности, одинаковы для величин, усредненных по времени и по ансамб- лю. Другими словами, в то время как функциональная форма функции взаимной когерентности или взаимной интенсивности может зависеть от того, вычисляется ли среднее по времени или по ансамблю, математическое соотношение между двумя функциями когерентности одного и того же типа не зависит от вида усреднения. Это позволяет нам применять все, что мы ранее установили относительно процесса распространения обыч- ных функций когерентности, к задачам, включающим когерент- ность, усредненную по ансамблю. С точки зрения усреднения по ансамблю взаимная интенсив- ность света, отраженного или рассеянного шероховатой поверх- ностью и наблюдаемого поблизости от этой поверхности, почти то же самое, что и взаимная интенсивность некогерентиого ис- точника. В случае ансамбля идеально шероховатых поверхно- стей практически нет никакой связи между фазами света, рас- сеянного двумя близко расположенными поверхностными эле- ментами, по крайней мере пока интервал между ними не ока- жется близким к одной длине волны. Сформулируем это мате- матически, представив функцию взаимной интенсивности на по- верхности в виде J(£1. V. П2) = хЙ£1. Т|1)6(£1— I2, П1 —Пг), (7.5.4) где х — постоянный множитель, а I — усредненное по ансамблю распределение интенсивности. Взаимная интенсивность, наблюдаемая на поверхности на некотором расстоянии от источника, может быть вычислена на основании теоремы Ван Циттерта — Цернике. По аналогии с
334 Глава 7 формулой (5.6.8) усредненная по ансамблю взаимная интен- сивность на плоскости, находящейся на расстоянии z от источ- ника, дается выражением J(%1> У\, Х2, У2) = +°° - = -^Г n)exp{/f4(A4 + «]pUn, (7.5.5) \A>Z 1 J J ( Л2? J —oo где * = + </?)]> <7-5-6) a /(£, t])—усредненное по ансамблю распределение интенсив- ности по рассеивающему пятну шероховатого объекта. Если мы имеем дело с системой, формирующей изображе- ние типа показанной на рис. 7.23, то выражение для взаимной интенсивности в изображении можно получить, рассуждая так же, как и при выводе выражения (7.2.17), Рассмотрим выход- ной зрачок оптической системы, формирующей изображение, как эквивалентный новому некогерентному источнику, и при- меним к этому источнику теорему Ван Циттерта — Цернике. Для области изображения, в которой интенсивность постоянна, взаимная интенсивность принимает вид Jz (Ы|> о.; и2, v2) = ехр {~i^~ [(«i + ~ («? + у?)] } X К Л<с2 J 4-00 X П I р (X, у) I2ехр ( / (Дых + kvy) I dx dy, (7.5.7) J J Л^2 J — oo где P — комплексная функция зрачка, изображающей линзы, х — постоянный множитель, введенный выше, и Ди = и2 — иь Ди = V2 = Уь Теперь мы готовы рассмотреть вторую основную характе- ристику спекл-структуры, а именно распределение размеров ее случайных пространственных флуктуаций. Поскольку мы гово- рим о флуктуациях спекл-структуры, а не об информации от- носительно изменений средней интенсивности, мы предположим, что интересующий нас объект имеет однородную яркость. Рас- пределение размеров спекл-структуры будем характеризовать пространственной спектральной плотностью мощности спекл- структуры, которую обозначим через VJvy, vv). Вычислим выполнив преобразование Фурье автокорреляционной функции спекл-структуры: __ +°°_ >vv) = ГЦДи, Др)ехр{/2л (Auv^ + Auvv)} dkud Ди, (7.5.8)
Влияние частичной когерентности 335 где _ _____________________________ Г£ (Ди, Ди) = Ц (ии uj Ц (uj + Ди, Uj + Ди); (7.5.9) остается показать, что Г/ зависит только от разности коорди- нат (Ди, Ди). В соответствии с тем, что ранее говорилось относительно случайных блужданий, комплексные поля, определяющие спекл- структуру, являются круговыми комплексными гауссовскими случайными переменными. Из теоремы о моментах для ком- плексных гауссовских переменных следует, что Г< = (Л)2[1 +IM2], (7.5.Ю) где согласно формуле (7.5.7), определяется выражением | g, (Ах, At/) | = ( 2л 'I J / —— (Aux 4- Av^) I dx dy (. ^*^2 J 4-oo 55 I ₽ (x, у) I2 dx dy — OO (7.5.11) Этот результат показывает, что величина Г/ действительно за- висит только от разности координат (Ди, Ди) и несет достаточно информации для вычисления спектральной плотности мощно- сти спекл-структуры. Используя определение I Р(х, у)I2 = +Jp(*’y-^-------------------- I ₽ (х. У) l2rfx dy (7.5.12) и подставляя (7.5.10), (7.5.11) и (7.5.12) в (7.5.8), получаем i (vи, vv)= Uif 5 (vu> vv) 4" + (Л)2^ 4-00 2 К 55 I р(X, г/)|2ехр{/-^-(Аих4-\vy)\dxdy I, J J С Л^2 J I — оо ) (7.5.13) где { } —двумерный фурье-образ по переменным (Au, Аи). На основании автокорреляционной теоремы фурье-анализа и свойств симметрии автокорреляции для действительной и не- отрицательной функций можно написать i (vt/> vv)= (7if р (vy, Vy) 4” 4-00 4- Р-2г)2 I P (x> #) I21 P (x ~ ^z2Vu, у — Kz2vv) I2 dx dy\. (7.5.14)
336 Глава 7 Мы видим, что, если не считать неинтересной 6-функции на нулевой пространственной частоте, спектральная плотность мощности спекл-структуры имеет форму автокорреляциойной функции квадрата модуля нормированной функции зрачка. Эта спектральная плотность мощности не зависит от каких-либо аберраций, которые могут существовать в системе изображе- ния, и в важном случае прозрачного неаподизированного зрач- ка (Р=1 или 0) автокорреляционная функция величины |Р|2 Рис, 7.24. Спектральная плотность мощности (в плоском сечении = 0) спекл-структуры на выходе системы, формирующей изображение, с квадрат- ным выходным зрачком. (с точностью до нормировочной постоянной) эквивалентна ав- токорреляционной функции самой функции зрачка. В случае системы, формирующей изображение, с квадрат- ным (L X L) неаподизированным выходным зрачком спектраль- ная плотность мощности принимает вид (vy, VK) = (Л)2 [б (va, Vy) + (-^)2 Л (-^ vy) Л (-^ Vy)] , (7.5.15) где Л(х)=1— |х| при |х|^1 и Л(х)=0 в других случаях. Это распределение в плоском сечении vy = 0 показано на рис. 7.24. В случае круглой линзы с открытым зрачком диамет- ром D соответствующий результат таков: ^(Vy, Vy) = (7,-)2 [6(Vy, Vy) + +2 Й’4 {(¥ ’) - (^ ’)[' - & Ж Г] (7.5.16) при v^D/Kz2 и (vy, Vy) —0 в других случаях, причем v Д Vvt/ + Ч- Итак, можно сделать вывод, что в любой спекл-структуре наиболее представлены крупномасштабные (низкочастотные) флуктуации и отсутствуют флуктуации, не превышающие не-
Влияние частичной когерентности 337 которого предельного значения. Точное распределение зависит от вида функции зрачка системы, формирующей изображение. Методы подавления влияния спекл-структуры когерентных систем, формирующих изображение, исследуются, но пока что не найдено общего метода, который позволил бы исключить спекл-структуру, сохранив при этом полную когерентность и мельчайшие детали изображения вплоть до дифракционного предела системы, формирующей изображение. Устранение спекл-структуры остается одной из наиболее важных нерешен- ных проблем когерентного формирования изображения. Задачи 7.1. Зная диаметр конденсорной линзы D на рис. 7.9, опреде- лите размер круглого источника, при котором можно пользоваться приближенным равенством (7.2.15а). 7.2. На основании обобщенной теоремы Ван Циттерта — Цер- нике докажите неравенство (7.2.18). 7.3. Докажите справедливость формулы (7.2.39) 7.4. Покажите, что выражение (7.2.41) правильно 7.5. В оптической системе, изображенной на рис. 7.5з, мы имеем квадратный (L X L) некогерентный источник. Объект — экран с двумя отверстиями, разделенными в на- правлении & расстоянием у___Af л— D , где А. — средняя длина волны, f — фокусное расстояние всех линз, a D — ширина квадратного отверстия диафраг- мы в плоскости зрачка. Интенсивность изображения ре- гистрируется в плоскости (и, v). а) При каком размере L источника максимален провал интенсивности в центре изображения?
338 Глава 7 б) Каково при размере источника, найденном в п. «а», отношение интенсивности в точке (и — Х/2, v = 0) к ин- тенсивности в точке (и = 0, и =0)? в) Сравните результат, полученный в п. «б», с отноше- нием, которое было бы получено при полной некогерент- ности освещения отверстий. г) Вычислите отношение Л (Х/2,0) к Л(0,0) при полной когерентности (ц = 1) освещения отверстий. 7.6. На рис. 7.5з замените источник тонким некогерентным кольцом со средним радиусом р и радиальной шириной W. Кроме того, замените зрачок системы, формирующей изо- бражение, круглой диафрагмой диаметром Е>_Два отвер- стия теперь разделены расстоянием X — l,22Zf/Z)— «рас- стоянием Рэлея». а) Найдите наименьший радиус кольцевого источника, при котором оба отверстия освещаются некогерентио. б) Найдите радиус р кольцевого источника, при котором интенсивность в центре изображения падает до своего наименьшего возможного значения относительно пикового значения. Указание. Фурье-образ тонкого однородного кольца сред- ним радиусом р и шириной W дается приближенным вы- ражением G (vx, vy) ~ 2лр1Г/0 (2лр/у^ + V0, • где /о — функция Бесселя первого рода нулевого порядка. 7.7. Докажите, что распределение интенсивности любого сим- метричного одномерного объекта можно восстановить, зная только модуль его спектра. Указание. Зная модуль спектра, можно найти автокорре- ляционную функцию объекта. Рассмотрите пространствен- но-ограниченный объект, представляемый конечным на- бором дискретных значений. 7.8. Нужно определить яркость двух компонент двойной звез- ды при помощи звездного интерферометра Майкельсона. Известно, что каждая компонента есть круг однородной яркости. Известны угловые диаметры аир компонент и угловое расстояние у между ними. Известно также, что у > а, у » р. Как можно было бы определить их отно- сительную яркость /а//р, измерив модуль |щ2($) | при помощи интерферометра? 7.9. Измените формулы (7.2.49) и (7.2.51) так, чтобы они были применимы к когерентной системе, формирующей
Влияние частичной когерентности 339 изображение, в которой объект освещается волной, имею- щей распределение фазорной амплитуды До(£, т]). Такой случай является более общим, чем случай освещения пло- ской волной, который-рассматривается в тексте. 7.10. Рассмотрим частично когерентную систему, формирую- щую изображение, показанную на рис. 7.11. Заметим, что в отсутствие какой-либо структуры объекта в плоскости зрачка формируется изображение источника. а) Покажите, что компонента пропускания объекта (для простоты бесконечной протяженности), описываемая функ- цией n) = c°s(2nv0g], дает два изображения источника в плоскости зрачка с центрами в точках t = ± Xfv0. б) Покажите, что каждое из этих двух изображений ис- точника будет полностью перекрывать зрачок при усло- вии rs>rp + ifv0. Если это условие выполняется, то такой источник неот- личим от источника неограниченной протяженности и, зна- чит, система, формирующая изображение, является неко- герентной. Можно принять, что спектр источника доста- точно узкий и, следовательно, влияние частотной диспер- сии незначительно. ЛИТЕРАТУРА 7.1. Thompson В. J, Image Formation with Partially Coherent Light. —In: Progress in Optics, Vol. VII, ed. E. Wolf. — Amsterdam: North-Holland PubL Co., 1969. 7.2. Born M., Wolf E. Principles of Optics. — N. Y.: MacMillan, 1964. [Имеет- ся перевод: Вольф Э., Мандель Л. Основы оптики. — М.: Наука, 1973.] 7.3. Beran М. J., Parrent G. В, Jr. Theory of Partial Coherence. — N. Y.: Pren- tice-Hall, Englewood Cliffs, 1964. 7.4. Pefina J. Coherence of Light. — London: Van Nostrand Reinhold, 1971. [Имеется перевод: Перина Я. Когерентность света. — М.: Мир, 1974.] 7.5. Hopkins Н. Н. — Proc. Roy. Soc., 1951, v. A208, p. 263. 7.6. Hopkins H. H. —Proc. Roy. Soc., 1953, v. A217, p. 408. 7.7. Goodman J. W. Introduction to Fourier Optics. — N. Y.: McGraw-Hill Book Co., 1968. [Имеется перевод: Гудмен Дж. Введение в фурье-опти- ку. — М.: Мир, 1970.] 7.8. Luneburg R. К. Mathematical Theory of Optics. — California Berkeley: University of California Press, 1964. 7.9. Kingslake R. Applied Optics and Optical Engineering, Vol. II. — N. Y.: Acad. Press, 1965, p. 225. 7.10. Zernike F,— Physica, 1938, v. 5, p. 785.
340 Глава 7 7.11. Collier R. J., Burkhardt C. B., Lin L. H. Optical Holography. — N. Y.: Acad. Press, 1971, p. 118. 7.12. Tichenor D. A., Goodman J. Ж—J. Opt. Soc. Am., 1972, v. 62, p. 293. 7.13. Duffieux P. M. L’Integral de Fourier et ses applications a TOptique, Ren- nes, 1946. 7.14. Swing R. E. - J. Opt. Soc. Am.. 1972. v. 62, p. 199. 7.15. Kinzley R. E. — J. Opt. Soc. Am.. 1972, v. 62, p. 386. 7.16. Grimes D.y Thompson B. J. — J. Opt. Soc. Am., 1967, v. 57, p. 1330. 7.17. Becherer R, /., Parrent G. B. — J. Opt. Soc. Am., 1967, v. 57, p. 1479. 7.18. Bracewell Rt N. Radio Astronomy Techniques.— In: Encyclopedia of Phy- sics, Vol. 54, ed. S. Fliigge.— Berlin: Springer-Verlag, 1959. 7.19. Proc. IEEE, Sept. 1973, v. 61. 7.20. Rogers G. L, — Proc. Phys. Soc. (2), 1963, v. 81, p. 323. 7.21. Dutta K, Goodman J. U7. — J. Opt. Soc. Am., 1977, v. 67, p. 796. 7.22. Russel F. D.y Goodman J. W. — J. Opt. Soc. Am., 1971, v. 61, p. 182. 7.23. Fizeau H. — Compts. Rend., 1868, v. 66, p. 934. 7.24. Michelson A. A. — Phil. Mag. (5), 1890, v. 30, p. I. 7.25. Michelson A. A. — Astrophys. J., 1920, v. 51, p. 257. 7.26. Michelson А. Л., Pease F. G. — Astrophys. J., 1921, v. 53, p. 249. 7.27. Miller R. H. — Science, 1966, v. 153, p. 581. 7.28. Currie D. G„ Knapp S. L., Liewer К M.—Astrophys. J., 1974, v. 187, p. 131. 7.29. Кулагин E. С. ~ Оптика и спектроскопия, 1967. т. 23, с. 459. 7.30. Hanbury Brown R. The Intensity Interferometer. — London: Taylor and Francis, 1974. 7.31. Labeyrie A. — Astron. Astrophys., 1970. v. 6, p. 85. 7.32. O' Neill E. Walther A. — Optica Acta, 1963, v. 10, p. 33. 7.33. Walther A<— Optica Acta, 1963, v. 10, p. 41. 7.34. Kohler D.f Mandel L. — J. Opt. Soc. Am., 1970, v. 60, p. 280. 7.35. Goodman J. W. —J. Opt. Soc. Am., 1970, v. 60, p. 506. 7.36. Wolf E. — Proc. Phys. Soc., 1962, v. 80, p. 1269. 7.37. Roman P., Marathay Л. S<— Il Nuovo Cimento (X), 1963, v. 30, p. 1452. 7.38. Dialetis £>., Wolf E. — Il Nuovo Cimento (X), 1967, v. 47, p. 113. 7.39. Nussenzvieg H. M. —J. Math. Phys., 1967, v. 8, p. 561. 7.40. Robinson S. R. — J. Opt. Soc. Am., 1978, v. 68, p. 87. 7.41. Fienup J, R. — Optics Lett., 1978, v. 3, p. 27. 7.42. Fienup J. R. — Opt. Eng., 1979, v. 18, p. 529. 7.43. Bruck Yu. M., Sodin L. G. — Opt. Commun., 1979, v. 30, p. 304. 7.44. Huiser Л. M. Л, van Toorn P. — Optics Lett., 1980, v. 5, p. 499. 7.45. Fienup J. R.—Appl. Optics., 1982, v. 21, p. 2758. 7.46. Verdet E.—Ann. Scientif. I’Ecole Normale Superieure, 1865, v. 2, p. 291. 7.47. Strutt J. W. (Lord Rayleigh).— Phil. Mag., 1880, v. 10. p. 73. 7.48. von Laue M. — Sitzungsber. Akad. Wiss. (Berlin), 1914, Bd. 44, S. 1144. 7.49. von Laue M. — Mitt Physik. Ges. (Zurich), 1916, Bd. 18, S. 90. 7.50. von Laue M. — Verhand!. Deut. Phys. Ges., ! 917, Bd. 19, S. 19. 7.51. Dainty J. C. The Statistics of Speckle Patterns. — In: Progress in Optics, Vol. XIV, ed. E. Wolf. — Amsterdam: North-Holland Publ. Co., 1976. 7.52. Dainty J. C. (ed.). Laser Speckle and Related Phenomena (Topics in App- lied Physics, Vo!. 9). — Berlin: Springer-Verlag, 1975. 7.53. J. Opt. Soc. Am., Nov. 1976, v. 66. 7.54. Beckmann P., Spizzichino A. The Scattering of Electromagnetic Waves from Rough Surfaes. — N. Y.: Pergamon/MacMillan, 1963. 7.55. Rigden /. D., Gordon E. L — Proc. IRE, 1962, v. 50, p. 2367. 7.56. Oliver В. M. — Proc. IEEE, 1963, v. 51, p. 220. 7.57. Pearson K. A Mathematical Theory of Random Migration. — London: Dra- per’s Company Research Memoirs, Biometric Series III, 1906. 7.58. Strutt J. W. (Lord Rayleigh). — Proc. Lond. Math. Soc., 1871, v. 3, p. 267. 7.59. Strutt J, W. (Lord Rayleigh). — Phil. Mag,, 1919. v. 37, p. 32L
Влияние частичной когерентности 341 ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 7.1 д. Cornells van Schooneveld (ed.). Image Formation from Coherence Func- tions in Astronomy, Vol. 76 (Proceedings). — Drodrecht Holland: D. Rei- del Publ. Co., 1979. 7.2 д. Roberts J. A. (ed.). Indirect Imaging. — Cambridge: Cambridge Univer- sity Press, 1984. 7.3 д. Fienup J. R., Grimmins T. R., Holsztnyski IF. Reconstruction of the Sup- port of an Object from the Support of Its Autocorrelation. — J. Opt. Soc. Am., 1982, v. 72, p. 610. 7.4 д. Fiddy M. A., Brames В. Л, Dainty J. C. Enforcing Irreducibility for Phase Retrieval in Two Dimensions. — Optics Lett., 1983, v. 8, p. 96. 7.5 д. J. Opt. Soc. Am., 1983, v. 73, p. 1412. 7.6 д. Saleh В. E. A. Optica! bilinear transformations. — Optica Acta, 1979, v. 26, p. 777. 7.7 д. Tango W. Л, Twiss R. Q. Michelson Stellar Interferometry. — In: Progress in Optics, Vol. XVII, ed. E. Wolf. — Amsterdam: North-Holland Publ. Co., 1980. 7.8 д*. Тихонов A. H,, Арсенин Б. Я. Методы решения некорректных задач,— М.: Наука, 1979, с. 288. 7.9 д*. Клименко И. С. Голография сфокусированных изображений и спекл- ннтерферометрия. — М.: Наука, !985. 7.10 д*. Джонс Р., Уйакс К- Голографическая спекл-интерферометрия. — М.: Мнр, 1986. 7.11 д*. Франсов М. Оптика спеклов. - - М.: Мир, 1980.
Глава 8 ФОРМИРОВАНИЕ ИЗОБРАЖЕНИЯ ПРИ НАЛИЧИИ СЛУЧАЙНЫХ НЕОДНОРОДНЫХ СРЕД В идеальных условиях предельное разрешение, обеспечиваемое системами, формирующими изображение, зависит только от того, в какой мере мы способны изготавливать оптические эле- менты больших размеров, свободные от собственных аберраций и не очень дорогие.. Однако такие идеальные условия редко, встречаются на практике. Часто среда, в которой распростра- няются волны, проходя от объекта до системы, формирующей изображение, сама является оптически несовершенной, и это приводит к тому, что даже в случае безаберрационных опти- ческих систем реальное разрешение значительно ниже теоре- тического дифракционного предела. Наиболее важный пример несовершенной оптической среды в этом смысле — земная атмосфера, т. е. воздух, окружающий нас. Вследствие неоднородного нагрева земной поверхности Солнцем всегда существуют неоднородности показателя пре- ломления воздуха, определяемые его температурой, которые могут отрицательно влиять на разрешение больших оптических систем, работающих в такой окружающей среде. С другим достаточно общим случаем мы встречаемся, когда изображение формируется при прохождении света через опти- ческое окно, толщина и показатель преломления которого весь- ма неоднородны. В обоих указанных примерах детальная структура оптиче- ских несовершенств заранее неизвестна. Вследствие этого при- ходится рассматривать оптические искажения как случайные процессы и вычислять средние характеристики оптической си- стемы для таких условий. В данной главе принимаются два важных ограничения. Во-первых, всюду предполагается, что излучение интересующих нас объектов некогерентно. Хотя рассматриваемую задачу можно решать и в случае частично когерентного излучения, такой анализ, как правило, значительно сложнее, чем в случае некогерентного излучения (который зачастую сам уже доста- точно сложен). К тому же в подавляющем большинстве задач, представляющих практический интерес (например, в астроно-
Формирование изображения при наличии случайных сред 343 мин), излучение объекта с высокой степенью точности можно считать некогерентным. Во-вторых, важное ограничение касается пространственного масштаба (т. е. длины корреляции) существующих неоднород- ностей. Мы будем всегда предполагать, что масштаб неодно- родностей намного больше длины волны излучения. Тем самым исключаются из рассмотрения задачи, затрагивающие форми- рование изображения при прохождении света через облака или аэрозоли, масштаб неоднородностей которых сравним с опти- ческой длиной волны или меньше ее и показатель преломления которых изменяется очень резко. Это, так сказать, «формиро- вание изображения в мутной среде», тогда как нас здесь ин- тересует «формирование изображения в турбулентной среде», показатель преломления которой изменяется более плавно. Чи- стая земная атмосфера — важнейший пример «турбулентной» среды. Материал, рассматриваемый в данной главе, можно разде- лить на две части. Первая (§ 1—3) посвящена вопросу о влия- нии тонких случайных «экранов» (т. е. тонких искажающих структур) на характеристики оптических систем. Во второй (§ 4—9) рассматривается вопрос о влиянии толстой неодно- родной среды на системы, формирующие изображение. § 1. Влияние тонких случайных экранов на качество изображения Вопрос о влиянии тонких искажающих слоев на распростра- нение электромагнитных волн рассматривался в литературе неоднократно [8.1, 8.2]. Вопросу же о влиянии таких искаже- ний на качество изображения уделялось значительно меньше внимания (хотя и имеются отдельные работы [8.3]). Теорети- ческие исследования этого вопроса важны не только потому, что вносят ясность в задачу о формировании изображения при про- хождении света через тонкие структуры, но и потому, что позво- ляют лучше понять суть намного более сложной задачи о фор- мировании изображения при прохождении света через земную атмосферу. А. Предположения и упрощения Чтобы исследовать вопрос о влиянии тонких случайных экра- нов на качество изображения, мы примем простую схему си- стемы, формирующей изображение, представленную на рис. 8.1. Предположим, что объект испускает пространственно-некоге- рентное излучение, распределение интенсивности которого обо-
344 Глава 8 значим через /о(£, т]). Линзы Ц и Л2 имеют фокусные расстоя- ния f. В задней фокальной плоскости линзы которая пред- полагается совпадающей с передней фокальной плоскостью линзы Л2, помещается тонкий случайный экран. В плоскости (u, v) формируется нечеткое, или искаженное, изображение объекта, которое описывается распределением интенсивности Л (u, v). Предположим, что случайный экран, находящийся в зрачке этой системы, математически может быть описан амплитудным коэффициентом пропускания ts (х, у). В таком представлении (5, п) (*.У) <“>и) Объект Lt Экран Изображение Рис. 8.1. Оптическая система, рассматриваемая при анализе случайного экрана. неявно подразумеваются два важных предположения. Во-пер- вых, мы предполагаем, что экран достаточно тонок и, следова- тельно, лучи, входящие в него с координатами (х, #), выходят из него почти с теми же самыми координатами. В результате для световых волн, испускаемых всеми точками объекта (£, т]), амплитудный коэффициент пропускания ts(x, у) одинаков. Во- вторых, мы предполагаем, что свет достаточно узкополосный и, следовательно, амплитудный коэффициент пропускания К оди- наков для всех частотных составляющих света. Нетрудно найти ситуации, в которых нарушается одно из отмеченных предположений или оба. Однако основанная на них простая теория оказывается более общей, чем может показать- ся с первого взгляда. Если известны результаты для узкопо- лосного оптического сигнала с центральной частотой v, фор- мулы для широкополосного света можно получить, выполнив интегрирование при изменении v в пределах спектра и включив явную частотную зависимость в ts(x, у). Кроме того, что ка- сается предположения о «тонком экране», то, хотя ts(x, у) фак- тически может зависеть от того, какую точку объекта (£, т]) мы рассматриваем, очевидно, что качество изображения опреде- ляется статистической автокорреляционной функцией величины ts, а эта автокорреляционная функция может совершенно не зависеть от (£, т]), даже если t$ зависит (задача 8.1). Наконец, заметим, что очень специфическая геометрия, представленная на рис. 8.1, может привести к результатам, ко-
Формирование изображения при наличии случайных сред 345 торые применимы и к геометриям более общего характера. На- пример, если экран сместить из обшей фокальной плоскости линз Li и Л2, то результаты анализа не изменятся. Дело в том (хотя это еще требуется доказать), что средние характеристики системы определяются пространственной автокорреляционной функцией волновых возмущений в зрачке. Если возмущающий экран удалить из положения, показанного на рис. 8.1, то де- тальная структура возмущений поля в зрачке изменится, но их автокорреляционная функция останется прежней (задача 8.2). Результаты, которые будут получены здесь, применимы к ши- рокому классу задач, связанных с формированием изображения. Б. Усредненная оптическая передаточная функция Пространственно-частотный отклик некогерентной оптической системы принято характеризовать оптической передаточной функцией (ОПФ), как же говорилось в гл. 7, § 2, п. Г. Эту передаточную функцию мы будем здесь обозначать через vy), где vu и vy— пространственные частоты1); она определяется следующим образом: + оо Р (х, у) Р* (х — XfVy, у — ifvv) dx dy Vy) = —--------, (8.1.1) I p (X, y) \2 dx dy — oo где P — комплексная функция зрачка, a f — фокусное расстоя- ние линз на рис. 8.1. Если в зрачок системы, формирующей изображение, поме- стить экран с амплитудным коэффициентом пропускания ts(x, #), то функция зрачка изменится и мы получим новую функцию зрачка Р'(х,у): Р' (х, у) = Р (х, у) ts (х, у). (8.1.2) Следовательно, в случае такого экрана ОПФ принимает вид Ж (Vy, Vy) + оо Р(х, у) Р* (X —Xfvu. у — xfvv) t* (х, y)t*(x — Ifvy, у — Xfvv)dxdy __ —оо — . |₽(Х, у) I21 ts (X, y)\3dxdy __________ (8.1.3) 9 Эти переменные называются также волновыми числами. — Прим, перев.
346 Глава 8 Дальнейший детерминированный анализ становится невозмож- ным, поскольку мы не знаем конкретных значений t$(x, у) для каждой пары координат (х, у). Самое большее, на что мы мо- жем рассчитывать, — это на основании статистического распре- деления коэффициента ts вычислить средний частотный отклик системы, проводя усреднение по некоему ансамблю экранов. Конечно, такая средняя частотная характеристика системы, формирующей изображение, вообще говоря, не будет совпадать с ее фактической характеристикой при наличии в ней данного конкретного экрана. Но, поскольку мы не знаем структуры дан- ного экрана, нам ничего не остается, как вычислять среднюю характеристику. Каким же должно быть приемлемое определение «усреднен- ной ОПФ»? Казалось бы, проще всего было бы определить ее как среднее величины vv) при подходящей статистической модели для ts. К сожалению, такой прямолинейный подход часто приводит к усложнениям. Как показывает анализ выражения (8.L3), при таком определении требуется вычислять среднее отношение двух коррелированных случайных переменных, а это не простая задача. Но возможно другое определение, при котором все оказы- вается проще. Определим усредненную ОПФ( которую мы обо- значим через 3$) как Ж (vy, v0 = 0Пф1 , (8.1.4) ь £ [знаменатель ОПФ] х 7 где £*[ ], как и ранее, оператор вычисления среднего значения. Можно показать, что два определения, приведенные выше, почти совпадают в большинстве случаев, представляющих ин- терес для нас. Например, в наиболее важном случае случайного фазового экрана (§ 3) мы имеем Щ2 = 1 и оба определения идентичны. В более общих случаях можно показать, что если ширина функции зрачка намного больше корреляционной ши- рины экрана, то пространственное усреднение неотрицательного подынтегрального выражения в знаменателе величины 5₽(vz/, vv) дает приблизительно постоянный и известный нор- мировочный множитель, а потому оба определения почти сов- падают. Дело в том, что совершенно неважно, какой нормировочный множитель мы выберем для усредненной оптической передаточ- ной функции, лишь бы в начале координат на частотной пло- скости она была равна единице. Оба определения удовлетво- ряют и этому требованию. Принимая второе определение, мы характеризуем работу системы средним весом, придаваемым ею частотной компоненте (vy, vy), нормированным на средний
Формирование изображения при наличии случайных сред 347 вес, придаваемый ею компоненте интенсивности с нулевыми частотами. Если числитель и знаменатель выражения (8.1.3) подста- вить в формулу (8.1.4) и изменить порядок выполнения инте- грирования и усреднения, то мы получим (Vy, Vy) ——: + оо ЭД ₽ (х, У) ₽* (X — Л/Vy, у — >.) vv) Е [ts (х, у) t’ (х—ifvy, y—ifvv)l dx dy — оо + oo I P (*, У) I2 E 11 ts (*, у) I2] dx dy (8.1.5) Если пространственное статистическое распределение экрана стационарно в широком смысле, то средние значения не зави- сят от х и у и могут быть вынесены за знак интеграла. Тогда усредненная оптическая передаточная функция принимает вид (vy, Vy) = (%o(vy, Vy)5^s(vy, Vy), (8.1.6) где — ОПФ системы в отсутствие экрана [выражение (8.1.1)], тогда как ^(vy, vv) может рассматриваться как усредненная ОПФ экрана, определяемая следующим образом: ^(vy, VV) A-r<(r-TO)V-' (8.1.7) где Г/ — пространственная автокорреляционная функция экрана: ГД Ах, Аг/)Д£[1Дх, t/)t*(x —Ах, t/ —At/)]. (8.1.8) Выражения (8.1.6) и (8.1.7)—самые важные результаты данного пункта. Они показывают, что усредненная оптическая передаточная функция некогерентной системы изображения с пространственно-стационарным случайным экраном в зрачке равна произведению ОПФ системы без экрана на усредненную ОПФ, связанную с экраном. Усредненная ОПФ, связанная с экраном, есть просто нормированная автокорреляционная функ- ция амплитудного коэффициента пропускания экрана. В. Усредненная функция размытия точки Для удобства часто вводят, «усредненную функцию размытия точки» (ФРТ) рассматриваемой системы. Мы определим эту ФРТ следующим образом: $(«, v)A3T_| Wvy, vv)}, (8.1.9)
348 Глава 8 где &~~1{ } — фурье-оригинал. При таком определении усред- ненная ФРТ всегда неотрицательна и действительна. Кроме того, поскольку функция Ж нормирована на единицу в начале отсчета частот, функция s(u, и), определяемая равенством (8.1.9), всегда будет иметь единичный объем. Поскольку усредненная ОПФ равна произведению ОПФ си- стемы (без экрана) на ОПФ, связанную с экраном, усреднен- ная ФРТ должна быть равна свертке ФРТ системы с ФРТ, связанной с экраном. Таким образом, s(u, v) = s0(u, v)*ss(u, v), (8.1.10) где «о(«. = {3^o(vUt vv)} есть функция размытия системы без экрана, а Ss(U, V) = vv)} есть усредненная функция размытия, связанная с экраном. § 2. Случайные поглощающие экраны Предположим, что случайный экран в системе, изображенной на рис. 8.1, является чисто поглощающим элементом, т. е. не вносит заметных фазовых сдвигов. Амплитудный коэффициент пропускания ts(x, у) такого экрана есть действительная и не- отрицательная величина, лежащая между нулем и единицей. Мы можем рассматривать введение такого экрана как случай- ную аподизацию оптической системы и исследовать влияние та- кой аподизации на качество усредненного изображения. А. Общие формы усредненных ОПФ и ФРТ Амплитудный коэффициент пропускания случайного поглощаю- щего экрана может быть записан в виде y) = t0+г(х, у), (8.2.1) где t0 — действительная и неотрицательная постоянная величи- на, лежащая между нулем и единицей, а г(х, у)—простран- ственно-стационарный, действительный случайный процесс, ограниченный интервалом — (X, уХ 1 — /о. (8.2.2) с нулевым средним значением. Как было показано ранее [формула 8.1.6)], усредненная ОПФ системы с экраном равна произведению ОПФ без экрана
Формирование изображения при наличии случайных сред 349 на нормированную автокорреляционную функцию экрана. Ав- токорреляционная функция экрана, как легко видеть, такова: Г, (Ах, At/) = Е {[/о + г (х, t/)] [/0 + г (х — Ах, у — At/)]} = = ^ + Гг(Дх, At/), (8.2.3) где Г, — автокорреляционная функция случайного процесса г(х, у). Требуемый нормировочный множитель имеет вид ГДО, 0) = /2+72 = ^ + <т2. (8.2.4) Если определить нормированную автокорреляционную функ- цию случайного процесса г(х, у) в виде Yf(Ax, At/) = Гг(А*’ Ау) , (8.2.5) то усредненная ОПФ, связанная со случайным экраном, при- мет вид ___ /2 q2 Ж* (Уи, vv) = -2-Ц- + -^-5- Vr^hu, kfvv). (8.2.6) *0 + ar Z0 + ar Усредненная ОПФ всей системы находится путем умножения найденной усредненной ОПФ на ОПФ в отсутствие экрана, что приводит к выражению __ z2 (V£b Vv) = ,2 , 2 ^0 (v£/> vv) + *0 “Г аг + 7^4 vv) Yr (8-2.7) *5 + ar Отметим некоторые важные свойства усредненной ОПФ экрана (va, vv). Во-первых, она всегда неотрицательна и дей- ствительна благодаря неотрицательному и действительному ха- рактеру амплитудного коэффициента пропускания ts. Во-вто- рых, при очень больших пространственных частотах (vu,w) мы имеем yr(hfvu, и усредненная ОПФ экрана прибли- жается к асимптотическому значению /2 ^s(vy, vf)->7-4-. (8.2.8) Г0"Г аг Если С /2, то это асимптотическое значение близко к еди- нице и экран слабо влияет на качество изображения. Если же сг2 то асимптотическое значение очень мало и большие
350 Глава 8 пространственные частоты сильно подавляются экраном. В слу- чае экрана с изотропным распределением (когда автокорреля- ционная функция имеет круговую симметрию) усредненная ОПФ экрана начинает приближаться к своему асимптотическому значению, если (vy + > -%- , (8.2.9) где А/—корреляционная длина экра- на, определяемая для удобства выра- жением [Ч-оо -.1/2 — | yr (Ах, \у) |2d Axd Аг/ I . — оо J (8.2.10) Читатель может в качестве инте- ресного упражнения (задача 8.3) до- казать, что минимальное возможное асимптотическое значение /2/(/2 + <т2) для любого случайного поглощающего экрана тождественно равно to — сред- нему коэффициенту пропускания экра- на; это — следствие того, что величина ts ограничена значениями 0 и 1. На рис. 8.2 показана форма различных передаточных функций в системе со случайным поглощающим экра- ном. Общую форму усредненной ФРТ системы можно установить путем сле- дующих рассуждений. Чтобы найти усредненную ФРТ системы при нали- чии экрана, мы должны вычислить свертку ФРТ системы без экрана so с усредненной ФРТ самого экрана яд [формула (8.1.10)]. Чтобы найти усредненную ФРТ экрана, мы должны выполнить обратное преобразование Фурье усредненной ОПФ экрана [формула (8.2.6)]. Последняя операция приводит к выражению /2 а2 («, V) = v 6 (и, v) + -2 ,г , §г (и, V), (8.2.11) г0 “г го "Г Рис. 8.2. Влияние случайно- го поглощающего экрана, а — ОПФ системы без экра- на; б ~ нормированная ав- токорреляционная функция экрана; в — усредненная ОПФ экрана; г — усреднен- ная ОПФ системы.
Формирование изображения при наличии случайных сред 351 где sr(u, v) = .r-'{Yr(^vy. (8.2.12) Таким образом, усредненная ФРТ системы принимает вид t2 а2 s(u, v)= ? 2 s0(и, v) + .у,f 2 s0(и, v)*sr(u, v). (8.2.13) *o + ar *0 + ar Первое слагаемое этого выражения часто называется «централь- ной сердцевиной» усредненной ФРТ. В большинстве случаев, Рис. 8.3. Примерная форма усреднен- ной ФРТ системы со случайным по- глощающим экраном. Рис. 8.4. «Шахматный» слу- чайный поглощающий экран. представляющих интерес для нас, второе имеет более широкое распределение, чем первое; эта составляющая называется «диффузным гало» в усредненной ФРТ, Примерная форма усредненной ФРТ показана на рис. 8.3. Б. Пример В качестве конкретного примера случайного поглощающего экрана рассмотрим «шахматный» экран, показанный на рис, 8.4. Он представляет собой множество примыкающих друг к другу квадратных ячеек I X I со случайно п независимо выбранными значениями коэффициента пропускания в каждой из них. Можно считать, что сам экран неограниченно протяженный, а на область зрачка оптической системы приходится только конечная его часть. Чтобы модель была стационарна в про- странстве по крайней мере в широком смысле, положение экра- на относительно оптической оси считается случайным с одно- родным распределением в квадрате 1\1. В этом предположе- нии находит выражение просто отсутствие информации о точ- ном положении экрана в масштабе отдельной ячейки. Коэффи- циент пропускания ts по предположению изменяется случайно
352 Глава 8 и независимо от ячейки к ячейке. Пока мы не конкретизируем точный вид его распределения. Среднее значение коэффициен- та пропускания обозначим через is или to, а второй момент — через /2 или + а2. Нам необходимо знать автокорреляционную функцию экрана Г,U1, Уй х2, y2) = ts(xt, yt)ts(x2, у2), (8.2.14) чтобы найти усредненную ОПФ системы при наличии экрана. Так как различные ячейки имеют статистически независимые значения коэффициента пропускания, автокорреляционная функция может быть записана в виде г , . Т2 „ . Г (*1> Уд и (х2, у2)> Г/ (х., ул х9, уЛ = t2 Prob s „ . Г + ' 1 1 2 2' s (в одной ячейке) . (Т,2 „ , ( (*1> У1) и (Х2, у2) + (ts)2 • Prob s (в разных ячейках (8.2.15) Как нетрудно сообразить, при однородном распределении абсолютного положения экрана мы имеем ,((*i. Уд и (х2, у2П _ Л / Ах \ л / Д// \ /оо 1Л\ Probs „ „ f = A(—г)Л(-Л), (8.2.16) (в одной ячейке) \ I J \ i J где Ах = х, — х2 и &у = У\ — у2, а Л (х) = 1 — | х | при | х | 1 и Л(х) = 0 в других случаях. Отсюда следует, что Г/(*ь УГ, х2, г/2) = Г/(Ах, \у) = - Ч-Чт)л (¥) + & [• - л (-Т-)л (-Т-)] • <8-2-17> ИЛИ Г, (Ах, \у) = а2Л л + $ (8-2-18) Таким образом, нормированная автокорреляционная функция случайной части амплитудного коэффициента пропускания экрана имеет вид Yr (Ах, Az/) = Л (49 Л (4-) • (8-2Л9) Усредненную ОПФ оптической системы с экраном такого типа легко найти, подставив (8.2.19) в (8.2.7), что дает „ /2 ^(v£/, VV)= ,2 У 2 ^o(V£/> Vv) + Г0 “Г аг + -^-^0(vu, vv)A (4^) А Ру9- (8.2.20) *0 г аг \tz\fx
Формирование изображения при наличии случайных сред 353 Замечая, что (8.2.21) получаем, что усредненная ФРТ системы имеет вид s(u, v) <0 , , . (Ч^)2 , . . 2(lU\ 2( lV\ = .2 , 9 S0(U, V) + .2-—S0(u, V) * Sine2 I I Sine2 I -r- ) . *0 "г ar Ч) ' ar \ Л/ / \ Л/ / (8.2.22) Относительные величины членов в усредненной ОПФ и усредненной ФРТ можно найти, только сделав некоторые кон- кретные предположения о распределении амплитудного коэф- фициента пропускания ts. Некоторый интерес представляет слу- чай «черно-белого» шахматного экрана, для которого ts = 1 с вероятностью р и 6=0 с вероятностью 1 — р. В этом случае ts = to= Р, t2s = tl + <>2r = P, О2 = Р^—р)’ (8.2.23) Таким образом, значения коэффициенты в формуле (8.2.22) принимают <о _ <6 /2+а2г Р' + (8.2.24) Тогда усредненная ОПФ имеет вид ^(Vy, vv) = p^o(vy, vF) + (l -p)^o(vy, vf)a(-^)a(-^), а усредненная ФРТ дается выражением (8.2.25) _ z / \2 s(u, v) = ps0(u, v) + (l — р)(д^) so(«, v) * sine2 (sine2 (ДЛ . Um Um Ясно, что чем более вероятна прозрачная ячейка (т. е. чем больше величина р), тем меньше влияния оказывает экран на характеристику системы. Другое распределение амплитудного коэффициента пропу- скания ts рассматривается в задаче 8.4.
354 Глава 8 § 3. Случайные фазовые экраны Другим классом случайных экранов, более важным с практи- ческой точки зрения, чем случайные поглощающие экраны, яв- ляется класс случайных фазовых экранов. Экран называется случайным фазовым экраном, если он изменяет фазу прошед- шего света непредсказуемым образом, не поглощая при этом свет. Амплитудный коэффициент пропускания такого экрана имеет вид М*. */) = ехр[/<р(х, t/)], (8.3.1) где <р(х, у) — случайный фазовый сдвиг, вносимый экраном в точке (х, у). Как показано в гл. 7, § 1, п. А, изменение фазы ср может быть обусловлено либо изменениями показателя преломления, либо изменениями толщины экрана, либо тем и другим вместе. Независимо от причин этих фазовых изменений они зависят от длины волны света даже в отсутствие дисперсии показателя преломления материала, так как пропорциональны числу длин волн, укладывающихся на оптической длине пути, преодолевае- мой волной при прохождении через экран. Поэтому в случае «тонкого» экрана фазовый сдвиг <р принимает вид ф(х, y) = ^-{L(x, у)-Щ, (8.3.2) где L(x,y)—полная оптическая длина пути (произведение по- казателя преломления на толщину) через экран в точке (х, у), а Ло — средняя длина пути, связанная с экраном. В последующем анализе мы заменим длину волны X ее сред- ним значением X, пренебрегая тем самым зависимостью фазо- вого сдвига от длины волны, т. е. предполагая, что спектр до- статочно узкий. Как было показано в гл. 7, § 1, п. А [в част- ности, при выводе формулы (7.1.11)], такое приближение приемлемо при условии, что оптические разности хода для волн, проходящих через экран, не превышают длины когерентности света. А. Общая формулировка Чтобы выяснить, как влияет случайный фазовый экран на ха- рактеристику некогерентной системы, формирующей изображе- ние, мы должны сначала найти пространственную автокорре- ляционную функцию амплитудного коэффициента пропуска- ния ts. Таким образом, мы должны найти выражение вида (хр r/p Хр t/2) — Е [ts (Хр t/J ts (х2, #2)]. (8.3.3)
Формирование изображения при наличии случайных сред 355 Подставляя (8.3.1) в (8.3.3), мы находим, что Г, (хь Уъ х2, у2) = £ {ехр [/<р (%!, у,) — /<р (х2, у2)]}. (8.3.4) Для дальнейшего анализа рассмотрим две разные интерпре- тации выражения (8.3.4). Во-первых, правую часть этого вы- ражения можно представить как тесно связанную с характе- ристической функцией второго порядка совместных случайных переменных <pi = <p(xi, #i) и <р2 = <р(х2, У2) Обращаясь к вы- ражению (2.4.22), мы видим, что ГЛ*!, У\> *2, 02) = Мф(1, —1), (8.3.5) где Мф (соь <о2) = £ [ехр (/©,<₽, + /со2<р2)] (8.3.6) является характеристической функцией в рассматриваемом слу- чае, Во-вторых, можно считать, что в формуле (8.3.4) величина выражается через характеристическую функцию первого по- рядка разности фаз Аср = дч — ф2: х2, У2)= Мдф (1). (8.3.7) Обе точки зрения полностью эквивалентны в силу равенства МДф (о)) = Мф (о), —<о), доказательство которого мы оставляем читателю в качестве упражнения. Общие формулы (8.3.5) и (8.3.7) требуют далее конкретных предположений о распределении фазы ф(х, #). Поэтому мы пе- реходим к самому важному частному типу случайного фазо- вого экрана, а именно к экрану с гауссовским распределением фазы. Б. Гауссовский случайный фазовый экран Пусть случайная фаза у(х,у) моделируется гауссовским слу- чайным процессом с нулевым средним. Поскольку ф[ и <р2— гауссовские величины, разность фаз Аф тоже гауссовская ве- личина; ее дополнительные статистические свойства таковы: Аф = 0, УС> х2> У2), где — структурная функция случайного процесса <р(х, у) [формула (3.4.17)]. Так как характеристическая функция пер- вого порядка гауссовской случайной переменной Д<р имеет вид МДф(со) = ехр{-у <т2ф(о2}, (8.3.9) соответствующая подстановка приводит к следующему вы- ражению для автокорреляционной функции амплитудного (8.3.8)
356 Глава 8 коэффициента пропускания экрана: ГДх„ У\> */2) = ехр{ — у£>ф(х1( у{‘, х2, z/2)}- (8.3.10) Если случайный процесс <р(х, у) является стационарным в первых приращениях, то структурная функция фазы <р зависит только от разностей координат Ах = Х[ — х2 и Ду = yi — у2. Таким образом, Г, (Ах, Ду) = ехр { — у £>ф (Ах, Ду)}. (8.3.11) Следовательно, усредненная ОПФ экрана дается выражением (vy, vv) = ехр | — У А)ф (Ajvy, kfvv j-. (8.3.12) В более ограниченном случае фазы, стационарной в широком смысле, структурная функция может быть выражена через нор- мированную автокорреляционную функцию уф(Дх, Ду) фазы [формула (3.4.19)]: Яф(Ах, А//) = 2ог2 [ 1 — уф (Ах, (8.3J3) Тогда усредненная ОПФ экрана принимает вид ^s(vy, vF) = ехр{—аЦ1 — уф (X/vy, XfvF)]}. (8.3.14) Чтобы установить, как ведет себя усредненная ОПФ си- стемы, формирующей изображение, содержащей случайный фа- зовый экран, необходимо прежде всего выяснить поведение структурной функции D<f. В случае фазы, стационарной в ши- роком смысле, мы можем взять структурную функцию в форме (8.3.13). Очевидно, что эта структурная функция имеет два важных свойства: 1) 2) £>ф(0, 0) = 0, £>ф(оо, А//) 1 £>ф(Ах, оо) J V (8.3.15) Второе свойство следует из того, что автокорреляционная функ- ция уф уменьшается до нуля, когда расстояние между двумя точками становится произвольно большим. Типичный ход из- менения структурной функции показан на рис. 8.5 при трех разных значениях дисперсии Теперь можно построить примерный график усредненной ОПФ для рассматриваемого случая. На рис. 8.6 показаны ти- пичные кривые, соответствующие <^0, и = при че- тырех значениях дисперсии фазы. Заметим, что при больших vy или vv усредненная ОПФ экрана Ж3 приближается к асим-
Формирование изображения при наличии случайных сред 357 птотическому значению ^S(vy, <^(оо, сю) ) | = ехр(-<т2). Vy) ) (8.3.16) Даже при не очень больших значениях а* это асимптотиче- ское значение крайне мало. Ширина функции 3^s(vUf vv) будет, вообще говоря, значи- тельно меньше, чем функции ^fvv). Это легче всего проиллюстрировать, если выбрать специальную форму автокор- реляционной функции фазы. Рассмотрим случайный фазовый процесс с автокорреляционной функцией, обладающей круго- вой симметрией, Y<p(r) = exp{ - (v)2}- г = [(Ах)2 4-(Az/)2]1/2. (8.3.17) Усредненная ОПФ такого экрана имеет вид (v) = ехр { - ст2 х х[>-м-тм v = Vvi/ + vv- (8.3.18) Рис. 8.5. Типичная форма структур- ной функции фазы (в случае стацио- нарности в широком смысле). Рис. 8.6. Типичные ОПФ для системы со случайным фазовым экраном, а — дифракционно-ограниченная ОПФ; б — усредненная ОПФ экрана; в — усредненная ОПФ системы [а^ (1) < <аф(2)<а2 (3)].
358 Глава 8 При большой дисперсии фазы можно показать (задача 8.5), что ОПФ уменьшается до значения 1/е, если (8.3.19) Таким образом, ширина усредненной ОПФ экрана прямо про- порциональна ширине W автокорреляционной функции фазы и обратно пропорциональна стандартному отклонению фазы <тф. Возвращаясь опять к случаю общей автокорреляционной функции фазы уФ, найдем теперь приближенное выражение для усредненной ОПФ, которое применимо, когда ОПФ Д) исход- ной оптической системы значительно шире усредненной ОПФ экрана. Это выражение мы получим, переписав выражение для Ж3 в следующем виде: Ж3 = е = е (8.3.20) Первый член в данном выражении представляет собой асим- птоту, к которой стремится усредненная ОПФ, а второй описы- вает превышение над этой асимптотой. Предполагая теперь, что ОПФ для первоначальной оптической системы значи- тельно шире второго члена в выражении (8.3.20), напишем «(v„, »,)««.(»„, v„)e’“J+ е-“5[Л’.1], (8.3.21) где мы заменили коэффициент Ж$ перед вторым членом еди- ницей— его значением в начале отсчета частот. Приближенное выражение (8.3.21) особенно ценно, когда мы рассматриваем функцию размытия точки всей системы. Вводя снова $o(u, v) для обозначения ФРТ первоначальной си- стемы (без экрана) и производя обратное преобразование Фурье выражения (8.3.21), получим усредненную ФРТ в виде -о2 s(u, v) « s0(u, v)e v + sh(u, v), (8.3.22) где s„ («,») = ЗГ-' { r’i - 1] }. (8.3.23) Слагаемое s0(u, v)exp(— o^) описывает дифракционно-ограни- ченную «сердцевину» ФРТ, а слагаемое Sh(u, и)—значительно более широкое «гало». На рис. 8.7 показана эта приближенная форма усредненной ФРТ при трех значениях дисперсии фазы. Заметим, что дифракционно-ограниченная «сердцевина» усред- ненной ФРТ очень быстро уменьшается с увеличением диспер- сии фазы и во многих практических приложениях ею можно пренебречь.
Формирование изображения при наличии случайных сред 359 В заключение отметим, что, хотя в данном пункте обсужде- ние было ограничено главным образом случаем экрана, ста- ционарного в широком смысле, мы можем сделать некоторые выводы относительно экрана, который является стационарным только в первых приращениях. В этом случае не может быть вполне определенной дисперсии фазовых флуктуаций, тогда как разность фаз Aqp имеет определенное значение дисперсии Рис. 8.7, Усредненная функция размытия точки при разных дисперсиях Фазы [<Тф (1) < <Уф (2)]. при любом расстоянии. Дисперсия величины Л<р, как правило, при больших расстояниях не выходит на какую-либо асимпто- ту, но неограниченно возрастает с увеличением Ах или Аг/. Структурная функция снова равна нулю в начале отсчета, но не обязана выходить на асимптотическое значение при боль- ших расстояниях. Поэтому должны быть сделаны соответствую- щие видоизменения рис. 8.6,6 и в. В частности, усредненная ОПФ экрана не обязана иметь конечное «плато» при высоких частотах, но в общем должна стремиться к нулю при увеличе- нии пространственных частот. Это означает, что ограниченная дифракцией «сердцевина» усредненной ФРТ в данном случае будет отсутствовать. В. Предельные формы усредненной ОПФ и усредненной ФРТ при большой дисперсии фазы Если флуктуации фазы, создаваемые случайным фазовым экра- ном, имеют большую дисперсию, то можно найти некоторые предельные формы усредненной ОПФ и усредненной ФРТ. Эти- ми предельными формами можно пользоваться, когда выпол- няются условия их применимости.
360 Глава 8 Мы будем рассматривать фазовые экраны, для которых пер- вые частные производные фазы у)А-^-ф(х, у), д (8.3.24) Фу (А у) А-^-ф(х, у), являются совместно стационарными (в строгом смысле) слу- чайными процессами. Начнем анализ со слегка видоизменного варианта выражения (8.3.4) для автокорреляционной функции экрана: УГ, х2, у2) = Е (exp[/(<p(xl, yt) — <р(х1 — Дх, у{— Ду))]}. (8.3.25) Если дисперсия фазы велика, то автокорреляционная функция Г< должна падать до нуля в интервалах Дх или Ду, малых по сравнению с корреляционной шириной фазы <р(х, у). Соответ- ственно этому мы можем приближенно считать, что разность фаз ф(л'1,У1)—ф(%1 — Дх, Ц) — \у) линейно зависит от Дх и Ду: ф(*ь уО —ф(х, —Дх, У1 —Ду) « Дх-Д-<р(х1,у1) + Ду^<р(х1,у1), (8.3.26) где мы опустили все члены высшего порядка относительно (Дх, Ду). В рамках такого приближения автокорреляционная функ- ция экрана имеет вид Г<(*1, Уй Xi — Дх, yi —Ду) « = Е{ехр[/Дх~<р(х1, у1) + /Ду-^ф(Х1, У1)]}== = МФх,Фу(Дх, Ду), (8.3.27) где Мфх, <рг — совместная характеристическая функция двух частных производных фазы. Из предположения о том, что эти частные производные являются совместно стационарными, сле- дует, что данная совместная характеристическая функция не зависит от координат (xl(yi). Усредненную ОПФ экрана можно представить в виде кор- реляционной функции Г<(Дх, Ду) с измененным масштабом: Я(vy, VZ) = МфХ, фГ (ZfVt/, kfvv). (8.3.28)
Формирование изображения при наличия случайных сред 361 Усредненная ФРТ, связанная с экраном, есть просто результат обратного фурье-преобразования этого выражения: 81(„,„)=-±7Рфх.,г(Л7. ^). (8.3.29) где фу — совместная плотность распределения частных про- изводных фх И фу. Выражение (8.3.29) допускает интересную физическую ин- терпретацию. В пределе больших дисперсий фазы распределе- ние энергии в усредненной ФРТ определяется производными функции случайной фазы. Действительно, при увеличении дис- персии фазы флуктуации производных волнового фронта стано- вятся столь большими, что строго геометрическое искривление падающих лучей преобладает над любыми дифракционными эффектами, которые могут иметь место. В частном случае гауссовского случайного фазового экрана с нулевым средним обе частные производные являются также гауссовскими и МФХ. ФГ (®Х’ ®г) = ехР {- т(стМ + 2<тх<тгсохсоу + 44)}, (8.3.30) где 4 и 4 ~ дисперсии величин <рх и <рг, ар — их коэффи- циент корреляции. Таким образом, усредненная ОПФ экрана принимает вид [формула (8.3.28)] (vu> vv) = ех₽{ - [«W + 4VV + 2<TzffypVy, V J }. (8.3.31) Аналогично усредненная ФРТ экрана принимает гауссовскую форму (8.3.32) При дальнейшем переходе к случаю некоррелированных и идентично распределенных частных производных усредненная ФРТ принимает вид гауссовской функции с круговой симмет- рией: (г) = ——!-----ехр f-----~-----1 (8.3.33) V 7 (V)22na4 2(Xf)2a2 J ’ k где r = [a2 + v2]1/2. Итак, мы нашли предельную форму усредненной ОПФ фа- зового экрана с большой дисперсией фазы. Этот результат
362 Глава 8 показывает, что усредненная ОПФ выражается через характери- стическую функцию второго порядка, записанную в соответствую- щем масштабе, для частных производных фх и <ру фазы. Этим предельным результатом можно пользоваться, когда имеется возможность принять или обосновать некую модель для сов- местного распределения величин фх и фу. Он позволяет также показать, что в случае гауссовского фазового экрана с большой дисперсией фазы усредненная ОПФ и усредненная ФРТ имеют приблизительно гауссовскую форму. § 4. Влияние протяженной случайной неоднородной среды на распространение волн В предыдущих параграфах данной главы мы рассматривали влияние тонких случайных экранов на усредненные характери- стики оптических систем изображения. Теперь мы сосредото- чимся на более важном и более трудном случае протяженной случайной неоднородной среды. Как показано на рис. 8.8, ин- Некогерентный. объект Неоднородная среда Изображение Рнс. 8 8. Геометрия формирования изображения. тересующим нас объектом является некогерентный источник. Пространство между элементом, формирующим изображение, и объектом заполнено протяженной хаотически неоднородной средой (например, земной атмосферой). Изображение, форми- руемое такой системой, будет искажаться из-за наличия неод- нородной среды, и нам нужно уметь рассчитывать такие ис- кажения.
Формирование изображения при наличии случайных сред 363 Как уже говорилось, наиболее важным примером протяжен- ной случайной неоднородной среды является земная атмосфера, которой в течение столетий ограничивались четкость картины неба, наблюдаемой человеком. Наш анализ направлен с самого начала на этот конкретный пример. Как уже подчеркивалось, в этой главе наше внимание будет ограничено плавными и ма- лыми флуктуациями показателя преломления чистого воздуха вокруг нас. Мы исключаем из рассмотрения влияние на опти- ческие явления пыли и аэрозолей, которое требует изучения явлений многократного рассеяния (см., например, [8.4], т. 2). Мы ограничим также наше внимание оптическими свойствами в соответствующем спектральном «окне» атмосферы (таком, как видимая область спектра), в котором атмосферное погло- щение пренебрежимо мало. (Подробно об атмосферном погло- щении см. книгу [8.5], гл. 5.) Вопросу о распространении оптического сигнала в турбу- лентной среде посвящена обширная литература (см., например, [8.4; 8.5, гл. 6; 8.6—8.11]) *). Однако, без сомнения, наиболь- шее влияние на развитие этого круга вопросов оказала важ- ная работа Татарского, две книги которого [8.12, 8.13] послу- жили фундаментом для большинства последующих, работ (см. также [8.14]). Работа Татарского оказала такое влияние в этой области, что его обозначения используются в большинстве работ по дан- ному предмету. Желая облегчить читателю пользование лите- ратурой, мы здесь отказываемся от некоторых наших прежних обозначений и в оставшейся части главы будем пользоваться некоторыми его обозначениями. Следующий пункт параграфа мы полностью отведем обозначениям и определениям. А. Обозначения и определения Показатель преломления земной атмосферы изменяется в про- странстве, времени и зависит от длины волны. Для удобства представим эти зависимости в виде и (г, t, Х) = По(г, t, ^) + nj(r, /, X), (8,4.1) где по — регулярная (неслучайная) часть величины и, а п\~ случайные флуктуации величины и относительно среднего зна- чения п = По 1. Детерминированные изменения величины и, вообще гово- ря, являются очень плавными и макроскопическими в простран- ственном измерении. Например, п0 содержит зависимость п от высоты над поверхностью Земли, Благодаря сравнительно !) См. также [8.2д— 8.4д].—Прим. ред.
364 Глава 8 большим временным масштабам, связанным с л0, временную зависимость этого члена мы можем не учитывать. Случайные флуктуации пх возникают из-за наличия турбу- лентности в атмосфере. Турбулентные вихри в воздухе имеют масштаб, изменяющийся от десятков метров и более до не- скольких миллиметров. Зависимость этих случайных флуктуа- ций от длины волны, вообще говоря, можно игнорировать, что позволяет нам записать (8.4.1) в виде и (г, /, Z) — м0 (г, Х) + И|(г, /). (8.4.2) Заметим, что типичные значения гц на несколько порядков ве- личины меньше единицы [8.15]. Время, затрачиваемое светом на прохождение через атмо- сферу,—лишь малая часть «времени флуктуации» случайной составляющей показателя преломления щ. По этой причине зависимостью величины гц от времени часто пренебрегают, рас- сматривая только пространственные свойства. Если в той или иной задаче представляет интерес и временная зависимость, то она вводится на основе гипотезы «замороженной турбулентно- сти» (называемой также гипотезой Тейлора), согласно которой данная реализация случайной структуры гц «дрейфует» через измерительную апертуру с постоянной скоростью (определяе- мой локальными ветровыми условиями), но без каких-либо дру- гих изменений. Одной из наиболее важных статистических характеристик случайного процесса ni(r) является пространственная автокор- реляционная функция г„ (rb r2) = Е [«1 (гО (г2)]. (8.4.3) Если «1 — пространственно-стационарный процесс в трехмерном пространстве, то мы говорим, что он статистически однороден и его автокорреляционная функция принимает более простой вид Г„(г) = Е [п, (Г|)П] (г, — г)], (8.4.4) где г = Г[ — r2 = (Ах, At/, Az). Спектральная плотность мощности случайного процесса п\ определяется как трехмерный фурье-образ величины Гл(г) и в обозначениях, используемых в оставшейся части этой главы, записывается следующим образом: ф"(х) = W П 5 rn(r)e/-rd3r, (8.4.5) — со где х —(хх,ху, xz) есть тйк называемый волновой вектор, ко- торый можно рассматривать как вектор пространственной ча-
Формирование изображения при наличии случайных сред 365 стоты, каждая компонента которого измеряется в единицах ра- диан на метр. Аналогично можно выразить автокорреляционную функцию через спектральную плотность мощности: -J- со Г„(г)= J $ $Фя(х)е-^зн. (8,4,6) — со Если флуктуации показателя преломления имеют автокор- реляционную функцию со сферической симметрией, то случай- ный процесс п\ называется статистически изотропным и приве- денные выше трехмерные фурье-образы можно выразить через однократные интегралы [8,16]: со фЛх)=2^7$ r„(r)rsin(xr)dr, (8.4.7а) О оо Гл(г)=-уЦ Ф„ (х)х sin (xr)dx, (8.4.76) о где х = [^ + ^ + *|]1/2 и г = [(Ах)2 + (Аг/)2 + (Аг)2],/2. Иногда нам придется рассматривать двумерную автокорре- ляционную функцию и двумерную спектральную плотность мощности п\ (г) в плоскости с фиксированной координатой г. Эта двумерная спектральная плотность мощности представ- ляется функцией Еп(хх, Ху; г), связанной со спектральной плот- ностью мощности соотношением (задача 8.10): Pnl'Xx, хг; г)= J ф„(хх, хг, xz)dxz. (8.4.8) — оо Двумерная автокорреляционная функция Вп(р;г) связана с двумерной спектральной плотностью мощности соотношениями + оо Fn (х: г) = W- $ $ Вп (р; г) e/x ₽d2P’ (8.4.9а) — оо 4-00 Вп (р; г) = J J Fn (х; г) (8.4.96) — со где теперь х = (х%, ху) и р = (Ах, А//). Заметим, что по опре- делению В„(р; z) = £[n1(p1; z)«i(pi-p; г)]. (8.4.10) Если флуктуации величины п\ статистически изотропны в плоскости с постоянным г, то Вп(р; г) и Frt(x;z) имеют кру-
366 Глава 8 говую симметрию, а соотношения (8.4.9) могут быть сведены к виду оо F„ (х; г) = -X- J Вп (р; г) /0 (хр) р dp, (8.4.11 а) О Вп(р\ г) = 2л^ Frt(x; г)/0 (хр) х tZx, (8.4.116) о где х = [х2, + 4]1/2 и р = [(Ах)2 + (Ар)2]1/2. После того как мы ввели все эти обозначения, можно пе- рейти непосредственно к оптическим свойствам турбулентной атмосферы. Б. Атмосферная модель Показатель преломления воздуха на оптических частотах дает- ся выражением [8.15] П=1 +77,6(1 +7,52- Ю"3х'2)у- • 10“s, (8.4.12) где к — длина волны света в микрометрах, Р — атмосферное давление в миллибарах и Т — температура в кельвинах. Зави- симость п от давления сравнительно слабая, и ее можно не учитывать. Тогда температурные флуктуации выступают как основная причина флуктуаций величины п. При к = 0,5 мкм изменение dn показателя преломления, вызываемое повыше- нием температуры на dl\ равно dn = — ^--\0~6dT, (8.4.13) где снова Р — в миллибарах, а Т — в кельвинах. При распро- странении света на уровне моря производная \dn/dT\ есть вели- чина порядка 10-6. Случайные флуктуации ги показателя преломления вызы- ваются преимущественно случайной микроструктурой простран- ственного распределения температуры. Происхождение этой микроструктуры связано с необычайно широкомасштабными температурными неоднородностями, обусловленными различной степенью нагрева отдельных участков земной поверхности Солнцем. Эти крупномасштабные температурные неоднородно- сти в свою очередь вызывают появление крупномасштабных не- однородностей показателя преломления, которые постепенно разрушаются турбулентным ветровым потоком и конвекцией, уменьшающими масштаб неоднородностей.
Формирование изображения при наличии случайных сред 367 Неоднородности показателя преломления принято называть турбулентными «вихрями», которые можно рассматривать как некие «пакеты» воздуха, каждый со своим характерным пока- зателем преломления. Спектральная плотность мощности Фл(х) однородной турбулентности может рассматриваться как мера относительного числа вихрей с размерами Lx = 2л/х%, LY = =2л/ху и Lz = 2л/хг. В случае изотропной турбулентности величина Фь(х) является функцией только волнового числа х, которое может рассматриваться как величина, связанная с раз- мером вихря L соотношением L = 2л/х. Согласно классической работе Колмогорова [8.17] по тео- рии турбулентности, спектр мощности Фл(х) распадается на три большие области. При очень малых х (очень большие мас- штабы) мы имеем область, в которой первоначально возникает большинство неоднородностей. Математическая форма Фл в этой области не предсказывается теорией, так как она зависйт от крупномасштабных географических и метеорологических условий. Кроме того, маловероятно, чтобы турбулентность была изотропной или однородной в таких масштабах. При значениях х, превышающих некоторое критическое зна- чение хо, форма функции Фп(к) определяется физическими за- конами, которые описывают распад больших турбулентных вих- рей на более мелкие. Масштаб Л0 = 2л/х0 называется внешним масштабом турбулентности. Вблизи земной поверхности мы имеем где h — высота над поверхностью. Типичные значения Lo, приводимые в литературе, изменяются от 1 до 100 м в зависимости от атмосферных условий и геометрии рас- сматриваемого эксперимента. При х, больших хо, мы вступаем в инерционную подобласть спектра, где форма функции Ф« может быть предсказана на основе хорошо установленных физических законов, описываю- щих турбулентное течение. Согласно цитированной выше работе Колмогорова, форма функции Ф„ в инерционной подобласти дается выражением Ф„ (х) = О,ОЗЗС~х~11/3 , (8.4.14) где С2п — так называемая структурная постоянная флуктуаций показателя преломления; эта величина служит мерой интенсив- ности флуктуаций. Когда х достигает другого критического значения х™, форма функции Фп снова изменяется. Турбулентные вихри, меньшие определенного масштаба, рассеивают свою энергию в резуль- тате действия вязких сил, что приводит к быстрому уменьше- нию ФДх) при х > хт. Масштаб /0 2л/хт называется внут- ренним масштабом турбулентности. Типичное значение масшта- ба /0 вблизи поверхности Земли — несколько миллиметров.
368 Глава 8 Татарский учел быстрый спад Ф„ при х > х,п введением модель- ной функции Ф„(х)= О.ОЗЗ^х-х/ЗехрГ-^-У (8.4.15) \ кт / Это выражение можно считать удовлетворительным приближе- нием, если величина кт выбрана равной 5,92//0 и х > х0. Оба спектра (8.4.14) п (8.4.15) имеют неинтегрируемые по- люса в начале координат. Но на самом деле, поскольку коли- ~~cF~ Рис. 8.9. Спектральная плотность мощности флуктуаций показателя преломления. чество воздуха в земной атмосфе- ре конечно, спектр не может стать произвольно большим при х->0. Чтобы устранить этот недостаток модели, часто принимают форму так называемого спектра Кар- мана. В этом случае для спектра берут приближенную фор- мулу 0.033С2 / х2 \ Ф"(х)Я< (х2 + х2)11/беХР( K2mJ- (8.4.16) Заметим, что для такого спектра lim Ф„ (х) = х->0 о,оззс; хн/з” х0 (8.4.17) Подчеркнем, однако, что форма спектра в области очень малых значений волновых чисел неизвестна и формула (8.4.16)—это лишь искусственный способ устранить полюс при х = 0. Кроме того, мы увидим далее, лишь в немногих экспериментах суще- ственно влияние вихрей, более крупных, чем внешний масштаб, так что в действительности нет необходимости знать вид спект- ра в этой области. На рис. 8.9 представлены графики функций Ф«(х), давае- мых формулами (8.4.15) и (8.4.16), причем указаны волновые числа х0 и хш, в интервале между которыми выполняется за* кон х-и/3. При исследовании влияния атмосферной турбулентности на системы, формирующие изображение, мы увидим, что на ха* рактеристики такой системы влияет структурная функция флук- туаций показателя преломления. По определению эта струк- турная функция дается выражением Dn (fl. г2) = Е {[лг, (Г1) - щ (г,)]2}. (8.4.18)
Формирование изображения при наличии случайных сред 369 Найдем соотношение между этой структурной функцией и спектральной плотностью мощности Фл для флуктуаций пока- зателя преломления. Если турбулентность изотропная и если существует значе- ние Гл(0), то мы имеем [формула (3.4.19)] Р„(г) = 2[Гп(0)-Г„(г)]. (8.4.19) Подставляя (8.4.6) в (8.4.19) и учитывая свойство симметрии Фп(—х)= Фп(х) любой спектральной плотности мощности, на- ходим +°° — cos(x • г)] Ф„ (x)d3x. (8.4.20) — со При изотропном распределении величины ni постановка вы- ражения (8.4.76) в (8.4.19) дает со D„(r) = 8«J Ф„(х)х2(1 --^-)dx. (8.4.21) о [При выводе этого выражения нужно быть осторожным, пола- гая г->0 в выражении для Гл (0).] Теперь становится очевидным преимущество структурных функций: функция Dn(r) мало чувствительна к характеру из- менения величины Фл(х| при очень малых волновых числах. Если мы предположим, что х очень мало, то подынтегральное выражение в формуле (8.4.21) будет приблизительно равно х4Фл(х)г2/3! Даже если величина ГДО) может стать неогра- ниченно большой из-за зависимости Фл(х) вида x-rt(l и ^4) при х->0, функция Dn(r) останется вполне определенной. Это указывает на отсутствие сильной чувствительности величины Dn(r) к части спектра с малыми волновыми числами. Более того, даже если компоненты спектра мощности показателя пре- ломления, отвечающие очень малым волновым числам, неодно- родны и неизотропны, величина гц может обладать однородной и изотропной структурной функцией. В частном случае, представляющем интерес для нас, спек- тральная плотность мощности равна 0,033С2х'11/3. Подставив это выражение в формулу (8.4.21), получим интеграл со Dn (г) = 8л • 0.033С2 jj х-5/3 [1 - d%. (8.4.22) о Воспользуемся интегральным тождеством [8.18] “ . r(v) sin j xv(l - =---------fll Д --- (-3 < V < -1), (8.4.23)
370 Глава 8 где T(v)—гамма-функция аргумента v. Поскольку Г(—5/3) = = 2,4110, получаем для структурной функции, соответствующей колмогоровскому спектру (8.4.14), выражение Dn{r) = C2nr^\ (8.4.24) Равенство численного коэффициента единице в данном выра- жении не случайно. Это предусмотрено в самом определении величины С2. Отметим, что структурная постоянная С2 зависит как от п местных атмосферных условий, Рис. 8-10. Структурная функция показателя преломления в случае колмогоровского спектра турбу- лентности. график структурной функции (8.4.24). так и от высоты над поверх- ностью Земли. Типичные ее зна- чения вблизи поверхности Земли лежат в пределах от 1СН3 м-2/3 при сильной турбулентности до 10-17 м~2/3 при слабой турбулент- ности, в качестве «среднего» ча- сто берут значение 10-15 м-2/3. В заключение заметим, что формула (8.4.24) для структур- ной функции применима только при /о < г < Lo, поскольку вы- ражение для спектральной плот- ности, взятое при выводе этой формулы, пригодно только при Хо < X < хт. На рис. 8.10 представлен Dn(r), описываемой выражением В. Распространение электромагнитной волны в неоднородной атмосфере Выяснив статистические характеристики неоднородностей пока- зателя преломления, перейдем теперь к вопросу о влиянии этих неоднородностей на распространение электромагнитной волны. Рассмотрим монохроматическую электромагнитную волну, имеющую временную зависимость типа ехр(—/W), распростра- няющуюся в земной атмосфере. Ранее мы представили пока- затель преломления атмосферы в виде n(r) = no(r)4-n,(r), (8.4.25) где временная зависимость опущена. Предположим, что регу- лярная часть nQ(r)—почти постоянная величина (не зависит от г) в области значений, рассматриваемых в эксперименте по
Формирование изображения при наличии случайных сред 371 распространению волны, и поэтому представим показатель пре- ломления в виде «(г) = "о + "1(г). (8.4.26) Предположим, что атмосфера имеет постоянную магнитную проницаемость ц, но изменяющуюся в пространстве диэлектри- ческую проницаемость е. Тогда уравнения Максвелла прини- мают вид VH=0, V X Е = /соцН, V X Н = — /соеЕ, (8.4.27) V • (еЕ) = О, где Е — электрическое поле, Н — магнитное поле (Е и Н — ком- плексные векторы), а V — вектор с компонентами (д/дх, д/ду, д/дг). Действуя оператором VX на второе уравнение и подстав- ляя в него третье, получаем V X (V X Е) = со2цеЕ. (8.4.28) Но VX(VXE)=-V2E + V(V'Е), (8.4.29) а из последнего уравнения Максвелла V-(eE) = e(V • Е) +Е • Ve = 0. (8.4.30) Отсюда VE = -E-^- = -£-Vlne, (8.4.31) а учитывая (8.4.29) и (8.4.28), получаем V2E + <о2цеЕ + v(E- Vlne) = 0. (8.4.32) Локальная скорость распространения волны равна (це)~1/2, или с/n, где с — скорость света в свободном пространстве, а п — локальный показатель преломления. Следовательно, Ие = ^-, (8.4.33) а при постоянных цис Vine = 2? Inn. (8.4.34) Подставляя эти два выражения в формулу (8.4.32), для любой области вне источников получаем V2E + -^-E + 2v(E-Vlnn) = 0. (8.4.35) Последний член в этом уравнении описывает связь между тремя компонентами вектора Е и, следовательно, соответствует деполяризационному члену. В ранних работах было четко
372 Глава 8 установлено, что в’ видимой области спектра этот член пренебре- жимо мал и может быть положен равным нулю [8.19]. С физи- ческой точки зрения деполяризационными эффектами можно пренебречь потому, что внутренний масштаб турбулентности /0 намного больше длины волны X. Таким образом, волновое урав- нение принимает вид V2E + Е = 0. (8.4.36) Это уравнение отличается от обычного волнового уравнения только тем, что величина и2 в коэффициенте при втором члене является функцией радиус-вектора г. Поскольку все три компоненты электрического поля удов- летворяют одному и тому же волновому уравнению, векторное уравнение можно заменить скалярным: V2u + и = 0, (8.4.37) где U представляет Ех, Fy или Ez. Это уравнение решают методом малых возмущений. По- скольку |П1|<^По, можно представить поле U в виде суммы члена и0, который был бы получен, если бы атмосфера имела однородный показатель преломления п0, и малого поправоч- ного члена Ui, который учитывает влияние возмущений пока- зателя преломления п\. В таком приближении волновое уравне- ние принимает вид V2 (Uo + U j) + («о + nO2 (Uo + U1) = 0. (8.4.38) Поскольку величина Uo — невозмущенное решение, она должна удовлетворять уравнению V2Uo + fe2Uo = O, (8.4.39) где /г2 = (о2п2/с2. Сохранение только тех членов, которые имеют первый порядок относительно Ui и означает, что величина Uj должна удовлетворять уравнению 2k%n, Un + -----°7^-. (8.4.40) Здесь и далее мы принимаем средний показатель преломления п0 равным единице, что является очень хорошим приближе- нием в случае распространения оптического сигнала. В формуле (8.4.40) мы имеем неоднородное волновое урав- нение для Ц с членом —2/^0 в качестве источника. Его ре- шение можно легко найти как свертку функции Грина для сво- бодного пространства (импульсный отклик) ехр(/&о|г|)/|г| с
Формирование изображения при наличии случайных сред 373 выражением для источника. В результате имеем 1 Г С С p^k I г~г' I , L <1') = 4-5Пт-^Г[2Ч".<г >и»(г)|Л'. (8Л.41) V где V — рассеивающий объем. Данное выражение для 1Д означает, что полевое возмуще- ние Uj может быть найдено путем суммирования множества сферических волн, генерируемых в различных точках г' внутри рассеивающего объема V. Амплитуда сферической волны, гене- рируемой в точке г', пропорциональна произведению амплиту- ды падающего невозмущенного излучения на возмущение пока- зателя преломления в этой точке. Дальнейшего упрощения мы достигнем, если учтем то об- стоятельство, что углы рассеяния, характерные для распростра- нения видимого света в атмосфере, довольно малы. Так как наименьшие турбулентные вихри по величине порядка /о ~ 2 мм, а типичная длина волны составляет ~0,5 мкм, углы рассеяния не превышают Х/7о ~ 2,5-10-4 рад. Следовательно, максимальное поперечное смещение, в пределах которого свет от рассеивателя попадает в заданную точку, намного меньше аксиального расстояния от рассеивателя до фотоприемника. Поэтому в подынтегральном выражении в формуле (8.4.41) мо- жет быть использовано так называемое приближение Френеля [8.20], что приводит к выражению V (8.4.42) где р и р'— поперечные смещения векторов г и г' от оси г. В этом месте мы введем преобразование, широко исполь- зовавшееся Татарским [8.12, 8.18]), а именно введем ком- плексную величину Ф, равную натуральному логарифму поля U: ф = 1пи. (8.4.43) Читателю может показаться непонятным, что дает такое пре- образование, а поэтому мы поспешим дать разъяснение. Наше решение для поля мы получили, рассматривая полное поле как сумму все уменьшающихся вкладов: U —U0 + U1 + U2 + ... (8.4.44) и ограничиваясь членами первого порядка по возмущению Ui. Такой метод решения называется борновским приближением; в нем по существу пренебрегают многократным рассеянием.
374 Глава 8 Конечно, при некоторых ограниченных экспериментальных усло- виях это решение может быть точным. Татарский ввел преобразование (8.4.43), так называемое преобразование Рытова, с самого начала своего анализа, а не в конце, как это делаем мы. Оно сразу же превращает волно- вое уравнение (8.4.37) в уравнение Риккати гл2 V4 (г) + V4 (г) • vt (Г) + п2 (г) = 0. (8.4.45) Уравнение Риккати можно решить, положив t = Чо + ti +12 + • • • (8.4.46) и опустив все члены более высокого порядка, чем фь Подобный метод решения приводит к такому же результату, как и тот, который мы получим для t7i, но зато он применим при более широких условиях, нежели борновское приближение [8.4, т. 2]. Преобразование Рытова дает такое преимущество по той при- чине, что в области слабых флуктуаций флуктуации амплитуды, как следует из эксперимента, подчиняются логарифмически- нормальному распределению. Решение в форме ф соответствует логарифмически-нормальному распределению флуктуаций ам- плитуды, а решения для U такому распределению не ствует [8.21] (дальнейшее обсуждение см. в конце пункта). Возвращаясь к преобразованию (8.4.43), напишем U = exp(ir0 + ti). Uo = exp(to). соответ- данного (8.4.47) Тем самым мы представляем величину U как возмущенный ва- риант решения в свободном пространстве в мультипликатив- ной, а не в аддитивной форме. [Заметим, что Ui =#= ехр (ф1).] Мы имеем ^=‘+-Е- = с’. <8'4-48) ♦.='"(' +w)-oj- <8'4'49’ Последнее приближенное равенство допустимо потому, что I Ui | | и0|. Подставляя выражение (8.4.42) для Ui в (8.4.49), получаем Xn.(r')U0(r')d3r'. (8.4.50) Этот результат действительно совпадает с тем, что получается, если с самого начала ввести преобразование Рытова.
Формирование изображения при наличии случайных сред 375 Вводя соответствующие обозначения, можно теперь найти выражения для логарифма амплитуды и фазы волновых возму- щений. Обозначим амплитуду и фазу фактической волны U через Л и S, а амплитуду и фазу решения в свободном про- странстве— через Ло и So: U = Лехр(/5), it л (8.4.51) Uo = Л0ехр(/50). Тогда 4i = t — 4o = ln^- + /(S — So), (8.4.52) и, вводя обозначения . . А (логарифмическая флуктуация х= П“ТГ амплитуды), (8.4.53) SdAS — So (флуктуация фазы), получаем 4! = X + /Se. (8.4.54) На основании формулы (8.4.50) мы приходим к выводу, что X •Se Re t Im 2ли° J ' X п, (г') Uo (г') d3r' | ]. (8.4.55) Это выражение представляет собой основной результат данного пункта. Как отмечалось выше, решения, полученные на основе бор- цовского приближения, с одной стороны, и преобразования Ры- това—с другой, приводят к разным плотностям распределения амплитуды А возмущенной волны. Единственной случайной ве- личиной, присутствующей в решении, в обоих случаях является возмущение показателя преломления И|. Выражение (8.4.42) дает полевое возмущение как суперпозицию огромного числа независимых вкладов различных частей турбулентной среды. В соответствии с центральной предельной теоремой мы вправе ожидать, что действительная и мнимая части величины Ui под- чиняются гауссовскому, или нормальному, распределению. Предсказываемое распределение интенсивности полной волны зависит от дисперсий действительной и мнимой частей вели- чины Ui и от их корреляции. Если эти дисперсии равны, а ко- эффициент корреляции равен нулю, то сумма величин Uo и Ui будет равна сумме постоянного (неслучайного) фазора и кру- гового комплексного гауссовского фазора. Согласно результа- там гл. 2, § 9, п. Г, при этих условиях величина А ~ | U |
376 Глава 8 должна подчиняться распределению Райса. Но, вообще говоря, предположение о равных дисперсиях и нулевой корреляции не выполняется, и распределение интенсивности должно быть бо- лее сложным. В то же время в выражении (8.4.55) логарифм флуктуаций амплитуды х представляется в виде суперпозиции множества независимых вкладов. Снова обращаясь к центральной пре- дельной теореме, мы приходим к тому, что величина х в такой форме должна подчиняться гауссовскому распределению, а это означает, что амплитуда А должна быть логарифмически-нор- мальной переменной. Преобладающее большинство экспериментальных данных говорит в пользу логарифмически-нормального распределения при малых флуктуациях, и принято считать, что при малых флуктуациях такая статистическая модель достаточно точна и ею можно пользоваться в теоретических расчетах. Г. Логарифмически-нормальное распределение Поскольку логарифмически-нормальное распределение играет особо важную роль в теории распространения света через тур- булентную среду, мы коротко остановимся на некоторых его свойствах. Примем, что логарифм амплитуды х есть гауссовская слу- чайная переменная со средним значением х и стандартным от- клонением <тх. Следовательно, "’(Z) = ‘V5=X “•>{- (% — х)* | 2ах J Л (8.4.56) Чтобы найти плотность распределения амплитуды А = Лоехр(х), (8.4.57) нам нужно ввести некое преобразование вероятностей. Заме- чая, что Рд(Л) = Рх(х = 1пЛ) |4т| <8-4-58) и что dyJdA = 1/Л, получаем А 1 <л>0)- <8-4М>
Формирование изображения при наличии случайных сред 377 Аналогичным образом находится плотность распределения ин- тенсивности 7 = А2: ( 1 , I \2 к ехр1 (т|п7Г~х) 1 ) Г (4^ 28)21 1 = := ехр" 2 У2л а%/ - ——2 — ( (7 > 0). (8.4.60) ( 8ах ) Выражения (8.4.59) и (8.4.60) могут служить примером плот- ности логарифмически-нормального распределения. При рассматриваемых условиях эти плотности распределе- ния имеют три независимых параметра х, <тх и /о- Но если фик- сировать среднее значение переменной, подчиняющейся лога- рифмически-нормальному распределению, потребовав, напри- мер, чтобы выполнялось равенство 7 = /о, то мы найдем, что х и стх не могут далее выбираться независимо. Чтобы доказать это, положим 7 = 7о^х = /о- (8.4.61) Теперь воспользуемся следующим соотношением, справедли- вым для любой действительнозначной гауссовской случайной переменной г и любой комплексной постоянной а: £ [gaz] _ еХр | + у а2сг2 j. (8.4.62) Положив z = х и а = 2, находим 7 — IqC х — 70, (8.4.63) или, что эквивалентно, Х = - <т2х. (8.4.64) Здесь мы еще имеем два независимых параметра, но если в качестве одного из них выбрать 70, то х и а2 не могут быть выбраны независимо. Приведенное соотношение соответствует предположению, что волны распространяются без заметного затухания. Следо- вательно, плоская волна единичной интенсивности, входящая в атмосферу в точке г = 0, в силу закона сохранения энергии должна иметь единичную среднюю интенсивность и тогда, ко- гда она достигает точки 2=7,. Кривые плотности распределения р/(7) представлены на рис. 8.11 при разных значениях параметра <тх с учетом огра- ничения, налагаемого законом сохранения энергии. Как
378 Глава 8 нетрудно видеть, даже при фиксированном значении /0 мы имеем самые разнообразные формы распределений. Логарифмически-нормальное распределение имеет и другие свойства, весьма необычные для распределений, описывающих реальные физические явления. Во-первых, как известно, оно на- рушает условия, необходимые для того, чтобы плотность рас- пределения полностью определялась своими моментами [8.22]. Рис. 8.11. Логарифмнчески-нор- мальное распределение интенсив- ности при средней интенсивности, равной единице. Во-вторых, оно обладает некото- рой «перманентностью» в том смысле, что сумма независимых лога рифм ически-нормальных пе- ременных очень медленно стре- мится к гауссовскому распреде- лению [8.23]. Однако эти вопро- сы уводят нас довольно далеко от нашей основной цели — опре- деления влияния турбулентности на характеристики системы, фор- мирующей изображение. § 5. ОПФ при длительной экспозиции Неоднородности атмосферы нахо- дятся в постоянном турбулент- ном движении, в связи с чем мгно- венные искажения волнового фронта быстро флуктуируют во времени. Чтобы «заморозить» и тем самым исключить любые эффекты, связанные с временным усреднением, необходимо задавать время экспозиции от 0,01 до 0,001 с и меньше в зави- симости от эффективной скорости ветра. На рис. 8.12 по- казаны примеры как большой (Г ^>1/100 с), так и малой экспозиции (Т 1/100 с) при фотографировании звезды. Как можно ожидать на основании вида изображений, при- веденных на рис. 8.12, имеется существенное различие между ОПФ, полученными при длительной и короткой экспозиции. В данном параграфе мы рассмотрим только случай боль- шой экспозиции, который соответствует, например, регистрации изображения слабых астрономических объектов, требующих времени интегрирования, измеряемого секундами, минутами и даже часами. В основе нашего анализа будет лежать предпо- ложение о временной эргодичности, а именно о том, что усред- ненная за большой промежуток времени ОПФ, на которую ока- зывает влияние большое число независимых реализаций атмо-
Формирование изображения при наличии случайных сред 379 сферных неоднородностей, идентична ОПФ, усредненной по ан- самблю. Рис. 8.12. Фотографии звезды Лямбда Кратера, а — длительная экспозиция; б — короткая экспозиция. Недавно появился интерес к ОПФ при короткой экспозиции, связанный с успехами адаптивной оптики [8.24] и звездной
380 Глава 8 спекл-интерферометрии [8.25]. Мы рассмотрим эти вопросы в последующих параграфах, но пока наше внимание будет огра- ничено случаем длительной экспозиции. А. ОПФ при длительной экспозиции, выраженная через волновую структурную функцию Рассмотрим (рис. 8.13) весьма удаленный квазимонохромати- ческий источник, расположенный на оптической оси простой си- стемы, формирующей изображение. В отсутствие атмосферной Уваленный. Атмосфера Линза Изображение источник Рис. 8.13. Формирование изображения удаленного точечного источника при наблюдении через атмосферу. турбулентности этот источник генерировал бы плоскую волну, падающую на линзу по нормали. При наличии же атмосферы плоская волна падает на неоднородную среду, распространяет- ся в ней и затем падает на линзу в виде возмущенной волны. Распределение поля, падающего на линзу, можно представить в виде и (х, у) = V/o ехр {х (х, у) + jS (х, у)}, (8.5.1) где /о — интенсивность падающей плоской волны, а х и S, как предсказывается решением Рытова,— гауссовские случайные переменные. Рассуждая так же, как и при выводе формулы (8.1.3), мгно- венную ОПФ системы можно представить в виде * (Уи> vy) = 4-00 Р (х, у) Р* (х — XfVy, у — xfvv) ехр {(%, + х2) + j (Sj — S2)} dx dy — oo ____________________ —- > J § ₽ (x- у) ₽* (x. y) exp {2%} dx dy (8.5.2)
Формирование изображения при наличии случайных сред 381 где Р(х, у)—комплексная функция зрачка системы в отсут- ствие атмосферной турбулентности, причем Xi=X(x, У), ‘Xz = X(x — ifvu, y — hfvv), ,8 5 3) S1 = S(x, у), S2 = S (х — Xfvy, у — Xfvv). Заметим, что величины хь Х2, Si и S2 — функции времени, но эта временная зависимость опущена в представленном выра- жении для мгновенной ОПФ. В рамках принятого предположения об эргодичности усред- ненная по ансамблю ОПФ в пределе неограниченно большого времени интегрирования будет совпадать с ОПФ при длитель- ной экспозиции. Следовательно, нам необходимо вычислить средние по ансамблю числителя и знаменателя выражения (8.5.2). Получим Ж (va, vv) = ^o(vt/, vv)^L(va, vj, (8.5.4) где Ж§ — ОПФ оптической системы в отсутствие турбулентно- сти, тогда как может рассматриваться как ОПФ при дли- тельной экспозиции атмосферы, которая дается выражением (8.5.5) где Г (Ах, Ay) = Е [ехр {(Xi + Х2) + / (Si — S2)} ]. (8.5.6) Записав Г в виде функции величин Ах и Ау, мы приняли до- пущение, что возмущения волнового фронта подчиняются одно- родному распределению. Таким образом, чтобы вычислять ат- мосферную ОПФ, нам нужно знать статистические свойства величин х и S. То обстоятельство, что / и S подчиняются гаус- совскому распределению, облегчает нашу задачу. Вообще говоря, у иас нет оснований считать х и S незави- симыми случайными процессами, поскольку их флуктуации обусловлены флуктуациями показателя преломления. Однако рассмотрим следующее среднее: (X! + Хг) (Si — S2) = х7$Г — xA-xA + jfeS?. (8.5.7) Если флуктуации показателя преломления подчиняются одно- родному распределению, то переменные х и S должны быть совместно однородными. В этом случае = XsA* (8.5.8)
382 Глава 8 Если к тому же и п подчиняется изотропному распределению, то х и S будут совместно изотропными, и тогда Xi^2 = Хг^Ч • (8.5.9) Следовательно, (Xi + x2)(S1-S2) = 0, (8.5.10) и мы видим, что случайные переменные (xi + Х2) и (Si— S2) не коррелированье И наконец, из гауссовского распределения величин х п следует, что величины (xi + Х2) н (Si — S2) также являются гауссовскими случайными переменными, а от- сутствие корреляции между ними означает их статистическую независимость. Следовательно, Г(Дх, Ay) = ехр (Xi + Х2) ехР [/ (Si — S2)]. (8.5.11) Из того, что ранее говорилось о гауссовских случайных экранах, мы знаем, что ехр[/(S, — S2)] = ехр[—-у Z)s (г)], (8.5.12) где г = [(Дх)2 4- (Ai/)]1/2 и Ds (г) — фазовая структурная функция: Z)s = (S, — S2)2. (8.5.13) Теперь мы должны вычислить среднее величины exp(xi + X2)- Для этого воспользуемся соотношением (8.4.62), которое справедливо для любой гауссовской случайной переменной г: £ [еаг] = ехр | аг +-у а2(т2 (8.5.14) Выбрав z = (Xi + Х2) и а = 1> получаем Е [е* '+*’] = Л (Х|+Х'-2Х%2Г (8.5.15) Замечая, что у(Х1 + Хг— 2х)2 = у[(Х1 — х) + (Хг —х)]2 = = 4 (Xi — х)2 + 4 (ЯР + (Х.-Х)(Х2-Х) = Сх(0) + Сх (г), (8.5.16) где Сх — автоковариация величины х, мы видим, что Е [ez>+x2] = ехр {Сх (0) + Сх (г)} е* (8.5.17) Вспомнив теперь о законе сохранения энергии, мы заключаем, что средняя интенсивность неограниченной плоской волны, рас- пространяющейся в хаотической неоднородной среде без по- терь, должна оставаться постоянной. Отсюда следует [форму- ла (8.4.64) ], что Х = -а2 = -Сх(0). (8.5.18)
Формирование изображения при наличии случайных сред 383 С учетом этого из формулы (8.5,17) получаем £ [е%.+х>] = ехр {- Сх (0) + Сх (г)} = ехр { - i£>х (г) }, (8.5.19) где Dy, — структурная функция логарифмической амплитуды = (8.5.20) В итоге имеем Г (г) = ехр ( —D (г) к 1 2 * (8.5.21) Г (0)= 1, где D = Z)z + Ds есть так называемая волновая структурная функция. Таким образом, полная усредненная ОПФ принимает вид ^(v) = ^0(v)exp{-yD(Afv)}, (8.5.22) где v = [v^ + Vy]1''2 и для простоты предполагается, что ОПФ невозмущенной оптической системы имеет круговую симметрию. Б. Вычислеиие волновой структурной функции в ближней зоне Рассмотрим теперь вопрос о детальном выражении для вол- новой структурной функции. Такое выражение позволит нам более детально конкретизировать форму атмосферной ОПФ при длительной экспозиции. В начальном анализе задачи мы примем весьма значитель- ные упрощения, которые лишь иногда оправдываются на прак- тике. Но затем мы покажем, как результаты такого упрощен- ного анализа могут быть распространены на гораздо более ши- рокий круг условий, нежели предполагалось вначале (§ 6). Основные упрощающие предположения таковы: 1) интере- сующий объект находится на очень большом расстоянии от линзы, а его угловой размер столь мал, что атмосфера воз- действует на все части объекта одинаковым образом, по край- ней мере в течение большого времени усреднения; 2) на неко- тором конечном расстоянии г перед линзой, формирующей изображения, имеется турбулентность, однородная и изотроп- ная в этой области; 3) система, формирующая изображение, расположена глубоко внутри области ближнего поля наиболее значительных турбулентных вихрей, так что в хорошем при- ближении можно считать, что всякий луч, падающий на неод- нородную среду, просто задерживается этой средой без суще- ственного искривления (данное предположение приемлемо только при Z ZqA)-
384 Глава 8 Предположение 1, которое можно назвать «изопланатным», не является очень сильным ограничением при большом времени усреднения изображения. Предположение 2 неприемлемо при наблюдении по вертикали через атмосферу, но оно будет снято в § 6, п. Г. Предположение 3 — это в сущности предположение о том, что турбулентность слаба и, следовательно, отсутствуют Рнс. 8.14. К вычислению структурной функции фазы. значительные эффекты амплитудного мерцания. Вообще гово- ря, такое условие не выполняется на практике, но в виде ис- ключения оно может выполняться при вертикальном наблюде- нии с высокогорной обсерватории в условиях хорошей атмо- сферной видимости. От этого предположения мы откажемся в § 6, п. 1. На рис. 8.14 показана геометрия, на которой основаны вы- числения. Предположение 1 позволяет нам рассматривать толь- ко одиночный точечный источник на оптической оси, создаю- щий плоскую волну на входе в область турбулентности. Пред- положение 3 используется теперь для того, чтобы представить разности фаз Si и S2, приобретаемые двумя параллельными лу- чами, в виде Z Si=k [Ио + nt (r,)J dz', °г (8.5.23) S2 = k [n0 + th (r2)] dz', 0 где k = 2лД. Кроме того, это предположение означает, что флуктуации амплитуды пренебрежимо малы, так что Xi = Х2 и £>х(г) = 0. Поскольку структурная функция логарифмической амплитуды равна нулю, волновая структурная функция равна фазовой
Формирование изображения при наличии случайных сред 385 структурной функции и усредненная атмосферная ОПФ дается выражением ^£(v) = exp{-4*Wv)}- (8.5.24) При вычислении фазовой структурной функции мы возьмем за начало нашей координатной системы точку, в которой ниж- ний луч на рис. 8.14 входит в турбулентную область. Тогда м(Г1) = п(г', г), п(г2) = n(z', 0). (8.5.25) Фазовую структурную функцию мы найдем, если среднее значение E[(S, - S2)2] = (k)2E dz' [п, (z', г) — tii (z'> 0)] вычислим (8.5.26) Эту величину можно представить в другом виде: (S,-S2)2 = (k)2 Е | J \ dz' dz" [n, (z', г) - щ (z', 0)] X X [«.(*", r)-tii(z", 0)]} = = (k)2 dz' dz" [«! (z', r) tii (z"’ r) + ni (г'> 0) ni (z"< 0) — — tii (z't r) nx (z", 0) — tii (z'< 0) ni (z"> r)L (8.5.27) Средние значения могут быть выражены через ковариационные функции г оо Ds (И = (k)2 j dz' j dz" [2Cn (z' - z") - 2Cn - z")2 + r2)]. о 0 (8.5.28) Разность ковариационных функций может быть выражена через разность структурных функций: 2С„ (г' - г") - 2Сп (V(Z - г")2 + г2) = = [2С„ (0) - 2Сп - г")2 + г2)] - [2С„ (0) - 2Сп (г' - г")] = = Dn W(z' - z")2 + г2) - Dn (z' - z"). (8.5.29) Комбинируя (8.5.28) и (8.5.29), находим, что фазовая структур- ная функция имеет вид Z Z Ds (г) = (k)2 J dz' J dz" [D„ (V(z'-z")2 + r2 - Dn (z' - z")]. о 0 (8.5.30)
386 Глава 8 Данную формулу можно еще более упростить, если учесть, что подынтегральное выражение есть четная функция разности zf — z!r\ это обстоятельство позволяет нам свести двойной ин- теграл к одинарному, что мы теперь и продемонстрируем. Пусть g( )—любая четная функция своего аргумента. Положив Аг = г' — г", напишем 2 2 Z Z—Z" \dz'\dz"g(z'-z")=\dz" J dAzg(Az), (8.5.31) 0 0 0 —za где интегрирование ведется по площади, показанной на рис. 8.15. Поскольку g зависит только от Аг и является четной функцией величины Аг, данный интеграл можно найти как удвоенный интеграл по области с двойной штриховкой, т. е. по правому треугольнику. В результате имеем 22 2 2-Д2 dz' dz"g (z' — z") = 2 d (Az) g (\z) dz" = 0 0 о 0 2 = 2 J (z - Az) g (Az) d (Az). (8.5.32) о Используя это соотношение, мы получаем следующее выраже- ние для фазовой структурной функции: 2 Ds (г) = 2 (/г)2 J (z - Az) (V(Az)2 + r2) - Dn (Az)] d (Az). (8.5.33) о Теперь нам нужно принять конкретный вид структурной функции для флуктуаций показателя преломления. Согласно широко признанной теории Колмогорова, эта структурная функция такова: Ря(г) = <?Л3. l0<r<L0. (8.5.34)
Формирование изображения при наличии случайных сред 387 Подстановка этого выражения в формулу для фазовой струк- турной функции приводит к выражению Ds (г) = 2 (£)2 С2п J (г - Az) [(Az2 + г2)1/3 - Дг2/3] d Az. (8.5.35) О Заметим, что вследствие ограничений, имеющихся в форму- ле (8.5.34), это выражение для Ds(r) строго применимо только при Аг < Ло, где Lq— внешний масштаб турбулентности. Та- ким образом, следует считать, что это выражение применимо только в случае путей г, меньших внешнего масштаба. Но ока- зывается, что, если расстояние г между путями намного мень- ше Lq (как обычно почти всегда и бывает, поскольку макси- мальное расстояние, представляющее для нас интерес, равно диаметру принимающей оптики), подынтегральное выражение равно нулю при больших Аг и точная форма структурной функ- ции при г > Lq становится несущественной. В частности, при больших Аг множитель в квадратных скобках в подынтеграль- ном выражении в формуле (8.5.35) ведет себя следующим об- разом: (Az2 + г2)'/3 - Аг2/3 = Аг2/3 (1 + -£^-)'/3 — Az2/3 « ”А2ад(1+Т1?-1)=^^0' <8-5'36) Значит, при Аг, больших Lq, и при г, меньших Lq, подынте- гральное выражение настолько мало, что его вкладом в инте- грал можно пренебречь и наше выражение для Ds (г) может рассматриваться как точное при всех значениях длин пути, при которых не нарушаются наши предыдущие более существенные предположения. Выражение (8.5.35) можно рассматривать как разность двух членов с подынтегральными выражениями, содержащими г[ (Аг2 + г2)1/3 — Аг2/3] и Аг[ (Аг2 + г2) ^3 - Аг2/3]. На рис. 8.16 показаны оба этих члена. Первый член (площадь верхней кри- вой) значительно больше второго (площадь нижней кривой). Вследствие этого мы будем полностью пренебрегать вторым членом. Кроме того, первый член падает почти до нуля задол- го до того, как Аг достигнет г, так что мы допустим неболь- шую ошибку, взяв верхний предел интегрирования равным бес- конечности. Таким образом, оо Ds (г) « 2 (fc)2 С2пг J [(Az2 + г2)|/3 - Az2/3] d Az. (8.5.37) О
388 Глава 8 Производя замену переменных Аг = ru, d\z = rdu, получаем выражение Ds(r) = (k)2C2nzr513 J [(u2+l)1/3-«2/3]d«. (8.5.38) — оо Этот интеграл, взятый численным методом, равен 2,91. Следо- вательно, Ds (г) = 2,91 (k)2 Cnzr3'3. (8.5.39) Вычислив фазовую структурную функцию, мы можем те- перь написать выражения для атмосферной ОПФ при длитель- ной экспозиции [8.26]. Подставляя (8.5.39) в (8.5.24), получаем %L (v) = ехр| - у • 2,91 (fc)2 С2г (М*)5/3} = = ехр 57,4 C^4jv5/3}. (8.5.40) Более удобная форма, не зависящая от параметров оптической системы, получается, если выразить ОПФ через угловую про- странственную частоту, измеряемую в герцах на радиан дуги, Рис. 8.16. Два члена подынтегрального выражения (8.5.35). а ие в герцах на метр. Соотношение между й и v имеет вид й = /v, в результате получаем, что — ( 1 f C2z (Q) = ехр <-----2,91 (k)2 С^г (ХЙ)5/3 > = ехр < - 57,4 Q5/3 f. х 2 z х Z (8.5.41) Это выражение — основной результат нашего анализа для об- ласти ближнего поля. Конечно, чтобы найти полную ОПФ, най- денную в (8.5.41) ОПФ нужно умножить на ОПФ оптической системы в отсутствие атмосферной турбулентности.
Формирование изображения при наличии случайных сред 389 Особое внимание следует обратить на то, что угловая про- странственная частота, при которой Жь падает до значения 1/е, определяется выражением а''-=Й5Г' <8-5-42) Таким образом, ширина полосы ОПФ, определяемая таким вы- ражением, пропорциональна длине волны лишь в степени 1/5, т. е. очень слабо зависит от длины волны. Графики атмосферных ОПФ для длительной экспозиции по- казаны на рис. 8.17 сплошными линиями при X =0,5 мкм, z = Рис. 8.17. Атмосферная ОПФ (X = 0,5 мкм, z = 100 м) при длительном экс- понировании. Штриховые линии — кривые дифракционно-ограниченной ОПФ круглых апертур. = 100 м и при разных значениях С2п. Штриховыми линиями показаны ОПФ для дифракционно-ограниченной круглой опти- ки диаметром 5, 50 см и 5 м. Сравнив сплошные и штриховые кривые, можно получить некоторое представление об эффек- тивном уменьшении апертуры, эквивалентном уменьшению раз- решения из-за наличия турбулентности. § 6. Обобщения теории Выражения для ОПФ при длительной экспозиции, полученные в § 5, основаны на ряде серьезных ограничений. В следующих пунктах данного параграфа мы снимем некоторые из них.
390 Глава 8 Во-первых, мы обобщим наш предыдущий чисто геометри- ческий вывод ОПФ для длительной экспозиции, включив эф- фекты искривления лучей и дифракции. Замечательным оказы- вается то, что ОПФ при длительной экспозиции не изменяется по сравнению с найденной в более ограниченной теории. Во-вторых, мы обобщим наши результаты, включив эффек- ты плавных изменений структурной постоянной С2 вдоль пути распространения волны. Такие изменения, в частности, важны при вертикальном наблюдении через атмосферу (например, в астрономических наблюдениях), ибо интенсивность турбулент- ности существенно зависит от высоты над поверхностью Земли. Изменения величины С2п вдоль горизонтальных путей также ча- сто имеют место на практике. В-третьих, мы введем атмосферный диаметр когерентности Го, что позволит лучше понять ограниченность разрешения при наблюдении объектов через атмосферу, а также упростить вы- ражения для передаточных функций. Наконец, в-четвертых, мы рассмотрим задачу о формирова- нии изображения, в том случае, когда объект расположен на конечном расстоянии от оптической системы, формирующей изображение, а не на бесконечном удалении. Такая геометрия имеет важное значение, когда при формировании изображения волны распространяются по горизонтали, а также когда ве- дутся неастрономические наблюдения по вертикали. В этих слу- чаях нам придется рассматривать распространение не плоских, а сферических волн. А. Обобщение на случай больших путей распространения. Фильтрующие функции для амплитуды и фазы Вычисление атмосферной оптической передаточной функции для длительной экспозиции, изложенное в § 5, было основано на весьма ограничивающем предположении, что даже в случае наименьших турбулентных вихрей влияние возмущений пока- зателя преломления сводится к задержке световых лучей, про- ходящих через них. Таким образом, геометрическое искривле- ние лучей и дифракционные эффекты игнорировались. Длины путей, при которых это предположение строго выполняется, столь малы, что оказываются вне пределов практического ин- тереса. Мы обобщим проведенный анализ, стараясь более полно учесть влияние неоднородностей среды на распространение волн через них. Наше изложение будет видоизмененным вариантом анализа, опубликованного Татарским [8.12, 8.13]. Как ни уди- вительно, но результаты более общей теории совпадают с ре- зультатами более простого анализа, проведенного выше.
Формирование изображения при наличии случайных сред 391 Соответствующая геометрия показана на рис. 8.18. Возму- щения показателя преломления существуют в конечной обла- сти, лежащей между zr = 0 и zr = z на пути распространения. Внутри этой области флуктуации fit (х', y't z') предполагаются однородными. Плоская волна входит в область флуктуаций по- казателя преломления при z' = 0, а апертура коллектора систе- мы изображения находится в плоскости z' — z. Рис. 8,18, Распространение волны в неоднородной среде. Исходным для анализа является выражение (8.4.55), кото- рое связывает логарифмическую амплитуду % и фазу в пло- скости апертуры коллектора с флуктуациями показателя пре- ломления неоднородной среды. В случае плоской волны единичной интенсивности, падающей на плоскость zr = 0, невоз- мущенное решение внутри среды имеет вид U0(r') = exp(/fcz'). (8.6.1) Постановка этого выражения в (8.4.55) приводит к следующему выражению для % и Se: 2 4-оо 4-оо (й)2 г , г с %(х, у, z)=-^~ dz dy dx п^х , у', г)Х о —оо —оо 2 4-°° 4-°° Ш2 Г z Г Г у, г) = -^- dz dy' dx пх (х', z') X О —оо — оо (8.6.2) ________2(2 — 2')________ Z — zr
392 Глава 8 Для удобства в дальнейшем перепишем выражения (8.6.2) в виде 2 х(х, у, z)= $ q(x, у, г, z')dz', \ (8.6.3) Se(x, у, г) = р(х, у, z, z')dz', О где 4-00- q(x, у, z, z') = -^ J J «! (%', у', г') X — оо гас I k[(X—x')2+(y — y')2 1 (8-6-4) p (x, y, z, z') = J j nt (x', y', z') X sin x— z — z' dx' dy'. Нашей целью в этом анализе является вычисление двумер- ных спектральных плотностей мощности Fz(xx, ху;г) п Fs(xx, ху; г) логарифмической амплитуды и фазы в плоскости z' = z. С помощью этих и связанных с ними результатов мы найдем соответствующие структурные функции и затем вычис- лим ОПФ при длительной экспозиции. Анализ облегчается, если заметить, что в формуле (8.6.4) величины q и р представляются в виде двумерных интегралов свертки в плоскости (х',у'). Ин- тегрирование по z' в формуле (8.6.3) сводится к сложению ре- зультатов этих сверток для всех расстояний z' вдоль пути рас- пространения. Во всех случаях длина пути z должна рассмат- риваться как фиксированная постоянная. Поскольку в нашем анализе появились свертки, для упро- щения можно перевести анализ в частотную шкалу. Импульс- ные отклики в выражении (8.6,4), как нетрудно видеть, даются выражениями , C0SJ г / лч fc2 I 2(z-z') ^(х, у, z, z ) =^------- hs (х, у; z, z') k2 2л Й*2+У2) 2(z — z') z — z' (8.6.5)
Формирование изображения при наличии случайных сред 393 Определив соответствующие двумерные передаточные функции как Hg(xx, ХУ: 2, z') = 4-00 = ‘(2}0г5 У’ 2. z')exp[j(xxx + xyt/)]dxdt/, (8.6.6) -оо используем соотношение преобразования Фурье 4-00 J J ехр {/а (х2 4- у2)} ехр {/ (ххх 4- хгг/)} dx dy = — оо 4Л/ ( . Ху 4- %у ) v = —-ехр{ —/ 4—-} (8.6.7) и совместно с подстановкой а = к/[2(z — z')] найдем следую- щие выражения для передаточных функций, представляющих интерес: Г (%2Х + / 1 Hz(xx, ху; z, z) = k sin ----=—~(z — z ) , |-f2+2\ 1 <8-6-8) , - I (xv 4- Xy) . Hs (xx, xy; г, z ) = k cos I -—-z—- (z — z ) . Теперь мы можем, пользуясь фундаментальным соотноше- нием (3.3.12), описывающим прохождение случайного про- цесса через линейные инвариантные системы, связать двумер- ные спектры мощности q и р с двумерным спектром мощности Fn флуктуаций показателя преломления. Результат таков: ЛД«х. «г: 2- 2') = |Нх(хх, ху; z, z')\2Fn(bx, ху; г') = Г „,2 Я — L 2k j п Y' у (8 6 9) FP(xx, 2- 2') = |Hs(xx, xy; z, 2')|2Fn(xx, xr; z') = Г „2 T где = (k2x + x^)1/2 есть радиальное волновое число в пло- скости (хх, Ху). На рис. 8.19 представлен график зависимости | Нх |2 и | Нs (2 от нормированного расстояния (x?/2nfe) (z — z') между турбулентным слоем в плоскости zr и апертурой коллектора в плоскости г. Эти кривые показывают, как флуктуации Mi,
394 Глава 8 имеющие волновое число xt и происходящие в плоскости г', преобразуются в флуктуации логарифмической амплитуды и фазы волны, падающей на апертуру коллектора системы, фор- мирующей изображение. Заметим, что флуктуации с волно- вым числом xt дают максимальный вклад во флуктуации лога- 1н/ 1Н/ Рис. 8.19. Фильтрующие функции для отдельного турбулентного слоя. рифмической амплитуды %, если расстояние г — zr удовлетворяет условию г-г' = (2п+1)-^-, n = 0, 1............ (8.6.10) тогда как максимальный вклад в флуктуации фазы имеет ме- сто, если z —z' = 2wi-^-, п = 0, 1, ... . (8.6.11) Существует очень тесная связь между результатами, представ- ленными на рис. 8.19, и так называемым эффектом Тальбота, или самоотображающими свойствами периодических решеток [8.27]. Хотя мы нашли вклад определенного турбулентного слоя, локализованного в плоскости zf, во флуктуации логарифмиче- ской амплитуды и фазы, интересующие нас, мы еще не рас- сматривали задачу сложения вкладов всех турбулентных слоев при всех возможных расстояниях г — z'. Простое интегрирова- ние функций Fq и Fp по zr дало бы правильные результаты только в том случае, если бы длина корреляции турбулентно- сти в направлении zr была равна нулю. Но это условие не выполняется, и поэтому необходим более тщательный анализ. Если мы рассмотрим два случайных процесса % и q (или и р), связанных между собой формулами (8.6.3), то нетрудно показать (в качестве упражнения), что автокорреляционные
Формирование изображения при наличии случайных сред 395 функции величин % и имеют вид Гх(Дх, Ду; 2) = ] j Г?(Дх, Ду; г, s', z")dz' dz", \ (8.6.12) Ts(Ax, Д#; z)= Гр(Дх, \у\ z, г', z")dz' dz", о где Г? и Гр — взаимные корреляционные функции величин <?(х, г/, z, z') и q(x, у, г, z") в первом случае и величин р(х, у, г, zr) и р(х, у, г, z") во втором случае. Выполнив преобра- зование Фурье обеих частей равенства (8.6.12) по переменным Дх и \у, получим соотношения Fx(xx, ху; г)= Fq(ux, ху; z, z', z")dz' dz", °г (8.6.13) Fs(*x> «у! 2)= jj j ^p(xx> z> z'> z")dz'dz", 0 где Fq и Fp — взаимные спектральные плотности величин q(x, у, z, z') и q(x, у, z, z"), с одной стороны, и величин р\х, у, Z, г') и р(х, у, z, г") — с другой. Воспользуемся здесь фундаментальным соотношением (3.5.8), описывающим прохождение взаимных спектральных плотностей через линейные инвариантные фильтры, примени- тельно к выражениям (8.6.8) для используемых передаточных функций и напишем F%(^ z) = -5И>2Ц-3-<г- Fs(xz; z) = z') sin — J L 2k z")j Fn (Kt;z'—z")dz'dz", (8.6.14) (* (* ~ I Xj I I X” I j j k2 cos ~^(z — z') cos —^(z — z") Fn(Kt; zf — z")dz'dz", 0 и Fn — взаимная спектральная плотность флуктуаций показа- теля преломления в плоскостях z' и г", причем для простоты предполагалась изотропность в поперечном направлении.
396 Глава 8 Далее воспользуемся тригонометрическими тождествами . Г sin — Г sin —— (г — г") L 26 lx; 1 I = — cos —г- (г" — г )--cos (2г — г" — г ) 2 I 2k v J 2 L 2k Г x2 I г x2 1 cos -Л- (г — г') cos (г — г") = L 2k J L 26 v J 1 Г х? 1 1 Г = — cos —- (г' — г") Н-cos —- (2г — г" — г ) 2 L 2k v 'J 2 L 26 7 (8.6.15) (8.6.16) Подставим эти выражения в формулу (8.6.14) и произведем замену переменных £ = г' — г", 2т] = г' + z". Новая область Рис. 8.20. Область интегрирования. интегрирования в плоскости (£, т]) показана на рис. 8.20. С уче- том симметрии подынтегрального выражения по переменной £ приведем выражения для Fx и F$ к виду г) Fs(*t‘, z) - г ~ /%2 \г-|3|/2 = (fc)2 \ dgF„(xz; |) cos 1-^-g I \ di] + -г К2к 7 +151/2 г г-1 {1/2 г 2 -1 =F k2 diFn(%t; I) drjcos I-^-(2z — 2т])1. (8.6.17) -г +|51/2 Вычисляя интегралы, получаем Fz(xz; z) ) _ с - =^2 Fn(*t'A)X Fs (х/5 г) ) J2 x[(z-|£|)cos-^±-^- sin-^^T^sin^-(2z-lg|)]dg. (8.6.18)
Формирование изображения при наличии случайных сред 397 Здесь необходимы дополнительные приближения. Сначала учтем то обстоятельство, что взаимная спектральная плотность g) быстро уменьшается до нуля при значениях g, превы- шающих 1/х/. Это следует из предположения об изотропном распределении флуктуаций показателя преломления, ибо такое распределение означает отсутствие корреляции между синусои- дальными компонентами с одинаковыми волновыми числами в двух плоскостях, разделенных в направлении оси расстоянием, превышающим обратную величину рассматриваемого волнового числа. Поскольку вклад дают в основном значения g, не пре- вышающие 1/х/, в эффективной области интегрирования мы имеем где последнее неравенство следует из того, что внутренний мас- штаб /о намного больше длины волны Л. Кроме того, нас ин- тересуют структурные функции только при тех значениях аргу- ментов, которые малы по сравнению с полной длиной пути L. Поэтому имеем 1/х/ 1. Далее, согласно доказанному ранее, существенная область значений g удовлетворяет условию g 1/х/. Отсюда следует, что g^//x/<;l/L и, значит, L—(l/2)tt L. С учетом всего этого могут быть написаны сле- дующие приближенные равенства: cos —— 1, sin ——, 2k 2k 2k . к2 (2z — g) # %2tz sin-------=-----sin . 2k k (8.6.20) Заметим также, что вследствие быстрого убывания функции Fn(x/; g) с ростом g пределы интегрирования в формуле (8.6.18) могут быть взяты равными бесконечности. После этих упроще- ний получим Л(х,; z) ) Г- k3 Р 3 [ = p2z + —sin-y \ Fn^t‘A)dl. (8.6.21) Fs(*t, г) ) L k J J b —oo И наконец, введем соотношение между двумерной взаимной спектральной плотностью ЛДхг; g) и трехмерным спектром Фп(хх, ху, xz). В силу основных определений имеем (зада- ча 8.10) 4-00 Ф/1 («X, «г, «г) = 5 Fn(xt; g)cosxzgdg. ' (8.6.22)
398 Глава 8 Отсюда следует, что ОО jj 1М1 = лФл(хх, Ху, 0). (8.6.23) о В случае изотропной турбулентности ф„ (хх, Ху, xz) = Ф„ (д/4 + Ху + х2 ), (8.6.24) и отсюда Фи(хх, ху, 0) = Фп(х/). Таким образом, мы пришли к окончательным выражениям для спектров мощности логариф- мической амплитуды и фазы: k xiz \ 1-----— sinT Ф"Н k / - 2 . (8.6.25) 1 4- — sin 1 Ф„ (хД utz k / Выражения (8.6.25) представляют собой главный результат нашего анализа. Они позволяют нам определить относитель- ные величины флуктуаций / и в зависимости от длины пути z и волнового числа х/. Функции Fy (x/; г) = ztk2z Fs(Kt; z) = nk2z | (xz; z) |2 = nk2z (1------------n- sin -4- \ Ktz k , - 2 ч (8.6.26) 9 -9 ( I l^s(xo z)\2 = Kk2z{ 1 +~у- sin . \ KfZ k / называют фильтрующими функциями для логарифмической ам- плитуды и фазы. Они отличаются от ранее введенных фильт- Рнс. 8.21. Фильтрующие функции для логарифмической амплитуды и фазы в случае расширенной турбулентной области (зависимость от волнового числа).
Формирование изображения при наличии случайных сред 399 Рис. 8.22. Фильтрующие функции для логарифмической амплитуды и фазы в случае расширенной турбулентной области (зависимость от рассстояння). рующих функций (8.6.8) тем, что относятся к полному инте- гральному пути распространения, тогда как предыдущие функ- ции применялись только для отдельного турбулентного слоя на расстоянии z — zr от оптической системы. Форма фильтрующих функций для логарифмической ампли- туды и фазы показана на рис. 8.21. Там же показана общая форма спектра мощности показателя преломления Фл. На этих графиках величину z можно считать параметром, а х<— теку- щей переменной. Как нетрудно видеть, флуктуации логарифми- ческой амплитуды мало чувствительны к флуктуациям пока- зателя преломления при малых волновых числах (масштаб большого размера), тогда как чувствительность флуктуаций фазы здесь максимальна. Другой точке зрения соответствует рис. 8.22. Здесь величина х< играет роль фиксированного параметра, а г —текущая пе- ременная. Эти кривые показывают, как изменяется относитель- ная роль флуктуаций логарифмической амплитуды и фазы в за- висимости от длины пути z. При очень коротких длинах пути (z <С л£/х?) флуктуации логарифмической амплитуды прене- брежимо малы и существенны лишь флуктуации фазы. При больших же длинах пути (z лй/х?) флуктуации логарифми- ческой амплитуды и фазы почти одинаковы. Заметим, что при определенном расстоянии z = nk!nt фазовые решетки на даль- нем конце пути (zr = 0) создают чисто амплитудный эффект, тогда как фазовые решетки на ближнем конце пути (z' = z) создают чисто фазовый эффект в этой плоскости. Следователь- но, при этом значении волнового числа вдоль пути распростра- нения создается равная «смесь» амплитудных и фазовых эф- фектов.
400 Глава 8 Наша конечная цель здесь — найти выражение для ОПФ, усредненной по большому промежутку времени, на основе об- щей теории. В силу формулы (8.5.22) форма этой ОПФ зависит целиком от формы волновой структурной функции D(r) = = Dx(r)+ Ds (г). Структурные функции Dx и Ds связаны с соответствующими спектрами мощности и Fs соотношениями со £>х (г) = 4л [ 1 — /0 (х(г)] Fx (xf, г) xt dnt, °„ (8.6.27) Ds (г) = 4л [ 1 — /0 («/)] P's («<; г) х, dxt. о Таким образом, полная волновая структурная функция имеет вид со D(r) = 4л [1 — /о(х^)] (V. г) + Fs (х#; г)] х< dxt = о = 8n2k2z J [1 -J0(xtr)]®n(Kt)*tdnt. (8.6.28) о Подставив сюда колмогоровский спектр (8.4.14), получим сле- дующее выражение для волновой структурной функции: D(r) = 8л2(0,033) Л2гСл [1 — Д(х(г)] хГ8/3йхс (8.6.29) о С учетом интегрального тождества [8.12] -4(*)]*-₽^ = л{2РГ2(-Ц^!-) sin["(p~ ° ]}' (8.6.30) о 1 < р < 3, приходим к окончательному результату D(r) = 2,91£2zC2r5/3- (8.6.31) точно совпадающему с тем, что было получено в предыдущем параграфе в результате более простого анализа. Таким образом, формы ОПФ, представляемые выражениями (8.5.40) и (8.5.41), остаются правильными и при более общем анализе. Основную причину, по которой результаты упрощенного ана- лиза носят столь общий характер, можно увидеть из рассмот- рения выражений для фильтрующих функций для амплитуды и фазы (8.6.26). При очень малых длинах пути, при которых
формирование изображения при наличии случайных сред 401 применим упрощенный анализ, мы имеем | |2 « О, 1|2 ~ nk2z. Именно в этом случае мы пренебрегли амплитудными эффек- тами и оставили только фазовые эффекты. Но более общие результаты показывают, что при любой длине пути (удовлетво- ряющей единственному требованию, чтобы был применим ме- тод малых возмущений) волновая структурная функция зависит от суммы двух фильтрующих функций, а эта сумма равна л/г2г, — т. е. точно тому же значению, что и описываемая фа- зовой фильтрующей функцией в случае короткого пути. Сле- довательно, поправки к амплитудной и фазовой фильтрующим функциям, необходимые в случае большого пути, взаимно унич- тожаются при сложении двух передаточных функций! Мы приходим к выводу, что выражения для атмосферной ОПФ при длительной экспозиции, полученные в § 5, п. Б, при- годны при более общих условиях, чем предполагалось в пер- воначальном анализе. Б. Влияние плавных изменений структурной ПОСТОЯННОЙ Сп Теперь найдем выражение для усредненной по большому про- межутку времени ОПФ, аналогичное выражению (8.5.41), но пригодное в случае, когда интенсивность турбулентности мед- ленно изменяется вдоль пути распространения. Такие измене- ния часто встречаются при распространении световой волны в атмосфере и особенно заметны при вертикальном наблюдении через атмосферу. Мы проведем приближенный анализ, но он дает те же конечные результаты, что и более точное исследо- вание. После того как будет получен основной результат, мы укажем на главный недостаток этого анализа и затем объяс- ним, почему этот недостаток несуществен при вычислении рас- сматриваемой здесь ОПФ. Для более полного изучения данной задачи отсылаем читателя к.литературе [8.12, гл. 8]. Медленный и плавный характер изменений интенсивности турбулентности позволяет использовать «квазиоднородную» модель структурной функции флуктуаций показателя прелом- ления ^(г1.гг)=ч(14^)1г1-г!Г' <8-6-32’ если /ор1 — г2| < £0. В этом выражении неявно предполагает- ся, что значительные изменения величины С2 могут иметь место только на расстояниях, сравнимых с Lq или больших.
402 Глава 8 Наша приближенная модель предполагает, что атмосфера может быть разделена на ряд слоев толщиной Аг вдоль пути распространения и что при достаточно большой их толщине флуктуации логарифмической амплитуды и фазы, вносимые раз- ными слоями, в хорошем приближении можно считать некор- релированными. Такая модель позволяет нам представить вол- новую структурную функцию после прохождения N слоев в виде суммы N волновых структурных функций, связанных с отдель- ными слоями: D (г) = £ Dt (г). (8.6.33) ы Если Zi — значение координаты z в середине r-го слоя, то мы можем на основании выражения (8.6.31) для отдельных слоев написать n D (г) = 2,91£2 £ (г<) Дгг2/3- (8.6.34) Если мы теперь далее предположим, что величина С2п изме- няется медленно по сравнению с длиной Аг, то конечная сум- ма может быть заменена интегралом по пути распространения, и это приводит к выражению z D (г) = 2,91£2г5/3 J С2п (?) dl, (8.6,35) о где г —полная длина пути. Окончательное выражение для ОПФ при длительной экспозиции принимает вид [формула (8.5.41)] J Сп (I) (Q) = ехр - 57,4 -°--_1/3-— &5/3 (8.6.36) Недостаток метода, которым выведен данный результат, в том, что мы пренебрегаем турбулентностью масштаба, превы- шающего внешний масштаб Ло. Спектр турбулентности макси- мален при малых волновых числах (большие масштабы), но, приняв, что флуктуации показателя преломления, создаваемые всеми слоями, некоррелированы, мы пренебрегли наличием этих крупномасштабных неоднородностей. Тем не менее полу- ченный нами результат точно согласуется с полученным при бо- лее прямом анализе, упомянутом выше. Дело в том, что та конкретная величина, которую мы вычисляем (т. е. волновая структурная функция), нечувствительна к крупномасштабным турбулентным структурам. Такие структуры не дают ни значи- тельных изменений амплитуды, ни значительных изменений
Формирование изображения при наличии случайных сред 403 разности фаз на апертуре системы, формирующей изображе- ние, а поэтому и мало влияют на волновую структурную функцию. Найдя форму волновой структурной функции в случае, ко- гда структурная постоянная изменяется вдоль пути распростра- нения, мы можем задать вопрос изменения. Для горизонтального формирования изображения не существует определенной анали- тической формы, так как эти из- менения сильно зависят от ло- кального рельефа и от «розы ветров». При вертикальном же наблюдении изменения величины Сп еще зависят от атмосферных условий во время эксперимента, но существуют аналитические приближенные выражения для Сп'- Одоно из НИХ таково [8.28]: С2„© = 4,2- 10-14Г‘/3Х Хехр(-^), (8.6.37) о том, какой вид имеют эти Рис, 8.23. Зависимость структур- ной постоянной С2п от высоты. Сплошная линия — для иочиых ус- ловий, штриховая линия—для дневных условий. где £0 = 3200 м. На рис. 8.23 по- казана типичная зависимость Сп от высоты над поверхностью Земли. Как нетрудно видеть, ин- тенсивность турбулентности уменьшается с увеличением высоты вследствие уменьшения тем- пературных флуктуаций на больших высотах. Некоторое уве- личение Сп наблюдается в области тропопаузы (вблизи h = = 10 км). В. Атмосферный диаметр когерентности г0 Искажающее влияние атмосферы на изображение удобно ха- рактеризовать параметром г0, введенным Фридом [8.29]. Пре- жде чем давать его определение и объяснять его значение, рас- смотрим сначала какую-либо конкретную меру разрешения, достигаемого системой, формирующей изображение. Предположим, что передаточная функция <Э^(Й) описывает свойства конкретной системы изображения. Далее примем, что Ж (Q) — действительная и циркулярно-симметричная перемен- ная (это выполняется во всех примерах, рассматриваемых нами
404 Глава 8 здесь). Поскольку Ж(0)= 1, мерой разрешения, обеспечивае- мого системой, может служить интеграл от передаточной функции со = J QM(Q)dQ. (8.6.38) о Будем рассматривать конкретный случай, когда изображе- ние создается при длительной экспозиции через атмосферу со- вершенной системой, имеющей круглый зрачок диаметром Dq. Полная усредненная ОПФ в этом случае принимает вид ^(Q) = ^0(Q) ехр Jc*(£)d£ I - 57,4 ----Q5'31 ’ Х1/3 ) (8.6.39) где (Q) —ОПФ системы в отсутствие атмосферы: «0(Si)=p[arc“sU)-^V^7CE)’] при \0 в других случаях (8.6.40) и Qo = £>0/Х— частота обрезания (в герцах на радиан) опти- ческой системы. Наша задача теперь — вычислить по формуле (8.6.38) разрешение 5?, используя полученное выражение для передаточной функции. Выполнив замену переменных и = Q/йо = XQ/Do, преобра- зуем требуемый интеграл к виду ^=4Ш J и [arccos и — и V1 — и2] X I г X ехр | - 57,4 -5—^5------(у-)5/3 № f du. (8.6.41) Теперь введем параметр г0, который будем называть атмосфер- ным диаметром когерентности. По причинам, которые станут вскоре ясны, параметр г0 определяют следующим образом: г0 А 0,185 (8.6.42) _ о
Формирование изображения при наличии случайных сред 405 С использованием параметра г0 выражение (8.6.41) примет вид 1 31 = 4 (и [arccos и — и^\ — и2] ехр |— 3,44 ГZ u5/3| du. J J l \ ''0 / J (8.6.43) Этот интеграл был рассчитан -шс?енно Фридом [8.29] при раз- ных значениях D$/r$. Полученные им результаты представлены на рис. 8.24. Заметим, что при Dq/tq <С 1 разрешение 31 увеличивается как квадрат величины Dq/tq, тогда как при Dq/tq 1 оно стремится к горизонтальной асимптоте, соответствующей значению ^макс. Эти две асимптоты пересекаются при Dq = г0, что и дает основание для введения величины г0- Таким образом,параметр г0 может служить мерой диа- метра когерентности атмо- сферы. Разрешение дифрак- ционно-ограниченной систе- мы, работающей при дли- тельных экспозициях, повы- Рнс. 8.24. Зависимость нормированного разрешения Я/& макс от нормированного диаметра DQ/rQ оптической системы, фор- мирующей изображение, в случае дли- тельно экспонированного изображения [8.29]. шается с увеличением апертуры, пока ее размер не достиг- нет приблизительно значения г0, после чего разрешение остает- ся почти постоянным. Параметр г0 упрощает выражения для атмосферных передаточных функций и делает более понятным ход их изменения. Типичные значения г0 для хорошей высокогорной астроно- мической обсерватории могут составлять от 5 см в условиях довольно плохой видимости до 20 см в условиях исключительно хорошей видимости. Среднее значение в условиях хорошей ви- димости— примерно 10 см. Значительно меньше значение г0 в случае горизонтальных путей формирования изображения. Г. Структурная функция для сферической волны В случае астрономических объектов, наблюдаемых с Земли, предположение о том, что любая отдельная точка объекта ге- нерирует плоскую волну, падающую на атмосферу, является достаточно точным. Поэтому результаты предыдущих разделов, относящиеся к распространению плоских волн, оказываются в этой ситуации непосредственно применимыми. Однако в
406 Глава 8 большинстве других приложений такое предположение может быть сомнительным. В случае систем, которые создают изобра- жение объектов, находящихся в пределах земной атмосферы (например, при формировании изображений в горизонтальном направлении или при формировании изображения объектов, на- блюдаемых по вертикали сверху вниз), уже нельзя пренебрегать Рнс. 8.25. Распространение сферической волны. сферичностью идальных волновых форм, генерируемых отдель- ной точкой объекта (рис. 8.25). Выражения для дисперсии логарифмической амплитуды и фазы сферической волны, распространяющейся через случайно неоднородную среду, были получены Татарским [8.12, гл. 9]. Волновая структурная функция для этого случая была впер- вые найдена Фридом [8.28] на основе результатов, полученных Шмельтцером [8.30]. Мы не воспроизводим здесь весь анализ, но приведем лишь его результаты. В случае распространения сферической волны волновая структурная функция дается выражением z D (г) = 2,91 (fe)2r5/3 $ (|)5/3С2 (£) dl. (8.6.44) о Если структурная постоянная Сп не зависит от расстояния, прой- денного вдоль луча, то D(r) = -|-[2,91fe2C^r5/3], (8.6.45) что отличается от результата для плоской волны постоянным множителем 3/8. Как и ранее, ОПФ атмосферы при длительной экспозиции связана со структурной функцией соотношением ^£(Q) = exp{-yD(M2)}. (8.6.46)
Формирование изображения при наличии случайных сред 407 § 7. ОПФ при короткой экспозиции Наш анализ атмосферной ОПФ ограничивался случаем фор- мирования изображений при временах интегрирования, намного больших, чем характерное время флуктуаций деформаций вол- нового фронта, вызываемых атмосферой. Непрерывная эво- люция независимых реализаций атмосферных возмущений во время экспозиции позволила нам для получения ОПФ, усред- ненной по времени, использовать усреднение по ансамблю. Те- перь мы перейдем к вопросу о влиянии атмосферных неодно- родностей на изображения, получаемые при временах интегри- рования, которые малы по сравнению с характерным временем флуктуаций в атмосфере. А. Длительные и короткие экспозиции Апертура системы Рис. 8.26. Зоны выходных зрачков, вносящие вклад в составляющую интенсивности с пространственной частотой v = s/Af. пути формирования изобра- Какое время экспозиции следует считать при формировании изображения большим, трудно определить точно. Первая при- чина трудностей в том, что необ- ходимое время интегрирования зависит от конкретных атмосфер- ных условий, имеющихся в пе- риод формирования изображе- ния. Вторая — в том, что это вре- мя зависит от интересующих нас пространственных частот. Если принять гипотезу «замороженной турбулентности» (Тейлора), то можно предположить, что иска- жения изображения вызываются фиксированными распределения- ми возмущений показателя пре- ломления, «дрейфующими» вдоль жения под влиянием местных ветровых условий. Рассмотрев пространственную частоту, соответствующую фиксированному расстоянию s = Xfv в апертуре системы, формирующей изо- бражения, мы увидим, что вклад в эту конкретную про- странственную частоту дает только ограниченная часть апер- туры, а именно заштрихованная зона на рис. 8.26. В случае высоких пространственных частот эта часть апертуры мала и достаточно сравнительно короткого времени, чтобы заданный набор деформаций волнового фронта сместился из этой обла- сти и был заменен новыми деформациями. При более низких же пространственных частотах часть апертуры, вносящая вклад, становится больше и поэтому требуется больше времени для смены деформаций.
408 Глава 8 Чтобы указать, какое время требуется для того, чтобы обес- печивалась точность модели длительной экспозиции, необходи- мо определить временные спектральные плотности мощности, связанные со всеми нужными нам частотными компонентами изображения. На практике часто принимают (впрочем, совер- шенно необоснованно), что время экспозиции должно быть зна- чительно больше 0,01 с. Во многих случаях модель длительной экспозиции оказы- вается неприменимой. Например, кинокамера, установленная на астрономическом телескопе, может работать при времени экс- позиции кадра, меньшем 0,01 с, если только достаточно велика яркость исследуемого объекта. ФРТ и ОПФ, отвечающие изображениям, полученным при короткой экспозиции, заметно отличаются от соответствующих функций при длительной экспозиции. Как показано на рис. 8.27 (см. также рис. 8.12), ФРТ для длительно экспонируемого изо- бражения—плавная и широкая функция, а соответствующая ОПФ — плавная и узкая. В случае же короткой экспозиции ФРТ — зубчатая и суженная, тогда как соответствующая ОПФ обнаруживает значительные флуктуации как величины, так и фазы при изменении пространственной частоты. ОПР МПФ фрт Vy)[ Рнс. 8.27. Типичные функции размытия точки и передаточные функции для изображений, полученных при разной экспозиции, а — длительная экспозиция; б — короткая экспозиция. Цъу) а
Формирование изображения при наличия случайных сред 409 Одной из наиболее важных особенностей коротко экспони- рованных изображений является то, что их качество не зави- сит от наклонных компонент волнового фронта. При наклоне падающего волнового фронта просто сдвигается центр изобра- жения, но не оказывается другого влияния на изображение. Если по изображению требуется определить распределение яр- кости объекта, но не его абсолютное положение, то этот на- клон не имеет значения. В случае же длительно экспонируе- мого изображения изменение наклона падающего волнового фронта приводит к уширению ФРТ и сужению ОПФ. Так как в случае короткой экспозиции структура ОПФ но- сит статистический характер, мы можем вычислить лишь неко- торые стастистические ее характеристики. В п. Б мы найдем усредненную ОПФ для формирования изображения при корот- кой экспозиции, причем усреднение будем проводить по ан- самблю реализаций атмосферных неоднородностей. Б. Вычисление усредненной ОПФ при короткой экспозиции Вычисления мы будем проводить, близко следуя работе Фрида [8.29]. ОПФ отдельного коротко экспонированного изображе- ния может быть записана в виде выражения (8.5.2), которое мы воспроизведем здесь: (v«, vo) = 4-00 У) ₽’ (* — Afvv, у - Xfvи) ехр {(х, + Х2) + / (si “ $2)} dx аУ __ — оо . _____— И I р (*, у) I2e2z dx dy (8.7.1) Усреднение числителя и знаменателя в этом выражении по от- дельности привело к нашему предыдущему выражению для длительно экспонированной ОПФ. Теперь мы хотим учесть то, что наклон волнового фронта не влияет на качество изображе- ния в случае короткой экспозиции. Таким образом, нам нужно исключить наклон волнового фронта из фаз $! и S2 в выраже- нии (8.7.1), а затем выполнить усреднение. Пусть S(x, у)— фаза в точке (х, у) апертуры коллектора изображающей оптики. Нам нужно найти методом наименьших квадратов плоский волновой фронт, наиболее приближающийся к S(x, у), и вычесть фазу, связанную с этим плоским фронтом, в результате чего мы получим распределение фазы» не завися- щее от наклона.
410 Глава 8 Линейную составляющую фазы S(x, у) представим в виде ахх + aYy. Выберем ах и aY для любой заданной функции S(x,y) таким образом, чтобы минимизировать квадратичную ошибку 4-00 А = j $ Р (х, t/) [S (х, у) — (ахх — aYy)]2 dx dy, (8,7.2) считая оптическую систему безаберрационной и неаподизиро- ванной. Прежде чем выполнять минимизацию, несколько упро- стим выражение для А: А = Р(х, y)S2(x, у) dx dy — 2 ^Р(х, y)(axx+aYy)S(x, у) dxdy+ + ^\(ахх + агУ)2Р(х, y)dxdy. (8.7.3) Легко показать, что в случае системы с круглой прозрачной апертурой диаметром Dq последний член может быть приведен к виду лОо(ах + ay)/64. Далее мы найдем частные производ- ные дк/дах и d\/daY и положим их равными нулю. Изменяя порядок выполнения операций интегрирования и дифференци- рования и решая полученные уравнения относительно ах и ау, находим 4-00 <*Х = ^4 S 5 хР s у)dx йУ' О —оо 4-00 ау ( уР (х, у) S (х, у) dx dy nD2 J J u —oo (8.7.4) в соответствии с методом наименьших квадратов. Тот факт, что ах и aY являются линейными функционалами фазы S(x,y), означает, что в случае гауссовского распределения фазы S оба коэффициента наклона также являются гауссовскими случай- ными переменными. Если исключить наклон волнового фронта из распределения фазы по апертуре системы, формирующей изображение, то чис- литель выражения (8.7.1) для ОПФ может быть записан в виде 4-00 Числ. = dx dyP (xb t/J P* (x2, y2) X — oo X exp {(X| 4- X2) 4- 7(5, — djX, — Oy//i) j (S2 йхх2 агУч)}> (8.7.5) где (xb уд = (x, у), (x2, y2) = (x — Xfvy, у —
Формирование изображения при наличии случайных сред 411 Теперь нам нужно усреднить это выражение по ансамблю не- зависимых реализаций атмосферных возмущений. При прове- дении требуемых усреднений следует учесть, что, поскольку ве- личины S, ах и aY являются гауссовскими случайными пере- менными, такими же являются и величины (Si — ахх{ — aYyi) И (S2 — ах%2 — ^уУ2)‘ Чтобы упростить вычисление рассматриваемых средних, мы прибегнем теперь к следующим предположениям. 1. В любой точке (х, у) величина S (х, г/)— ахх — aYy пред- полагается некоррелированной с ах и ау (а поэтому благодаря гауссовскому распределению не зависящей от них). Иначе, мы предполагаем, что отклонение поверхности S от наклоненной плоскости не зависит от величины наклона. Детальный анализ [8.31] показывает, что это верно в каком-то приближении, но не совсем точно. 2. Разность (Si — axXi — aYy) — (S2 — ахх2 — aYy2) фаз, оставшихся после исключения наклона, не зависит от суммы логарифмических амплитуд (%i + %2). Так как ранее мы уста- новили [формула (8.5.10)], что (%i + %г) и (Si — S2) незави- симы^ здесь мы по существу предлагаем, что E[(ax^fvu + + aYKfvv) (xi + Х2)] = 0. Это свойство снова должно рассмат- риваться как приближенное. Если теперь при вычислении среднего значения знаменателя ОПФ изменить порядок выполнения операций усреднения и ин- тегрирования, то в результате останется вычислить среднее значение экспоненциального множителя в выражении (8.7.5). Используя предположение 2, приведенное выше, с помощью формул (8.5.19) и (8.5.14) найдем £ (ехр [(х, + х2) + / (5i — axxt — aYyi) — j (S2 — axx2 — aYy2)]} = = exp|— yDx(Xfvy, Xfvv) — — 2" [(5> axxi — ауУ1) — (5г axx2 aY&2)l ) • (8.7.6) Это выражение упростим, пользуясь тождеством [(Si axXj ayyi) — (S2 ахх2 Ду£/2)] = = {(Sj — S2) + (axhfvu + aY^fvv) + + 2 [(Si ауУ]) — C$2 axx2 — ЯуУг)! X X [^x^Nt/ + flyVvd}- (8.7.7) В силу предположения - 1 вместе с дополнительным предполо- жением о том, что сдвиг фазы относительно наклонной плоско- сти подчиняется симметричному распределению, среднее
412 Глава 8 последнего члена равно нулю, и мы получаем £ {ехр [(xi + Х2) + ! (-Si — ax*i ~ ^У\) — j (S2 — ахх2 — aYу2)]} = = ехр {—(hfvu, Mvy) -|- -g"Vy -}- , (8.7.8) где снова D = Dx + Ds — волновая структурная функция. В этом месте для упрощения результатов мы снова, на этот раз в явной форме, обращаемся к предположению об изотроп- ном характере турбулентности (такое предположение уже де- лалось неявно выше при формулировке предположения 2). В дополнение к этому мы принимаем, что оптика системы, фор- мирующей изображение, имеет круглый зрачок; это позволит нам представить результаты в виде функции радиальной часто- ты v = (v^ + Vy)1/2. Выражение для среднего значения коротко экспонированной ОПФ атмосферы принимает вид Ms (v) = ехр {у D (Xfv) + 4 (W S + 4)} (8.7.9) Среднее значение величины а?х -ф было вычислено Фри- дом [8.32]. Его вычисления сложны, и мы их здесь не воспро- изводим. Результат таков: (Xfv)2(4 + ^) « 6,88а(-^)5/3(^-)‘/3, (8.7.10) где а принимает значение, равное единице, для распростране- ния в области «ближнего поля» (применимое в случае, когда существенны только фазовые эффекты) и значение 1/2 для распространения в области «дальнего поля» (применимое, когда одинаково существенны и амплитудные и фазовые эффекты). Величина г0— это снова атмосферный диаметр когерентности (§ 6), a Do — диаметр входного зрачка оптической системы, формирующей изображение. Если полученные выражения подставить в формулу (8.7.9) вместе с выражением, найденным ранее для волновой струк- турной функции, то получим для коротко экспонированной ОПФ выражение следующего вида: (v) = ехр {-3,44 (-^)5/3[1 -а(^-)‘/3]}. (8.7.11) Заметим, что если параметр а положить равным нулю, то мы получим выражение, совпадающее с выражением для длитель- но экспонированной ОПФ: (v) = ехр {- 3,44 (тт-)53}- (8.7.12)
Формирование изображения при наличии случайных сред 413 Если от v здесь перейти к угловой пространственной ча- стоте Q, измеряемой в герцах на радиан *), то соответствующий результат принимает вид — ( ( W \5/3 Г ( Q (П) = ехр 3,44 ]} . (8.7.13) Это, пожалуй, самая удобная форма представления данного результата. Необходимо сделать несколько замечаний относительно пре- дыдущих результатов. Во-первых, заметим, что в случае корот- кой экспозиции средняя ОПФ, связанная с атмосферой, зависит от диаметра £>о изображающей оптики, тогда как в случае дли- тельной экспозиции результат не зависел от параметров опти- ческой системы, формирующей изображение. Причина зависи- мости от Qo в случае короткой экспозиции заключается в том, что среднеквадратичный наклон зависит от обратной величины £Н/3, как это видно из формулы (8.7.10). Таким образом, чем больше апертура, тем меньше наклонная компонента искаже- ния волнового фронта. Различие между результатами для длительной и короткой экспозиции связано с множителем [1 — a(Q/Q0)1/3]. В случае длительной экспозиции мы имеем a =0, и этот член равен еди- нице. В случае же короткой экспозиции ненулевое значение a приводит к возрастанию ОПФ, особенно когда Q приближается к Qo. В различных значениях параметра а, отвечающих слу- чаям ближнего и дальнего поля, просто находит отражение то обстоятельство, что изменение фазы, связанное с наклонной компонентой волнового фронта, ие влияет на ОПФ, а сама фаза играет меньшую роль в случае дальнего поля, чем в случае ближнего поля. В ближнем поле вся нечеткость обусловлена фазовыми эффектами, тогда как в дальнем поле только поло- вина нечеткости обусловлена фазовыми возмущениями, а дру- гая половина — амплитрудными эффектами. На рис. 8.28 представлены кривые общих усредненных ОПФ системы для телескопа с круглым зеркалом диаметром 1 м и атмосферы с г0 = Ю см. Длина волны принята равной 0,5 мкм. Кривая при а = 0 соответствует длительной экспозиции, а кри- вые при a =1/2 и a = 1 — короткой экспозиции. На том же графике показана ОПФ дифракционно-ограниченной системы при диаметре круглой оптики, равном 1 м. Как и в § 6, п. В, мы можем снова определить разрешение системы как интеграл от усредненной ОПФ [формула (8.6.38)], используя на этот раз коротко экспонированную атмосферную ОПФ. Фрид [8.29] численно проинтегрировал необходимые *) См. стр. 388, — Прим, перев.
414 Глава 8 выражения, получив результаты, представленные на рис. 8.29. Предельное разрешение при Do > г0 оказывается одним и тем же для всех случаев, поскольку наклонная компонента иска- жения волнового фронта в пределах апертуры уменьшается с Рнс. 8,28, Усредненная оптиче- ская передаточная функция для комбниацин система — атмо- сфера. Рис, 8.29. Зависимость нормирован- ного разрешения макс от норми- рованного диаметра £>/г0 оптической системы, формирующей изображение при короткой н длительной экспози- ции [8,28]. увеличением Dq. Значительно более высокое разрешение воз- можно в случае короткой экспозиции, когда Do ж г0, в част- ности, в условиях ближнего поля. § 8. Звездная спекл-интерферометрия В предыдущих параграфах мы изучали ограничения, налагае- мые на качество изображения атмосферными неоднородностя- ми, при формировании изображения оптической системой в условиях длительной и короткой экспозиции. Влияние атмо- сферы описывалось передаточными функциями, которые умень- шают пространственно-частотный отклик на высоких частотах и нередко существенно снижают разрешение системы. Теперь мы перейдем к новому важному методу сбора и обработки дан- ных, который позволяет извлечь из серии коротко экспониро- ванных изображений информацию о пространственных часто- тах, значительно больших, чем те, которые могли бы быть про- пущены рассмотренными ранее усредненными длительно и коротко экспонированными передаточными функциями. Такой метод формирования изображения предложил и впервые про- демонстрировал в астрономической обсерватории Лабейри [8.33, 8.34].
Формирование изображения при наличии случайных сред 415 В этом параграфе мы остановимся на основном принципе указанного метода и связанных с ним операциях обработки данных. В п. Б мы проведем эвристический анализ метода. Бо- лее строгий и полный анализ будет проведен в п. В. И наконец, в п. Г мы коснемся некоторых обобщений и альтернативных подходов. А. Принцип метода Рассмотрим еще раз различие в ФРТ для длительной и корот- кой экспозиции (см. рис. 8.12 и 8.27). Изображение точечного источника, полученное при короткой экспозиции, обнаруживает сложную высокочастотную структуру, часто называемую спекл- структурой, тогда как изображение точки, полученное при дли- тельной экспозиции, оказывается сравнительно плавным и ре- гулярным. Это говорит о том, что при короткой экспозиции ОПФ имеет больший высокочастотный отклик, чем при дли- тельной экспозиции, как это и видно на рис. 8.27. Отметим существенное различие между ОПФ, связанной с отдельным изображением, полученным при короткой экспози- ции, и средней ОПФ, вычисленной в § 7. Операция усреднения по ансамблю, которая приводит к последней ОПФ, подавляет высокочастотный отклик, так как на высоких частотах ком- плексные значения ОПФ могут сильно изменяться по ампли- туде и по фазе от изображения к изображению. Если бы мы собрали большое число коротко экспонированных фотографий и центрировали их все так, чтобы исключить эффекты чистого сдвига изображения от кадра к кадру, то сумма всех этих цен- трированных изображений дала бы изображение, хорошо со- гласующееся с предсказываемым нашей теорией для усреднен- ной ОПФ при короткой экспозиции, изложенной в предыдущем параграфе. Описанная выше процедура получения комбинации задан- ной совокупности коротко экспонированных изображений не яв- ляется единственно возможной. И действительно, метод, пред- ложенный Лабейри, основывается на другом подходе к про- блеме извлечения информации из таких изображений. Преиму- щества этого подхода в том, что, в то время как усредненная по ансамблю ОПФ при короткой экспозиции сравнительно быстро убывает на высоких частотах, усредненный по ансамб- лю квадрат модуля ОПФ остается отличным от нуля на зна- чительно более высоких частотах. Мы объясним это ниже, но сначала подробно изложим суть метода Лабейри. Предположим, что при помощи астрономического телескопа набирается большое число К фотографий, сделанных при ко- роткой экспозиции, некоего объекта. Чтобы предотвратить
416 Глава 8 размывание тонкой спекл-структуры изображения, обусловлен- ное потерей временной когерентности света, приходится преду- смотреть узкополосный фильтр. Полученный набор изображений далее подвергается обработке (на ЭВМ или с помощью коге- рентной оптики) следующего вида. Для каждого изображения вычисляется квадрат фурье-образа. Так, если /^(u, v)— интен- сивность, связанная с k-м изображением, то вычисляется дву- мерный фурье-образ (vi/’ vv) = П /(Л е<2Я (“V£/+UVv) du dv. (8.8.1) — оо Этот спектр изображения, конечно, связан со спектром объекта (который не изменяется от кадра к кадру) и с ОПФ (которая изменяется от кадра к кадру) обычным соотношением vv) = «™(v„, vk)yo(v„. v7). (8.8.2) где ^—фурье-образ объекта, а — ОПФ, связанная с А-м изображением. Для спектра каждого изображения вычисляется квадрат модуля, что дает серию «спектров энергии» (гл. 3) ^,(vt/’v0 = |^?)(^,vv)|2. (8.8.3) И наконец, эти спектры энергии усредняются путем их сложе- ния и деления суммы на полное число изображений К. Пред- положим, что число изображений достаточно велико и, следо- вательно, наше окончательное среднее почти совпадает со сред- ним по ансамблю от той же величины. Такая процедура дает некую оценку усредненного спектра энергии изображения, за- висящую от среднего квадрата модуля ОПФ при короткой экс- позиции, или от среднего квадрата модуляционной передаточ- ной функции (МПФ) м|2=М21 Ь’ vk) Г- (8Л4) Изложенную процедуру вычислений Лабейри и его коллеги [8.34] осуществили с помощью когерентной оптической системы типа изображенной на рис. 8.30. Изображения зарегистриро- ваны на киноленте, которая освещается когерентным излуче- нием лазера. Кинолента протягивается через оптическую си- стему, которая создает в выходной плоскости (фокальной пло- скости линзы) проинтегрированное по времени распределение интенсивности, т. е. среднее спектров энергии отдельных фо~ тографий. Поскольку усредняются спектры энергии, положения изображений внутри своих кадров несущественны, так как сдвиги изображений приводят к линейным сдвигам фаз в фурье-
Формирование изображения при наличии случайных сред 417 представлении, а данная система обработки нечувствительна к спектральным распределениям фаз. Для выполнения той же операции можно применить и цифровую ЭВМ, но из-за ограни- ченной скорости вычислений это обычно возможно лишь в тех Рис. 8.30. Когерентная оптическая система для усреднения спектров энергии набора фотографий, сделанных при короткой экспозиции. случаях, когда фотоприемниками служат фотонные счетчики, причем частота фотонных импульсов достаточно мала. Из выражения (8.8.4) явствует, что если бы мы могли вы- числить или измерить средний квадрат МПФ такой системы, формирующей изображение, и если бы эта усредненная вели- чина оставалась значительной на частотах, больших, чем те, которые присутствуют в усредненной ОПФ для короткой экс- позиции, то спекл-интерферометрия давала бы информацию об объекте, которую нельзя извлечь из отдельного изображения или из простой комбинации некоторого числа центрованных изображений, полученных при короткой экспозиции. Однако ясно также, что эта информация об объекте будет, вообще говоря, неполной, ибо при таком методе может быть получен квадрат модуля спектра объекта, а не сам комплекс- ный спектр. Как и в случае звездного интерферометра Май- кельсона, работающего в условиях атмосферной турбулентно- сти, а также в случае интерферометра интенсивностей (гл. 6, § 3), при этом информация о спектре фазы полностью
418 Глава 8 отсутствует, а потому полное изображение объекта, вообще го- воря, не может быть получено. Тем не менее такая неполная информация во многих слу- чаях может оказаться исключительно ценной. Первым приме- нением данного метода у Лабейри было измерение расстояния Рнс. 8.31. Усредненный спектр энергии, полученный на основании 120 коротко экспонированных изображений двойной звезды 9 Кормы после компенсации передаточной функции, отвечающей спекл-структуре. между компонентами двойной звезды. Особый интерес пред- ставляют те двойные звезды, компоненты которых слишком близки друг к другу, чтобы быть разрешенными с помощью теле- скопа при наличии атмосферных искажений, но которые в прин- ципе разрешимы при данной дифракционно-ограниченной апер- туре телескопа. Если мы для удобства будем рассматривать сами звезды как идеальные точечные источники, то распреде- ление их яркости можно представить функцией интенсивности вида /о (X, у) = /,д (х - Ay Z/) + /2д (х + у) , (8.8.5) где хну рассматриваются как угловые переменные, Ах пред- ставляет собой угловое расстояние между компонентами и учтено возможное различие в яркости обеих компонент. Квад- рат модуля фурье-образа этого распределения интенсивности
Формирование изображения при наличии случайных сред 419 таков: | Л ’г) Р = ('? + Is) Г I + 4Й “S (8.8.6) I 1 L 11 * * 2 1 Отметим, в частности, содержащуюся в этом распределении си- нусоидальную «интерферограмму», которая выступает как на- стоящая оптическая интерференционная структура в усреднен^ ном распределении интенсивности на выходе оптической системы обработки данных, показанной на рис. 8.30. Пространствен- ная частота этой интерферограммы однозначно связана с рас- стоянием Ах между двумя компонентами. Чтобы точно изме- рить период этой интерферограммы, потребуем, чтобы средний квадрат МПФ данной системы, формирующей изображение, имел значительную составляющую в области частот, намного больших, чем соответствующие периоду интерферограммы. Ко- нечно, возможность извлечения этой информации целиком за- висит от отношения сигнала к шуму в данной интерферограм- ме, но этот вопрос мы отложим до гл. 9. На рис. 8.31 показана экспериментально зарегистрированная интерференционная кар- тина, полученная описанным выше способом. В ряде мест мы утверждали, что средний квадрат МПФ бу- дет оставаться значительным в области частот, намного боль- ших, чем для усредненных ОПФ при длительной и короткой экспозиции. Мы изложим интуитивное доказательство правиль- ности этого утверждения, а затем перейдем к более строгому доказательству. Б. Эвристический анализ спекл-интерферометрии Почему средний квадрат МПФ при короткой экспозиции для оптической системы, действующей в земной атмосфере, сохра- няет значительную величину при относительно высоких часто- тах, можно объяснить, обращаясь к интуиции и обходясь мини- мумом математики. Речь пойдет о статистических свойствах второго порядка МПФ, причем мы будем опираться на интер- ферометрический подход к процессу формирования изобра- жения. Напомним, что для отдельного коротко экспонированного изображения определенная пространственно-частотная компо- нента, имеющая векторную частоту v, возникает в плоскости изображения за счет интерференции света от точек выходного зрачка, разделенных векторным расстоянием s = Xfv. При пе- ремещении такого вектора по всему зрачку мы накапливаем множество «элементарных» вкладов в эту интерферограмму, а возникающий контраст этой частотной компоненты зависит от относительных фаз, с которыми складываются отдельные
420 Глава 8 вклады, а также от амплитуд суммируемых интерферограмм (гл. 7, §4). Атмосферные искажения приводят к изменению интенсивно- сти и фазы света, падающего на различные части зрачка, а тем самым к изменению констраста и фаз элементарных ин- терферограмм, из которых складывается некоторая одночастот- ная компонента интенсивности. При малых пространственных частотах мы имеем дело с интервалами, которые очень малы; если рассматриваемый интервал меньше диаметра когерентно- сти атмосферы г0, то разности логарифми щских амплитуд и фаз света, падающего в точках, разделенных расстоянием s, очень малы и, следовательно, атмосферные искажения не влияют на такие частотные компоненты. Такие пространственные частоты лежат в области низких частот, соответствующей большим зна- чениям усредненной ОПФ при короткой экспозиции. Если мы теперь рассмотрим достаточно высокую простран- ственную частоту, соответствующую интервалу на зрачке, боль- шему rQ) но еще значительно меньшему, чем максимальный ин- тервал, уменьшающийся в зрачке, то различные элементарные интерферограммы будут претерпевать возмущения фазы и кон- страста и не будут полностью усиливать друг друга при сло- жении в плоскости изображения. Более того, если представить каждую синусоидальную интерферограмму комплексным фазо- ром, то последовательное добавление элементарных интерферо- грамм можно рассматривать как процесс случайного блуждания в комплексной плоскости (см. рис. 2.10). Результирующий фа- зор для любой выбранной частоты после соответствующей нор- мировки имеет комплексное значение, равное ОПФ отдельного рассматриваемого коротко экспонированного изображения на данной конкретной частоте. Построив некую модель случайных блужданий для «сред- них» пространственно-частотных компонент, мы сможем сде- лать некоторые выводы относительно статистических свойств коротко экспонированных ОПФ. Разобьем мысленно выходной зрачок нашей системы, формирующей изображение, на множе- ство независимых ячеек корреляции диаметром г0 каждая. Число таких ячеек в зрачке диаметром Do равно ^олн = (^)2- (8.8.7) Однако конкретная пространственная частота v не получает вкладов элементарных интерферограмм от всего выходного зрачка. В нее входят только вклады заштрихованных областей выходного зрачка, показанных на рис. 8.26. Обозначим пло- щадь одной из этих заштрихованных областей через a(v). Но величина a(v) точно равна числителю выражения [формула
Формирование изображения при наличии случайных сред 421 (7.2.48)] для дифракционно-ограниченной ОПФ на этой кон- кретной пространственной частоте. Следовательно, число неза- висимых ячеек корреляции, дающих вклад в эту простран- ственно-частотную компоненту ОПФ, равно (£)’ (8Л8) П I 2 ) где — дифракционно-ограниченная ОПФ оптической системы, и снова предполагается, что зрачок — круглый диаметром £>0- Зная число независимых фазоров, дающих вклад в каждую пространственно-частотную компоненту, мы можем теперь на основании известных нам свойств случайных блужданий сде- лать некоторые выводы относительно статистических свойств ОПФ. Сначала заметим, что в области средних частот, где число вносящих вклад независимых фазоров велико, в соответ- ствии с рассуждениями гл. 2, § 9, п. Б ОПФ должна быть (в хорошем приближении) круговой гауссовской случайной пе- ременной. Как следствие этого МПФ должна подчиняться рэ- леевскому распределению, а квадрат МПФ — экспоненциально- му распределению с отрицательным показателем. Это весьма информативные выводы, но мы подчеркиваем, что они, строго говоря, верны только в области средних частот, где ОПФ имеет большое число независимых случайно сфазированных вкладов. Нас здесь более всего интересует средний квадрат МПФ, поскольку именно эта величина играет решающую роль в спекл-интерферометрии [формула (8.8.4)]. Для простоты пред- положим, что длины всех фазоров, участвующих в случайном блуждании, одинаковы и равны р, причем будем считать, что величина р пропорциональна г%: Р=хф (8.8.9) Согласно изложенному в гл. 2, § 9, если опустить нормировоч- ный множитель VW в определении действительной и мнимой частей получающегося выражения, то вторые моменты действи- тельной и мнимой частей числителя МПФ будут равны 75 = i2 = y(v)-^-. (8.8.10) С учетом выражения (8.8.9) представим средний квадрат чис- лителя МПФ в виде Ч^2 = ^ + Z2 = W (v) 02 = W (v) x2r04 = (v) (-^)2 х24 (8.8.11)
422 Глава 8 В соответствии с предположениями, сделанными ранее в слу- чаях длительной и короткой экспозиции, мы считаем знамена- тель ОПФ приближенно постоянным. Заметим, что при век- торном интервале на апертуре, стремящемся к нулю, все фа- зоры в сумме полностью коррелированы, т. е. все они имеют нулевую фазу. Как следствие этого квадрат длины результи- рующего фазора точно равен квадрату суммы длин отдельных Рис. 8.32. Общая форма среднего квадрата МПФ для комбинации оп- тической системы и атмосферы. фазоров. Следуя предположе- нию (8.8.9), напишем Знам.2 = (х£>0)2- (8.8.12) Отсюда следует, что в рассмат- риваемой области средних ча- стот второй момент МПФ ра- вен Числ.2 _ Знам.2 1ВД |2 = Заметим, в частности, что в этой промежуточной области ча- стот интересующий нас второй момент прямо пропорционален МПФ дифракционно-ограниченной оптической системы, а коэф- фициент пропорциональности равен отношению квадратов г0 и Dq. Поскольку дифракционно-ограниченная МПФ имеет зна- чительную величину в этой промежуточной области частот, мо- жет быть значительным здесь и второй момент МПФ, если от- ношение Го//?о не слишком мало. На частотах, близких к верхнему пределу дифракционно- ограниченной ОПФ, площадь перекрытия на зрачке становится сравнительно малой, а потому мало число независимых фазо- ров, дающих вклад в ОПФ на таких частотах. Тем не менее анализ рассуждений гл. 2, § 9, п. Б, которые приводят к при- веденным выражениям для среднего квадрата МПФ, показы- вает, что все результаты, которые были использованы при вы- воде формулы (8.8.13), верны и при конечном числе фазоров. Хотя мы и не можем утверждать, что квадрат МПФ подчи- няется экспоненциальному распределению с отрицательным по- казателем на таких частотах, мы тем не менее можем пользо- ваться теми же самыми выражениями, что и ранее, при вычис- лении второго момента МПФ. На рис. 8.32 показаны результаты нашего приближенного анализа. Второй момент МПФ ведет себя почти также, как усредненная ОПФ при длительной экспозиции на низких часто- тах, но падает до значения, приблизительно равного (г0/Д))2, а не нулю. В этом месте поведение изменяется и функция спа-
Формирование изображения при наличии случайных сред 423 дает пропорционально МПФ для дифракционно-ограниченной оптической системы, но с масштабным множителем (го/^о)2- Этим мы завершаем наш эвристический анализ звездной спекл-интерферометрии. Теперь перейдем к более полному и более строгому анализу. В. Более полный анализ звездной спекл-интерферометрии Более полный анализ метода, изложенного в п. Б, был выпол- нен Корфом [8.35]. Мы изложим здесь этот анализ, опуская не- которые детали, с которыми можно ознакомиться в цитиро- ванной работе. Как показано в п. Б, возможности метода спекл-интерфе- рометрии основываются в значительной мере на свойствах вто- рого момента МПФ оптической системы, действующей в атмо- сфере Земли. Поэтому исходной точкой в этом более полном анализе является вычисление второго момента | Ж (v) |2- При вы- числении этой величины мы воспользуемся тем, что нам из- вестно о статистических свойствах амплитудных и фазовых флук- туаций, вносимых атмосферой. Поскольку, как было показано, знаменатель МПФ прибли- зительно постоянен, можно сконцентрировать внимание на свой- ствах числителя. В рассматриваемом случае это означает, что нам нужно найти второй момент выражения + оо Чнсл. = Р (х, у) Р* (х — Xfvu, у — kfvv) X — оо X U (х, у) U* (х — Xfvy, у — dx dy. (8.8.14) Рассматриваемый момент можно записать непосредственно в виде + оо W = р (Г) р« (г - S) Р‘ (г') Р (г' - S) X X и (г) и* (г - s) и* (г') и (г' - s) dx dy dx' dy', (8.8.15) где векторы определяются следующим образом: г ~ (х, у), ~ и изменен порядок выполнения операций усреднения и интегрирования. Выразив поле U через логарифмическую амплитуду % и фазу [формула (8.5.1)],
424 Глава 8 получим эквивалентное выражение Числ.2 = /о2 Р (г) Р‘ (Г - S) Р* (г') Р (г' - S) X X ехр {(%, + %2 + Хз + Х4) + / (^! - s2 - S3 + s4)} dx dy dx' dy', (8.8.16) S.=Se(r), S2 = Se(r — s), S3 = Se(r'), S4 = Sj (rz s). Xi = X(r) X2 = X(r- s), Хз = Х(г')> X4 = X(r'- s), Рассуждения, приведшие к равенству (8.5.10), можно обоб- щить на случай не четырех, а восьми переменных, и тогда мы придем к выводу, что средние амплитудных и фазовых членов могут вычисляться по отдельности (т. е. сумма членов, содер- жащих логарифмические амплитуды, является статистически независимой от суммы фазовых члелов). Напомним, что этот вывод основан на предположении об однородном и изотропном распределении турбулентности. Учитывая, что сумма членов, содержащих логарифмические амплитуды, и сумма фазовых членов подчиняются гауссовскому распределению, мы можем показать [с помощью выражения (8.5.14) и некоторых алгеб- раических преобразований], что Ах = ехр {%1 + Хг + Хз + Xj = = ехр [4СХ (0)] ехр [— Dx (| s |) — Dx (| г — г' |) — - | Dx (| г - г' + s |) - у Dx (| г - г' - s |)], (8.8.18) As = ехр [/ (S, — S2 — S3 + S4)] = = ехр {— Ds (| s |) — Ds (| г — г' |) + + у Ds (|г - г' + s |) + у Ds (|г - г' - s |)}. (8.8.19) Произведение величин Ах и As может быть тогда записано с помощью волновой структурной функции в виде . Ях4з = е4Сх(0»<2(г, г', s), Q(r, г', s) = exp|— D(| s |) — £>(| г — г'|) — — у D (| г — г' + s) — у D (| г — г' - s |)} X X ехр {Ds (| г - г' + s |) + Ds (| г - г' - s |)}, (8.8.20)
Формирование изображения при наличии случайных сред 425 что приводит к следующему выражению для числителя сред- него квадрата МПФ: ЧЙсл? = J J р (Г) Р* (г - s) Р’ (г') Р (г' - S) х X ехр [4СХ (0)] Q (г, г', s) dx dy dx' dy'. (8.8.21) Средний квадрат знаменателя ОПФ равен просто среднему квадрату числителя, вычисленному при нулевой частоте. Та- ким образом, имеем Знам2. = 4-со = J $ J $ 1 Р (г)|21 р (г') |2 ехр [4СХ (0)] Q (г, г', 0) dx dy dx' dy'. (8.8.22) Средний квадрат для МПФ теперь можно записать в виде l^(v)|2 = 4-00 ИИ Р (г) Р* (Г — s) Р* (rz) Р (г' — s) Q (Г, г', s) dx dy dx' dy' 4-co $ $ I p w I21 p (f/) I2 Q (f’fz’ °)dx dy dx' d&' (8.8.23) Остается вычислить предыдущее выражение в случае, когда турбулентность (по предположению) подчиняется распределению Колмогорова. В этом случае волновая структурная функция принимает вид £>(г) = 6,88(-^-)5/3. (8.8.24) Фазовая структурная функция Ds(r) зависит от того, относятся ли условия распространения к случаю ближнего или к случаю дальнего поля: ( D(r) (ближнее поле), DS(r)= 1ЛП , , (8.8.25) ( уD(г) (дальнее поле). Предполагая, что условия ближнего поля выполняются, при- ведем выражение для Q(r, г', s) к виду Q (г, г', s) = ехр 6,88 X X ехр {— 6,88 [(А у 1 - 4 (8.8.26)
426 Глава 8 Выполнив замену переменных интегрирования Аг = г — г' ~ (Ах, Аг/), р = г + г' ~ (рх, ру), (8.8.27) получим следующее I^(V)|2 выражение для среднего квадрата МПФ: + °о Q (Дг, s) L (Дг, s) t/Дх d&y — оо = + - — И I Р (х, у) I2 dx dy (8.8,28) где L(Ar, s) — интеграл перекрытия вида L»r. з)-^Р(4,±Г-) Р'(^£ГХ)Х (8.8.29) Корф [8.35] взял интеграл перекрытия £(Дг, s) для случая ди- Рис, 8.33. Теоретические кривые сред- него квадрата МПФ для комбинации оптической системы и атмосферы [8-35]. Частая штриховая линия — редкая штриховая линия — |Ж|2. сплошная линия— фракционно-ограниченной си- стемы с круглой апертурой, а оставшиеся интегралы рас- считал численным методом. Его результаты представлены на рис. 8.33. Предполагается, что величина г0 равна 13 см и приводимые результаты отно- сятся к телескопной оптике диаметром Z)o, равным 15 см, 1,5 м и 5 м, что соответствует отношению £)о/го, равному 1,17, 11,7 и 38,4. На том же гра- фике показаны также усред- ненные ОПФ для длительной и короткой экспозиции в тех же случаях. Сравнив рис. 8.32, где пред- ставлены результаты нашего приближенного анализа, с рис. 8.33, мы видим, что результаты приближенного анализа под- тверждаются более точным вы- числением. На низких частотах средний квадрат МПФ близко повторяет форму усредненной ОПФ при короткой экспози-
Формирование изображения при наличии случайных сред 427 ции. Изменения в поведении наблюдаются тогда, когда средний квадрат МПФ падает до значения, приблизительно равного (Z)o/ro)2; с этого момента форма кривых следует ослабленному варианту дифракционно-ограниченной ОПФ оптической системы. Именно в этой промежуточной области частот спек-интерферо- метрия дает наиболее ценную информацию. Г. Обобщения Все сказанное о спекл-интерферометрии будет неполным, если мы не познакомим читателя с другими аналогичными метода- ми. Поэтому мы кратко остановимся на некоторых сходных ме- тодах извлечения информации из серии коротко экспонирован- ных фотографий, сделанных при наличии атмосферных иска- жений. В 1971 г. МакТлэмери [8.36] попытался получить изобра- жение на основании серии искаженных турбулентностью сним- ков, пользуясь определенным методом усреднения. Его мысль заключалась в том, что если изображения на ряде фотографий подвергнуть преобразованию Фурье (в рассматриваемом слу- чае на цифровой ЭВМ) и рассмотреть распределение каждой частотной компоненты по ансамблю изображений, то средние амплитуды и средние фазы для всех компонент должны давать информацию об амплитудах и фазах спектра неискаженного объекта. Хотя эта мысль в принципе правильна, полученные результаты не оправдали ожиданий из-за того, что практиче- ски очень трудно проследить за прохождением фаз через зна- чения, равные целым кратным 2л радиан. Дело в том, что, ко- гда вычисляется средняя фаза заданной частотной компоненты, необходимо проводить усреднение по «развернутой» фазе, т. е. исключив скачки на 2л. Это очень трудно сделать, особенно при наличии типичных уровней шума. В течение ряда лет интерес привлекала к себе мысль об использовании интерферометрического аспекта процесса фор- мирования изображения для извлечения изображений из ре- зультатов регистрации при коротких экспозициях. Родс и Гуд- мен [8.37], следуя более ранним идеям Джеинисона [8.38] и Рогстеда [8.39], придумали схему такого разделения зрачка телескопа, при котором образуется сразу целый ряд тройных интерферометров. Информация, даваемая этими тройными ин- терферометрами, в принципе позволяет формировать изобра- жения без фазовых искажений, вносимых атмосферой. Эту идею проверял методом компьютерного моделирования Браун [8.40] в плане возможных приложений в солнечной астрономии. Важный шаг был сделан в 1974 г., когда Нокс и Томпсон [8.41, 8.42] предложили видоизмененный метод спекл-интерфе-
428 Глава 8 рометрии Лабейри, который позволил получать полные изобра- жения (а не просто автокорреляционные функции распределе- ния яркости объекта) на основании серии изображений, полу- ченных при короткой экспозиции. Метод названных авторов основан на том, что в пределах ансамбля изображений суще- ствуют корреляции между вносимыми атмосферой фазовыми возмущениями компонент Фурье с близкими пространственны- ми частотами. Две компоненты Фурье, разделенные в фурье- плоскости расстоянием, меньшим ro/Af, должны иметь сильно коррелированные фазовые ошибки, вносимые атмосферой, то- гда как их фазовые компоненты, даваемые объектом, могут весьма различаться. Если взять разность фаз таких компонент, то вносимые атмосферой ошибки взаимно уничтожатся и мы по- лучим не содержащие таких ошибок измеренные значения раз- ности фаз между смежными частотными компонентами объек- та. По набору разностей фаз, измеренных во всем спектре изо- бражения, можно определить соответствующий набор самих фаз. Путем соответствующего усреднения информации о мо- дуле и устранения ее влияния можно выделить часть комплекс- ного спектра объекта, лежащую в пределах ОПФ оптической системы, и получить изображение, свободное от искажений. Та- кой метод был применен Стечником и др. [8.43] для получе- ния изображений отдельных частей Солнца. Отметим также работу Уордена и др. [8.44], в которой не- сколько иначе использована спекл-структура, создаваемая ат- мосферой, для выделения изображения астрономических объек- тов. Спекл-структура в отдельном изображении точечного ис- точника, полученном при короткой экспозиции, эквивалентна ФРТ системы, формирующей изображение, в момент регистра- ции этого изображения. Если данная спекл-структура имеет один или несколько широко разнесенных максимумов, которые существенно превышают уровень окружающей интенсивности, то свертка этой ФРТ с распределением интенсивности, соответ- ствующим объекту малой угловой протяженности, может дать ряд отдельных изображений этого объекта по одному от каж- дого максимума спекл-структуры, наложенных на основной фон. Путем смещения изображения до совпадения этих «подызображений» получают изображение первоначального объекта, искаженное «средней» спекл-структурой. Затем то же самое производят с изображением точечного источника и по- лучают распределение интенсивности, отвечающее средней спекл-структуре. Далее‘путем численного решения интеграль- ного уравнения свертки устраняют влияние средней спекл- структуры и получают улучшенное изображение нужного (про- тяженного) объекта.
Формирование изображения при наличии случайных сред 429 И наконец, следует указать на то, что в последние годы огромное число теоретических и экспериментальных работ было посвящено «адаптивной оптике» — получению дифракционно- ограниченных изображений при наличии атмосферной турбу- лентности. Блок-схема оптической системы подобного рода по- казана на рис. 8.34. Датчик фронта волны — это преобразова- тель, который выделяет из поступающей волны информацию о Рис. 8.34. Блок-схема адаптивной оптической системы, формирующей изобра- жение. деформациях волнового фронта, вносимых атмосферой при рас- пространении света до оптической системы. Компьютер, ком- бинируя эти данные, вычисляет распределение ошибок волно- вого фронта, вносимых атмосферой, по зрачку оптической си- стемы, формирующей изображение. В соответствии с этим в реальном времени даются команды на деформируемое зеркало, компенсирующее вычисленные искажения, в результате чего на приемнике изображения получается дифракционно-ограни- ченное изображение. Прекрасный обзор по данному вопросу чи- татель может найти в статье [8.24]. Кроме того, этому вопросу посвящен целый выпуск журнала [8.45]. § 9. О степени общности теоретических результатов Огромное большинство полученных и изложенных здесь теоре- тических результатов основано на преобразовании Рытова. Естественно спросить, насколько общий характер носят они, по- скольку, как мы знаем, решение Рытова относится лишь к слу- чаю малых флуктуаций. Было бы ошибкой, однако, сделать вывод, что результаты, полученные на основе приближения малых флуктуаций, не могут быть верными в случае больших флуктуаций. В литературе велись многочисленные споры об области применимости решения Рытова, основанные непосредственно на
430 Глава 8 изучении величины членов, которыми пренебрегают (см., на- пример, [8.46, 8.47]). Такой критерий приводит к заключению, что ситуации, в которых приближение Рытова является точным, чрезвычайно редки. Предположения теории малых флуктуаций, как принято считать, приемлемы только тогда, когда диспер^ сия логарифмической амплитуды меньше ~0,5. Для спектра турбулентности колмогоровского типа этот критерий имеет Пид [8.4, т. 2] <4,= < 0,3. (8.9.1) Если это условие нарушено, то говорят, что распространение света происходит в условиях больших флуктуаций. Тем не ме- нее имеются экспериментальные данные [8.48, 8.49], указываю- щие на то, что по крайней мере некоторые из предсказаний теории Рытова оказываются точными в ситуациях, в которых они должны были бы быть существенно ошибочными. Понимание этой трудной проблемы прояснилось постепенно после открытия явления насыщения, наблюдающегося при рас- пространении оптического сигнала по длинному пути [8.50]. Измерения дисперсии интенсивности как функции длины пути показали первоначальное увеличение в соответствии с теорией малых флуктуаций, но в конечном счете наблюдалось насыще- ние при значении отношения дисперсии к квадрату средней ин- тенсивности, равном единице. Были предложены разнообразные теоретические методы ис- следования распространения света в случае больших флуктуа- ций: диаграммный метод [8.51], метод интегрального уравне- ния [8.52], обобщенный принцип Гюйгенса — Френеля [8.53] и метод параболического уравнения, или уравнения моментов [8.54]. Эти различные подходы изложены в обзорной статье Стробена [8.21]. Результаты этих математических исследований привели к замечательному и важному результату. Предсказания всех ме- тодов определения функции взаимной когерентности для рас- пространяющейся волны приводят к одному и тому же резуль- тату, а именно к результату, полученному нами на основе при- ближения Рытова. Таким образом, нашими формулами для оптических передаточных функций систем, формирующих изо- бражение, работающих в земной атмосфере, можно без опасе- ний пользоваться как в случае малых, так и в случае больших флуктуаций. Предсказания теорий больших флуктуаций заметно отли- чаются от предсказаний теории малых флуктуаций, если речь идет о функциях когерентности высшего порядка. Заметим, в частности, что необходимо учитывать дисперсию интенсивности, содержащую четвертые моменты амплитуды волны, чтобы объ-
Формирование изображения при наличии случайных сред 431 яснить явление насыщения, отмеченное выше. Кроме того, за- метим, что в средний квадрат МПФ, который имеет важное значение в звездной спекл-интерферометрии (§ 8), тоже вхо- дят четвертые моменты, и потому область применимости при- веденных здесь решений нельзя считать хорошо установленной. Но, по-видимому, сображения, которые привели к прибли- женному решению в § 8, п. Б, будут оставаться справедливыми, пока фазовые флуктуации — величины порядка 2л рад и более; поэтому предсказания данной теории в области промежуточных частот должны оставаться применимыми и в случае больших флуктуаций. В заключение отметим, что в большинстве задач о форми- ровании изображения предсказания теории малых и больших флуктуаций почти совпадают. Хотя решение Рытова, строго говоря, ограничено случаем малых флуктуаций, в котором со- ответствующие математические выражения совершенно точны, оно более отвечает физической подоплеке, чем существующие подходы для режима больших флуктуаций и, (что еще важнее) дает правильные результаты практически во всех случаях, ко- торые представляют здесь интерес для нас. Задачи 8.1. Амплитудный коэффициент пропускания ts(x, у\ £, т]) случайного экрана в схеме рис. 8.1 зависит от координат г —4*— zr —4*— z8 Рис. 8.2з. рассматриваемой точки объекта (£, т]). Найдите усред- ненную ОПФ системы, предполагая, что статистическая автокорреляционная функция Е [t5 (х, у\ |, т]) t* (х — х0, у — “ У& L Л)] не зависит от (|, т])- 8.2. Случайный экран с амплитудным коэффициентом пропу- скания ts(x, у) освещается согласно схеме рис. 8.2з. Ам- плитудный коэффициент пропускания экрана обозначим
432 Глава 8 через ts(x, у), а его пространственную автокорреляцион- ную функцию (по предположению пространственно-одно- родную)— через Г/(Лх, Ау). Найдите автокорреляционную функцию полей в плоскости, расположенной на расстоя- нии Z2 от экрана, предполагая, что амплитуда квазимо- нохроматического освещения экрана равна единице, и пре- небрегая конечной протяженностью экрана. Указание. Пространственная передаточная функция по- лей, распространяющихся в свободном пространстве, имеет вид [5.24] $$ Vy) == _ { ехР 1V' " “ (Ч)2] ПРИ Vvx + vy < У » 10 в других случаях. 8.3. Покажите, что на частотах, соответствующих большим интервалам (уг ж 0), усредненная ОПФ случайного погло- щающего экрана не может быть меньше to — среднего ам- плитудного коэффициента пропускания экрана. Указание. Учтите, что 0 ts 1. 8.4. Найдите усредненную ОПФ и усредненную ФРТ для шахматного случайного поглощающего экрана, если ам- плитудный коэффициент пропускания ts однородно рас- пределен между нулем и единицей. 8.5. Покажите, что для стационарного гауссовского фазового экрана, имеющего автокорреляционную функцию гауссов- ской формы с круговой симметрией [формула (8.3.17)], в пределе большой фазовой дисперсии частота, на которой усредненная ОПФ уменьшается в е раз, дается выраже- нием (8.3.19), т. е. ¥1/е=БГ* 8.6. Покажите, что в задаче 8.5 частота v{/e на самом деле не зависит от средней длины волны X. 8.7. Рассматривается случайный фазовый экран, для которого фаза ф(х, у) имеет вид <р (х, у) = <р0 cos (2л 7 + б) - где 0 — случайная переменная, однородно распределенная в интервале (—л, л). Найдите усредненную ОПФ для та- кого экрана.
Формирование изображения при наличии случайных сред 433 8.8. Интенсивность / = /0ехр(2%) плоской волны после прохо- ждения турбулентной атмосферы имеет среднее значение I и стандартное отклонение о/. Предполагая, что в процес- се распространения потери энергии отсутствуют, выразите О//7 через Ox* В каких пределах изменяется оу/7 при изме- нении Ох от О Д° °°? 8.9. Серия экспериментальных измерений, выполненных с по- мощью астрономического телескопа, показывает, что ОПФ при длительной экспозиции уменьшается в е раз на угло- вой частоте, равной 80 Гц/мрад при обычных условиях. Измерения производились в свете со средней длиной вол- ны, равной 0,550 мкм. оо а) Найдите величину ^Сл (£)</£, отвечающую наблюдению о через атмосферу. б) Представьте себе, что атмосфера — однородная турбу- лентная среда с С2п— 10-15м-2/3 независимо от высоты. Какова эффективная толщина атмосферы? 8.10. Рассматриваются флуктуации показателя преломления П1(г), которые можно считать статистически однород- ными. а) Покажите, что двумерная спектральная плотность мощности Fn величины п\ в плоскости с фиксированным значением г связана с трехмерной спектральной плот- ностью Фп соотношением + » Fn («х> «г’> г) = $ Ф„ (их, ху, xz) dkz. —оо б) Покажите, что двумерная взаимная спектральная плот- ность Рп (хх, хУ; Аг) флуктуаций ni в двух поперечных плоскостях, разделенных расстоянием Аг, связана с трех- мерной спектральной плотностью мощности соотношением 4-00 (хх, ху; Az) = Ф„(хх, ху, xz)cos(xzAz) Ахг. — оо 8.11. Два монохроматических точечных источника с равной ин- тенсивностью разделены промежутком s в плоскости Рь На расстоянии zi от плоскости расположен тонкий стати- стически однородный гауссовский фазовый экран, имею- щий фазовую дисперсию и нормированную автокорре- ляционную функцию уф. Структура экрана изменяется во времени, но соответствующий случайный процесс является
434 Глава 8 эргодическим. На расстоянии г2 позади экрана располо- жен экран наблюдения, на котором можно наблюдать ин- терферограмму. Найдите видность длительно экспониро- ванной интерферограммы на экране наблюдения при сле- дующих предположениях: а) для сферических волн допу- стимо параксиальное приближение; б) лучи света при про- хождении через экран приобретают сдвиг фазы, но не ис- кривляются заметным образом; в) конечными размерами экрана можно пренебречь; г) эффектами временной коге- рентности пренебрегать нельзя. Выразите видность на- блюдаемой интерферограммы через все относящиеся сюда параметры. Замечание. Речь идет о возможности записи голограмм через искажающую среду с изменяющимися во времени свойствами. 8.12. Найдите фильтрующую функцию, которая связывает дву- мерную взаимную спектральную плотность величин S и х с трехмерной спектральной плотностью Фл флуктуаций по- казателя преломления. 8.13. Целью этой задачи является получение некоторых пред- ставлений относительно соотношения между борновским приближением и приближением Рытова. а) Покажите, что в случае плоской волны борновское приближение приводит к такому же (с точностью до по- стоянного множителя) выражению для аддитивного поле- вого возмущения t7j, как и приближение Рытова для по- казателя мультипликативного полевого приближения, б) На основе полученных выше результатов найдите фильтрующие функции, которые связывают двумерные спектральные плотности мощности компонент величины Ui, находящихся в фазе и в квадратуре с величиной Uo, с трехмерной спектральной плотностью Фл флуктуаций показателя преломления. в) Оцените справедливость утверждения, часто приводи- мого в литературе, о том, что из борновского приближе- ния следует райсовское распределение амплитуды полного поля |Uo + Ui I • ЛИТЕРАТУРА 8.1. Booker Н. О., Ratcliffe Л A., Shinn D. Я. — Phil. Trans. Roy. Soc. (Lond.), 1950, Ser. A, v. 242, p. 579. 8.2. Ratcliffe J. A. — Rep. Progr. Phys,, 1956, v. 19, p. 188. 8.3. O'Neill E. L. Introduction to Statistical Optics. — N. Y.: Addison-Wesley, Reading, MA, 1963, p. 99. [Имеется перевод: О'Нейл Э. Введение в ста- тистическую оптику. — М.: Мир, 1966.]
Формирование изображения при наличии случайных сред 435 8.4. Ishimaru Akira. Wave Propagation and Scattering in Rindom Media* Vols. 1, 2. — N. Y.; Acad. Press, 1978. [Имеется перевод: Исимару A. Распространение и рассеяние волн в случайно неоднородных средах.— М.: Мир, 1981.] 8.5. Wolfe W. L., Zissis G. L (eds.). The Infrared Handbook. — Ann Arbor. Michigan.: The Infrared Information and Analysis Center, Environmental Research Institute of Michigan, 1978, в частности, Ch. 4, 6. 8.6. Strohbehn J. W. — Proc. IEEE, 1968, v. 56, p. 1301. [Имеется перевод: Стробен Д. — ТИИЭР, 1968, т. 56, с. 46.] 8.7. Lawrence R. S., Strohbehn J. W. — Proc. IEEE, 1970, v. 58, p. 1523. [Имеется перевод: Лоуренс Л, Стробен Д. — ТИИЭР, 1970, т. 58, с. 130.] 8.8. Lee R. W., Harp /. С. — Proc. IEEE; 1969, v. 57, р. 375. [Имеется пере- вод: Ли Р., Харп Дж. — ТИИЭР, 1969, т. 57, с. 7.] 8.9. Strohbehn J. w. Optical Propagation Through the Turbulent Atmosphere* Progress in Optics, Vol. IX, ed. E. Wolf. — Amsterdam: North-Holland, Publ. Co., 1971. 8.10. Radio Science, 1975, v. 10, No. 1 (полный выпуск). 8.11. Fante R. L. — Proc. IEEE, 1975, v. 63, p. 1669. [Имеется перевод: Фэнте P. - ТИИЭР, 1975, т. 63, № 12, с. 43.] 8.12. Татарский В. И. Распространение волн в турбулентной атмосфере. — М.: Наука, 1967. 8.13. Татарский В. И. Теория флуктуационных явлений при распространении волн в турбулентной атмосфере. — М.: Изд-во АН СССР, 1959. 8.14. Чернов Л. А. Распространение волн в среде со случайными неоднород- ностями.— М.: Изд-во АН СССР, 1958. 8.15. Clifford S. F. The Classical Theory of Wave Propagation in a Turbulent Medium in Laser Beam Propagation in the Atmosphere, ed. J. W. Stroh- behn. — Heidelberg: Springer-Verlag. 1978. 8.16. Bracewell R. N. The Fourier Transform and its Applications. — N. Y.: McGraw-Hill Book Co., 1965. 8.17. Kolmogorov A. — In: Turbulence, Classic Papers on Statistical Theory, eds. S. K. Friedlander, L. Topper. — N. Y.: Wiley-Interscience, 1961. 8.18. Erdelyi A., Magnus W., Oberhettinger F., Tricomi F. G. Table of Integral Transforms, Vol. 1. —N. Y.: McGraw-Hill Book Co., 1954. [Имеется пере- вод: Бейтмен Г., Эрдейи А. при участии Магнуса Б., Оберхеттингера Ф., Трикоми Ф. Таблицы интегральных преобразований. Том. 1. —М.: Наука, 1969. 8.19. Clifford S. F„ Strohbehn J. W. — IEEE Transact. Antennas Propagation, 1967, v. AP-15, p. 416. 8.20. Goodman I. W. Introduction to Fourier Optics. — N. Y.: McGraw-Hill Book Co., 1968, Ch. 4. [Имеется перевод: Гудмен Дж. Введение в фурье- оптику. — М.: Мир, 1970.] 8.21. Strohbehn J. W. Modern Theories in the Propagation of Optical Waves in Laser Beam Propagation in the Atmosphere, ed. J. W. Strohbehn. — Heidel- berg: Springer-Verlag, 1978. 8.22. Barakat R. — J. Opt. Soc. Am., 1966, v. 66, p. 211. 8.23. Mitchell R. L. — J. Opt. Soc. Am., 1968, v. 68, p. 1267. 8.24. Hardy J. W.— Proc. IEEE, 1978, v. 66, p. 651. [Имеется перевод: Хар- ду Д.— ТИИЭР, 1978, т. 66.] 8.25. Dainty I. С. Stellar Speckle Interferometry in Laser Speckle and Related Phenomena, ed. J. C. Dainty. — Heidelberg: Springer-Verlag, 1975. 8.26. Hufnigel R. E., Stanley N. R. — J. Opt. Soc. Am., 1964, v. 54, p. 52. 8.27. Talbot F. — Phil. Mag.., 1836, v. 9, p. 401. 8.28. Fried D. L. — J. Opt. Soc. Am., 1966, v. 56, p. 1380. 8.29. Fried D. L. — J. Opt. Soc. Am., 1966, v. 56, p. 1372. 8.30. Schmeltzer R. A.—Quart. Appl. Math., 1967. v. 24, p. 339. 8.31. Heibreider G. R. — IEEE Trans. Antennas Propagation, 1967* v. AP-15, p. 90.
436 Глава 8 8.32. Fried D. L. — J. Opt. Soc. Am., 1965, v. 55, p. 1427. 8.33. Labeyrie A. — Astron. Astrophys., 1970, v. 6, p. 85. 8.34. Gezari D. K, Labeyrie A., Stachnik R. V. — Astrophys. J., 1972, v. 173, p. LI. 8.35. Korff D. — J. Opt. Soc. Am.. 1973, v. 63, p. 971. 8.36. McGlamery B. L. Astronomical Use of Television Image Sensors, NASA Technical Report SP-256, 1971. 8.37. Rhodes W. Г., Goodman J. Ж — J. Opt. Soc. Am. 1973, v. 63, p. 647. 8.38. Jennison R. C. — Monthly Notices Roy. Astron Soc., 1958, v. 118, p. 276. 8.39. Rogstad D. H.— Appl. Opt., 1968, v. 7, p. 585. 8.40. Brown T. AL— J. Opt. Soc. Am., 1978, v. 68, p. 883. 8.41. Knox К T.t Thompson B. — Astrophys. J., 1974, v. 193, p. L45. 8.42. Knox К Т,— J. Opt. Soc. Am., 1976, v 66, p. 1236. 8.43. Stachnik R. V., Nisenson A, Ehn D. C., Hudgin R. H., Scherf V. E. — Nature, 1977, v. 266, p. 149. 8.44. Worden S. P., Lynds C. R., Harvey J. W.--J. Opt. Soc. Am., 1976, v. 66, p. 1243. 8.45. J. Opt Soc. Am., 1977, v. 67, No. 3. (Весь номер.) 8.46. de Wolf D. A. —J. Opt. Soc. Am., 1965, v. 55, p. 812. 8.47. Brown W. P., Jr. — J. Opt. Soc. Am., 1966, v. 56, p. 1045. 8.48. Gracheva Mt E., Gurvich A. S., Kashkarov S. S., Pokasov V. V. Similarity Relations and Their Experimental Verification for Strong Intensity Fluc- tuations of Laser Radiation. — In: Laser Beam Propagation in the Atmo- sphere, ed. J. W. Strohbehn. - - Heidelberg: Springer-Verlag, 1978. 8.49. Гурвич А. С., Каллистратова M. А., Тиме H. C. — Изв. вузов. — Радио- физика, 1968, т. 1, с. 1360. 8.50. Грачева М. Е., Гурвич А. С. — Изв. вузов. —- Радиофизика, 1965, т. 8, с. 717. 8.51. Bourret R. С. — Can. J. Phys., 1962, v. 40, р. 782; — Nuovo Cimento, 1962, v. 26, р. 1. 8.52. Brown W. P., Jr. —J. Opt. Soc. Am., 1971, v. 61, p. 1051; 1972, v. 62, p. 45. 8.53. Lutomtrski R., Yura H. — J. Opt. Soc. Am., 1971, v. 61, p. 482. 8.54. Ho T. L.t Beran M. — J. Opt. Soc. Am., 1968, v. 58, p. 1335. ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 8.1д. Roddier F. The Effects of Atmospheric Turbulence in Optical Astronomy.— In: Progress in Optics, Vol. XIX, ed. E. Wolf. — Amsterdam: North-Hol- land Publ. Co., 1981. 8.2Д. Рытое С. M. Введение в статистическую радиофизику. Ч. 1. Случайные процессы. — М.: Наука, 1976. 8.3Д. Рытое С. М., Кравцов Ю. А., Татарский В. И. Введение в статистиче- скую радиофизику. Ч. 2. Случайные поля. — М.: Наука, 1978. 8.4*. Розенберг Г. В. — УФН, 1977, т. 121, вып. 1, с. 97.
Глава 9 ФУНДАМЕНТАЛЬНЫЕ ПРЕДЕЛЫ ТОЧНОСТИ ПРИ ФОТОЭЛЕКТРИЧЕСКОЙ РЕГИСТРАЦИИ СВЕТА Взаимодействие света с веществом ‘носит принципиально слу- чайный, или стохастический, характер. Поэтому при всякой ре- гистрации света неизбежны флуктуации. Это связано с кван- товыми эффектами, т. е. с тем, что свет может поглощаться только малыми дискретными «порциями» энергии, или кван- тами [9.1]. В данной главе мы изложим статистическую тео- рию таких флуктуаций и исследуем ограничения, налагаемые ими на возможности получения информации, которую несут све- товые волны. Наиболее фундаментальный подход к анализу таких явле- ний должен был бы основываться на квантовой электродина- мике (КЭД). Мы должны были бы проквантовать электромаг- нитные поля и проанализировать следствия, вытекающие из основных постулатов квантовой механики, в плане задачи о ре- гистрации. Такой наиболее общий подход весьма труден, по- скольку требует детального знакомства с аппаратом квантовой механики и мало согласуется с нашей интуицией. Ввиду затруднений, связанных с таким строгим подходом, мы выберем другой путь, а именно изложим так называемую полуклассическую теорию фоторегистрации. Такой подход не требует сложной математики и в большей мере основан на фи- зической интуиции. При этом, как было показано [9.2, 9.3], выводы полуклассической теории полностью согласуются с вы- водами более строгого квантовомеханического подхода во всех задачах регистрации, основанной на фотоэлектрическом эффек- те. Поскольку в преобладающем большинстве задач о реги- страции света действительно используется фотоэлектрический эффект, ограничение таким методом регистрации не приведет к большой потере общности. Имеется ряд отличных работ общего характера по полуклас- сической теории фоторегистрации, к которым может обратиться читатель за альтернативными разъяснениями, а в некоторых случаях и за более детальным обсуждением. Рекомендуем, в частности, работы [9.4—9.6]. Обсуждение относительных пре-
438 Глава 9 имуществ полукласспческого п КЭД-подходов можно найти в работе [9.7]. Тем, кто особенно интересуется строгим КЭД-под- ходом, рекомендуем работу Глаубера [9.8]. § 1. Полу классическая теория фотоэлектрической регистрации Полуклассический подход дает в высшей степени прозрачное физическое описание взаимодействия света с веществом. Осо- бенностью такого описания является то, что электромагнитные поля рассматриваются как классические, пока они не начинают взаимодействовать с атомами фоточувствительного материала. Таким образом, нет необходимости в квантовании электромаг- нитного поля, на основе квантовой теории рассматривается только взаимодействие классического поля с веществом. Когда электромагнитные волны падают на фоточувствитель- ную поверхность, происходит сложная последовательность со- бытий. Основные стадии этого процесса таковы: 1) поглощение кванта световой энергии (фотона) и передача этой энергии возбужденному электрону, 2) перенос возбужденного электро- на к поверхности и, наконец, 3) выход электрона с поверхно- сти. Будем называть выход электрона с фоточувствительной поверхности фотособытием. Число К таких фотособытий, проис- ходящих в данном временном интервале, назовем числом фо- тоотсчетов. Полуклассическая теория основывается на следующих трех предположениях относительно статистических свойств фотосо- бытий. Во-первых, принимается, что вероятность отдельного фо- тособытия на площади фоточувствительной поверхности, малой по сравнению с площадью когерентности падающего света, за время, меньшее времени когерентности света (но намного боль- шее периода оптических колебаний), пропорциональна интен- сивности падающей волны, длине интервала времени и рассмат- риваемой площади фоточувствительной поверхности. В мате- матической записи вероятность наблюдения одного фотособы- тия за время А/ на площади АД имеет вид Р (1; А/, АД) = аАМД/(х, у; /), (9.1.1) где а — коэффициент пропорциональности, a I(x,y\t)—интен- сивность волны в момент времени t в точке с координатами (х, у). Во-вторых, принимается, что вероятность более чем од- ного события, происходящего за такой короткий временной ин- тервал и на такой малой поверхности, пренебрежимо мала по сравнению с вероятностью одного фотособытия и с вероятностью отсутствия фотособытий. (Следовательно, возможность много-
Фундаментальные пределы точности 439 кратных событий исключается.) В-третьих, принимается, что числа фотособытий, происходящих в любых двух неперекры- вающихся временных интервалах, статистически независимы. (Процессы фотоэмиссии не имеют «памяти».) Внимательный читатель может заметить, что эти три пред- положения идентичны рассмотренным в гл. 3, § 7, п. Б, где речь шла о пуассоновских импульсных процессах и было по- казано, что они приводят к пуассоновскому распределению чис- ла импульсов, приходящихся на заданный временной интервал. Если каждое событие представить пространственно-временной дираковской б-функцией единичной площади, то мы получим случайный процесс, который будет пространственно-временным пуассоновским импульсным процессом со скоростной функцией, равной интенсивности света, умноженной на коэффициент про- порциональности а. Поэтому в соответствии с формулой (3.7.8) вероятность наблюдения К фотособытий во временном интер- вале (t, t + т) может быть записана в виде Р(К)ЛР(К;1, < + т) = ®-е-*, (9.1.2) где К— среднее число фотособытий, которое дается выраже- нием = J 7(х, y,l)d^dxdy (9.1.3) Г i (Л — освещаемая площадь фоточувствительной поверхности.) Для удобства этот результат записывают, вводя величину, которую называют интегральной интенсивностью W. Она имеет размерность энергии и определяется как /(x,y,№dxdy. (9.1.4) A t Заметим, что возможна более простая форма интегральной ин- тенсивности, если интенсивность света, падающего на фоточув- ствительную поверхность, постоянна во времени или в простран- стве. Так, если интенсивность имеет постоянное значение /0 (не зависящее как от времени, так и от пространственных коорди- нат), то выражение для IT сводится к виду W = /0Лт, (9.1.5) Если же допускаются временные изменения, то выражение при- нимает вид W = A J /(£)<£. (9.1,6) t
440 Глава 9 Записанное с использованием интегральной интенсивности вы- ражение для вероятности наблюдения К фотособытий таково: P{K) = -^^-e-aW. (9.1.7) Можно выразить постоянную а через другие, более знако- мые нам физические постоянные. Так как интегральная интен- сивность W фактически равна энергии света, падающего на фо- точувствительную поверхность за интересующее нас время из- мерения, а каждый фотон несет энергию Av, среднее число фо- тособытий за время т равно K=aW = ^-, (9.1.8) где h — постоянная Планка (6,626196-10“34 Дж-с), v— средняя оптическая частота излучения, а т] — так называемый кванто- вый выход (среднее число фотособытий, вызываемых одним па- дающим фотоном, т] 1). Итак, коэффициент пропорциональ- ности а равен <=& (М-9) Этим введение в полуклассическую теорию завершено. От- метим, однако, что в нашем обсуждении неявно использовано важное предположение, а именно что пространственно-времен- ные изменения интенсивности полностью детерминированы, или, другими словами, известны априори. Перейдем теперь к более реальным случаям, когда имеются случайные флуктуации клас- сической интенсивности. § 2. Влияние стохастических флуктуаций классической интенсивности Если на фотоприемник падает свет, интенсивность которого регулярно изменяется в пространстве и во времени, то, как было показано, флуктуации числа фотоотсчетов подчиняются распределению Пуассона. Однако в большинстве задач, пред- ставляющих реальный интерес, световая волна, падающая на фоточувствительную поверхность, есть стохастический объект: ее флуктуации нельзя предсказать заранее. Как будет видно из дальнейшего, любые стохастические флуктуации классиче- ской интенсивности могут оказывать влияние на статистические свойства регистрируемых фотособытий. По этой причине необ- ходимо рассматривать распределение Пуассона (9.1.7) как условное распределение; его условность состоит в том, что нам точно известна интегральная интенсивность U7.
Фундаментальные пределы точности 441 На практике же интерес представляет безусловное распре- деление фотособытий. Чтобы найти такое распределение, необ- ходимо усреднить условное распределение (9.1.7) по распре- делению интегральной интенсивности. Имеет смысл записать пуассоновское распределение (9.1.7) в форме, принятой для условного распределения, а именно в виде P(K\W). Здесь, как обычно, вертикальная черта указывает на то, что распределе- ние относится к известному значению величины, которая сле- дует за ней. Безусловная вероятность регистрации К. фотосо- бытий теперь может быть записана в виде оо Р (К) = J Р (К IW) pv (W) dW = . о = \-^^е~а'х' pv(W)dW, (9.2.1) О где pw(W)—плотность распределения интегральной интенсив- ности. Это выражение будет служить основой для всех даль- нейших вычислений статистических свойств фотособытий. Оно называется формулой Манделя [9.10]. Принято также назы- вать функцию Р(К), определяемую этой формулой, преобра- зованием Пуассона плотности распределения pw(W). Из формулы (9.2.1) должно быть очевидным, что, несмотря на исходное условное пуассоновское распределение фотособы- тий, полное распределение, вообще говоря, не является пуас- соновским, если возможны случайные флуктуации самой клас- сической интенсивности. В действительности мы наблюдаем флуктуации фотоотсчетов, обусловленные как фундаменталь- ными неопределенностями, связанными с взаимодействием све- та и вещества, так и с классическими флуктуациями света, па- дающего на фоточувствительную поверхность. Эти фотособытия образуют дважды стохастический пуассоновский процесс (гл. 3, § 7, п. Д). Прежде чем рассматривать статистическое распределение фотособытий в отдельных конкретных случаях, приведем ряд общих выражений, которые непосредственно следуют из фор- мулы Манделя. В частности, вычислим n-й факториальный мо- мент распределения Р(К): 00 EIK(K-V) ... (К — «+!)] = X W-1)...W-п+1)Р(/0= к=о = £ К (К— 1) ... (K-n+\)\-^-e-aVpw(W)dW. (9.2.2) к=о oJ
442 Глава 9 Изменяя порядок выполнения операций суммирования и ин- тегрирования, мы узнаем во внутренней сумме n-й факториаль- ный момент пуассоновской случайной переменной со средним значением (al^). Согласно формуле (3.7.3), эта сумма равна просто (а1Г)п. Таким образом, рассматриваемый безусловный момент равен оо Е[К(К-\) ... (К — л + 1)J = \(aW)npw(W)dW = anWn о (9.2.3) Далее легко найти среднее значение и дисперсию величины /С: К = aW, ок = aW + a2ouz* (9.2.4) Заметим, что дисперсия переменной К состоит из двух чле- нов, имеющих разный физический смысл. Первый, пропорцио- нальный полной энергии, падающей в течение процесса изме- рения, можно интерпретировать как вклад чисто пуассоновско- го шума, обусловленного случайным взаимодействием света с веществом. Второй же, пропорциональный дисперсии флуктуа- ций падающей интенсивности, — это «классический» вклад, ко- торый должен быть в отсутствие какого-либо шума, связанного с взаимодействием света и вещества. Читателю рекомендуется найти соотношение между харак- теристическими функциями числа фотоотсчетов и интегральной интенсивности (задача 9.1). А. Распределение числа фотоотсчетов в случае излучения хорошо стабилизированного одномодового лазера Рассмотрим одномодовый лазер, работающий значительно выше порога. Свет от этого источника падает на фоточувстви- тельную поверхность, и мы хотим найти распределение числа фотособытий, регистрируемых в некотором интервале време- ни т. Предположим, что в очень хорошем приближении интен- сивность падающего света можно считать постоянной в про- странстве и во времени, и обозначим эту интенсивность сим- волом /б. Тогда интегральная интенсивность в этом простом случае будет равна W = IQAx (9.2.5) и, следовательно, плотность распределения интегральной ин- тенсивности имеет вид Pw (Ю = W - IqAx). (9.2,6)
Фундаментальные пределы точности 443 Подставляя это выражение в формулу Манделя (9.2.1) и вы- полняя тривиальное интегрирование, приходим к следующему результату; 00 к Р (к) = J e-aWb (W - /0.4т) dW = О = (9.2.7) И наконец, замечая, что среднее число фотособытий равно К = а/oAr, мы можем записать вероятность регистрации К фо- тособытий эквивалентным образом P(K) = -^-e"«. (9.2.8) Предупредив читателя, что распределение числа фотоотсче- тов, вообще говоря, не будет пуассоновским, мы в данном слу- чае получили именно пуассоновское распределение. Это не должно вызывать удивления, поскольку это тот случай, когда полностью отсутствуют классические флуктуации интенсивно- сти. Таким образом, здесь нет «излишних флуктуаций» числа фотоотсчетов, которые налагались бы на основное пуассонов- ское распределение, связанное с взаимодействием света и ве- щества. Напомним, что факториальные моменты пуассоновского рас- пределения даются выражением [формула (3.7.3)] £[/Ш-1) ... (К - п + 1)] = art (Г)\ (9.2.9) Аналогично дисперсия может быть выражена через среднее значение: <гк = К. (9.2.10) Заметим, что отношение сигнала к шуму, связанное с этим распределением, определяемое как отношение среднего значе- ния к стандартному отклонению, дается выражением т. е. оно пропорционально квадратному корню из среднего чис- ла фотоотсчетов. Ясно, что рассмотренный случай излучения одномодового лазера, стабилизированного по амплитуде, является некоторой идеализацией. Однако при достаточной осторожности эта идеа- лизация может быть очень близкой к действительности, и по- этому важно понять характер флуктуаций числа отсчетов в
444 Глава 9 Рис. 9.1. Гистограмма для распределения Пуассона при К = 5. этом предельном случае. На рис. 9.1 представлена гистограмма вероятности регистрации К фотособытий в случае пуассонов- ского распределения числа отсчетов сК = 5. Б. Распределение числа фотоотсчетов в случае поляризованного теплового излучения при времени наблюдения, намного меньшем времени когерентности Рассмотрим теперь случай теплового излучения и связанное с ним распределение числа фотоотсчетов. Ограничимся пока простейшим с аналитической точки зрения случаем, а именно случаем полностью поляризованного излучения и времени на- блюдения, малого по сравнению с временем когерентности све- та. Практически столь малое время наблюдения было бы ис- ключительно трудно получить для истинно теплового излуче- ния, поскольку при ширине полосы 1 нм и длине волны 500 нм это время должно было бы быть намного меньше 1 пс (10“12 с)! Однако в случае квазитеплового излучения это усло- вие легко может быть выполнено. При таком коротком времени наблюдения интенсивность I (t) падающего света приблизительно постоянна во всем ин- тервале наблюдения. Следовательно, интегральная интенсив- ность просто равна произведению интенсивности на время на- блюдения и на площадь фотоприемника: Г = /(/)Лт. (9.2.12) Однако значение интенсивности в этом интервале является слу- чайной величиной и подчиняется экспоненциальному распреде- лению с отрицательным показателем степени; из выражения (9.2.12) следует, что то же самое справедливо и для интеграль-
Фундаментальные пределы точности 445 ной интенсивности: = = 1Г>0. (9.2.13) Теперь можно найти распределение числа фотоотсчетов, под- ставив выражение (9.2.13) в формулу Манделя и выполнив требуемое интегрирование: = -£=r ( WK ехр Г— W (а + J=-)l dW =-U=- ( —=V KIW J И1 к Wj] l+aW\l+aWj ' (9.2.14) Выполнив подстановку К = получим эквивалентное выра- жение P(K) = —^(—^=Y- (9.2.15) ' 1 + К к1 + К) Такое распределение называется распределением Бозе — Эйн- штейна (или, в статистике, геометрическим распределением); оно играет исключительно важную роль в статистической фи- зике неразличимых частиц (бозонов). Нам же достаточно за- метить, что факториальные моменты этого распределения опре- деляются выражением E[K(K-i) ... ^-n+I)] = Ш(Ж (9.2.16) Отсюда следует, что дисперсия может быть выражена через среднее значение в виде а2к = /( + (/ё (9.2.17) Заметим, что из двух членов, составляющих дисперсию, пер- вый снова описывает пуассоновский шум, связанный с дискрет- ным характером взаимодействия света с веществом, а второй — классические флуктуации интегральной интенсивности, которые в данном случае будут очень значительны при К > 1. Отноше- ние сигнала к шуму при бозе-эйнштейновском распределении фотоотсчетов, как легко видеть, равно —=_К.= А/—(9.2.18) ЛГ V 1+Л" Это отношение асимптотически стремится к единице при увели- чении среднего числа отсчетов, указывая на то, что флуктуа- ции числа фотоотсчетов действительно весьма существенны.
446 Глава 9 Когда среднее число фотоотсчетов R намного меньше еди- ницы, как нетрудно показать, различие между пуассоновским распределением и распределением Бозе — Эйнштейна становит- ся малым. При таких малых средних значениях заметно отлич на от нуля лишь вероятность зарегистрировать одно событие и не зарегистрировать ни одного события. Для обоих распреде- Рис. 9,2. Гистограмма для распределения Бозе — Эйнштейна при К = 5. лений соответствующие вероятности оказываются асимптотиче- ски совпадающими: Распределение ( ^(0) — — 1 — К, Пуассона = (9.2.19) Распределение Бозе-Эйнштейна Р(0) = Р(1)= —« 1 - к, 1 + К (1 + К)2 (9.2.20) На рис, 9.2 представлена гистограмма вероятности, отве- чающая распределению Бозе — Эйнштейна при том же среднем значении, что и на рис. 9.1. Сравнение этих двух гистограмм показывает, что, если среднее число отсчетов больше единицы, распределение Бозе — Эйнштейна значительно шире пуассонов- ского распределения, а потому флуктуации числа фотоотсчетов для первого (рис. 9.2) должны быть значительно больше, чем для второго (рис. 9.1). На этом мы закончим обсуждение распределения числа фо- тоотсчетов в случае поляризованного теплового излучения и ма- лого интервала наблюдения. Перейдем к более общему случаю неограниченного интервала наблюдения.
Фундаментальные пределы точности 447 В. Распределение числа фотоотсчетов в случае поляризованного теплового излучения и произвольного времени наблюдения Как указывалось ранее, исключительно трудно провести экс- перимент с истинно тепловым излучением так, чтобы время на- блюдения было намного меньше времени когерентности падаю- щего света. По этой причине важно исследовать распределение числа фотоотсчетов при времени наблюдения, сравнимом с вре- менем когерентности или превышающем его. Предположение о том, что падающий свет полностью поляризован, мы пока сохраним. Распределение числа фотоотсчетов будем искать так же, как и выше. Сначала найдем плотность распределения pw(W) интегральной интенсивности, а затем подставим ее в формулу Манделя и выполним требуемое интегрирование. Найти распределение интегральной интенсивности — нетри- виальная задача. Но мы встречались с ней ранее, и ее решения уже были найдены. Отсылаем читателя к гл. 6, § 1, где рас- сматривалось распределение проинтегрированной по времени интенсивности. Там было получено приближенное решение для pw(W) (§ 1, п. Б), а также точное решение (§ 1, п. В). Здесь мы, исходя из приближенного выражения для pw(W), иссле- дуем вопрос о распределении числа фотоотсчетов. Относитель- но точного решения рекомендуем читателю работу [9.11]. Предположим на некоторое время, что для волны, падаю- щей на фоточувствительную поверхность, площадь когерентно- сти намного больше площади фотоприемника. При таком пред- положении внимание может быть полностью сконцентрировано на эффектах временной когерентности. Тогда можно непосред- ственно использовать приближенное решение для pw(W), пред- ставленное выражением (6.1.31), т. е. плотность гамма-распре- деления pW(W) = Ur*~’exp «Г— О в других случаях. Здесь Ж — число «степеней свободы» интенсивности, приходя- щихся на интервал измерения; если имеются в виду чисто вре- менные степени свободы, этот параметр определяется следую- щим выражением [сравни (6Д.30)]*. [+°о — 1 jr j Л (у-) | у (т) |2 dr , (9.2.22) -оо J где у(т) —комплексная степень когерентности падающей волны.
448 Глава 9 Два предельных случая, а именно случаи, когда время ин- тегрирования очень велико и очень мало по сравнению с вре- менем когерентности света, были рассмотрены в гл. 6 [форму- лы (6.1,18) и (6.1.19)], Заметим, что независимо от того, на- сколько мало время измерения, число степеней свободы никогда не становится меньше единицы, и в этом предельном случае гамма-распределение с плотностью (9.2.21) сводится к экс- поненциальному распределению с отрицательным показателем. Если время интегрирования намного больше времени когерент- ности, то число степеней свободы будет равно числу интерва- лов когерентности, охватываемых интервалом измерения. Кро- ме того, как нетрудно показать, при увеличении числа степе- ней свободы гамма-распределение асимптотически стремится к гауссовскому распределению (задача 9.2), Если известна приближенная форма плотности распреде- ления интегральной интенсивности, то остается вычислить плот- ность распределения фотоотсчетов при произвольном времен- ном интервале счета. Вычисление производится по формуле Манделя, которая в этом случае имеет вид Р (Я) = \ (^~ е-а^ -----— dw. (9.2.23) J \ A I / 1 ) 0 Интегрирование может быть проведено без больших трудно- стей и приводит к следующему выражению для распределения числа импульсов К, регистрируемых за время т: Г(К+ I) Г(Л-) V, к) V * ) ' где К = а1Г. Это — биномиальное распределение с отрицатель- ным показателем, оно оказывается достаточно хорошим при- ближением для интересующего нас распределения числа фото- отсчетов, Заметим, что, как и следовало предполагать, число степеней свободы Л оказалось параметром данного распреде- ления. Если время интегрирования т очень мало, то число сте- пеней свободы близко к единице и биномиальное распределение с отрицательным показателем, как можно легко показать, сво- дится к распределению Бозе — Эйнштейна (задача 9.3). Имея приближенное выражение для распределения числа фотоотсчетов поляризованного теплового излучения с произ- вольным временем наблюдения и при полной пространственной когерентности, посмотрим теперь, какие потребуются измене- ния в результатах, если волна не полностью поляризована.
Фундаментальные пределы точности 449 Г. Случай неполной поляризации Выше предполагалось, что свет, падающий на фоточувствитель- ную поверхность, полностью поляризован. Интерес представ- ляет также случай теплового излучения с произвольной сте- пенью поляризации. Чтобы найти распределение числа фото- отсчетов в общем случае, заметим сначала, что если свет поляризован частично,™ полная интегральная интенсивность мо- жет рассматриваться как сумма двух статистически независи- мых составляющих интегральной интенсивности, по одной для каждой поляризационной компоненты волны, после прохожде- ния через поляризатор, который диагонализирует матрицу ко- герентности (4.3.38). Таким образом, Г = Г1 + Г2, (9.2.25) где W = W. + W2t ^,=4(1+^. (9.2.26) r2 = 4(i-^)- Так как И7| и И72 в случае теплового излучения статистически независимы, мы имеем р1Г(Г) = р1(Г1).р2(Г2), (9.2.27) где pi и р2 — плотности распределения величин W\ и UZ2. Чтобы продвинуться дальше, мы должны привлечь одно утверждение, справедливое при любом распределении числа фотоотсчетов: если плотность распределения интегральной интенсивности может быть представлена как (непрерывная) свертка двух плотностей распределения, то соответствующее распределение числа фотоотсчетов может быть представлено в виде (дискретной) свертки двух плотностей распределения числа фотоотсчетов, по одной для каждой отдельной непрерыв- ной плотности распределения. Таким образом, если Pi(U^) и Pz(W) — плотности распределения, фигурирующие в формуле (9.2.27), а Р\(п) и Р2(п)—соответствующие дискретные плот- ности распределения числа фотоотсчетов (найденные по фор- муле Манделя, применяемой к каждой непрерывной плотно- сти), то к Р (Я) = Е Pl (k) Р2 (К - k). (9.2.28) k=0 Читателю предлагается доказать этот общий результат в за- даче 9.5.
450 Глава 9 Применяя приведенный результат к настоящему случаю и учитывая биномиальные распределения (с отрицательным по- казателем) числа фотоотсчетов, отвечающие каждой из неза- висимых поляризационных составляющих, мы находим выра- жение для распределения числа фотоотсчетов в случае частич- но поляризованного теплового света: к V r(K~k + J() А Zu г(к-л+ 1)Г(^) А r(fe + Л) /У(1-^г) + 2^(1-^) у (9 2 29) А Г(£ + l)T(Jt) ЧК(1 -9>2) + 2Л(\ + &) ) ' ' ' ’ Выполнив эту дискретную свертку численным методом, можно найти распределение вероятностей числа фотоотсчетов при лю- бой заданной степени поляризации. Если одна из поляриза- ционных компонент имеет нулевую интенсивность, то эта дис- кретная свертка сводится к биномиальному распределению (с отрицательным показателем) фотоотсчетов, отвечающих од- ной оставшейся компоненте. Как и должно быть, если свет пол- ностью неполяризован, свертка сводится к одному биномиаль- ному распределению (с отрицательным показателем), имеюще- му 2Л степеней свободы. В заключение еще раз подчеркнем, что решения, представ- ленные здесь для случая теплового излучения, являются при- ближенными вследствие приближенного характера использо- ванных функций Возможно более точное рассмотрение, основанное на точном распределении величины приведен- ном в гл. 6, § 1, п. В. Относительно такого подхода и сравне- ния с приближенными результатами, представленными здесь, см., например, работы [9.6, 9.11]. Д. Случай неполной пространственной когерентности Выше мы предполагали, что тепловое излучение, падающее на фоточувствительную поверхность, является пространственно-ко- герентным. В этом случае число степеней свободы Л опреде- ляется исключительно временными эффектами. Если же волна пространственно-некогерентна, то ее пространственная структу- ра может сказаться на числе степеней свободы; в каждый дан- ный момент времени интенсивность падающего света на раз- личных участках фоточувствительной поверхности может быть разной. В таких случаях нужно изменить определение степени свободы с тем, чтобы включить в рассмотрение как временные,
Фундаментальные пределы Точности 451 так и пространственные степени свободы. Это и будет сделано ниже. Чтобы хоть немного упростить анализ, мы сделаем ряд предположений относительно характера света, падающего на фоточувствительную поверхность. Предположим, что свет имеет тепловое происхождение и полностью поляризован. Кроме того, предположим, что он обладает взаимной спектральной чисто той. Тогда комплексная степень когерентности может быть представлена в виде произведения временной и пространствен- ной компонент. Наконец, как временные, так и пространствен- ные флуктуации интенсивности предполагаются по крайней мере стационарными в широком смысле1). Тогда V12 (A*, A*/! т) = Н12 (Ах, Ду) V (г). (9.2.30) Обратимся к рис. 6.2. Точно так же как мы разбили время измерения на приблизительно независимые временные ячейки корреляции, мы должны теперь разбить площадь детектора на приблизительно независимые пространственные ячейки корре- ляции. Полная интегральная интенсивность тогда может рас- сматриваться как сумма многих независимых экспоненциально распределенных случайных переменных, по одной для каждой пространственно-временной ячейки корреляции. Чтобы среднее значение и дисперсия гамма-распределения, аппроксимирующего распределение интегральной интенсивно- сти во времени и пространстве, были равны подлинным сред- нему значению и дисперсии величины U^, нужно надлежащим образом выбрать параметр Л гамма-распределения. В связи с факторизацией, представленной в формуле (9.2.30), число сте- пеней свободы, требующееся для подбора правильных среднего значения и дисперсии, будет выражаться в виде произведения числа временных степеней свободы Jtt на число пространствен- ных степеней свободы Л=ЛгЛ3, (9.2.31) Как было показано в гл. 6, § 1, п. А, если существенна толь- ко зависимость от времени, то число временных степеней сво- боды может быть представлено (после некоторых преобразо- ваний) в виде одинарного интеграла ^ = 1~ J А (-у) | Y(t) |2dt I . (9.2.32) 1) Строго говоря, мы требуем лишь, чтобы модули комплексной степени когерентности зависели только от разностей пространственных и временных координат. Это требование мягче требования стационарности в широком смысле и удовлетворяется, например, в случае пространственных когерентных эффектов, описываемых теоремой Ван Циттерта — Цернике.
452 Глава 9 Можно также свести выражение для числа пространственных степеней свободы к двойному интегралу Jls = М- & (Ах, At/) | gl2 (Ах, by) \2d\xd\y , (9.2.33) где — нормированная автокорреляционная функция эффек- тивной «функции зрачка» Р(х,у), связанной с фоточувствитель- ной площадью, а А — площадь фоточувствительной поверхно- сти. Иначе говоря, если {1 (х, у) в пределах фоточувствительной площади, (9.2.34) О вне ее, то Я (Дх, At,) = . Р2 (х, у) dx dy (9.2.35) Если фоточувствительная площадь А намного меньше пло- щади когерентности Ас падающего излучения, то, как легко показать, число пространственных степеней свободы Ms равно единице. Если же фоточувствительная площадь намного боль- ше площади когерентности, то (задача 9.4) число простран- ственных степеней свободы равно отношению площади фото- приемника к площади когерентности (или, что эквивалентно, равно числу пространственных площадей когерентности света, укладывающихся на фоточувствительной поверхности): (9.2.36) Это выражение может быть преобразовано далее, если падаю- щая волна создается пространственно-некогерентным источни- ком. В этом случае теорема Ван Циттерта — Цернике и выра- жение (5.6.12) приводят нас к следующему эквивалентному выражению для числа пространственных степеней свободы, спра- ведливому при А > Ас: (9.2.37) Здесь, как и в формуле (5.6.12), есть угловой размер ис- точника, наблюдаемого с фотоприемника.
Фундаментальные пределы точности 453 На этом закончим с пространственными аспектами пробле- мы, перейдем к понятию параметра вырождения света и рас- смотрим роль, которую он играет в вопросе о распределении числа фотоотсчетов в случае теплового излучения. § 3. Параметр вырождения Теперь, вероятно, читатель убедился в том, что суще- ствует принципиальное различие в статистическом распределе- нии числа фотоотсчетов в случае излучения высокостабильного одномодового лазера и в случае хаотического излучения тепло- вых источников. Это различие особенно ясно обнаруживается, если более детально исследовать флуктуации числа фотоотсче- тов в обоих случаях, что мы и сделаем в следующем пункте. Однако ситуация оказывается более сложной, чем могло бы показаться с первого взгляда. Различие в распределениях чис- ла фотоотсчетов для этих двух типов излучения не всегда ве- лико. Более того, в видимой области электромагнитного спектра по распределению числа фотоотсчетов в большинстве слу- чаев очень трудно определить тип излучения. Основным кри- терием различимости этих двух типов излучения, как будет показано, является параметр вырождения, который мы вскоре определим. В п. А мы рассмотрим флуктуации числа фотоотсчетов в случае, когда на фоточувствительную поверхность падает свет разного типа. В результате мы придем к определению парамет- ра вырождения. В п. Б этот параметр рассматривается в част- ном случае излучения абсолютно черного тела. Важное значе- ние параметра вырождения станет еще яснее после того, как мы рассмотрим в последних параграфах этой главы различные приложения. А. Флуктуации числа фотоотсчетов Рассмотрим дисперсию числа фотоотсчетов в случае теплового излучения и условия, при которых она заметно' отличается от дисперсии в случае излучения стабилизированного одномодово- го лазера. Сначала укажем на прямую связь между дисперсией числа фотоотсчетов и дисперсией классических флуктуаций интенсивности света, падающего на фоточувствительную по- верхность. Чтобы вычислить дисперсию флуктуаций числа фотоотсче- тов, мы ^должны сначала найти второй момент числа фотоот- счетов К?. Заметим, что при условии известной интегральной интенсивности W число фотоотсчетов К есть пуассоновская
454 Глава 9 переменная со средним значением aW [формула (9.1.7)]. Поэто- му условный второй момент переменной К. определяется сле- дующим образом: b>iw[K2] = (aH7)2 + аИ7. (9.3.1) Чтобы найти безусловный второй момент К, мы должны про- сто усреднить (9.3.1) по переменной W. В результате получаем ^ = ^W2 + aW = = а2<4 + (аТ)2 + aW. (9.3.2) Чтобы найти дисперсию величины К, достаточно вычесть от- сюда квадрат среднего значения К, т. е. вычесть (aTF)2, что приводит к следующему выражению для дисперсии числа от- счетов [формула (9.2.4) tr2K = K4-a2ff2r. (9.3.3) Заметим, что при выводе выражения (9.3.3) не было не- обходимости делать какие-либо предположения относительно распределения классических флуктуаций интегральной интен- сивности. Результат носит совершенно общий характер, т. е. справедлив при любом типе излучения, падающего на чувстви- тельную поверхность фотоприемника. Более того, оба слагае- мых этого выражения имеют простой физический смысл. Пер- вый член К—просто дисперсия числа фотоимпульсов, которая должна была бы наблюдаться, если бы классическая интенсив- ность была постоянной и число фотоотсчетов было чисто пуас- соновской переменной. Назовем этот вклад в флуктуации числа фотоотсчетов «дробовым шумом» по аналогии с распределен- ным по Пуассону дробовым шумом, наблюдаемым, например, в вакуумном диоде [9.12]. Второй член а2о^ в отсутствие флук- туаций классической интенсивности, очевидно, равен нулю. Сле- довательно, эта составляющая дисперсии числа фотоотсчетов обусловлена флуктуациями классической интенсивности. В слу- чае излучения стабилизированного одномодового лазера эта со- ставляющая была бы тождественно равна нулю, а дисперсия числа фотоотсчетов просто соответствовала бы распределению Пуассона. Если на фоточувствительную поверхность падает тепловое излучение, то классические флуктуации не равны нулю и дисперсия числа фотоотсчетов оказывается больше, чем со- ответствующая распределению Пуассона, на величину, пропор- циональную дисперсии интегральной интенсивности. Эта до- полнительная составляющая дисперсии числа фотоотсчетов часто называется «избыточным шумом»; такое название указы- вает на то, что эта часть шума добавляется к чисто пуассо- новским флуктуациям.
Фундаментальные пределы точности 455 Предположим теперь, что свет, падающий на фоточувстви- тельную поверхность, является поляризованным тепловым из- лучением. В этом случае, комбинируя выражения (6.1.10) и (6.1.17), получаем = = (9.3.4) Отсюда _ _ <Л = К + а2 -5- = (9.3.5) или __ <т2к=к(1+4)- (9-3.6) Заметим, в частности, что отношение дисперсий классиче- ских флуктуаций и флуктуаций дробового шума просто равно Важная роль этого параметра подчеркивается тем, что ему дается особое название. Итак, будем называть парамет- ром вырождения фотоотсчетов величину бс = К/Х (9,3,7) Физически параметр вырождения можно интерпретировать как среднее число фотоотсчетов за один интервал когерентности па- дающего излучения. Его можно также рассматривать как сред- нее число фотоотсчетов на «степень свободы» или на «моду» падающей волны. Если бс <С 1, то с большой вероятностью чис- ло фотоотсчетов за один интервал когерентности волны будет не более единицы. Это означает, что дробовой шум преобладает над классическим шумом. Если же бс 1, то в каждом интер- вале когерентности волны будет много фотособытий. Происхо- дит «сгущение» фотособытий из-за классических флуктуаций интенсивности и увеличение дисперсии числа фотоотсчетов до такой степени, что классические флуктуации становятся зна- чительно более сильными, чем флуктуации типа дробового шума. Поскольку параметр вырождения фотоотсчетов пропорцио- нален R, он пропорционален и квантовому выходу фоточув- ствительной поверхности. Иногда целесообразно исключить эту зависимость от данной характеристики конкретного фотоприем- ника и иметь дело с параметром вырождения, который был бы характеристикой только самого падающего поля. Поэтому мы введем волновой параметр вырождения (9-3-8) Этот новый параметр вырождения может рассматриваться как параметр вырождения числа фотоотсчетов, который получился
456 Глава 9 бы в случае идеального фотоприемника с квантовым выходом, равным единице. Распределение числа фотоотсчетов, полученное в случае по- ляризованного теплового излучения, определяется комбинацией параметров К и бс, как это можно видеть, переписав биноми- альное распределение с отрицательным показателем (9.2.24) в форме _ р(ю—[(1+дс)?/бс(1+УТ- (9-з>9) Докажем теперь одно очень важное положение. Когда пара- метр вырождения числа фотоотсчетов приближается к нулю, распределение числа фотоотсчетов Р(К), которое представляет собой биномиальное распределение с отрицательным показа- телем, становится неотличимым от пуассоновского распределе- ния. Для доказательства этого утверждения необходимы неко- торые приближения. Во-первых, если параметр вырождения намного меньше единицы, для гамма-функций в выражении (9.3.9) справедливо приближение Стирлинга [9.13] 9.3.10) Во-вторых, при &с С 1 допустимы следующие приближения: (9.3.11) Комбинируя приведенные выше приближенные выражения, най- дем, что вероятность регистрации К импульсов за время т дает- ся приближенным выражением р w=J?r^[(1 +4)*+Л-1/2еД’ <9-312) где мы в явной форме учли, что К/Ьс равно Л, числу степеней свободы. И наконец, сделаем еще одно приближение. Заметим, что* если среднее число фотоотсчетов за интервал когерентно- сти бс мало, с большой вероятностью действительное число
Фундаментальные пределы точности 457 K/v# фотособытий за один интервал когерентности также мало. Отсюда следует, что (*+4-)'“етеК- <9-з-1з> а величина в квадратных скобках в формуле (9.3.12) близка к единице. Таким образом, вероятность зарегистрировать К импульсов с хорошим приближением дается распределением Пуассона. Заметим, что точность приближений, использованных при выводе этого конечного результата, повышается с умень- шением параметра вырождения. Поэтому мы должны более правильно сформулировать этот результат в виде предела lim Р(Д’)-—(9.3.14) Л 1 Чтобы подчеркнуть важность только что полученного ре- зультата, сформулируем его еще раз словами. В случае поляризованного теплового излучения при пара- метре вырождения фотоотсчетов, стремящемся к нулю, распре- деление числа фотоотсчетов стремится к распределению Пуас- сона. Физический смысл этого результата состоит в следующем. Если параметр вырождения фотоотсчетов намного меньше 1, то число фотоотсчетов в каждом отдельном интервале когерент- ности падающей классической волны с большой вероятностью будет равно либо нулю, либо единице. В таком случае флук- туации классической интенсивности практически не вызывают «сгущения» фотособытий, так как интенсивность света (с вы- сокой степенью вероятности) недостаточна для того, чтобы вы- звать многократные фотособытия в одной ячейке когерентности. Если «сгущением» фотособытий можно пренебречь, то распре- деление числа фотоотсчетов будет неотличимым от распреде- ления в случае излучения стабилизированного одномодового лазера, в котором «сгущение» отсутствует. Мы предполагали, что падающий свет поляризован, но ана- логичный результат справедлив и в случае частично поляризо- ванного теплового излучения при условии, что независимые ин- тенсивности поляризационных компонент, получаемых при про- хождении света через поляризатор, который диагонализирует матрицу когерентности, характеризуются малыми параметрами вырождения. Значение этого результата не может быть полностью оце- нено до тех пор, пока мы не познакомимся с типичными пара- метрами вырождения, которые могут встречаться на практике. Они очень сильно различаются в СВЧ-диапазоне и в видимом диапазоне электромагнитного спектра, как мы сейчас покажем.
458 Глава 9 Б. Параметр вырождения для излучения абсолютно черного тела В статистической физике и термодинамике обычно вводят идеа- лизированное понятие абсолютно черного тела. Абсолютно чер- ное тело — это объект, который полностью поглощает всю па- дающую на него энергию излучения. Если такое тело находится в равновесии со своим окружением, то, кроме того, что оно является совершенным поглотителем, оно должно быть также и совершенным излучателем. Оно должно излучать столько же энергии, сколько и поглощает, иначе оно не могло бы оста- ваться в тепловом равновесии. Идеализированное представле- ние об абсолютно черном теле облегчает вычисления (завися- щего от температуры) спектрального распределения такого излучения. Многие излучатели, встречающиеся на практике, мо- гут рассматриваться как абсолютно черные тела или как при- близительно черные тела. Например, общая форма спектра солнечного излучения приблизительно соответствует спектру абсолютно черного тела с температурой 6000 К. Вычислением спектрального распределения энергии, излу- чаемой абсолютно черным телом, занимались многие физики XIX в. Наиболее известны исследования Рэлея и Джина, кото- рые вывели спектральное распределение излучения абсолютно черного тела из классического закона равнораспределения энер- гии по степеням свободы. Они установили, что полученные таким путем выводы согласуются с экспериментом только в длин- новолновом пределе и что в коротковолновом пределе резуль- таты приводят к знаменитой «ультрафиолетовой катастрофе»— спектральному распределению, плотность которого неограни- ченно возрастает при стремлении длины волны к нулю. Трудности, связанные с излучением абсолютно черного тела, были разрешены только после введения гипотезы, которая за- метно отступила от принципов классической физики. В 1900 г. Планк опубликовал новый вывод закона излучения абсолютно черного тела, который был основан на существенном предпо- ложении о том. что энергия может излучаться и поглощаться только в виде дискретных порций или квантов. Закон, пред- сказываемый этой теорией, находился в согласии со всеми экс- периментальными результатами, известными в то время. С по- явлением этой работы родилась квантовая теория излучения. Теория излучения абсолютно черного тела, предложенная Планком, существенна для нас тем, что позволяет весьма кон- кретно предсказать параметр вырождения для теплового излу- чения в разных частях электромагнитного спектра. Чтобы использовать результаты теории Планка, мы должны рассмат- ривать каждую степень свободы падающего излучения как ана-
Фундаментальные пределы точности 459 лог гармонического осциллятора. Такую картину можно полу- чить в явном виде, применяя теорему выборки1) для частот- ного представления ограниченного во времени сигнала, посту- пающего на фотоприемник в рассматриваемой нами задаче. Число степеней свободы сигнала одно и то же независимо от того, рассматриваются ли временные или частотные выборки. Действительно, энергию, падающую на фоточувствительную по- верхность, можно рассматривать как сумму энергий, приходя- щихся либо на временную, либо на частотную выборку; обе суммы приводят к одному и тому же результату. Энергии, связанные с каждым из таких осцилляторов, пред- полагаются квантованными с допустимыми дискретными зна- чениями En = nhv, (9.3 Л 5) где п — целое число, h — постоянная Планка (h = 6,626196 X X 10“34 Дж-с) и v — частота осциллятора. В эксперименте, включающем большое число таких осцилляторов, предпола- гается, что число осцилляторов в каждом возможном энерге- тическом состоянии отвечает распределению Максвелла — Больцмана. То есть число осцилляторов Nn с энергией Еп опре- деляется выражением tf„ = tfoexp{-^} = tfoexp{-^}, (9.3.16) где No — постоянная, Еп — п-й допустимый уровень энергии, k — постоянная Больцмана (k = 1,38-10-23 Дж/К) и Т — темпе- ратура в кельвинах. Чтобы найти вероятность того, что данный осциллятор находится в n-м энергетическом состоянии (или, иначе, имеет «число заполнения» п), мы должны нормировать выражение (9.3.16) так, чтобы набор этих чисел при сумми- ровании по п давал единицу. Такая нормировка может быть проведена (задача 9.7), и результат имеет вид Р(п) = (1 - e-WkT)(e~hvikT)n. (9.3.17) Сравнение (9.3.17) с (9.2.15) показывает, что энергетические состояния подчиняются распределению Бозе — Эйнштейна со средним числом заполнения на моду Л = (9.3.18) или, иначе, со средней энергией на моду Е = (9.3.19) ') Эта теорема в зарубежной литературе называется теоремой Уитте- кера— Шеннона (1949 г.). В советской литературе эта теорема известна как теорема В. А. Котельникова (1933 г.). — Прим, перев.
460 Глава 9 Волновой параметр вырождения представляет собой просто среднее число фотонов на моду. Это как раз та величина, ко- торая представлена выражением (9.3.18). Если рассматривае- мое излучение имеет узкополосный спектр, то частоту v в этом выражении можно заменить частотой v, соответствующей цент- ру спектра. Следовательно, параметр вырождения для излуче- Рнс. 9.3. Контуры постоянного волнового параметра вырождения как функции температуры источника и длины волны. ния абсолютно черного тела от узкополосного источника в тер- модинамическом равновесии принимает вид <9-3-20> Это выражение и нужно, чтобы выяснить различие между из- лучением в оптической области спектра и излучением на более низких частотах. Рассмотрим сначала случай излучения на достаточно низ- ких частотах, таких, что hv kT, При таком условии пара- метр вырождения в формуле (9.3.20) хорошо аппроксимирует- ся выражением (9.3.21) В этом случае параметр вырождения обратно пропорционален частоте и оказывается очень большим. В противоположном же случае hv kT параметр вырождения экспоненциально убы- вает с увеличением частоты и оказывается очень малым. На рис. 9.3 представлены контуры постоянного волнового пара-
Фундаментальные пределы точности 461 метра вырождения в плоскости двух координат: средней длины волны и температуры источника. Здесь четко видно, что в СВЧ-области спектра ж 1СН м) при любой температуре ис- точника, превышающей доли кельвина, волновой параметр вы- рождения намного больше единицы. Поэтому в данной области спектра вклад классических флуктуаций числа фотоотсчетов должен быть намного больше вклада флуктуаций, связанных с чисто дробовым шумом. В видимой же области спектра (I 5-Ю"7 м), чтобы волновой параметр вырождения был больше едйницы, требуются температуры источника, превышаю- щие 20 000 К- Поскольку Солнце имеет эффективную темпера- туру абсолютно черного тела, составляющую только 6000 К, мы делаем вывод, что в видимой области спектра огромное число встречающихся источников создают излучение с малым волно- вым параметром вырождения, и поэтому шум, обусловленный квантовой природой излучения, оказывается значительно боль- шим, чем шум, создаваемый классическими флуктуациями ин- тенсивности. В заключение данного пункта отметим следующее. Мы рас- сматривали волновой параметр вырождения, который является характеристикой излучения, падающего на фотоприемник. Квантовый выход последнего меньше единицы. Следовательно, параметр вырождения фотоотсчетов будет меньше волнового параметра вырождения, и в видимой области спектра вероят- ность встретиться с подлинно тепловым излучением, для кото- рого классические флуктуации интенсивности доминировали бы в распределении числа фотоотсчетов, оказывается еще меньше. (Правда, квазитепловые источники могут создавать излучение с очень большим параметром вырождения, и в таких случаях классические флуктуации интенсивности могут доминировать в флуктуациях числа фотоотсчетов.) Кроме того, фотоприемник или коллекторная оптика могут охватывать только часть одной пространственной моды источника. (Практически в интервале измерения всегда охватывается очень много временных мод.) В таком случае параметр вырождения фотоотсчетов может сно- ва стать меньше волнового параметра вырождения в резуль- тате неполного охвата пространственной моды. Хотя минималь- ное значение параметра Л равно единице, нужно учесть умень- шение энергии, достигающей фоточувствительной поверхности. Для этого нормальное значение параметра вырождения фото- отсчетов нужно дополнить множителем, равным отношению эф- фективной площади измерения к площади когерентности падаю- щего света. В случае протяженного некогерентного источника для параметра вырождения фотоотсчетов можно принять
462 Глава 9 выражение i>c = ПРИ А > Ас> А п _ ла г, л^л <9-3-22) Ас eMkT-\ (X)2 eh*kT-\ ПРИ А<Ас’ где площадь когерентности Ас света, испускаемого некогерент- ным источником, взята равной отношению квадрата длины вол- ны к телесному углу, под которым виден источник со стороны фотоприемника (задача 5.15). Читателю, интересующемуся вопросами излучения абсолют- ного черного тела, рекомендуем работы [9.14—9.16]. § 4. Шум в амплитудном интерферометре при низких световых уровнях Здесь и в следующих параграфах мы рассмотрим приложения статистической теории фотоэлектрической регистрации, изло- женной в предыдущих параграфах данной главы. Таких прило- жений очень много, поскольку точность практически любого оптического эксперимента определяется в основном конечным количеством используемого в измерениях света. Мы выберем из этой массы приложений эксперименты по измерению пара- метров простых интерферограмм. Имеется несколько причин такого выбора. Во-первых, измерение параметров интерферо- граммы обеспечивает относительно хорошо определенный и поддающийся интерпретации пример приложения теории. Во- вторых, мы видели на протяжении этой книги, что измерение па- раметров интерферограммы — одна из центральных проблем, связанных с когерентностью. Фундаментальные характеристики световых волн, используемые в теории когерентности, в действи- тельности являются измеряемыми параметрами интерферо- грамм. Исследуя предел точности измерения этих параметров, мы в действительности изучаем пределы точности измерения самой когерентности. Рассмотрим два различных подхода к измерению парамет- ров интерферограмм. В данном пункте мы рассмотрим метод, который можно называть «амплитудной интерферометрией» или методом «корреляции до фоторегистрации». Такой метод ис- пользуется, например, в звездном интерферометре Майкельсо- на. Вообще говоря, в гл. 7 мы отмечали, что любую систему, формирующую изображения путем непосредственной фокуси- ровки света на фотоприемнике, можно рассматривать как ин- терферометрическую систему; каждую фурье-компоненту изо- бражения можно представить себе как суперпозицию множе-
Фундаментальные пределы точности 463 ства интерферограмм с одной и той же пространственной ча- стотой, отвечающих некоторому фиксированному интервалу, занимающему все возможные положения в выходном зрачке системы. В § 5 мы рассмотрим другой метод измерения пара- метров интерферограммы, а именно метод «интерферометрии интенсивностей» или метод «корреляции после фоторегистра- ции». Этот тип измерения обсуждался с чисто классической точки зрения в гл. 6. Наконец, в § 6 мы обсудим шум в звезд- ном спекл-интерферометре, рассмотренном ранее в гл. 8, § 8. Нашей целью во всех случаях будет выяснение порога чув- ствительности рассматриваемого метода измерения. Иначе го- воря, мы будем искать ответа на вопрос: как зависит точность измерения от числа фотособытий, участвующих в этом изме- рении? А. Измерительная система и измеряемые величины Предположим, что метод амплитудной интерферометрии ис- пользуется в измерительной системе типа показанной на Рис. 9.4. Система регистрации и обработки сигнала для амплитудного интер- ферометра. рис. 9.4. Синусоидальное распределение интенсивности, отве- чающее идеальной интерферограмме, поступает на фотоприем- ник, состоящий из W дискретных элементов, установленных в ряд без зазоров. Такая интерферограмма может возникнуть,
464 Глава 9 например, в звездном интерферометре Майкельсона, применен- ном для определения диаметра удаленного звездного источника. Предполагается, что на выходе каждого элемента фотоприем- ника имеется отдельный счетчик фотонов1). Счетчик, связан- ный с n-м элементом, по истечении интервала времени т, ука- зывает число К(п), равное числу фотособытий, создаваемых этим элементом фотоприемника в интервале измерения. Все счетчики на выходе пускаются и останавливаются одновремен- но, так что в конце общего периода счета они дают «вектор числа фотоотсчетов К» длиной N, каждая компонента которого есть число импульсов, зарегистрированных отдельным элемен- том многоэлементного фотоприемника. Следует сделать некоторые предположения относительно ха- рактера интерферограммы. Во-первых, пространственная частота интерферограммы предполагается заранее известной. Прак- тически это хорошее приближение. Например, если интерферо- грамма образуется с помощью звездного интерферометра Май- кельсона, то ее период определяется интервалом субапертуры, длиной волны и фокусным расстоянием, а все эти параметры можно считать известными. Во-вторых, амплитуда интерферо- граммы предполагается постоянной в пределах многоэлемент- ного фотоприемника. В действительности мы предполагаем, что рассматриваемый свет является квазимонохроматическим и что усредненные по времени интенсивности двух пучков постоянны в пределах фотоприемника. В-третьих, пространственный пе- риод интерферограммы предполагается большим по сравнению с размером отдельного элемента. Это предположение позволяет нам считать интенсивность на любом элементе постоянной. На- конец, мы используем несколько искусственное предположение о том, что на всем фотоприемнике укладывается целое число периодов интерферограммы. Последнее предположение позво- лит нам упростить задачу (как будет ясно из дальнейшего) и все-таки найти фундаментальные пределы точности интересую- щего нас измерения. Распределение интенсивности интерферограммы, падающей на фотоприемник, представим в виде / (х, у) = (/, + /2) [1 + Г cos (-^ + <р)], (9.4.1) 1) Мы здесь оставляем в стороне некоторые усложняющие вопросы элек- троники. Для регистрации дискретных фотособытий таким многоэлементным фотопрнемником потребуются усиление выходных сигналов и некоторая элек- тронная дискриминация. На практике регистрироваться будут не все им- пульсы и будет регистрироваться некоторое количество ложных импульсов. Мы не рассматриваем все это, поскольку нас интересуют лишь фундамен- тальные стороны данной проблемы.
Фундаментальные пределы точности 465 где /1 и /2—(постоянные) усредненные по времени интенсив- ности двух интерферирующих пучков на многоэлементном фо- топриемнике, Т — видность интерферограммы, a L и <р— ее пространственный период и пространственная фаза. Цель эксперимента—определить Т и <р. В некоторых экс- периментах, например когда для получения информации при наличии изменяющихся во времени атмосферных неоднородно- стей используется звездный интерферометр Майкельсона, фаза интерферограммы может быть быстро флуктуирующей функ- цией времени. Предположим, что временной интервал, задан- ный для наблюдения, достаточно мал и интерферограмму мож- но считать «замороженной» во времени на многоэлементном фотоприемнике. Тогда нет уменьшения видности интерферограм- мы, обусловленного ее движением. Наша цель — установить, с какой точностью могут быть определены Т и <р при разных чис- лах фотособытий, регистрируемых многоэлементным фото- приемником. Б. Статистические свойства вектора числа фотоотсчетов Для анализа нам потребуется некоторая информация о стати- стических свойствах вектора числа фотоотсчетов К(/г). Они за- висят от вида света, который участвует в интерференционных экспериментах. Например, если это излучение одномодового лазера со стабилизированной амплитудой, то каждая компонен- та вектора числа фотоотсчетов будет пуассоновской переменной. Если же два световых пучка поляризованы и являются тепло- выми по происхождению, то фотоотсчеты подчиняются бино- миальному распределению с отрицательным показателем. Пред- положим, что излучение тепловое, поскольку это соответствует практически всем экспериментам по формированию изображе- ний с использованием интерферометрических данных. Предпо- ложим далее, что свет поляризован. Первой интересующей нас статистической величиной является среднее значение вектора числа фотоотсчетов. Конечно, среднее число фотоотсчетов и-го элемента фотоприемника просто пропорционально интенсивно- сти той части интерферограммы, которая падает на этот эле- мент. Таким образом, R (п) = аЛт (Ц + /2) [1 + V cos + <р)], (9.4.2) где а — величина, определяемая выражением (9.1.9), р0 — число периодов интерферограммы, охватываемое всем фотоприемни- ком, т — время интегрирования, а А — площадь одного элемен- та фотоприемника. Интерес представляет также второй момент
466 Глава 9 n-го числа фотоотсчетов К2(п). Исходя йз выражений (9.3.2) и (9.3.5), мы можем легко показать, что ^(п) = К(л) + [К(п)]2(1 +4)’ <9ЛЗ) где v# — число временных степеней свободы в интервале изме- рения. Подобным же образом (задача 9.8) можно показать, что корреляция между фотоотсчетами m-го и м-го элементов (т У= и) равна К(/п)К(п) =~К(^К(п) (1 + 4) ' (9.4.4) Теперь мы можем рассмотреть конкретный метод измерения интересующих нас параметров интерферограммы. В. Дискретное преобразование Фурье как метод вычисления параметров Нужно выбрать какой-то метод вычисления параметров интер- ферограммы. Мы здесь выберем для этого дискретное преоб- разование Фурье (ДПФ) [9.17, гл. 6] вектора числа фотоот- счетов. Под ДПФ вектора числа фотоотсчетов мы подразуме- ваем комплексную последовательность Ж (р), определяемую выражением # (р) = 4 £ Я (И) (9.4.5) п=0 Если мы вычислим компоненту ДПФ с индексом ро (где ро — снова число периодов интерферограммы, укладывающееся по длине многоэлементного фотоприемника), то амплитуда и фаза этой компоненты дадут нам информацию об амплитуде и фазе интересующей нас интерферограммы. Такой метод определения параметров интерферограммы в условиях ограничения фотон- ным шумом детально исследовался в работе [9.18], где было показано, что это оптимальная по критерию метода максималь- ного правдоподобия процедура, когда видность интерферограм- мы мала. Если же видность велика, то данный метод нельзя считать оптимальным, но он очень удобен и дает хорошие ре- зультаты. Прежде чем переходить к дальнейшему, коротко прокоммен- тируем наше предположение о том, что имеется целое число периодов интерферограммы. Коэффициент ДПФ с индексом ро имеет амплитуду и фазу, которые позволяют определить ампли- туду и фазу падающей интерферограммы только в том случае, если выполняется указанное условие. Если же преобразованию Фурье подвергается нецелое число периодов, то так называемая
Фундаментальные пределы точности 467 «утечка» [9.17, разд. 9-5] приводит к расплыванию информации о параметрах интерферограммы по нескольким коэффициентам ДПФ и к изменению коэффициента с индексом Но, посколь- ку период интерферограммы точно известен заранее, мы вполне можем сконструировать систему так, чтобы она охватывала це- лое число периодов интерферограммы. Как именно вычислять параметры Т и <р по р0-й компоненте ДПФ? Чтобы ответить на данный вопрос, мы должны сначала рассмотреть свойства среднего значения этой компоненты ДПФ. Для этого запишем выражение (9.4.5) в виде двух выражений для действительной и мнимой частей величины Л (pQ). Посколь- ку вектор числа фотоотсчетов является действительным, эти вы- ражения таковы: A Re {Ж (ро)} = 4 X * cos Т ’ <9Л6) п—0 ЛГ-1 X, д 1т{» (Ро)} = у X * sin ’ <9-4-7) л=0 где Жц н ЛГ/— действительная и мнимая части величины УС(Ро) Средние значения величин и «Ж’/ могут быть легко вычис- лены на основании выражения (9.4.2) для К(п). Простые пре- образования приводят к следующим выражениям для этих средних: У смМЛ-Нг) Tcn<i(r. _ Л Z, I , ч (9.4.8) JT, = «^5,(Л + <2> r sin ф Теперь можно указать нашу стратегию определения интере- сующих нас параметров. Если бы не было шума, связанного с процессом фоторегистрации, то средние значения, даваемые формулой (9.4.8), были бы равны истинным значениям величин Ж^ и Жь В этом случае зарегистрированная амплитуда интер- ферограммы, которую мы обозначим через С, могла бы быть получена путем простого извлечения квадратного корня и'з суммы квадратов этих двух выражений. Аналогично фаза ин- терферограммы могла бы быть получена путем вычисления арктангенса отношения Ж\ и Ж %. В отсутствие шума такая стратегия привела бы к свободным от ошибок значениям ам- плитуды регистрируемой интерферограммы и фазы. При на- личии флуктуаций числа фотоотсчетов эта стратегия не являет- ся совершенной в том смысле, что всегда существует некоторое различие между найденными и правильными значениями пара- метров. Тем не менее было установлено, что такой метод дает
468 Глава 9 хорошие результаты [9.17]» и мы воспользуемся им здесь. Итак, амплитуда С и фаза ф зарегистрированной интерферограммы определяются следующим образом: С = (^4-Х'/)1/2, ф=агс1е(ЗДГ₽). (9.4.9) Чтобы вычислить снова в отсутствие шума видность интер- ферограммы, потребуется сделать дальнейший шаг. Так как амплитуда не содержащей шума интерферограммы равна {уе\ + х2),/2 = аЛ- (/21 + /г) г, (9.4.10) это выражение необходимо разделить на аЛт(Л +Л)/2, чтобы получить Т?. Заметим, что все параметры а, т и А известны заранее. Однако в общем случае сумма двух падающих интен- сивностей /1 + /2 неизвестна. То что мы не знаем полной ин- тенсивности, падающей на весь фотоприемник, не мешает нам определить фазу интерферограммы, но не позволяет определить ее видность. Единственный выход — вычислить отдельно эту сумму. Ее можно вычислить по постоянной составляющей ДПФ УС (0), которая имеет среднее значение лг-i ^(°) = 7Г X ^(п) = а^(7, + 72). (9.4.11) На практике часто проводится некоторая последовательность измерений для интерферограмм с разными пространственными частотами (разные интервалы субапертуры в случае звездного интерферометра Майкельсона). В ходе такой последовательно- сти можно получить много независимых значений полной ин- тенсивности падающего излучения по одному для каждой изме- ряемой интерферограммы. По предположению эта полная интенсивность не зависит от времени и от пространственной ча- стоты рассматриваемой интерферограммы, и, стало быть, такая последовательность измерений может дать значение полной ин- тенсивности, более точное, чем любое однократно измеренное значение амплитуды интерферограммы. По этой причине пред- положим, что сумма интенсивностей известна. Таким образом, видность интерферограмм можно вычислить по формуле 2(^ + ^2)1/2 аЛт(Л + /2) * (ЭЛЛ 2)
Фундаментальные пределы точности 469 Г. Точность определения видности и фазы Процедура вычисления видности и фазы интерферограммы ме- тодом ДПФ была установлена при рассмотрении случая, когда интенсивность света велика и флуктуациями числа фотоотсче- тов можно пренебречь. Теперь обратим внимание на очень важ- ный вопрос о том, с какой точностью могут быть измерены эти параметры таким методом, если флуктуациями числа фотоот- счетов нельзя будет пренебрегать. Чтобы было легче ответить на этот вопрос, рассмотрим дисперсии действительной и мни- мой частей коэффициента ДПФ <%(р0) и их ковариацию. Для иллюстрации начнем с дисперсии 4 = Л)2- (9.4.13) С учетом соотношений (9.4.3) и (9.4.4) напишем N-l N— I £ WWcos^».cos-^ = п=0 ЛГ — 1 _ х = ~тп У К2 (п) cos2 2jt”p0 I члены с т = п Z— f N ( п-0 ) члены с my=n. (9.4.14) С учетом выражения (9.4.3) для второго момента ЛДп) получаем Л'-1 > /V-1 ч 2 E^cos^v) • <9'4Л5> п=0 \ n=0 J Наконец, вспоминая выражение (9.4.2) для К(п) и выбирая (без потери общности) начало отсчета фазы так, чтобы вели- чина ф была равна нулю (мы всегда имеем право выбрать лю- бое удобное начало отсчета фазы), проводим суммирование и получаем д, = <.^(Л + '.> (1 + °Лт(Л + /.) jgly (9 4J6) Определяя Kt и К2 как средние числа фотособытий, вызывае- мых двумя интерферирующими пучками в пределах всего мно- гоэлементного фотоприемника: Kl = aArNIl, K2 = aAxNI2, (9.4.17)
470 Глава 9 мы можем представить дисперсию величины Ж R в виде 0 +-4i^r2)- (9-4Л8) Точно так же для дисперсии величины получаем aj = ('1 + ' <9'4-19> И наконец, можно вычислить ковариацию Е1(Ж/?—Ж#)(Ж/—Ж/)], которая оказывается равной нулю. Проведенный анализ показывает, что действительная и мни- мая части величины УС (ро). не коррелированы и, вообще гово- ря, имеют разные средние значения и дисперсии. На рис. 9.5 Рнс. 9.5. Фазорная диаграмма в случае интерферограммы, содержащей шум. показаны различные интересующие нас величины. Истинное значение фазора интерферограммы представляется вектором С, который, как легко видеть, направлен вдоль действительной оси в соответствии с нашим предположением о том, что истин- ная фаза интерферограммы структуры равна нулю. Около точ- ки, определяемой концом вектора С существует «шумовое обла- ко», контуры которого могут рассматриваться как контуры постоянной плотности распределения. Эти контуры более широ- кие в направлении действительной оси, чем в направлении мни- мой оси. В более общем случае, когда истинная фаза интерфе- рограммы не равна нулю, эти контуры вытянуты в направлении вектора С. Возвращаясь к выражениям (9.4.18) и (9.4.19), можно уви- деть, что обе дисперсии различаются только вторым членом в круглых скобках в первом уравнении. Этот член может быть представлен в виде произведения квадрата видности на сред- нее арифметическое параметров вырождения двух падающих пучков. Как отмечалось в § 3, п. Б, в случае видимого тепло-
Фундаментальные пределы точности 471 вого излучения эти параметры вырождения почти всегда на- много меньше единицы. Видность же интерферограммы не мо- жет быть больше единицы. Следовательно, этот второй член, вызывающий асимметрию шумового облака на рис. 9.5, вообще говоря, пренебрежимо мал, если мы имеем дело с тепловым из- лучением в видимой области спектра. Поэтому в дальнейшем мы будем считать обе дисперсии одинаковыми. На основе проведенного выше анализа мы можем теперь оценить точность, с которой могут быть определены видность и фаза интерферограммы. Возможны два разных подхода. Один основан на предположении, что полное число фотоотсчетов мно- гоэлементного фотоприемника достаточно велико и к действи- тельной и мнимой частям величины (р0) применима цент- ральная предельная теорема. Тогда задача определения ампли- туды и фазы интерферограммы сводится к задаче определения амплитуды и фазы постоянного фазора комплексного гауссов- ского шума с круговой симметрией. Такой подход был исполь- зован в работе [9.18]. Мы выберем другой несколько более про- стой подход, основанный на другом предположении. Вместо того чтобы привлекать центральную предельную теорему, мы пред- положим, что ширина шумового облака на рис. 9.5 намного меньше длины истинного значения фазора вдоль действитель- ной оси (см. гл. 2, § 9, п. Д и гл. 6, § 2, п. В, где проводился подобный анализ в том же предположении большого отноше- ния сигнала к шуму). Обращаясь к рис. 9.5, можно записать эти предположения в виде МКгг>> //C. + /G т а/=-Л=- . (9.4.20) 2W V 2№ V К. + Кг Таким образом, видность интерферограммы должна быть боль- ше некоторого предела, причем этот предел уменьшается с уве- личением числа фотособытий, регистрируемых всем фотоприем- ником. При таком условии ошибки в оценке амплитуды интер- ферограммы почти полностью связаны с шумовой компонентой, которая находится в фазе с истинным фазором (дисперсия в этом случае), тогда как ошибки определяемой фазы обуслов- лены почти полностью шумовой компонентой, которая сдвинута на 90° по фазе относительно истинного фазора (дисперсия в этом случае). Отношение сигнала к шуму, связанное с опре- делением амплитуды интерферограммы (а также ее видности, поскольку 1\ и /2 предполагаются точно известными), прини- мает форму _____ (Xb"X=VXX (9.4.21)
472 Глава 9 тогда как среднеквадратичная ошибка, связанная с измерением фазы интерферограммы, определяется выражением Выражения (9.4.21) и (9.4.22)—главные результаты этого пункта. Рассмотрим некоторые следствия из них. Начнем с за- дачи определения видности интерферограммы. Из выражения (9.4.21) явствует, что отношение сигнала к шуму 1) зависит от квадратного корня из полного числа фотособытий, регистрируе- мых всем фотоприемником (как и должно быть в случае явле- ний пуассоновского типа), и 2) пропорционально видности ин- терферограммы. Из этого следует важный вывод о времени ин- тегрирования, требуемого для достижения заданного отношения сигнала к шуму. Поскольку величины и К2 линейно зависят от времени интегрирования т, мы можем сформулировать тре- тий важный вывод, а именно: чтобы отношение сигнала к шуму оставалось постоянным при уменьшении видности, сумма + Лг должна увеличиваться пропорционально 1/F2. Иногда удобнее представить результат (9.4.21) в другой форме. Предполагая, что средние интенсивности двух интерфе- рирующих пучков равны = и замечая, что = и где тс — время когерентности света, можно написать (4)™=VI <9А23> явно выделяя тем самым роль параметра вырождения фотоот- счетов. Обращаясь к задаче измерения фазы интерферограммы, в качестве основных выводов отметим, что 1) среднеквадратич- ная ошибка измерения фазы обратно пропорциональна квад- ратному корню из полного числа фотособытий, регистрируемых всем фотоприемником, и 2) среднеквадратичная фазовая ошиб- ка обратно пропорциональна видности интерферограммы. Теперь можно оценить, например, время наблюдения, тре- буемое для определения видности интерферограммы, формируе- мой в звездном интерферометре Майкельсона. Чтобы обеспе- чивалось заданное отношение сигнала к шуму (9.4.23), отно- шение времени наблюдения к времени когерентности света должно удовлетворять условию — = Г(4) T-rk’ (9.4.24) Ис IA к 7ckbJ dcz2 v 7 если два взаимодействующих пучка имеют один и тот же па- раметр вырождения фотоотсчетов бс. Предположим, что нам
Фундаментальные пределы точности 473 нужно отношение сигнала к шуму, равное 10, при измерении видности в свете с параметром вырождения ~ 10-3. Время усреднения, требуемое для достижения такой точности, будет зависеть от видности, которую мы измеряем. Если интересую- щая нас видность близка к единице, то соответствующая под- становка в (9.4.24) показывает, что требуемое время наблюде- ния составляет ~ 105 времен когерентности. Если же видность рассматриваемой интерферограммы равна только 0,1, то тре- буемое время наблюдения равно ~ 107 времен когерентности. Время когерентности само зависит от спектральной ширины света, который падает на фотоприемник. Если его спектральная ширина равна, например, 0,001 мкм (10 А), а средняя длина волны равна 0,5 мкм, то время когерентности равно ~ 10”В * * * 12 с. Следовательно, времени измерения, равного Ю7 времен коге- рентности, далеко не достаточно. Приведенный пример в какой- то мере искусственный, поскольку в реальной астрономии эф- фективный параметр вырождения намного меньше, чем пред- полагалось здесь. И все же эти значения будут полезны при проведении сравнения с чувствительностью интерферометра ин- тенсивностей в следующем параграфе. § 5. Шум в интерферометре интенсивностей при низких световых уровнях В предыдущем параграфе мы рассматривали метод измерения видности интерферограммы, или, иначе, комплексного коэффи- циента когерентности gi2 света, падающего на два простран- ственно-разделенных отверстия. (Поскольку интенсивности па- дающих пучков предполагались полностью известными, ком- плексный коэффициент когерентности может быть определен по видности и даже просто равен видности, когда средние интен- сивности двух интерферирующих пучков одинаковы). В этом методе два пучка объединяются до фоторегистрации. В данном параграфе мы снова рассмотрим интерферометр интенсивностей, о котором говорилось в гл. 6, § 3. В этом слу- чае свет, падающий на две пространственно-разделенные апер- туры, регистрируется непосредственно, без сведения вместе двух оптических пучков. Затем определяется корреляция двух фото- токов, а по корреляции определяется видность интерферограм- мы. Читателю, может быть, имеет смысл перечитать § 3 гл. 6. Там рассматривался вопрос об ограничениях, налагаемых чисто классическим шумом, который обусловлен флуктуациями ин- тенсивности теплового излучения, попадающего на фотоприем- ник. Здесь же мы сосредоточимся на шумовых ограничениях в случае интерферометра интенсивностей, обусловленных
474 Глава 9 дискретной природой фотособытий, создаваемых в каждом из двух фотоприемников. Вообще говоря, будут присутствовать одновременно оба типа шумов. Но как будет показано, в види- мой области спектра чувствительность и точность интерферо- метра интенсивностей ограничиваются в основном флуктуациями числа фотоотсчетов. А. Счетчиковый вариант интерферометра интенсивностей Вариант интерферометра интенсивностей, представленный на рис. 6.15, соответствует чисто классической ситуации, в которой непрерывные выходные токи двух фотоприемников преобра- зуются и комбинируются при помощи аналоговых фильтров и Рис, 9.6. Счетчиковый вариант интерферометра интенсивностей. схем. В рассматриваемом же теперь случае анализ упростится, если мы примем несколько иную форму интерферометра, по- казанную на рис. 9.6. Световые пучки, собранные двумя боль- шими зеркалами, фокусируются на два разных фотоприемнн- ка. На выходе каждого такого фотоприемника имеется счетчик, который регистрирует фотособытия в интервале времени, рав- ном То. Из чисел фотоотсчетов /G и JG в двух плечах интерфе- рометра вычитаются средние числа фотоотсчетов и К2 для обоих плеч интерферометра. Полученные «флуктуации числа фотоотсчетов» Л/G и ЛК2 затем перемножаются, и их произве- дение поступает в усредняющий накопитель, где оно склады- вается с такими же произведениями чисел фотоотсчетов, соот- ветствующими более ранним интервалам то, и полная сумма делится на число накопленных произведений. Выходными дан- ными служит среднее произведение флуктуаций числа фотоот- счетов. Оно, как будет показано, дает информацию о видности
Фундаментальные пределы точности 475 интерферограммы, которая сформировалась бы, если бы оба оптических пучка интерферировали непосредственно. Наша цель состоит в том, чтобы найти соотношение между средним произ- ведением флуктуаций числа фотоотсчетов и видностью интер- ферограммы или комплексным коэффициентом когерентности. Кроме того, мы найдем дисперсию этой величины, что позволит определить среднеквадратичное отношение сигнала к шуму, свя- занное с этим измерением, и провести сравнение с подобными же величинами, найденными в предыдущем параграфе. Б. Среднее произведение флуктуаций числа фотоотсчетов и его связь с видностью интерферограммы Под «флуктуациями числа фотоотсчетов» мы подразумеваем разности между действительными числами фотоотсчетов за ин- тервал т0 на фотоприемниках 1 и 2 и средними значениями этих двух чисел фотоотсчетов. Следовательно, АК1 = Ki - Ki, АК2 = К2- К2. (9.5.1) Усредняющий накопитель на выходе системы, показанный на рис. 9.6, действительно дает среднее значение произведения двух флуктуаций чисел фотоотсчетов. Таким образом, мы будем ин- тересоваться статистическими свойствами величины AKjA/G и, в частности, ее средним значением и дисперсией. Для облег- чения анализа вычислим сначала среднее произведение вели- чин К\ и К2; КЛг = Е Е КЛ2Р(Кь Кг), (9.5.2) Xi=0 Кг=0 где Р(/С,/G) — совместная плотность распределения чисел фо- тоотсчетов К] и /<2. Прежде всего заметим, что в соответствии с основными свойствами условных распределений мы имеем Р(КЬ Кг)=\\Р(Къ W2)pw (Wt, W2)dWxdW2. (9.5.3) о Кроме того, поскольку числа фотоотсчетов К\ и Кг независимы как события при условии известной интегральной интенсивно- сти IV'i и 1Гг, можно написать Р(Кх, K,lF„ 1Г!) = Р(К1|)Г|)Р(Х2|1Гг) = = (9.5.4) Л I I Л2 «
476 Глава 9 где учтено, что Ki и К2— условные пуассоновские переменные. С учетом сказанного теперь можно написать следующее выра- жение для среднего произведения чисел фотоотсчетов: /0=0 О W2)dW.dW2t (9.5.5) Далее в выражении (9.5.5) мы изменим порядок выполне- ния операций суммирования и интегрирования. Используя со- отношения Е Kl (<ТГ e~aV' = «^i- Е Кг -^—e-aV’= aW2, (9.5.6) /0=0 *’ /0=0 2‘ мы можем выразить среднее произведение чисел фотоотсчетов через среднее произведение классических интегральных интен- сивностей на двух фотоприемниках: /^2 = а2Г^2. (9.5.7) Исследуем теперь среднее значение произведений интеграль- ных интенсивностей. Подставив выражения для двух интеграль- ных интенсивностей в формулу для этого среднего значения и изменив порядок выполнения операций интегрирования и усред- нения, получим A2 J * + То = ГДР,, Р2; t /2(S2) ^2 (9.5.8) где Р\ и Р2 — центры двух коллекторных апертур интерферо- метра, а Г/ — взаимная корреляция интенсивностей падающего излучения в этих двух точках. Далее необходимо сделать некоторые конкретные предполо- жения относительно природы света, участвующего в измерении. Предположим, что свет 1) поляризован и является тепловым по происхождению и 2) обладает взаимной, спектральной чи- стотой, что позволяет нам разделить временной и простран- ственный аспекты когерентности. При таких предположениях функция взаимной корреляции двух интенсивностей может быть сведена к виду Г. (Pi, Р2; Si - S2) = 7Л П +1 Н.2121V(S, - S2)I2]. (9.5.9)
Фундаментальные пределы точности 477 Подчеркнем еще раз, что данное выражение справедливо толь- ко для теплового и квазитеплового излучения. Оно непригодно для излучения одномодового лазера, стабилизированного по амплитуде. Свойства симметрии функции — |2) допускают дальнейшее упрощение рассматриваемых интегралов. Выполнив преобразования, подобные использованному в ряде случаев выше [см., например, формулу (6.2.18)], приведем двойной ин- теграл к одинарному: Та Г^2 = 2т0Д^ (1 - А)Г/(Р„ Р2; я)^ = О Та = 2X2t07,72 J (1 -JL)dn + О То + 2Л2т07|7~2|ц|2|2 J (1 - JL)|Y(r1)|2dT1. (9.5.10) о Подставив этот результат снова в (9.5.7), с учетом определения (9.2.22) для числа степеней свободы найдем = (9.5.11) где gi2 = l Hi21- Таким образом, зная К,, К2 и Я, мы можем определить р12 по A/f, A/C2. Наконец, этот результат можно вы- разить и через видность интерферограммы Т. Поскольку F =s дУлД ц = ц12, (9.5.12) среднее произведение флуктуаций числа фотоотсчетов дается выражением _ _ (9.5.13) Выражение (9.5.13), связывающее среднее произведение флуктуаций числа фотоотсчетов с видностью интерферограммы, которая наблюдалась бы, если бы два пучка света интерфери- ровали, имеет важное значение в нашем анализе. Выражение (9.5.13) показывает, что если в усредняющий накопитель вво- дится достаточно большое число произведений флуктуаций чис- ла фотоотсчетов, так что оценка истинного статистического среднего является достаточно точной, то интерферометр дает на выходе информацию о видности V. Заметим, что, как и в случае классического интерферометра интенсивностей, ре- зультат измерений не несет никакой информации о фазе
478 Глава 9 интерферограммы. Но мы не знаем еще, сколько произведений флуктуаций числа фотоотсчетов нужно усреднить, чтобы опре- делить видность с заданной точностью. Это приводит нас к во- просу о флуктуациях вычисленного значения Т. Нужно оценить шум на выходе интерферометра. В. Отношение сигнала к шуму при измерении видности Полное общее исследование шумовых флуктуаций На выходе счетчикового интерферометра, показанного на рис. 9.6, — не тривиальная задача. Трудность связана с необходимостью од- новременно учитывать шумы, обусловленные как классически- ми флуктуациями, так и флуктуациями (типа дробового шума) числа фотоотсчетов. Если флуктуации типа дробового шума статистически независимы, то классические флуктуации не яв- ляются такими. Именно статистическая зависимость фотоотсче- тов и позволяет нам получить информацию о видности полос. От этого статистического соотношения между фотоотсчетами зависит не только «сигнал» на выходе интерферометра, но и шум. Полный анализ характеристик интерферометра, включаю- щий оба этих эффекта, — очень трудная аналитическая задача. Но в одном частном и притом наиболее интересном случае, а именно когда речь идет об излучении истинного теплового ис- точника в видимой области спектра, возможно существенное упрощение анализа. Мы знаем, что благодаря малому парамет- ру вырождения для света, испускаемого такими источниками, флуктуации числа фотоотсчетов определяются в основном чисто дробовым шумом. Мы не можем пренебрегать классическими флуктуациями числа фотоотсчетов при вычислении сигнальной компоненты на выходе, но мы можем пренебречь их вкладом, когда вычисляем шум, просто потому, что их вклад в шум очень мал. В последующем анализе мы рассмотрим, во-первых, отноше- ние сигнала к шуму, связанное с измерением произведения флуктуаций числа фотоотсчетов в одном интервале счета. Оно определяется следующим образом: (—) = АК| АКг - -;2. (9.5.14) \N Ji 1^К^Кг)2-^К^Кг)2]'12 Вычислив эту величину, мы затем найдем отношение сигнала к шуму на выходе усредняющего накопителя, просто умножив отношение сигнала к шуму для произведения флуктуаций числа фотоотсчетов в одном интервале на квадратный корень из числа независимых измерений, усредненных накопителем. Един- ственное требование к точности этой процедуры — чтобы флук-
Фундаментальные пределы точности 479 туации числа фотоотсчетов были некоррелированы от одного интервала счета к другому. Это требование выполняется в слу- чае пуассоновского дробового шума, который считается глав- ным фактором, ограничивающим точность. Величину в квадратных скобках в знаменателе выражения (9.5.14) для (S/Af)i можно вычислить, если учесть, что при вы- числении шумовых характеристик флуктуации числа фотоот- счетов на выходе двух фотоприемников являются статистически независимыми пуассоновскими переменными. Отсюда следует, что (А^А^Р - (A/GA/Q2 = Atff AKl - (АКТ Ж)2 = = АЙА^ = ^Л2, (9.5.15) где были использованы равенства А/С — О (по определению) и А/<2 = /< (по предположению о пуассоновских свойствах). Под- становка (9.5.13) и (9.5.15) в (9.5.14) показывает, что отноше- ние сигнала к шуму, связанное с произведением флуктуаций числа фотоотсчетов для одного интервала, равно ( + Т2 Если средние интенсивности света, падающего на два фото- приемника, одинаковы, выражение для этого отношения сиг- нала к шуму приводится к удобному виду (4)i = 6^2- <9-5>17) где 6с — параметр вырождения фотоотсчетов для света, падаю- щего на каждый фотоприемник. Еще раз подчеркнем, что в выражении (9.5.17) мы имеем отношение сигнала к шуму только для произведения флуктуа- ций числа фотоотсчетов в одном интервале счета, построен- ного на фотоотсчетах в одном интервале то. Даже беглого взгляда на эту формулу достаточно, чтобы увидеть одну труд- ность. Так как параметр вырождения по предположению на- много меньше единицы, а видность полос никогда не может превышать единицу, отношение сигнала к шуму (9.5.17) всегда намного меньше единицы! Заметим, что это выражение не за- висит от задаваемого интервала счета т0- Поэтому отношение сигнала к шуму не улучшается при увеличении длительности счета счетчиков на выходе фотоприемников. Таким образом, мы делаем вывод, что из данных измерения произведения флук- туаций числа фотоотсчетов невозможно извлечь информацию о
480 Глава 9 видности полос, так как в этих данных шума намного больше, чем сигнала. Чтобы получить более точную оценку видности, мы должны проводить усреднение произведений (флуктуаций числа фотоот- счетов), полученных во многих независимых интервалах счета. В этом и состоит функция усредняющего накопителя, показан- ного на выходе интерферометра на рис. 9.6. Предполагая, что флуктуации произведения числа фотоотсчетов не зависят от ин- тервала счета, мы видим, что среднеквадратичное отношение сигнала к шуму, связанное с усредненным результатом для W интервалов счета, равно (4L = VW2. (9.5.18) Если то — основной интервал счета и возврат к нулю счетчи- ков может производиться мгновенно, то полное время измере- ния равно т = Лто. Введем полное время измерения в формулу (9.5.18): _ <9-5|9> Заметим, что выгодно иметь основной интервал счета то по воз- можности малым, так как тогда максимально число независи- мых произведений флуктуаций числа фотоотсчетов, усреднен- ных по фиксированному полному времени измерения. Чтобы получить более конкретное представление о значе- нии этого анализа, рассмотрим точно тот же пример, что и об- суждавшийся в § 4 в связи с интерферометром интенсивностей. Отношение полного времени измерения к основному времени счета, требуемому для того, чтобы обеспечить заданное отноше- ние сигнала к шуму, может быть записано, согласно формуле (9.5.19), в виде Пусть параметр вырождения света равен 10~3, основной интер- вал счета то=Ю“7 с, а отношение сигнала к шуму должно быть равно 10 (как и в предыдущем примере). Требуемое вре- мя измерения теперь зависит от четвертой степени видности. Если видность интерферограммы равна единице, то требуемое время измерения в этом случае равно по крайней мере 10 с (и малой доле секунды в случае амплитудного интерферомет- ра). Если же видность интерферограммы падает до 0,1, то вре- мя измерения увеличивается до 108 с, или ~28 ч (и остается равным малой доле секунды в случае амплитудного интерферо- метра).
Фундаментальные пределы точности 481 Если чувствительность интерферометра интенсивностей дей- ствительно столь мала, то почему он представляет какую-то ценность? Дело (частично) в том, что коллекторные апертуры интерферометра интенсивностей могут быть значительно боль- ше, чем у амплитудного интерферометра, и, следовательно, в рассматриваемом случае коллекторной апертурой может быть охвачена большая доля отдельной ячейки когерентности. Наше предположение о том, что параметр вырождения фотоотсчетов одинаков для обоих интерферометров, если используется свет от одного и того же источника, на самом деле неверно. Если апертура коллектора в каком-либо плече интерферометра мень- ше, чем размер отдельной ячейки когерентности, то параметр вырождения фотоотсчетов на фотоприемнике для этого плеча пропорционален площади этой апертуры [формула (9.3.22)]. Диаметр наибольшего возможного коллектора в интерферомет- ре Майкельсона, работающего в пределах земной атмосферы, равен ~ 10 см (или, может быть, несколько меньше); большие размеры апертуры приводят к потере видности вследствие того, что в процессе измерения участвует более одной атмосферной ячейки когерентности. В интерферометре же интенсивностей, который нечувствителен к атмосферным искажениям фазы све- та, достигающего фотоприемник, могут быть использованы кол- лекторные апертуры значительно больших размеров, чем ука- занные выше. Например, интерферометр интенсивностей в Нар- рабри в Австралии имеет коллекторы диаметром ~7 м. Таким образом, эффективный параметр вырождения фотоотсчетов ре- гистрируемого света оказывается для этого интерферометра интенсивностей приблизительно в 702 раз больше, чем для срав- нимого амплитудного интерферометра. Существует и ряд других причин, по которым интерферо- метр интенсивностей представляет ценность, несмотря на его сравнительно низкую чувствительность. Во-первых, длины пу- тей в двух плечах такого интерферометра требуется уравнивать только с точностью до доли с/В, где с — скорость света, а В— электрическая ширина полосы электронного устройства, обра- батывающего сигнал фотоприемника. В случае же амплитуд- ного интерферометра необходимо уравнивать длины путей с точностью до доли c/Av, где Av — оптическая ширина полосы интерферометра. Разница между электрической и оптической ширинами полос вполне может составлять несколько порядков величины. Следовательно, требования к точности юстировки в случае интерферометра интенсивностей существенно снижаются. Второе преимущество интерферометра интенсивностей со- стоит в том, что в нем могут быть использованы не очень совершенные коллекторы, тогда как амплитудный интерферо- метр требует оптических компонентов высокой точности.
482 Глава 9 Третье преимущество состоит в том, что атмосферные не- однородности оказывают сравнительно малое влияние на харак- теристики интерферометра интенсивностей, но исключительно существенны в случае амплитудного интерферометра. Фото- приемники интерферометра интенсивностей совершенно нечув- ствительны к любым ф'азовым ошибкам падающих на них опти- ческих волн. Значительное влияние оказывает только мерцание, вызываемое атмосферой, но и эти эффекты часто оказываются не очень существенными. Амплитудный же интерферометр ис- ключительно чувствителен к атмосферным фазовым возмуще- ниям, даже если размеры апертуры малы. В этом случае регистрируемая интерферограмма все время смещается по мно- гоэлементному фотоприемнику в результате постоянного изме- нения относительных сдвигов фазы, вносимых двумя атмосфер- ными путями, которые отвечают двум плечам интерферометра. Таким блужданием интерферограммы практически исключается возможность выделения фазовой информации о комплексном коэффициенте когерентности (интерферометр интенсивностей тоже не позволяет определить эту фазу). Это также делает задачу выделения информации о видности более трудной, чем в случае, когда интерферограмма совершенно непо- движна. Итак, более низкая чувствительность интерферометра ин- тенсивностей по крайней мере частично компенсируется боль- шей площадью коллекторных апертур, меньшей требуемой точ- ностью изготовления этих элементов, малой чувствительностью к атмосферным эффектам и значительно сниженными требова- ниями к точности юстировки системы. Однако большинство про- водящихся исследований в области интерферометрического фор- мирования изображений направлено по пути использования ам- плитудного интерферометра из-за его превосходной шумовой характеристики. Читателя, интересующегося дальнейшим разви- тием в области интерферометрии интенсивностей, отсылаем к работе [6.24], где детально обсуждается история вопроса и воз- можности интерферометра интенсивностей. § 6. Шумовые ограничения в спекл-интерферометрии В заключение рассмотрим шумовые ограничения, с которыми встречаются в звездной спекл-интерферометрии, в частности ограничения фундаментального характера, которые возникают из-за конечного числа фотособытий в любом измерении. Чита- тель может перечитать § 8 гл. 8, где излагаются основные со- ображения относительно звездной спекл-интерферометрии, пре-
Фундаментальные пределы точности 483 жде чем двигаться дальше. Здесь достаточно напомнить, что путем усреднения квадрата модуля спектров Фурье ансамбля зарегистрированных при короткой экспозиции изображений мо- жет быть получена оценка квадрата модуля спектра объекта, свободная от искажающих атмосферных эффектов. Возмож- ность выделить такую фурье-информацию об объекте, однако, ограничена, особенно в случае наиболее интересных для астро- номии слабых объектов, из-за шума, присущего процессам фо- торегистрации. Сосредоточим сначала наше внимание на аналитической мо- дели, которая будет использоваться для изучения чувствитель- ности этого метода формирования изображения. Затем вычис- лим спектральную плотность регистрируемой картины и при этом определим флуктуации, с которыми приходится сталки- ваться в одной возможной вычислительной процедуре, исполь- зуемой для определения квадрата модуля спектра объекта. И в заключение вычислим отношение сигнала к шуму (S/Af), достигаемое в этом процессе. Этот последний параграф завер- шим некоторыми общими замечаниями. Другие изложения этой проблемы могут быть найдены в работах [9.19—9.21]. А. Непрерывная модель процесса фоторегистрации Анализ амплитудной интерферометрии и интерферометрии ин- тенсивностей, проведенный в предыдущих параграфах, был основан на использовании дискретных моделей процесса фото- регистрации. Под этим мы подразумеваем, что при анализе амплитудной интерферометрии предполагался дискретный на- бор малых фотоприемциков, каждый из которых дает один эле- мент вектора числа фотоотсчетов. Предполагалось, что фото- приемники в интерферометрах интенсивностей включаются в дискретных интервалах времени и каждый из них дает дис- кретную последовательность фотоотсчетов для дальнейшей об- работки. Читатель может оценить достоинства этого метода, ознакомившись здесь с другим методом анализа, в котором ис- пользуется пространственно-непрерывная модель процесса фо- торегистрации. В этом случае мы предполагаем, что фотоприемник непре- рывен в пространстве и способен регистрировать не только возникновение фотособытия где-либо на его чувствительной поверхности, но и локализацию этого фотособытия. Сигнал фо- топриемника d(x, у) как функцию двух пространственных ко- ординат можно представить в виде х d U, У) = S 6 (х — х„, у — уп), (9.6.1) П = 1
484 Глава 9 где 6(х — хп, у — уп)~ двумерная 6-функция с центром в точке с пространственными координатами (хп уп), представляющая конкретное фотособытие в этой точке. Всего у нас К таких фотособытий, по-разному локализованных на фоточувстви- тельной поверхности, происходящих за время, в течение кото- рого регистрируется это отдельное изображение. В таком представлении все величины К, хп и уп рассматриваются как случайные переменные, статистические свойства которых опи- сываются в следующих пунктах параграфа. Модель, описанная в предыдущем параграфе, — это модель смешанного, или неоднородного, пуассоновского импульсного процесса типа рассмотренного в гл. 3, § 7. В соответствии с полуклассической теорией фоторегистрации вероятность К фо- тособытий на площади А фотоприемника принимается равной вероятности события пуассоновского процесса в предположении, что падающий свет является тепловым по своему происхожде- нию и имеет очень малый параметр вырождения. Следователь- но, вероятность регистрации К фотособытпй на площади А мо- жет быть записана в виде Р(Ю +«> ,/( У) dx dy I ехр + °о — Х(х, y)dxdy — оо (9.6.2) где Х(х, у)—«скорость» пуассоновского импульсного процесса, связанная с классической интенсивностью 1(х,у) света, падаю- щего на фоточувствительную поверхность, соотношением Х(х, y) = al(x, y)xt (9.6.3) причем в 1(хьу) учитывается конечная протяженность фото- приемника. Здесь а — величина (9.1.9), а т — время интегриро- вания фотоприемника для данного конкретного изображения. Поскольку распределение классической интенсивности /(х,у) заранее неизвестно, мы сначала будем рассматривать Х(х, у) как заданную известную функцию, а затем проведем усреднение по статистическому распределению величины X. Эта процедура полностью согласуется с правилами, установленными для услов- ных распределений. Заметим далее для будущего, что при из- вестном числе событий К координаты событий (хп, уп) являют- ся независимыми случайными переменными с общей плотностью распределения [формула (3.7.14)] Р (хп, у„) = ^К{Хп' Уп}-----, (9.6.4) \ \ А. (х, у) dx dy
Фундаментальные пределы точности 485 где Х(х, у) — неотрицательная скоростная функция, пропорцио- нальная классической интенсивности изображения. Рис. 97. Классическое и регистрируемое изображение, а — классическая ин- тенсивность изображения; б — регистрируемое изображение. На рис. 9.7 представлены типичное распределение класси- ческой интенсивности и соответствующее зарегистрированное изображение (для простоты показана одномерная картина). Б. Спектральная плотность регистрируемого изображения Метод спекл-интерферометрии основан на точных вычислениях спектральной плотности регистрируемого изображения. Следо- вательно, важно рассмотреть статистические свойства таких спектральных величин. В данном пункте мы сосредоточим вни- мание на определении среднего значения спектральной плот- ности. В § 6, п. В мы рассмотрим флуктуации этой величины относительно ее среднего значения. Классическая интенсивность света /(х, #), падающего на фо- точувствительную поверхность, непредставима в виде выбороч- ной функции стационарного случайного процесса. Конечная
486 Глава 9 площадь фоточувствительной поверхности в действительности об- разует «окно», через которое должны измеряться величины, ха- рактеризующие изображение, и независимо от того, является ли информация, падающая на это окно, стационарной или нет, она оказывается нестационарной после прохождения окна. Действи- тельно, интеграл (по площади фотоприемника) каждый выбороч- ной функции процесса с интенсивностью, ограниченной окном, конечен вследствие того, что всякое изображение соответствует конечной оптической мощности. Следовательно, для каждой вы- борочной функции существует фурье-образ, и более уместно иметь дело со спектральной плотностью энергии, а не спектраль- ной плотностью мощности. Этот вывод справедлив также и для регистрируемого изображения d(x, у). Нам нужно найти сред- нее значение квадрата модуля фурье-образа D(vxtvy) регистри- руемого сигнала изображения 4-00 О (vx, vz) = ЭД d (х, у) ехр [/2л (vz.t + vyz/)[ dx dy. (9.6.5) — oo В качестве первого шага подставим в формулу (9.6.5) вы- ражение (9.6.1) для d(x, у)\ получим к о (vx, vr)= S ехр [/2л (vxxn + vrz/„)]. (9.6.6) ?г= I Квадрат модуля этой величины дается выражением к к. | D (vx, vr |2 = £ Z el2!,[vx {X"~X^+VY (9.6.7) n = l m=l Остается усреднить |D|2 по распределениям величин К, (xn,yn) и X. Для удобства сначала будем считать К и К(хуу) извест- ными величинами, усредним | D|2 по условным распределениям величин (хп, уп) и (Хт,Ут), а затем проведем усреднение по и X. Первой нашей задачей является вычисление величины к к Еат 11 D (vx, Vr) |2] = Z S Enm k2" lV* (xn~xm)+^ (»„-*«)]], n-l (9.6.8) где символ ЕПт означает среднее по (хп,уп) и (хт,ут). Могут быть выделены два класса членов: 1) К членов, для которых п = т и каждый из которых дает единицу, 2) К2 — К членов, для которых п =# /и. Относительно последних членов известно, что (хп, уп) и (хт,ут) — независимые случайные пе-
Фундаментальные пределы точности 487 ременные, и поэтому Р (*„, Уп’ хт, ут) = +хК(Хп' Уп}--—. (9.6.9) М*. y)dxdy Л(х. y)dxdy — ОО “ОО Для этих № — /( членов результат процесса усреднения сво- дится к следующему: Епт [<?'2Я [V% (X'»~y"*)+Vr = Л (x, y) dx dy (9.6.10) Таким образом, результат усреднения величины | D |2 по рас- пределению величин (хп, уп) и (хт, ут) принимает вид £„m[|D(vx, vr)|2] = tf + (№-*) A(vx- vr) 2 Л (0, 0) (9.6.11) где A(vx,vy)—фурье-образ скоростной функции Х(х,г/). В этом месте следует сделать несколько замечаний относи- тельно числа фотособытий К в одном кадре. Это число изме- няется от кадра к кадру. В некоторых приложениях, в частно- сти в тех, в которых используется точная аппаратура для счета фотонов, можно измерять К для каждого регистрируемого кад- ра. В этом случае нельзя рассматривать К как случайную пе- ременную, так как она полностью известна для каждого изме- рения. В других случаях невозможно измерить А, например ко- гда фотоприемником служит фотографическая пленка. В таких условиях величину К следует считать случайной переменной. Мы будем рассматривать последний случай, но позже скажем, какие изменения необходимы, если величина К может быть из- мерена для каждого кадра. Продолжая наш процесс усреднения, мы найдем далее сред- нее значение выражения (9.6.11) по распределению случайной переменной А, предполагая функцию Х(х, у) известной. Обо- значая_условное среднее величины К [при заданном Х(х, г/)] через А(х) и замечая, что для пуассоновского распределения Е [К2-К] = [Ы, (9.6.12) найдем, что ^,m,K[|D(vx, vy) I2] = К{К) + 1 Л (vx, vy)|2. (9.6.13)
488 Глава 9 Наконец, проводя усреднение по распределению величины Л (х, У), получаем ^(VX, vr) = E[|D(vx, vy)|2]=^+^(vx, vr), (9.6.14) где К — безусловное среднее значение величины К, а (vj, vy) = Е [| A (vx, vr) |2]. Таким образом, спектральная плотность регистрируемого изображения равна сумме постоянного спектрального уровня К Рнс. 9.8. а — нормированная спек- тральная плотность энергии ин- тенсивности изображения; б — со- ответствующая спектральная плот* ность энергии регистрируемого изображения. и спектральной плотности скоро- стной функции. Этот результат согласуется с выражением (3.7.32), которое было выведено путем аналогичных рассуждений. Полезны также другие формы этого результата. Во-первых, если мы определим нормированную спектральную плотность энергии в виде (9.6.15) то будем иметь ^(Vx, Vy) = ^ + (^)2^(Vx, Vy). (9.6.16) Во-вторых, поскольку функция Х(х,у) пропорциональна класси- ческой интенсивности мы должны иметь ^(Vx, Vy) = ^((Vx, Vy), (9.6.17) где ё (v%, vr)— нормированная спектральная плотность энергии классической интенсивности изображения, падающей на фото- приемник. Этот результат приведен на рис. 9.8. Вычислив среднюю плотность распределения квадрата мо- дуля спектра Фурье изображения, мы рассмотрим затем более трудную задачу вычисления флуктуаций, связанных с этой ве- личиной. В. Флуктуации вычисленной спектральной плотности интенсивности изображения В рассматриваемой здесь задаче формирования изображения прежде всего нужно точно вычислить нормированную спект-
Фундаментальные пределы точности 489 ральную плотность энергии классической интенсивности изо- бражения, «падающей» на фотоприемник. Благодаря простому соотношению между и спектральной плотностью энергии регистрируемого изображения [формула (9.6.17)] целесообраз- но сначала определить^, а затем найти S’i как . (9.6.18) (К)2 Величина К является просто мерой полной яркости изображе- ния, которую мы предполагаем либо заранее известной, либо точно определенной в результате соответствующего фотометри- ческого измерения. (Альтернативная процедура, описанная в работе [9.21], при которой К заменяется истинным числом К фотособытий, регистрируемых в изображении, кратко обсу- ждается ниже.) Флуктуации нашей величины определяются флуктуациями результатов нашего измерения Это те флук- туации, которые мы намерены здесь рассмотреть. Значение может быть получено путем измерения |D|2 для отдельного изображения. Среднее значение этой величины, конечно, равно ^d(vx,vy). Но насколько может отклоняться от этого среднего значения результат отдельного измерения? Что- бы ответить на этот вопрос, нужно найти второй момент вели- чины | D |2, т. е. мы должны вычислить к к к к Е [I О I4] = S Ё S £ Е [ехр {/2л [vx (хп — хт + хр — xq) + п = 1 т = 1 р=1 + ^у(Уп — ут + Ур- Xq)]}]- (9.6.19) Это вычисление является достаточно громоздким и приведено в приложении В. Результат имеет вид £[|ОГ] = К + 2/С + 4(1+Ю<ГхЬ>Х1 vr) + + ^(2vx, 2vr) + 2M(vx, vr). (9.6.20) Если вычесть отсюда квадрат среднего значения | D|2, т. е. квадрат выражения (9.6.14), то мы получим дисперсию вели- чины |D|2: <Т| DI2 = К + (Ю2 + 2 (2 + ад (vx, vr) + (2vx. 2vr) + + ^(vx, vy). (9.6.21) Исходя из пропорциональности между Хи/, найдем эквива- лентное выражение <Т| DI2 = К + (Ю2 + 2£2 + к)(Ю2 &{ (vx, vr) + + (К)2 (2vx, 2vr) + (Ю4 (vx, vr). (9.6.22)
490 Глава 9 Это выражение представляет собой основной результат дан- ного пункта параграфа. Весьма интересно обратить внимание на некоторые моменты. Заметим, в частности, что флуктуации спектральной плотности регистрируемого изображения на ча- стотах (vx,w) зависят не только от спектральной плотности классической интенсивности при тех же частотах, но также и от спектральной плотности на частотах (2vx, 2vy)! Другими |£>12 -v0 -ty/? v0/2 Vo Рнс. 9.9. Результаты вычисления спектральной плотности в случае синусои- дального изображения. Сплошной линией представлено среднее значение, а штриховкой — стандартное отклонение от среднего при каждом значении ча- стоты. словами, компонента классической интенсивности для частот (2vx, 2vy) вызывает флуктуации спектральной величины для частот (v%, vy). Такое явление «уполовинивания частоты» яв- ляется фундаментальным свойством фотонно-ограниченных изо- бражений. Это отмечал ранее в другом контексте Уолкап [9.22]. Характер вычисленной спектральной плотности интен- сивности фотонно-ограниченного изображения, имеющего вид отдельной пространственной синусоиды (конечной протяженно- сти), показан на рис. 9.9. Заметим, что флуктуации спектраль- ной величины с половинным значением частоты синусоиды дей- ствительно имеют место. Найдя как среднее значение, так и дисперсию спектральной величины, мы можем теперь рассмотреть отношения сигнала к шуму, связанное с этим измерением. Г. Отношение сигнала к шуму для звездной спекл-интерферометрии Основываясь на проведенных в предыдущих двух пунктах вы- числениях, можно теперь найти среднеквадратичное отно- шение сигнала к шуму, связанное с нормированной спектраль-
Фундаментальные пределы точности 491 ной плотностью энергии интенсивности изображения для частот (vx, vr), полученной на одном кадре. После вычитания постоян- ного значения К, связанного со средним значением [фор- мула (9.6.16)], для отношения сигнала к шуму получим' (4) ,= = -=___________ (K)2gf(vx, vF)____________________ {K^2t(vx, vy)+2K3»( (vx, vr)+№ [l+4^ (vx, vY)+f( (2vx> ’ (9.6.23) Более подходящую форму этого результата получим, если вспомним, что на самом деле нам нужна спектральная плот- ность объекта, а не изображения. Необходимо теперь учесть соотношение между этими двумя спектральными плотностями, принимая в расчет влияние атмосферной турбулентности. Та- кие расчеты были проведены в гл. 8, § 8. Наиболее подходя- щим для наших целей является результат эвристического анализа, проведенного в гл. 8, § 8, п. Б. Замечая, что нормиро- ванные спектральные плотности изображения и объекта свя- заны соотношением [формула (8.8.4)] ^(vx. vr) = |^(vx, vr)|2^0(vx, vy), (9.6.24) можно с учетом формулы (8.8.13) найти средний квадрат ко- роткоэкспонированной ОПФ: I^(VX, VX)|2 = (-^)2 Жо (Vx, Vy). (9.6.25) Здесь, как и прежде, г0—атмосферный диаметр когерентности, Dq—диаметр коллекторной апертуры телескопа и — ди- фракционно-ограниченная ОПФ телескопа в отсутствие атмо- сферы. Выполнив подстановку (Vx, VF) = (-^)2 Жо (Vx, Vy) 80 (vx, Vy) (9.6.26) и введя величину k = (-gL.)2 К, (9.6.27) равную среднему числу фотособытий на спекл, найдем отноше- ние сигнала к шуму для отдельного кадра; z_s\(vx- *г) &о (УХ. уу) (9.6.28) N ’ (У*' Уу)§о (У*’ vY)f+^=b + ^3^0(yx-vY) <?o(vX’ vr)+ + А^0(2УХ- 2vr)^0(2vx. 2vr)]V/2
492 Глава 9 На практике данные измерения получаются не от одного кадра изображения, а от большого числа кадров, взятых во временной последовательности. Предполагая, что реализации состояния атмосферы не изменяются при переходе от кадра к кадру, для отношения сигнала к шуму, соответствующего сред- нему значению по N кадрам картины, получаем Теперь у нас имеется выражение для отношения сигнала к шуму, которое справедливо при любых оценках возможностей звездной спекл-интерферометрии. Эти результаты требуют, од- нако, некоторого дальнейшего обсуждения, и мы проведем его в п. Д. Д. Обсуждение результатов Выражение для отношения сигнала к шуму для отдельного кад- ра (9.6.28) выявляет некоторые интересные и важные свойства метода звездной спекл-интерферометрии. Важнее всего, что при неограниченном увеличении числа k фотособытий, приходящих- ся на один спекл, отношение сигнала к шуму приближается к единице. Таким образом, невозможно достичь отношения сиг- нала к шуму, большего единицы, при использовании одного кадра для определения спектральной плотности интенсивности изображения. Это характерно для всех вычислений спектраль- ных величин, основывающихся на преобразовании Фурье одной выборочной функции случайного процесса (см., например, о «пе- риодограммах» в работе [9.12], § 6-6). Единственным способом повышения отношения сигнала к шуму является усреднение найденных значений для отдельных кадров по большому числу кадров, что приводит к свойству, описываемому выражением (9.6.29). В этом интерферометр интенсивностей и звездный спекл- интерферометр удивительно сходны. Отношение сигнала к шуму, связанное с любым произведением флуктуаций числа фотоотсче- тов для одного интервала счета, в интерферометре интенсивно- стей, как было показано, меньше единицы. Только усреднение по многим независимым произведениям флуктуаций числа фотоот- счетов может привести к улучшению характеристик устройства. Аналогия не оканчивается здесь. В случае интерферометра ин- тенсивностей критическим параметром, определяющим основные характеристики, является параметр вырождения фотоотсчетов, т. е. среднее число фотособытий, создаваемое в отдельном интер- вале когерентности падающего света. В случае звездного спекл- интерферометра подобную роль играет параметр 6 —среднее
Фундаментальные пределы точности 493 число фотособытий, происходящее в одной пространственной ячейке когерентности атмосферы. Выражение (9.6.28) для отношения сигнала к шуму отдель- ного кадра усложняется, поскольку оно зависит от характера и формы спектра объекта для частот (vx,vy) и (2v%,2vy). Это усложнение может быть снято, если наше внимание будет огра- ничено частотами, которые лежат между половиной значения дифракционно-ограниченной частоты обрезания и частотой об- резания телескопа, поскольку тогда известно, что член с двой- ной частотой не может привести к вкладу в шум в области рассматриваемых частот. В этом случае отношение сигнала к шуму для отдельного кадра может быть записано в виде (-£-) = 7---------------------------П/2- (9.6.30) V /I ((! + ад,)2 + ' (1 + 4Ш)\1/2 I А ) Имеются три предельные представляющие интерес области с разными зависимостями от 1) при > 1 мы имеем (S/Af)i ~ 1 (независимо от k)\ 2) при kd№$0 «С 1, но k 1 мы имеем (S/N){ ~ k3^^0\ 3) при k3^Q^0 < 1, но & <С 1 мы имеем (S/Af)i ~ k3/2(DQ/rQ) X X Vo- На рис. 9.10 показана типичная зависимость от /г отноше- ния сигнала к шуму для одного кадра. Указаны три различные характерные области. Отметим асимптотическое приближение отношения сигнала к шуму к единице при больших к (справа). В этой области величина (S/W)i практически не зависит от яр- кости объекта. В средней области величина (S/2V)X увеличи- вается пропорционально среднему числу фотособытий, прихо- дящихся на площадь Когерентности. Только на третьем участ- ке, где полное число фотособытий, приходящихся на один кадр, намного меньше единицы, увеличение апертуры телескопа при- водит к повышению отношения сигнала к шуму. Этот послед- ний участок, вообще говоря, не имеет практического значения, так как здесь получающееся отношение сигнала к шуму мало. Дейнти и Гринеуэй [9.21] показали, что если действительное число фотособытий в данном кадре известно, то_в формуле (9.6.18) нужно вычитать его, а не среднее число К. Тогда ха- рактерная зависимость в средней области распространяется на третий участок слева. Таким образом, отношение сигнала к шуму остается пропорциональным величине /г во всех тех обла- стях, в которых /г <С 1. Названные авторы исследовали также так называемые (/-урезанные значения, при получении которых все кадры, имеющие меньше q фотособытий, отбрасываются и не
494 Глава 9 учитываются в процессе усреднения. В этом случае результаты оказываются более сложными, но, как было показано, при от- брасывании кадров, не содержащих ни одного или содержащих одно фотособытие, достига- Wj ется наилучшая характери- Рис. 9.10. Зависимость среднеквадратич- ного отношения сигнала к шуму для от- дельного изображения в случае спекл-ин- терферометра от среднего числа фото- событий на спекл. Условия: простран- ственная частота равна 0,8 частоты об- резания, диаметр зеркала телескопа ра- вен 1,5 м, атмосферный диаметр коге- рентности равен 10 см, нормированная спектральная плотность объекта равна 1,0 (соответствует объекту в виде то- чечного источника). стика и это приводит к тому, что отношение сигнала к шуму для одного кадра уве- личивается пропорциональ- но £, если 1, как и в средней области на рис. 9.10. Задачи 9.1. Рассмотрим характери- стическую функцию чис- ла фотособытий, проис- ходящих в интервале т при падении света на фоточувствительную по- верхность. Выразите эту характеристическую функцию через характе- ристическую функцию интегральной интенсив- ности падающего света W. Учтите, что для этого придется обобщить характеристическую функцию инте- гральной интенсивности W на случай комплексной пере- менной. 9.2. Используя характеристические функции, покажите, что плотность гамма-распределения (9.2.21) асимптотически стремится к гауссовской плотности при увеличении пара- метра V#. 9.3. Покажите, что биномиальное распределение с отрица- тельным показателем (9.2.24) сводится к распределению Бозе — Эйнштейна, если число степеней свободы равно единице. 9.4. Покажите, что если фоточувствительная площадь фото- приемника намного больше площади когерентности па- дающего света, обладающего взаимной спектральной чи-
Фундаментальные пределы точности 495 стотой, то число пространственных степеней свободы рав- но отношению площади фотоприемника к площади коге- рентности падающей волны. 9.5. Частично поляризованная волна теплового излучения па- дает на фоточувствительную поверхность. Полная инте- гральная интенсивность падающего света может рассмат- риваться состоящей из двух статистически независимых компонент (среднее значение Wi) и W2 (среднее зна- чение fF2). Следовательно, плотность распределения ве- личины W может быть представлена в виде свертки плот- ностей распределения величин ITi и W2. Покажите, что при этих обстоятельствах функция распределения Р(К) полного числа наблюдаемых фотособытий может быть представлена в виде дискретной свертки функций рас- пределения Р\(К) и Р2(К) чисел фотособытий, которые наблюдались бы при раздельном падении света интенсив- ностью и W2. 9.6. Соотношение (8.2.29) — это общее выражение для распре- деления фотоотсчетов, когда свет является тепловым по происхождению и частично поляризован. Покажите, что если степень поляризации равна нулю, то это выражение сводится к биномиальному распределению с отрицатель- ным показателем для случая при числе степеней свободы, равном 2JH. Повторите все для случая полностью поляри- зованного света, показав при этом, что распределение ста- новится биномиальным распределением с отрицательным показателем при числе степеней свободы, равном М. 9.7. Исходя из распределения Максвелла — Больцмана для чисел заполнения [формула (9.3.16)], покажите, что если уровни энергии гармонического осциллятора могут при- нимать только значения n/iv, то распределение чисел за- полнения является распределением Бозе — Эйнштейна, и определите среднее значение числа заполнения. 9.8. Покажите, что в случае многоэлементного фотоприемни- ка, изображенного на рис. 9.4, при использовании предпо- ложений, связанных с рассматриваемой там задачей (включая предположение о тепловом характере излуче- ния), функция корреляции между числами фотоотсчетов в /-м и &-м элементах фотоприемника равна E[K(j)K(k)] = +-Jr) при < + [У (/)12 (1 + -jt) при k = /.
496 Глава 9 9.9. Рассмотрим шумовые характеристики системы, изобра- женной на рис. 9.4, когда излучение, падающее на много- элементный фотоприемник, является квазитепловым и имеет большой параметр вырождения (т. е. бс 1). Сде- . лайте следующие предположения об относительных зна- чениях различных параметров: Найдите выражение для среднеквадратичного отношения сигнала к шуму в данных измерения видности интерфе- рограммы и сравните результат с полученным ранее [фор- мула (9.4.23)]. 9.10. Одномодовый лазер, стабилизированный по амплитуде, имеет модулированную интенсивность, которая зависит от времени следующим образом: /(0 = 4 l1 +cos(2nvm/ + e)], где /о и vm— известные постоянные, а 0 — случайная пе- ременная, однородно распределенная на интервале от 0 до 2л. а) Найдите среднее число k фотособытий, регистрируе- мых за время т. б) Найдите дисперсию числа фотособытнй, регистри- руемых за время т. 9.11. На фотоприемник падает излучение лазера, генерирую- щего N независимых мод равной интенсивности. Фотосо- бытия считаются в интервале, который достаточно мал, для того чтобы интенсивность падающего света можно было считать постоянной (но случайной) в этом интер- вале. __ а) Найдите среднее значение К и дисперсию ог^ наблю- даемого числа фотособытий, выразив последний результат через N и /С б) Выразите отношение классической компоненты диспер- сии фотоотсчетов к компоненте, соответствующей дробо- вому шуму, через N и 9.12. Некоторый процесс люминесценции дает очень короткие импульсы света, причем каждый импульс несет известную классическую энергию W Число импульсов, падающих на фотоэлектрический приемник в 1 с, имеют пуассонов- ское распределение с известным средним числом импуль- сов в секунду X. При помощи счетчика регистрируется
Фундаментальные пределы точности 497 число К фотоэлектронов, выходящих с фоточувствитель- ной поверхности за время измерения т. а) Выразите дисперсию <тд числа фотособытий К через среднее число фотоотсчетов К за время т и среднее число фотоотсчетов на импульс N. б) На основе результата п. «а» ответьте на вопрос: При каких условиях классические флуктуации должны преоб- ладать над флуктуациями, связанными с дробовым шу- мом самого процесса фотоэмиссии? 9.13. Некоторый фотоприемник дает конечный импульс извест- ной постоянной площади при регистрации каждого фото- события. В первом приближении такие импульсы можно считать прямоугольными импульсами длительностью т с максимальным напряжением У0- а) Предполагается, что излучение одномодового лазера, стабилизированного по амплитуде (интенсивность /0), па- дает на фоточувствительную поверхность (площадь = Л) фотоприемника. Найдите распределение напряжения V, на- блюдаемого на выходе фотоприемника в некоторой про- извольно выбранный момент времени tQ. б) Повторите п. «а» в случае поляризованного теплового излучения, не ограничивая время когерентности света. ЛИТЕРАТУРА 9.1. Einstein A. Ann. Phys., 1905, v. 17, р. 132. 9.2. Mandel L., Sudarshan E. C. G., Wolf E. Proc. Phys. Soc. (London), 1964, v. 84, p. 435. 9.3. Lamb W. E., Jr., Scully M. O. — In: Polarization: Matiere et Rayonne- ment. — Paris: Press Universitares de France, 1969, p. 363. 9.4. Mandel L. Fluctuations of Light Beams. — In: Progress in Optics, Vol. II, ed. E. Wolf. — Amsterdam: North-Ho!!and Publ. Co., 1963, p. 181. 9.5. Klauder J. R., Sudarshan E. C. G. Fundamentals of Quantum Optics. —* N. Y.: W. A. Benjamin, 1968. [Имеется перевод: Клаудер Дж., Судар- шан Э. Основы квантовой оптики. — М.: Мир, 1970.] 9.6. Saleh В. Photoelectron Statistics. — Berlin: Springer-Verlag, 1978. 9.7. Mandel L. The Case for and against Semiclassical Radiation Theory.— In: Progress in Optics, Vol. XIII, ed. E. Wolf. — Amsterdam: North-Ho!- land Pub!. Co. ! 976, p. 27. 9.8. Glauber R. J. — Phys. Rev., 1963. v. 130, p. 2529; v. 131, p. 2766. 9.9. Vernier P. J. Photoemission. — In: Progress in Optics, Vol. XIV, ed. E. Wolf. — Amsterdam: North-Ho!!and Publ. Co., 1976, p. 245. 9.10. Mandel L. — Proc. Phys. Soc. (London), 1959, v. 74, p. 233. 9.!!. Mehta C. L. Theory of Photoelectric Counting.—In: Progress in Optics, Vo!. VIII, ed. E. Wolf. — Amsterdam: North-Holland Publ. Co., 1970, p. 373. 9.12. Davenport W. E., Jr., Root W. L. Random Signals and Noise. — N. Y.: McGraw-Hil! Book Company, 1958. [Имеется перевод: Давенпорт В. Б., Рут В. Л. Введение в теорию случайных сигналов и шумов, —М.: ИЛ,
498 Глава 9 9.13. Abramowitz M.t Stegan I. A. Handbook of Mathematical Functions.— N. Y.: Dover Publications, 1972, p. 257. 9.14. Goldin E. Waves and Photons. An Introduction to Quantum Optics.— N. Y.: John Wiley and Sons, 1982, § 5.3. 9.15. Boyd R. U7. Radiometry and the Detection of Optical Radiation: — N. Y.: John Wiley and Sons. 1983, Ch. 3. 9.16. Siegman A. E. An Introduction to Laser and Masers.—N. Y.: McGraw- Hill Book Company, 1971, Ch. II. 9.17. Brigham E. O. The Fast Fourier Transform, Prentice-Hall, Englewood Cliffs. —N. J., 1974. 9.18. Walkup E F., Goodman J. №. —J. Opt. Soc. Am., 1973, v. 63, p. 399. 9.19. Roddier F. Signal-to-Noise Ratio in Speckle Interferometry fci Imaging in Astronomy AAS/SAO/OSA/SPIE Topical Meeting, Paper ThC6. — Bos- ton, 1975. 9.20. Goodman J. U7., Belsher J. F. Photon Limited Images and Their Restro- ration. Techn. Rep. RADC-TR-76-50 (March 1976), Precompensation and Postcopensation of Photon Limited Degraded Images. Techa. Rep. RADC- TR-76-382 (Dec. 1976), Photon Limitations in Imaging and Image Resto- ration. Techn. Rep. RADC-TR-77-175 (May 1977) (all available from Rome Air Development Center, Griffiss AFB, N. Y. 13441). 9.21. Dainty J. C., Greenaway A. //. — J. Opt. Soc. Am., 1979, v. 69, p. 786. 9.22. Walkup J. F. Limitations in Interferometric Measurements and Image Re- storation at Low Light Levels, Ph. D. Dissertation, Department of Elec- trical Engineering, Stanford University (July 1971). ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 9.1д. Snyder D. L., Random Point Process. — N. Y.r John Wiley and Sons, 1975. 9.2д. Saleh В. E. A., Teich M. C. Multiplied Poisson Noise in Pulse, Particle and Photon Detection. — Proc. IEEE, 1981, v. 69, p. 299. [Имеется пере- вод: ТИИЭР, 1981, т. 69.] 9.3д. Gagliardi R. М., Karp S. Optical Communications. — N. Y.: John Wiley and Sons, 1976.
Приложение А ПРЕОБРАЗОВАНИЕ ФУРЬЕ Преобразование Фурье — это, пожалуй, самый важный анали- тический инструмент для работы в области статистической оптики и в области современной оптики вообще. Поэтому мы приведем здесь краткий обзор наиболее важных теорем, касаю- щихся фурье-образов и фурье-преобразований, встречающихся на практике. Здесь не будут выводиться эти свойства и соотноше- ния. По данному вопросу рекомендуем читателю ряд прекрас- ных книг (см., например, [А.1—А.4]). А.1. Определения преобразований Фурье В этой книге мы выбрали такое определение прямого преобра- зования Фурье, которое имеет экспоненциальное ядро с поло- жительным показателем. Наши определения одномерного и дву- мерного фурье-образов (вообще говоря, комплексных) функций f (х) и f (х, у) таковы: 4-00 F(v) = J t(x)e,2KVX dx, (A.l) — оо 4-00 F (vx, vy) = f (x, y) el2n (vx*+v^) dx dy. (A.2) —-oo Им соответствуют определения одномерного и двумерного об- ратных фурье-преобразований 4-00 f(x) = J F (v)e~l2KvX dv, (А.З) — оо f(x, у}= $ F(VX> Vy)e-,2n^x+Vvy>>dvxdvy. (А.4) — оо Читателю, может быть, более привычны другие возможные определения этих преобразований. Например, часто прини-
500 Приложение А мается отрицательный показатель экспоненциального ядра фурье-образа (и положительный показатель в ядре обратного фурье-преобразования). Тогда естественно возникает вопрос: как фурье-образ, определяемый с положительным показателем ядра [обозначим его через F+(v)], связан с фурье-образом, определяемым при отрицательном показателе ядра [F“(v)]. Про- стые алгебраические выкладки показывают, что требуемое соот- ношение имеет вид F+(v) = F~(-v) (А.5) в одномерном случае и F+(vx, Vy) = F"(—vx, — vY) (A.6) в двумерном случае. Это позволяет от таблицы фурье-образов, отвечающих одному определению, легко перейти к таблицам, соответствующим другому определению. А.2. Основные свойства фурье-образа Теперь мы представим без доказательств ряд формул для одно- мерных и двумерных фурье-образов. Везде в этом приложении g и h представляют собой функции (вообще говоря, комплекс- ные) одной или двух переменных, a G и Н — их фурье-образы, определяемые в соответствии с (А.1) или (А.2). Во всех слу- чаях символ &"{ } означает оператор преобразования Фурье в одном или двух измерениях. Размерность должна быть ясной из контекста. Если приводится только одна форма соотноше- ния, то это значит, что она пригодна как для одномерного, так и для двумерного случая. Линейность. Если а и b — комплексные постоянные, то как для одномерного, так и для двумерного случая {ag + bh} = aG + ЬН. (А.7) Подобие. Если а й Ь — действительные постоянные, то {g («х» =||TG (-?-), (А.8) {g (ах, by)} = qiy G (-V-- -г1) • (А-9) Сдвиг. Если а и с — действительные постоянные, то ^{g(x-a)} = e/2"wG(v), (А. 10) F {g (х - а, у - b)} = е,т (vx“+vyb)G (vx, vY). (A.l 1)
Приложение А 501 Теорема Парсеваля. В случае одного измерения 4-оо +оо 5 lg(x)|2dx = $ |G(v)|2dv; (А. 12) — оо —-оо в случае двух измерений 4-00 4-.ОО 55 । 8'(х> y)'?dxdy = | G(vx> vy)|2dvxdvy. (A.13) — oo — OO Теорема» свертки. В случае одного измерения (^°° ) 5 8(W-h!=G(v)H(v); (А.14) в случае двух измерений ^h<x —У~ n)d^n| = G(vx, vr) Н (vx, vy). (A.15) Автокорреляционная теорема. В одном измерении И 5 h®h*(£-xMd = |H(v)|2; (А.16) в двух измерениях х, П — У) dl dx\ L = | H (vz, vy) |2. (A. 17) Интегральная теорема Фурье. Во всякой точке области не- прерывности функции g преобразование Фурье с последующим обратным преобразованием Фурье приводит к первоначальной функции g. В точке разрыва непрерывности функции g после- довательное применение прямого и обратного преобразования дает 1) в случае одного измерения — среднее арифметическое значение функции по обе стороны разрыва и 2) в случае двух измерений — угловое среднее значение функции около точки разрыва.
502 Приложение А А.З. Таблица одномерных фурье-образов В табл. АЛ приведены одномерные фурье-образы, которые встречаются в этой книге. Таблица A.L Одномерные фурье-образы Функция Фурье-образ е-ЛХ’ e-nV* 1 6(v) б(х) 1 1 , / 1 \ 1 . ( , 1 Л cos тех -6(v__)+_6(v+-) sin лх ~|<N + «О -.|<м 1 -Iм 1 «О rect х sine v А(х) sine2 v Л-|Х I 2 е 1 1 1 + (2jtv)2 1 _Lp-lv| I + (2лх)2 2 e /о (2ях) rect(v/2) л (1 — v2)1/2 Д (2лх) 2х (1 — v3)l/2 rect i sgn V тех einx* ехр тху (x • 2jtv А Г(т) V } m ) А.4. Таблица двумерных фурье-образов В табл. А.2 приведены двумерные фурье-образы, которые мо- гут встретиться в данной книге. Здесь г — радиус в плоскости (х,у), а р — радиус в плоскости двумерной пространственной частоты (0х, 9у).
503 Приложение А Таблица А.2. Двумерные фурье-образы Функция Фурье-образ rect x rect у Ъ(х, у) sine vx sine vy 1 __е-яг2 е-"(у?х+4)=е-яр2 circ г Ji (2лр) p Ь(г — a) 1 г A(x)A(t/) 2яа/0 (2лар) 1 Р sine2 vx sine2 Vy Г Jx (2лг) у L г J ГО i 1 о СЛ Д to 1'0 1 bo[-o I 1 CD О r*- o “ 1 ,e-/«(v2x+v2r)=.e-/V ЛИТЕРАТУРА АЛ. Bracewell R, N, The Foureir Transform and its Applications, 2nd ed.— N. Y.: McGraw-Hill Book Company, 1978. A.2. Papoulis A. The Fourier Integral and its Applications. — N. Y.: McGraw- Hill Book Company, 1962. A.3. Papoulis A. Systems and Transforms with Applications in Optics. — N. Y.: McGraw-Hill Book Company, 1968. A.4. Gaskill J. £). Linear Systems, Fourier Transforms and Optics. — N. Y.: John Wiley and Sons, 1978.
Приложение Б СУММЫ СЛУЧАЙНЫХ ФАЗОРОВ Поскольку метод случайных блужданий имеет очень важное значение в статистической оптике, мы изложим в данном при- ложении обобщение теории, рассмотренной в гл. 2, § 9. Там было сделано предположение о том, что фазы отдельных фазо- ров, входящих в сумму, независимы и однородно распреде- лены по интервалу (—л, л). Здесь мы получим результаты, при- менимые н в том случае, когда фазы имеют произвольную плот- ность распределения /ч(ф)> оставаясь при этом одинаково рас- пределенными и независимыми. Характеристическую функцию, соответствующую плотности распределения фазы, обозначим через Мф(о)). Как и в гл. 2, § 9, рассмотрим сумму а = ае'в = —=- £ а*е/чЧ (Б.1) *=1 где W— число независимых фазоров, дающих вклад в случай- ное блуждание, a — длина А-го фазора. Будем считать, что величины ak не зависят друг от друга и от фаз и имеют оди- наковое распределение. Действительная и мнимая части этой суммы имеют вид 1 N Г = Re {ае/е} = —/= £ ak cos <рь Vv *-> (Б 2) t = Im{ae,e} = —7= ^aftsin<pft. VW A=1 Ясно, что средние значения действительной и мнимой частей результирующего фазора могут быть записаны следующим об- разом: ! лг f = —f=- X dk cos ф*. **' (Б.З) ( N V 7 / = -т=- Sa*sin<p*. V N k = \
Приложение Б 505 Для дальнейшего упрощения заметим, что средние значения функций косинуса и синуса могут быть выражены через ха- рактеристическую функцию случайных переменных ф*. Разла- гая функции косинуса и синуса по формулам Эйлера, можно получить для этих средних значений выражения Г = ^р-[М ф(1) + М ф (-!)], /- (Б'4) Эти результаты — наиболее общие при сделанных выше предположениях, но их можно упростить, если использовать дополнительные ограничения. Например, если плотность рас- пределения случайных фаз принять симметричной относительно нуля, то характеристическая функция будет действительной и четной функцией переменной ю [Б.1]. Отсюда следует, что средние значения рассматриваемых действительной и мнимой частей принимают значения f = V# <х*Мф(1), 7= 0. (Б.5) Найдя первые моменты действительной и мнимой частей, займемся вторыми моментами, чтобы можно было вычислять дисперсии действительной и мнимой частей и их ковариации. Общие выражения для вторых моментов величин г и I та- ковы: г2 = 4- S S cos <pft COS Ф„, 27 k = \ n = l __ 1 AT _____________________ z2 = -rr E S a*a„ sin <p* sin <pn, (Б.6) 2V k = l n = l ^=TF S E a*a„ cos <pj sin <pn. n A=1 n~l Снова используя формулы Эйлера, получим следующие общие выражения для рассматриваемых моментов тригонометрических
506 Приложение Б функций: '-г12МФ(|)МФ(-|) + МФ(|) + МФ(-!)] при k п, COS (Pfc cos (prt = < -L12 + Мф (2) + Мф(-2)1 при k== п, '4-[2Мф(1)Мф(-1)-М2(1)-М2 (-1)] при k=^ п, sin (pfc sin (pn = < 1 (Б.7) при k = /г, при k =/: П, cos (pfc sin (pn = < ^-[Мф(2)-Мф (-2)1 при k=tl. Комбинируя эти выражения, найдем для интересующих нас вторых моментов выражения г2 = -^[2 + Мф(2) + Мф(-2)] + + -(^~4И5)2 (W1)ЛМ-О + мф(!) + МФ (-1)]’ 7=4[2-Мф(2)-Мф(-2)] + + [2МФ (1) Мф (-1) - Мф (I) - Мф (-1)], (Б.8) * = % [Мф(2) - Мф(—2)] + [М2 (1) - М2 (-1)]. Вычитая квадраты средних значений из г2 и Z2 и произведение средних значений из ri, найдем дисперсии и ковариацию о2г = 4 [2 + Мф (2) + Мф (“2)1 - --[2МФ(1)Мф(—1) + М2 (1) + М2 (-1)], °г« = qp[2 — Мф(2) — Мф(—2)] — (Б.9) --Ц£[2Мф(1)Мф(-1) - М2 (1) - М2 (-1)], cov (г, /) = [Мф (2) - Мф (-2)] - [М2 (1) - М2 (-1)]. В частном случае, когда плотность распределения фаз четна относительно начала отсчета, получим более простые выра-
Приложение Б 507 жения: а2г = ^[1 + Мф(2)]-(а)2М*(1), <4 = 4 П-Мф(2)], (Б.10) cov(r, /) = 0. Наконец, если фазы распределены однородно, то Мф(1) = Мф(2) = 0 (Б.11) и дисперсии и ковариация таковы: 2 _ 2 _ а2 г ‘ 2 ’ (Б. 12) cov(r, 0 = 0, что идентично результатам, полученным в гл. 2, § 9. Имеется одна тонкость, касающаяся метода случайных блу- жданий. В гл. 2, § 9 было показано, что если число членов в сумме (Б.2) быстро растет, то, согласно центральной пре- дельной теореме, распределение действительной и мнимой ча- стей суммы асимптотически стремится к гауссовскому распре- делению. Это справедливо независимо от того, имеют ли фазы, связанные с индивидуальными вкладами, одинаковые распре- деления. Но по предположению действительная и мнимая ча- сти асимптотически являются совместно гауссовскими случай- ными переменными, т. е. они вместе описываются гауссовской плотностью распределения второго порядка [формула (2.9.5)]. В то время как гауссовский характер их маргинальных плот- ностей следует из центральной предельной теоремы, их сов- местный гауссовский характер менее очевиден. Чтобы доказать совместную гауссовость, сделаем упрощаю- щее предположение о том, что фазы (р* — однородно распре- деленные независимые случайные переменные. Сохраним пред- положение о том, что амплитуды не зависят от фаз и друг от друга. Совместная характеристическая функция действи- тельной и мнимой частей г и I дается выражением Mr/ (©j, ш2) = Е& (<^+<*0]. (Б. 13) Введем полярные координаты в плоскости (01,02) соотноше- ниями <01 = a cos X, ,Б14) fi>2 = Qsin%. 1 ’ Подставив (Б.2) и (Б. 14) в (Б. 13), с учетом тригонометриче- ского тождества cos A cos В 4- sin A sin В = cos (Л — В) полу- чаем для характеристической функции выражение Мг/(<оь со2) = Е ехр | —т=- Ё a*Q cos (х — <Pi) ( • (Б.15) L С /V ) -
508 Приложение Б Воздержимся на некоторое время от усреднения по а вы- числим условное среднее по ф*, что даст нам n tAri (©„ (02) = П ро (-^=г)], (Б. 16) где /о — функция Бесселя первого рода нулевого порядка. При увеличении Af аргумент функции Бесселя уменьшается, так что функция может быть аппроксимирована двумя первыми чле- нами ее разложения в степенной ряд относительно начала от- счета: n ®2)= П £а[1 -(т=7]. (Б-17) Теперь выполним усреднение по амплитудам ak, что приведет к выражению <02) = [1 (Б.18) Если число Af шагов случайного блуждания устремить к бес- конечности, то совместная характеристическая функция дей- ствительной и мнимой частей будет асимптотически стремиться к гауссовской функции с круговой симметрией: lim Мн(<в„ = (Б. 19) Лг->оо И наконец, обратное преобразование Фурье этой характеристи- ческой функции приводит к двумерной гауссовской совместной плотности распределения /Л 1 f Г2 + /2 ) /г? Рн (г, i) = ехр ]--------=— I. (Б.20) 4ла2 ( 4а2 J Таким образом, мы доказали, что действительная и мнимая ча- сти случайных блужданий являются совместными гауссовскими случайными переменными. В проведенных нами рассуждениях предполагалось, что фазы индивидуальных компонент случайных блужданий рас- пределены однородно, но путем более- сложных рассуждений можно показать, что совместное распределение оказывается асимптотически гауссовским даже в том случае, если фазы рас- пределены неоднородно. ЛИТЕРАТУРА Б.1. Bracewell R, N. The Fourier Transform and its Applications, 2nd ed.— N, Y.: McGraw-Hill Book Company, 1978.
Приложение В ЧЕТВЕРТЫЙ МОМЕНТ СПЕКТРА РЕГИСТРИРУЕМОГО СПЕКЛ-ИЗОБРАЖЕНИЯ В данном приложении вычисляется четвертый момент фурье- образа изображения, используемого в спекл-интерферометрии. Задача состоит в том, чтобы вывести формулу (9.6.20). Будем исходить из выражения (9.6.19), которое мы воспро- изведем здесь для удобства: к к ,к к £ II D I4] = S S S S Е [ехр {/2л [vx (х„ - хт + хр - х„) + п = 1 т=1 р=1 ?=1 + vy (уп — ут + ур - г/?)]}]. (В.1) Члены с К4 в этой сумме могут быть разбиты на 15 клас- сов: 1. n=m=p=q 2. п = т, p = q, п^=р 3. п = т, p=/=q — n 4. п = р, m = q, п=/=т 5. п = р, tn=£q=£n 6. n = q, т = р, п^=т 7. n = q, т=/=ру=п 8. п = т = р, ny=q 9. n = p = q, п^р 10. n = p = q, n=/=tn 11. p = q = m, n^tn 12. n#=m=#/?y=Q 13. p = q, n^=m=/=p 14. m = q, n=£tn=£p 15. m = p, n^*m=/=q К членов,- К (К — 1) членов, К (К— 1)(К —2) членов, К. (К — 1) членов, К {К— 1)(К-2) членов, К (К — 1) членов, К(К- 1)(К-2) членов, К(К — 1) членов, К (К— 1) членов, К (К— 1) членов, К (К — 1) членов, К {К - 1) (К - 2) (К - 3) членов, К (К— 1)(К — 2) членов, К (К — 1) (К — 2) членов, К(К- 1)(К-2) членов. Сначала будем рассматривать условное распределение при известной скоростной функции Х(х,у), а затем усредним ре- зультат по X. Таким образом, сначала усредним по 2К+ 1 слу- чайным переменным (хь у\), (х2,//г)> ••• (хк,Ук), К- Замечая, что для пуассоновской случайной переменной К имеет место следующее среднее значение, вычисленное по распределению
510 Приложение В величины К при условии, что величина X известна: Е[К(К—\) ... (tf-*+l)] = [W, (В-2) где — условное среднее величины /С, вклады 15 наборов членов, приведенных выше, можно теперь записать в следую- щем виде: 1. Км, 2. [М» 3. [WlA(vx> vr)|2, 4. [WIA(2vx> 2vr)|2, 5. [WA(2vx, 2vr)[A*(vx, vr)]2, 6- K(d2, 7. (W|A(vx, vr)|2, 8- IWlA(vx> vr)|2, 9. [W|A(vx, vr)|2, 10. Kw]2|A(vX) vr)|2, H- (W|A(vx, vr)|2, 12. [WlA(vx> vr)|4, 13. [W|A(vx, vr)|2, 14. [Aw]3A*(2vx, 2vr)[A(vx, vr)]2, 15. [WlA(vX) vr)|2. Здесь использовано определение y)ei23l^x+v^dxdy A(vx> vr) = —-----------------• (B.3) Я, (x, y) dx dy — co Далее, замечая, что A(vx, vr) = (vx, vr), (B.4) и комбинируя эти результаты, получаем Е [| D |4] = К(К) + 2 [К(Л>]2 + 4 [ 1 + Awl I Л (vx, vr) |2 + 4-A(2vx, 2vr)[A*(vx, vr)]2 + A* (2vx, 2vr)[A(vx, vr)]2 + +1 A (2vx, 2vr) |2 +1 A (vx, vr) |4. (B.5)
Приложение В 511 Чтобы упростить этот результат, запишем величину A(vx, vr) с указанием ее модуля и фазы: A(vx, vy) = |A(vx, vr)|e/0(v*-4 (В.6) а четвертый момент величины Z) —в виде Е И D Г] = + 2 [К(М]2 + 4 [ 1 + [Л (vx, vr)]2 + + 2|A(2vx, 2vr)||A(vx, vr) |2 cos [6 (2vx, 2vr) — 26(vx, vr)] + + |A(2vx, 2vr)|2 + [A(vx, vy)]4. (B.7) Теперь остается произвести усреднение по распределению величины Х(х, у). Если распределение интенсивности изображе- ния занимает конечную область с размерами L X L, то при до- вольно общих условиях vx > 1/L и vyi>l/L величина A(vx,vy) будет приблизительно комплексным гауссовским слу- чайным процессом с круговой симметрией и корреляцией, рас- пространяющейся на область с размерами приблизительно 2/L X 2/L в частотной плоскости. Отсюда следует, что фаза 9 однородно распределена в интервале (—л, л) и что |Л|2 под- чиняется экспоненциальному распределению с отрицательным показателем. Кроме того, на таких частотах все величины 0(2vx, 2vy), 9(vx, vy), |A(2v%, 2vy)| и | A(vx, vy) | приблизительно независимы. На этом основании, проводя усреднение по X, на- ходим Е [А(м] = А. £[2|A(2vx, 2vy)||A(vx, vy)|2cos]6(2vx, 2vr) — 26(vx, vr)]] = 0, £[|A(vx, vy)|2] = <^(vx, vy), (B.8) £[|A(vx, vy)|4] = 2^(vx, vy). Подставив эти выражения в (В.7), получим окончательный ре- зультат £[|D|4] = £ + 2£2 + 4(l+£)^(vx, vr) + + (2vx, 2vy) + (vx, vy), (B.9) который согласуется с выражением (9.6.20). Следовательно, доказательство завершено.
Предметный указатель Аберрации 316, 317 Аберрационная фаза 293 Абсолютно черное тело 458 Автоковариационная функция 82 Автокорреляционная теорема 501 — функция 78, 81 ----- временная 78 ---------- пространственная 345 ------ статистическая 78 ------ экрана 360 Адаптивная оптика 429 Амплитуда изображения 304 — фазорная 102 -----зависящая от времени 106,288, 291 Амплитудная интерферометрия 462 — передаточная функция 305 — синусоидальная решетка 310 — функция размытия 283, 288, 289, 291, 295 Амплитудный интерферометр 258 — коэффициент (функция) пропуска- ния 214, 274, 288 ----- тонкой лиизы 276 Анализатор поляризации 125, 129 Аналитический сигнал 51, 103, 106— 109, 325 Аналитическое сигнальное представ- ление 103 Апертура (линзы) физическая 285 Апертурная диафрагма 284 Апертурный синтез 318 Астрономический телескоп 415 Атмосферная модель 366—370 Атмосферный диаметр когерентности 390, 403, 404 Байеса формула 26 Биномиальное распределение 93 -----с отрицательным показателем 448 Бозе-эйиштейновское распределение 445, 446 Борновское приближение 373—375, 434 Быстрое преобразование Фурье 165 Ван дер Поля уравнение 142 Ван Циттерта — Цернике теорема 200—213, 224, 225, 292, 293, 315, 317, 333, 334, 452 -------обобщенная 210, 213, 294 Вектор числа фотоотсчетов 464, 465 Векторный интервал 315, 419 Вероятность 18, 19 — маргинальная 24 — совместных событий 23 — условная 24 Взаимная интенсивность света 176, 178, 201, 294 — когерентность, функция 156, 170, 178 ----- распространение 189—200 — корреляционная функция 83—85 — спектральная плотность 83—85, 185 ----- распространение 194—196 -----чистота 181 —189, 222, 247, 261 Взаимные статистические свойства 244, 257 Взаимный коэффициент пропускания 301 Взаимнооднозначное отображение 33 Взаимоисключающие события 19 Видность интерференционных полос 160, 177 Вихри турбулентные 367 Внешний масштаб турбулентности 367 Внутренний масштаб турбулентности 367 Волна затухающая 199
Предметный указатель 513 Волновая структурная функция 380 --------в ближней зоне 383—389 —-------для сферической волны 405—406 Волновое уравнение, описывающее распространение взаимной когерент- ности 192—194 — поле полностью когерентное 196 ----- некогерентное 196 Волновой параметр вырождения 455, 461 Волны взаимно когерентные 177 — некогерентные 177 — частично когерентные 177 Восстановление фазы 324—328 Временная автокорреляционная функ- ция 78 — когерентность 155, 156—166 Время когерентности 156, 161, 164 — корреляции 150 — наблюдения в интерферометре ин- тенсивностей 480 ----------Майкельсона 472 Входной зрачок 285, 315 Выборочная функция 65 Вынужденное нзлучеиие 139, 142 Вырождение, параметр 453 Вытянутые сфероидальные функции 242 Выход квантовый 440 Выходной зрачок 284, 315 Гало усредненной ФРТ диффузное 351, 354 Гауссовская плотность распределе- ния 23, 40 — сфера отсчета 293 — форма спектральной линии 162 Гауссовские случайные переменные 41—50 Гауссовский контур 232, 268 — случайный процесс 86—88 -------- для поляризованного тепло- вого источника 123 --------линейно отфильтрованный 87 --------комплексный 110—112 Гауссовский случайный процесс,ком- плексный круговой НО, 123 ------- стационарный в широком смысле 87 -------строго стационарный 87 -----фазовый экран 355—359, 432 Гауссовское распределение, круговое совместное НО Геометрическое распределение 445 Гельмгольца уравнение 194, 195, 223 Гильберта преобразование 104—109, 193, 326 Гильбертовский фильтр 105 Гипотеза замороженной турбулентно- сти (Тейлора) 304 Голограмма 434 Грина функция 372 Дважды стохастические пуассонов- ские процессы 90, 97—99 Двойная звезда 418 Деление амплитуды 155 — волнового фронта 155 Деполяризационные эффекты 372 Диаметр источника, угловой 321 Дирака 6-функцня 92 Дискретное преобразование Фурье (ДПФ) 466 Дисперсия 26 Дифракционная спектроскопия 165 Дифракция 213—219 — Фраунгофера 203, 217 Диффузное гало усредненной ФРТ 351, 354 Длина когерентности света 161 Дробовой шум 454 Затухающая волна 199 Звездная спекл-нитерферометрия 17, 414—429, 494 ----- эвристический анализ 419—423 -----полный анализ 423—427 -----шумовые ограничения 482—494 -----отношение сигнала к шуму 490—492 Звездный интерферометр Физо 319, 320
514 Предметный указатель Звездный интерферометр Майкельсо- на 320, 321, 338, 417, 464 Зеркало Ллойда 220 Зрачок входной 285, 315 — выходной 284, 315 Избыточность оптической системы 317 Излучение абсолютно черного тела 458 — вынужденное 139, 142 — естественное 126, 132 — квазитепловое 149, 150, 158, 228— 244, 268 — лазерное 122, 138—150 -----многомодовое 145—149 — одномодового лазера 267 — спонтанное 139, 142, 146 — тепловое 122—138, 228, 230, 239 ----- неполяризованное 125—127 ----- поляризованное 123—125 ----- частично поляризованное 127— 129, 237 Изопланатная система 295 Изопланатное предположение 384 Изотропный случайный процесс 365 Импульсный отклик фильтра 77 Инерционная подобласть спектра тур- булентности 367 Интеграл свертки 295 — суперпознцнонный 295 Интегральная интенсивность 228— 244, 439 — теорема Фурье 501 Интегрирование по источнику 287— 290 Интенсивность изображения 286, 287 — света 124 ----- интегральная 234 -----мгновенная 124, 136, 228 — — взаимная 176, 178 Интервал счета 448, 478, 479, 480 — векторный 315, 419 Интерференция деструктивная 157 — конструктивная 157 Интерферограмма 158, 165 — Юнга 316, 317 Интерферометр амплитудный 258 — звездный Физо 318, 319, 320 -----Майкельсона 320, 321, 338, 417, 464 — интенсивностей 16, 257, 258, 260, 473 -----выходной сигнал 260—263 ----- классический анализ 257—267 -----классический, или собственный, шум 263—267 -----преимущества и недостатки 259, 481, 482 -----счетчиковый вариант 474 — Майкельсона 156, 221 — тройной 427 Интерферометрия амплитудная 17, 462 — интенсивностей 17, 463 Источник квазнодиородный 211 — круговой формы 207 Кажущаяся передаточная функция 311 Карунена — Лоэва разложение 111 Катастрофа ультрафиолетовая 458 Квазиоднородиый источник 211 Квазитепловое излучение 149, 150, 158, 228—244, 268 Квантовый выход 440 Кёлеровское освещение 289, 290 Классический анализ интерферометра интенсивностей 257—267 — нли собственный шум 263 Ковариационная матрица 43, 48, 86 Ковариация случайной переменной 27 Когерентность временная 155, 161, 172 — высшего порядка 227—267 — оптических волн 155—226 — пространственная 155, 166, 172 ----- неполная 450—453 — усредненная по ансамблю 272, 332—337 — частичная 170, 271—339 Колмогорова спектр 367, 400—430 Комплексная огибающая 105, 106
Предметный указатель 515 Комплексная степень когерентности взаимной 171, 178 -------- собственной 159, 160 -------- спектральной 195 — функция зрачка 215, 216, 308,314, 345 Комплексный гауссовский случайный процесс 110, 111 — коэффициент когерентности 176, 178 Комплексные случайные переменные 46—50 -------- гауссовские 48—50 Конденсорная система 290 -----Кёллера 215 Конечная средняя мощность 73 Контраст спекл-структуры 331 Корреляция случайных переменных 27 Коэффициент асимметрии 251, 252 — когерентности, комплексный 176, 178 — корреляции 27 — пропускания амплитудный 188, 274, 288 -----взаимный 301 Критерий разрешения рэлеевский 308, 309, 310 — Спарроу 310 Критическое освещение 290 Круговое совместное гауссовское рас- пределение 110 Круговой комплексный гауссовский случайный процесс 111, 123 Лазерное излучение многомодовое 145—149 -----одномодовое 267 Лампы низкого давления 162 — высокого давления 163 Линейно отфильтрованные гауссов- ские случайные процессы 87 ----- пуассоновские процессы 90, 99—101 Линейно-системный подход для ис- следования формирования изобра- жения 295—302 Линейный фильтр 76 Лииза тонкая 275 — уравнение 282 Логарифмическая флуктуация ампли- туды 375 Логарифмическн-нормальное распре- деление 374, 376 Лоренцевская форма спектральной линии 163 Лоренцевскнй контур 232, 233, 268 Майкельсона интерферометр 156, 221 ----звездный 320, 324, 338, 417, 464 Максвелла уравнения 371 Малых возмущений метод 372 Манделя формула 441 Масштаб турбулентности внешний 367 — — внутренний 367 Маргинальная вероятность 24 — плотность распределения 24 Матрица ковариационная 43, 48, 86 — когерентности 130, 135, 151 — поляризационная 128 — унитарная 129 ---- поляризационная 133 Мгновенная частота генерации 141 Метод корреляции до фоторегнстра- цин 462 ----после фоторегистрацин 463 — малых возмущений 372 Многомодовое лазерное излучение 145 Модуляционная передаточная функ- ция (МПФ) 416 Момент второй 26 — n-й центральный 42 — первый 26 — четвертый 507 — центральный 26, 42 — факториальный 441, 443 Моменты случайных переменных 26— 27 -------смешанные 27—29 -------совместные 67 — функций распределения 88, 264
516 Предметный указатель Набор событий 18 Наклон волнового фронта 409 Некогереитное поле 199 Некогерентный предел 302 Неоднородная среда 362—366 Неравенство Шварца 27, 197 Область ближнего поля 412 — дальнего поля 216, 412 Объект синусоидальный амплитудный 310—312 — тонкий пропускающий 272 — шероховатый 330 Огибаюшая комплексная 105, 106 Оптическая передаточная функция (ОПФ) 303 --------при длительной экспозиции 407—414 -------- при короткой экспозиции 378—389 --------усредненная 345—347 — разность хода 158 - - ширина полосы 481 Опыт Юнга 167—175, 190, 222, 223, 258, 313, 332 Освещение кёлеровское 290 — когерентное полностью 302 — критическое 290 Осциллятор гармонический 459 Отверстия конечных размеров 178— 181 Отклонение стандартное 27 Относительная частота 19 Относительное смещение 253 Отношение сигнала к шуму средне- квадратичное (СКВ) 231 ----------на выходе интерферомет- ра 263 ---------- для звездной спекл- интерферометрни 490—492 Параксиальное приближение 173, 202, 211, 216, 276, 278 Параметр вырождения 453—426 ---- для теплового излучения 458 ----волновой 455, 460, 461 ----- фотоотсчетов 455 Парсеваля теорема 74, 115, 501 Пеле — Винера условие 326 Передаточная функция 77, 84, 297 ----- амплитудная 305 -----кажущаяся 311 —-• — оптическая (ОПФ) 303 --------- усредненная 345 Планка постоянная 440, 459 Плотность гамма-распределення 236, 447 — мощности спектральная 109, 161— 165 --------спекл-структуры 334 — распределения 21, 22 -----гауссовская 23, 40 ----- второго порядка 66 ----- интегральной интенсивности 233—244 ----------приближенная форма 233—239 ----------точная форма 139—144 -----Коши 62, 63 -----n-го порядка 43, 67 ----- первого порядка 66 -----пуассоновская 40, 61 -----рэлеевская 55, 124, 421 -----совместная 30, 86 Площадь когерентности 200, 203 ----- источника 213 Показатель преломления земной ат- мосферы 363 Полностью коррелированные компо- ненты 132 Полуклассическая теория фоторегн- страцни 438—440 Поляризационная матрица 128 ----- унитарная 133 Поляризация частичная 127, 449 Поляризованный по кругу свет 131 Постоянная Больцмана 459 — Планка 440, 459 Пределы некогерентный н когерент- ный 302—310 — точности измерения интенсивно- стей 464
Предметный указатель 517 Пределы точности при фотоэлектри- ческой регистрации света 437—497 Предельная точность 244 Предельные формы усредненной ОПФ, ФРТ 359—362 Представление аналитическое сигналь- ное 103, 106 Преобразование Гильберта 104—109, 193, 324, 325, 326 ---- обратное 325 — Лапласа 325 — матричное унитарное 134 — многомерных распределений 35 — общее 31—33 — Пуассона 441 — Рытова 374, 375 — Фурье 499—503 ----быстрое 165 ----дискретное 466—468 Преобразования случайных перемен- ных 31—37 Приближение борновское 373 — параксиальное 173, 202, 211, 216, 276, 278 — Рытова 375, 430, 434 — Френеля 373 Приводимость функции когерентности 181, 183—187 Принцип Гюйгенса — Френеля 119, 190—193 Произведение флуктуаций числа фотоотсчетов 475, 477 Пространственная автокорреляцион- ная функция 345 — когерентность 166—181 — спектральная плотность мощности спекл-структуры 334 Прямоугольная форма спектральной линии 163 Пуассона преобразование 441 Пуассоновский случайный процесс 88—101 -------дважды стохастический 90, 97, 98 -------импульсный 89, 439 Пуассоновский случайный процесс линейно отфильтрованный 90, 99—101 Пуассоновское распределение 91—93 Развернутая фаза 427 Разложение Карунена — Лоэва 111 — 112, 240 Райсовское распределение 57, 376 Распределение биномиальное 93 ----- с отрицательным показателем 448 — Бозе — Эйнштейна 445 — геометрическое 446 — логарифмическн-нормальное 376 — Максвелла — Больцмана 459 — Райса (райсовское) 57, 376 — рэлеевское 421 — числа фотоотсчетов в случае из- лучения одномодового лазера 442— 444 ------------- поляризованного теп- лового излучения 444—448 — экспоненциальное с отрицательным показателем 125, 331, 421 Распространение взаимной интенсив- ности 194, 195 ----- когерентности 189—200 -----спектральной плотности 194— 196 — световых (электромагнитных) волн 119—122, 370—376 Рассеиватель 149, 150, 187, 188, 189, 223 Расстояние Рэлея 338 Решение Рискена 144 Рэлеевская плотность распределения 55, 57, 124 Рэлеевский критерий разрешения 308, 309, 310 Рэлеевское распределение 421 Свет взаимно спектрально чистый 183 Световой сигнал немоиохроматнче- ский 120—121, 220 -----узкополосный 121, 127, 190 -----широкополосный 220
518 Сгущение фотособытий 455, 457 Синусоидальная амплитудная решет- ка 310 Система нзоДланатная 295 Скалярная теория световых волн 118 Скоростная функция пуассоновского процесса 487 Скорость импульсного пуассоновского процесса 8Я 484 Случайная аподизация 348 — неоднородная среда 342, 362—378 Случайные блуждания 421 — переменные 18—63 ---- антнкоррелнрованные 28 — — гауссовские 41—45 — — дискре'ГНые 20 — — комплексные 46—50 --------совместно круговые 49 --------гауссовские 48—50 ---- некоррелированные 28 ----непрерывные 20 ----полностью коррелированные 28 — — смешанные 20 ----совместно гауссовские 42, 44— 46 ----статистически зависимые 29, 45 —-------независимые 25, 28, 39, 40, 44, 56 Случайные процессы 65—112 — флуктуации показателя преломле- ния 15, 363 Случайный процесс гауссовский 86— 88 --------комплексный круговой НО, 123 — — изотропный 365 ----линейно отфильтрованный 76 ----пространственно однородный 364 — — пуассоновский 88—101 ----совместно стационарный в ши- роком смысле 83 ----статистически однородный 364 ----стационарный 69 --------в первых приращениях 68, 69, 356 --------в широком смысле 68, 69 Предметный указатель Случайный процесс строго стационар- ный 68, 69 ---- эргодический 69 — экран поглощающий 348—362, 431 ------ тонкий 343 ----фазовый 354—362 -------гауссовский 355—359, 432 — эксперимент 18, 65 Смещение относительное 253 Собственные значения матрицы 135 Событие элементарное 18 События взаимоисключающие 19 Совместная плотность распределения 23, 30, 66, 86 -------n-го порядка 31 — случайная переменная 23 — функция распределения 23 ----характеристическая двух пере- менных 30, 86 — rt-го порядка 30 Совместно гауссовские случайные переменные 42, 44, 46 ------круговые комплексные случай- ные переменные 49 Совместное распределение 23 Спектр мощности Кармана 368 ------Колмогорова 367 — угловой 306 Спектральная линия, форма 162 — плотность 83—85, 185 ------ распространение 194—196 ------мощности 73, 109, 161 —165,364 --------- пуассоновских процессов 94—97 ---------спекл-структуры, простран- ственная 334 ------ энергии 73 --------- пуассоцовскнх процессов 94—97 Спекл-ннтерферометрия звездная 17, 414—429, 482—494 — — эвристический анализ 419— 423 ------полный анализ 423—427 ------шумовые ограничения 482— 494
Предметный указатель 519 Спекл-интерферометрия звездная, от- ношение сигнала к шуму 490—492 Спекл-структура 271, 328, 329, 415 — контраст 331 — статистические характеристики первого порядка 329—332 Спекл-эффекты при когерентном фор- мировании изображения 328—337 Спонтанное излучение 139, 142, 146 Среднее по времени 71 — по ансамблю 71 Среднеквадратичное (СКВ) отноше- ние сигнала к шуму 229, 231 Средняя конечная мощность 73 Стандартное отклонение 27 Статистически зависимые случайные переменные 29, 45 — независимые случайные перемен- ные 25, 28, 39, 40, 44, 56 Стационарность 68 Степени свободы временные 451 ----пространственные 451 Степень комплексная когерентности взаимной 171, 178 -------собственной 159, 160 ------- спектральной 195 — поляризации 133—135 Структурная постоянная флуктуаций показателя преломления 367, 401 — функция 82 ----для показателя преломления 368 -------сферической волны 405—406 ---- волновая 380 ----в ближней зоне 383—389 ---- квазиоднородная модель 401 ----логарифмической амплитуды 384 ----фазовая 385, 386 ----флуктуаций показателя прелом- ления 368 Сумма случайных фазоров 50—60, 251, 504—508 Суммы действительных случайных переменных 37—41 Суперпозицнонный интеграл 295 Тальбота эффект 394 Теорема автокорреляционная 501 — Ван Циттерта—Цернике 200—213, 224, 225, 293, 315, 317, 333. 334, 452 -------обобщенная 210, 213, 294 — Винера — Хинчина 78—83 — выборки (Котельникова) 459 — о моментах 264, 335 -------для действительных гауссов- ских переменных 46, 264 -------для комплексных гауссов- ских переменных 50, 247, 261 — Парсеваля 74, 115, 501 — предельная центральная 39—41 — Фурье интегральная 501 — Шелла 216 Теория вероятностей, аксиомы 19 — световых волн скалярная 118 Тепловое излучение 122—138,228,230. 239 ----- неполярнзованное 125—127 ----- поляризованное 123—125 ----- частично поляризованное 127— 129, 237 Тонкая линза 275 Тонкий пропускающий объект 272 — случайный экран 343 Точность определения видности и фазы 469 — предельная 244 Турбулентная атмосфера 343, 366— 370 Турбулентные вихри 364, 367 Увеличение системы освещения 290 Угловая пространственная частота 388, 389, 413 Угловой спектр 306 Ультрафиолетовая катастрофа 458 Унитарная матрица 129 Унитарное матричное преобразование 134 Уравнение Ван дер Поля 142 — волновое 194—196 — Гельмгольца 194, 195, 223
520 Предметный указатель Уравнение линзы 282 — Риккати 374 Уравнения Максвелла 371 Условие квазимонохроматичности 175 — Пеле — Ринера 326 — полного времени задержки 277 — полной когерентности 196 Условная вероятность 24 — плотность распределения 25 Усредненная оптическая передаточ- ная функция (ОПФ) 345—347 ----------предельная форма 359— 362 ---------- при длительной экспози- ции 378—380 ---------- при короткой экспозиции 379, 407—414 ---------- экрана 347 — функция размытия точки (ФРТ) 347—348, 359 ----------предельная форма 359— 362 ---------- центральная сердцевина 351, 358 Фаза развернутая 427 Фазовая информация, значение 321 — 324 — структурная функция 385, 386 Фазор 50 — постоянный 56 Фазорнаи амплитуда 102 ----зависящая от времени 105, 106, 288, 291 Факториальный момент распределе- ния 441 Физическая апертура линзы 284 Фильтр гильбертовскнй 105 — линейный 76 Фильтрующие функции для амплиту- ды и фазы 390—399 ----для логарифмической амплиту- ды и фазы 398, 399 Флуктуации большие 430 — малые 430 — числа фотоотсчетов 450, 475, 477 Фокальная плоскость 277 Фокусное расстояние линзы 276 Форма спектральной линии гауссов- ская 162 ------- лоренцевская 163 -------прямоугольная 163 Формирование изображения как ин- терферометрический процесс 312— 317 Формула Байеса 25 — Манделя 441 — свертки 76 — умножения вероятностей 25 Фотоотсчет 438 Фотоприемник 15 Фотособытие 438 Фоточувствительная поверхность 438 Функция автоковариационная 82 — автокорреляционная временная 78 ---- комплексной функции зрачка 216, 303 ---- пространственная 345 ---- статистическая 78 ---- экрана 360 — взаимной интенсивности падающе- го света 290—295 ---- спектральной плотности 84 ----когерентности 156, 170, 178 -------падающего света 274 -------предельные формы 196—200 -------падающего света 274 -------предельные формы 196—200 -------прошедшего света 274 — выборочная 65 — вытянутая сфероидальная 242 — Грина 372 — зрачка комплексная 215, 216, 308, 314, 345 ----фурье-образ 297 — когерентности 155 ----временная 155, 157, 161 ----(яЧ-т)-го порядка 227 ----четвертого порядка 16, 230 ---- приводимая 181 ---- пространственная 155, 172 — корреляционная взаимная 83—85
Предметный указатель 521 Функция размытия амплитудная 283, 288, 289, 291, 295 ---точки (ФРТ) усредненная 347, 348, 359 ----------предельные формы 359— 362 ---------- центральная сердцевина 351, 358 ----- ннтенснвностн 302 — распределения 20 — собственной когерентности 159, 178 — структурная 82 ---для показателя преломления 368 -----сферической волны 405—406 ----- волновая 380 -----в ближней зоне 383—389 ----- квазиоднородная модель 401 -----логарифмической амплитуды 384 — — фазовая 385, 386 ---флуктуаций показателя прелом- ления 368 — характеристическая 29, 86 -----совместная двух переменных 30 — Эйри 310 — экрана автокорреляционная 360 Фурье-спектроскопия 81, 165, 166,221, 324 Фурье-образы, основные свойства 500—503 — одномерные 502 — двумерные 502 — четырехмерные 279, 298 Характеристическая функция 29, 86 -----совместная двух переменных 30 Центральная предельная теорема 39— 41 — сердцевина усредненной ФРТ 351 Частичная когерентность 170, 271 — 339 — поляризация 127, 449 Частота генерации мгновенная 141 — относительная 19 Число заполнения 459 — степеней свободы 447, 448 — фотоотсчетов 438 — фотособытий на сигнал 491 — ячеек когерентности 236 Чистота взаимная спектральная 181 — 189, 222, 248, 261 Шахматный экран 351—353 Шварца неравенство 27, 197 Шелла теорема 216 Шероховатый объект 330 Ширина полосы оптическая 481 ----- электрическая 481 Широкополосный свет 220 Шум в интерферометре интенсивно- стей 473—482 — дробовой 454 — избыточный 454 — классический, или собственный 263 Шумовые ограничения в спекл-ннтер- ферометрни 482—494 Экран случайный поглощающий 348— 362, 431 ----- тонкий 343 -----фазовый гауссовский 355—359, 432 Экспозиции длительные 407 — короткие 407 Эйри функция 310 Электрическая ширина полосы 481 Эргодический случайный процесс 69 Эргодичность 68 Эффект Тальбота 394 Юнга опыт 167, 175, 190, 222, 2?3, 258, 313, 332 Явление затухающей волны 199 — уполовнннваиия частоты 490 Якобиан обратного преобразования 36, 38 Ячейки когерентности 217 — корреляции временные 451 -----пространственные 420, 451
ОГЛАВЛЕНИЕ Предисловие редактора перевода ......................................... 5 Предисловие............................................................ 8 Глава 1. Введение..................................................... 11 § L Детерминированное н статистическое описание явлений . . 12 § 2, Статистические явления в оптике............................13 § 3. Общий план книги.........................., ... . 16 Глава 2, Случайные переменные.......................................... 18 § L Определения вероятности и случайных переменных . . . 18 § 2. Функция распределения н плотность распределения . . . 20 § 3, Совместное распределение двух н большего числа случай- ных переменных..............................................23 § 4. Статистические средние..................................25 А, Моменты случайных переменных . . ,.....................26 Б. Смешанные моменты случайных переменных..................27 В, Характеристические функции.............................29 § 5. Преобразования случайных переменных.....................31 А. Общее преобразование................................. 31 Б. Монотонные функции......................................33 В. Преобразования многомерных распределений .... 35 § 6. Суммы действительных случайных переменных...........37 А. Два метода нахождения функции pz(z)..................37 Б. Независимые случайные переменные.................... 39 В. Центральная предельная теорема.........................39 § 7. Гауссовские случайные переменные..........................41 А. Определения............................................42 Б. Особые свойства гауссовских случайных переменных 44 § 8. Комплексные случайные переменные........................46 А. Общие сведения .........................................46 Б. Комплексные гауссовские случайные переменные ... 48 § 9. Суммы случайных фазоров............................... 50 А. Исходные предположения.................................51 Б. Вычисление средних значений, дисперсий н коэффициен- та корреляции.....................................52 В. Распределение длины н фазы результирующего фазора 54 Г. Постоянный фазор н сумма случайных фазоров ... 56 Д. Большой постоянный фазор н малая сумма случайных фазоров...........................................59 Задачи........................ ...........................60 Литература.............................................63
Оглавление 523 Глава 3. Случайные процессы . . ...................................65 § 1. Определение н описание случайного процесса..............65 § 2. Стационарность н эргодичность ....................... 68 § 3. Спектральный анализ случайных процессов.................73 А. Спектральные плотности известных функций.............73 Б. Спектральная плотность случайного процесса .... 75 В. Спектральные плотности энергии н мощности для ли- нейно отфильтрованных случайных процессов .... 76 § 4. Автокорреляционные функции и теорема Винера — Хннчииа 78 § 5. Взаимные корреляционные функции и взаимные.спектраль- ные плотности 83 § 6. Гауссовский случайный процесс.....................86 А. Определение . . .....................................86 Б. Линейно отфильтрованные гауссовские случайные про- цессы ............................................... 87 В. Стационарность в широком смысле и строгая стацио- нарность ..............................................87 Г. Моменты четвертого порядка ...........................88 § 7. Пуассоновский случайный процесс.........................88 А. Определения...........................................89 Б. Вывод пуассоновского распределения из фундаменталь- ных гипотез ...... .................................. 91 В. Вывод пуассоновского распределения из распределения времен случайных событий...............................92 Г. Спектральные плотности энергии н мощности пуассонов- ских процессов........................................94 Д. Дважды стохастические пуассоновские процессы ... 97 Е. Линейно отфильтрованные пуассоновские процессы . . 99 § 8. Случайные процессы на основе аналитических сигна- лов ........................................................ 101 А. Представление монохроматического сигнала в виде ком- плексного сигнала.....................................102 Б. Представление иемонохроматического сигнала в комп- лексной форме.........................................ЮЗ В. Комплексные огибающие или зависящие от времени фа- зоры ............................................. 105 Г. Аналитический сигнал как комплексный случайный про- цесс . . ............................................106 § 9. Комплексный гауссовский случайный процесс...............НО § 10. Разложение Карунена — Лоэва............................111 Задачи...................................................... 113 Литература.................................................. 117 Глава 4. Некоторые статистические характеристики первого порядка све- товых воли...................................................... 118 § 1. Распространение световых волн..........................119 А. Монохроматический световой сигнал....................119 Б. Немонохроматнческий световой сигнал..................120 В. Узкополосный световой сигнал.........................121 § 2. Поляризованное и неполярнзованное тепловое излучение 122 А. Поляризованное тепловое излучение . ................ 123 Б. Неполярнзованное тепловое излучение..................125 § 3. Частично поляризованное тепловое излучение ........... 127 А. Прохождение узкополосного светового сигнала через устройства, чувствительные к поляризации..............127 Б. Матрица когерентности.................................130
524 Оглавление В. Степень поляризации..................................133 Г. Статистические характеристики первого порядка мгно- венной интенсивности ............................. 136 § 4. Лазерное излучение......................................138 А. Одномодовое колебание................................139 Б. Многомодовое лазерное излучение......................145 В. Квазитепловое излучение, образующееся при прохожде- нии лазерного света через движущийся рассеива- тель .............................................149 Задачи......................,.................................151 Литература.................................................. 154 Глава 5. Когерентность оптических волн . . . .........................155 § 1. Временная когерентность..................................156 А. Интерферометр Майкельсона.............................156 Б. Математическое описание эксперимента...................158 В. Связь между интерферограммой и спектральной плот- ностью мощности светового пучка........................161 Г. Фурье-спектроскопия....................................165 § 2. Пространственная когерентность ......................... 166 А. Опыт Юнга............................................ 167 Б. Математическое описание опыта Юнга....................169 В. Некоторые геометрические соображения..................172 Г. Интерференция квазимонохроматического света .... 175 Д. Влияние конечных размеров отверстий..................178 § 3. Взаимная спектральная чистота............................181 А. Спектр мощности суперпозиции двух световых пучков 182 Б. Взаимная спектральная чистота и приводимость . . .183 В. Лазерный свет, рассеиваемый движущимся рассеива- телем .................................................187 § 4. Распространение взаимной когерентности.............. . 189 А. Решение, основанное на принципе Гюйгенса — Френеля 190 Б. Волновые уравнения, описывающие распространение взаимной когерентности . ...........................192 В. Распространение взаимной спектральной плотности . .194 § 5, Предельные формы функции взаимной когерентности . . 196 А. Когерентное поле.....................'................196 Б, Некогерентное поле.................................199 § 6. Теорема Ван Циттерта—Цернике..........................200 А. Математический вывод...............................201 Б. Значение теоремы и следствия нз нее.............• . 203 В. Пример.............................................204 Г. Обобщенная теорема Ван Циттерта — Церинке , . . 210 § 7. Дифракция частично когерентного света на отверстии . .213 А. Влияние тонкой структуры пропускания отверстия на взаимную интенсивность.................................214 Б. Распределение интенсивности в области наблюдения . .215 В, Анализ полученных результатов.........................217 Задачи....................................................... 219 Литература.................., . . ...........................225 Глава 6. Некоторые задачи, связанные с когерентностью высшего по- рядка ..............................................................227 § 1. Статистические свойства интегральной интенсивности теп- лового н квазнтеплового излучения ......................... 228
Оглавление 525 А. Среднее значение и дисперсия интегральной интенсивно- сти ................................................ .... 229 Б. Приближенная форма плотности распределения инте- гральной интенсивности ............................. 233 В. Точное выражение для плотности распределения интег- ральной интенсивности.................................. 239 § 2. Статистические свойства взаимной интенсивности при ко- нечном времени измерения ................................. 244 А. Моменты действительной и мнимой частей функции J12(T)...............................................246 Б. Распределение модуля и фазы функции Ji?(T) при боль- шом времени интегрирования и малых значениях Ц12 250 В. Статистические свойства модуля и фазы функции Л12(Г) при большом отношении сигнала к шуму....................255 § 3, Классический анализ интерферометра интенсивностей . . 257 А. Амплитудный интерферометр и интерферометр интен- сивностей ............................... .............. , 258 Б. Идеальный выходной сигнал интерферометра интенсив- ностей ........................................... 260 В. «Классический», или «собственный», шум на выходе ин- терферометра ........................................263 Задачи......................................................267 Литература................................................ 269 Глава 7. Влияние частичной когерентности на системы, формирующие изображения.................................................... 271 § 1. Некоторые предварительные соображения .... . . 272 А. Влияние оказываемое на взаимную когерентность тон- ким пропускающим объектом...............................272 Б. Временные задержки, вносимые тонкой линзой .... 275 В. Соотношения между когерентностями в двух фокаль- ных плоскостях....................................... . 277 Г. Соотношения между когерентностями в плоскостях объ- екта и изображения для одиночной тонкой линзы . . 281 Д. Соотношение между взаимными интенсивностями в вы- ходном зрачке н в плоскости изображения................284 § 2. Методы вычисления интенсивности изображения .... 287 А. Интегрирование по источнику.........................287 Б. Представление источника с помощью функции взаимной интенсивности падающего света . ...... 290 В. Четырехмерный линейно-систсмный подход..............295 Г. Некогерентный п когерентный пределы ....... 302 § 3. Примеры...............................................306 А. Изображение двух близко расположенных точек . . 307 Б. Изображение синусоидального амплитудного объекта 310 § 4. Формирование изображения как интерферометрический процесс................................................... 312 А. Система, формирующая изображение, как интерферо- метр ................................................313 Б. Применение интерферометров для получения информа- ции об изображении................................. 317 В. Важное значение фазовой информации..................321 Г. Восстановление фазы.................................324 § 5. Спекл-эффекты при когерентном формировании изображе- ния .......................................................328
526 Оглавление А. Причины возникновения спекл-структуры н ее статисти- ческие характеристики первого порядка...........329 Б. Когерентность, усредненная по ансамблю..............332 Задачи.....................................................337 Литература........................................ . . . 339 Глава 8. Формирование изображения при наличии случайных неоднород- ных сред.......................................................342 § 1. Влияние тонких случайных экранов на качество изобра- жения ....................................................343 А. Предположения и упрощения..........................343 Б. Усредненная оптическая передаточная функция . . . 345 В. Усредненная функция размытия точки.................347 § 2. Случайные поглощающие экраны.........................348 А. Общие формы усредненных ОПФ н ФРТ..........348 Б. Пример..............................................351 § 3. Случайные фазовые экраны.............................354 А. Общая формулировка.................................354 Б. Гауссовский случайный фазовый экран................355 В. Предельные формы усредненной ОПФ и усредненной ФРТ при большой дисперсии фазы........................359 § 4. Влияние протяженной случайной неоднородной среды на распространение воли.................................... 362 А. Обозначения и определения..........................363 Б. Атмосферная модель..................................366 В. Распространение электромагнитной волны в неоднород- ной атмосфере.........................................370 Г. Логарнфмнчески-нормальное распределение.............376 § 5. ОПФ при длительной экспозиции....................... 378 А. ОПФ при длительной экспозиции, выраженная через волновую структурную функцию.......................380 Б. Вычисление волновой структурной функции в ближней зоне............................................. 383 § 6, Обобщения теории....................................389 А. Обобщение на случай больших путей распространения. Фильтрующие функции для амплитуды и фазы . . . 390 Б. Влияние плавных изменений структурной постоянной С2п 401 В. Атмосферный диаметр когерентности г0...............403 Г. Структурная функция для сферической волны .... 405 § 7. ОПФ при короткой экспозиции............................ 407 А. Длительные и короткие экспозиции...............407 Б. Вычисление усредненной ОПФ при короткой экспозиции 409 § 8. Звездная спекл-интерферометрия...................414 А. Принцип метода................................415 Б. Эвристический анализ спекл-интерферометрнн .... 419 В. Более полный анализ звездной спекл-интерферометрии 423 Г. Обобщения......................................427 § 9. О степени общности теоретических результатов .... 429 Задачи .......................................... ....... 431 Литература................................................ 434 Глава 9. Фундаментальные пределы точности при фотоэлектрической ре- гистрации света............................................... 437 § 1. Полукласснческая теория фотоэлектрической регистрации 438
Оглавление 527 § 2. Влияние стохастических флуктуаций классической интен- сивности ..............................................440 А. Распределение числа фотоотсчетов в случае излучения хорошо стабилизированного одномодового лазера . . 442 Б. Распределение числа фотоотсчетов в случае поляризо- ванного теплового излучения при времени наблюдения, намного меньшем времени когерентности...............444 В, Распределение числа фотоотсчетов в случае поляризо- ванного теплового излучения н произвольного времени наблюдения..........................................447 Г. Случай неполной поляризации.........................449 Д. Случай неполной пространственной когерентности . . 450 § 3. Параметр вырождения...................................453 А. Флуктуации числа фотоотсчетов.......................453 Б. Параметр вырождения для излучения абсолютно чер- ного тела..........................................458 § 4, Шум в амплитудном интерферометре при низких световых уровнях .................................................... А, Измерительная система и измеряемые величины . . . Б. Статистические свойства вектора числа фотоотсчетов . , В. Дискретное преобразование Фурье как метод вычисле- ния параметров ......................................... Г, Точность определения видности н фазы................ § 5. Шум в интерферометре интенсивностей при низких свето- вых уровнях ................................................ А, Счетчнковый вариант интерферометра интенсивностей Б. Среднее произведение флуктуаций числа фотоотсчетов н его связь с видностью интерферограммы................. В, Отношение сигнала к шуму при измерении вид- ностн ................................................. § 6. Шумовые ограничения в спекл-ннтерферометрни . . , . А. Непрерывная модель процесса фоторегистрации . . . Б. Спектральная плотность регистрируемого изображения В. Флуктуации вычисленной спектральной плотности ин- тенсивности изображения..................................... Г, Отношение сигнала к шуму для звездной спекл-ннтер- ферометрни ............................................ Д. Обсуждение результатов............................... 462 463 465 466 469 473 475 475 478 482 483 485 488 490 492 Задачи Литература 494 497 Приложение А. Преобразование Фурье...................................499 АЛ. Определения преобразований Фурье........................499 А.2. Основные свойства фурье-образа.........................500 А.З, Таблица одномерных фурье-образов.......................502 А.4. Таблица двумерных фурье-образов........................502 Приложение Б. Суммы случайных фазоров Приложение В. Четвертый момент спектра регистрируемого спекл-изобра жен .......................................................... . • Предметный указатель 504 509 512