Автор: Пергамент М.И.  

Теги: физика  

ISBN: 978-5-91559-026-6

Год: 2018

Текст
                    ФИЗТЕХОВСКИЙ УЧЕБНИК
М.И. ПЕРГАМЕНТ
МЕТОДЫ ИССЛЕДОВАНИИ
В ЭКСПЕРИМЕНТАЛЬНОЙ
ФИЗИКЕ
Допущено Учебно-методическим объединением
высших учебных заведений Российской Федерации по образованию
в области прикладных математики и физики
в качестве учебного пособия для студентов ВУЗов
по направлению «Прикладные математика и физика»
ИНТЕЛЛЕКТ
ДОЛГОПРУДНЫЙ
2010


М.И Пергамент Методы исследований в экспериментальной физике: Учебное пособие / М.И. Пергамент- Долгопрудный: Издательский Дом «Интеллект», 2010. - 304 с. ISBN 978-5-91559-026-6 В книге изложена общая теория измерительно-регистрирующих систем; приборы и методы исследований быстропротекающих процессов средствами радиоэлектроники и оптики; основные методы экспериментальной физики - фурье-оптика, спектроскопия, интерферометрия и голография, зондирование электромагнитными волнами, рентгеновские и корпускулярные методы исследования; методы обработки и интерпретации результатов измерений. Физические основы методов исследования излагаются в объеме достаточном для того, чтобы последующее изучение специальной литературы не вызывало затруднений. Что касается измерительной аппаратуры, здесь прежде всего рассматриваются принципы ее работы, поскольку именно это наиболее важно, при планировании и проведении экспериментов или при разработке приборов. В книге широко используются методы теории информации, так как именно с их помощью возможно наиболее адекватно описывать и анализировать свойства измерительно-регистрирующих систем, прогнозировать качество выходных сигналов и находить критерии регуляризации при решении обратных задач. Книга адресована студентам и аспирантам физических и физико-технических специальностей, научным сотрудникам, планирующим и проводящим экспериментальные исследования, а также инженерам, занятым разработкой, тестированием и сертификацией измерительных приборов и измерительно- регистрирующих систем. ISBN 978-5-91559-026-6 © 2010, М.И. Пергамент © 2010, ООО Издательский Дом «Интеллект», оригинал-макет, оформление
ОГЛАВЛЕНИЕ Предисловие 6 Благодарности 8 Глава 1 Введение 9 1.1. Косвенные данные и обратные задачи 10 1.2. Стохастичность физического мира и эксперимент 13 Литература 24 Глава 2 Основные свойства измерительно-регистрирующих систем 25 2.1. Линейные измерительно-регистрирующие системы 25 2.2. Аппаратная функция, уравнение свертки 27 2.3. Коэффициент передачи, амплитудно-частотная и фазово-частот- ная характеристики, связь входного и выходного сигналов в фурье- пространстве 32 2.4. Некоторые следствия 37 2.5. Дискретизация 41 2.6. Информационный подход, скорость передачи информации по электронным и оптическим каналам, информационная емкость запоминающих устройств, энергетическая цена информации .... 42 2.7. Методы измерения параметров измерительно-регистрирующих систем 58 Литература 64 Глава 3 Исследование импульсных процессов 65 3.1. Измерения интервалов времени и некоторые элементы вычислительных схем 65 3.2. Измерения временных зависимостей, аналого-цифровые и цифро- аналоговые преобразователи 73 3.3. Измерение световых импульсов в фемтосекундном временном диапазоне 89 Литература 99
Оглавление Глава 4 Фотографические методы исследования и высокоскоростная фотография 100 4.1. Оптико-механические камеры 103 4.2. Электронно-оптические преобразователи и электронно-оптические камеры 108 4.3. Приборы с зарядовой связью (ПЗС), КМОП-структуры, ПЗС- и КМОП-камеры 125 4.4. Фотослой 136 4.5. Электрооптические затворы 145 4.6. Краткое резюме 150 Литература 151 Глава 5 Фурье-оптика и фурье-спектроскопия 152 5.1. Дифракция света на транспарантах 153 5.2. Фильтрация в фурье-плоскости 160 5.3. Дифракционная теория разрешения оптических приборов 165 5.4. Фурье-спектроскопия 169 Литература 172 Глава 6 Методы спектроскопии 173 6.1. Спектральные приборы и их основные характеристики 173 6.2. Диспергирующие элементы 177 6.3. Спектральные приборы с высоким разрешением 187 6.4. Специальные методы спектрального анализа 194 Литература 199 Глава 7 Интерферометрические и теневые методы 200 7.1. Распределение интенсивности света в интерференционной картине 201 7.2. Обработка интерферограмм 206 7.3. Теневые методы 207 Литература 210 Глава 8 Голографические методы исследования 211 8.1. Фотослой в голографии 212 8.2. Получение голограмм и восстановление волновых фронтов .... 214 8.3. Операции в схеме восстановления 217
Оглавление Глава 9 Зондирование электромагнитными волнами 224 9.1. Распространение электромагнитных волн в веществе 224 9.2. Рассеяние электромагнитных волн на флуктуациях плотности . . 227 9.3. Бриллюэновское рассеяние 229 9.4. Томсоновское, рэлеевское и резонансное рассеяние 232 9.5. Рассеяние на движущихся электронах 233 9.6. Комбинационное рассеяние в плазме 234 9.7. Аппаратурная реализация 236 Литература 240 Глава 10 Рентгеновские измерения 241 10.1. Спектральная область и источники рентгеновского излучения . . 241 10.2. Детекторы рентгеновского излучения 247 10.3. Аппаратура и методы измерений в рентгеновском диапазоне ... 256 Литература 267 Глава 11 Корпускулярные методы исследования 268 11.1. Основные принципы . 268 11.2. Анализаторы корпускулярного излучения, масс-спектрометры . . 270 11.3. Методы измерений . 277 Литература 281 Глава 12 Методы обработки экспериментальных данных 282 12.1. Модели 282 12.2. Восстановление исходных сигналов 284 12.3. Первичная обработка экспериментальных данных, фильтрация . . 288 12.4. Квазиреальные эксперименты 293 12.5. Погрешности восстановленных сигналов 295 Литература 300
ПРЕДИСЛОВИЕ Книга, которую вы держите в руках, основана на многолетней практике экспериментальных исследований и опыте чтения курса «Методы экспериментальной физики» на факультете Проблем Физики и Энергетики Московского Физико—Технического Института (МФТИ). Содержание книги может быть условно разбито на четыре части. Это — общая теория измерительно-регистрирующих систем; приборы и методы исследований быстропротекающих процессов средствами радиоэлектроники и оптики; основные методы экспериментальной физики (фурье-оптика, спектроскопия, интерферометрия и голография, зондирование электромагнитными волнами, рентгеновские и корпускулярные методы исследования); и наконец, методы обработки и интерпретации результатов измерений. Критерием отбора материала служило четкое представление автора о тех знаниях, которые требуются в физических лабораториях при постановке задачи исследования, проведении экспериментов, их обработке и анализе их результатов, а также в конструкторских бюро при разработке, испытаниях и сертификации измерительных средств. При этом физические основы методов исследования излагаются в объеме достаточном для того, чтобы последующее изучение специальной литературы не вызывало затруднений. Что касается измерительной аппаратуры, здесь, прежде всего, рассматриваются принципы ее работы, и в меньшей мере ее техническое устройство, поскольку именно первое наиболее важно, как при планировании и проведении экспериментов, так и при разработке измерительной техники. К тому же это позволило избежать превращения книги в многотомную инженерную энциклопедию. Заглядывая в будущее, автор счел необходимым, вопреки сегодняшним традициям, широко использовать методы теории информации, поскольку именно с их помощью, возможно наиболее адекватно описывать и анализировать свойства измерительно-регистрирующих систем, прогнозировать качество выходных сигналов и находить критерии регуляризации при решении обратных задач. Автор стремился сделать книгу понятной возможно более широкому кругу читателей поэтому, следуя принципам своего учителя академика Льва Андреевича Арцимовича, автор «всегда,
Предисловие когда нужно было выбирать между строгостью и доступностью изложения, отдавал предпочтение второму». Книга адресована студентам и аспирантам физических и физико-технических специальностей, научным сотрудникам, планирующим и проводящим экспериментальные исследования, а также инженерам, занятым разработкой, тестированием и сертификацией измерительных приборов и измерительно-регистрирующих систем. Если читатели этой книги найдут написанное ценным и полезным, автор будет считать, что его усилия потрачены не зря. М. Пергамент
БЛАГОДАРНОСТИ Созданию книги в немалой степени способствовала атмосфера благожелательности на факультете Проблем Физики и Энергетики, профессоров, преподавателей и сотрудников которого автор хотел бы поблагодарить. Но прежде всего, автор благодарен А.Х. Пергамент за ее бесконечное терпение — сосуществовать с человеком, который кроме научной работы и преподавания занят вдобавок литературным трудом, не так-то просто. Благодаря ее высокому профессионализму математическая сторона книги не страдает изъянами, поскольку все наиболее сложные выкладки сделаны ею. Не в меньшей мере автор обязан постоянным партнерам в дискуссиях о способах объяснения наиболее сложных физических явлений, своим коллегам, профессорам МФТИ Н. Г. Ковальскому и А. Ю. Гольцову, а также своим коллегам по ГНЦ ТРИНИТИ Р. В. Смирнову и И. К. Фасахову. Автор также многим обязан представителю молодого поколения, старшему научному сотруднику М. М. Пергаменту, который, в силу понятных причин, в отличие от студентов, аспирантов и молодых сотрудников автора, не стеснялся и не скупился на замечания, когда написанное ему казалось непонятным или нестрогим. Автор благодарен специалистам в области радиоэлектроники и компьютерной техники В. В. Крыжко и А. А. Вольферцу, внимательно прочитавшим третью главу и сделавшим ряд полезных замечаний. Большинство рисунков этой книги сделаны О. Л. Дедовой и Е. Ю. Красовской — большое им спасибо. И, наконец, большое спасибо Директору книгоиздательских программ издательского дома «Интеллект» Л. Ф. Соловейчику за его долготерпение и настойчивость, способствовавшим завершению работы над рукописью.
ГЛАВА 1 ВВЕДЕНИЕ Методы экспериментальной физики — это методы экспериментального исследования природы, ее явлений, ее законов. Понятно, что экспериментальные исследования могут опираться и опираются лишь на те знания, которые уже накоплены к моменту начала исследования, т. е. на уже известные физические законы. Другими словами в экспериментальной физике для исследования неизвестных физических механизмов и процессов используются известные, т.е. уже изученные физические процессы и явления. Исследовать — это значит получить данные о параметрах объекта исследования, равно как и об эволюции этих параметров во времени, если объект исследования не стационарен. В экспериментальной физике данные о параметрах исследуемого объекта получают из измерений. Конечная цель измерений — это определение набора функций координат и времени, описывающих состояние объекта исследования, для чего необходимо принять, передать, зарегистрировать и обработать информацию о таких функциях. Как правило это косвенная информация, поскольку чаще всего измерить непосредственно интересующие нас параметры невозможно. Действительно, пусть, например, нам важно знать, как распределены электроны по скоростям в неком плазменном образовании. Понятно, что измерить скорости электронов непосредственно мы не можем. Но мы можем просветить плазму мощным лазерным лучом и измерить спектр, рассеянного плазмой света. То обстоятельство, что вид спектра (распределение интенсивности рассеянного света по длинам волн) однозначно связан с распределением электронов плазмы по скоростям позволяет нам найти искомое. Часто мы говорим: «Температура плазмы была измерена методом томсоновско- го рассеяния». Но измеряли то в этом случае не температуру, а спектр рассеянного плазмой излучения! Температуру же вычислили, поскольку связь между температурой и спектром рассеянного излучения известна, однозначна и формализована. Мы уточняем: «Температура плазмы была измерена методом томсоновасого рассеяния», поскольку существуют и другие методы измерения температуры, скажем, метод измерения температуры по рентгеновскому спектру, так называемого, «тормозного» излучения. Конечно, уравнение, формализующие связь между температурой
10 -i\- Глава 1. Введение плазмы и спектром излучения, в этом случае будут совершенно иным, поскольку механизмы излучения и рассеяния различны. Так что же означает термин «метод измерения»? Под методом измерения понимают совокупность физических явлений, позволяющих определить и формализовать связи между параметрами, исследуемого объекта и величинами, поддающимися непосредственному измерению. Важно, что те величины или зависимости, которые поддаются непосредственному измерению, могут быть измерены разными способами. Способ измерения — это совокупность приемов, которые позволяют с помощью соответствующей аппаратуры зарегистрировать величины, косвенно определяющие параметры объекта исследования. Как правило эти величины или зависимости, регистрируемые в эксперименте, называют первичными экспериментальными данными. Заметим, что чаще всего первичные экспериментальные данные не используются сами по себе, а необходимы лишь как исходные данные для расчета параметров объекта исследования. Поэтому процесс экспериментального исследования условно разбивают на измерение и обработку (интерпретацию) экспериментальных данных, которая, также может производиться различными методами. Под методом обработки понимают совокупность алгоритмов, позволяющих на основе первичных экспериментальных данных вычислить (восстановить) изучаемые параметры объекта исследования. Выбор метода обработки всегда определяется характером экспериментальных данных. При этом требования, предъявляемые к первичным экспериментальным данным, всегда обусловлены той точностью, с которой необходимо определить набор функций координат и времени, описывающих состояние объекта исследования и являющихся, как мы уже говорили, конечной целью измерений. В свою очередь возможность удовлетворить требованиям точности определения параметров объекта исследования зависит от объема и характера получаемой от объекта исследования информации, от конкретных параметров используемых измерительно-регистрирующих систем и от выбранного метода обработки экспериментальных данных. Все это будет предметом нашего пристального внимания на долгом пути изучения методов экспериментальной физики. В этом долгом плавании три подводных рифа все время будут подстерегать нас — это косвенный характер экспериментальных данных, обратные задачи и стохастичность физического мира. 1.1. КОСВЕННЫЕ ДАННЫЕ И ОБРАТНЫЕ ЗАДАЧИ Прямые и обратные задачи получили свои названия от направления, в котором вы движетесь в потоке причинно-следственных связей. Прямая задача это движение в направлении потока причинно-
1.1. Косвенные данные и обратные задачи —fly- 11 следственных связей. Другими словами, вам известна причина и вы ищете вызванное этой причиной следствие. Обратная задача — движение против потока причинно-следственных связей — известно лишь следствие, а нам нужно, опираясь на косвенные данные, найти причину, которая это следствие вызвало. Житейский пример — вы пригласили свою любимую в театр, но она простудилась, у нее поднялась температура, страшно болит голова; причина известна — следствие понятно: по причине болезни поход в театр откладывается. Другой случай — вы с букетом цветов ждете у входа в театр, как заранее условились, однако прозвенел первый звонок, второй, третий... но ее нет. В чем причина — она заболела и не сумела предупредить, попала в транспортную пробку, а может быть пошла с Ваней в ресторан, куда он так упорно приглашал ее всю неделю? Прекратим драматизировать эту крайне неприятную для любого мужчины ситуацию, но сделаем незамедлительный вывод — при решении обратных задач бессмысленно рассчитывать на единственность решения. Хотим мы того или нет, но здесь нам приходится иметь дело с совокупностью всех возможных решений и выбор единственно правильного — особенно в отсутствии дополнительной информации — нелегкое дело. К сожалению, в физике, да и в жизни, в основном приходится решать обратные задачи. Формально связь между параметрами объекта исследования и измеряемыми величинами (как правило, функциями) записывается как AZ = I, (1.1) где А — оператор, формализующий связь между Z и /, Z — функция, описывающая параметры исследуемого объекта (в рассмотренном выше примере с томсоновским рассеянием Z = Ге(г, /)), / — функция, значения которой доступны непосредственному измерению (в том же примере / — спектр рассеянного плазмой лазерного излучения, причем /=/(Л, z, t), где z — координата, направленная вдоль просвечивающего плазму зондирующего лазерного луча). Оператор А характеризует используемый метод измерения, поэтому понятно — в разных методах измерения разные и операторы А. Понятно также, что спектр рассеянного излучения I=f(X,z,t) еще не есть первичные экспериментальные данные. Спектр еще нужно зарегистрировать. Если U есть первичные экспериментальные данные, a G — оператор, характеризующий используемый способ измерения, то подобно (1.1) их связь может быть записана как GI = U. (1.2) При обработке экспериментальных данных U чаще всего сначала находят /, используя уравнение (1.2), а затем с помощью уравнения (1.1)
12 -J\- Глава 1. Введение получают Z. Для решения уравнений (1.1) и (1.2) широко применяются два следующих способа. В первом из них конструируют обратный оператор, например, G~l и с его помощью находят / = G~XU. Здесь две трудности: мало того, что сконструировать этот, как правило интегро-дифференциальный, оператор G~l достаточно удобным для дальнейших вычислений, не так просто, так вдобавок еще полученные с его помощью решения неустойчивы. Дело в том, что здесь искомая функция находится под знаком интеграла, а правая часть уравнения (экспериментальные данные) задана с ошибкой. Такого рода уравнения относятся к классу так называемых «некорректно поставленных» обратных задач, впервые подробно исследованных Ж. Адамаром на примере уравнений Фредгольма 1-го рода. Он показал, что в такого рода уравнениях «сколь угодно малые изменения правой части могут привести к сколь угодно большим изменениям подынтегральной функции». Заметим, что это его сильное и, в принципе своем, верное утверждение надолго затормозило разработку математических основ обработки экспериментальных данных. На самом деле, зачем пытаться решать уравнения с заведомо неточной правой частью, если решение в этом случае может быть сколь угодно далеко от истинного? Ситуация в этой области кардинально изменилась лишь благодаря работам А. Н. Тихонова. Предложенная им техника решения некорректно поставленных обратных задач, называемая «тихоновской регуляризацией», широко известна и мы еще не раз в дальнейшем будем обсуждать возникающие здесь проблемы. Сейчас же хотелось бы обратить внимание не на технику регуляризации, которая, безусловно, очень важна, а на принципы тихоновского подхода. Кратко идеологию А. Н. Тихонова можно изложить следующим образом. Сколь угодно малые изменения правой части могут привести к сколь угодно большим изменениям подынтегральной функции при решении некорректно поставленных обратных задач лишь в том случае, если мы будем пытаться точно решить задачу с приближенными данными. Если же допустить возможность приближенного решения задачи с неточно заданными данными, это приближенное решение будет устойчиво, причем при уменьшении ошибки в правой части приближенное решение будет монотонно стремится к точному. Второй метод решения уравнений типа (1.1) или (1.2) заключается в следующем. Модель /*, т.е. приближенное значение /, задается, например, в виде ряда (степенного, ряда Фурье и т. п.), а коэффициенты при членах ряда находятся при решении вариационной задачи минимизации функционала \\cr-u\\.
1.2. Стохастичность физического мира и эксперимент —' \^ 13 В сущности, при решении этой задачи мы сравниваем GI* и GI (поскольку U = GI). Понятно, что минимум функционала будет достигаться в том случае, когда /* будет достаточно близко к /. К сожалению, и здесь решение неустойчиво и единственный выход — ограничить число членов ряда, ухудшая тем самым аппроксимацию решения. Иного и не следовало ожидать, поскольку неустойчивость решения некорректно поставленных обратных задач обусловлена отнюдь не математическими процедурами, а глубинными физическими проблемами, суть которых мы обсудим позже. С точки зрения теории информации / это сигнал на входе в измерительно-регистрирующую систему, U = GI — выходной сигнал, а решение уравнения (1.2) — процедура восстановления входного сигнала по выходному, точнее по зарегистрированным значениям выходного сигнала. Понятно, что из-за потерь в измерительно-регистрирующем тракте в выходном сигнале отсутствует часть информации, содержащейся во входном сигнале. Поэтому в восстановленном сигнале принципиально не может содержаться больше информации, чем ее содержалось во входном сигнале, и уж тем более больше чем в зарегистрированных значениях выходного сигнала. Другими словами, в восстановленном сигнале не может содержаться больше подробностей, чем их было в выходном сигнале о входном. Как только вы, пытаясь «улучшить» качество восстановления, переходя этот принципиальный запрет, решение становится неустойчивым. 1.2. СТОХАСТИЧНОСТЬ ФИЗИЧЕСКОГО МИРА И ЭКСПЕРИМЕНТ Мы живем в вероятностном мире. Утром, собираясь на работу и решая вопрос брать ли зонтик, мы смотрим в окно на безоблачное небо и говорим: «Дождь маловероятен». Мы пытаемся оценить вероятность того, поднимутся ли в цене или упадут акции той или другой компании. И тем не менее в повседневной жизни мы ощущаем окружающий нас мир, как мир детерминированный, хотя это далеко не так. К тому же большинство жителей планеты свыклись с тем, что расхожее слово «вероятность» есть интуитивная оценка возможности того или иного события и никогда даже не задумывались о том, что вероятность есть строгая математическая категория. Мы себе этого позволить не можем. Среди многочисленных определений вероятности [1] наиболее рафинированное и строгое принадлежит А. Н. Колмогорову. В аксиоматике А. Н. Колмогорова вероятность это неотрицательная, обладающая определенными свойствами мера в пространстве, элементами которого являются элементарные события. Однако при всех ее достоинствах колмо- горовская аксиоматика трудна при феноменологическом описании фи-
14 -V Глава 1. Введение зических явлений. Поэтому мы будем пользоваться так называемым частотным определением вероятности, которое вводится следующим образом. Пусть мы наблюдаем некие события, повторяющиеся большое количество раз N, причем в п случаях событие обладает признаком А (например, при игре в «кости» выпадает пятерка). Если исходы событий в их последовательности взаимно независимы, то вероятность события с признаком А определяется как Р(А) = lim ~, (1.3) N—►оо N откуда, в частности следует, что Р(А) может изменяться в пределах 0< Р(А) < 1. Это выражение есть оценка точного значения вероятности, которая сходится к точному по той вероятностной мере, которая определена А. Н. Колмогоровым. Ясно, что если Р(А) — есть вероятность того, что некоторое событие произойдет (например, пойдет дождь) то 1 — Р(А) — это вероятность того, что дождя не будет. Случайные события или в нашем случае случайные величины характеризуются их стохастическими и частотными свойствами. Стохастические свойства случайных величин определяются их функциями распределения. Функция распределения вероятностей случайной величины £ — это функция х, равная вероятности того, что £ примет значение меньшее величины х P((<x) = F(x)9 (1.4) при этом понятно, что Р(£ > х) = 1 — F(x). Другими словами вероятность того, что случайная величина ( примет значение в интервале [х, оо] равна 1 — F(x). Поясним смысл функции распределения. Пусть изготовитель лампы- вспышки в вашем фотоаппарате гарантирует, что с вероятностью 80% срок службы лампы не меньше чем 350000 = 3,5 • 105 вспышек. (Заметим, что вероятность обязательно должна быть указана — иначе никакая это не гарантия, а пустой звук, поскольку «срок службы» без указания вероятности его реализации смысла не имеет.) Понятно, что у лампы вспышки есть всего лишь два состояния — либо она работает, либо она сломана. Поэтому утверждению «срок службы лампы с вероятностью 80% составляет 3,5 • 105 вспышек» полностью соответствует другое: «с вероятностью 20% лампа выйдет из строя не сделав 3,5 • 105 вспышек», т. е. с вероятностью 0,2 (20%) лампа выйдет из строя где-то между первой и 350000-й вспышками. Заметим, что 3,5- 105 вспышек — это очень много. Щелкая фотоаппаратом каждые 30 секунд по 8 ч в день вы и за год не наберете 3,5 • 105 вспышек. Но цифра 80%, конечно же, смущает.
1.2. Стохастичность физического мира и эксперимент 15 Как мы можем узнать поподробнее, что, все же, это означает? Пусть Р(( < х) = F(x), а случайная величина £ в нашем рассмотрении — это та роковая вспышка, которая привела к поломке лампы. Обратимся к рис. 1.1, на котором представлена функция F(x). По оси абсцисс этой кривой отложены номера вспышек, а по оси ординат — значения вероятностей. Точка А на этом графике соответствует значению х = 3,5 • 105; при этом величина F(x) = ^(3,5 • 105) = 0,2 означает, что с вероятностью 0,2 (20%) значение ( лежит где то в интервале от 0 до 3,5 • 105. То, о чем мы говорили — с вероятностью 20% лампа не проживет дольше. Пока что ничего нового из кривой F(x) мы не узнали, но ведь мы и поинтересовались лишь одной точкой из этой кривой. Посмотрим на другие точки. Вот, например, точка Б (х = 2-104) говорит о том, что вероятность поломки лампы до истечения 2 • 104 вспышек всего 2%. Кстати, когда мы говорим об одной конкретной лампе, то мы можем сказать что-либо лишь о вероятности ее выхода из строя на протяжении определенного коли- 0 0,8 0,6 0,4 0,2 F(x) ■ 0,02| |—гМ ' 0,01 l......L/^\. 104 210* .... А / х/ х / 10D 5-10э 106 Рис. 1.1. Функция распределения вероятностей F(x) случайной величины ( чества вспышек. Однако, если дело касается большого количества ламп, то мы можем, опираясь на соотношение (1.3) сделать более строгое утверждение. Мы можем утверждать, что из всех ламп, выпущенных заводом, лишь 2% ламп не доживут до 2 • 104 вспышек (точка Б), больше половины всех ламп, выпущенных заводом не в состоянии сделать больше, чем 5 • 105 вспышек (точка В) и т. д. Из этой кривой мы можем узнать какова вероятность того, что лампа разрушится в промежутке между 3,5 • 105 и 5 • 105 вспышками. Для этого нужно лишь вычислить разницу значений функции F(x) в точках А и В. Как видно из графика F(B) - F(A) « 0,3. В общем случае разница F(x + dx)- F(x) = р(х) dx показывает какова вероятность случайной величине £ попасть в интервал dx, причем функция р(х) называется плотностью вероятностей и является производной функции F(x). Действительно, вероятность того, что £ примет значение меньшее чем х + dx равна а вероятность того, что f окажется в интервале [х + dx, oo] равна > х + dx) = 1 - /*(* + dx).
Глава 1. Введение Отсюда следует, что вероятность того, что £ окажется вне интервала [х, х + dx] равна Р[({ < х) U (( > х + dx)] = 1 - /*(х + dx) + а вероятность оказаться внутри интервала [х, хЛ- dx] равна c) = 1 - [1 - Fix + dfr) + F(x)] = F(x + dx)- F(x). Теперь можно предложить другое определение функции распределения вероятностей случайной величины, а именно: функция распределения ее- роятностей случайной величины f это такая функция F(x)9 что вероятность того, что ( примет значение в интервале [х, х + dx] равна разности F{x + dx)-F(x). Отсюда по определению F'(x) dx = F(x + dx)- F(x) = р(х) dx. (1.5) Функция р(х) называется плотностью вероятностей случайной величины 1\ Приведем значения некоторых функций р(х), прежде всего тех, с которыми нам придется достаточно часто встречаться в дальнейшем. Так называемое нормальное распределение характеризуется плотностью вероятностей d4W Собственно функция распределения F(x) в этом случае носит название интеграл вероятностей и записывается как Известно, что этот интеграл не берется в квадратурах, однако его табулированные значения можно найти в любом руководстве по теории вероятностей. Графики функций (1.6) и (1.7) приведены на рис. 1.22). 1) Часто в физической литературе именно функцию р(х), а вовсе не функцию F(x) называют функцией распределения. Такова данность, но это не просто не строго, но, по существу, не правильно. 2) Заметим, что сумма квадратов случайных величин с нормальным распределением также является случайной величиной, однако не с гауссовским распределением. Такое, часто встречающееся при обработке экспериментальных данных, распределение носит название распределение #2. Его табулированные значения также можно найти в любом руководстве по теории вероятностей.
1.2. Стохастичность физического мира и эксперимент 17 0,9 0,8 0,7 0,6 0,5; 0,4- 0,3 /0,2 ^s* 0,1 i у / / / 2 3 X P(x)t 1,0 0,8 0,6 0,4 0,2 0 = 6; а = 0,5 -2-1012345678л: Рис. 1.2. Графики функций распределения вероятностей F(x) и плотности вероятностей р(х) при так называемом «нормальном распределении вероятностей» При равномерном распределении все значения случайной величины, лежащие в интервале от а до Ь равновероятны. Поэтому плотность вероятностей 0 Р(х) = 1 при — оо < х < а; при а < х < Ь\ Ь-а | 0 при Ь < х < оо, (1.8) а функция распределения вероятностей F(x) = [0 х — а при — оо < х < а; при а < х < Ь\ Ь-а 1 при Ь < х < оо. Графики этих функций приведены на рис. 1.3. F(x)\ p(x)\ (1.9) Ъ х а Ъ х Рис. 1.3. Графики функций распределения вероятностей Fix) и плотности вероятностей р(х) при равномерном распределении значений случайной величины Плотность вероятностей при пуассоновском распределении мы представим в двух различных формах, описывающих два типичных, но принципиально различающихся, физических процесса. В качестве первого, как пример, рассмотрим процесс фотоэмиссии катода электронно-оптиче-
18 -J\ - Глава 1. Введение ского усилителя яркости, часто называемого также «усилителем света»3). Пусть фотокатод с площадью S освещается строго однородным световым потоком, причем поверхностная плотность упавших на фотокатод фотонов (число фотонов на единицу площади фотокатода) равно т. Тогда общее количество эмитированных фотокатодом электронов Ne = Ятц, где величину \х принято называть квантовым выходом. Заметим, что это равенство выполняется только в среднем, причем тем точнее, чем больше S и т. Поскольку рождение электрона при фотоэмиссии есть случайный процесс, а считывание электронного изображения производится с достаточно малым шагом, так что окно считывания Д£ мало, то и при строго постоянном /я, т. е. при т(х, у) = const число считанных в различных участках фотокатода электронов пе(х9 у) ф АЯтц, а есть случайное число, определяемое их статистикой. Мало того, ив том же самом участке фотокатода при повторных измерениях вы будете получать неодинаковые результаты. Фактически это значит, что \i (квантовый выход) не есть величина постоянная. Если этот непостоянный квантовый выход обозначить как /1/ = fix, то, как показывает эксперимент, плотность вероятности распределения числа электронов эмитированных в различных отсчетах хорошо аппроксимируется распределением Пуассона р(х) = juxexp{-/**}. (1.10) График функции (1.10) показан на рис. 1.4. Поскольку эта функция нормировано на единицу (/0°° р(х) dx = 1), площадь под кривой, ограниченная двумя вертикальными линиями, определяет долю электронов от их полного количества. Так, например, в интервале значений аргумента 0,5 < fjx < 1,5 (заштрихованная область на рис. 1.4) сосредоточено почти 40% всех эмитированных электронов, в интервале 1,5 < цх < 2,5 — примерно 30%, в интервале 2,5 < fjx < 3,5 — около 15% и т.д. Заметим, кстати, что целый ряд других физических процессов, например, распределение эмитированных некоторыми полупроводниковыми фотокатодами электронов по энергиям, пробеги квантов света в веществе и т.п. также хорошо описываются пуассоновским распределением. Иной вид пуассоновского распределения используется для описания аппаратной функции4) электронно-оптического усилителя яркости при малой освещенности фотокатода: £ (1.11) 3) Подробно электронно-оптические усилители яркости будут рассмотрены в гл. 4. 4) Аппаратная функция — вид фигуры рассеяния на экране электронно-оптического усилителя яркости при проецировании на входной фотокатод предельно узкой щели (подробнее см. гл. 2).
1.2. Стохастичность физического мира и эксперимент 19 В данном случае эта четная функция показывает, как убывает плотность электронов с удалением от максимума при g(0). При этом функция распределения запишется как F(x) = - exp{/ux} -zexp{- при х < 0; при х> 0. (1.12) Математическим ожиданием случайной величины £ по определению называется среднее значение £ с учетом вероятности (или плотности вероятности) осуществления каждого значения £. Для дискретного распределения математическое ожидание случайной величины ( для непрерывного распределения (1.14) Величина //, фигурирующая в этих формулах, т. е. математическое ожидание, в сущности есть среднее значение случайной величины при числе испытаний, стремящихся к бесконечности, т. е. при N —> оо. Рис. 1.4. Плотность вероятности распределения числа электронов эмитированных в различных отсчетах Соответственно математическим ожиданием функции/(О случайной величины £ называется средняя величина /(О, усредненное по всем возможным значениям переменной £ или
20 Глава 1. Введение Дисперсия случайной величины £ есть математическое ожидание квадрата уклонения £ от Мf причем а — так называемое среднеквадратичное (или стандартное) уклонение — мера разброса £ относительно среднего значения М£ = fi. Заметим, что и при нормальном и пуассоновском распределениях математическое ожидание М£ = //, дисперсия при нормальном распределении Щ = а2, дисперсия при пуассоновском распределении Ю( = д, т. е. при пуассоновском распределении среднеквадратичное уклонение а = у/Ц. Это замечательное свойство пуассоновского распределения позволяет просто оценивать (чем мы и будем в дальнейшем широко пользоваться) фундаментальное отношение сигнал/шум S/N. Действительно, пусть наш «сигнал» есть Nc эмитированных электронов. Тогда дисперсия нашего сигнала (так называемый квантовый шум) а2 « Ne, а отношение сигнал/шум S/N 1 <"* 2 3 4 till 1 Рис. 1.5. Разброс показаний вольтметра Поясним физический смысл приведенных математических абстракций на следующем примере. Пусть мы решили проверить вольтметр, предназначенный для измерения напряжений от 0 до 10 В; причем сертифицированная точность этого прибора составляет 5%5). Это означает, что некая «средняя ошибка» измерения ДК = 0,05Fmax. (Смысл и значение так определенной «средней ошибки» будет понятен из дальнейшего изложения.) Для проверки используем источник напряжения с заведомо высокой стабильностью, так чтобы случайные флуктуации напряжения &VT источника были заведомо меньше 5%, скажем, порядка 0,01% т.е. ДКГ < 10~4К. Процедура проверки будет очень проста: мы установим некоторое напряжение нашего эталонного источника, например 5 В, и будем раз за разом, многократно измерять напряжение с помощью проверяемого вольтметра, каждый раз записывая его показания. Что мы увидим? Во-первых мы, обнаружим что, хотя отдельные показания прибора 5) В реальной практике прибором со столь низкой точностью мало кто пользуется, мы же выбрали столь неточный прибор лишь для того, чтобы иллюстрация была более наглядна.
1.2. Стохастичность физического мира и эксперимент J\y- 21 jc/ группируются с некоторым разбросом около деления 5 (рис. 1.5), но точно на отметке «5 В» стрелка прибора практически никогда не останавливается. Во-вторых, мы установим по мере продолжения испытаний, что среднее значение показаний прибора х = (l/n)Lx, постепенно приближается к значению «5 В». (Этого, понятно, и следовало ожидать — ведь часть отсчетов х, > 5, а часть х, < 5; кстати, в этом конкретном эксперименте мы ожидали и того, что отдельные отсчеты прибора будут группируются около деления 5, поскольку измеряемое напряжение было нам известно до опыта.) Однако, эти, только что приведенные рассуждения, есть лишь плод наших интуитивных представлений, и не более того. Могут ли они быть формализованы? Да, если нам известны свойства случайной величины х,-, т. е. функция распределения (или плотность вероятностей) х,-, математическое ожидание M(xj) = /л и дисперсия ©(*,) = а2 (или среднеквадратичное уклонение а). Нам, к счастью, все эти сведения известны — иначе нам пришлось бы их находить из опытных данных. Функция распределения отдельных отсчетов х,- в стрелочных приборах обусловлена, конечно же, рядом лишь физических причин. Это трение в подшипниках оси, на которой укреплена стрелка прибора, положение стрелки перед началом конкретного измерения, переходные процессы в электрических цепях прибора, имеющие место при присоединении нашего вольтметра к источнику измеряемого напряжения и т. п. Однако многочисленные опыты показывают, что здесь мы имеем дело с нормальным распределением, которое, как мы знаем, описывается соотношениями (1.6) и (1.7). Как это ясно из предыдущего рассуждения, в нашем случае математическое ожидание M(xt) = ji = 5. Что же касается дисперсии, то известно, что деления на шкале стрелочных приборов наносятся через интервалы ДК = а, поэтому ДК = = 0,05 Ктах = 0,5 К = а, и, следовательно, дисперсия ©(х,) = а2 = 0,25. Теперь, используя формулу (1.6), мы можем вычислить, какова вероятность того, что в некотором конкретном измерении будет получен такой отсчет х/, что (/х — а) < х/ < (// + а) (область, отмеченная на рис. 1.6, а вертикальными линиями) ц+а J = J \i-a Другими словами, лишь приблизительно в 70% случаев мы зафиксируем отсчет, лежащий где то в промежутке между 4,5 и 5,5 В. Как мы видим, вероятность такого события не слишком велика, причем, как это следует из рис. 1.6,5, она примерно линейно падает с уменьшением промежутка. Так что в мысленном ли или реальном эксперименте бессмысленно
22 Глава 1. Введение ждать, чтобы стрелка прибора остановилась, где то совсем рядом с отметкой 5 — вероятность такого события исчезающе мала. Поэтому во всех тех случаях, когда отсчет х, попадает в промежуток (ц - а), (// + а), принято приписывать измеряемой величине значение \i, равное в нашем случае 5 В. Более аккуратные экспериментаторы скажут, что измеряемая величина равна 5 ± 0,5 В (ц ± а), хотя и то и другое недостаточно корректно. Корректное описание измерения звучало бы так: «Вероятность того, что измеряемая величина лежит в промежутке 5 ± 0,5 В, равна примерно 70%». Конечно, в обиходе так вычурно никто не выражается, но когда говорят, что некая величина равна (// ± а), имеют в виду именно это. Главный вывод из всего сказанного следующий — мы никогда не можем в эксперименте точно определить измеряемую величину, но мы можем установить, с какой вероятностью измеряемая величина лежит в том или ином интервале. 0,8 0,6 0,4 0,2 Л\ 2а 0,9 0,8 0,7 0,6 0,5; 0,4 0,3 /0,2 1 2 3 / / *В X *-За //-2о- /и-<7 // ц+а Рис. 1.6. Вероятность зафиксировать отсчет прибора в интервале ±а Вернемся к проверке нашего вольтметра. Условия опыта, равно как и те экспериментальные данные, которые мы будем получать, определены выше. В чем же будет состоять суть проверки? Ее суть — сопоставление экспериментальных данных со значениями М(х{) = ц и ©(*,) = а2, вычисленными на основании сертификата, для чего необходимо обработать полученные результаты с тем, чтобы найти выборочное среднее и среднеквадратичное уклонение экспериментальных значений х, от их среднего значения. Выборочным средним называется среднее значение случайной величины х/, полученное на основе выборки объемом п, т. е. выборки, содержащей п случайных величин х, 1 х = - п Xl (1.16) выборочное среднее есть оценка математического ожидания. Сравнив соотношения (1.13) и (1.16) мы без труда обнаружим, что в формуле
1.2. Стохастичность физического мира и эксперимент —fly- 23 (1.16) отсутствует вероятность осуществления х,-, т.е. P(xt). Это и понятно—в расчете нам необходимо учитывать вероятность осуществления каждого значения х,-, в эксперименте же эта вероятность реализуется природой явления, суть которого в том, что частота выпадения различных значений х,- разная. Квадрат среднеквадратичного уклонения экспериментальных значений X/ от их среднего значения Л) = - L (*/ - х)2 « ©(*/) (1.17) есть оценка дисперсии экспериментальных данных ©(х,), т. е. оценка разброса экспериментальных данных6). Дисперсия выборочного среднего, которая определяет точность оценки у, по х D(xj) * a2(xj) = I £ 09 - х)2 = 1 £(х, - х)2, Лу=1 п /=1 откуда следует, что а(х) = ^. (1.18) Другими словами, х обладает меньшим разбросом чем X/ и потому является более точной оценкой ц9 чем отдельные значения х,; при этом точность оценки возрастает пропорционально у/п. Поэтому, если какая ни будь величина была измерена в п опытах, результат измерения, как правило, представляется в виде х±а(х) = х± сг(х/)Д/я. Используем неравенство Чебышева P[\x-»\>ka]<-j-2, чтобы показать, что с ростом объема выборки выборочное среднее х со среднеквадратичным уклонением а(х) = а/у/п с высокой вероятностью стремится к /л, как к своему пределу. Перепишем неравенство Чебышева, введя обозначения € = ка/у/п ик = еу/п/а. Тогда Р[|х- у\ > е] < а2/(пе2), поскольку при этом Р[|х — /л\ < е] > 1 — а2/(пе2), Р[-е<(х- ц)<е]> 1-£. (1.19) Отсюда следует, что при п —> оо стремится к 1 вероятность того, что 6) При малом п оценка дисперсии, полученная по формуле (1.16) оказывается смещенной. Поэтому для выборок малого объема лучше использовать соотношение <72(х,) = [\/(п - 1)] EU <* " ^)2-
24 —I\- Глава 1. Введение Итак, в результате испытаний мы определили величину а, сравнили ее со значением А V, указанном в сертификате прибора, и таким образом установили соответствие нашего вольтметра его паспортным данным. Однако при этом мы нашли лишь случайную компоненту ошибки. Нам попросту повезло в том, что отдельные измерения оказались сгруппированными вокруг значения 5 В. Это могло бы и не произойти, если бы систематическая компонента ошибки, равная по определению \i — x, не равнялась бы нулю, как в нашем случае. Заметим, что систематическая компонента ошибки не есть случайная величина, поэтому ее однажды нужно установить тем или иным способом и затем просто учитывать при обработке результатов измерений. Правда сказать это проще, чем сделать. В нашем случае мы знали, как говорится «ответ в задаче» — ведь мы использовали для проверки нашего вольтметра высокоточный источник напряжения. Совсем иная ситуация имеет место, когда мы впервые измеряем параметры неизвестного нам объекта (например, температуру некоего плазменного образования) и сравнить результаты наших измерений нам не с чем. Как быть здесь? Оставим пока этот вопрос без ответа, чтобы вернуться к нему позже. Наконец, в заключение этой главы приведем правила сложения и умножения вероятностей. Если события А и В независимы и взаимно исключают друг друга, т. е. события несовместные, то вероятность того что произойдет или событие А или событие В Если события Аи В взаимно не исключают друг друга, то Р(А + В) = Р(А) + Р(В) - Р(АВ), где Р(АВ) есть вероятность одновременного осуществления событий и А и В. Если Аи В независимы Р(АВ) = Р(А)Р(В). В общем случае Р(АВ) = Р(А)РА(В) = Р(В) - РВ(А), где, так называемая, условная вероятность Ра(В) есть вероятность события В при условии, что событие А произошло , аналогично РВ{А) = ЛИТЕРАТУРА 1. ХудсонД. Статистика для физиков. — М: Мир, 1967.
ГЛАВА 2 ОСНОВНЫЕ СВОЙСТВА ИЗМЕРИТЕЛЬНО-РЕГИСТРИРУЮЩИХ СИСТЕМ Прежде чем пользоваться прибором, его, разумеется, следует проверить. Процедура проверки проста — на вход подается известный, чаще всего специально сформированный, сигнал 1т а выходной сигнал сравнивается с его ожидаемым значением GIm = U. Если функционал ||/out - GI\n\\ <a2,cr — погрешность, обусловленная действующими в системе шумами, — прибор в порядке. Так что все, действительно, просто, если оператор G, определяющий измерительную систему и значение а, характеризующее действующие в системе шумы, нам известны. Если оператор G нам известен, можно всегда определить выходной сигнал U = GIm или попытаться восстановить входной сигнал по выходному из уравнения U = GI\n + N. (Понятно, что успешность такого рода процедуры определяется отношением сигнал/шум Glm/N). Из этого же уравнения можно найти и G, что, как правило, много проще, поскольку чаще всего возможно использовать входные сигналы такой амплитуды, при которой GIm ^> N. Возникающие здесь проблемы проследим на примере линейных измерительно-регистрирующих систем. 2.1. ЛИНЕЙНЫЕ ИЗМЕРИТЕЛЬНО-РЕГИСТРИРУЮЩИЕ СИСТЕМЫ Измерительно-регистрирующие системы, применяемые в экспериментальной физике, как правило системы линейные, т. е. системы, которые описываются линейными уравнениями. Точнее они конструируются так, чтобы в пределах того динамического диапазона, на который они рассчитаны, они оставались бы системами линейными. Самое важное при этом — это то, что в линейных системах справедлив принцип суперпозиции: f(x + y) =f(x) +f(y). В частности это означает, что шум, действующий в линейных системах аддитивен, т. е. он просто складывается с сигналом. Это позволит нам исследовать проходящие через систему сигналы и действующие в системе шумы независимо друг от друга. При исследовании линейных систем используются два метода — импульсный и частотный (спектральный). В принципе можно обойтись лю-
26 —J\/» Глава 2. Основные свойства измерительно-регистрирующих систем бым из них, поэтому в каждом конкретном случае выбор метода исследования определяется требованиями к точности измерения, удобством или просто наличием соответствующей аппаратуры. В теории линейных систем (см., например, [1]) входной сигнал/„(*) (или /п(0) называется воздействием, а выходной (или зарегистрированный) сигнал /охЛ(х) — откликом. При импульсном методе исследования в качестве тестовых воздействий используются или единичная функция Го при х < 0; ' Х(х) = { (2.1) I 1 при х > 0, или единичный импульс (дельта-функция), определенный так, что: ПРИ Х л а f 6(*)dx=l. (2.2) оо при х = 0, J —оо (В оптических исследованиях модели этих функций называются «край освещенного поля» и «щель с шириной меньше нормальной»). Отметим, что в последнем случае термин «единичный импульс» используется потому, что, вовсе не амплитуда импульса, а именно fH°oo8(x)dx = 1. Заметим также, что дельта-функция вводится, как функция реализующая равенство f^cooS(x)f(x)dx=f(0)9 поэтому, в частности интеграл f™008(x)x(x)dx= 1, поскольку #(0) = 1. Понятно, что математические абстракции (2.1) и (2.2), весьма удобные, как будет видно из дальнейшего, при теоретическом анализе, не могут быть представлены реальными физическими объектами. Поэтому на практике применяются различные их модели легко реализуемые в эксперименте и одновременно пригодные для численного анализа. Например: : —7= ехР{~ (ах)2}; (2.3) \/П ]_ где <P(z) = (27т)"1/2 /ог exp(-w2/2) du — интеграл вероятностей. При этом, как и раньше, /!^o5i(x)dx= 1. (Критерии применимости такого рода моделей 6(х) мы обсудим ниже.) Понятно, что обозначение аргумента (/ или х) выбираются для функций соответственно зависящих от времени или пространства. Нетрудно убедиться в том, что и в этом случае как f-^ S\(x)dx= 1, так и f*™ 6\(t)dt = 1. Заметим, что значения функций 6\(х) и S\(t) отнюдь не безразмерны. Их размерность есть [с"1] для функций, представляющих временную структуру входного сигнала, и [см"1] для функций, описывающих его пространственную структуру.
2.2. Аппаратная функция, уравнение свертки —11-27 Однако по той же причине интегралы от этих функций f*™ S\(x)dx и fl£> ^ W dt безразмерны, в силу чего, в частности, ток на входе в прибор запишется как Im(t) = QoS\(t), поскольку заряд протекший во входных цепях прибора в этом случае /^ /щ(Г) Л равен f*™ QoSi(t) dt = Qo. В двумерном случае используется двумерная дельта-функция 8(х,у), или функция Гаусса от двух переменных 6\(х,у) = -exp{-aV +?)}, (2.5) я или функция (У [О при — так называемая «светящаяся точка», радиус которой равен а/2. Размерность 6\(х,у) и б2(х9у) — [см~2], так что если т длительность единичного импульса подаваемого на вход оптической системы, а его энергия £0, то распределение интенсивности на входе в систему 1т(х,у) = = $$г(х,у)/т [Вт/см2]. В одномерной ситуации аналогом входного сигнала б2(х,у) является широко используемый в радиотехнике, так называемый «прямоугольный» импульс, который мы будем обозначать 82V). Понятно, что, если длительность такого единичного «прямоугольного» импульса есть т, то его амплитуда будет равна А/т. Подчеркнем еще раз, что во всех случаях интегралы и f*™ S\(x)dx, и /^ 82(t)dt, и ff6\(x,y)dxdy безразмерны и равны единице. При частотном методе исследования, который будет подробно рассмотрен ниже, в качестве тестовых воздействий применяются синусоидальные входные сигналы fm(t) = Aq sinШ или fin(x) — Aq(\ + sin<ox)/2; при этом а) изменяется в пределах полосы пропускания изучаемой аппаратуры. 2.2. АППАРАТНАЯ ФУНКЦИЯ, УРАВНЕНИЕ СВЕРТКИ Отклик системы на единичный импульс называется импульсной реакцией или аппаратной функцией и будет обозначаться нами как g(t) или g(x). (Отклик на единичную функцию называется переходной функцией и обозначается h(x), отметим при этом, что d[h(x)]/dx = g(x).) Покажем, что функция g(x), впрочем, так же как и функция А(х), полностью описывает измерительную систему без помех в том смысле, что с ее помощью можно однозначно связать сигналы на входе и выходе системы. Предварим этому рассмотрение некоторых свойств аппаратной функции. Пусть мы имеем дело с неким пассивным радиотехническим устройством без потерь, причем сигналы на входе и выходе системы
28 Глава 2 Основные свойства измерительно-регистрирующих систем соответственно Im(t) и /out(0- Если Im(t) ток во входной цепи, то заряд, втекающий в систему за время Д/, есть Iin(t)&t и, следовательно, +ОО +ОО = J Iout(t)dt (2.7) просто из условий сохранения — заряды не могут в системе скапливаться. (Усиление или ослабление сигнала, скажем за счет его деления во входных цепях, просто учесть введя в левую часть уравнения (2.7) постоянный множитель.) Разумеется, будет справедливо и следующее равенство + ОО 00 + ОО S(t)dt=Q0 f g(t)dt, поскольку по определению g(t) — есть отклик системы на единичный импульс S(t). Другими словами Qog(t) — это выходной сигнал /out(0> который имеет место, когда на вход подан сигнал /щ(/) = Qo6(t). Из этого последнего равенства, в частности, следует, что размерность значений функций 6(t) и g(t) одна и та же. Аналогичное равенство имеет место и в оптике: ёо jjS(x9y)dxdy = ft Jjg(x9y)dxdy и также, как предыдущие два, представляет собой уравнение сохранения. Рис. 2.1. Воздействие и отклик в линейной системе Обратимся к рис. 2.1. На нем представлены два прямоугольных входных импульса #2(0 разной длительности Т\ и тг и, соответственно, с разной амплитудой /in, такой что 1\Т\ = /2Т2 = Qol два отклика на них g(t) и эквивалентная принципиальная схема, иллюстрирующая нашу экспериментальную ситуацию. Заметим, ситуацию характерную, обычно возникающую при пользовании радиоэлектронными устройствами, — пара-
2.2. Аппаратная функция, уравнение свертки —11-29 зитные индуктивности и емкости являются причиной ограничения крутизны переднего фронта импульса, равно, как запасаемая в них энергия, ответственна за задний, обычно более пологий, его фронт. Обратим внимание на следующее: во-первых, амплитуда выходных импульсов /out(0 существенно меньше амплитуды импульсов входных, что, впрочем, понятно — площади под кривыми Im(t) и /out(0 должны быть равны; во- вторых, хотя длительность первого входного импульса вдвое меньше второго (2ti = T2), форма выходных импульсов (откликов) практически неразличима. Тому две причины: во-первых, равенство I\T\ = /2T2 и, во-вторых, то обстоятельство, что /5» т. Первое понятно — в силу условия (2.7) при 1\Т\ ф /2Т2 ни о каком равенстве выходных импульсов не могло бы быть и речи. Объяснение физических причин, лежащих в основе второго условия (ft > т), отложим до следующего параграфа, здесь же займемся немного терминологией, немного историей и, наконец, уравнением, связывающим входные и выходные сигналы. /д Рис. 2.2. Аппаратная функция Параметр )8 в нашей литературе носит название «полуширина» — название, заметим, не из лучших, поскольку «ширина» как раз полная, а пресловутая «половина» относится не к «ширине», а к амплитуде импульса. В этом смысле следует признать более удачным американскую аббревиатуру FWHM — «полная ширина на половине максимума» — точно описывающую параметр 0. Для аппаратных функций в оптике, функций, как правило четных, где g(x) = g(—x)9 параметр £ можно определить формально: 2g(f}/2) = g(0). Бросим взгляд на рис. 2.2. Там изображена ситуация, имеющая место тогда, когда длительность входного импульса прямоугольной формы значительно больше «полуширины» аппаратной функции. Понятно, что и передний и задний фронты выходного импульса обусловлены переходными электрическими процессами в цепях схемы и лишь его средняя часть соответствует входному сигналу. Однако, сейчас нас озаботит отнюдь не это. Начнем сокращать длительность входного импульса. Ясно, что до поры до времени никаких изменений фронты выходного импульса не претерпят — сокращаться будет
30—11- Глава 2. Основные свойства измерительно-регистрирующих систем только плоская, неискаженная часть импульса. Это и понятно: передний фронт импульса — реакция системы на скачком поданное напряжение; задний фронт — реакция на снятие напряжения. Однако в какой-то момент плоская часть исчезнет вовсе — останутся только передний и задний фронты — и именно тогда выходной импульс по своей форме станет весьма близок к аппаратной функции. Интересно, что много лет назад такой экспериментальный прием измерения полуширины аппаратной функции разработали спектроскописты. Было замечено, что спектральные линии на выходе спектрографа становятся уже по мере уменьшения ширины входной щели спектрографа только до определенного предела, получившего название «нормальная ширина щели». Дальнейшее уменьшение входной щели ограничивает световой поток, но не приводит к уменьшению полуширины выходного сигнала, в обсуждаемом случае — спектральной линии. Итак, пусть известны входной сигнал и аппаратная функция. Как вычислить сигнал на выходе системы? Трудность здесь заключается в том, что величина выходного сигнала /out(0 в некоторый момент времени /* обусловлена не только (скорее не столько!) значением входного сигнала /in(0 в тот же момент времени /*, но, прежде всего, всей его предысторией, т. е. всеми значениями /in(/) на интервале 0, /*. Действительно, если обратиться к рисункам 2.1 и 2.2, то нетрудно увидеть, что заряд Im(t)kt, внесенный в систему компонентой входного сигнала в некоторый момент времени /, длительное время поддерживает соответствующую компоненту выходного тока Д[/ош(0] = I\n(t)g(t)kt на достаточно высоком уровне. В этом смысле аппаратная функция g(t) — это функция влияния, т.е. функция, которая определяет влияние всех компонент входного сигнала на значения выходного сигнала во все последующие промежутки времени. (Понятно, что чем больше промежуток времени, тем влияние меньше). Учитывая ранее сказанное, а также то обстоятельство, что система линейна, можно предложить следующий алгоритм (порядок действий) вычисления выходного сигнала, основанный на применении принципа суперпозиции. Входной сигнал Im(t) разобьем на интервалы Д/ < р (рис. 2.3); вычислим заряд Q, = /(/,)Д/, втекающий в систему за промежуток времени Д7, в момент *,; определим элементарную составляющую выходного сигнала A[/out(0] в момент времени tj > U — из предыдущего ясно, что A[/out(fy)] = Im(ti)btig(tj - f/); найдем выходной сигнал Л>т(0 в момент времени tj как сумму его элементарных составляющих: /out(^) = Y!j=!o Iw{ti)g(tj — /,)Д/. В обозначениях рис. 2.3 элементарная составляющая выходного сигнала в момент времени t составит
2.2. Аппаратная функция, уравнение свертки 31 Переходя к пределу и интегрируя, получим (2.8) Интеграл в правой части этого равенства носит название интеграла Дюа- меля и позволяет в линейных системах вычислить выходной сигнал, если известны входной сигнал и аппаратная функция. Это же уравнение используется и для отыскания (восстановления) входного сигнала, если известны аппаратная функция и выходной сигнал, как это обычно и бывает при измерениях. Обратим внимание, что в реальных системах с шумами, любая процедура восстановления, т. е. отыскивания /щ(0 по /Out(0> несет в себе ряд принципиальных (а отнюдь не вычислительных!) трудностей с которыми нам придется столкнуться еще столько раз, что на первый раз ограничимся лишь предупреждением. Рис. 2.3. Связь входного и выходного сигналов Нижний предел интеграла Дюамеля определен областью существования входного сигнала, верхний — принципом причинности: те составляющие входного сигнала, которые поступят на вход системы в промежутки времени более поздние, чем tj никак не могут повлиять на выходной сигнал /out(4)- He такова ситуация с оптическими изображениями — на значение выходной освещенности 1(х) в некоторой точке х будут влиять участки входного изображения расположенные как слева, так и справа от х, если мы имеем дело с одномерными изображениями. (Типичный пример одномерного изображения 1(х) это спектрограмма, в которой интенсивность вдоль спектральной линии не меняется, т. е. 1{у) = const.)
32—11- Глава 2. Основные свойства измерительно-регистрирующих систем В двумерной ситуации — Г=/(х,у) — на освещенность (или интенсивность) выходного изображения в некоторой точке х,у будут влиять все участки входного изображения, расположенные вокруг сопряженной точки. Если учесть отмеченное обстоятельство, а также иную размерность переменных, несложно, повторив логику приведенных выше рассуждений, получить уравнение, связывающее пространственные распределения освещенности на входе и выходе оптической системы: +оо Ux!)g(x-xf)dx!, (2.9) + f Это уравнение носит название «уравнение свертки». С его помощью можно решить три следующие задачи: вычислить распределение освещенности в выходном изображении /out(x), если известно входное изображение /ш(х) и аппаратная функция g(x)\ попытаться, со сделанными выше оговорками, восстановить входной сигнал 1т{х) по выходному /0UtM; найти аппаратную функцию g(x), если входное и выходное изображения известны. Понятно, что при двумерных изображениях уравнение свертки будет иметь вид Iout(x,y) = ff /in(x',/)g(x -х\у- yf)dxdy. (2.10) В литературе операция свертки часто обозначается как 1оЫ(х) = /ш(х) 0 g(x), мы же останемся верны ранее введенным обозначениям 101й(х) = GIm(x), понимая, что в линейных системах оператор G определен уравнениями (2.8), (2.9) и (2.10). Отметим, что и в нелинейных системах можно ввести аналогичный оператор, т. е. формализовать связь входного и выходного сигналов. 2.3. КОЭФФИЦИЕНТ ПЕРЕДАЧИ, АМПЛИТУДНО-ЧАСТОТНАЯ И ФАЗОВО-ЧАСТОТНАЯ ХАРАКТЕРИСТИКИ, СВЯЗЬ ВХОДНОГО И ВЫХОДНОГО СИГНАЛОВ В ФУРЬЕ-ПРОСТРАНСТВЕ При частотном методе исследования в линейных системах в качестве тестовых входных воздействий применяются синусоидальные входные сигналы fm(t) = Ioshoot или fm(x) = /о(1 + sina)x)/29 причем в первом случае величина сигнала изменяется во времени, во втором случае значение сигнала определяется пространственной координатой. В частотном методе исследования роль аппаратной функции играет коэффициент передачи. Коэффициентом передачи по определению называется отношение двух комплексных величин — выходного сигнала
2.3. Коэффициент передачи, уравнение свертки в фурье-пространстве —11-33 /out = h exp{/[w/ + <р(а))]} ко входному сигналу /щ = /0 exp{i<ot}, измеряемое при различных значениях монохроматического сигнала со, подаваемого на вход системы ^ (2.11) где К(ш) — комплекснозначная функция, обычно представляемая в виде К((о) = А(о))ехр{—i(p(a))}. Функция А((о) = \К(о))\ носит название «амплитудно-частотной характеристики» и определяет отношение амплитуд входного и выходного сигналов. Функция <р((о) называется «фазово-частотной характеристикой» и определяет фазовый сдвиг так, что если входной сигнал fin (/) = /о sin ce>/9 то выходной сигнал fout(t) = h sin(w/ + <р). Напомним, что фурье-образом или фурье-изображением функции/(х) называется функция оо Ф(о))= j f(x)exp{-ia>x}dx. (2.12) В сущности функция Ф(<х))9 т.е. изображение функции/(х) в фурье-пространстве, является спектральным разложением функции/(х). Обратным преобразованием Фурье или восстановлением называется операция оо f(x) = -!- Г Ф(а>) exp{/a>x} da). (2.13) 2л J —оо Операции в фурье-пространстве широко распространены как вообще в вычислительной математике, так и при обработке результатов наблюдений в частности. Причина — упрощение вычислений. Похожий прием используется при логарифмировании — переходя в пространство логарифмов, где мы оперируем не с числами, а с их изображениями, т. е. с логарифмами — мы понижаем ранг операции — складываем логарифмы, а не перемножаем числа; мучительную операцию извлечения корня заменяем делением и т.д. Аналогично в фурье-пространстве, где операции производятся не с функциями а с их изображениями, процедуру решения интегральных уравнений заменяет решение уравнений алгебраических, после чего искомая функция восстанавливается по найденному фурье-образу. Понятно, что, например, входной сигнал /^(х) связан со своим спектральным разложением Фт(о)) обратным преобразованием Фурье оо /ш(х) = ^ J <Pin(a>)exp{i<ox}da>. (2.14)
34 Jly- Глава 2. Основные свойства измерительно-регистрирующих систем На некоторой фиксированной частоте w* спектральная составляющая сигнала сосредоточенная в интервале Аш определит соответствующую составляющую сигнала в конфигурационном пространстве 0((o)exp{io)x}d<o ^Ф(о)*) exp{ia)*x}bo)9 (2.15) £7Z причем правая часть равенства будет стремиться к точному значению интеграла по мере уменьшения А(о. В то же время отношение спектральных составляющих выходного и входного сигналов на фиксированной частоте по определению есть коэффициент передачи, т. е. К(а>*) = k± /in откуда Используя равенство (2.15) найдем, что *х}А(о (2.17) и суммируя по всем частотам получим оо /outW=^ f <Pm(w)K(a,)cxp{iwx}da>. (2.18) — ОО В то же время оо ^ |ft>. (2.19) по определению. Из сопоставления подынтегральных выражений формул (2.18) и (2.19) следует, что Фоих(о)) = Фш(о))К(о)). (2.20) Связь входного и выходного сигналов в фурье-пространстве проста и наглядна так как коэффициент передачи как раз и показывает, как при прохождении системы ослабляется каждая спектральная компонента. Полученное уравнение есть уравнение свертки в фурье-пространстве. Его решение
2.3. Коэффициент передачи, уравнение свертки в фурье-пространстве —f\/- 35 прозрачно: для восстановления входного сигнала по выходному следует каждую спектральную составляющую выходного сигнала поделить на величину ослабления этой спектральной компоненты в измерительной системе, т. е. увеличить ее в \/К(а)) раз (Отсюда, в частности, ясно, что, если в интервале частот входного сигнала К(<о) = 1, Фт(о)) = Фот(^)) Итак, рациональный алгоритм, т. е. последовательность действий, которые следует предпринять при восстановлении (реконструкции) входного сигнала по выходному, понятен: следует перейти в фурье-простран- ство, т. е. найти фурье-образ выходного сигнала, разделить его на К(а)) и вернуться в пространство конфигурационное, т. е. выполнить обратное преобразование Фурье. К сожалению, в действительности все обстоит не так просто. В реальной жизни при восстановлении входного сигнала приходится иметь дело со следующей ситуацией: (2-22) Здесь N((o) — спектральная составляющая действующих в системе шумов, которые суммируются с выходным сигналом. В той области частот, где Фош(й>) ^ N((o), т. е. там, где спектральная составляющая сигнала сильно превышает спектральную составляющую шума, восстановление входного сигнала не вызывает сложностей. Сложности начинаются там, где Фош(^) и N((o) близки. Поэтому важным является вопрос, каковы спектральные распределения <P0Ut(<*>), К{<*>) и N(<o). В связи с этим сделаем ряд замечаний. Во-первых, любой прибор имеет ограниченную область спектрального пропускания, поскольку при <о -> оо \К(а))\ -» 0. Поэтому Фои1((о) и стремится к нолю с ростом частоты. Другими словами, из-за конечной ширины аппаратной функции высокие пространственные частоты в выходном изображении всегда подавлены. Во-вторых, при а) —► оо и Фоиг((о), и К((о), и N((o) стремятся к нулю, однако с разной скоростью. Причем, и К(со) стремятся к нулю быстрее чем N((o). Дело в том, что и и К((о) достаточно гладкие функции, в то время как шум N(x) не есть гладкая функция, поэтому N((o) стремиться к нулю очень медленно. В этой ситуации, как это ясно видно из соотношения (2.22), начиная с некоторой критической частоты а)с 1) такой, при которой N(<o) > Фош(^), а К((о) —> 0 погрешность восстановленного значения Фт((^) может быть сколь угодно велика. Математики говорят: «задача неустойчива». Иногда 0 В дальнейшем наряду с а)с будет использоваться также и vc = (ос/(2л).
36 -JI- Глава 2. Основные свойства измерительно-регистрирующих систем говорят: «решение раскачивается». Что это означает с физической точки зрения? Дело в том, что слабо меняющийся с ш спектр шумов есть результат усреднения большой выборки реализаций, в то время, как каждая отдельная реализация, как любая реализация случайного процесса, есть функция флуктуирующая. Поэтому в области а) > о)с всегда найдется такая частота сыу, при которой спектральная составляющая N((Oj) велика, a K(q)j) близка к нулю. Вследствие этого вместо истинного (или даже приближенного) решения мы получаем результат fm(x) = Aj sin^x) поскольку именно спектральная компонента Ф-т(щ) оказывается доминирующей в интеграле (2.14). При этом значение Aj может быть сколь угодно велико. Другими словами в такой ситуации основной вклад в восстановленный сигнал будут давать частоты а> > а)с, т.е. те, которые практически отсутствуют в исходном сигнале. Мы рассмотрели причину возникновения неустойчивости решения уравнения типа свертки в фурье-пространстве только потому, что такое рассмотрение более наглядно, но те же неустойчивости имеют место и при решении такого рода задач в конфигурационном пространстве, просто потому, что физическая причина неустойчивости одна и та же. Задачи такого рода известны как некорректно поставленные т. е. задачи, для которых малые изменения исходных данных (в нашем случае за счет шумовой компоненты на высоких частотах) могут приводить к сколь угодно большим изменениям решения. Сегодня, следуя пионерским работам А. Н. Тихонова, разработано много рецептов их решения, которые будут рассмотрены подробно в разделе посвященном обработке результатов наблюдений. По определению g(x) — выходной сигнал системы при подаче на ее вход сигнала/nW = 6(x); поэтому в соответствии с (2.18) = h J ®s(<o)K(<o)exp{iiox}da>. (2.23) — ОО Учитывая, что спектр 5-функции Ф$((о) = 1, получим оо = h f K(")eMi<ox}da>, (2.24) т. е. коэффициент передачи является спектром аппаратной функции. Конечно при этом оо К(со)= J g(x)exp{-i<ox}dx. (2.25) — ОО Другими словами, коэффициент передачи и аппаратная функция связаны парой преобразований Фурье.
2.4. Некоторые следствия —11-37 2.4. НЕКОТОРЫЕ СЛЕДСТВИЯ 1. Пусть в нашей измерительной системе A(co) = \К(а>)\ = = С = const, а (р(а)) = асо, т.е. К((о) = Cexp{—iaa)}9 а входной сигнал /in =/n(0- Найдем выходной сигнал /out С Г /om(0 = 2^J &in{<*))sxp{-ia<x)}exp{i<ot}d<x) = о ё / ~fl)}da) = 0 Таким образом, если А(а)) = С = const, а <р(о>) = а<о, то форма сигнала измерительной системой не искажается, но выходной сигнал «запаздывает» по отношению ко входному на время а. Эта величина называется «запаздыванием». 2. Заметим, что аппаратные функции оптических систем, как правило, симметричны относительно их максимума; другими словами — это функции четные. Покажем, что если аппаратная функция вещественная и четная, т.е. g(x) = g(—x), то <p(w) = 0. Произведем в нижеследующих выражениях две последовательные замены. Сначала заменим х на —х, а затем g(x) на g(—x) оо оо К(о)) = I g(x) exp{-i(ox} dx= I g(-x) exp{i<ox} dx = oo = j g(x) exp{iwx} dx = К(-ш). — OO Таким образом из четности функции g(x) следует, что К((о) также функция четная, т. е. К(а)) = K(-w). (2.26) Заметив, что g(x) — вещественная функция, найдем функцию, комплексно сопряженную К(со) оо К*((о) = f g(x) cxp{i(ox} dx = K(-<o). —oo Другими словами — из того обстоятельства, что g(x) функция вещественная, следует, что К*((о) = К(-со). (2.27) Перепишем это равенство в виде А((о) exp{iq>(a))} = A(—(o)exp{—i<p(—a))}9
38 JL Глава 2, Основные свойства измерительно-регистрирующих систем или, что то же A(a))[cos<p(a)) + isin<p(a))] = A(—(o)[cosq)(—a)) — /sin<p(—ш)]. Для того чтобы эти равенства выполнялось необходимо, чтобы А((о)=А(—(о), а (р(ш) = — q>(—(о). Представив равенство (2.26) в виде A(o))exp{-iq>(a))} = А(-а)) exp{-i(p(-a))} и проведя в его правой части замены А(-ш) = А(со) и -<р(-ш) = (р(<о) получим А((о)схр{—i<p((o)} = A(a))exp{i<p(a))}, что возможно лишь, если (р(а>) = 0 или, что то же К((о) = А((о). Собственно это нам и требовалось доказать. 3. В оптике коэффициент передачи называется частотно-контрастной функцией или частотно-контрастной характеристикой (ЧКХ). В эксперименте ЧКХ определяется по выходному изображению как А(а>) = f=f!=* (2.28) при подаче на вход системы сигнала fm(x) — Ео(1 + sinwx)/2. Понятно, что при этом выходной сигнал fout(x) = Eo(\ +A((o)s\na)x/2), а максимальные и минимальные его значения т. е. Етях и Дпш будут реализоваться соответственно при значениях о>х = я/2 + кп и <ох = Зя/2 + кл, где к - четные числа. Заметим, что в оптической системе без потерь всегда, независимо от значения о), (Emax+Emin)/2 = Ео, хотя и Етах и Emsn от (х) зависят. Это позволяет находить ЧКХ пользуясь только выходным изображением. 4. Из теории спектров известно, что произведение длительности импульса и его спектральной ширины Д/ х Ду « 1, где, естественно, Ду = Дш/(2я). Конечно, это лишь грубая оценка. К тому же не очень понятная, поскольку, что такое «длительность импульса Д/», если импульс не прямоугольной формы, не ясно. Безусловно, по поводу Дсо или Ду возникает еще больше вопросов. Однако, поскольку оценка — это всего лишь оценка и не более того, примем, что At, Аю и Ду определяются соответственно полуширинами функций/(/), Ф((о) и Ф(у), т. е. примем, что At « /}t, a Ду « fiv. Напомним, что для четных функций полуширина (} находится из уравнения 2/()8/2) =/(0) и вычислим значения сначала f}t а затем и (}v для функции (2.3) — 6{(t) = (а/х/я) ехр{—(at)2}, используемой нами как модель ff-функции при импульсном методе исследования измерительных
2.4, Некоторые следствия -JI- 39 систем. Из уравнения (2аД/я)ехр{-(а0/2)2} = (аД/я)ехр{-(0)2} найдем, что )8/ = 2\/1п2/а. Вычислим фурье-спектр функции (2.3) Ф(а>)= -?L —оо откуда найдем, что Ф(у) = ехр{—(nv/a)2}, f}v = 2ау/\п2/л и, следовательно, произведение Д/ х Ду « 0, x /Jv = 41п2/я « 0,9. Отсюда видно, что оценка Д/ х Ду « 1 не так уж и плоха. По какой причине мы занимались этими упражнениями? Причин две. Первая — показать, что, если Д/ (или Дх) известны, где Д* или Дх характерные времена или масштабы изменения функций, описывающих структуру сигналов во времени или пространстве, мы можем оценить (именно оценить, а не вычислить точно!) ширину спектров этих сигналов как Ду « 1/Д/ или Ду « 1/Дх. (Для функций с одним максимумом таким характерным масштабом может служить их полуширина.) Вторая причина — найти критерии применимости моделей ^-функции, используемых при импульсном методе исследования измерительных систем. Предварительно заметим, что, если при частотном методе исследования мы измеряем К(а>) последовательно изменяя частоту входного сигнала от (о=0 до wmax, где й>тах определяется из условия #out(wmax)> Ща>тах) (здесь N(u>max) спектральная составляющая шума на частоте а)тах, то при импульсном методе исследования, измеряя g(x), мы подаем на вход системы один короткий импульс, в спектре которого, конечно же, должны содержаться все частоты в интервале [0,й>тах]. Однако, если в первом случае а)тах легко определяется по выходному сигналу — мы увеличиваем частоту лишь до тех пор, пока выходной сигнал не «потонет» под шумами, — то во втором случае не так-то просто по виду аппаратной функции определить, достаточно ли короткий импульс мы подали на вход системы, т. е. определить, содержаться ли в спектре входного сигнала все частоты, лежащие в интервале [0, сотях]. С другой стороны, если /J есть полуширина аппаратной функции, то оценка полосы частот Дю, пропускаемых системой есть, как показано выше, 2n/fi. В то же время спектральная ширина входного импульса длительностью 6 может быть оценена как 2п/8. Понятно, что интервал частот, подаваемых на вход системы при ее испытании, должен быть шире ее полосы пропускания Да>, т. е. нужно выполнить условие 2л/8 ^> 2л//5 или 8 <$: р. Насколько меньше? Оценки показывают, если 8 всего в три раза меньше /?, то ошибка в определении fi составит лишь несколько процентов. 5. Обсудим применимость описанного выше аппарата для оценки качества различных измерительно-регистрирующих систем. Прежде всего
40—11- Глава 2. Основные свойства измерительно-регистрирующих систем подчеркнем, что во всех тех случаях, когда шумы малы по сравнению с сигналом, формализм, использующий такие параметры системы, как аппаратная функция или коэффициент передачи, позволяет по входному сигналу найти сигнал на выходе системы и в этом смысле является хорошим аппаратом для оценки качества измерительно-регистрирующей системы. Более того, аппаратом весьма удобным, поскольку он может быть использован и тогда, когда система лишь синтезируется, т. е. еще экспериментально не исследована и ее сквозные параметры не известны, но имеются данные по составляющим ее компонентам. Пусть наша система состоит из ряда последовательных устройств (оптический тракт, ПЗС-камера, линия передачи данных и т.д.), аппаратные функции или коэффициенты передачи которых известны и есть g\(x)9g2(x),g3(x)... или К\(а)),К2((о),Кз((о)... . Тогда суммарная аппаратная функция, являющаяся параметром всей системы gi(x) = jjj gn(x - xn-i)gn-i(xn-{ - х„-2) • • - —оо а ее коэффициент передачи = Kl(a))K2(a))K3(a))K4(a)).... Однако при всем при этом, зная выходной сигнал, мы не имеем критерия его оценки, а значит не можем количественно определить качество системы и, следовательно, не имеем оснований для сравнения различных систем между собой. Дело в том, что пока мы занимались лишь аберрационными характеристиками систем, а при всей их важности это лишь половина дела, поскольку реальная система — это система с шумами, а качество выходного сигнала в конечном итоге не в меньшей, а подчас в большей степени зависит от отношения сигнал/шум. Перейдем к рассмотрению этой стороны вопроса. Прежде всего напомним, что мы рассматриваем измерительные системы, выходные сигналы которых подвергаются обработке. Заметим, в этой связи, что поскольку реальные физические системы не есть системы строго ограниченные по частоте (К(а)) лишь асимптотически стремится к нулю при (о —> оо), в пределе, когда отношение сигнал/шум S/N —► оо, при любой аппаратной функции входное изображение может быть восстановлено сколь угодно точно с помощью, например, операции Фт(х) = Фохй((х))/К(а)). В этом смысле все системы просто одинаковы. Однако в действительности при восстановлении входного сигнала по выходному приходится иметь дело с непростой ситуацией, подробно рассмотренной выше, откуда видно, что успешность такой процедуры сильнейшим образом зависит от действующих в системе шумов. Поэтому
2.5.Дискретизация —fly- 41 в условиях шумов g(x) и К((о) сами по себе характеристиками системы не являются. Следовательно, только на их основе сконструировать количественные критерии качества системы невозможно. 2.5. ДИСКРЕТИЗАЦИЯ Как правило, измеренные в эксперименте зависимости представляют собой непрерывные функции своих аргументов. Однако при обработке результатов измерений функции, несущие информацию об объекте исследования, дискретизируются как по значениям аргумента, так и по значениям функции. Дискретизация состоит в замене несчетного множества значений аргумента и функции конечным множеством их значений. Это возможно сделать поскольку функции обсуждаемого класса ограничены, как по их спектру, так и по значениям функций и области их существования. Если дискретные значения функции располагаются по шкале функций равномерно, так что /и* = k km, операция дискретизации (или квантования) может быть выражена формулой т> <2-29) где скобки означают «целая часть», а Д/w представляет собой шаг квантования. Само собой разумеется, что при квантовании, т. е. при замене истинного значения т округленным значением /и*, вносится погрешность г = т — т/с, которую называют помехой квантования или шумом квантования. Как видно из (2.29), всегда е < Д/и/2. Обычно е выбирается того же порядка, что и помехи измерительных датчиков и усилительно-передающих трактов. Для помех с нормальным распределением шаг квантования выбирается так, чтобы е2 = £"=1 aj = а2, где суммирование производится по различным независимым процессам, вызывающим помехи. Что несет в себе такой способ дискретизации, при котором шаг квантования Д/и выбирается так, чтобы е = а? При нормальном распределении шума в измерительно-регистрирующем тракте выбор Д/и = 2(7 означает, что вероятность ошибки на одно деление дискретной шкалы в ту или иную сторону (±Д/и) в сумме составляет ~ 30%. Однако вероятность ошибиться на два деления всего 5 %, а на три — меньше 0,5 %! Дискретизация по значениям аргумента производится на основе теоремы Котельникова, одну из формулировок которой мы приведем: «Для однозначного определения функции f(x) строго ограниченной по частоте величиной vc необходимо и достаточно задать ее значения в дискретных точках, отстоящих друг от друга на величину Дх < l/2vc». Используя теорему Котельникова, несложно представить соотношения (2.12) и (2.13) в сумматорном виде. Действительно, следуя теореме Котельникова по-
42 Jl. Глава2. Основные свойства измерительно-регистрирующих систем ложим, что шаг квантования Ах = l/2vc. В этом случае некое дискретное значение х, обозначаемое как хк = &хк = k/2vc, а общее число членов ряда N = Г/Дх = 27VC, где Т = Хщах — *min — интервал, на котором задана функция /(х). Значение До> обусловлено наименьшей частотой Vnun = 1/Г, откуда Ао) = 2п/Т, a (Oj =jA<D. Понятно, что у и к — целые числа. Заменив в выражении (2.12) соответственно х и <о на хк и a)J9 a dx на Дх = l/2vc и просуммировав все значения/(х) отДхщш) до/(хтах) найдем, что ^ £ (2.30) Произведя аналогичную замену в формуле (2.13) и суммируя все значения <P(C0j) ОТ Ф(-Ютах) ДО Ф(й>тах), ГДв (Omax = 2jlVc, ПОЛУЧИМ f(xk) = ± £ <P(<Oj)exp{ia>jxk}. (2.31) У >=-rvc Вообще говоря, соотношения (2.30) и (2.31) некорректны, поскольку относятся к функциям одновременно ограниченным и по спектру и по пространству, что, строго говоря, невозможно. Однако, те функции, с которыми приходится иметь дело при обработке экспериментальных данных, в большинстве случаев практически ограничены и по пространству и по частоте в том смысле, что сумма слагаемых (2.30) и (2.31) при \ц\ > 2лvc и |х*| > Т/2 становится пренебрежимо малой по сравнению с Ф(алу) и f(xjc) соответственно, или эти слагаемые становятся малыми по сравнению с шумами. Если, как это чаще всего и бывает при обработке экспериментальных данных, функция/(х) оказывается определена в точках хк и при этом Дх = \xk — х/с-\\ < l/2vc, а всего точекх* на интервале [хл,х_л] — 2п, фурье-образ/(х) удобно вычислить по формуле 0(a>j) = Дх £ /te)exp{-/^*}. (2.32) k=-n 2.6. ИНФОРМАЦИОННЫЙ ПОДХОД, СКОРОСТЬ ПЕРЕДАЧИ ИНФОРМАЦИИ ПО ЭЛЕКТРОННЫМ И ОПТИЧЕСКИМ КАНАЛАМ, ИНФОРМАЦИОННАЯ ЕМКОСТЬ ЗАПОМИНАЮЩИХ УСТРОЙСТВ, ЭНЕРГЕТИЧЕСКАЯ ЦЕНА ИНФОРМАЦИИ Итак, заключительный этап эксперимента, предшествующий обработке экспериментальных данных, состоит в формировании числового массива, несущего информацию о сигнале, поступившем на вход
2.6. Скорость передачи информации, энергетическая цена информации измерительной системы. Требования, предъявляемые к такому массиву чисел, обусловлены той точностью, с которой необходимо определить набор функций координат и времени, описывающих состояние объекта исследования и являющихся конечной целью измерений. Возможность удовлетворить этим требованиям зависит от конкретных параметров используемых измерительно-регистрирующих систем. Последние обычно состоят из ряда устройств многократно трансформирующих приносимую со входным сигналом информацию так, что выходные (зарегистрированные) сигналы подчас существенно отличаются от входных, что, собственно, и определяет потерю точности. Прогнозирование выходных сигналов, равно как и анализ возможностей измерительных систем, включающих в себя оптические приборы, разнородные радио-электронные устройства с их каналами связи, аналого-цифровые преобразователи, запоминающие устройства и т.д., требует единого подхода с общих позиций. Естественно применить для описания и анализа таких систем хорошо разработанные методы теории информации, поскольку задача последней — как раз определение и оптимизация пропускной способности каналов передачи информации и информационной емкости запоминающих систем, а все перечисленные выше устройства в конечном счете предназначены для приема, передачи, обработки и регистрации информации. То, что в одних устройствах информация сосредоточена во временной структуре сигналов, а в других устройствах — в пространственной их структуре, не существенно. Все названные выше устройства в равной степени обладают рядом фундаментальных свойств и, в первую очередь, линейностью и инвариантностью, т. е. независимостью свойств системы относительно пространственного или временного сдвига. Эти обстоятельства определяют почти полное сходство используемого для их анализа математического аппарата и позволяют применить хорошо разработанные и далеко продвинутые в теории связи методы анализа и синтеза электронных систем к другим, в частности, к оптическим устройствам. Как известно (см., например, [2]), мера неопределенности или мера информации сообщения о конкретном значении этой неопределенности, называемая энтропией, определяется как Н(А) = - £ P(At) log2 РШ, (2.33) где P(Aj) — вероятность элементарного события Ах (в нашем случае — вероятность получения некоторого отсчета исследуемой функции). Формула (2.33) определяет энтропию конечного поля вероятностей {А}. Для непрерывной случайной величины у, характеризуемой плотностью рас-
44 —fly- Глава 2. Основные свойства измерительно-регистрирующих систем пределения вероятности р{у), энтропия сообщения о конкретном значении этой случайной величины определяется как оо = - f P(ynog2[p(y))dy. (2.34) — ОО Отметим, что обычно в теории связи P(At) ф const, поскольку символы, кодируемые при передаче сообщений (буквы алфавита, слова и т.д.) появляются с существенно разной вероятностью. Не так, как правило, обстоит дело при приеме и регистрации сообщений о физических явлениях, «закодированных» природой и регистрируемых нами как осциллограммы, интерферограммы, коноскопические картины и т.п., или при анализе полутоновых изображений во всех случаях, когда нет априорных данных и в любой наперед заданной точке изображения с равной или примерно равной вероятностью можно ожидать любую освещенность. Пусть в нашем случае измеряемая функция ограничена значением /итах. Шаг квантования, определенный точностью измерения, выбран равным А/и и априори равновероятно в каждой из точек (х,у) зарегистрировать любой из отсчетов функции от 0 до /итах/Д/я. Тогда, если L = /wmax/A/w+ 1, вероятность зарегистрировать некоторое конкретное значение функции в одной из точек будет равно 1/Z,, откуда вероятность зарегистрировать набор конкретных независимых значений функции в к точках будет \/Lk. Если о функции ничего не известно, но любой набор равновероятен P(Ai) = l/Lk, и, следовательно, ЩА) = - £ РМ log2 P(At) = (-*log2 L)[- £ РШ] = *log2 U (2.35) /-1 i-i ПОСКОЛЬКУ YH-\ ?(Ai) = 1. Таким образом, если отдельные значения функции дискретны и независимы, а в каждом из к отсчетов равновероятно зарегистрировать любое из L значений, энтропия сообщения вычисляется по формуле (2.35). В соответствии с этим, например, если на единице площади поля изображения возможно произвести к независимых отсчетов освещенности (или яркости), а число градаций освещенности, которое возможно различить, равно L, энтропия единицы площади поля изображения # = fclog2£, т. е. только к и L в этом случае определяют количество информации, которое в принципе можно записать (а значит и считать) на единице площади поля изображения. Подчеркнем, что это соотношение при всей его наглядности точно определяет лишь энтропию совокупности дискретных случайных величин, распределенных так, что P(Aj) = 1/Lk. Энтропию же реальных оптических изображений с его помощью можно только
2.6. Скорость передани информации, энергетическая цена информации —11-45 приблизительно оценить, да и то в ситуациях далеких от оптимальных. Так в ситуации, когда полуширина аппаратной функции измерительно- регистрирующей системы р < A, vc < 1/Д, где А — шаг считывания (1/Д2 = 4 а!>1, рассчитанное по этой формуле информационное содержание изображения только на 20—30% больше истинного. Но дело здесь не в величине ошибки — описанные условия (j8 <^C A <^C l/vc) далеки от оптимальных. А в оптимальной или близкой к ней ситуации эта прозрачная формула попросту неверна, т. е. именно там, где необходимо, она не может быть использована. Корректные формулы для расчета энтропии, в том числе и оптических изображений, будут предложены ниже. Здесь же остановимся на следующем. Известно, что энтропия сообщения о конкретном значении некоторой величины у, имеющей гауссовское распределение с нулевым средним Н(у) = l-log2(2nea2y), (2.36) где агу — дисперсия величины у. Если некая случайная величина и не имеет гауссовского распределения, в теории информации она характеризуется как дисперсией а\, так и величиной а\ = 22Н{у)/(2пе), названной по предложению К. Шеннона энтропийной мощностью. Последняя равна дисперсии такой случайной величины, которая имеет гауссовское распределение и ту же энтропию, что и и. Пропускная способность канала С в теории информации определяется той наибольшей энтропией сообщения, которая может быть передана через него в единицу времени со сколь угодно малой ошибкой. Если среднеквадратичное значение входного сигнала не может превзойти определенной величины и2, то пропускная способность канала, в котором действует аддитивный шум с нулевым средним, характеризуемый дисперсией а\ и энтропийной мощ- (2.37) где знак равенства имеет место только тогда, когда шум гауссовский. В этом случае а\ = а\ и информация, которую можно передать через такой канал в единицу времени i( £) (2.38) В теории информации доказывается, что о\ > а\. Поэтому, в силу неравенства (2.37) пропускная способность канала с гауссовским шумом наименьшая, т. е. помеха, вызванная аддитивным шумом будет наиболее силь-
46 Jl- Глава 2. Основные свойства измерительно-регистрирующих систем ной тогда, когда шум имеет гауссовское распределение. Таким образом формула (2.38) — оценка снизу той информации, которая может быть передана через канал с шумами. Используя теорему Котельникова можно перейти от дискретного канала к непрерывному. Так пропускная способность частотно-ограниченного канала с аддитивным белым шумом (139) Здесь Д v — ширина полосы пропускания канала, Р — средняя мощность сигнала на входе в канал и No — средняя мощность шума на единицу ширины полосы. (Заметим, что средней мощностью функции u(t) называется величина Р = (I/ T) f_'T,2u2(t) dt. В реальном физическом канале эта величина пропорциональна мощности в обычном смысле, если u(t) — амплитуда сигнала.) В соответствии с (2.39) за время А* через частотно-ограниченный канал с аддитивным белым шумом можно передать информацию Я = AvA,.og2(l + J^) = AvA,log2(l + ±±). (2.40) Положим, что произведение Ду х At порядка единицы. Тогда информация, переданная через канал с шумами определится отношением принятой энергии сигнала PAt к энергии шума ЛЬДуД/, откуда нетрудно заметить, что для передачи одной единицы информации необходимо, чтобы энергия сигнала, принятого по некоторому физическому каналу, по крайней мере была бы не меньше энергии шума, накопленной за время передачи сигнала. Пропускная способность канала, выражаемая формулой (2.39) зависит от ширины полосы пропускания и отношения средней мощности входного сигнала Р к средней мощности шума ЛЬДу в заданной полосе частот Av, При заданных Р и No значение С растет очень быстро с Ду при малых Ду, но асимптотически приближается к Cqo, когда Ду —► оо. Величину Соо легко вычислить [3]: ~Р ~р Со° = ЖШ2 ~ Эта формула определяет пропускную способность канала при условии, что на его частотные характеристики не накладывается никаких ограничений. Из сравнения (2.39) и (2.41) можно обнаружить, что С = 0,7Соо уже при Ду = P/No. «Скорость создания сообщений», «скорость передачи сообщений» и «пропускная способность канала передачи информации» — это понятия теории информации. Рассмотрим более подробно, что означают эти понятия, чтобы затем перейти к вычислению энтропии передаваемых сигналов и энер-
2.6. Скорость передачи информации, энергетическая цена информации —11-47 гии, необходимой для передачи через канал с шумами требуемого количества информации. При этом будем помнить, что наша основная цель — найти способ анализа измерительно-регистрирующих систем. Причем такой способ, который позволил бы конструировать измерительные системы оптимальным образом в том смысле, что по выходному (зарегистрированному) сигналу входной может быть восстановлен с заданной точностью при минимальных энергетических затратах на передачу информации. Последнее уточнение совсем не лишнее, поскольку, если энергия на входе в канал и его динамический диапазон не ограничены, входной сигнал может быть восстановлено со сколь угодно малой ошибкой. Пусть, например, входной сигнал есть входное двумерное изображение, которое задано пространственным распределением освещенности на входе в канал Ет(х,у) или входной экспозицией ^т(х9у) = Ет(х9у)т, где т — время экспонирования, и начнем со «скорости создания сообщения». Заметим, что непрерывная функция Е(х9у) имеет бесконечное число значений. Это означает, что для ее точного воспроизведения необходимо передать бесконечное количество информации, т. е. иметь неограниченный источник энергии, а также — или канал с бесконечной пропускной способностью, или неограниченное время передачи. Естественно, что все это невозможно. Однако, если между точными значениями функции Ет(х,у), и ее восстановленными по выходному изображению значениями допустить некоторое расхождение, количество информации, передаваемой по каналу, будет ограничено. Как раз то минимальное количество информации, которое нужно передавать в единицу времени (или как в нашем случае на единице длины или площади оптического изображения), чтобы восстановить передаваемую функцию с заданной точностью, называется в теории информации скоростью создания сообщения. Эта величина зависит от природы и значения допускаемой погрешности и вводится в работах [4, 5] как «скорость создания информации по отношению к критерию точности». (Критерии точности могут быть, вообще говоря, разными; чаще других используется среднеквадратичный критерий.) Само собой разумеется, что канал, через который передается информация, должен позволять передавать ее, по крайней мере, не с меньшей скоростью, чем она «создается», т. е. подается на вход канала. Скорость передачи сообщений по каналу определяется соотношением [4]: R = ЩХ) - HY(X) = H(Y)- Hx(Y). (2.42) Здесь X — входной, a Y — выходной сигналы, независимо от того временная 7(0 или пространственная Е(х9у) структура сигнала содержит информацию о передаваемом «сообщении». Рассмотрим ситуацию, когда входной сигнал Ет(х9у) представляет собой пространственное распреде-
48 —'w- Глава 2. Основные свойства измерительно-регистрирующих систем ление освещенности на входном зрачке оптической системы. В этом случае: • Н(Х) = Н[Е\п(х,у)] — энтропия источника, равная энтропии входа в канал; • H(Y) = H[Eout(x,y)] — энтропия выхода канала, т.е. энтропия зарегистрированного изображения; • Ну(Х) = fft^piX, Y) log2 Py(x) dX dY — условная энтропия входа («ненадежность»), т. е. та часть информации входного сигнала, в нашем случае входного изображения, которая отсутствует в зарегистрированном изображении, или та неопределенность относительно переданного изображения, которая имеет место, когда известно принятое изображение; • HX{Y) = fftZP(x> Y)\o%2Px(Y)dXdY — условная энтропия выхода, т. е. неопределенность относительно того изображения, которое будет принято, если известно передаваемое изображение. Понятно, что конкретизация приведенных выше определений и обозначений таких, как ЩХ) = Н[Е^(х9у)]9 H(Y) = H[Eout(x9y)]9 HY(X) и Hx(Y)9 обусловлена лишь тем, что мы рассматривали в качестве примера случай передачи именно двумерных оптических изображений. Эти определения сразу же станут универсальными, как только в них слова «изображения» будут заменены словами «сообщения». Итак ясно, что величина R определяет количество информации, содержащейся в выходном изображении о входном. Обычно в теории информации вместо величин R9 H(X)9 H(Y)... вычисляют величины Ri9H\(X)9 H\(Y)... — энтропии или количества информации в расчете на «одну степень свободы»; а нашем случае — на один отсчет функций Ет(х9у) или Eout(x9y). Обратим внимание на следующее. Если сигнал и шум статистически независимы, условная энтропия выхода HX(Y) = H(N) — энтропии шума, причем при аддитивном шуме N=Y — X. В отсутствие шумов и при условии, что в полосе передаваемых частот К(о>) = 1, Н(Х) = H(Y). Вычислим скорость передачи информации по каналу, в котором действует гауссовский шум, [p(N) = (ay/2n)~ltxp{—N2/2a2}]9 а ансамбль функций Е(х9у) характеризуется плотностью вероятностей/К^) = 1/Етзх = = const при 0 < Е < Етах и р(Х) = 0 при Е < 0 или при Е > £"тах. Как будет видно из дальнейшего, если сигналы ограничены по амплитуде, то при Е > N для такого ансамбля достигается максимальная скорость передачи по каналу, т. е. реализуется его пропускная способность. В соответствии с формулой (2.42) скорость передачи информации R=H{Y)—Hx(Y). С последним слагаемым в этом соотношении обычно трудностей не возникает, поскольку HX(Y) = H(N)9 а для шума с нормальным распределением, как это следует из формулы (2.36) H(N) = (\/2)log2(2nea2). Хуже с определением H(Y)9 поскольку распределение p(Y) непосредственно получить нельзя. Однако можно, воспользовавшись известны-
2.6. Скорость передачи информации, энергетическая цена информации -JI- 49 ми формулами теории вероятности, найти сначала р(Х, Y), затемр(У) и наконец Н\. Действительно, следующие формулы хорошо известны р(Х9 Y) = px(X)p(Y) = p(x)px(Y); (2.43) оо p(Y)= J p(X,Y)dX. (2.44) — ОО В нашем случае р(Х, Y) = (Е^оу/Ъг)~l exp[-(Y~J)2], (2.45) откуда (2.46) где <P(z) = [l/(27r)]/ozexp(—u2/2)du — интеграл вероятностей. Теперь нетрудно найти и +ОО \ 1оё2(2леа2). (2.47) К сожалению, интеграл в (2.47) вычислить аналитически не представляется возможным. Вместе с тем функция Ri = H(Y) — HX(Y) хорошо аппроксимируется следующим выражением, представляющим собой главную часть асимптотического разложения, в котором точность приближения растет с L [6] Rx w log2 L + AL~l - В. (2.48) Здесь L = Дпах/(2а) = ТГ/сг, где а2 — дисперсии шума. Этот результат удобно представить в привычном виде *i = Qilog2I. (2.49) Медленно меняющаяся функция Q(L) при L > 1,2 хорошо2) приближается соотношением i() (250) 2) Так, если принять здесь А = 1,286, а В = 1,047, то ошибка в определении Q(L) будет порядка процента уже при L = 1,5, а при £ = 10 значения Q, вычисленные по формуле (2.50), будет отличаться от истинного в шестом знаке.
50 Глава 2. Основные свойства измерительно-регистрирующих систем Ее график показан на рис. 2.4, откуда видно, что при L > 0,5 Q(L) везде порядка 1, а для наиболее часто встречающихся значений (10 < L < 100) Q(L) « 0,8. Функция R(L) монотонна — просто из здравого смысла ясно, что с уменьшением отношения сигнал/шум передаваемая информация должна монотонно убывать. Немонотонный же характер Q(L) обусловлен лишь тем, что log2 L —► 0 при L —► 1, хотя R(L) ± 0 вовсе, когда L = 1. R\y бит/отсчет 1 2 4 6 10 100 1000 L* Рис. 2.4. Скорость передачи информации через каналы с шумами в зависимости от эффективного отношения сигнал/шум Естественно, что при других ансамблях входных сигналов и действующих в системе шумов «скорость передани сообщения», т. е. информация, содержащаяся на единице длины или площади выходного изображения о входном, будет иной. Пусть, как и раньше, ансамбль входных сигналов задан на отрезке [0, i^nax] распределением плотности вероятности р(Х) = l/Emax = const, но в канале действует пуассоновский шум p(N) = (2а)*"1 ехр(—N/а), что типично для изображений, получаемых на экране электронно-оптических преобразователей при малой освещенности фотокатода. Алгоритм вычисления R\(L) прежний: вычисляем р(Х, Y), затем p(Y), на основании чего получаем H(Y), и, наконец, рассчитываем Hx(Y) = H(N). Теперь, имея все слагаемые, по формуле (2.42) находим R\i R{ « log2 L + 1,37X"1 - 0,94. (2.51) При этом H(Y) = log2 L + аЕ^(\ + 21og2e), HX(Y) = H(N) = log22a, а = 2a2 — дисперсия шума. Отсюда для канала с пуассоновским шумом получаем по аналогии с (2.49) Ri = Q2log2L, (2.52) где Q2(L) = (0,94-1,37L~1)/ log2 L. Как видно из рис. 2.4, функции Q\(L) и Qi(L) разнятся несущественно. Итак, медленно меняющаяся функция
2.6. Скорость передачи информации, энергетическая цена информации —11/- 51 Q(L) играет роль некоего, зависящего от функций распределения ансамблей сигналов и шумов, поправочного множителя, который уточняет значение скорости передачи информации при заданном отношении сигнал/шум. В теории информации пропускной способностью канала С\ называется max/?! по всем распределениям р(Х) при фиксированном рх(У) = (Ю- Для сигналов, ограниченных по амплитуде, максимум R{ достигается в том случае, когда р(Х) = 1/Дпах = const. Поэтому величины R\, вычисленные по формулам (2.48), (2.49) и (2.51), (2.52) при L > 2 (рис. 2.4), являются соответственно пропускными способностями каналов с гауссов- скими и пуассоновскими шумами. Понятно, почему в теории информации за пропускную способность конкретного канала принимают максимально-возможную скорость передачи информации через этот канал — ведь одна из центральных задач теории информации, как раз, разработка таких кодов, т.е. распределении р(Х), при которых Л—>Лтах. Какую роль в нашем случае играет пропускная способность канала, если мы передаем не кодированные сигналы, а сигналы, «закодированные» природой — осциллограммы, спектрограммы, распределения яркости рентгеновских источников и т. п.? Для нас это оценка сверху, которая может играть роль параметра при сравнении различных каналов. Точно количество информации, содержащейся в выходном сигнале о входном, мы можем вычислить, лишь зная статистические свойства входного сигнала, т. е. р(х), однако, это уже будет определяться термином «скорость передачи сообщений», термином, заметим, не очень удачным применительно к оптическим изображениям, поскольку информация здесь относится не к единице времени, а к единице длины или площади. Видимо, в этом случае термин «скорость передачи сообщений» уместно заменить термином «плотность потока передаваемой информации», которым мы, и будет пользоваться в дальнейшем. Итак, мы установили, что при L » 1 ансамбль входных сигналов, определенный плотностью вероятностей р(Е) = 1/Дпах = const позволяет оценить сверху скорость передачи сообщений или — для оптических изображений — плотность потока передаваемой информации. Покажем на частном примере, что эта оценка не так уж плоха. Пусть оптический канал с гауссовскими шумами используется для регистрации интерференционной картины, отражающей искажение фазовой поверхности плоской волны, зондирующей объект исследования. При достаточно больших и нерегулярных набегах фазы входная освещенность может быть представлена, как Е(х) = Eq + Eq cos(u>x -f <p), где Eq = Emax/2, a ip — случайная величина, характеризуемая на интервале [0,2л] распределением плотности вероятностей р(<р) = 1/(2лг). Понятно, что при синусоидальной структуре входного сигнала уже не равновероятны от-
52 \ Глава 2. Основные свойства измерительно-регистрирующих систем дельные значения освещенностей элементов поля изображения — большая часть отсчетов теперь будет группироваться вокруг EmsXL и 0. В данном случае р(Е) = 2(пЕтгх)~1 [1 - (2(Е/Етах - I)2] , что, как видно из рис. 2.5 существенно отличается от ситуации, при которой р(Е) = l/2smax = = const, в то время как соответствующие зависимости R\(L) при L > 10 практически неразличимы. Конечно, это не всегда так. Например, при регистрации спектрограмм, когда функция р(Е) близка к гиперболе, разница в значениях R\(L) может превышать порядок величины. R\, бит/отсчет 8 6 / ** *"№)£» 1,4 1,0 0,6 ( tax V N ) ( VI ),2 1 / / / 0,o 1 f 1 / ,0 E/E | e= nax 1 0,8 0,6 2 4 6 8 10 102 103 V Рис. 2.5. Плотности распределения вероятностей входной освещенности р(Е) и соответствующие скорости передачи информации «Скоростью создания сообщений» R\, в теории информации называется min R\ по всем распределениям p(N) при фиксированном р(Х) и ошибке приближения 5. Это означает, что согласно [4] «рассматриваются все каналы, которые могут использоваться; для каждого из них вычисляется R\ и выбирается ее наименьшее значение». Поскольку минимум достигается в канале с гауссовскими шумами, значение R\, вычисленное по формулам (2.51) и (2.53), одновременно будет являться скоростью создания сообщений для сигналов, характеризуемых плотностью вероятности р(Е) = l/Emax = const, при условии, что дисперсия а2 = б2. Другими словами «скорость создания сообщений» — это то минимальное количество информации, которое нужно передавать, т.е. подавать на вход системы, в единицу времени (или на единице длины или площади оптического изображения), чтобы восстановить передаваемую функцию с заданной точностью S. Если за единицу времени, на единице длины или площади оптического изображения можно произвести к независимых отсчетов, пропускная способность канала передачи информации C = kRx= kQ\og2 L. (2.53)
2.6. Скорость передачи информации, энергетическая цена информации —'ь- 53 Эта величина — верхнее значение информации о входном сигнале, содержащееся в единице времени, длины или площади выходного сигнала. В соответствии с теоремой Котельникова, для сигналов, пространственный спектр которых ограничен частотой vc, отсчеты функции Е следует производить с шагом Д < l/2vc. Если принять, что Д = l/2vc, то соответственно для одномерных и двумерных сигналов будем иметь: С = 2vcQL = 2vc01og2 - [бит/с или бит/см]; °- (2.54) С = 4v2cQL = 4v2Qlog2 - [бит/см2] и все это правильно во всех тех случаях, когда отношение Е/а не зависит от си. Дело в том, что до сих пор мы полагали, что во всей полосе передаваемых частот вплоть до vc коэффициент передачи К (со) = 1, но в канале передачи информации действует шум. Теперь предварительно рассмотрим прямо противоположную ситуацию — шум в канале отсутствует, но коэффициент передачи К(<о) или, что фактически то же, K(v) ф 1. Если бы шумы отсутствовали и A'(v) = 1, то Н(Х) = Я(У), т.е. потери информации не было бы вовсе. Если же шумы отсутствуют, но в полосе передаваемых частот K(v) ф 1, то, как показано в работе [4] H{(Y) = НХ(Х) + 1 J log2\K(v)\ dv. (2.55) с о Поскольку второе слагаемое суммы (2.55) всегда меньше 0, в реальной ситуации, т.е. когда K(v) ф 1, все значения R и С, вычисленные по полученным выше формулам, должны быть уменьшены на величину |(l/vc)/0Vc log2 |A"(v)|rfv|, которая учитывает потерю информации в канале за счет конечной ширины аппаратной функции, т. е. за счет потери энергии высоких частот. Потерю информации за счет влияния конечной ширины аппаратной функции удобно учесть, используя вместо L величину Vc Г = lexpji- J hi\K(v)\ tfv} = Ж. (2.56) о По аналогии с К. Шенноном [4] назовем величину Vc ft=exp{— f ]n\K(v)\dv\ (2.57) о коэффициентом потери мощности.
54 Ji. Глава 2. Основные свойства измерительно-регистрирующих систем Таким образом, для реального канала передачи информации с шумами и K(v) ф 1 «скорость передачи сообщений» составит: ] (2.58) Напомним, что «пропускной способностью канала передачи информации» С называется max^*) R при фиксированном рх(У) = (N). Для сигналов, ограниченных по амплитуде, максимум R достигается в том случае, когда p(Y) = 1/Дпах = const. Поэтому величина R, вычисленная по формуле (2.58), соответствует пропускной способности каналов с шумами, статистические свойства которых обуславливает медленно меняющаяся функция Q(L). Заметим, что информационную емкость запоминающих устройств реальных (фотослой) или виртуальных (ПЗС-матрица) также можно вычислить по формуле (2.58). Теперь известную теорему теории информации о соотношении между «скоростью создания сообщения» Я и «пропускной способностью канала передачи информации» С [4] при передаче «сообщений» (изображений в том числе) можно изложить следующим образом. «Если спектр частот входного сигнала (временных или пространственных) ограничен частотой vc, а канал, в котором действует шум с дисперсией а2 характеризуется коэффициентом передачи К(ш) (или частотно-контрастной характеристикой K(v)), то по выходному сигналу можно приблизить входной со среднеквадратичной ошибкой 6 тогда и только тогда, когда Я < С» т. е. тогда, когда *inQlog2 f < *outQlog2 ^K. (2.59) Это неравенство позволяет оценить требуемую пропускную способность канала, когда задана ошибка приближения, или величину ошибки восстановления входного сигнала 6 по выходному, если известны параметры канала. Так, например в частности, если число независимых отсчетов входного и выходного сигналов одинаково и выбрано таким образом, чтобы kin = fcout = 2vc или (вслучае двумерных изображений) /qn = &oUt = 4v£ относительная ошибка 6/Ет восстановления входного сигнала по выходному Итак, мы получили оценку снизу ошибки восстановления входного сигнала по выходному, т. е. то минимальное значение ошибки, которое может быть достигнуто в принципе, если никакая дополнительная информация
2.6. Скорость передачи информации, энергетическая цена информации —11-55 не используется. Ясно, что это минимальное значение ошибки может быть достигнуто лишь в том случае, когда на единице времени, длины или площади оптического изображения можно произвести k независимых отсчетов, а пропускная способность канала передачи информации С больше или равна R, потоку информации, поступающему на вход канала. Разделив энергию, подаваемую на вход канала за единицу времени (или энергию, поступающую на единицу длины или площади входного зрачка оптического канала), т.е. Ет на Я, т.е. на количество информации, передаваемой за единицу времени (или содержащейся на единице длины или площади выходного оптического изображения) мы найдем минимальную энергетическую цену единицы переданной информации т - iKlog2RrexpU /мад|л}])~'[дж/бит]. (2.6D Насколько к этим минимальным значениям можно приблизиться в каждом конкретном случае, будет видно из дальнейшего изложения. Здесь же заметим следующее. Формулы (2.58), (2.60) и (2.61) полностью описывают любую измерительно-регистрирующую систему [7], поскольку они (и только они!) показывают, какое предельное количество информации, с какой ошибкой и по какой цене может быть принято, передано и зарегистрировано за единицу времени или на единицах длины или площади оптического изображения. Лишь с их помощью мы можем установить с какой точностью могут быть определены функции координат и времени, описывающие объект исследования, и какая энергия входного сигнала для этого достаточна при той или иной измерительно-регистрирующей системе. Величины, вычисленные по этим формулам, являются единственными критериями для объективного сравнения различных систем между собой. Сделаем несколько дополнительных замечаний. В реальных каналах с увеличением полосы передаваемых частот Av всегда уменьшается К и растет о (при белом шуме просто а2 = Avctq, где а\ — спектральная плотность шума), и, таким образом, отношение сигнал/шум на выходе канала падает. Однако, как это видно из формулы (2.54), с энергетической точки зрения выгодно передавать (и записывать) информацию как раз в большей полосе частот, но с меньшим отношением сигнал/шум Е/а = L, т. е. с большим временным или пространственным разрешением, но с меньшим динамическим диапазоном сигналов. Именно в этом случае при меньших энергетических затратах будут достигаться большая пропускная способность канала передачи информации, большая плотность записи и т. п. (Кстати, именно по этой причине информационная емкость голограммы столь разительно выше информационного содер-
56 JL Глава 2. Основные свойства измерительно-регистрирующих систем жания обычной фотографии.) Именно поэтому, если бы наша задача заключалась в том, чтобы полностью использовать пропускную способность канала, т. е. добиться равенства Я= С, следовало бы на входе в канал преобразовать (закодировать) сигнал оптимальным способом. (В теории информации строго доказывается, что такие коды возможны.) Однако, хотя принципиальных ограничений для создания такого кодировщика нет, инженерные трудности, как правило, делают эту затею бессмысленной. Тогда казалось бы, раз в нашем случае входной сигнал уже «закодирован» природой — причем довольно часто далеко не оптимальным способом, — мы не властны что-либо изменить. Однако это не всегда и не совсем так. Чтобы убедиться в этом, обсудим имеющиеся возможности. Пусть, например, входной сигнал это изображение, которое задано распределением освещенности Е^(х,у), причем пространственный спектр функции Е(х, у) ограничен частотой vc, а величина сигнала значением Ет^. Изображение передается по каналу с частотно-контрастной характеристикой K(vx,vy) или аппаратной функцией g(x,y) — причем в канале действует гауссовский шум с дисперсией а2 и нам требуется по выходному изображению ЕоиХ(х,у) восстановить Е[П(х,у) со среднеквадратичной ошибкой 6. Таким образом, нам известны «скорость создания сообщений», т. е. количество информации, подаваемой на единицу входной площади канала Я = k\n4vlQ\og2(E/S) и пропускная способность канала Vex cy &ехр{1 f f \n\K(vx,vy)\dvxdvy)\, о о о о где #out — число независимых отсчетов на единице площади выходного изображения. (Выбор оптимального значения kout одна из наших будущих задач, поэтому пока положим только, что /3>Дош < 1, где j8 — полуширина аппаратной функции, определяемая так, что 2g(j3/2) = g(0).) Если R > С, то подаваемая на вход информация не может быть передана по каналу и необходимо трансформировать входное изображение, чтобы согласовать R и С. В оптике это легко осуществить увеличив изображение. При увеличении в М раз во столько же сжимается пространственный спектр, как М2 падает освещенность входного и выходного изображений и больше, чем в М2 раз, если учесть еще и зависимость Q(L*), уменьшается количество информации, подаваемой на единицу входной площади канала. Теперь процедуру согласования Я и С рассмотрим в свете нашей задачи восстановления Дп(х,д>) со среднеквадратичной ошибкой 6 по выходному изображению с точек зрения минимизации входной энергии, т.е. времени экспонирования Д/ (поскольку Е\п(х,у) в нашем случае задано) или минимизацией входной площади канала, необхо-
2.6. Скорость передачи информации, энергетическая цена информации —|\- 57 димой для передачи изображения. Начнем со второго, для чего вернемся к соотношению (2.60), напомнив, что оно получено в предположении kin = £oUt = 4v2. Смысл выражения (2.60) очень прост — относительная ошибка восстановленного изображения 8/Ет не может быть меньше эффективного значения отношения шум/сигнал на выходе системы a/(E0UtK), так сказать «относительной тонности>>_выходното изображения. Относительную ошибку восстановления S/Em — ведь существенно именно значение 6/ЕШ9 а вовсе не абсолютная величина S — можно уменьшить исходя из рассматриваемого неравенства лишь увеличив энергию сигнала. Поэтому, если энергии достаточно и главное — экономно расходовать входную площадь оптического канала, следует выбирать М так, чтобы k = 4v2 « 1//323). При j82 > \/к = l/4v2 экспоненциально уменьшается ^так что энергия, необходимая для обеспечения разумного значения, 8/~Ёт становится несуразно большой. Рассмотрим прямо противоположную ситуацию — входная площадь оптического канала не ограничена, но ограничена энергия на входе в канал. Можно ли в этом случае, не прибегая к кодировке входного изображения, улучшить точность восстановления, варьируя величину М, т. е. проецируя изучаемое изображение на вход канала с разным увеличением? Будем рассматривать такие значения М, при которых к\п = 4v2 < l/j82. В этом случае на к\п элементов входного изображения можно получить ifeout « 1/jS2 статистически независимых элементов выходного изображения. (Ясно, что при этом kout>kin). Это равносильно тому, что входное изображение передается пол = kout/k[n независимым каналам; т. е. мы имеем, как бы, п независимых выходных изображений. Естественно, что, чем больше входных изображений, тем меньше точность каждого из них, поскольку входная энергия ограничена. На первый взгляд выигрыш здесь лишь в том, что К —► 1 с увеличением М. Действительно, если при восстановлении Е1п(х,у) по п изображениям применить простое усреднение, то относительная ошибка восстановления уменьшается в у/п раз, однако именно в у/п раз увеличивается и относительная ошибка каждого из п изображений, просто потому, что освещенность при увеличении па- дает как М2, а частотный спектр сужается в М раз, т. е. а = Vkvx&vycrl падает в М раз, и, таким образом, отношение сигнал/шум также уменьшается в М = у/п раз. Тем не менее определенные преимущества видны здесь даже не вооруженным глазом. Во-первых, сравнивая «идентичные» строки и столбцы совокупности п изображений и задавшись доверительным интервалом 2а или За можно отбросить «грубые» ошибки, за- 3) В главах 4 и 12 способы оптимального выбора величины к — число отсчетов на единице площади (или длины) оптического изображения будут рассмотрены подробно.
58 —'%>- /лявд 2 Основные свойства измерительно-регистрирующих систем менив из полусуммой соседних отсчетов. Такая процедура эффективно «очищает» изображение от дефектов, связанных с царапинами фотослоя, многоэлектронной компонентой шумов электронно-оптических преобразователей или блочной структурой микроканальных усилителей яркости. Во-вторых, используя взамен усреднения фильтрацию локальными фильтрами [8], можно существенно уменьшить систематические ошибки. В третьих, что естественно, при увеличении улучшается и позиционная точность изображений. Похожий прием, примененный в системах астроориентации, позволил больше, чем на порядок величины улучшить угловое разрешение системы. В четвертых, что очень важно, при высококонтрастных входных изображениях, увеличение, снижая контраст, как бы увеличивает динамический диапазон системы. Это перечисление можно было бы продолжить, однако дальнейшее изучение возникающих здесь ситуаций мы отложим до следующих глав, в которых рассмотрим приложение информационных аспектов к конкретным системам и проблемам восстановления. 2.7. МЕТОДЫ ИЗМЕРЕНИЯ ПАРАМЕТРОВ ИЗМЕРИТЕЛЬНО-РЕГИСТРИРУЮЩИХ СИСТЕМ Мы показали, что максимальная плотность потока информации, передаваемой через оптическую систему, т.е. пропускная способность канала передачи информации С = RmaXi является таким параметром, который совместно с энергетической ценой регистрируемой информации $/Н с предельной полнотой характеризует измерительно-регистрирующую систему. Зная эти две величины можно как объективно сравнивать разные измерительно-регистрирующие системы между собой, так и вычислять скорости передачи информации, находить оптимальные условия ее приема, передачи и регистрации и получать оценки точности измерения входных сигналов, т.е. точности их восстановления. Чтобы найти эти величины, необходимо иметь сведения об аппаратной функциях g(t), g(x) или коэффициентах передачи К((о) (или частотно- контрастной характеристике K(v)), входной чувствительности (квантовой эффективности приемного устройства), максимально-допустимом значении входного сигнала EmsK и действующих в системе шумах. Все эти данные для реальных каналов могут быть получены лишь путем измерений, однако здесь важно отметить, что, если рассматриваются системы, для которых функциональные зависимости g(t), g(x) и характеристики шумов известны, достаточно всего четырех чисел, именно значений /3, //, Emax и о у чтобы определить как пропускную способность канала С, так и энергетическую цену регистрируемой информации &/Н. Рассмотрим используемые для этого методы измерений. Начнем с шумов.
2.7. Методы измерения параметров измерительно-регистрирующих систем 59 1. Как известно, статистические свойства шума описываются плотностью вероятностей />[/ош(0]> которая определяется при подаче на вход сигнала /щ(/) = const. (В частном случае, когда а не зависит от 1{П, естественно следует проводить измерения при I[n(t) = 0.) Отсюда понятен порядок действий: сигнал на входе /т(0 = const фиксируется, а совокупность считанных значений выходного сигнала /out(4) исследуется с помощью амплитудного анализатора. Удобнее всего использовать в этих целях стандартные многоканальные амплитудные анализаторы — приборы просто предназначенные для получения распределения плотности вероятностей />(Д0 сигналов Дь подаваемых на их выход. Эти, промыш- ленно-выпускаемые приборы, содержат на входе в каждый канал амплитудные дискриминаторы, пропускающие лишь импульсы шумов с амплитудами, лежащими в интервале [Дь (Д^+Д4)], где Дь увеличиваясь с каждым следующим каналом на АД изменяется от 0 до Атах. Современные многоканальные амплитудные анализаторы содержат тысячи каналов, так что плотность вероятности (а значит и функция распределения) случайной величины Ак может быть определена с большой точностью, ПОСКОЛЬКУ А4 = Дпах/^max ОЧвНЬ МШЮ. -1,9 -1 -0,1 0,8 Рис. 2.6. Шумы ПЗС-матрицы В оптике при изучении спектральных и статистических свойств, действующих в системе шумов, на вход подается сигнал &т(х) = const, a выходной сигнал £Out(*/) считывается на достаточно частой сетке, так чтобы шаг считывания А = х, — x/_i «С /3. Затем вычисляется £^ (2-62) л 1=1 и квадрат среднеквадратичного уклонения о1 = (2.63) который и есть оценка дисперсии, поскольку а2 —♦ D[E0Ut(x)] при N—► оо. Отсюда при белом шуме нетрудно получить и его спектральную плотность: Oq = а А. В тех случаях, когда а(^), описанная операция повторяется при разных £in. Эту процедуру иллюстрирует рис. 2.6, на котором по
60 —'I/- Глава 2. Основные свойства измерительно-регистрирующих систем оси абсцисс нанесена координата вдоль строки ПЗС-матрицы (х)9 а по оси ординат — отсчеты измеряющего прибора Ni(x). Из рис. 2.6 видно, что отдельные отсчеты отличаются от N(x) « 220 почти на 30 единиц. Если при этом спектральные и статистические свойства шума известны — как, например, это имеет место быть для электронно-оптических преобразователей или фотослоев — то никаких других измерений и не требуется. В противном случае приходится исследовать и эти характеристики шума. Порядок действий при этом в оптике ни чем не отличается от описанного выше: сигнал на входе &т(х) = const фиксируется, а совокупность считанных значений выходного сигнала £Out(*/) регистрируется с помощью многоканального амплитудного анализатора. Спектральные свойства шума п((о) или п2(ю) = N(a)) находятся путем усреднения квадратов фурье-образов совокупности отдельных реализаций. Для этого на вход многократно подается сигнал ^(х) = const и для каждой конкретной реализации выходного сигнала £Out(*) определяется ее шумовая компонента £jj- = £Out(*) ~ £out(*)» после чего вычисляются фурье-образы Х/2 / tiWe-^dx (2.64) -Х/2 и проводится их осреднение л *=1 л Здесь, как и раньше, X — полная длина реализации4). 2. В радиотехнике принято измерять не аппаратную функцию g(t)9 a переходную функцию h(t)9 называемую также переходной характеристикой. (Напомним, что переходная функция по определению есть отклик системы на входной сигнал jf(f), называемый единичной функцией; напомним также, что производная d[h(t)]/dt = g(t), т.е. равна аппаратной функции.) Для измерения h(t) используются стандартные, промышлен- но-выпускаемые приборы, называемые измерителями переходных характеристик (ИПХ). Они содержат генератор ступенчатого сигнала (модель 4) Заметим, что часто практикуемый способ вычисления N(co), основанный на оценке автокорреляционной функции В(т) = (1/Х) /5^/2 Е(х + т)Е(х) ах и последующем ее фурье-преобразовании /^ В(т)е~1а)Т dt = N(a>) не является в нашем случае корректным, поскольку в силу чисто формальных связей полученное таким образом N(<o) является спектральной плотностью конкретной реализации, а не результатом усреднения по их множеству.
2.7. Методы измерения параметров измерительно-регистрирующих систем —11 — 61 единичной функции Х\(*))> который подается на вход исследуемого прибора и регистратор, записывающий выходной сигнал. При пользовании такими приборами важно удостовериться, что время нарастания А/ входного сигнала Х\(0 от уровня 0,l#i(0max до уровня 0,9;ti(0max (так принято в радиотехнике определять At) существенно меньше полуширины аппаратной функции fi, т. е. необходимо выполнить условие Д/ <С $. В оптике таких стандартных приборов нет. Однако, поскольку аппаратная функция g(x) по определению — отклик системы на входной сигнал типа 6(х) то, казалось бы, метод измерения здесь прост. Действительно, для того, чтобы &out(x) ~ g(x), достаточно спроецировать на вход системы изображение щели с шириной d <C р. К сожалению, погрешность именно такого метода измерения крайне велика. Тому три причины: обычная недостаточность динамического диапазона системы регистрации £оШ(*)> несовершенство проецирующей оптики и достаточно высокий уровень шумов. Рассмотрим их по порядку. Первая трудность заключается в необходимости определить аппаратную функцию с достаточно малой и примерно одинаковой относительной погрешностью как вблизи ее максимума, так и в далеких крыльях. (Только в этом случае можно надеяться в обратной задаче получить устойчивость решения при высокой точности восстановления.) Динамический диапазон обычных систем регистрации таких возможностей не представляет, однако выход здесь есть. Стандартный прием состоит в том, что за коллимиру- ющим объективом, в фокальной плоскости которого расположена щель, помещается клин. Многократные отражения от его граней позволяют на входе в систему получить ряд убывающих по яркости изображений щели. Понятно, что теперь значения g(x) в крыльях и максимуме могут быть измерены по разным изображениям, а результаты сшиты. Это, конечно, дополнительные заботы, но что поделаешь. Вторая трудность обусловлена требованиями к разрешающей способности проецирующей системы, поскольку полуширина ее аппаратной функции должны быть много меньше полуширины аппаратной функции исследуемой системы. Этому требованию можно удовлетворить лишь применяя микрообъективы. Это, естественно, мало удобно, но принципиально возможно. Хуже с шумами. Дело в том, что ширина проекции щели, т. е. ее линейный размер во входном изображении принципиально должен быть много меньше р. Как следует из всего изложенного выше, шумы при этом будут чрезмерно велики, а значит велика погрешность и измеренных значений g(x). Конечно, можно пытаться уменьшить ошибку измерения, используя статистику повторных испытаний или увеличивая, сколь это возможно, размер щели по ее длине, но существенно улучшить ситуацию такими приемами нельзя. Ситуация может быть несколько улучшена, если на вход системы подавать не сигнал б(х), а сигнал х(х) (так назы-
62 -J\- Глава 2. Основные свойства измерительно-регистрирующих систем ваемый «край освещенного поля»). К сожалению, не кардинально. Если функциональная зависимость g(x) известна, измерять )8, проецируя щель на вход системы разумно. В этом случае может быть достигнута приемлемая точность, поскольку все входные отсчеты будут использованы для вычисления одного параметра. Однако для определения функции g(x) в общем случае такой метод плохо подходит. Какова же альтернатива? Она ясна — следует искать К(<о), a g(x) вычислять используя операцию обратного^фурье-преобразования. В этом случае на вход подается сигнал &т(х) = £(1 + sina>x)/2 и вся совокупность выходных отсчетов используется для определения единственного параметра — амплитуды переменной составляющей А((о) выходного сигнала £Out(*) = £0 +A(o))sina)x)/2. Напомним, что, если g(x) — четная вещественная функция, — а это в оптике, как правило, так, — К((о) =А(о)). Поэтому несложно найти К(<о) = А((о), изменяя от опыта к опыту пространственную частоту со. Заметим, что для формирования входного сигнала в такого рода измерениях годится равноплечный интерферометр, например, интерферометр Майкельсона. В эксперименте А(ю)9 т.е. частотно-контрастная характеристика (ЧКХ) определяется по выходному ИЗОбражеНИЮ Как А((О) = (£тах - £min)/(£max + £min)- До сих пор мы рассматривали ситуацию, когда может быть использована одномерная аппаратная функция g(x)9 измеряемая по выходному изображению при проецировании на вход системы изображения щели с шириной 6 «С 0. В одномерных изображениях существует выделенное направление, вдоль которого освещенность не меняется. Типичный пример одномерного изображения спектрограмма, полученная при равномерной освещенности входной щели спектрографа. Изображения могут рассматриваться как одномерные и в тех случаях, когда их частотный спектр по одному из направлений гораздо шире, чем по другому, т. е. скажем v^ > vcy, так как это, например, имеет место в интерферограм- мах с малыми набегами фаз, где интерференционные линии лишь слегка искривлены5). В двумерной ситуаций необходимо знание двумерной аппаратной функции g(x,y), которую, вообще говоря, можно получить 5) Естественно, здесь возникает вопрос о направлении считывания, которое, как правило, отождествляется с направлением одной из осей координат. В массиве, считанном с одномерного изображения, спектральные компоненты vx (или vy) будут отсутствовать лишь в том случае, когда направление осей выбрано так, что Е(х) = const или Е(у) — const. Можно, конечно, поступать по другому — не особенно заботясь об ориентации изображения при считывании, найти в уже считанном массиве направления, вдоль которых освещенность (или почернение) постоянно, и, пользуясь этим, преобразовать двумерный массив в одномерный.
2.7. Методы измерения параметров измерительно-регистрирующих систем -J\- 63 измеряя g(x) и g{y) по отдельности. В отсутствие астигматизма двумерная аппаратная функция находится из уравнения Абеля (2.66) X решение которого хорошо известно: оо (2.67) Здесьg(r) = g(y/x2 + у2) — двумерная аппаратная функция g(x,у). Соответственно и коэффициент передачи в таком случае будет функцией двух переменных К(а>х, а)у). В отсутствие астигматизма К(о)х, соу) = К((ог) = = К(У<о1 + а)у)9 что в сущности означает лишь переход к полярной системе координат в фурье-пространстве. В радиотехнике амплитудно-частотная характеристика А(со) измеряется с помощью приборов, называемых генераторами стандартных сигналов (ГСС). Стандартных в том смысле, что амплитуда выходных сигналов генератора Aq sin cot остается строго фиксированной во всем диапазоне изменений частоты а). Поэтому достаточно подать сигнал от ГСС на вход исследуемого прибора и изменяя частоту генерации получить А((о) = Aw/Aq, где Ait) — амплитуда выходного сигнала исследуемого прибора на частоте ш. Зависимость <р((о) называемую фазово-частотной характеристикой и определяющей фазовый сдвиг так, что если входной сигнал fm(t) = /о sin (ot, то выходной сигнал fout(t) = h sin(atf + <р) = /о sm[(o(t — а)] можно найти с высокой точностью, измеряя при разных частотах задержку а((о) выходного сигнала от входного. Понятно, что при стационарных синусоидальных сигналах q> может быть найдено с точностью до добавочного слагаемого 2лп но это и не важно, если мы ищем K(w) =A((o) exp{—i<p(a))}, поскольку ехр{—ilnri] = 1. Ясно, что с этой оговоркой <р(а>) = (оа(а)), где «задержка» а(р)) находится из эксперимента. (Техника измерения временных интервалов, в том числе и при синусоидальных сигналах, будет подробно обсуждаться в следующей главе.) Таким образом, проведя описанные выше измерения несложно из экспериментальных данных получить коэффициент передачи как К(ш) =А(ш) ехр{—i<p(a))} —A^/Aq exp{—ia)a(w)}. В оптике найти из опыта зависимость <р(а)) — а это необходимо, если g(x) нечетная функция — совсем не просто, что обусловлено невысокой позиционной точностью входного изображения. В этом случае, хотим ли мы того или нет, приходится из измерений находить g(x), а К((о), т. е. фурье-образ g(x)9 — вычислять.
Глава 2. Основные свойства измерительно-регистрирующих систем ЛИТЕРАТУРА 1. Харькевич А. А. Теоретические основы радиосвязи. — М.: Гостехтеориздат, 1957. 2. Голдман С. Теория информации. — М.: ИЛ, 1957. 3. Фано Р. Передача информации, статистическая теория связи. — М.: Мир, 1965. - 438 с. 4. Шеннон К. Математическая теория связи // В кн.: Работы по теории информации и кибернетике. — М.: И.Л., 1963. — С. 243-332. 5. Шеннон К. Связь при наличии шума // В кн.: Работы по теории информации и кибернетике. — М.: И.Л., 1963. — С. 433-46-. 6. Пергамент М. И. Информационные аспекты получения и обработки оптической и спектральной информации // Энциклопедии низкотемпературной плазмы. - Т. II. - М.: Наука, 2000. - С. 424-442. 7. Pergament M. I. Real features of the image registration systems and the reconstruction problems in the light of the information theory // SPIE. — 1998. — V. 3516. — Part I. - P. 465-473. 8. Тихонов А. Н., Пергамент М. И. Современные методы измерений и интерпретации наблюдений в высокотемпературной плазме // В кн.: Диагностика плазмы. Вып. 4 (И). - М.: Энергоиздат, 1981. - С. 130-147.
ГЛАВА 3 ИССЛЕДОВАНИЕ ИМПУЛЬСНЫХ ПРОЦЕССОВ В этой главе мы рассмотрим принципы измерений времени, токов и напряжений при исследовании импульсных быстропротекающих процессов. Заметим сразу, что изменения во времени токов или напряжений иногда представляют и самостоятельный интерес, однако гораздо чаще они интересны тем, что несут в себе информацию об объекте исследования, полученную самыми разными методами, поскольку выходные сигналы большинства современных измерительных устройств — это аналоговые или цифровые электрические сигналы. Заметим также, что широко распространенное определение «быстропротекающие процессы» относится скорее к категории литературных, нежели физических терминов. Поэтому уточним — речь идет о нестационарных физических процессах, в которых характерное время изменения параметров объекта исследования определяется величиной А/. Понятно, что не только используемая аппаратура, но и сами принципы измерения перечисленных в начале главы физических величин кардинально зависят от характерного времени А/. Поэтому сразу определимся — речь пойдет о диапазоне 10~2 > А/ > 10~15 с, поскольку именно этот диапазон наиболее интересен для современной экспериментальной физики. И хотя мы отбросили, как ненужные нам, столетия, годы, часы, минуты и, даже, секунды оставшийся диапазон огромен и, конечно же, не может быть перекрыт с помощью одних и тех же устройств. Поэтому мы шаг за шагом будем продвигаться от больших, в нашем понимании времен (10~2 с), к малым, рассматривая методы измерений и используемую аппаратуру. Что касается собственно аппаратуры, здесь нас будут интересовать, прежде всего, принципы ее работы, а отнюдь не ее техническое устройство, поскольку именно это важно при планировании и проведении экспериментов. К тому же это позволит избежать превращения этой главы в многотомную инженерную энциклопедию. 3.1. ИЗМЕРЕНИЯ ИНТЕРВАЛОВ ВРЕМЕНИ И НЕКОТОРЫЕ ЭЛЕМЕНТЫ ВЫЧИСЛИТЕЛЬНЫХ СХЕМ Как это видно из заглавия, в этом параграфе мы рассмотрим способы измерения промежутков времени между событиями, имеющими место в разные моменты, скажем /,- и /у, и некоторые элементы вы-
66 Jly- /)ш<?д J. Исследование импульсных процессов числительных схем, отложив до следующего параграфа изучение методов измерения зависимостей от времени токов /(/) или напряжений U(t). В современной практике измерение не слишком коротких временных интервалов производится с помощью дискретной цифровой техники. Как правило, в таких устройствах в качестве эталона времени используются сигналы стабилизированного с помощью кварцевой пластины генератора переменного тока. Дело в том, что с одной стороны кварц, будучи пьезоэлектриком легко встраивается в цепи положительной обратной связи генераторов, а с другой стороны — его замечательные качества (прежде всего крайне малый коэффициент линейного расширения) обуславливает очень высокую стабильность собственной частоты колебания кварцевой пластины. Кварц — пьезоэлектрик, поэтому синхронно с механическими колебаниями между противоположными поверхностями пластины появляется переменное электрическое напряжение, задающие частоту радиоэлектронного генератора. Если частота стабильна, то достаточно при измерении промежутков времени просто подсчитать, сколько периодов приходится на тот или иной временной интервал. Величину стабильности легко может оценить каждый, кто пользуется так называемыми «кварцевыми» часами, которые и получили свое название потому, что используют как раз обсуждаемые нами принципы измерения времени. Действительно, если вы проверяете свои кварцевые часы по сигналам точного времени, то наверняка заметили, что за месяц они «отстают» или «уходят» на одну-две секунды. Другими словами точность измерения месячного интервала составляет ~ 5 • 10~7 — выше, чем одна десятитысячная доля процента! Казалось бы, зачем такая точность для бытовой техники? Ответ на удивление прост — при таком способе измерения времени хуже сделать нельзя. Заметим сразу же — такая точность измерения реализуется, в том числе, за счет очень большой выборки. При измерении более коротких промежутков времени обеспечить точность, даже на два порядка величины худшую, не так то просто, хотя, как это будет видно из дальнейшего, возможно. Принцип работы «секундомера», основанного на изложенной концепции поясняет рис. 3.1. Сигналы эталонного генератора (а) усиливаются (б) и потом дискриминируются, т.е. «обрезаются» по амплитуде с тем, чтобы получить цуг «прямоугольных» импульсов (в). Последние сначала дифференцируются (г), затем детектируются и эти однополяр- ные импульсы (д) направляются в пересчетное устройство, сопряженное с блоком управления. Задача последнего — включить счетчик импульсов в момент прихода сигнала на вход А и выключить его по сигналу, поступившему на вход В. Понятно, что точность измерения интервала длительностью Т составит величину t/T9 где / — период колебания эталонного генератора. Эта «счетная» область электроники быстро про-
3.1. Измерения интервалов времени и элементы вычислительных схем 67 грессирует, поскольку напрямую связана с совершенствованием средств вычислительной техники. Сегодня тактовая частота серийных компьютеров \/t превышает 2 ГГц, так что значение t = 1 не (10~9 с) далеко не предел. Дальше все просто — микросекундный временной интервал может быть измерен с точностью 10~3, а интервал времени длительностью 10 не всего с десяти процентной точностью. Существуют приборы, в которых встроены устройства, измеряющие промежутки времени как между стартовым сигналом и первым счетным импульсом, так и между последним, еще посчитанным импульсом, и сигналом, прерывающим счет. Если длительность — или, по крайней мере, фронты — всех этих сигнальных импульсов существенно короче t точность измерения может быть повышена. Однако, так или иначе, но мы должны сделать вывод, что для измерения временных интервалов, лежащих в пикосекундном диапазоне длительностей приборы такого типа не годятся. Понятно, что на основе такого «секундомера» можно создать и приборы для управления экспериментом. Так фирмой Stanford Equipment выпускается цифровой генератор задержанных импульсов DG535, генерирующий четыре импульса, предназначенных для запуска в строго определенные моменты времени приборов или экспериментального оборудования. Время задержки каждого из четырех импульсов относительно любого из них может устанавливаться в пределах от 0 до 1000 с. В этом приборе абсолютная ошибка отсчета временного интервала Т (в секундах) между любыми двумя импульсами относительно установленного значения не превышает величину АТ = 1,5 • 10~9 + (At/t)T, где Д/ — отклонение истинного значения периода генератора тактовой частоты от ее номинального значения t. Прибор выпускается в двух модификациях стандартной и прецизионной, в которых относительная ошибка bdjt составляет соответственно Генератор *| \у чУ \^ \-/ 1 Усилитель \ АЛЛ V1/1/1 Ограничитель t } лппп ' [ U U U U Дифференцирующее устройство \ К К К * [ V V V V Детектор \ К К К t 1 Счетное устройство А В Вкл О О Выкл 1 1 Рис. 3.1. Принцип работы измерителя временных интервалов
68 Глава 3. Исследование импульсных процессов 2,5 10 5 и 10 6. Таким образом, например, для задержки Т в 1 мс абсолютная ошибка не превысит 26,5 не в первом случае и 2,5 не во втором. а б Рис. 3.2. Принцип работы дискриминатора Прежде чем двигаться дальше разберемся, как осуществляются ограничение амплитуды (дискриминация), дифференцирование и интегрирование сигналов в радиоэлектронных цепях. Принцип работы дискриминатора понятен из рис. 3.2, а. Как видно из рисунка простейший дискриминатор состоит из сопротивления R\, диода, внутреннее сопротивление которого равно R2, когда он проводит ток, причем R2 < R\, и генератора опорного напряжения1*, разность потенциалов, на зажимах которого равна Щ. До тех пор, пока входное напряжение не превышает величину Щ, никакого ограничения величины сигнала не происходит, поскольку диод заперт, ток не течет, а значит падения напряжения на сопротивлении R\ нет и входное напряжение просто равно выходному, т.е. Um = Uout- Однако, как только Um превысит Щ положение изменится — потечет ток и к опорному напряжению должно прибавиться падение напряжения на сопротивлении R2. Нетрудно подсчитать, что в этом случае Uout(t) = Щ + [R2/(R\ + ДгШ^пС) - %], но, поскольку отношение (R\ + Ri)/Ri очень велико, выходной сигнал практически будет ограничен величиной Щ, другими словами на том временном интервале, где Uin > Щ выходной сигнал Uout « Uo. Понятно, что описанный дискриминатор ограничивает только положительную составляющую импульса. Для ограничения отрицательной составляющей нужно изменить полярности диода и генератора опорного напряжения так, как это по- 1) Понятия «генератор тока» и «генератор напряжения» вводятся по определению, в соответствии с которым внутренние сопротивление первого из них равно оо, а второго — 0.
3.1. Измерения интервалов времени и элементы вычислительных схем 69 казано на рис. 3.2, б. Последовательное включение двух таких схем приводит к ограничению обеих составляющих, причем уровни ограничения задаются напряжениями опорных генераторов. Uc = Uout Рис. 3.3. Векторная диаграмма тока и напряжений одной из гармоник сигнала, Простейшие устройства для интегрирования и дифференцирования электрических сигналов показаны на рисунках 3.3 и 3.4 соответственно. Выпишем уравнение Кирхгофа для входных контуров этих цепей *№ + ^ = (3.1) где q(i) — заряд, и, следовательно, q(i) — ток, текущий во входном контуре, Rq(t) = RI(t) = C//KO — первый член в левой части равенства (3.1) — падение напряжения на сопротивлении, a q(t)/C = Uc(t) — второй член левой части равенства — напряжение на конденсаторе. Рассмотрим два предельных случая: Ur^> Uc и Ur<^ Uc. Ясно, что в первом случае мы можем пренебречь вторым членом левой части равенства (3.1), а во втором случае — первым. (Ниже будет показано, что возникающая при этом ошибка пренебрежимо мала.) Другими словами в этих двух предельных случаях мы можем уравнение (3.1) представить или в виде Rq(t) « U\n(t), или в виде q(t)/C « Um(t). Понятно, что условие Ur ^> Uc равносильно требованию R > 1/(юС), поскольку UR = I(t)R, a Uc = I(t)/(<oC). Конечно требование R ^> 1/(соС) должно выполняться для каждой спектральной составляющей входного сигнала для чего достаточно, чтобы оно выполнялось вплоть до значения <о = 2л/Г, где Т — полная длительность входного сигнала, т. е. область существования функции Um{i). Из уравнения Rq(t) « Um{t) следует, что ток в цепи I(t) « Um(t)/R. По-
70 Глава 3. Исследование импульсных процессов этому заряд, накопившийся в емкости С за время от / = 0 (начало импульса) до / q(t) = /0' I(r)dr = (1/Л)/о U[n(r)dT. В то же время всегда напряжение на любом конденсаторе U = q/C. Поэтому и напряжение на конденсаторе в схеме рис. 3.3, т. е. выходное напряжение Uoxa(t) = q(t)/C. После подстановки получим, что (3.2) Таким образом, с точностью до постоянного множителя l/(RC) выходной сигнал рассматриваемого четырехполюсника есть проинтегрированный по времени входной сигнал. Рассмотрим прямо противоположную ситуацию £Уд<с£/с или Л <d/(wc С), где о)с = 2лгс — критическая частота, которой ограничен сверху спектр входного сигнала. В этом случае, как следует из сказанного, q(t)/C& U\n(t), т. е. q(f) « CU'm{t). Продифференцировав обе части последнего выражения получим £(0 « CUin(t). Но q(t) — это ток в цепи, поэтому падение напряжения на выходном сопротивлении схемы рис. 3.4 RI(t) = Rq(t)> т. е. выходной сигнал Uout(t) « RCUinit), (3.3) другими словами в данном случае выходной сигнал с точностью до множителя RC есть производная по времени входного сигнала. Рис. 3.4. Векторная диаграмма тока и напряжений при Ur << Uc Оценим ошибку измерения, возникающую в такого рода схемах, а заодно и выясним, что означают утверждения, что R «много больше» или «много меньше», чем 1/(а)С). Насколько меньше? Обратимся к показанной на рис. 3.4 векторной диаграмме. Угол между векторами Um и
3.1. Измерения интервалов времени и элементы вычислительных схем —1\/- 71 Uc, т.е. угол <р = UR/Um, так что UR = ipUm. Заметим, кстати, что UR это как раз то слагаемое, которым мы пренебрегли в исходном уравнении, выводя формулу (3.3), поэтому привнесенная при этом ошибка ди = U* = Uin - Uc. С другой стороны U2 = U?-U2 = U&(1 - <p\ в силу чего AU — U\n— Uc = Uin— U^y/l — <p2 « Um(p2/2. Отсюда относительная ошибка &U/U = <p2/2. Пользуясь этой формулой нетрудно подсчитать, что уже при R меньшем, чем 1/(<оС) в три раза &U/U < 5%. При разнице этих величин в десять раз относительная ошибка AU/U меньше половины процента. Так что с точностью измерений дела обстоят не так уж плохо, хуже с соотношениями входного и выходного сигналов, поскольку, рассматриваемая нами электрическая цепь есть, по существу, не что иное, как делитель напряжения. Это отношение найдем из амплитудно-частотной характеристики, рассматриваемого нами четырехполюсника. По определению А(а>) = | tfOut|/|#in| = IR/lVR2 + R2C = R/\/R2 + R2C. Поскольку (\Uout\/\Um\)2 = R2/[R2 + 1/(cjC)2] = (RCa>)2/(RCa>)2 + l |«|/ll = RCo)/y/(RCa))2 + 1 « RCa), так как условие R <^ 1/(о>С) одновременно означает, что RCio <^ 1. Пусть \/(о)сС) больше Rb M раз, т.е. MR = = l/(<t>cC). Тогда RC(oc = \/M и | UQuX\/\ Um\» RCio = 1/M. Другими словами, амплитуда выходного сигнала будет по меньшей мере в М раз меньше амплитуды сигнала на входе и, если, скажем, вы добиваетесь полупроцентной точности измерения (М = 10), то вынуждены считаться с десятикратным уменьшением амплитуды выходного сигнала — за точность нужно платить. Подчеркнем — сделанные оценки справедливы лишь при условии R <^С 1/(а)сС). Подобные выкладки нетрудно сделать и для интегрирующего четырехполюсника. Действительно, так как в этом случае амплитудно-частот- ная характеристика А(а>) = \U0Ut\/\Um\ = RC/VR2 + R2C, (|£/Out|/|^m|)2 = = l/(o)C)2[R2 + \/(<oC)2] = \/(RCa))2 + 1 и, следовательно, |ftut|/|b5n| = = \/y/(RCo>)2 + 1 w l/(RCo))9 поскольку теперь (RCco)2 > 1, потому что R > l/(o)C). Так как в рассматриваемом случае R > 1/(юС)9 R = M/(o)Q и, значит, RC(o = М, т.е. |%1л|/Щп| « l/(RCa>) = 1/М. Таким образом, и здесь амплитуда выходного сигнала будет в М раз меньше амплитуды сигнала на входе. Картина до боли знакомая любому экспериментатору. В ряде случаев, когда входные сигналы велики, никакой беды в этом нет. Но как быть, если они малы? Средства современной радиоэлектроники позволяют справиться и с этой проблемой. Рассмотрим, как это реализуется на примере радиоэлектронной интегрирующей схемы, приведенной на рис. 3.5. Показанное там устройство весьма несложно и состоит из операционного усилителя с большим коэффициентом усиления, охваченного глу-
72 -Jly- Глава 3. Исследование импульсных процессов бокой отрицательной обратной связью, т.е. усилителя, в котором выходной сигнал подается на вход системы так, чтобы входной и выходной сигналы находились бы в противофазе. При 100%-й отрицательной обратной связи суммарный коэффициент усиления всей системы был бы близок к единице, сколь не велик был бы коэффициент усиления собственно операционного усилителя, вследствие того, что поданный в противофазе вы- : ходной сигнал подавляет сигнал входной. Однако, поскольку цепь обратной Рис. 3.5. Электронный интегратор связи, состоящая из конденсатора С и сопротивления R, представляет собой фильтр высоких частот2), активно подавляются только высокие частоты с (о > l/(RC). Другими словами, это устройство действует так же, как и простая интегрирующая схема, приведенная на рис. 3.3, в которой также подавляются высокие частоты, однако, в отличие от последней, здесь амплитуда даже самой низшей гармоники выходного сигнала практически не отличается от ее значения на входе в систему. Существует и другое, более простое объяснение принципов работы такого интегрирующего устройства. Дело в том, что операционный усилитель представляет собой «генератор тока» (см. сноску на с. 68), заряжающий конденсатор С. При этом, генерируемый операционным усилителем ток I(t) в каждый момент времени пропорционален входному напряжению Uin(t). Что происходит дальше легко понять, если вернуться к приведенным выше объяснениям, сопутствующим выводу формулы (3.2). Разница лишь в том, что в отличие от простой интегрирующей электрической цепи, в такой электронной схеме высокая точность интегрирования достигается без ослабления низшей гармоники сигнала в¥ = RCa) раз. Наконец, разберемся, хотя бы в общих чертах, как работает компаратор — устройство, предназначенное для сравнения напряжений. Компаратор состоит из операционного усилителя с очень большим коэффициентом усиления, т. е. с очень крутой вольтамперной характеристикой, и логической схемы, на выходе которой, как результат сравнения, формируется всего два значения 0 или 1, в зависимости от того, измеряемое напряжение меньше или больше опорного. На две входные «клеммы» компаратора подаются опорное напряжение и, сравниваемое с ним, измеря- 2) «Фильтром высоких частот» называют устройство, которое пропускает высокие частоты и отсекает низкие. Именно такой фильтр и стоит в цепи обратной связи. В то же время вся система в целом является фильтром низких частот, т. е. пропускает лишь низкие частоты.
3.2. Измерения временных зависимостей, АЦП и ЦАП —11- 73 емое напряжение, разница между которыми и есть напряжение на входе усилителя. Крутизна вольтамперной характеристики усилителя компаратора такова, что достаточно нескольких милливольт, чтобы выходное напряжение усилителя изменилось от минимального до максимального. Практически, такой усилитель имеет лишь два состояния — U = Umin и U = Umax, которые и отслеживаются логической схемой. Это означает, что, как только измеряемое напряжение превысит опорное на нескольких милливольт, усилитель перейдет из одного состояния в другое и на выходе логической схемы вместо 0 появится 1. Понятно, что, если измеряются (точнее сравниваются) напряжения, лежащие в вольтовом диапазоне, точность измерений составляет десятые доли процента. 3.2. ИЗМЕРЕНИЯ ВРЕМЕННЫХ ЗАВИСИМОСТЕЙ, АНАЛОГО-ЦИФРОВЫЕ И ЦИФРО-АНАЛОГОВЫЕ ПРЕОБРАЗОВАТЕЛИ В этом параграфе мы рассмотрим методы измерения изменяющихся во времени токов /(/), напряжений U(t) и других зависимых от времени физических величин, датчики которых преобразуют их значения в ток или напряжение. В сегодняшней практике эти измерения производится с помощью дискретной цифровой техники, если верхняя граничная частота входных сигналов vc < 1 ГГц. В соответствии с теоремой Котельникова (см. гл. 2) для того, чтобы измерять сигналы, спектр которых лежит в интервале [0, vc], достаточно измерять значения 7(0 или U(t) через интервалы Д/ < l/2vc, а это значит, что тактовая частота используемого электронного устройства F должна быть больше, чем 2vc, F = 1/Д/ > 2vc. Те, кто интересуется средствами вычислительной техники, знают, что персональные компьютеры с тактовой частотой F = 2,5 ГГц уже ширпотреб. Сегодня есть компьютеры и с тактовой частотой близкой к 4 ГГц. Это значит, что не за горами то время, когда цифровые осциллографы обеспечат возможность измерения в диапазоне от 0 до 2 ГГц. Заметим, что 2 ГГц — это, практически, предел возможностей традиционной осциллографии. Поэтому, как это не печально, но заслуженные ветераны экспериментальной техники, электронные осциллографы, по-видимому, доживают свой век. Кстати, как невозможно по внешнему виду отличить обычные механические часы от стрелочных кварцевых часов, у которых не только внутренние устройства, но принципы измерения времени кардинально различны, также по внешнему виду вы не всегда отличите цифровой осциллограф от электронного. Просто первый из них гораздо удобнее в работе и, что самое главное, сразу же после измерения результат в виде числового массива уже в компьютере и готов для дальнейшей обработки.
74—11- Глава 3. Исследование импульсных процессов В предыдущей главе мы обсудили принципы дискретизации, т. е. принципы представления непрерывных значений функций и их аргументов их дискретными значениями. Здесь же мы рассмотрим технические способы дискретизации, прежде всего в части, касающейся основных идей, а отнюдь не технического устройства тех или иных приборов. Преобразование непрерывных значений токов или напряжений в их дискретные значения осуществляется с помощью, так называемых, аналого-цифровых преобразователей (АЦП). Заметим вскользь, что электроника всегда предоставляла и предоставляет сегодня безграничный простор для фантазии и творчества. Поэтому, перелистав любой профессиональный справочник [1], вы найдете сотни АЦП различного типа. Но, приглядевшись повнимательнее, вы поймете — основополагающих идей то всего несколько, а разнообразие АЦП обусловлено лишь их различными комбинациями. Вот эти основополагающие идеи мы и рассмотрим. 1. Начнем с параллельных АЦП. АЦП этого типа осуществляют преобразование сигнала с помощью набора компараторов, включенных «параллельно» в том смысле, что на одни из их одноименных дифференциальных входов параллельно подается измеряемое напряжение, в то время как другие входы компараторов присоединены к делителю опорного напряжения (рис. 3.6). Как видно из этого рисунка, на котором приведена принципиальная схема 8-разрядного АЦП (т. е. АЦП, у которого число двоичных разрядов N = 8), этот преобразователь содержит 2N — 1 = 255 компараторов, источник опорного напряжения, 2N = 256 согласованных сопротивлений делителя напряжения, устройство выборки- хранения (УВХ), шифратор, блок управления (БУ) и запоминающее устройство (ЗУ). Устройство выборки-хранения — в простейшем случае это просто конденсатор с двумя ключами (рис. 3.6) — служит для временного запоминания значения измеряемого напряжения U(t) в определяемый блоком управления момент времени *,. По сигналу последнего, сначала ключ 5г отключает конденсатор С от компараторов. Затем замыкается ключ S\, обеспечивая заряд конденсатора С и, наконец, после того, как напряжение на конденсаторе сравняется с измеряемым напряжением, ключ S\ размыкается и ключ 52 присоединяет конденсатор к компараторам, т. е. к собственно измерительной схеме. (Некоторые интегральные микросхемы (ИМС) параллельных АЦП, например МАХ100, снабжаются сверхскоростными УВХ, имеющими время выборки порядка 0,1 не.) Как видно из схемы, при увеличении входного сигнала компараторы переводятся из состояния 0 в состояние 1 по очереди — снизу вверх. Теперь, если приложенное входное напряжение не выходит, скажем, за пределы диапазона от 2,5Д/и, до 3,5Д/и (заштрихованная часть шкалы на рис. 3.6), где А/и = А^^\цп — квант входного напряжения, соответству-
3.2. Измерения временных зависимостей, АЦП и ЦАП 75 ющий единице младшего разряда АЦП, то компараторы с 1-го по 3-й устанавливаются в состояние 1, а компараторы с 4-го по 255-й остаются в состоянии 0. Логическое устройство, называемое шифратором, преобразует эту группу кодов в восьмизначное двоичное число, т. е. переводит на машинный язык, и заносит результат измерения напряжения U(t) в момент U в запоминающее устройство, где оно и хранится до получения соответствующего запроса. Затем, описанная процедура повторяется: по сигналу блока управления сначала ключ *% отключает конденсатор С от компараторов, затем замыкается ключ *Si и т.д. Благодаря одновременной работе компараторов параллельный АЦП является самым быстрым. Например, восьмиразрядный преобразователь типа МАХ104 позволяет получить 109 отсчетов в секунду при времени задержки прохождения сигнала не более 1,2 не. Недостатком этой схемы является высокая сложность. Действительно, как мы видели 8-разрядный параллельный АЦП содержит 255 компараторов и 256 согласованных сопротивлений. Следствием этого является высокая стоимость и значительная потребляемая мощность. Тот же АЦП МАХ 104 потребляет около 4 Вт. 256Д/и 3,5 tfon/256. 255Aw 254Aw 3A/w 2Д/Я Am Рис. З.6. Принципиальная схема 8-разрядного параллельного АЦП
76 Глава 3. Исследование импульсных процессов | tfon/16 Рис. 3.7. Последовательно-параллельный двухступенчатый 8-разрядный АЦП Последовательно-параллельные АЦП'— это результат компромисса при стремлении получить высокое быстродействие и желании сделать это по возможности меньшей ценой. К категории последовательно-параллельных АЦП относятся и многоступенчатые АЦП, принципиальная схема одного из которых (двухступенчатый 8-разрядный АЦП) приведена на рис. 3.7. В этой схеме верхний на рисунке параллельный АЦП-1 осуществляет грубое преобразование сигнала в четыре старших разряда выходного кода, т. е. измеряет входной сигнал с шагом квантования Д^ацп-1 = Umax/2* — Umax/l6. Цифровые сигналы с выхода АЦП-1 направляются в выходной регистр и одновременно на вход 4-разрядного быстродействующего цифро-аналогового преобразователя (ЦАП), преобразующего двоичный код сигналов АЦП-1 в соответствующее напряжение, подаваемое в сумматор (£). Остаток от вычитания выходного напряжения ЦАП из входного напряжения поступает на вход АЦП-2, опорное напряжение в котором в 16 раз меньше, чем в АЦП-1. Как следствие, шаг квантования АЦП-2 в 16 раз меньше шага квантования АЦП-1, А^ацп-2 = ^пах/256. Этот остаток, преобразованный АЦП-2 в цифровую форму, представляет собой четыре младших разряда выходного кода, которые также направляются в выходной регистр, чем и завершается формирование 8-разрядного числа. Различие между АЦП-1 и АЦП-2 заключается, прежде всего, в требовании к точности: у АЦП-1 точность должна быть такой же как у 8-разрядного преобразователя, в то время как АЦП-2 может иметь точность 4-разрядного. Конечно, при прочих равных условиях преобразователь такого типа оказывается медлен-
3.2. Измерения временных зависимостей, АЦП и ЦАП 77 нее рассмотренного нами ранее. Действительно, АЦП-1, ЦАП и АЦП-2 работают последовательно, причем время срабатывания ЦАП, по крайней мере, не меньше, чем время срабатывания АЦП. Если прибавить к этому еще и время, необходимое для срабатывания цифровых схем управления, то окажется, что время выборки у такого прибора примерно на порядок величины больше, чем у рассмотренного выше параллельного АЦП. Зато он проще и дешевле. На самом деле, он содержит в сумме всего 30 компараторов, а не 255, всего 32 точно согласованных сопротивлений, а не 256; АЦП-2 может обладать существенно меньшей точностью, а значит быть дешевле и т. д. В заключение следует добавить, что грубо и точно измеренные величины должны, естественно, соответствовать одному и тому же входному напряжению U(U). А это значит, что все то время, которое требуется сигналу для прохождения последовательности АЦП-1 —> ЦАП —► АЦП-2 —> выходной регистр —> запоминающее устройство, входное напряжение необходимо поддерживать постоянным с помощью устройства выборки-хранения. ГТЧ Блок Управления Счетчик Запоминающее устройство Рис. 3.8. Структурная схема АЦП последовательного счета На рис. 3.8 показан преобразователь, который является типичным примером АЦП последовательного счета. Он состоит из компаратора, генератора тактовой частоты (ГТЧ), блока управления (БУ), счетчика, цифро- аналогового преобразователя (ЦАП) и запоминающего устройства (ЗУ). На один вход компаратора поступает входной сигнал, а на другой — сигнал обратной связи с ЦАП. Работа преобразователя начинается по сигналу блока управления, который в некоторый момент времени // включает счетчик, суммирующий число импульсов, поступающих от генератора тактовой частоты ГТЧ. Выходной код счетчика подается на ЦАП, осуществляющий его преобразование в напряжение обратной связи U^. Счет импульсов будет продолжаться до тех пор, пока напряжение обрат-
78 Глава 3. Исследование импульсных процессов ной связи не сравняется с входным напряжением. В этот момент компаратор переключится из состояния 1 в состояние 0 и своим выходным сигналом остановит счетчик. Понятно, что число сосчитанных импульсов, которое, в двоичном коде будет занесено в запоминающее устройство, пропорционально входному напряжению £/(?,) в момент времени /,. Через заранее установленный промежуток времени Д* блок управления вновь запустит счетчик, описанный процесс повториться и тем самым будет измерено входное напряжение U(tj) в момент времени tj = /, 4- А*. Время преобразования АЦП этого типа есть функция N — числа разрядов АЦП и F — тактовой частоты. Для TV-разрядного АЦП fmax = (2^ — \)/F. Так, например, если N = 10, a F = 1 ГГц tmax = 1023 не, что обеспечивает максимальную частоту выборок порядка 1 МГц. Заметим, что в АЦП этого типа мы, в сущности, измеряем время, необходимое для того, чтобы напряжение обратной связи сравнялось с измеряемым напряжением, а затем по этому измеренному времени судим об измеряемом напряжении. Поэтому точность измерения напряжения зависит от погрешности измерения времени, т. е. прежде всего от стабильности генератора тактовой частоты (ГТЧ). Так что, если желательно точно измерять напряжение, не стоит скупиться — нужно использовать, пусть дорогой, но высокостабильный ГТЧ. Si и* ♦ Выходной код Рис. 3.9. Упрощенная схема АЦП двухтактного интегрирования Такого сорта проблем практически не существует в так называемых АЦП многотактного интегрирования (рис. 3.9). Каждый цикл работы такого АЦП происходит в две стадии: стадию интегрирования измеряемого напряжения и стадию его измерения. Время интегрирования входного
3.2. Измерения временных зависимостей, АЦП и ЦЛП —11-79 напряжения Д/i постоянно; в качестве таймера используется счетчик импульсов. Ключевым элементом рассматриваемой схемы является, описанный выше, электронный интегратор (И), который в каждом цикле работы АЦП по сигналу блока управления ключом S\ соединяется с входной клеммой АЦП Блок управления одновременно с командой на замыкания ключа S\ активизирует счетчик импульсов, который после отсчета фиксированного число импульсов п, т. е. через промежуток времени Afi = n/F9 прекращает счет и посылает ответный сигнал в блок управления, завершая этим стадию интегрирования входного сигнала. (Подчеркнем, что промежуток времени Д*ь т.е. тот промежуток времени, в течение которого конденсатор электронного интегратора С заряжается от входного напряжения через сопротивление R, обусловлен фиксированным числом импульсов счетчика п = Д^/*, где F, как мы условились тактовая частота.) По получении ответного сигнала от счетчика импульсов блок управления размыкает ключ S\ и замыкает ключ £2, присоединяя тем самым источник опорного напряжения к интегратору, и одновременно посылает команду счетчику импульсов начать отсчет новой серии импульсов т. Как видно из рис. 3.9, опорное напряжение противоположно по знаку входному напряжению. Поэтому на стадии измерения конденсатор С интегратора будет разряжаться, т. е. выходное напряжение интегратора, будет линейно уменьшаться по абсолютной величине. Как только выходное напряжение интегратора перейдет через нуль, компаратор К переключится из одного состояния в другое и даст сигнал блоку управления остановить счет и переслать число отсчитанных импульсов т в выходной регистр. Понятно, что за время, Д/2 = tm-tk, т. е. за то время, которое необходимо, чтобы конденсатор разрядится до нуля, будут отсчитано т = Д^/1 импульсов. Обратимся к диаграмме рис. 3.10, на которой приведена зависимость напряжения на выходе интегратора l/ц от времени. Ясно, что изменяющееся во времени напряжение на выходе интегратора к моменту 4 достигнет величины (34) где UBX(t) « [UBX(ti) + Um(tk)]/2 — среднее значение входного напряжение за промежуток времени Д/i = & — /,-3). Из формулы (3.4) видно, что выходное напряжение интегратора l/ц в этот момент будет тем больше, чем больше будет VBX, что иллюстрирует также и рис. 3.10 (зависимость #и(0> показанная на этом рисунке соответствует меньшему входному 3) Точное значение Um(t) = (1/ДЛ)//* UBX(t)dt.
80 Глава 3. Исследование импульсных процессов напряжению). Но, чем больше будет |{/и|> тем больше времени потребуется, чтобы оно снизилось до нуля, что хорошо видно на рис. 3.10. На стадии измерения, т.е. во временном интервале Д/2 = tm-tk, выходное напряжение интегратора по абсолютной величине будет снижаться линейно со временем, т. е. пропорционально т: Unit) = Uonm (3.5) RCF RCF В момент времени tm напряжение на выходе интегратора будет равно нулю, а это значит, что оба слагаемых правой части уравнения (3.5) станут равны друг другу по абсолютной величине, откуда ивх = ^т.. (з.б) п Из этого выражения следует, что при таком методе измерения ни тактовая частота, ни постоянная интегрирования RC не влияют на результат. Необходимо только, чтобы тактовая частота в течение времени Д/i + Д£ оставалась постоянной. Это можно обеспечить даже при использовании простого, а значит дешевого тактового генератора, поскольку существенные временные или температурные дрейфы частоты происходят за время несопоставимо большее, чем Д^ + Д/^. Второе существенное преимущество такого метода изменения состоит в усреднении шумовой компоненты, т. е. в фильтрации шумов, поскольку в окончательный результат входят не мгновенные значения измеряемого напряжения, а лишь усредненные за время интегрирования Д/i величины. Как правило, АЦП такого типа это высокоточные АЦП, однако с частотой выборки редко превосходящей 1 кГц. Afc Интегрирование Измерение Рис. 3.10. Временные диаграммы АЦП двухтактного интегрирования 2. С цифро-аналоговыми преобразователями (ЦАП) мы уже сталкивались при изучении АЦП. Эти широко распространенные приборы являются в известной мере антиподами АЦП. Действительно, если АЦП
3.2. Измерения временных зависимостей, АЦП и ЦАП 81 последовательно преобразует каждое из значений входного напряжения в некоторое, соответствующее ему, iV-значное двоичное число, т. е. измеряет величину этого напряжения и «переводит» его значение на машинный язык, то ЦАП, наоборот, преобразует, поданный на его вход закодированный в двоичном коде сигнал в напряжение соответствующее значению этого двоичного числа. Сами, того не подозревая, мы постоянно используем эти приборы, когда рассматриваем какой-либо график на экране дисплея, когда пользуемся Интернетом, когда слушаем музыку, записанную на лазерных дисках — больше того, подавляющее число управляемых компьютерами машин и механизмов, равно как и исполнительных устройств экспериментальной техники не «понимают» непосредственно машинные коды и требуют преобразования цифровых сигналов в аналоговую форму. В этом причина того, что в составе изделий вычислительной техники ЦАП встречаются не реже, а, скорее, чаще, чем АЦП. Цифро-аналоговые преобразователи проще, чем АЦП, поэтому разнообразие принципов их построения не так велико. Также как и АЦП, цифро-аналоговые преобразователи делятся на последовательные (достаточно медленные) и параллельные ЦАП. Параллельные ЦАП, в свою очередь, делятся на ЦАП с суммированием токов и ЦАП с суммированием напряжений. Начнем с последних. Блок-схема параллельного 8-разрядного ЦАП с суммированием напряжений показана на рис. 3.11. Основой этой интегральной микросхемы (ИМС) является цепь из 256 последовательно соединенных сопротивлений делителя опорного напряжения. Дешифратор служит для преобразования входного двоичного числа в унитарный код, управляющий ключами. Из схемы видно, что напряжение на выходных клеммах ЦАП «А» и «В» обусловлено номером того ключа, который будет замкнут по команде дешифратора. Конечно, при такой схеме ЦАП приходится формировать на одном кристалле ИМС 2N ключей и 2N согласованных сопротивлений, тем не менее, сегодня выпускаются 8-, 10- и 12-разрядные ЦАП такого типа. Ключевым элементом большинства ЦАП с суммированием весовых токов является, так называемая, «резистивная матрица постоянного импеданса» (рис. 3.12). Такая матрица обладает рядом замечательных свойств. Рис. 3.11. Блок-схема параллельного восьмиразрядного ЦАП с суммированием напряжений
Л- 82 —fly. Глава 3. Исследование импульсных процессов Во-первых, ее входное сопротивление, т.е. сопротивление, измеренное на входных клеммах матрицы, остается постоянным и всегда равным R при добавлении любого количества ячеек, в чем нетрудно убедиться, например, сравнив схемы рис. 3.12, а и б. Поэтому, если ее запитать от «генератора тока», то входное напряжение матрицы всегда будет равно IR = и0П. Во-вторых, ток в каждом узле схемы делится ровно надвое, поэтому напряжение в каждом следующем узле схемы будет вдвое меньше, чем в предыдущем, так что в N-м узле схемы U^ = Uon/2N~l, где N = 1,2,3..., а полный ток, вытекающий из какого либо узла схемы (до его разделения надвое) IN = I/2N. И, наконец, в-третьих, если обозначить минимальный ток, текущий в системе, как Д/и = /щщ, то токи, текущие через сопротивления с величиной 2R, составят последовательность Д/w, 2Д/и, 4Д/и, 8Д/и ..., т. е. каждый раз будут возрастать вдвое или на порядок величины в двоичной системе счисления. Другими словами, нормированный (разделенный на Д/я) «вес» каждого тока будет равен соответствующему разряду двоичного числа. = I/2-R= Uon/2 £) I/2\\] 2R 1/$\ П 2R //8ЧМ 2R 7/84 П 2R U/22 »>N-\ //84 П 2R //2"VM 2R \\2R Рис. 3.12. Резистивная матрица постоянного импеданса Схема ЦАП с суммированием весовых токов, использующая матрицу постоянного импеданса, приведена на рис. 3.13. Как видно из схемы, выходной ток /вых определен тем какие из ключей 5b,5i,iS2, ...,5V-1 замкнуты. Ключи находятся в разомкнутом или замкнутом состоянии в зависимости от того, 0 или 1 стоит в соответствующем разряде двоичного числа. Так, если только в младшем разряде двоичного числа стоит 1, за-
3.2. Измерения временных зависимостей, АЦП и ЦАП 83 мкнут лишь ключ 5Ь и выходной ток /вых = Д/я, что соответствует минимальному току, т. е. току младшего разряда ЦАП. Если лишь в двух младших разрядах двоичного числа стоят единицы, замкнуты ключи 5Ь и S\ и выходной ток /вых = Д/и + 2Д/и = ЗД/w. Пусть мы имеем дело с 8-разрядным ЦАП (N = 8). Если все ключи разомкнуты, естественно, /вых = 0. Если все ключи замкнуты, как нетрудно подсчитать, /вых = Лпах = 255Д/Я, что, включая 0, составляет 256 отсчитываемых значений тока. Выберем любое, наперед заданное число, скажем 147. Это число в двоичном счислении запишется, как 10010011. При поступлении такого числа на вход ЦАП будут, как это нетрудно видеть, замкнуты ключи Sq9 S\9 S* и S?, что приведет к результату /вых = Дт + 2Д/и + 16Д/И + 128Д/И = 147Д/w. В отличие от рассмотренного ранее 8-разрядного ЦАП с суммированием напряжений этот преобразователь содержит всего 16, а не 256 сопротивлений и только 8, а не 256 ключей. Рис. 3.13. Схема ЦАП с суммированием весовых токов Заканчивая наше достаточно краткое путешествие в мир АЦП—ЦАП, отошлем тех, кто интересуется их широчайшем разнообразием к Справочнику [1] или к Интернету, откуда можно получить массу полезных сведений. 3. Итак, мы рассмотрели различные способы, с помощью которых можно, используя АЦП, преобразовывать входные сигналы, представляющие собой непрерывно изменяющиеся во времени аналоговые напряжения, в последовательность их дискретных значений, запомнить полученные числовые массивы и, если потребуется, используя ЦАП, преобразовать последние в их первоначальную форму. В нашем случае входные сигналы АЦП — это выходные сигналы датчиков, косвенно отражающих ход исследуемых нами физических процессов. Поэтому сигналы датчиков должны быть, во-первых, согласованы по амплитуде с возможностями АЦП и, во-вторых, приведены на вход АЦП, поскольку АЦП и датчики вовсе не всегда расположены совсем рядом. В реальном эксперименте сигналы датчиков, как назло, или много больше или много меньше тех нескольких вольт, в пределах которых, используя АЦП, можно достичь
84 —11/- /идея J. Исследование импульсных процессов приемлемой точности измерений. Если сигналы датчиков малы, то — куда деваться — их нужно усиливать, что подчас не просто. Казалось бы, большие сигналы всегда можно уменьшить по амплитуде, тем более, что некоторые АЦП имеют входные делители напряжения. К сожалению, возможности таких делителей ограничены — так что даже киловольтные напряжения не стоит подавать на вход АЦП, если в вашу задачу не входит уничтожение измерительной аппаратуры. А сконструировать и изготовить делитель напряжения, который был бы, например, пригоден для измерения формы стокиловольтных импульсов наносекундного диапазона, вообще задача вовсе не простая. Но, в конце концов, все эти задачи решаемы, так что нам останется только передать, эти согласованные по амплитуде выходные сигналы датчиков на вход АЦП. Тут то вроде, что за проблемы? Оказывается — проблемы есть. В экспериментальной физике передача сигналов от датчиков к регистрирующим системам осуществляется либо по радиотехническим коаксиальным кабелям, либо по оптоволоконным линиям связи. Коаксиальный кабель состоит из центрального, обычно сплошного, т.е. одножильного провода; окружающего его цилиндрического, чаще всего, полиэтиленового, изолятора; наружного токопровода, выполненного в виде плетеного чулка из тонких медных нитей (так называемой «оплетки»), и защитной, предохраняющей оплетку, оболочки. Кабель характеризуется его волновым сопротивлением р = у/L/C, где L — индуктивность, а С — емкость, приходящиеся на единицу длины кабеля, и, так называемым, «затуханием», обусловленным потерями передаваемой энергии в проводнике и изоляторе. При разработке и анализе схем, используемых в экспериментальной физике, удобнее пользоваться не этим, введенным связистами, параметром, а коэффициентом передачи К((о). Впрочем, дело не в терминах, важно другое — с увеличением частоты затухание увеличивается, а коэффициент передачи падает, причем, так, что форма импульсов длительностью, скажем, 10~9 с не будет искажена лишь в том случае, если длина обычного радиотехнического кабеля не превышает одного метра. Конечно, существуют кабели с меньшим затуханием на высоких частотах. Это дорогие кабели с посеребренными проводниками, в которых изоляция центральной жилы осуществляется за счет дистанционных керамических шайб. По внешнему виду они скорее напоминают шланги от пылесоса, нежели те кабели, которыми телевизор соединяется с коллективной антенной. По безысходности они употреблялись в ряде физических экспериментов, но сегодня есть более кардинальный путь — использование оптоволоконных линий связи, о чем мы чуть подробнее поговорим позже. Пока же займемся другим. При исследовании быстропротекающих физических процессов все кабели должны быть согласованы, т.е. замкнуты на сопротивление R = р,
3.2. Измерения временных зависимостей, АЦП и ЦАП -J\ - 85 во всех тех случаях, когда характерное время изменения амплитуды сигнала Д/« l/vc (vc, как всегда высшая критическая частота в спектре сигнала) меньше удвоенного времени распространения сигналов по кабелю 2т = 2Ly/e/c, где L — длина кабеля, с — скорость света в вакууме, а е — диэлектрическая постоянная материала, изолирующего центральную жилу кабеля от оплетки. В противном случае, отражаясь от концов кабеля, как от зеркал, любая помеха или иного сорта флуктуация напряжения будет многократно возвращаться к регистратору, искажая сигнал. (Похожее явление часто наблюдается при пользовании домашней антенной, когда телевизионный сигнал, отражаясь от зданий, стоящих на разных расстояниях от телевизора, многократно поступает на его вход, создавая многоконтурное изображение.) Так что, кабели должны быть замкнуты на согласующие сопротивления. Это не всегда безобидное мероприятие. Во-первых, согласование кабелей, как правило, приводит к уменьшению амплитуды измеряемых сигналов. Во-вторых, во всех тех случаях, когда выходное сопротивление датчиков велико, необходимы добавочные радиотехнические устройства, согласующие высокоомный выход датчика с низкоомным входом кабельной линии. К сожалению, это не единственная морока с кабелями. Сотни метров кабелей, а на крупных экспериментальных установках их многие километры, образуют некую «паутину» с многочисленными замкнутыми электрическими контурами, в которых возбуждаются и текут так называемые «блуждающие токи», являющиеся причиной трудно подавляемых помех. Кардинальный способ борьбы с этим явлением известен — все кабели должны быть «заземлены», т.е. присоединены к шине, соединенной с заземлением, в одной точке. Это сравнительно просто сделать на небольшой, «настольной» установке, но практически невозможно на крупном экспериментальном комплексе. Практически все, перечисленные трудности, отсутствуют при использовании оптоволоконных линий связи для передачи сигналов от датчиков к регистраторам. Конечно, оптоволоконные линии гораздо сложнее простых и относительно недорогих радиотехнических коаксиальных кабелей. В состав любой оптоволоконной линии связи входят: передатчик, оптоволоконный кабель и фотоприемник. Передатчик включает в себя полупроводниковый лазер и модулятор (или другое кодирующее устройство), преобразующий электрические сигналы датчиков в модулированное во времени световое излучение, которое и передается по оптоволоконному кабелю к фотоприемнику. Оптоволоконный кабель представляет собой, заключенную в защитную оболочку, тонкую (~ 100 мкм) стеклянную нить с примерно 10-микронной сердцевиной (керном). Показатели преломления материалов, из которых формируются (вытягиваются из расплавленной стеклянной массы) собственно стеклянная нить и ее стеклянный керн, существенно различны. Это обуславливает рас-
86 _f\_ Глава 3. Исследование импульсных процессов пространение излучения лишь вдоль стекловолокна. Поэтому выйти за пределы стеклянной нити свет может, только достигнув ее торца, где и располагается фотоприемник. Сегодня в мире таких стекловолоконных кабелей, используемых для целей телекоммуникации, уложено уже больше, чем обычных электропроводных линий связи. Эта область техники бурно развивается. Сегодня имеются экспериментальные образцы оптоволоконных линий связи с полосой пропускания до 100 ГГц, а линии с полосой пропускания в 10 ГГц — уже обыденность. Это означает, что при увеличении быстродействия АЦП мы могли бы уже сегодня исследовать физические процессы с характерными временами изменения параметров Д/« l/vc = 10~10 с. Другими словами, сегодня не линии связи, а АЦП ограничивают быстродействие аппаратуры, регистрирующей электрические сигналы. Однако, наиболее существенное преимущество оптоволоконных линий связи — это даже не их полоса пропускания, а достигаемая с их помощью помехозащищенность, обусловленная тремя следующими причинами. Во-первых, датчики и регистраторы сигналов в такой схеме измерения электрически развязаны, т. е. надежно изолированы друг от друга. Во-вторых, в силу своих малых габаритов, к тому же малопотребляющие, а потому питаемые от небольших локальных аккумуляторов, передатчики и фотоприемники могут быть просто и надежно экранированы от электромагнитных воздействий. И, наконец, в-третьих, будучи диэлектриками, оптоволоконные кабели не только не восприимчивы к электромагнитным наводкам, но и не могут образовывать каких либо замкнутых паразитных электрических контуров. 4. Рассмотрим в качестве примера два типа датчиков, используемых, соответственно, при измерении больших токов и напряжений в высоковольтных цепях экспериментальных физических установок. Для измерения токов в основном применяется так называемый «пояс Роговского». Его конструкция и принципиальная схема измерений тока показаны на рис. 3.14. Из принципиальной схемы (рис. 3.14, а) видно, что здесь мы имеем дело с трансформатором тока. Небольшое, но принципиальное замечание. Такая схема работает, как трансформатор тока лишь в том случае, если выполнено условие <oL ^> R, где L — индуктивность вторичной обмотки. Дело в том, что ЭДС, индуцированная во вторичной обмотке, пропорциональна скорости изменения пронизывающего ее магнитного потока (Е = -dH/dt), т. е. пропорциональна скорости изменения измеряемого тока. Поэтому, если бы мы измеряли напряжение на концах разомкнутой обмотки, мы измеряли бы производную тока по времени, а отнюдь не ток, текущий в первичной цепи. Понятно, что если наша задача измерить ток, а не его производную по времени, необходимо выполнить операцию интегрирования, что и осуществляется в R—1,-цепи,
3.2. Измерения временных зависимостей, АЦП и ЦАП 87 когда (oL > R. Если это условие выполнено, ток во вторичной обмотке трансформатора тока просто в N2/N{ раз меньше измеряемого, где N\ и Ni — количество витков первичной и вторичной обмоток. К регистратору в К регистратору \\Р Рис. 3.14. Пояс Роговского Обычно пояс Роговского изготавливается следующим образом (рис. 3.14, в). С конца коаксиального кабеля удаляются защитная оболочка и оплетка и на оголенную изоляцию внутренней жилы кабеля плотно, виток к витку наматывается проволока. Один ее конец припаивается к оплетке, другой — к центральной жиле кабеля. Затем этим куском кабеля, обмотанного проволокой, опоясывается проводник, в котором измеряется ток, и припаивается «шунт» с сопротивлением р. Образованная таким образом конструкция, и есть не что иное, как трансформатор тока, в котором роль первичной обмотки играет проводник с измеряемым током, а роль вторичной обмотки выполняет «катушка», намотанная на оголенном конце кабеля. И, наконец, несколько слов о согласовании выхода нашего датчика со входом кабельной линии. Как мы говорили — кабель должен быть замкнут на согласованную нагрузку. Поэтому схемы подключения различны для случаев, когда (oL ^> p или <oL <C р, что и показано на рис. 3.14, а и б.
Глава 3. Исследование импульсных процессов Металлический проводник Резистивное покрытие Металлический ' проводник Резистивное покрытие (R з) Принципиальная схема Рис. 3.15. Конструкция делителя напряжения для измерений в цепях со сверхвысокой частотной составляющей (СВЧ) Вопросы согласования кабельных линий особенно остро стоят при измерении напряжений. Это и понятно, поскольку интегрирование, осуществляемое при измерении токов, в сущности, усреднение по некоторому временному интервалу, всегда ведет к подавлению помех, т.е. флуктуации с так называемым «нулевым средним»4*. Поэтому, в отличие от измерений тока, при измерении напряжений приходится особенно изощряться, что можно понять, разглядывая рис. 3.15. На этом рисунке схематически показана конструкция делителя напряжения для измерений в цепях со сверхвысокой частотной составляющей (СВЧ). Обратим внимание на то, что оба согласующих сопротивления р\ и pi выполнены из пустотелых керамических цилиндров, внутрь которых входят лишенные оплетки (но не изоляции!) центральные жилы кабелей. На внешней поверхности каждого из этих керамических цилиндров равномерно нанесено резистивное покрытие, а на поверхности большего из них сформированы еще и два тонких опоясывающих металлических проводника. К первому присоединяется жила высоковольтного кабеля, второй делит сопротивление р\ на две части R\ и R% так, что R\ + Ri = рь (Соответс- 4) Функции с «нулевым среднем» это функции, у которых /f^ N(t) dt — 0.
3.3. Измерение световых импульсов в фемтосекундном временном диапазоне JL твенно R$ + Ri = Р2) Поскольку Ri много меньше и^ и R3, выходное напряжение такого делителя напряжения Uout = Um x Ri: 2p\. Внешний металлический кожух обеспечивает неизменность волнового сопротивления кабельной линии на том ее участке, где вмонтированы сопротивления. В целом эта «картинка для разглядывания» весьма поучительна и при внимательном изучении позволяет заметить ряд небезынтересных деталей, что мы и предоставляем сделать нашим читателям. Итак, мы рассмотрели методы измерения зависимых от времени физических величин, датчики которых преобразуют их значения в токи или напряжения, методы измерения изменяющихся во времени токов I(t) и напряжений U(t) и установили, что с помощью современных средств вычислительной техники можно надежно проводить измерения в широком временном интервале, включая наносекундный диапазон длительностей (10~6—10~9 с). Как мы увидим в следующей главе, электронно- оптическая техника позволяет перекрыть и пикосекундный (10~9—10~12 с) временной интервал, когда дело касается световых, а не электрических импульсов. Как продвинуться дальше, в фемтосекундный (10~12—10~15 с) диапазон? Методы измерения в этом временном интервале рождаются сегодня, на наших глазах. К сожалению, для объяснения сущности многих из них необходимо использовать непростой математический аппарат, однако в ряде случаев, опустив подробности, можно обойтись без этого, что мы и попытаемся сделать в следующем параграфе. 3.3. ИЗМЕРЕНИЕ СВЕТОВЫХ ИМПУЛЬСОВ В ФЕМТОСЕКУНДНОМ ВРЕМЕННОМ ДИАПАЗОНЕ Стандартными методами в этом временном диапазоне можно было бы измерять, если бы имелись инструменты с полушириной аппаратной функции фемтосекундной длительности. К сожалению, таких инструментов нет и, как говорится, не предвидится5). Для любого прибора импульсы такой длительности — это дельта-функция, поэтому подали ли мы на вход нашего прибора импульс длительностью 10 или 100 фс, на выходе все едино мы зарегистрируем одно и то же — g(t)9 т. е. аппаратную функцию. Единственный прок от таких измерений — уверенность в том, что полуширина измеряемого импульса т < 0, т. е. меньше полуширины аппаратной функции. Таким образом можно получить оценку сверху, т. е. уверенность в том, что длительность измеряемого импульса, по крайней мере, не больше 0. Проведя спектральные измерения, что несложно при достаточно коротких световых импульсах, поскольку их 89 5) Как будет показано в гл. 4 реально достижимая полуширина аппаратной функции электронно-оптических приборов /8 > 0,3 пс.
90 Глава 3. Исследование импульсных процессов спектральная ширина занимает десятки, а то и сотни ангстрем, можно получить оценку снизу. Действительно, как мы уже говорили (см. гл. 2), из теории спектров следует, что Ду Д/ и 1. Это значит, что если длительность измеряемого импульса на самом деле равна А/, ширина полосы частот, зарегистрированная спектрографом будет никак не меньше, чем Ду « 1/Д/6). К сожалению, это условие необходимо, но недостаточно — частотные составляющие импульса должны быть еще сфазированы определенным образом. Другими словами, из того факта, что ширина полосы частот, полученная из спектральных измерений равна Ду, вовсе не значит, что длительность светового импульса Д/ « 1/Ду. Но оценку снизу из этих измерений получить можно, поскольку, если измеренная полоса частот импульса равна Ду, то его длительность никак не может быть короче ~ 1/Ду. Вернувшись к оценке сверху можно написать 1/Ду < Д* < 0. К сожалению, этот интервал, подчас, может составлять один, а то и два порядка величины, так что такой метод годится только для очень грубых оценок, но не более того. Для измерения длительностей световых импульсов в фемтосекундном временном диапазоне существуют другие приемы. Фоторегистратор Рис. 3.16. Принципиальная оптическая схема измерения длительностей фемто- секундных световых импульсов Принципиальная схема устройства, реализующая один из них, показана на рис. 3.16. Это устройство включает в себя: систему деления измеряемого импульса надвое с регулируемой линией задержки одного из вновь полученных в результате деления импульсов относительно другого, нелинейный кристалл и фоторегистратор. Ход лучей в этой схеме понятен из рисунка. Измеряемый импульс вводится в измерительную систему со стороны полупрозрачного, 50%-го зеркала 3\. После деления надвое один из полученных импульсов, отражаясь от зеркала 3fe, 6) Шкалы спектрографов нанесены в длинах волн, а не в частотах. Поэтому ширину полосы частот приходится находить как Ду = сДА/А2, где с — скорость света, ДА — спектральная ширина в длинах волн, а А — длина волны, соответствующая центру спектрального распределения.
3.3. Измерение световых импульсов в фемтосекундном временном диапазоне Ju 91 падает на нелинейный кристалл под углом <р к оси Z, а его копия, т. е. второй импульс, направляется в линию задержки, состоящую из зеркал Зз, 3* и З5. Этот второй импульс, пройдя линию задержки, падает на кристалл симметрично первому, т.е. также под углом q>, но с другой стороны по отношению к оси Z. Зеркала З4 и 3s линии задержки укреплены в единой оправе, которая может перемещаться вдоль оси падения второго луча, что, изменяя длину оптического пути, обеспечивает неизменность угла его падения на кристалл. Линия задержки нужна для того, чтобы выровнять длины оптических путей, поскольку необходимо, чтобы оба импульса достигли кристалла одновременно. Эти два импульса, т. е. эти две пересекающиеся внутри нелинейного кристалл электромагнитные волны с частотой щ могут, при некоторых условиях, в зоне их пересечения вызвать свечение кристалла на частоте второй гармоники (2wo), которое и регистрируется с помощью фотодетектора или фотоприемником с пространственным разрешением. Что это за условия, при которых частота электромагнитной волны, проходящей сквозь нелинейный кристалл, удваивается? Их много: пластину кристалла, сквозь которую будет проходить преобразуемое излучение, нужно вырезать из монолита так, чтобы ее поверхности были определенным образом ориентированы относительно кристаллографических осей; излучение, возбуждающее свечение кристалла, должно падать практически нормально на, вырезанный таким образом кристалл7); поляризация возбуждающего излучения, т. е. направление вектора Е падающей электромагнитной волны, обязано быть ориентировано должным образом относительно осей кристалла и т.п. Мы не станем обсуждать сложные физические процессы взаимодействия волн внутри кристалла, что завело бы нас в дебри нелинейной оптики, а лишь обратим внимание на внешнюю простоту и красоту этого явления. На пути лазерного луча, пусть невидимого глазу инфракрасного луча неодимового лазера, мы ставим тонкую прозрачную пластину нелинейного кристалла и видим за кристаллом, как бы рожденный внутри его, ярко зеленый, слабо расходящийся луч! Но для рассматриваемых нами практических приложений важно другое — как это будет видно из дальнейшего изложения, размеры светящейся области внутри кристалла зависят только от длительности измеряемого импульса и угла между направлениями распространения пересекающихся волн. Поэтому, поскольку углы падения <р известны, по размеру зоны свечения можно оценить длительность импульса. 7) Преобразование во вторую гармонику возможно лишь тогда, когда угол между волновым вектором К и нормалью к поверхности кристалла не превышает примерно одной угловой минуты.
92 \ Глава 3. Исследование импульсных процессов I = ст = 3-150 мкм Нелинейный а б в г д Рис. 3.17. Принципы измерения длительностей фемтосекундных световых импульсов Обратимся к рис. 3.17. Прежде всего, заметим, что для наглядности на этом рисунке пропорции не соблюдены. Поэтому прежде, чем разбираться с существом дела, оценим, какие объемы в пространстве занимают эти сгустки энергии, путешествующие в нашей схеме, т. е. наши импульсы. Поперечный размер пучка определяется апертурой измерительного устройства и составляет, обычно, 3—5 мм. «Размер» нашего импульса вдоль направления его распространения оценим, как / = ст, где с — скорость света, а т — длительность импульса. При длительности импульса равной 10~14—5 • 10~13 с, / = 3—150 мкм соответственно. Таким образом, объем пространства, в котором сосредоточена энергия импульсов фемтосекундной длительности, таков, что его размер вдоль направления распространения, по крайней мере, в 20 раз меньше его поперечных размеров, что следует иметь в виду, изучая рис. 3.17. Диаграмма а этого рисунка иллюстрирует ситуацию, при которой длины оптических путей не выровнены. Из рисунка видно, что в то время, когда первый импульс уже пересекает нелинейный кристалл, второй все еще не достиг его поверхности. Так как угол падения достаточно велик, первый импульс пройдет сквозь прозрачный кристалл не испытывая каких либо изменений. То же произойдет и со вторым импульсом, поскольку, в то время, когда он будет пересекать кристалл, первый импульс будет уже далеко за его пределами. Раз кристалл не «светится», т. е. вторая гармоника не генерируется, выровняем с помощью линии задержки длины оптических путей. Теперь оба импульса начнут пересекать кристалл одновременно (рис. 3.17,6) и результирующий волновой вектор суммы двух электромагнитных волн будет ориентирован перпендикулярно поверхности кристалла, поскольку углы падения пересекающихся волн строго симметричны относительно нормали к его поверхности. (Соответственно суммарное электрическое поле двух электромагнитных волн окажется требуемым образом ориентировано относительно кристаллографических осей.) Однако, генерация второй гармоники будет происходить лишь в той области кристалла, где
3.3. Измерение световых импульсов в фемтосекундном временном диапазоне -J\- 93 существуют две пересекающиеся волны одновременно (заштрихованный треугольник на рис. 3.17, б). Наибольшего размера зона свечения достигнет в тот момент времени ti, когда центр области пересечения двух волн совпадет с центром кристалла (рис. 3.17, в). Как мы уже говорили, размеры светящейся внутри кристалла зоны зависят только от длительности измеряемого импульса и угла между направлениями распространения пересекающихся волн, что хорошо видно из рис. 3.17, д. Если бы измеряемый импульс имел прямоугольную форму, т.е. функция /(/), описывающая зависимость интенсивности измеряемого импульса от времени, имела бы вид прямоугольника, то, как это следует из рис. 3.17, д, по максимальному размеру светящейся зоны L можно было бы найти длительность импульса, как т = L\%q>/c « L<p/c, поскольку угол (р достаточно мал. Зависимость интенсивности излучения второй гармоники от координаты х (ось х совпадает по направлению с большей диагональю ромба), т.е. /2оДх), будет зафиксирована фоторегистратором, на который проецируется светящаяся зона кристалла так, чтобы плоскости кристалла и фотоприемника были оптически сопряжены. При этом в том случае, когда измеряемый импульс имеет прямоугольную форму, а коэффициент увеличения проецирующей системы М = 1, график функции hvix) представляет собой равнобедренный треугольник с основанием L и полушириной L{/2 = L/2, откуда легко находится длительность импульса как т = 2L\/2<p/c*K К сожалению, все не так просто при измерениях реальных импульсов. При таком способе измерения полуширины реальных импульсов, найденные подобным образом из полуширины функции hmix), оказывается в 1,5—2 раза меньше действительных,^ определить, в полтора ли или в два раза меньше, невозможно в принципе, если Вид функции E(t) (или, по крайней мере, /(/)) неизвестен. Конечно, хотелось бы найти неизвестную функцию E(t), а не ее полуширину, да еще с 30%-й ошибкой. Как, в принципе, это можно сделать? Прежде всего разберемся, что нам необходимо знать, чтобы однозначно определить искомую функцию E(i) E(t) = A(t) exp{/[w0/ - (p(t)]}9 (3.7) где щ — частота, A(t) = y/I(i) — амплитуда, a <p(t) — фаза электромагнитной волны в моменты времени /. Поскольку щ, как правило, известна 8) Заметим, что при обработке экспериментальных данных, как правило, используется именно полуширина, так как определить непосредственно L со сколь либо приемлемой точностью не представляется возможным из-за малой интенсивности сигнала на краях изображения, а значит низкого отношения сигнал/шум.
94 Глава 3. Исследование импульсных процессов нам нужно найти «всего лишь» A(t) и <p(t). Другими словами наша задача — найти зависимость от времени амплитуды и фазы ультракороткого светового сигнала. Для того, чтобы понять применяемые здесь методы, рассмотрим более подробно ситуацию, возникающую при пересечении очень тонкого нелинейного кристалла двумя одинаковыми световыми импульсами с волновыми векторами к\ ъкг, распространяющимися под углами ±0 к оси Z (рис. 3.18). Как видно из рисунка оба этих импульса пересекают кристалл одновременно лишь на оси системы при х = 0. В той области кристалла, где значения х положительны, первый импульс отстает от второго, при отрицательных значениях х — опережает его. Нелинейный кристалл Рис. 3.18. Ситуация в зоне пересечении очень тонкого нелинейного кристалла двумя одинаковыми световыми импульсами При некотором фиксированном значении У, как это понятно из рисунка, задержка т(х) = Ifix* /с. Напомним, что оба этих импульса появились на свет в результате того, что исходный импульс был поделен на входе в измерительную систему ровно надвое. Поэтому при фиксированном значении х* суммарное электрическое поле рассматриваемых двух электромагнитных волн может быть представлено как Ez(t) = E(t) + E(t — т). В этом случае, т.е. в случае так называемого «неколлинеарного взаимодействия» электрическое поле генерируемой в нелинейном кристалле электромагнитной волны второй гармоники а ее интенсивность -т), -т). (3.8) (3.9) (В этих формулах, равно как и в некоторых последующих, знак равенства заменен на знак пропорциональности с тем, чтобы не выписывать
3.3. Измерение световых импульсов в фемтосекундном временном диапазоне -J\ - 95 неважных для понимания сути дела коэффициентов, учитывающих эффективность преобразования во вторую гармонику, потери в оптическом тракте, чувствительность фоторегистратора и т. п.) Заметим — широко используемые сегодня фотоприемники9) в состоянии измерять интенсивность световой волны /, а точнее энергию £ = /А/, пришедшую на фотоприемник за время экспонирования At, а отнюдь не электрическое поле световой волны Е. Более того, в фемтосекундном временном диапазоне фотоприемники могут, коль необходимо, обладать пространственным, но не временным разрешением, т.е. не только E(t), но и I(t) измерены быть не могут. Другими словами, в обсуждаемой измерительной схеме возможно зарегистрировать лишь полную энергию второй гармоники, излученной из той или иной точки кристалла за все время ее генерации, т.е. за все то время, пока в этой точке присутствуют одновременно обе пересекающиеся волны. (На рис. 3.18 этот временной интервал ограничен значениями t\ и fc.) Соответственно, энергия второй гармоники, излученная из некоторой точки нелинейного кристалла с координатой х = тс/2/5, h oo //('НО-т)Л = j I(t)I(t-T)dt. (3.10) t\ — oo Интегралы в этой формуле равны друг другу просто потому, что вне интервала [fbfc] I(t)I(t — т) = 0'3 причем второй интеграл есть не что иное, как автокорреляционная функция /(/). Поскольку, как мы знаем, т(х) = 2/Здс/с, просто заменив переменные, мы найдем распределение плотности энергии на входном зрачке нашего фоторегистратора. Так, если коэффициент увеличения проецирующей системы М = 1, оо = k J /(/) I(t - 20х/с) Л. (3.11) — ОО Здесь к — коэффициент, учитывающий эффективность преобразования во вторую гармонику, потери в оптическом тракте, чувствительность фоторегистратора и т.п. Обратим внимание — в уравнениях (3.10) и (3.11) не содержится информация о фазе <p(t). Тем не менее, если вид функций 7(0 или E(t) нам известен, не составляет труда найти I(t) по полуширине функций @2ш(х) или $2ш(т)- Если же вид этих функции нам неизвестен, то этого, к сожалению, сделать нельзя, хотя бы потому, что невозможно из одного уравнения найти два неизвестных /(/) и <p(t). В принципе, 9) См. гл. 4.
96 Глава 3. Исследование импульсных процессов /(/) можно пытаться искать из интегральных уравнений (3.10) или (3.11), например, путем минимизации функционала = f - j I(t)I(t-r)dt dr, (3.12) где £Sig(r) = к^2а)(т) = * /Г^о ^W ^(' — i)dt — результат эксперимента. Однако, здесь мы имеем дело с типичной «некорректно поставленной задачей», со всеми вытекающими отсюда последствиями. Это значит, что в результате мы найдем не единственную искомую функцию I(t)9 а некоторую совокупность функций hit), одинаково хорошо минимизирующих функционал (3.12), но «сколь угодно сильно отличающихся друг от друга». Действенный путь преодоления возникающих при этом проблем — это радикальное увеличение объема экспериментальной информации10), что возможно при переходе от одномерных (#2й>(*)) к двумерным (например, спектральным) методам измерения. Для этого необходимо перед фоторегистратором так установить спектрограф, чтобы его щель была ориентирована вдоль оси X (соответственно, направление дис персии будет параллельно оси Y) и спроецировать на щель спектрографа зону генерации второй гармоникиИ). Это позволит получить набор спектров второй гармоники, излучаемых из каждой точки кристалла с координатой х = тс/2(5 S((o,t) оо J E(t)E(t - т) exp{-i<ot} dt (3.13) Ясно, что, если коэффициент увеличения системы М = 1, распределение плотности энергии в плоскости фоторегистрации S(a),x) j E(t)E(t - 2/Зх/с) ехр{-Ш} dt (3.14) Эти уравнения позволяют в итерационном процессе [2] найти E(t), т. е. вычислить A(t) и q>(t). При этом в каждой итерации после решения обратной задачи, т.е. вычисления A(t)t и <р(/)/> определяется невязка z = /^ol&ig(w> т) - /!^ E(t)E(t - r)exp{-ia)t}dt\2 dr в исходном уравнении (3.13). На рис. 3.19 приведено, заимствованное из работы [2], со- 10) Как мы не раз уже говорили, именно недостаточность информации не позволяет из совокупности возможных решений отобрать единственно «правильное». 11) Этот метод измерения ультракоротких световых импульсов был предложен Ри- ком Требино [2] и носит название FROG — Frequency-Resolved Optical Gating.
3.3. Измерение световых импульсов в фемтосекундном временном диапазоне —fly- 97 поставление экспериментально полученной спектрограммы с реконструированной по найденным значениям E(t). Эксперимент Реконструкция 0,5 0,4 | 0,3 0,5 0,4 0,3 -40 -20 0 20 40 -40 -20 0 20 40 Время, фс Время, фс I 0 0,5 1,0 Область времен Область частот 1,0 ] я 0,5 о 0,5 -л -40 -20 0 20 40 600 800 1000 Время, фс Длина волны, нм Рис. 3.19. Сопоставление результатов восстановления (реконструкции) E(t) с экспериментальными данными Все рассмотренное выше относится к методам и приборам для измерения одиночных импульсов (так называемые single shot correlators). При измерении цуга импульсов, генерируемых источниками фемтосе- кундных импульсов, появляются другие возможности. (Фемтосекундные генераторы генерируют непрерывный цуг идентичных друг другу фемто- секундных импульсов следующих последовательно один за другим с промежутком в 10-20 не.) В этом случае в схеме, показанной на рис. 3.16, в качестве регистратора используется фотодетектор, сигнал которого поступает на вход относительно медленного осциллографа. Развертка этого осциллографа синхронизирована с движителем, обеспечивающим воз-
98 —' \у- Глава З. Исследование импульсных процессов вратно-поступательное перемещение устройства задержки (на рис. 3.16 это связка зеркал З4—З5) так, что каждой точке осциллограммы точно соответствует определенное положение связки зеркал 3*—3s, т.е. определенная задержка между приходом лучей, освещающих, кристалл, преобразующий излучение во вторую гармонику. Заметим, что при развертке, скажем 10 мс и при периоде следования импульсов в 10 не, будут измерены и сформируют осциллограмму 106 пар импульсов, последовательно задерживаемых один относительно другого на время т. Как ясно из предыдущего изложения, мы увидим на экране осциллографа кривую £Sig(r) = kf^ I(t)I(t — т) dt с той лишь разницей, что масштаб времени по оси X осциллограммы будет иной. Истинный масштаб времени можно найти исходя из следующих соображений. При измерениях автокорреляционной функции, для того чтобы обеспечить задержку т одного светового импульса относительно другого необходимо переместить зеркала З4—З5 на величину / = ст, где с — скорость света. Максимальное время задержки ттах выбирается так, чтобы оно было бы в два-три раза больше ожидаемой полуширины измеряемой функции, так чтобы /щах = сттах. При перемещении зеркал линии задержки от 0 до / луч осциллографа переместится вдоль оси развертки на величину L = vt9 где v — скорость развертки (в электронных осциллографах это просто скорость перемещения луча по оси абсцисс), a t — время, прошедшее от начала регистрации. Для того, чтобы измеряемая функция поместилась на экране осциллофафа необходимо, чтобы полная длина развертки Lmax была бы больше или равно величине L = v/max, для вычисления которой необходимо найти соотношение между Тщах и /щах — полной длительностью развертки или, что одно и то же, между ти/. Используем для этого масштабный коэффициент М = 1/L, показывающий во сколько раз длина перемещений зеркал линии задержки меньше длины перемещения луча осциллофафа вдоль оси его развертки. Поскольку / = ст, a L = vt М = l/L = cr/(vt), откуда найдем, что истинное время задержки r=M-t, (3.15) с где, как понятно, t — время, отсчитанное по экрану осциллофафа. Перепишем равенство (3.15) в виде сттах = vtmuM, откуда видно, что при заданном ттах, vtmax = const. Типичная автокорреляционная функция, полученная в такого рода схеме, приведена на рис. 3.20. Деления шкалы времени, на этом рисунке, нанесены с учетом приведенного выше соотношения (3.15). Как понятно, максимум интенсивности автокорреляционной функции будет соответствовать такой задержке т, при которой оба импульса приходят на кристалл преобразователь одновременно. Осцилляции связаны с тем, что
Литература 99 задерживаемый луч периодически приходит на кристалл преобразователь в противофазе к лучу незадержанному. Действительно, пусть поле волны, пришедший на кристалл-преобразователь первой U\ =Aeiw^<p\ тогда поле задержанного импульса запишется как U2 = i4e'w(/+v+T). Их суммарное поле в плоскости кристалла Uz = U\ + Щ, а их суммарная интенсивность h =UzUj! = 2А2 + А2е*" + А2е~ш = 2А2 + 2А2 cos шт. Заметим, что интенсивность второй гармоники (рис. 3.20) не будет описываться этим соотношением, поскольку поле преобразованного излучения пропорционально произведению первичных волн U^ ~ U\Ui, a не их сумме. Однако, каждый раз, когда (от будет принимать значение (от = лл, где п = 1,3,5,..., суммарная интенсивность первичных волн в плоскости кристалла будет равно нулю — какое уж тут преобразование во вторую гармонику! (Кстати, из периода осцилляции несложно найти частоту, а значит, и длину волны, лазера.) -100 -50 0 50 Задержка т Рис. 3.20. Типичная автокорреляционная функция (деления шкалы в фс) Этот метод измерения — хороший, надежный и простой способ оценки длительности периодически следующих лазерных импульсов. Именно оценки, коли неизвестна форма импульсов E{t) или /(/), поскольку если для импульсов «прямоугольной» формы полуширина его автокорреляционной функции точно равна полуширине лазерного импульса, то при других формах импульсов полуширина автокорреляционной функции может оказаться в 1,4—2,0 раза больше истинной полуширины импульса. ЛИТЕРАТУРА 1. Микросхемы АЦП и ЦАП: Справочник (+CD). — М.: Додэка-ХХ1, 2005. — 432 с. 2. Trebino R. Frequency-resolved optical gating: the measurement of ultrashort laser pulses. — Boston: Kluwer Academic Publishers, 2002.
ГЛАВА 4 ФОТОГРАФИЧЕСКИЕ МЕТОДЫ ИССЛЕДОВАНИЯ И ВЫСОКОСКОРОСТНАЯ ФОТОГРАФИЯ Хорошо известна поговорка: «лучше один раз увидеть, чем тысячу раз услышать». В сущности это изречение есть интуитивная оценка разницы в пропускной способности оптических и акустических каналов передачи информации. К тому же, чаще всего первичная информация и о физических объектах, и о физических явлениях приносится со светом. Оба эти обстоятельства объясняют столь широкое распространение оптических и, в частности, фотографических методов исследования в современной экспериментальной физике. Тем не менее оптические изображения, регистрируемые в современном физическом эксперименте, чаще всего предназначены не для непосредственного визуального восприятия, а необходимы как исходные данные для расчета пространственного распределения параметров объекта исследования. Более того, в основном это и не изображения в традиционном смысле этого слова, а лишь числовой массив, отражающий распределение освещенности на входе в измерительную систему. Требования, предъявляемые к такому массиву чисел, т.е. к выходному изображению, обусловлены той точностью, с которой необходимо определить набор функций координат и времени, описывающих состояние объекта исследования и являющихся конечной целью измерений. Возможность удовлетворить этим требованиям зависит от конкретных параметров используемых измерительно- регистрирующих систем. Последние обычно состоят из ряда устройств многократно трансформирующих приносимую со световым потоком информацию так, что выходные изображения подчас существенно отличаются от входных, что, собственно, и определяет потерю точности. Прогнозирование выходных изображений, равно как и анализ возможностей измерительных систем, включающих наряду с оптическими приборами, разнородные радиоэлектронные устройства с их каналами связи, автоматические микрофотометры, аналого-цифровые преобразователи, запоминающие устройства и т. д., требует единого подхода с общих позиций. Именно поэтому естественно применить для описания и анализа таких систем хорошо разработанные методы теории информации, поскольку задача последней — как раз определение и оптимизация пропускной
Глава 4. Фотографические методы исследования -J\y- 101 способности каналов передачи информации и информационной емкости запоминающих систем, а все перечисленные выше устройства в конечном счете предназначены для приема, передачи, переработки и регистрации информации. То, что в одних устройствах информация сосредоточена во временной структуре сигналов, а в других устройствах — в пространственной их структуре, как мы уже знаем, не существенно. Все названные выше устройства в равной степени обладают рядом фундаментальных свойств и, в первую очередь, линейностью и инвариантностью, т. е. независимостью свойств системы относительно пространственного или временного сдвига. Эти обстоятельства, как было показано в гл. 2, определяют почти полное сходство используемого для их анализа математического аппарата и позволяют применить хорошо разработанные и далеко продвинутые в теории связи методы анализа и синтеза электронных систем к другим, в частности, оптическим устройствам. Однако, для практической реализации такого подхода нам придется пересмотреть широко распространенную сегодня систему параметров, характеризующих оптические устройства как раз с точки зрения визуально воспринимаемого качества изображения. Эта система параметров возникла не сама по себе — долгие годы основной задачей фотографии было именно получение изображений для их визуального восприятия. Этим целям служила и неплохо служит сегодня разработанная и широко используемая система описания качества фотографических устройств и фотографических изображений. И дело вовсе не в том, хороша ли или плоха эта система «в принципе» — она с большим трудом или вовсе не может быть использована в наших целях. Вот в чем дело. Для того, чтобы пояснить суть обсуждаемого вопроса, приведем в качестве примера принятую сегодня методику определения фактора зернистости фотопленки [1]: «... значение фактора зернистости G, служащего мерой фотографических шумов, вычисляется по формуле G = 100/Mim, где Mim — предельный масштаб увеличения, при котором невооруженным глазом обнаруживаются первые следы зернистой структуры изображения». Цель введения такого параметра понятна — он определяет максимально-допустимый размер фотоотпечатка и этим очень полезен фотокорреспондентам. Однако, получить с его помощью величину отношения сигнал/шум, и в конечном итоге значение ошибки измеряемой освещенности нельзя. Другой параметр — так называемая разрешающая способность, «определяемая визуально ... по номеру элемента миры с наиболее тонкими штрихами, все направления штрихов в котором еще разрешаются раздельно» [2]. Таким «предельным элементом» миры, сфотографированной с экрана электронно-оптического преобразователя и показанной на рис. 4.1, является поле № 10. На том же рисунке приведены столь сильно
102 Глава 4. Фотографические методы исследования различающиеся между собой микроденситограммы входного и выходного изображений, откуда видно, что для визуального разрешения в данном конкретном случае достаточно 10%-й модуляции яркости на выходном экране. О чем говорит тот факт, что столь малая модуляция яркости позволяет визуально «разрешить раздельно все направления штрихов»? Безусловно, об удивительной способности человеческого мозга к опознаванию образов; но ведь и только! j Входные сигналы №1 №10 Выходные сигналы У\ЛЛЛЛ ЛЛЛЛЛЛ №1 №6 ^~ №8 №10 Рис. 4.1. Выходное изображение электронно-оптического преобразователя Можно ли на основе подобного рода визуальных измерений получить критерии для оценки погрешностей измерений входных сигналов? К сожалению, нельзя. Было предпринято немало попыток с помощью критерия Рэлея залатать эти зияющие прорехи. Однако введенный Дж. Рэлеем численный критерий правильно устанавливает пороговое значение визуального разрешения лишь для вполне определенных условий: аппаратная функция — результат дифракции на круглом отверстии или щели, источники излучения точечные, а их интенсивность примерно одинакова. Здесь использование критерия Рэлея целесообразно и оправдано. Применять же его для формализации визуальных восприятий вообще, столь же неуместно, как, например, использовать — что, кстати, постоянно делается — световые единицы (люмен, люкс и пр.) при определении чувствительности фотоэлектронных приборов, предназначенных для работы в ИК- или УФ-диапазонах, в которых, как известно, функция видности просто равна нулю, а значит формально — без искусственно введенных «подпорок» — и освещенность равна нулю. Одно время казалось, что введение в практику метода измерений частотно-контрастных характеристик существенно изменит дело, но и здесь
4.1. Оптико-механические камеры —fly- ЮЗ дар традициям не позволил воспользоваться имеющимися возможностями. Действительно, вряд ли можно найти радиоинженера, который для снятия амплитудно-частотной характеристики использовал бы им- пульсно-периодический генератор прямоугольных импульсов, но откройте любой справочник — частотно-контрастные характеристики в оптике снимаются по штриховой мире! И дело даже не столько в том, что применение «синусоидальной» миры (т. е. миры, пространственная яркость которой меняется по закону 1(х) = /о[1 4- s\n((ox)/2], существенно упрощает математическое описание, — измерения со штриховой ми- рой не обеспечивают на высоких пространственных частотах требуемую точность. Мы перечислили практически все основные параметры, призванные сегодня характеризовать оптические устройства, т. е. все те рудименты, данные о которых приводятся в справочной литературе. Из изложенного ясно, что для инженерного анализа и синтеза сколько- нибудь сложных оптических систем, равно как и для априорных оценок погрешности измерения входной освещенности Еь(х9у) по выходному изображению или точности восстановления входного изображения по выходному, эта система мер не подходит, поскольку такого рода оценки или расчеты нельзя сделать, используя принятую сегодня систему параметров. По этим причинам, в целях о которых говорилось выше, мы будем пользоваться методами теории информации и подходами, подробно изложенными в гл. 2. 4.1. ОПТИКО-МЕХАНИЧЕСКИЕ КАМЕРЫ Оптико-механические камеры [3], регистрирующие изображения на фотопленку просты и надежны. Их применение целесообразно во всех тех случаях, когда не требуется предельное временное разрешение или очень высокая светосила. Конечно, дополнительные заботы, связанные с проявлением фотопленки и ее последующей обработкой, не прибавляют энтузиазма, однако это плата за высокое качество изображения. Оптико-механические камеры бывают двух типов. Первый тип так называемый фоторегистраторы («streak camera» в западной терминологии) предназначены для регистрации с временным разрешением одномерных изображений Е(х, /), т. е. изображений, у которых освещенность вдоль одной из осей координат постоянна, скажем Е(у) = const. Второй тип — кадровые камеры предназначены для регистрации во времени двумерных изображений Е(х,у, /), в которых распределение освещенности Е(х,у) регистрируется через промежутки Af или, как говорят с частотой N = 1/Д* кадров в секунду. Понятно, что временное разрешение кадровых камер равно Д/. О временном разрешении фоторегистраторов речь пойдет ниже.
104 —f \/- /лава 4 Фотографические методы исследования 1. Принципиальная оптическая схема фоторегистратора показана на рис. 4.2. Поясним принцип действия этого прибора. Изображение объекта исследования О объективом L\ строится в плоскости щели 5, вырезающей из спроецированного изображения полосу с характерным размером Д порядка полуширины аппаратной функции фоторегистратора )8. Понятно, что изменяющееся во времени изображение объекта исследования Е(х91)9 должно быть спроецировано на щель прибора таким образом, чтобы ось X была направлена вдоль щели. Затем вырезанная полоса изображения с помощью объективов Li и L^ и вращающегося зеркала М проецируется на фотопленку, прижатую к цилиндрической поверхности R. Отметим, что пара объективов Li, £3 представляет собой так называемый репродукционный объектив, состоящий из двух последовательных объективов. Щель расположена в фокальной плоскости первого из них, поэтому второй работает в параллельных лучах, что обеспечивает высокое пространственное разрешение. При использовании объективов с относительно малыми относительными отверстиями, которые обычно применяются в фоторегистраторах, пространственное разрешение изображения спроецированного на фотопленку при такой оптической схеме близко к дифракционно-предельному. Для оценки временного разрешения может быть использована простая формула Д/« /J/v, где $ — полуширины аппаратной функции, a v — линейная скорость перемещения изображения щели вдоль фотопленки. Из рис. 4.2 видно, что v = coR, где R — расстояние от фотопленки до оси вращения зеркала. Здесь нужно обратить внимание на два следующих обстоятельства. Пропорционально R растет, к сожалению, не только линейная скорость v, но и /5, поскольку с R растет и оптическое увеличение (что, кстати, снижает светосилу прибора). Так что на этом пути улучшить временное разрешение не представляется возможным. Казалось бы, кардинальный путь улучшения временного разрешения — увеличение скорости вращения зеркала (о и до определенного предела это так. Предел увеличению а) кладут разрывающие вращающиеся зеркало центробежные силы пропорциональные га)2, где г — радиус зеркала. Поэтому, если напряжения, вызванные центробежными силами, близки к критическим, увеличить о) можно лишь уменьшив г. Причем, увеличивая <о скажем, в два раза, г приходится уменьшать в четыре. И это при том, что р в такого рода системах определяется, прежде всего, дифракцией света на апертуре зеркала т. е. пропорционально Л/г. Так что и здесь возможности ограничены. В справочной литературе, в основном, приводятся лишь значения Nmax = 2no)max, которые составляют обычно 100000—500000 об/мин, и vmax, находящиеся в пределах 3—15 мм/мкс. Однако, как это следует из изложенного выше, из этих цифр невозможно извлечь данные о временном разрешении, если не известно /J или, по крайней мере г. Реально
4.1. Оптико-механические камеры 105 временное разрешение оптико-механических регистраторов обычно не превосходит 10~8 с. Светосила подобного рода приборов, как правило невелика — D/f » 1/10-1/20. Рис. 4.2. Принципиальная оптическая схема фоторегистратора Вернемся к рис. 4.2. Из рисунка видно, что рабочий угол у, в котором возможна регистрация изображения относительно невелик (обычно 60—90°). Это требует жесткой синхронизации начала изучаемого физического явления с началом фотографической регистрации, что совсем непросто, если вы имеете дело с механическими системами. Поэтому широко распространены так называемые системы непрерывной регистрации, называемые также «ждущими» системами. Это системы с многогранными зеркалами, в которых на фотопленке всегда имеется изображение объекта исследования, а зна- _^ чит, его регистрация может быть произведена в любой момент времени. Принципиальная оптическая схема такой системы показана на рис. 4.3. Как видно из рисунка, пучок света, выходящий из объектива в некоторый момент времени покрывает сразу две грани многогранного вращающегося зеркала, отражаясь от которых строит сразу два изображения объекта исследования в точках А[ и А!2 по краям рабочего угла у. При дальнейшем вращении зеркала одно из изображений (А[) уходит за пределы рабочего угла, а второе перемещается в его пределах. Таким образом в любой момент времени на фотопленке будет находится изображение объекта исследования. Рис. 4.3. «Ждущий» фоторегистратор
106 Глава 4. Фотографические методы исследования Заметим что окружность R (рис. 4.2) является геометрическим местом изображений точек щели прибора лишь в том случае, когда ось вращения лежит в плоскости отражающей поверхности зеркала М. Если же отражающая поверхность зеркала смещена относительно оси вращения, так как это имеет место при использовании многогранных зеркал (рис. 4.3), геометрическое место изображений точек щели прибора будет представлять собой часть внутренней дуги улитки Паскаля. Однако, изменяя радиус R и смещая центр окружности можно настолько хорошо аппроксимировать часть дуги улитки Паскаля окружностью, что потери пространственного разрешения практически не будет. Рис. 4.4. Разряд в дейтерии Как мы уже говорили, качество фокусировки объективов Li, L$ близко к дифракционно-предельному. Поэтому двумерная аппаратная функция фоторегистратора может быть представлена в виде g(x,y)=g(r)= ( —з -. 2 nD (4.1) Здесь J\ — функция Бесселя, D — диаметр светового пучка в плоскости выходного зрачка объектива /,з> / — его фокусное расстояние, А — длина световой волны, г — координата в плоскости фотопленки, q — коэффициент близкий к единице, учитывающий реальное превышение дифракционного предела. Отсюда полуширина аппаратной функции о q^j /л ^\ В завершение этого раздела приведем в качестве иллюстрации картину периодического осесимметричного сжатия плазмы слабозатухающим переменным током с периодом ~ 8 мкс (рис. 4.4). Ток в плазме протекает параллельно оси трубы диаметром 8 см. Съемка выполнена с помощью оптико-механического фоторегистратора AWREC5. Полная длительность фоторазвертки составляет 11,4 мкс. При съемке щель фоторегистратора «вырезала» участок изображения перпендикулярно оси
4.1. Оптико-механические камеры 107 трубы, так что вертикальная координата на рис. 4.4 соответствует радиусу г, а горизонтальная — времени /. Таким образом, представленная на рисунке картина, есть не что иное, как зависимость свечения плазмы разряда от г и t, т.е. функция I(r,t) Как видно из рисунка, в начале процесса светится только тонкая кольцевая оболочка у внутренней стенки трубы — там, где развивается разряд. Однако, по мере нарастания тока плазма стремительно сжимается, некоторое время удерживается магнитным полем тока вблизи оси, но к концу первого полупериода, когда ток спадает, не удерживаемая больше магнитным током плазма выбрасывается на стенки. Во втором полупериоде тока все начинается сначала, с той только разницей, что теперь светится и пристеночная плазма. а"' в2 Ь' Рис. 4.5. Принципиальная схема оптико-механической кадровой камеры 2. Принципиальная оптическая схема кадровой оптико-механической камеры показана на рис. 4.5. Объект съемки аЪ с помощью объективов L\ и Li проецируется на плоскость, перпендикулярную оптической оси объективов и совпадающую с осью вращения зеркала (изображение а'У). Зеркало М поворачивает изображение clb1 в положение d'b11 (в таком положении мы увидим объект съемки ab, если будем его рассматривать по направлению стрелки А). Наконец изображение d'b11 с помощью объектива с малым диаметром L^ переносится на неподвижную фотопленку Р (изображение dnbtn). Ряд таких объективов расположен по дуге окружности с центром в точке С. В то же время плоскость выходного зрачка объектива L\ с помощью объектива Li оптически сопряжена с
108 —J\- Глава 4. Фотографические методы исследования поверхностью, на которой располагаются входные зрачки объективов Ь$. Поэтому пучок света, покидающий объектив L\ направляется ко входному зрачку объектива L^ При этом оптическое увеличение подбирается таким, чтобы все лучи выходящие из объектива L\ попадали бы в апертуру объектива L^. В плоскости выходного зрачка объектива L\ не существует какого-либо изображения, поэтому его нет и в плоскости входного зрачка объектива L$ — это просто размытое световое пятно, которое при вращении зеркала М перемещается с одного объектива с малым диаметром L$ на другой, реализуя этим оптическую коммутацию. Понятно, что частота съемки кадров определяется скоростью вращения зеркала и диаметром объективов L3. Современные скоростные оптико-механические камеры позволяют реализовать частоту съемки от 100 тысяч до 10 миллионов кадров в секунду. К недостаткам таких оптико-механических камер следует прежде всего отнести их относительно малую светосилу (D/f « 1/20—1/40) и трудности с синхронизацией с исследуемыми явлениями, что отчасти компенсируется большим количеством снимаемых кадров. К тому же все (или почти все) оптико-механические системы рассчитаны на использование фотопленки, которая сегодня пользуется все меньшей и меньшей любовью экспериментаторов из-за излишней головной боли, связанной с ее дальнейшей обработкой. 4.2. ЭЛЕКТРОННО-ОПТИЧЕСКИЕ ПРЕОБРАЗОВАТЕЛИ И ЭЛЕКТРОННО-ОПТИЧЕСКИЕ КАМЕРЫ Можно смело сказать, что внедрение электронно-оптических преобразователей в физический эксперимент [4] произвело революцию в практике фотографических методов исследования быстропротекающих процессов. Действительно, их временное разрешение вплоть до 10~12 с (на четыре порядка величины лучше, чем у оптико-механических камер!), чувствительность близкая к предельной1*, простота сканирования изображений и возможность регистрировать излучение в инфракрасной, видимой, ультрафиолетовой и мягкой рентгеновской областях спектра делают эти уникальные приборы незаменимыми инструментами исследования. Электронно-оптические преобразователи — это вакуумные приборы, в которых оптическое изображение сначала преобразуется в свой электронный аналог, т. е. в электронное изображение, которое усиливается и затем проецируется на люминесцентный экран, где снова пре- 1) Предельной чувствительностью называется чувствительность, позволяющая регистрировать единичные фотоны (или электроны). Понятно, что увеличивать чувствительность сверх предельной бессмысленно, поскольку ни пол фотона ни пол электрона в природе не существует.
4.2. Электронно-оптические преобразователи и камеры 109 образуется в оптическое изображение. В настоящее время в мире выпускается несколько десятков различных типов электронно-оптических преобразователей, предназначенных для научных исследований, но все их многообразие можно условно разделить на так называемые «времяа- нализирующие приборы» и «усилители света». Последние, как наиболее простые мы и используем для первого знакомства. 1. Устройство типичного усилителя света показано на рис. 4.6. С помощью внешнего объектива изображение проецируется на полупрозрачный фотокатод 2, который часто формируют на полупрозрачной металлической подложке 1. Последняя необходима, чтобы избежать падения напряжения вдоль фотокатода при больших импульсных световых нагрузках, поскольку собственное сопротивление большинства фотокатодов чрезмерно велико. Эмиссия электронов с поверхности фотокатода в каждой его точке пропорциональна интенсивности падающего в эту точку света, в силу чего пространственное распределение эмитированных электронов nt(x9y) = pnp(x9y), (4.3) где яе — пространственная плотность эмитированных электронов2), \i — квантовый выход фотокатода, алр- пространственная плотность падающих на фотокатод фотонов. Таким образом эмитированное фотокатодом электронное изображение с точностью до случайных флуктуации повторяет изображение оптическое. Динамический диапазон фотокатода превышает несколько миллионов. Это означает, что эмиссия с пространственно разрешаемого участка изображения, примерно равного /J2, пропорциональна количеству фотонов падающего света в пределах от нескольких электронов до их нескольких миллионов. Повторим, что при малом числе эмитированных электронов обсуждаемая пропорциональность определяет- РиС. 4.6. Электронно-оптический ся статистикой фотоэлектронов и вы- усилитель света полняется только в среднем. На рисунках 4.7 и 4.8 приведены спектральные характеристики фотокатодов, предназначенных соответственно для работы в инфракрасном и видимом 3 4 2) Заметим, что рождение фотоэлектронов есть случайный процесс, поэтому равенство (4.3) выполняется только в среднем, т. е. ле выполняет роль математического ожидания.
no Глава 4. Фотографические методы исследования диапазонах. Кривые рис. 4.7 — квантовый выход серебряно-кислородно- цезиевого фотокатода — нормированы на максимум чувствительности. Представленные на рис. 4.8 кривые — это зависимость абсолютных значений квантового выхода от длины волны собственно многощелочного фотоэмиссионного слоя без учета поглощения света в проводящей подложке. Поглощение света в проводящей подложке фотокатодов, допускающих высокие импульсные световые нагрузки, составляет обычно 10-20%. Поэтому, для того чтобы найти квантовую эффективность многощелочного фотокатода с проводящей подложкой, достаточно данные рис. 4.8 помножить на коэффициент 0,8—0,9, откуда нетрудно убедиться, что в максимуме спектральной чувствительности цена рождения электрона составит примерно 3 фотона/электрон. Справедливости ради нужно отметить, что это, конечно, рекордные результаты. Фотокатод рядовых коммерческих трубок считается хорошим, если его квантовый выход составляет 0,15—0,2. Понятно, что при таком квантовом выходе нужно затратить в среднем 5—7 фотонов для рождения одного электрона. 1 0,5 0 ч / / / I / / / у f *** \ \ V \ ч ч 0,1 0,08 0,06 0,04 0,02 400 600 800 1000 Я, нм 1200 1300 1400 А, нм Рис. 4.7. Квантовый выход серебряно-кислородно-цезиевого фотокатода Экран электронно-оптического преобразователя 5, являющийся составной частью анода в этой электродной системе, формируется на противоположной фотокатоду стенке вакуумной колбы и служит для преобразования электронного изображения в оптическое. Экраны электронно- оптических преобразователей кроме как лучшей разрешающей способностью (/} « 1,25—2 • 10~2 мм) мало чем отличаются от экранов телевизоров или экранов компьютерных дисплеев. Такие экраны состоят из осажденного люминофора (часто сине-фиолетового свечения (Атах « 450 нм, ДА « 60 нм), лежащего в максимуме чувствительности большинства детекторов излучения) и вакуумно-напыленной поверх него пленки алюминия толщиной ~ 50—100 нм. Алюминиевые пленки такой толщины практически прозрачны для электронов с энергией порядка 10 кэВ, и
4.2. Электронно-оптические преобразователи и камеры -J\y- 111 фактически непрозрачны для света. Роль этих пленок двояка: во-первых, они формируют электрическое поле в районе экрана и, во-вторых, они отражают свечение люминофора в направлении детектора излучения, чем с одной стороны повышают эффективность регистрации, а с другой экранируют фотокатод от паразитной засветки. Энергетическая эффективность3) экрана при облучении его электронами с энергией в диапазоне 10-20 кВ составляет 10-15%. 10—20 кВ — это как раз та разность потенциалов между фотокатодом и экраном, при которой обычно работают однокаскадные электронно-оптические преобразователи. Поэтому каждый электрон с энергией лежащей в 300 400 500 600 700 А, нм этих пределах рожает в зависимости риС. 4.8. Квантовый выход много от напряжения питания и эффектив- щелочного фогокатода ности экрана ~ 300—1000 фотонов со средней энергией 2,75 эВ, что соответствует максимуму спектральной плотности излучения люминофора сине-фиолетового свечения. Итак, непосредственно у поверхности фотокатода сформирован электронный аналог, спроецированного на фотокатод оптического изображения. Наша задача перенести его на экран электронно-оптического преобразователя. Эту задачу выполняет электронная оптика — специальная конфигурация электрических полей, собирающая все электроны эмитированные какой-либо точкой фотокатода в сопряженную с ней точку экрана. Заметим, что роль поверхностей линз оптического объектива, изменяющих направление распространяющихся лучей, в электронной оптике играют эквипотенциальные поверхности электрического поля. Действительно, если между вектором напряженности электрического поля, всегда перпендикулярного эквипотенциальной поверхности, и вектором скорости электрона существует некоторый угол, то существует и компонента электрического поля перпендикулярная вектору скорости, которая и вызывает искривление электронной траектории. Чем больше угол меж- 3) Энергетическая эффективность экрана вводится по определению, как отношение мощности фотонного потока, излучаемого экраном, к мощности потока электронов, облучающих экран [Вт/Вт]. При импульсном режиме работы энергетическая эффективность экрана определяется, как отношение энергии фотонов, излученных экраном, к энергии электронов, облучивших экран за время регистрируемого светового импульса [Дж/Дж].
112 Jly. Глава 4. Фотографические методы исследования ду векторами, тем больше и эта трансверсальная сила. Необходимое для переноса электронного изображения с фотокатода на экран поле формируется системой электродов, в простейшем случае всего двумя электродами — это электроды 3 и 4 на рис. 4.6. Можно ли, и в каких случаях, не создавать сложных конфигураций электрических полей, а обойтись лишь однородным продольным электрическим полем, естественно реализуемым, когда между плоскими фотокатодом и экраном приложено ускоряющее напряжение? Оценим, какой в этом случае будет кружок рассеяния на экране при эмиссии электронов из некоторой точки фотокатода. Известно, что фотокатод излучает электроны изотропно по всем направлениям, причем максимум плотности вероятности распределения электронов по энергиям для многощелочного фотокатода при облучением его квантами света видимого диапазона лежит в области £0 « 0,5 эВ. Пусть некий «средний» электрон ускоряясь продольным электрическим полем по направлению от фотокатода к аноду (экрану) равномерно движется в перпендикулярном направлении со скоростью соответствующей максимуму плотности распределения вероятности. Из этих посылок нетрудно получить оценку радиуса кружка рассеяния: г = 25гд/£0/& гДе S — расстояние между катодом и анодом, £о — энергия эмитированного электрона, а £ — энергия ускоренного электрона. Расстояние между катодом и анодом S обычно составляет ~ Ю см, поэтому, если £0 = 0,5 эВ, а £ = 10 кэВ, то г « 1,4 мм. Понятно, что это никуда не годится. Что можно предпринять в такой ситуации? Во-первых, уменьшить S, скажем до 5 мм. Тогда диаметр кружка рассеяния составит ~ 0,14 мм. Это не блестяще, но работать можно и такие приборы, так называемые бипланары (biplanar), существуют. Несмотря на их подкупающую простоту они не получили широкого распространения по причине малого коэффициента усиления, достаточно большого паразитного фона и невысокого пространственного разрешения. Другая возможность — использовать продольное, параллельное электрическому, магнитное поле. При этом за счет трансверсальной компоненты скорости электроны будут двигаться по винтообразным траекториям совершая полный оборот вокруг оси вращения за отрезок времени А/ = 2л/а), где (о = еН/(тс) — так называемая ленгмюровская частота. Обратим внимание на то, что время полного оборота не зависит от скорости электронов. Поэтому, если так подобрать соотношение между ускоряющим электрическим и магнитным полями, чтобы время пролета электрона от фотокатода до экрана равнялось бы Д/, то все электроны, вылетевшие из одной и той же точки фотокатода, совершив полный оборот вокруг своих осей вращения, снова соберутся вместе в одной и той же точке экрана. Такие приборы были когда-то очень широко распространены, несмотря на их отчаянные габариты, чрезмерный вес и необ-
4.2. Электронно-оптические преобразователи и камеры из ходимость стабилизировать ускоряющее напряжение и ток в магнитных катушках с точностью до 0,1%. В то время обеспечить сравнимое качество фокусировки в чисто электростатических приборах не представлялось возможным, но, по мере развития техники электростатической фокусировки, их пространственное разрешение резко возросло и приборы с магнитной фокусировкой просто вымерли как динозавры. Решающую роль в улучшению качества пространственного разрешения приборов с электростатической фокусировкой сыграло внедрение в оптику стекло- волоконной техники. Дело в том, что в простых электростатических приборах, подобных изображенному на рис. 4.6, невозможно получить одинаково хорошее пространственное разрешение в центре и на краю поля зрения. Другими словами, плоскости фотокатода и экрана оказываются оптически сопряженными лишь в приосевой области. В то же время всегда существуют поверхности (к сожалению, не плоские), которые могут быть оптически сопряжены с помощью электрических полей даже не очень сложной конфигурации. Это всегда хорошо понималось — так еще 50 лет назад фотокатод прибора RCA C73435 формировался на сферической поверхности. Однако, здесь возникала другая трудность — как спроецировать оптическое изображение на сферическую поверхность без геометрических искажений и неоднородности пространственного разрешения по полю зрения? Кардинально решить все перечисленные проблемы оказалось возможным только при использовании, так называемых «стекловолоконных шайб». Стекловолоконные шайбы, используемые как входные и/или выходные окна современных электронно-оптических преобразователей состоят из миллионов предельно плотно упакованных светопроводящих волокон, ориентированных параллельно оптической оси прибора (рис. 4.9). Шаг этой растровой структуры d соответствует наружному диаметру отдельных, понятно, двухслойных светопроводящих стекловолокон и составляет в современных приборах 5—10 мкм. Ясно также, что переданное такой структурой изображение будет состоять из отдельных Рис. 4.9. Стекловолоконная шайба световых точек (пикселей) со световым диаметром 3—8 мкм, однако их плотность составит 106—4 • 106 см~2. Это много или мало 2000 х 2000 элементов разложения на каждый квадратный сантиметр поверхности? Для сравнения заметим, что полностью в идеальном телевизионном кадре элементов разложения содержится в десять раз меньше. Однако для нас гораздо важнее другое — тот факт, что d < j3. После укладки
114 Глава 4, Фотографические методы исследования стекловолокон и их спекания стекловолоконная шайба с точки зрения возможности ее механической обработки, в том числе возможностей ее шлифовки и полировки, ничем не отличается от обычного стекла. Поэтому одну из ее поверхностей, скажем ту, на которую будет проецироваться в дальнейшем оптическое изображение, делают плоской, а другую, ту на которой будет формироваться фотокатод, — сферической. Конечно же, устройство современных усилителей света далеко от той изначальной конструкции, что приведена на рис. 4.6, в чем нетрудно убедиться бросив даже беглый взгляд на рис. 4.10, на котором представлена конструкция усилителя света РМШ2х18, выпускаемого фирмой BIFO. На рис. 4.11 показан внешний вид этого прибора: справа — собственно вакуумный прибор, слева — прибор в контейнере. Внутри этого, залитого высоковольтным компаундом контейнера, помещается не только собственно электронно-оптический преобразователь, но также и высоковольтный преобразователь напряжения, делители напряжения и электроника, ответственная за работу прибора, так что наружу часто выводятся лишь два провода, подключаемых к 3-вольтовой батарейке. Рис. 4.10. Усилитель света РМШ2х18: 1 — стекловолоконное входное окно; 2 — фотокатод; 3 — фокусирующий электрод; 4 — анод; 5 — микроканальная плата; 6 — выходное окно Коэффициент усиления электронно-оптического преобразователя, т.е. отношение количества фотонов, излученных люминофором экрана, к количеству фотонов, пришедших на фотокатод может быть вычислен по формуле Ц = №j=-, (4.4)
4.2. Электронно-оптические преобразователи и камеры —fly- 115 где \х — квантовый выход фотокатода, <р — энергетическая эффективность экрана, е — заряд электрона, U — разность потенциалов между фотокатодом и анодом электронно-оптического преобразователя, Avout — энергия фотона (в джоулях), усредненная по спектральному распределению фотонов, эмитированных экраном. Приняв ^=0,2; <р = 0,125; 17= 10 кВ; и hvoux = 4,4 • КГ19 Дж, найдем, что ц « 90. Это отличный результат, к сожалению, в обычных, стандартных однокаскадных усилителях света г\ колеблется в пределах 30-50. Но и это было *~ бы неплохо, если бы нам не нужно было переносить изображение **• 41L ^илитель света РМШ2х18: с экрана усилителя света на фо- справа " собс™е™° элеюронно- У оптический преобразователь, слева — торегастратор, например, на фо- прибор в конгейнере топленку. Как мы уже говорили экран электронно-оптического преобразователя излучает изотропно по всем направлениям в то время, как репродукционный объектив с относительным отверстием, скажем, D/f = 1/3 перехватывает, как нетрудно убедиться, примерно одну сотую часть этого светового потока. Другими словами в результате мы получаем не усиление, а ослабление света. Как же тут быть? На сегодняшней день существуют две возможности. Первая — это переход к многокаскадным приборам. В многокаскадных приборах внутри одной вакуумной колбы монтируются последовательно несколько идентичных каскадов усиления, разделенных тонкой прозрачной для света пленкой (обычно это слюда толщиной 5—10 мкм). На одной стороне этой пленки формируется экран, на другой фотокатод, так что эта многослойная конструкция является одновременно экраном для предыдущего каскада усиления и фотокатодом для последующего. Из-за чрезвычайно малой толщины пленки передача изображения с одной ее стороны на другую происходит практически без потерь и света и пространственного разрешения. Конечно это не означает, что аппаратная функция или коэффициент передачи многокаскадных приборов в целом остаются такими же, как и у приборов однокаскадных, поскольку теперь передаваемое изображение формируется не одной, а несколькими последовательно расположенными электронными линзами. Поэтому, если коэффициент передачи некоего каскада усиления есть A}(w), то суммарный коэффициент передачи /z-каскадного прибора найдется, как Kz(oj) = K\{p))Kiiio)... Кп(<о). Понятно, что и суммарный коэффициент усиления найдется, как произведение коэффициентов усиления отдель-
116 —f\y- Глава 4. Фотографические методы исследования ных каскадов. Так, например, коэффициент усиления двухкаскадного прибора rjz = Т]\ х ?72 будет порядка 2,5 • 103. Другая возможность увеличить коэффициент усиления — это использование, так называемых микроканальных пластин для размножения электронов внутри прибора. Микроканальные пластины — это предельно плотно упакованные сборки из миллионов одиночных микроканальных электронных умножителей, продольные оси которых ориентированы перпендикулярно плоскости всей сборки. Конструкция одиночного микроканального электронного умножителя показана на рис. 4.12. Такой микроканальный электронный умножитель, называемый иногда электронным умножителем с равномерно распределенными динодами, представляет собой полую трубку с наружным диаметром 5—10 мкм и длиной 0,3—0,5 мм. Внутренняя поверхность трубки обрабатывается специальным химическим составом, в результате чего она становится слабо проводящей. Благодаря этому потенциал, обусловленный напряжением, при- <. 1Л ложенным к торцам трубки, ока- зывается равномерно распределенным по ее длине, что в свою очередь обеспечивает равномерность электрического поля, направленного вдоль оси трубки. Электроны, попадающие в такую трубку, Рис. 4.12. Микроканальный элеюрон- Ускоряются электрическим полем ный умножитель вдоль ее оси, но благодаря транс- версальной компоненте скорости и небольшому диаметру трубки достаточно часто сталкиваются с ее стенками. Ускоряющее электрическое поле подбирается такой величины, чтобы на длине пробега электрона между столкновениями со стенками трубки он приобретал бы энергию, обеспечивающую вторичную электрон-электронную эмиссию. Если коэффициент вторичной электрон- электронной эмиссии оказывается большим единицы, внутри трубки происходит размножение электронов. Таким образом величина коэффициента размножения электронов, или как принято называть коэффициент усиления, зависит от приложенного к торцам трубки напряжения и изменяется в пределах от 1 до 104 при изменении приложенного напряжения от ~ 0,5 до 1 кВ. Понятно, что если мы имеем дело не с отдельным микроканальным электронным умножителем, а с их плотно упакованной структурой, мы имеем возможность усиливать электронное изображение и этим увеличивать яркость оптического изображения на экране электронно-оптического преобразователя. Как это видно на рис. 4.10, на котором показано устройство прибора PMU12xl8, микроканальная пластина монтируется в непосредственной близости к экрану.
4.2. Электронно-оптические преобразователи и камеры 117 Между выходным торцом микроканальной пластины и алюминиевым покрытием экрана прикладывается напряжение, в силу чего электроны, которые покидают микроканальную пластину ускоряются до энергии 5—7 кэВ, что обеспечивает достаточно высокую энергетическую эффективность экрана. Понятно, что в такого рода приборах электронное изображение проецируется не на экран, а на входной торец микроканальной пластины. Заметим, что усилитель света РМШ2х18 — типичный представитель современных приборов этого класса. Его параметры достаточно высоки — р < 20 мкм по всему входному зрачку диаметром 12 мм, коэффициент усиления ц = 2 • 104. Лишний раз подчеркнем — коэффициент усиления Т] = 2 • 104 лишь означает, что яркость выходного экрана в 2 • 104 раз выше, чем освещенность входного фотокатода, но и только. Объем же информации, который в принципе может быть считан с выходного экрана, определяется количеством фотонов, пришедших за время экспонирования на фотокатод, его квантовой эффективностью, статистикой первичных электронов, но никак ни коэффициентом усиления, о чем ниже мы будем говорить подробно. Рис. 4.13. Времяанализирующий электронно-оптический преобразователь PV201: 1 — стекловолоконное входное окно; 2 — фотокатод; 3 — анод; 4 — отклоняющие пластины; 5 — микроканальная плата; 6 — выходное стекловолоконное окно Времяанализирующие электронно-оптические преобразователи отличаются от усилителей света лишь наличием отклоняющих пластин, предназначенных для сканирования электронного изображения. Переменное во времени электрическое поле между отклоняющими пластинами играет ту же роль, что и вращающиеся зеркало в оптико-механических приборах. При этом в фоторегистраторах на отклоняющие пластины,
118 Глава 4. Фотографические методы исследования также как в осциллографах, подается линейно изменяющееся во времени напряжение, обеспечивающее линейное перемещение электронного изображения вдоль экрана электронно-оптического преобразователя. В кадровых электронно-оптических камерах на пластины подаются импульсы ступенчатой формы, из за чего электронное изображение скачками перемещается с одного места экрана на другое. Общее количество кадров в таких приборах невелико (обычно не больше 16), однако возможность их точной синхронизации с исследуемыми явлениями с лихвой компенсирует их малое количество. Таблица 4.1. Основные параметры электронно-оптического преобразователя PV201 Временное разрешение, пкс Область спектральной чувствительности, мкм Рабочий размер фотокатода, мм Полуширина аппаратной функции р, мкм Коэффициент усиления 10 0,4-0,8 20 х 15 <50 104 В качестве примера на рис. 4.13 показано устройство времяанали- зирующего электронно-оптического преобразователя PV201. Нетрудно заметить, что конструкция этого прибора, который, само собой разумеется, содержит отклоняющие пластины, в общих чертах весьма схожа с подробно обсужденным нами ранее усилителем света (см. рис. 4.10). Основные параметры прибора PV201 приведены в табл. 4.1. Здесь следует отметить, что этот прибор не обладает предельным временным разрешением. Сегодня близкое к предельному временное разрешение достигнуто в электронно-оптической камере К005, в которой используется электронно-оптический преобразователь PV-001. При подаче на фотокатод импульса напряжения, увеличивающего поле у его поверхности4) до 24 кВ/см, временное разрешение электронно-оптической камеры К005 приближается к 0,3 пкс. Стационарно создать такую напряженность поля у поверхности фотокатода не представляется возможным. Поэтому напряжение, увеличивающее напряженность поля до 24 кВ/см прикладывается в коротком импульсе, длительность которого короче, чем время развития пробоя. Внешний вид камеры К005 представлен на рис. 4.14. Эта универсальная камера дает возможность работать как в режиме фоторегистрации, так и в многокадровом режиме со скоростью съемки до 108 кадров в секунду. Использование в этой камере электронно-оптических преобразователей с различными фотокатодами позволяет пере- 4) Как будет показано ниже, именно напряженность электрического поля у поверхности фотокатода определяет временное разрешение электронно-оптического преобразователя.
4.2. Электронно-оптические преобразователи и камеры —11- 119 крыть диапазон длин волн от 0,25 до 1,5 мкм. Камера снабжена усилителем света (апертура 40 х 40 мм2) с микроканальной платой, что особенно важно при исследовании неярких объектов. Считывание выходного изображения осуществляется с помощью ПЗС-камеры5), сопряженной с компьютером, что избавляет от применения фотопленки и, значит, существенно убыстряет обработку изображений. Рис. 4.14. Универсальная электронно-оптическая камера К005 2. Известно, что аппаратная функция электронно-оптических преобразователей при не слишком малой освещенности фотокатода6) с высокой точностью аппроксимируется гауссианой: g(x) = -^exp{-(ax)2}. (4.5) у/Я (Полуширина такой аппаратной функции р = 2\/ln2/a2.) Воспользовавшись соотношением (2.25), получим коэффициент передачи К(а>) = exp{-(w/2a)2} (4.6) и частотно-контрастную характеристику (ЧКХ) = txp{-(nv/a)2}7\ (4.7) 5) Устройство и принцип работы ПЗС-камер будут рассматриваться в §4.3. 6) При очень малой освещенности фотокатода аппаратная функция описывается соотношением (1.10) — р(х) = g(x) = - ехр{—р\х\}.
120 —I w- Глава 4. Фотографические методы исследования Теперь в соответствии с (2.57) можно вычислить коэффициент потери мощности (4.8) В двумерном случае, в отсутствие астигматизма в силу уравнения (2.67) g(r) = ^exp{-(ra)2}, (4.9) откуда коэффициент передачи Кг = (шх, а,) = ехр{-^^ }, (4.10) частотно-контрастная функция К2 = (ух,уу) = expj-^+^j (4.11) и коэффициент потери мощности |^£} (4.12) Как уже говорилось, основная компонента шума электронно-оптического преобразователя — это квантовый шум входного фотокатода. При средней освещенности фотокатода Е и его квантовой эффективности ц за время экспонирования т в среднем с элементарной площади фотокатода Д2 = ДхД;у8) будет эмитировано Ne = ЕтЬ}\х = £Д2р электронов. Поэтому, если отсчеты изображения производятся с шагом А, отношение сигнал/шум на входе в систему может быть записано как L = Ne/y/Ne = &у/Щ19). На выходе системы из-за конечной ширины аппаратной функции упадет контраст на высоких пространственных частотах. Поэтому отношение сигнал/шум, обозначаемое нами как Z,*, вычислим, воспользовавшись формулами (2.56) и (4.12): V = Д\/&к= Д\/^ехр(^1. (4.13) I 2a J 7) Нетрудно убедиться, что полуширины функций К(а)), K(v) и g(x) относятся как Д» = 2л/Зу = 81п2//Зх. Откуда fix « O,8825/0V. 8) Обычно, в двумерной ситуации Ах = Ду. В одномерной ситуации, как правило, Дл: ф Ду. 9) При более строгом рассмотрении, учитывающем целый ряд дополнительных факторов и прежде всего дисперсию коэффициента усиления, вместо квантового выхода используют так называемый «обобщенный квантовый выход» fiz = рщ, где ц — коэффициент порядка единицы.
4.2. Электронно-оптические преобразователи и камеры —11- 121 Шаг считывания Д с одной стороны ограничен условиями jeopeMbi Ко- тельникова Д < l/2vc, с другой — ошибкой восстановления б@/& > 1/L* = = 1/Д V &цКг, которая сложным образом зависит от Д, поскольку L*(A, f$). Поэтому разумно, осуществив подстановки v2 = 1/4Д2 и а2 = 41n2/j82, представить соотношение (4.13) в виде В результате плотность потока информации, передаваемой через электронно-оптический канал R = ^е„1оё2[д\/фехр{-^2(^)}] [бит/см2]. (4.15) (Напомним, что Qn = Qn(L*) -— медленно меняющаяся функция, зависящая от ансамблей сигналов и шумов). В данном случае Q обусловлена пуассоновским шумом и ансамблем Ет(х9у), характеризуемом плотностью вероятности р(Х) = 1/Дщх = const. Соответственно, в одномерной ситуации (4.16) Л= ifi»log2[v^/iAxAyexp|-^(^)2|] [бит/см]. (4.17) Воспользуемся полученными соотношениями для анализа реальной ситуации, возникающей при регистрации изображений. Пусть, как это чаще всего и бывает в действительности, нам известны полная энергия, приходящая за время экспонирования на фотокатод, и площадь последнего. Будем считать, что нами используется электронно-оптический преобразователь с предельным коэффициентом усиления, т.е. такой преобразователь, усиление которого достаточно, чтобы регистрировать на выходе единичные фотоэлектроны. Полуширина аппаратной функции подобных приборов р « 10~2 см и поэтому ясно, что отсчеты выходного изображения следует производить с шагом того же порядка, т.е. с шагом Д порядка 10~2 см. Однако при каких именно значениях Д//8 мы передадим и считаем с выходного экрана максимальное количество информации? Рассмотрим эту задачу, используя в качестве параметра отношение Д/£. Примем, что в районе максимума R* =/(Д) переменная Q(L*) не зависит от Д (в том, что это практически так, нетрудно будет убедиться несколько позже, сопоставив кривые рисунков 2.4 и 4.15). Из
122 —fly- Глава 4. Фотографические методы исследования условия экстремума функции (4.15), т. е. из условия R'(k) = 0, несложно получить оптимум для передачи изображения в виде Worn" у д2 , (4.18) откуда, например, следует, что при £//= 105 см~2 или, скажем, &ц= 106 см"2 первичных фотоэлектронов на квадратный сантиметр максимальное количество информации можно считать с выходного экрана электронно- оптического преобразователя в тех случаях, когда отношение Д/)8 будет выбрано равным соответственно 1,1 и 0,76. Для того, чтобы изучить поведение других параметров, характеризующих изображение, исследуем численно поведение Z*, R и $/R в зависимости от параметра Д/)8. Соответствующие их значения при изменении Д/jS в интервале от 0,4 до 10 для £//, равного 105, 106, 107 и 108 см~2 показаны на рис. 4.15. Приведенная на этом рисунке зависимость энергетической цены информации от (А//8) вычислена, исходя из средней энергии фотонов hv = 2 эВ и квантового выхода фотокатода \х — 0,3. Как видно из приводимых данных, даже при чрезвычайно малых освещен- ностях, но оптимальных значениях Д/)8 через подобный электронно- оптический канал можно передать порядка 1 Кбайт/см2, несмотря на то, что в среднем в одном отсчете выходного изображения содержится всего около 1 бита информации. При этом (также в среднем) на элемент изображения с площадью Д2 приходится меньше 102 первичных фотоэлектронов, отношение сигнал/шум на входе в канал находится в пределах 3-8, а на выходе — 2-4. Заметим также, что с ростом входного сигнала резко растет энергетическая цена информации, поскольку при увеличении входной освещенности на порядок содержащаяся в выходном изображении информация увеличивается в лучшем случае втрое. Интуитивно это понималось всегда — не даром же эвристическое пра- вило_рекомендует экспонировать фотоматериал всего лишь до почернения 2)« 1. Может вызвать недоумение тот факт, что при дальнейшем уменьшении Д после достижения максимума функции /?(Д/)3) скорость передачи по каналу катастрофически падает. Казалось бы, если Д это устанавливаемый нами шаг записи/считывания, то причем тут информационные характеристики канала передачи информации? Конечно дело здесь не в рукотворной величине Д. Дело в том, что вводя параметр А//3 мы приняли в соответствии с теоремой Котельникова, что Д = l/2vc. Поэтому, в сущности, параметр Д/jS характеризует не формальное отношение шага записи/считывания Д к полуширине аппаратной функции /5, а соотношение между шириной спектра передаваемого сигнала vc = 1/2Д и спектральной шириной канала передачи информации,
4.2. Электронно-оптические преобразователи и камеры 123 которая, как известно, пропорциональна 1/0. Как только мы пытаемся «пропихнуть» сквозь канал сигнал, спектр которого шире спектральной ширины канала, скорость передачи информации резко падает. Ry Кбайт/см 0,1 0,2 0,4 0,6 0,8 1 2 4 6 8 Д/0 Рис. 4.15. Плотность потока информации, передаваемой через электронно-оптический преобразователь, в зависимости от параметра А//3 Итак, нами получены соотношения, позволяющие учесть аппаратную функцию и вычислить плотность потока информации, передаваемой через реальный электронно-оптический канал с шумами в зависимости от входной освещенности и способа считывания выходного изображения. Это весьма полезные формулы, важные в практическом отношении, позволяющие для конкретных приложений находить оптимальные условия приема и регистрации оптических изображений и получать оценку точности восстановления входного изображения по выходному. Однако нам необходим еще и параметр, который давал бы возможность как однозначно характеризовать наши измерительно-регистрирующие системы, так и сравнивать их между собой. Для того, чтобы сделать этот последний шаг, вернемся к рис. 4.15 и обратим внимание на два следующих обстоятельства. При увеличении входного сигнала, во-первых, и это есте-
124—11- Глава 4. Фотографические методы исследования ственно, растет плотность потока передаваемой информации и, во-вторых, значение (A/)3)opt —► 0,5. Это значит, что, если заданы (т. е. известны) коэффициент передачи К(а)) и действующие в системе шумы, характеризуемые энтропийной мощностью а2, или дисперсией а2 при нормальном распределении, наибольшая плотность передаваемой информации, т. е. пропускная способность канала определяется предельно-допустимой входной освещенностью Дпах- Учитывая, что при высокой входной освещенности (A/j8)opt « 0,5, получим исходя из формулы (4.15) пропускную способность электронно-оптического преобразователя С= ^Ч^ Это, в сущности, и есть параметр, который совместно с энергетической ценой информации с предельной полнотой характеризует оптическую измерительно-регистрирующую систему, пропускная способность которой определяется электронно-оптическим преобразователем. Отношение сигнал/шум Етах/2а в электронно-оптических преобразователях с микроканальными пластинами обычно меньше, чем 102. Однако в приборах без микроканальных пластин Етах/2а может достигать величины 103. Полуширина аппаратной функции таких приборов примерно равна 50 мкм. Нетрудно подсчитать, что пропускная способность такого электронно- оптического преобразователя составит 106 бит/см2 = 1,25 • 105 байт/см2. Правда в этом случае Е поднимется до ~ 0,2 эрг/см2 (практически как у фотопленки), соответственно и энергетическая цена информации возрастет до rsj 2 • 10~7 эрг/бит. Вряд ли стоит эксплуатировать электронно- оптические преобразователи в таких режимах, т. е. в режимах реализующих их пропускную способность, однако при сравнении различных приборов между собой этот параметр незаменим, хотя бы потому, что другого комплексного параметра характеризующего сравниваемые приборы попросту нет. 3. Под временным разрешением электронно-оптического преобразователя обычно понимают то максимальное временное разрешение, которое может быть достигнуто в режиме фоторегистрации. Временное разрешение электронно-оптического преобразователя определяется двумя факторами. Во-первых, пространственной разрешающей способностью, т.е. в прежде всего величиной полуширины аппаратной функции 0С, которая определяет позиционную точность, а значит и точность отсчета времени на экране прибора. Во-вторых, величиной fit, связанной с рас- плыванием электронного пакета во время его пролета от фотокатода до экрана. Дело в том, что электроны, покинувшие одну и ту же точку фотокатода в один и тот же момент времени, долетят до экрана не одновре-
4.3. Приборы с зарядовой связью, КМОП-структуры, ПЗС- и КМОП-камеры —11- 125 менно, что обусловлено разбросом их начальных скоростей. Напомним, что, например, при облучением многощелочного фотокатода квантами света видимого диапазона максимум плотности вероятности распределения электронов по энергиям лежит в области £0 « 0,5 эВ. Напомним также, что, поскольку это пуассоновское распределение, дисперсия будет того же порядка. Обратим внимание еще на одно обстоятельство. Если позиционная точность, даже при не очень малом )8С, может быть улучшена простым увеличением скорости развертки электронного луча по экрану, то с ($t, т.е. фактически с разбросом начальных скоростей электронов, мы не в силах что либо сделать. Оценим временное разрешение электронно-оптического преобразователя At « fit приняв, что Рс <^ fit- Итак, одно и то же расстояние S от фотокатода до экрана электроны, покинувшие одну и ту же точку фотокатода в один и тот же момент времени, пролетят за разное время, обусловленное разбросом начальных скоростей voi = vo + av и V02 = vo — av, где а\ — дисперсия скорости. Пусть At = ti — t\ = 2at, поскольку, t\ = t — at, a h = 14- at, где a\ — дисперсия времени пролета. Тогда S\ = [eE/(2m)]tf + voifi и 5г = [еЕ/(2т)]% + vO2/2- Приравняв правые части этих равенств (так как S{ = 52 = S — это одно и то же расстояние от фотокатода до экрана получим [еЕ/(2т)]($ — t\) = voi/i — vo2*2- Приняв во внимание, что с хорошей точностью t\ « /2 « t и, как мы условились Д/ = fc — *ь найдем, что (eE/m)tAt = vo\t\ - V02U = Voift - V02U - vo2t\ + vO2^i = Avt - Vo2&t. Из двух слагаемых правой части Avt > vo2At, поскольку Av порядка V02, a t ^> At, в силу чего окончательно имеем А, mAv 10"и /л^п\ А'=-^*а—' (420) если Е — в единицах CGSM. Эта формула известна, как формула Л. А. Ар- цимовича. Коэффициент а « 1—5; его конкретная величина определяется, как это понятно, типом фотокатода и энергией облучающих его квантов. Положив а = 3 и Е = 30 кВ/см найдем, что Д* = 3 • 10~13 с. Видимо это наилучшее временное разрешение, которое может быть технически реализовано в такого рода приборах. 4.3. ПРИБОРЫ С ЗАРЯДОВОЙ СВЯЗЬЮ (ПЗС), КМОП-СТРУКТУРЫ10), ПЗС- И КМОП-КАМЕРЫ Попытки избавиться от фотопленки, используемой в научных исследованиях не только в качестве детектора, но и как долговременное запоминающее устройство для хранения оптической инфор- 10) КМОП — комплементарный меташю-оксидный полупроводник.
126 —J\- Глава 4. Фотографические методы исследования мации предпринимались неоднократно. В том числе последняя, сравнительно недавняя, массированная атака на фотопленку, связанная с попыткой ее замены на передающую телевизионную камеру, записывающую изображение на магнитную пленку, успеха не имела. Недостаточная точность, значительные нелинейные искажения, трудности с позиционированием, т. е. с привязкой изображения целиком или его фрагментов к лабораторной системе координат, необходимость трансформирования запомненного в аналоговой форме изображения в цифровую форму, технические трудности, обусловленные чересстрочным кодированием — все это резко снижало качество экспериментальных данных и требовало отнюдь не меньших усилий при их обработке, чем при обработке изображений, запомненных на фотопленке. Другими словами — головная боль осталась, а качество было потеряно. Прорыв здесь произошел после предложения В. Бойля и Дж. Смита использовать для регистрации изображений твердотельные полупроводниковые приборы и разработанной ими концепции приборов с переносом заряда, так называемых ПЗС — «приборов с зарядовой связью» (Charge Coupled Device — CCD). Принцип действия ПЗС состоит в накоплении зарядов в конденсаторах со структурой «метал—окисел—полупроводник» (МОП-структура) и передаче накопленных зарядов к устройству, измеряющему величину каждого из них. Передача накопленных зарядов осуществляется по цепочке таких же МОП-конденсаторов под действием специальных электрических управляющих импульсов. Сотни тысяч таких конденсаторов методами стандартной микроэлектронной технологии формируются на единой полупроводниковой подложке, образуя ортогональную структуру, называемую ПЗС-матрицей. При этом на полупроводниковой подложке (например, /ьтипа проводимости) формируется тонкий (0,1—0,15 мкм) слой диэлектрика (обычно окисла), на который наносятся проводящие электроды из металла или из поликристаллического кремния. Если к какому-либо из электродов приложить положительное напряжение, то в МОП-структуре возникает электрическое поле, под действием которого основные носители (дырки) уходят от поверхности полупроводника, так что у поверхности образуется потенциальная яма для электронов. Ортогональная структура ПЗС-матрицы, как правило, содержит от ~ 105 (256 х 512) до ~ 2 • 106 (1024 х 2048) ячеек (пикселей). Размер каждой ячейки в различных ПЗС-матрицах колеблется в пределах от 5 до 15 мкм, расстояние между ними составляет 0,1—1,0 мкм, так что полный размер матрицы обычно не превосходит 1 см. Каждая ячейка состоит из нескольких МОП-структур, служащих для детектирования (накопления заряда за счет фотоэффекта), хранения накопленного заряда и его дальнейшей транспортировки. До определенных пределов, как принято говорить в линейной области, величина заряда, накоплен-
4.3. Приборы с зарядовой связью, КМОП-структуры, ПЗС- и КМОП-камеры 127 ного в каждой ячейке пропорциональна экспозиции, т. е. числу фотонов, попавших на ее светочувствительный элемент за время экспонирования. Таким образом распределение зарядов, накопленных в ячейках ПЗС- матрицы, пропорционально распределению освещенности спроецированного изображения, так что, измеряя накопленный в каждой из ячеек заряд, мы получаем двумерный числовой массив, определяющий измеряемое распределение освещенности Е{х,у). Для понимания принципа работы ПЗС-матрицы вначале рассмотрим основные свойства МОП-конденсатора. На рис. 4.16 изображена МОП- емкость, сформированная на полупроводнике /ьтипа (р-тип рассматривается как пример, все рассуждения применимы и к полупроводнику л-тапа с соответствующими изменениями знаков). Состоит МОП-емкость из электрода 4, который может быть изготовлен из металла или сильно легированного поликремния, диэлектрика 3 и полупроводниковой подложки /. Для того, чтобы в дальнейшем, при транспортировке заряды перемещались по определенному направлению, т. е. вдоль регистра, с обеих сторон канала переноса создают стоп- каналы 2 — области, легированные более сильно, чем кремний в самом канале переноса. Потенциальная яма в стоп-канале не возникает, и пакет зарядов не расплывается. Сразу же после приложения напряжения основные носители очень быстро (за единицы пи- косекунд) уходят от элеюрода, образу- **• 4Л6' МОП-конденсатор ется у его поверхности приповерхностный обедненный слой и потенциальную яму 5. Заметим, что ПЗС функционируют используя нестационарное состояние МОП-структуры. Однако, так как скорость термогенерации носителей мала, потенциальную яму МОП-структуры можно использовать для накопления и временного хранения сигнальных зарядовых пакетов. Вследствие процессов термогенерации к хранящемуся в потенциальной яме сигнальному (информационному) заряду добавляется паразитный термогенерируемый заряд. Этот заряд в основном обусловлен термогенерацией электронно-дырочных пар на поверхности и в обедненном слое и, в значительно меньшей степени, диффузией неосновных носителей из нейтральных областей, примыкающих к обедненному слою. Естественно, что накапливаемый паразитный заряд искажает заряд сигнальный. Максимальное время накопления и хранения зарядов диктуется допустимой степенью ошибки измерения и определяется свойствами полупроводника, но, прежде всего, температурой ПЗС. Поэтому ПЗС высокого качества охлаждаются, чаще всего, с помощью
128 Глава 4. Фотографические методы исследования встроенных полупроводниковых холодильников, хотя в прецизионных приборах используется иногда и жидкий азот. Тем не менее ПЗС-струк- тура — это временное хранилище, в котором при длительном хранении продукция портятся. Поэтому сразу после накопления информационных зарядов их следует считать и измерить, а полученные данные поместить в надежное долговременное хранилище. Фаза 3 Фаза 3 Фаза Фаза 1 \ Фаза 2 ФазаЗ / / \ / ^0 ^1 ^2 '3 t Рис. 4.17. Перенос информационного заряда в сдвиговом регистре Рассмотрим процесс переноса информационного заряда по цепочке МОП-конденсаторов на примере сдвигового регистра. Его структура изображена на рис. 4.17, причем каждый элемент этой структуры образован тремя МОП-конденсаторами. Одноименные электроды всех эле-
4.3. Приборы с зарядовой связью, КМОП-структуры, ПЗС- и КМ ОП-камеры —fly. 129 ментов электрически соединены шинами, образуя фазовые электродные системы (упрощенно — фазы). В данном примере фаз три и сдвиговый регистр называют трехфазным. В общем случае число фаз может составлять 1, 2, 3 и более. Пусть в такой трехфазной системе в момент времени /о высокий уровень смещения подан на вторую фазу, а на первой и третьей фазах уровень смешения низкий (рис. 4.17, я). После того, как под электродами второй фазы накопятся зарядовые пакеты, в момент времени t\, высокий уровень смещения на ней переключают на низкий и одновременно высокий уровень смещения подается на одну из соседних фаз, например на третью, расположенную справа. В результате заряды начнут перетекать в пустые ямы справа (рис. 4.17,6). Налево они двигаться не могут, так как на электродах первой фазы смещение оставлено на низком уровне. На рисунке видно, что перенос зарядовых пакетов вправо происходит одновременно во всех элементах сдвигового регистра. Далее высокий уровень смещения с третьей фазы переключается на первую фазу, и все заряды одновременно перенесутся еще на один шаг вправо (рис. 4.17, г), затем высокий уровень смещения переключается с первой фазы на вторую и т. д. При считывании информации с ПЗС-матрицы все ее строки подобным образом сначала одновременно перемещаются вниз, так что нижняя строка оказывается в сдвиговом регистре. Затем информационные заряды перемещаются вдоль структуры сдвигового регистра, измеряются на его выходе и направляются в запоминающее устройство ПЗС-камеры или непосредственно в запоминающее устройство, связанного с ней компьютера. Этим завершается считывание нижней строки, после чего описанная операция многократно повторяется до тех пор, пока все строки не будут считаны и числовой массив, отражающий распределение освещенности на поверхности ПЗС-матрицы, не будет занесен в запоминающее устройство компьютера. Если ПЗС осветить, то поглощаемые в полупроводнике фотоны вызывают генерацию электронно-дырочных пар. В обедненном слое под действием электрического поля эти пары разделяются: электроны локализуются в потенциальных ямах, а дырки выносятся в нейтральную область полупроводника. Величина зарядового пакета, накапливаемого в каждом элементе, как мы уже говорили, пропорциональна усредненному по площади фоточувствительного элемента потоку фотонов, времени накопления и квантовой эффективности, которая, как мы увидим, весьма велика. Как и другие полупроводниковые фотодетекторы, ПЗС имеют определенную область спектральной чувствительности, т. е. область длин волн, в которой осуществляется эффективное преобразование светового потока в зарядовые пакеты. Длинноволновая ее граница определяется шири-
130 Глава 4. Фотографические методы исследования ной запрещенной зоны полупроводника и для кремния составляет 1,1 мкм. Коротковолновая граница равна 0,32—0,4 мкм и обусловлена сильным поглощением коротковолновых квантов в приповерхностном слое, в котором одновременно с фотогенерацией носителей интенсивно происходит их рекомбинация. Спектральная чувствительность (квантовая эффективность) ПЗС представлена на рис. 4.18. Заметим, что у новейшего поколения ПЗС, у которых изображение проецируется на заднюю, обратную фронтальной стороне матрицы сторону, квантовая эффективность достигает в максимуме 85%. Такая высокая квантовая эффективность ПЗС по сравнению с фотокатодами электронно-оптических преобразователей обусловлена, прежде всего тем, что здесь все рожденные электроны захватываются в потенциальную яму, в то время как из-за изотропии скоростей рожденных в фотокатоде электронов половина их общего количества движутся в сторону обратную от эмитирующей поверхности. У у/ / / / / . * /4 / ,•*■ ч' ч *^ «с* ^^ ••• -• \ • ■■• \ • \ Ч \ \ ч Й 340 420 500 580 660 740 820 900 980 Длина волны, нм Рис. 4.18. Спектральная чувствительность (квантовая эффективность) ПЗС ( Sony; Kodak Blue Plus; освещение с задней стороны ПЗС-матрицы; — освещение с фронтальной стороны ПЗС-матрицы) Полуширина аппаратной функции ПЗС-матрицы всегда больше расстояния между соседними ячейками. Это связано с рассеянием света в полупроводниковой основе матрицы, характер которого зависит от длины волны рассеиваемого света. В силу этого не только полуширина, но и собственно аппаратная функция g(x), равно как и коэффициент передачи К((о) и частотно-контрастная функция К(у) оказывается разными для различных диапазонов длин волн. К счастью, в видимом диапазоне длин волн, за исключением красного его крыла, характер рассеяния меняется слабо. На рис. 4.19 представлена частотно-контрастная функция ПЗС-камеры ST-7E, выпускаемой фирмой Santa Barbara Instrument Group. ПЗС-матрица этого прибора (Kodak KAF-1600+TI ТС-211) снаб-
4.3. Приборы с зарядовой связью, КМОП-структуры, ПЗС- и КМОП-камеры 131 жена Пелтье-холодильником позволяющим работать при температурах вплоть до — 50 °С. Она содержит 1530 х 1020 ячеек при расстоянии между ними 9 мкм, так что полный размер матрицы составляет 1,38 х 0,92 см2. Как видно из рисунка, частотно-контрастная функция этой матрицы хорошо аппроксимируется гауссианой, откуда следует, что и аппаратная функция g(x) также гауссиана. Поэтому все те соотношения, которые мы получили, рассматривая проблемы, связанные с электронно-оптическими преобразователями, в частности соотношения начиная с формулы (4.5) вплоть до равенства (4.19) могут быть использованы и здесь. Не замедлим этим воспользоваться. 1 0,9 0,8 0,7 ^0,6 S< 0,5 0,4 0,3 0,2 0,1 Я = 530 мкм К( ч N. > А-С- rv\ 1 а / j = 125 мм о 10 20 30 40 V, ММ"1 50 vc 60 Рис. 4.19. Частотно-контрастная функция K(v) ПЗС-матрицы. Точки на графике — экспериментальные данные Прежде всего используя данные рис. 4.19 найдем с помощью формул, приведенных в примечании на с. 120, что полуширина аппаратной функции g(x) - ft = 13,35 мкм « 1,5 пикселя. Что это означает, 1,5 пикселя — это много или мало? Это означает, что осветив всего одну ячейку, за счет рассеяния света в полупроводниковой основе матрицы мы накопим во всех соседних неосвещенных ячейках заряд, всего лишь примерно в четыре раза меньший чем в ячейке освещенной. Понятно, что этот паразитный заряд уменьшит контраст запомненного изображения, т. е. приведет к потере информации, передаваемой на высоких пространственных частотах. Справедливости ради отметим, что уже через одну ячейку от освещенной рассеянный свет составит всего ~ 0,5%. Шкала измерения освещенности ПЗС-камеры ST-7E в линейной ее части содержит 5^ = 4 • 104 отсчетов. Это значит, что S = fc//ATPh вплоть до Ящах. Здесь \х — квантовый выход, JVph — число фотонов, попавших на фоточувствительную область ячейки за время экспонирования, а Л: — величина обратная цене одного отсчета шкалы освещенности в электронах. (Другими словами, к~{ — это количество электронов, необходимое
132 \ Глава 4. Фотографические методы исследования для изменения величины S на единицу.) Как правило, изготовители такого рода приборов — и изготовители ПЗС-камеры ST-7E здесь не исключение — приводят величину среднеквадратичной ошибки измерения информационного заряда. К сожалению, эта величина нам мало что дает, поскольку ошибка в определении освещенности обусловлена, прежде всего, флуктуацией накопленных электронов, т. е. флуктуацией величины iVph, а вовсе не флуктуацией величины к. Поэтому относительную ошибку измерения освещенности (которая, кстати, не число, а функция iiNpb) или обратную зависимость, т. е. отношение сигнал/шум приходится определять экспериментально. (Напомним, что методика таких измерений подробно обсуждалась нами в § 2.7.) Экспериментально измеренные значения отношений сигнал/шум, полученные при испытании ПЗС-камеры ST-7E, приведены на рис. 4.20. Как и следовало ожидать, отношение сигнал/шум L = S/(2a) пропорционально уДхЩь- Не вызывает удивления и тот факт, что даже при 104 отсчетов по шкале прибора максимальная точность измерения освещенности не дотягивает до 1 %. Максимальная в том смысле, что оценка точности 2а/S правомерна лишь в том случае, когда во всей области пространственных частот изображения К(у) « 1. В противном случае при вычислении ошибки измерения или отношения сигнал/шум следует учитывать потерю контрастности на высоких пространственных частотах, т. е. использовать вместо L величину L* = LK. В нашем случае, как это следует из соотношения (4.12), коэффициент потери мощности К= exp{-rc2v2jS2/81n2}, и таким образом Z,* = ПК= £ехр{-л2у202/81п2}. Отсюда следует, что ошибка измерения растет, а отношения сигнал/шум падает с увеличением v, причем начиная с некоторого значения v очень резко. 100000 Рис. 4.20. Отношение сигнал/шум ПЗС-матрицы Оценим масштаб бедствия. Если Д расстояние между ячейками матрицы, то в соответствии с теоремой Котельникова максимальная пространственная частота, которая еще может присутствовать в изображении, запомненном ПЗС-матрицей, vmax = 1/2Д. Понимая последствия,
4.3. Приборы с зарядовой связью, КМОП-структуры, ПЗС- и КМОП-камеры —'ь- 133 не будем доводить дело до крайности и уменьшим допускаемую пространственную частоту записываемого изображения vc, скажем в полтора раза, с тем чтобы vc = vmax/l,5. В этом случае — нетрудно подсчитать — коэффициент потери мощности К = 0,65, а это значит, что усредненная по полю изображения ошибка измерения распределения освещенности возрастет больше, чем в полтора раза. В конкретном случае обсуждаемой ПЗС-камеры, при 104 отсчетов по шкале прибора ошибка измерения освещенности составит уже не 1,2%, а 1,85%. Наконец, воспользовавшись значением 5^/(2^) = 166 (рис. 4.20), и учитывая что шаг считывания А равен расстоянию между соседними ячейками вычислим ту максимальную плотность информации, которую можно в этом случае записать, а значит и считать с одного квадратного сантиметра матрицы ПЗС-камеры ST-7E (-^Л Qnlog2fed = 3,1 • 106 бит/см2 = 389 Кбайт/см2. Н\(Л Qnlog2fe Д \Vmax/ \_2О Здесь А = 9 мкм, (vc/vmax)2 — коэффициент, учитывающий реальную ширину полосы частот, содержащихся в записываемом изображении, Q = 0,84 (см. рис. 2.4) и L* = 107,4 — так что с учетом значения Q в среднем один пиксель содержит всего 5,67 бита, несмотря на то, что усредненное по изображению число отсчетов по шкале прибора S = 2 • 104. При такой плотности записи на всей матрице, размеры которой несколько больше, чем один квадратный сантиметр (1,38 • 0,92 = 1,27 см2), можно записать максимально ~ 0,5 Мбайт. Это прекрасный результат. Однако в реальной практике, как правило, записывают изображения, у которых vc существенно меньше, чем vmax = 1/2А. Поэтому реальные записи обычно содержат гораздо меньше информации. Здесь уместно предостеречь от попыток использовать простую и ясную формулу Н = fclog2 L для оценки информационного содержания записанного изображения. Действительно, если не вдаваться в разные «сложности» типа рассеяния света в полупроводниковой основе ПЗС- матрицы, флуктуации фотоэлектронов от ячейки к ячейке и прочее, а просто положить к — это число ячеек, a L найти по формуле L = Smax/(2a)9 используя данные завода-изготовителя о среднеквадратичной ошибке измерения информационных зарядов, то нетрудно найти, что значение И = 2,025 Мбайт. Этот результат, конечно, греет сердце, но, к сожалению, не имеет никакого отношения к реальности. Паразитное рассеяние в полупроводниковой основе ПЗС-матрицы особенно ощутимо в инфракрасном диапазоне длин волн. Заметим, что и характер рассеяния здесь иной, чем в видимом диапазоне. В этом нетрудно убедиться сравнив две частотно-контрастные функции K(v) представленные на рисунках 4.19 и 4.21. Как видно из рис. 4.21 значения K(v) в
134 Глава 4. Фотографические методы исследования инфракрасном диапазоне просто обратно пропорциональны v. В такой ситуации аппаратная функция g(x) = F sin nFx (4.21) (nFx)2 ' где F находится из условия K(F) = 0. Понятно, что это точка пересечения прямой K(v) с осью абсцисс. Полуширина такой функции /5 = = 1/(1,13/) « 1/F, откуда в частности следует, что в инфракрасном диапазоне длин эолн полуширина аппаратной функции ПЗС-камеры ST-7E составит ~ 20 мкм, что примерно в два раза больше, чем расстояние между соседними ячейками ПЗС-матрицы и почти в полтора раза больше, чем в видимом диапазоне длин волн. Коэффициент потери мощности в инфракрасном диапазоне длин волн ~F/VC\ (4.22) т. е. теперь уже К = 0,56, если принять, как и прежде, что допускаемая при записи высшая пространственная частота изображения в полтора раза меньше, чем vmax = 1/2А. А = 1,06 мкм K(v) 0,8 0,6 0,4 0,2 0 10 20 _ 30 40 V, ММ"1 Рис. 4.21. Частотно-контрастная функция K(v) ПЗС-матрицы. Точки на графике — экспериментальные данные Следующим шагом в разработке твердотельных полупроводниковых приборов для регистрации оптических изображений было создание и внедрение в промышленное производство так называемых КМОП-структур (Complementary Metal Oxide Semiconductor — CMOS). КМОП-матрицы также как и ПЗС-матрицы содержат сотни тысяч ячеек (пикселей), также образуя ортогональную структуру. Однако в отличие от последних все ячейки КМОП-матрицы объединены системой ортогональных шин, что дает возможность произвольной выборки и считывания информационных зарядов. И если в ПЗС-матрицах осуществляется последовательный вывод информации, при котором информация может быть считана только целиком, т. е. только со всей матрицы, то в КМОП-структурах реализуется возможность считывания любого числа ячеек в любом, наперед
4.3. Приборы с зарядовой связью, КМОП-структуры, ПЗС- и КМОП-камеры 135 заданном участке матрицы, в том числе в параллельном режиме. Такая возможность важна в целом ряде применений, например, в оптических системах наведения или устройствах ориентации космических аппаратов, где удобнее иметь датчики с произвольным опросом. Это первое, принципиальное различие ПЗС и КМОП. Таблица 4 Характеристика Сигнал ячейки (пикселя) Выход матрицы (сигнал) Фактор заполнения Шум Динамический диапазон Равномерность чувствительности Сложность датчика Сложность системы считывания Скорость считывания Кадрирование Стоимость разработки .2. Сравнение ПЗС и КМОП ПЗС Информационный заряд Аналоговый Высокий Низкий Высокий Высокая Низкая Высокая Низкая Ограничено Низкая КМОП Напряжение Цифровой Средний Средний Средний От низкой до средней Высокая Низкая Высокая Не ограничено Высокая Второе различие — наличие в каждом пикселе КМОП помимо фоточувствительного элемента (фотодетектора) транзисторной схемы усиления сигнала, а в последних разработках и АЦП, при помощи которых усиленный и обработанный сигнал каждой ячейки поступает на выход прибора в цифровой форме. Поскольку в этих, так называемых активных ячейках (Active Pixel Sensors — APS) преобразование информационного заряда в напряжение производится внутри каждого пикселя и появляется возможность считывать информацию о состоянии каждого пикселя отдельно, задавая адрес его строки и столбца в двумерном массиве элементов. К тому же APS-архитектура обеспечивает очень малое энергопотребление — почти в 100 раз меньше, чем устройства на ПЗС матрицах, что особенно важно в устройствах с автономным питанием — ноутбуках, сотовых телефонах, цифровых фотоаппаратах и пр. Понятно, что все это не задаром. Так если в ПЗС-матрицах размер ячейки колеблется в пределах от 5 до 15 мкм, то в КМОП-матрицах он составляет 15—20 мкм, соответственно, размер матрицы существенно больше, они сложнее по своему устройству. Мало того, отношение площади фотодетектора к полной площади ячейки (фактор заполнения) невелико. Впрочем, с этой бедой ряд изготовителей справляются, используя микролинзовую матрицу, чтобы весь свет, падающий на ячейку сфокусировать на фотодетектор. С
136 Глава 4. Фотографические методы исследования другой стороны КМОП-матрицы изготовляются по стандартной, хорошо отработанной технологии и потому много дешевле ПЗС-матриц. Немаловажна и другая их особенность — гибель одной или даже нескольких ячеек мало что значат (действительно, это всего лишь потеря нескольких отсчетов на миллион элементов изображения!). В ПЗС-матрицах одна испорченная ячейка может привести к тому, что матрицу будет невозможно считать. Сравнение ПЗС и КМОП приводится в табл. 4.2. Как видно из таблицы, ПЗС обладают большим динамическим диапазоном и лучшим отношением сигнал/шум, в силу чего они предпочтительнее в научных исследованиях. В то же время высокая скорость считывания КМОП позволяет использовать их в высокоскоростных цифровых кадровых камерах. Так недавно выпущенная камера Phantom VI2 (рис. 4.22) обеспечивает съемку с частотой до 106 кадров/секунду с минимальными экспозициями в 300 пс. Рис. 4.22. Цифровая камера Phantom VI2 фирмы Vision Research на основе КМОП, обеспечивающая съемку с частотой до 106 кадров/с 4.4. ФОТОСЛОЙ При всех достоинствах ПЗС-камер, успешно вытесняющих из эксперимента фотопленку, последняя, несмотря на явное недовольство экспериментаторов, еще долгие годы будет в употреблении, а в ряде применений — таких, например, как голография — и вдали не маячит ей замена. В экспериментальной физике фотослой используется в оптических приборах и как детектор, и как долговременное запоминающее устройство. Принципиальное устройство современной фотопленки показано на рис. 4.23. Независимо от сорта и назначения светочувствительные Рис. 4.23. Фотопленка материалы имеют один или несколько эмульсионных слоев, а также промежуточные и защитные желатиновые слои. Общая толщина эмульсионных слоев обычно составляет 10—25 мкм. Основа (или подложка) фотоматериала 2 — это, как правило, стеклянная пластинка или синтетическая пленка. Для того, чтобы обеспечить прочное сцепление эмульсионного слоя с поверхностью подложки, она предварительно покрывают-
4.4. Фотослой 137 ся тонким желатиновым подслоем 3. Для предотвращения образования ореолов при съемке объектов с ярко светящимися деталями на обратную сторону основы пленки наносится поглощающий лаковый или желатиновый противоореольный слой L В негативных сортах черно-белых фото- и кинопленок эта цель достигается введением нейтрально-серого красителя непосредственно в основу пленки. (Иногда противоореольный слой наносится на стеклянные пластинки или основу пленки в виде подслоя.) Для достижения необходимых фотографических свойств почти все сорта негативных черно-белых пленок имеют не один, а два эмульсионных слоя: нижний 4 является мене светочувствительным, а верхний 5 — более светочувствительным. Чтобы предохранить верхний слой фотоэмульсии от механических повреждений на него наносится тонкий защитный слой желатины 6. Фотографические эмульсии содержат преимущественно бромистое серебро с небольшой примесью йодистого серебра. В них может содержаться также хлористое серебро и соли серебра некоторых органических кислот. Все эмульсионные галогенидосеребряные зерна имеют кристаллическое строение. По своей внешней форме эмульсионные зерна могут быть разными. В большинстве случаев они представляют собой многоугольные пластинки, толщина которых примерно в 10—15 раз меньше любого из двух остальных размеров; реже — кристаллы, более или менее равномерно развитые по всем трем направлениям. Размер эмульсионных зерен колеблется в пределах от 0,1—0,2 до 4—5 мкм. Относительное распределение эмульсионных зерен по величине зависит от метода синтеза и определяет фотографические свойства эмульсии. Эмульсионные зерна располагаются в фотографических слоях многоярусно. Несмотря на малую толщину фотоэмульсии, она может содержать 40—50 и более элементарных кристаллических слоев. Эмульсионные зерна пластинчатой формы большей своей поверхностью располагаются параллельно поверхности фотографического слоя. В табл. 4.3 приводятся данные, показывающие различие в зернистости некоторых высокочувствительных, среднее и малочувствительных фотографических слоев (слева направо). Таблица 4.3. Характеристики фотографических слоев Число эмульсионных зерен на 1 см2 слоя Средний радиус зерен, мкм Среднее расстояние между зернами, мкм 3,5 • 108 0,65 2,1 1,0 109 0,36 0,35 1,6 • 1010 0,15 0,56 Фотографические свойства фотографических слоев определяются их сенситометрическими и структурными свойствами. Рассмотрим их по порядку, предварив это рассмотрение пояснением ключевого термина «почернение». Так называемое почернение фотослоя (Z>), зависящие от раз-
138 Глава 4. Фотографические методы исследования меров и плотности восстановленных при проявлении зерен серебра, вводится по определению как где /о — интенсивность светового потока, падающего на проявленный фотослой, а / — интенсивность, пошедшего сквозь проявленный фотослой света. Понятно, что количество проявленных зерен серебра зависит от числа фотонов попавших на еще не проявленный фотослой при фотографировании. Плотность энергии попавшей на фотослой при фотографировании £ = EAt принято называть экспозицией, (Здесь Е — освещенность, a Af — время экспонирования.) Зависимость почернения от логарифма экспозиции носит название характеристической кривой. Типичная характеристическая кривая показана на рис. 4.24. Следует обратить внимание на четыре характерные области этой кривой. Область 1 — это область недодержек, 2 — область нормальных экспозиций, 3 — область передержек и, наконец, 4 — область так называемой соляризации. В этой области при дальнейшем увеличении экспозиции почернение уменьшается, а не увеличивается. Заметим также, что почернение начинает увеличиваться лишь после некоторого ненулевого значения экспозиции (точка а на рисунке). До той поры /) = Dq, где А) — почернение проявленного, но не экспонирован- Do- Рис. 4.24. Характеристическая кривая фотослоя ного фотослоя, величина почернения так называемой «вуали». Область 2, т.е. область нормальных экспозиций, называется также «линейным (в логарифмическом масштабе!) участком характеристической кривой». Интервал [lg^i,lgft] носит название «фотографической широты», a /y(log£) = tga = 7 (рис.4.24) — «коэффициента контрастности». При относительных измерениях не требуется какая-либо предварительная градуировка фотопленки, если вы работаете в «линейным участке характеристической кривой»П). Действительно, если вас интересует лишь отношение исходных интенсивностей, пришедших, скажем, в две точки изображения jci,j>i и х^уг при фотографировании, (например, отношение интенсивностей двух спектральных линий), то это отноше- П) Как это видно из рис. 4.24, в линейном участке характеристической кривой
4.4. Фотослой -J\- 139 \ ние легко находится поскольку у lg(/i//2> = ylg^i/ft) = А ~ А> где Д и />2 — почернения фотопленки соответственно в точках изображения х\,у\ ИХ2,У2- К сожалению, совсем не такова ситуация при абсолютных измерениях. Дело в том, что приводимые в справочной литературе ха^ рактеристические кривые есть результат испытаний «свежих», т. е. только что изготовленных фотослоев, проявленных в определенном, строго нормированном, «свежем» проявителе, при строго заданных температуре проявителя и времени проявления. Условия и время хранения фотопленки со времени ее изготовления до момента ее использования кардинальным образом изменяют все ее параметры. Мало того — точно выполнить все условия проявления очень сложно (так, например, изменение температуры проявителя за время проявления всего на 1—2°С весьма заметно изменяет вид характеристической кривой). Подчас не совпадают характеристические кривые двух кусков фотопленки из одного рулона, проявленные в один и тот же день и в одном и том же проявителе. Поэтому единственный путь при абсолютных измерениях — это использовать эталонный источник света и впечатать так называемые «марки почернения» на тот же кусок пленки, который в дальнейшем будет использован в эксперименте. Чтобы впечатать марки почернения нужно между эталонным источником света и пленкой поместить градуированный многоступенчатый ослабитель и спроецировать его выходной торец на поверхность фотопленки. При этом следует учесть как потери света в проецирующей оптике, так и неравномерность освещенности по полю зрения. Итак необходимо: применяя эталонный источник света и многоступенчатый ослабитель впечатать марки почернения; использовать в эксперименте тот же самый кусок фотопленки; по завершению эксперимента проявить его; учитывая замечания, приведенные выше, обработать марки почернения и построить характеристическую кривую и лишь затем можно приступить к обработке результатов эксперимента. Светочувствительность фотослоев (S) определяется, как величина обратная экспозиции, необходимой чтобы обеспечить почернение превосходящее вуаль на некоторую величину D. Чаще всего используется нормировка, при которой D = 0,2. В этой стандартной ситуации так называемые числа светочувствительности определяются как S[лк^с-1] Немецкие фотоматериалы маркируются несколько по другому Sdin = 101g^^1 Обратим внимание — здесь D = 0,1. Однако в обоих случаях применяется система световых единиц (люмены, люксы и т. п.). Все это, как мы
140 Глава 4. Фотографические методы исследования уже говорили в начале этой главы, чрезвычайно затрудняет использование такого рода справочных данных как при планировании экспериментов, так и при обработке их результатов. С этой точки зрения гораздо больше подходят данные по так называемой энергетической спектральной чувствительности. Эти данные (как характеристические кривые, так и числа светочувствительности) находятся из результатов измерений, при которых облучение фотоматериалов производится последовательно на разных длинах волн. При этом числа энергетической спектральной чувствительности вводятся как 1 [эрг !cir]. Наконец, имея в виду сенситометрические свойства фотоматериалов, следует обратить внимание на так называемые кривые невзаимозаместимо- сти lgfo=Const =/(lg ДО- Это пологие кривые с вялым минимумом в районе At = 10~2—10~4 с. Другими словами для получения того же почернения необходимо несколько больше энергии, если длительность экспонирования лежит вне указанного диапазона. N — 10 8 6 4 2 ! -е \ \ ч ч^<-А5'=10 4см 2 G(D) ,.„%1Л G (Oji) V G(^ ^ (7(0,1) " ,7[D{/2e-D- -— -(1-е" 0,14 0,10 0,08 0,06 0,04 0,02 0,01 0,1 0,2 0,3 0,5 1 2 3 D Рис. 4.25. Шумы фотослоев (заштрихована область экспериментальных данных) Из-за зернистой структуры проявленного изображения отсчеты почернений можно принципиально получать только усредненными по некоторой площади AS = Ах Ay. Последняя может быть достаточномала, но всегда ограничена снизу значением ошибки восстановления 8&/$ = = G(D)/[Ay(D)], где Д = VAS, у = 1У(\о%$) — контрастность, D — почернение, a G(D) — фактор зернистости12). Характер функции G(D) ил- 12) Отметим, что здесь G(D) нормирована так, чтобы равенство 6&/& = = G(D)/[Ay(D)] выполнялось без дополнительных численных коэффициентов.
4.4. Фотослой -J\- 141 люстрирует рис. 4.25; там же приведены две аппроксимации зависимости G(D)/G(0,1). На том же рис. 4.25 показана зависимость от D значений относительной ошибки 6@/$, построенная на основании данных о пленке «КОДАК-4Х», проявленной так^что у = 1. Обратим внимание на то, что при почернениях D > 0,8 и 8$/$ и G(D) практически постоянны. (Резкое увеличение 6$/@ = G(D)/[Ay(D)], при D < 0,8 наступающее одновременно с уменьшением G(D) обусловлено тем обстоятельством, что при стремлении D —> Д>13) функция y(D) убывает быстрее, чем G(D).) Заметим также, что в интервале 0,8 < D < 2,5 также и контрастность y(D) « const. Таким образом, в «линейном» участке характеристической кривой /)(lg£), т.е. там, где у « const, ошибка восстановления 8$/$ зависит не от £, а лишь от Д5. Поэтому, если энергии достаточно, следует проецировать изображение на фотослой с таким увеличением М, при котором отношение A//J > 1 (соответственно K(cj) « 1), а неравенство D > 0,8 выполнялось. В этом случае отношение сигнал/шум £ (4.23) a G Казалось бы, что в соответствии с этой формулой можно улучшить отношение сигнал/шум, проявляя фотослой до больших значений у. Однако, как следует из обработки экспериментальных данных с увеличением продолжительности проявления вместе с у растет размер зерна, а значит и G. При этом отношение у/ G остается приблизительно постоянным — вялый максимум, наблюдаемый у некоторых фотослоев вблизи рекомендуемого значения у, улучшает отношение сигнал/шум лишь на 10—15%. К сказанному следует добавить, что в интересном с практической точки зрения диапазоне пространственных частот шум фотослоя белый с нормальным распределением. Рассмотрим информационную емкость фотослоя, как долговременного запоминающего устройства оптических систем. Найдем эффективное значение отношения сигнал/шум в условиях, когда К (со) ф 1, т. е. вычислим величину U\ Как известно, понижение контраста на высоких пространственных частотах обусловлено рассеянием света в фотоэмульсии. В одномерном случае освещенность в фигуре рассеяния описывается так называемой дисперсионной кривой, которая фактически и является аппаратной функцией фотослоя: <424) 13) Напомним, что Do — почернение проявленного, но не экспонированного фотослоя, т. е. величина почернения так называемой «вуали».
142—11- Глава 4. Фотографические методы исследования где р — полуширина. Воспользовавшись соотношением (4.24), получим коэффициент передачи К((о) = exp[-j8w/2] (4.25) и частотно-контрастную функцию ВД = exp[-*jSv]. (4.26) Теперь, в соответствии с формулой (2.57), вычислим и затем В двумерной ситуации аппаратную функцию g(r) получим используя уравнение (2.67) g(r) = г, Р -37J, (4.29) 4п[г2 + Ф/2)2У/2 откуда по аналогии с предыдущим найдем K(w), K(v), ЗС2 и £|: АГ(шх, wy) = ехр| -1 у/а)1 + а>2у }; (4.30) AT(v,, v,) - expj-^vl + vj}; (4.31) % = ехр{-^}=«р{^}; (4.32, Выражения (4.28) и (4.33) позволяют написать формулы для вычисления информационной емкости фотослоя соответственно в одномерной и двумерной ситуациях: Н = ^01og2[2|ехр(-^)] [бит/см]; (4.34) Я = ^01og2p|exp(-^)] [бит/см2]. (4.35) Воспользуемся полученными соотношениями, чтобы выяснить, как зависит от параметра Д/jS энтропия единицы площади оптического изображения Н, энергетическая цена информации $/Н и R\ — информация, содержащаяся в «среднем» отсчете, получаемом при шаге считывания Д.
4.4. Фотослой 143 Перечисленные зависимости представлены на рис. 4.26 для фотопленок ФОТО-32, ФОТО-250Т и КОДАК 4Х. Эти фотослои выбраны для иллюстрации не случайно. Во-первых, именно их сопоставление поможет нам установить характерные особенности изучаемых функций; во-вторых, для них, правда не без труда, используя справочную литературу, возможно вычислить значения j8, G и £, которые и приводятся в табл. 4.4. Для этих фотопленок, при их проявлении до рекомендуемого значения yopt серединам «линейных» участков характеристических кривых примерно соответствуют плотности почернения D = 1,5. При этом отношение исходных освещенностей на границах линейного диапазона 0,8 < D < 2,5 превышает два порядка, что обеспечивает область существования изучаемых функций в интервале изменения аргумента [1, 50]. Я, Кбайт/см 'Г" 2 4 6 8 10 20 Рис. 4.26. Информационные емкости фотослоев ю-1 Вернемся к рис. 4.26 и обсудим основные следствия нашего численного исследования. Прежде всего сопоставим кривые, отвечающие фотопленкам ФОТО-32 и ФОТО-250Т. Эта пара фотопленок интересна в том отношении, что при одной и той же контрастности yOpt У первой из них по сравнению со второй вдвое меньше как полуширина аппаратной функции )8, так и фактор зернистости G. Отсюда следует, что отноше-
Глава 4. Фотографические методы исследования ние GA/уР одинаково для обеих фотопленок, а значит, одинаковы и характеризующие их функции Z*(A/jft) и /?i(A//8). Естественно, что в силу этого плотность записи информации при том же отношении Д/)8 на фотопленке ФОТО-32 вчетверо выше, чем на ФОТО-250Т. Однако, поскольку для получения такой же плотности почернения для ФОТО-32 требуется вшестеро большая экспозиция, энергетические затраты, необходимые для записи одного и того же количества информации на фотопленку ФОТО-32, все же в 1,5 раза выше, чем при использовании высокочувствительной фотопленки ФОТО-250Т. Заметим, что так называемые числа светочувствительности у этих двух фотопленок разнятся больше, чем на порядок величины, а энергетические затраты на запись одинакового количества информации — только в 1,5 раза! Парадокс хорошо известный экспериментаторам, регистрирующим слабые световые потоки — выбираешь фотопленку, вроде бы, на порядок более чувствительную, а точность восстановления Е(х,у) возрастает, хорошо, если на 30%. Конечно это не так, тогда, когда экспозиция недостаточна, чтобы на низкочувствительной фотопленке получить почернение D > 0,8; в этом последнем случае выигрыш от применения высокочувствительных фотослоев может быть существенен. Таблица 4.4. Основные параметры фотопленок ФОТО-32, ФОТО-250Т и КОДАК 4Х Тип фотопленки ФОТО-32 ФОТО-250Т КОДАК 4Х 7oPt 0,8 0,8 0,6 Р • 104, см 5,0 10,0 7,5 G > 104, см 2,1 4,2 3,6 (G/ГЫО4, см 2,6 5,25 6,0 E(D = Do + 1,5), эрг/см2 8,2 1,4 0,68 Сравним фотопленки ФОТО-250Т и КОДАК 4Х. У первой на 25% больше полуширина аппаратной функции, но на 12% лучше отношение сигнал/шум. В результате, как это видно из рис. 4.26, для этих двух фотослоев максимальная плотность записи примерно одинакова, а ее разница в разумном интервале Д/0 не превышает 30—40%. Здесь существенно другое — для фотопленки КОДАК 4Х требуется вдвое меньшая экспозиция, чтобы достичь того же почернения. Поэтому, энергетические затраты, необходимые для записи некоторого количества информации на фотопленку КОДАК 4Х, в 2—4 раза меньше, чем при ее записи на пленку ФОТО-250Т. В рассматриваемой нами ситуации минимальная энергетическая цена информации для фотослоя КОДАК 4Х составляет ~ 4 • 10~6 эрг/бит. Заметим, однако, что при записи с минимальными энергетическими затратами, т.е. при записи с максимальной плотностью информации нет нужды экспонировать фотослой до почернения D = 1,5, поскольку в этом случае число считываемых градаций почер-
4.5. Электрооптические затворы —'I/- 145 нения так или иначе невелико. При D = 0,8—1,0 энергетическая цена записанной информации падает до (1—3) • 10~7 эрг/бит для лучших с этой точки зрения фотослоев. Эта цена на 2,5—3 порядка больше, чем у электронно-оптических систем — результат, вообще говоря, известный и многократно полученный разными способами и различными исследователями. Добавим к этому, что с другой стороны при реализации этого преимущества плотность потока информации в электронно-оптических системах не превышает 1 Кбайт/см2, т.е. по крайней мере на полтора порядка меньше максимальной плотности записи на фотослое. Наконец, обратим внимание на то обстоятельство (рис. 4.26), что максимальная плотность записи информации на фотослое достигается при Д/£ « 2; причем #(Д/)8 = 2) отличается от Ятах не больше, чем на 1—2 %. Это дает нам основание, исходя из формулы (4.35), получить соотношение для вычисления Ятах в виде [^(|)] (4.36) Этот параметр наряду с энергетической ценой записанной информации (£/#)тш = @(D = Do + l)/Hmax, с предельной полнотой характеризует фотослой. Естественно, что для их вычисления необходимо знать /J, у, G и $(D = i>o + 1). Совокупность перечисленных данных позволяет найти оптимальные условия регистрации и получать оценку точности восстановления исходных изображений. 4.5. ЭЛЕКТРООПТИЧЕСКИЕ ЗАТВОРЫ С точки зрения высокоскоростной фоторегистрации как фотопленки, так и ПЗС-камеры являются лишь запоминающими устройствами в оптических системах. Что касается фотопленки — здесь не требуется каких-либо пояснений. С ПЗС-камерами все несколько сложнее, поскольку, в принципе, используя управляющую электронику, ПЗС-каме- ру можно превратить в фотоаппарат для получения снимков в миллисе- кундном временном диапазоне. Однако, при этом не только о фемто- или пикосекундных экспозициях, но и об экспозициях наносекундных, конечно же, нужно забыть14). Поэтому при использовании фотопленки ли, или ПЗС-камер для съемки в диапазоне 10~6—10~12 с необходимы внешние быстродействующие затворы. 14) Здесь уместно заметить, что и время считывания информационных зарядов в ПЗС-камерах, предназначенных для научных исследований, чрезвычайно велико. Так время считывания в подробно рассмотренной выше камере ST-7E составляет 60 с!
146 Глава 4. Фотографические методы исследования Сечение в плоскости A(Y,X) Сечение в плоскости В(Х, Z) ^ # Рис. 4.27. Электрооптический затвор Понятно, что в качестве затворов, работающих в указанном временном диапазоне, могут служить разного рода электронно-оптические преобразователи (к примеру, описанные выше бипланары), однако здесь мы рассмотрим затворы, основанные на использовании электрооптических эффектов. Принципиальная схема одного из таких затворов показана на рис. 4.27. Он состоит из двух призм Глана 1 и J, развернутых одна относительно другой на 90°, и устройства 2, которое при приложении напряжения поворачивает вектор Е, проходящей световой, волны на 90°. Устройство 2 часто называют электрооптическим затвором — и мы также будем пользоваться этим термином — хотя само по себе это устройство никаким затвором не является, а служит лишь для изменения поляризации, проходящего сквозь него излучения. Как известно, призмы Глана изготавливаются из одноосных анизотропных кристаллов, у которых коэффициент преломления зависит от ориентации вектора Е световой волны относительно оптических осей кристалла. Призма Глана представляет собой комбинацию двух призм, дополняющих одна другую до прямоугольного параллелепипеда (рис. 4.27). Они соединены друг с другом с небольшим воздушным зазором между ними. Оптические оси в призме Глана ориентированы так, что диэлектрические постоянные в направлении осей Х9 Y не равны друг другу, т. е. ех ф еу, а угол при вершине а выбран таким, чтобы на границе кристалл — воздушный промежуток выполнялись бы условия полного внутреннего отражения лишь для одной из компонент световой волны (в обозначениях рис. 4.27 это компонента с поляризацией Ех). Поэтому на выходе первой по ходу луча
4.5. Электрооптические затворы 147 призмы Глана 1 мы будем иметь линейно поляризованное излучение, причем вектор Е этой световой волны будет параллелен оси Y, поскольку компонента с поляризацией Ех отразится на границе кристалл — воздушный промежуток и будет выброшена из оптической системы. Призма Глана 3 повернута (вокруг оси Z) относительно призмы 1 на 90°. Соответственно на 90° будут повернуты и оптические оси кристалла, поэтому теперь уже волна с поляризацией Еу, отразится на границе кристалл — воздушный промежуток и также будет выброшена из оптической системы. Это объясняет, почему сквозь скрещенные призмы Глана практически не проходит свет (при этом контрастность, т. е. Iout/I\n « 10~3—10~4). Однако, если мы подадим напряжение на электрооптический затвор 2 поляризация, проходящего сквозь него излучения, поменяется на ортогональную и свет свободно минует вторую по ходу луча призму Глана 3. Оптические оси кристалла Рис. 4.28. Полуволновая пластина В этой оптической системе «электрооптический затвор» 2 при подаче на него напряжения действует как, так называемая, «полуволновая пластина». Обычные полуволновые пластины изготавливается из одноосных анизотропных кристаллов и служит для поворота плоскости поляризации световой волны на 90°. Причины, вызывающие поворот плоскости поляризации, объясним с помощью рис. 4.28. Пусть оптические оси кристалла направлены вдоль осей X и Y и показатель преломления пх > пу, где пх и пу — соответственно показатели преломления кристалла для световых волн, векторы Ех и Еу которых совпадают по направлению с осями X и Y. Направим плоско поляризованную волну вдоль оси Z так, чтобы на входе в кристалл вектор Ein делил бы угол между осями X и Y пополам. Понятно, что при этом компоненты вектора Ех и Еу, т.е. проекции вектора Е[П на оси X и Y, будут равны по амплитуде. Выберем такую длину кристалла L, чтобы на выходе из него компонента
148 -JI- Глава 4. Фотографические методы исследования световой волны с поляризацией Ех отставала бы от волны с поляризацией Еу на половину периода А/ = Ь/с • (пх — пу) = А/(2с). (Другими словами, потребуем, чтобы L(nx — пу) = А/2.) При такой задержке на выходе из кристалла волна с поляризацией Ех как бы сдвинется в пространстве относительно волны с поляризацией Еу (см. рис. 4.28!) на я. В результате на выходе из кристалла суммарный вектор Eout окажется повернут относительно вектора Еш на 90° (см. векторную диаграмму на рис. 4.28). Вернемся к рис. 4.27. В устройстве 2, которое со сделанными оговорками мы называем электрооптическим затвором, на пути луча помещается оптически активное вещество (кристалл или жидкость), которые изотропны в отсутствие электрического поля, но в электрическом поле приобретают все свойства одноосных анизотропных кристаллов. Поэтому при подаче напряжения на электроды электрооптического затвора 2, последний, действуя как полуволновая пластина, поворачивает плоскость поляризации световой волны на 90°, тем самым, открывая путь свету сквозь скрещенные призмы Глана. Понятно, что длительность электрического импульса будет определять время экспозиции, т. е. то время пока свет будет проходить сквозь всю систему. Объект исследования Рис. 4.29. Принципиальная оптическая схема многокадровой съемке со световой задержкой При высокоскоростном фотографировании несамосветящихся объектов такого рода системы используются для формирования импульса подсветки, в том числе, и при многокадровой съемке со световой задержкой, принципиальная оптическая схема которой приведена на рис. 4.29. В такой схеме световой луч многократно отражаясь просвечивает объект исследования в моменты времени, отстоящие друг от друга на величину А/« 2L/c. (Конечно, при этом необходимо выполнить условие т < Д/, где т — длительность светового импульса.) В схеме световой задержки используются отражающие зеркала Во с коэффициентом отражения близким к 100% и делительные зеркала Ri9 коэффициенты отражения которых Rj = (п — i)/[n — (/ — 1)], где i — порядковый по ходу луча но-
4.5. Электрооптические затворы —'\у- 149 мер делительного зеркала, а п — количество лучей (т. е. количество кадров). При таких коэффициентах отражения делительных зеркал интенсивность лучей, просвечивающих последовательно во времени объект исследования, будет одинаковой. Заметим, что, вообще говоря, расстояния между любой парой зеркал Ro-Rt могут быть выбраны произвольно, что позволит производить съемку отдельных кадров в заданные моменты времени. Понятно, что такая схема может содержать некоторые дополнительные оптические элементы необходимые для съемки голограмм, интерферограмм и т. п. Так на рис. 4.30 приведена картина формирования ударных волн в газе при давлении 10 Торр при облучении плоской мишени лазерным импульсом с энергией 100 Дж и длительностью ~ 2 не. Интерферограммы получены с помощью интерферометра Маха— Цендера, время экспонирования каждого кадра 3 • 10~10 с. Для генерации короткого импульса света и его последующей задержки использовались схемы, аналогичные схемам, показанным на рисунках 4.27 и 4.29. ,'.., '■ — •'.'-* •'.»Vu4-."# v --■--:, Рис. 4.30. Картина формирования ударных волн в газе
150 -J\s- Глава 4. Фотографические методы исследования 4.6. КРАТКОЕ РЕЗЮМЕ Обсудим результаты. Мы рассмотрели ряд устройств, предназначенных для регистрации оптической информации, и нашли соотношения, позволяющие определять их параметры. Полученные нами выражения дают возможность вычислить скорость передачи информации через реальные оптические каналы с шумами, установить плотность ее записи при регистрации и определить энергетическую цену принятой информации. С их помощью можно найти оптимальные условия приема, передачи и регистрации и вычислить точную нижнюю границу ошибки измерения. Они позволяют объективно сопоставлять разнородные оптические информационные системы, используя в качестве критериев сравнения всего два параметра — пропускную способность или плотность передаваемой информации и ее энергетическую цену. И если бы наша цель заключалась в передаче сообщений через оптические каналы, можно было бы посчитать, что задача в основном решена. Однако, наша цель иная — нам необходимо по выходным сигналам найти входное изображение, т.е. возможно более точно восстановить распределение освещенности на входе в систему. До сих пор мы стремились к тому, чтобы в выходном изображении содержалась бы возможно большая информация о входном изображении, а вовсе не искали условия, при которых входное и выходное изображения отличались бы минимально. Подчеркнем — это далеко не одно и то же, так что наши усилия не потрачены впустую лишь в том случае, если максимуму информации в выходном изображении о входном соответствует минимальное уклонение входного изображения от изображения, восстановленного по выходному. До сих пор мы занимались оптимальным кодированием информации, т. е. определяли, при каком количестве бит на отсчет («число букв в слове») реализуется пропускная способность канала передачи информации. Настало время занятия декодированием, т.е. восстановлением исходного распределения освещенности. И главный вопрос, на который при этом следует ответить, заключается в том, не происходит ли при декодировании существенной потери информации? Другими словами — насколько близко можно подойти к нижней границе ошибки, определяемой информационным содержанием выходного сигнала? Второй вопрос, требующий ответа — какова оптимальная сетка считывания зарегистрированной информации? Занимаясь кодированием при записи информации, а говоря скромнее, согласуя пространственную структуру сигнала с частотными характеристиками канала путем изменения коэффициента увеличения проецирующей оптики М, мы использовали в качестве параметра оптимизации значение Д/)8. Введенный нами безразмерный параметр A//J по определению равен обратной величине
Литература —/Х- 151 удвоенного произведения критической частоты vc и полуширины аппаратной функции р. Но в то же время Д/0 = l/2vcj0 = Ac/2/J, другими словами А//8 — это отношение половины минимальной длины волны пространственной гармонической составляющей сигнала к полуширине аппаратной функции. И это естественно, поскольку, конечно же не выбираемый нами шаг сетки Д, а такие физические реальности, как ширина спектра и коэффициент передачи обуславливают плотности передаваемых потоков информации или плотности ее записи. Таким образом используемая нами на основе теоремы Котельникова величина Д = l/2vc лишь упрощает расчеты и делает наглядным удобный для поиска оптимума и записи информации параметр A/fi. Скрывается ли именно за этим значением Д какой-либо физический смысл? Конечно. Во-первых, Дс = l/2vc это максимально возможный шаг, определяющий то минимальной количество отсчетов на единицу длины (1/Дс) или площади (1/Дс) оптического изображения, которое в соответствии с теоремой Котельникова необходимо для однозначного представления сигналов со спектром, ограниченным величиной vc. Во-вторых, Д^ — это максимально-возможная апертура считывания, при которой реализуется максимальное отношение сигнал/шум. Заметим — максимальное отношение сигнал/шум, но не минимальное значение ошибки, поскольку, увеличивая Д мы уменьшаем случайную компоненту погрешности, но увеличиваем систематическую ошибку, усредняя считываемые значения функции по интервалу Д. Уже отсюда следует, что оптимальную величину шага считывания следует искать в области значений Д < l/2vc, в чем мы окончательно убедимся в гл. 12. ЛИТЕРАТУРА 1. Гороховский Ю. #., Баранова В. П. Свойство черно-белых фотографических пленок. — М.: Наука, 1970. — 388 с. 2. Мальцев М. Д, Каракулина Г. А. Прикладная оптика и оптические измерения. — М.: Машиностроение, 1968. — 471 с. 3. Дубовик А. С. Фотографическая регистрация быстропротекающих процессов. - М.: Наука, 1975. - 456 с. 4. Бутслов М.М., Степанов Б.М., Фанченко С. Д. Электронно-оптические преобразователи и их применение в научных исследованиях. — М.: Наука, 1978. — 432 с.
ГЛАВА 5 ФУРЬЕ-ОПТИКА И ФУРЬЕ-СПЕКТРОСКОПИЯ «Линза как оптический элемент, выполняющий фурье-пре- образование» — это утверждение можно встретить в большинстве книг по фурье-оптике. Сразу заметим что, собственно линза не производит и в принципе не может производить никакого фурье-преобразования. В схемах фурье-оптики линза лишь фокусирует любой параллельный пучок света, т. е. любую волну с плоским волновым фронтом, попадающую в ее апертуру под углом /5 к оптической оси, в точку фокальной плоскости на расстоянии г = /3fl) от оси, где/ — фокусное расстояние линзы. Тем не менее, чисто формально, используя формулу дифракции Френеля, несложно показать (см., например, [1]) что, если: Транспарант t(x,y) f f Рис. 5.1. Оптическая схема — в передней фокальной плоскости линзы (рис. 5.1) расположить перпендикулярно оптической оси (в плоскости XY) транспарант с амплитудным коэффициентом пропускания t(x,y), определенным так, что амплитуда поля волны непосредственно за транспарантом а(х, у) — ао(х, у) t(x, у), где ао(х,у) — амплитуда волны, падающей на транспарант; 1) При больших углах г =/tg)8.
5.1. Дифракция света на транспарантах 153 — осветить его, распространяющейся вдоль оси Z, плоской монохроматической волной, у которой длина волны равна А, а амплитуда а(х,у) = const, то сразу за транспарантом амплитуда волны а(х,у) будет равна at(x,y), а пространственное распределение U/ = (х/,у/) амплитуд волнового поля в задней фокальной плоскости линзы с фокусным расстоянием/, в плоскости X/, Y/, запишется как = -^fft(x9y)exp{-i^(xxf+yyf)}dxdy. (5.1) оо Отсюда видно, что U/ = (х/,ду) есть не что иное, как фурье-образ функции [а/(А/)Шу). Для того, чтобы понять физический смысл этой данности, рассмотрим совокупность физических явлений, лежащих в основе фурье-оптики. 5.1. ДИФРАКЦИЯ СВЕТА НА ТРАНСПАРАНТАХ Начнем с того, что «уберем» линзу и рассмотрим дифракцию света на синусоидальном транспаранте. Пусть монохроматическая волна с плоским волновым фронтом и амплитудой ао(х,у) = const, распространяющаяся вдоль оси Z, освещает установленный в плоскости X, Y транспарант с пропусканием по амплитуде t(x) = (1+ cos щх)/2, где а>о — пространственная частота модуляции, причем щ <С 2пс/Х (графики функций t(x) и а(х) = at(x) показаны на рис. 5.2)2). Ясно, что в плоскости X, Y, сразу за транспарантом распределение амплитуд имеет вид a(l а (х) = at(x) = (5.2) Понятно также, что в соответствии с принципом Гюйгенса—Френеля, распространение электромагнитного излучения «вниз по потоку» будет однозначно определяться полем электромагнитной волны в плоскости X, Y. 1,2 1 3 0,8 * 0,6 S 0,4 " 0,2 \ \ \ V / 1 / У \ \ \ V /^ / / / у 0 10 20 30 40 мкм Рис. 5.2. Пропускание транспаранта t(x) и амплитуда волны а(х) за транспарантом 2) Понятно, что если а(х, у) = const, то при а(х, у) = 1 функции t(x) и а(х) = at(x) совпадают, поскольку пространственная частота wo одна и та же.
154 —J\_ Глава 5. Фурье-оптика и фурье-спектроскопия Отметим характерные особенности этого поля: — вектора Е и Н электромагнитной волны ао(х, у) = const, падающей на транспарант лежат в плоскости X, У, т. е. в плоскости транспаранта, ее волновой вектор к параллелен оси Z; — для линейно поляризованной волны вектора Е коллинеарны во всей плоскости X, Y, причем направлены в одну и ту же сторону в течение каждого полупериода электромагнитной волны; — индекс (коэффициент) модуляции т= ^J^ max max Теперь уберем транспарант и попытаемся найти такую комбинацию волн, падающих на плоскость X, Y, которая в отсутствии транспаранта создавала бы в плоскости X, Y точно такое же поле, с тем же распределение амплитуд U(x) = д(1 -f cosw<pc)/2, т.е. то же поле, что было непосредственно за транспарантом при освещении его плоской волной, распространяющаяся вдоль оси Z. После недолгих попыток каждый в состоянии убедиться, что это можно сделать с помощью трех волн. Действительно, сумма трех волн При этом первая волна с амплитудой а/2 распространяется вдоль оси Z, а вторая и третья ((а/4)е?ш*х и (а/4)е~'щх) падают на плоскость X, Y под углами ±/5 по отношению к оси Z, причем набег фазы у этих двух волн изменяется вдоль оси х как АФ(х) = 2яДк/А = (Оох4\ Поскольку поля в обоих рассмотренных нами случаях эквивалентны, то в соответствии с принципом Гюйгенса—Френеля одинаковы будут и волны электромагнитного излучения распространяющиеся вниз по потоку как в первом, так и во втором случаях. Таким образом дифракция плоской волны на синусоидальном транспаранте приводит к возникновению трех волн, одна из которых распространяется по направлению распространения волны, падающей на транспарант, а две другие — под углами ±/5 по отношению к первой. Уместно заметить, что если Infix/\ = щх, то )8 = \щ/2п = Л/Л, где А = 2п/щ — длина пространственной волны синусоидальной структуры транспаранта. Другими словами, fi — это просто угол дифракции. Если теперь на пути этих трех плоских волн поместить линзу, ось которой совпадает с осью Z, а фокусное расстояние равно/, то эти вол- 3) Отсюда, в том числе, видно, что в результате интерференции в плоскости X, Y создается стоячая волна. 4) Заметим, что это равенство справедливо лишь при небольших углах )8, когда правомерна замена sin ft « p.
5.1. Дифракция света на транспарантах —'\у- 155 ны будут собраны в трех точках фокальной плоскости5), причем первая волна будет сфокусирована на оси системы, а две другие на расстоянии ±х = ±/3f = ±(А/Л)/ = ±(Xf/2n)a)Q от оси. Заметим, что множитель 2л/А/ — определяет масштаб шкалы а> в фокальной плоскости линзы; при этом со = (2л/А/)х. В этом масштабе падающее на линзу излучение будет сфокусировано в трех точках с координатами <о = 0, а) = -\-cjq и а) = — щ, причем амплитуды поля в этих точках будут соотносятся как 1/2 : 1/4 : 1/4. Заметим, что ни о каком фурье-преобразовании пока речи не шло. Мы просто рассмотрели дифракцию плоской монохроматической волны на транспаранте, амплитудное пропускание которого t(x) = (1 4- coswox)/2, и нашли, что в результате дифракции возникают три плоские волны, которые могут быть сфокусированы линзой в трех точках ее фокальной плоскости. Теперь, используя формулу Эйлера, представим функцию (5.2) в виде и найдем ее фурье-образ ^8(а>) + -Мы + щ) + jS(w - wo), (5.3) 2 4 4 откуда видно, что функция Фа((о) не равна нулю лишь при а) = 0, о) = +щ и ^ = —^о, причем значения Фа(о>) в этих точках соотносятся как 1/2:1/4:1/4. Заметим, что аналогичным образом находится фурье- образ функции t(x). После столь же несложных преобразований получим <Pt(o)) = (1/2)8((о)+(1/4)6((о + (Dq)+(1/4)6(o) — щ). Здесь также функция ФДю) не равна нулю лишь при (о = 0, w = +Щ и w = — о^о» и значения Ф/(аО в этих точках также соотносятся как 1/2 : 1/4 : 1/4. Таким образом распределение поля электромагнитной волны в фокальной плоскости линзы, фокусирующей дифрагированную на синусоидальном транспаранте плоскую волну, с точностью до постоянного коэффициента совпадает с результатом формального фурье-преобразования функции пропускания транспаранта t(x). Другими словами распределение поля электромагнитной волны в фокальной плоскости линзы А(х) (или А((о)) есть фурье-образ электромагнитной волны в плоскости транспаранта at(x)6). 5) Из-за дифракции на апертуре линзы полуширина этих «точек» будет порядка А///), где D — диаметр линзы. 6) Понятно, что отношение амплитуд А/а пропорционально отношению D*/d2, где D — диаметр линзы, a d — так называемый «кружок рассеяния», примерно равный 2Л//Д если аберрации малы.
156 Глава 5. Фурье-оптика и фурье-спектроскопия 1,05 20,95 Д 0,85 ?0,75 0,65 \ / \ / \ / \ / V/ \ / \ / О 10 20 мкм 30 40 Рис. 5.3. График функций t(x) и а(х) Итак, нами изучена совокупность явлений, возникающих при облучении плоской световой волной синусоидального транспаранта со 100%-й модуляцией. Рассмотрим более общий случай, при котором индекс модуляции т ф 1. В этом случае t(x) = 1 - - + - coscjqx, (5.4) ГДе т = (/тах - fmin)/W = 1 ~ Wi/'max, ТЭК ЧТО При ИЗМеНвНИИ tmin В ИН- тервале от 0 до 1 индекс модуляции т изменяется в интервале от 1 до 0. (График функции t(x) показан на рис. 5.3.) Пусть, как и прежде, плоская монохроматическая волна с амплитудой ао(х,у) = const распространяется вдоль оси Z и освещает установленный в плоскости X, Y транспарант, у которого т ф 1. В этом случае пространственное распределение поля электромагнитной волны в плоскости X, Y за транспарантом а(х) = aot(x) = а0 - ^ + ^р cos щх. (5.5) График функции а(х) показан на том же рис. 5.3. Используем тот же прием, что и раньше, т. е. уберем транспарант и попытаемся найти такую комбинацию волн, падающих на плоскость X, Y, которая в отсутствии транспаранта создавала бы в этой плоскости точно такое же поле, с тем же распределение амплитуд, что и раньше, т. е. то же поле, что было в плоскости транспаранта при освещении его плоской волной, распространяющаяся вдоль оси Z. Нетрудно проверить, что такое распределение амплитуд поля в плоскости X, Y можно получить сложением трех волн, из которых первая волна с амплитудой доО — ^/2) распространяется вдоль оси Z, а вторая и третья ((аът/4)е*ШоХ и (аот/4)е~'щх) падают на плоскость X, Y под углами ±/3 по отношению к первой. Действительно, Щх) = ао(1- т/2) + *^j*>x + ^Vto»* = ao-^ + ^совщх. (5.6) Этот результат можно получить и другим способом. Используем принцип суперпозиции и представим распределение полей за транспарантом в виде суммы до = а\ +Q2, в которой, как это понятно, а\ = а$ — аг = oq(1 — аи),
5.7. Дифракция света на транспарантах —'w- 157 а а2 = 0о>я. При этом а\(х,у) = const — это смодулированная компонента, а аг(х) = Д2О + cosu>o*)/2 — компонента со 100%-й пространственной модуляцией, которая, как это ясно из предыдущего, сформирует стоячую волну в плоскости X, Y, что приведет к рождению трех волн: а2/2 = аот, (a2/4)ei0)oX = (а0т/4)^х и (а2/4)е~ШйХ = (a0m/4)e-ia)°x. Понятно, что сумма этих двух компонент (а\ + а2) а(х) = а{ + — + — соьщх = а0 - — + — cosw0*, есть не что иное, как распределение амплитуд электромагнитного поля за транспарантом. Заметим, что в этом случае, т.е. при т ^ 1, картина распределения амплитуд поля электромагнитной волны в фокальной плоскости линзы, собирающих дифрагированные лучи, будет отличаться от рассмотренной ранее (т = 1) лишь тем, что амплитуда волны нулевого порядка (а) = 0) будет больше, а амплитуды поля волн плюс первого (ш = а>о) и минус первого порядков (а) = —щ) меньше, чем при т = 1. Отметим крайне важную деталь — амплитуды волн, дифрагированных под углами ±р пропорциональны т. Сделаем следующий шаг: — изготовим транспаранты для первой и второй гармоники t\(x) = = \-т{/2+(т\/2)соьа)оХИ t2(x) = 1 - т2/2 +(т2/2)со$2щхтьк, чтобы m\+m2< 1; — поместим их вплотную один за другим в плоскости X, Y — понятно, что при этом ь(х) = t\(x)t2(x) — суммарное пропускание этих двух, расположенных друг за другом транспарантов; — осветим этот сэндвич однородной (ао(х,у) = const) плоской монохроматической волной, распространяющейся вдоль оси Z; — и рассмотрим распределение амплитуд поля электромагнитной волны в фокальной плоскости линзы, собирающей дифрагированное излучение. В пренебрежении членами с коэффициентами гп\ х т2/4 получим !f cos2a>0x7\ Графики функций t\(x), t2(x) и fc(jc) показаны на рис. 5.4. He станем в очередной раз повторять те же рассуждения, не будем делать новые выкладки, а сразу напишем результат дифракции а(х) = ао(\- ) + ^е + ре + ^е + 2 / 4 4 4 4 7) Это равенство выполняется с хорошей точностью. Так, например, при wi =0,3 и /иг = 0,15 максимальное отличие только некоторых значений /(*,) от истинных ~ 2,5%, при т\ = 0,2 и тг = 0,1 эта разница уменьшится до ~ 1 %. Впрочем, можно изготовить и точный транспарант.
158 Глава 5. Фурье-оптика и фурье-спектроскопия 1 0,9 0,8 0,7 п v4 \ \ / / V / \ \ V \ \ / р '/ j! i i \\ \\ \\ \ V / \ \ у \ ' t 0 10 15 20 25 мкм 30 35 40 Рис. 5.4. Графики функций fi(x) ( ), fc(x) ( ) и ( ) Ясно, что каждой волне, т. е. каждой гармонике, будет соответствовать точка в фокальной плоскости линзы, причем координаты этих точек будут пропорциональны о), а амплитуды волн — пропорциональны соответственно ш\ и тг. Логика дальнейших рассуждений понятна: при любом виде финитной функции t(x,y) волна aot(x9y) может быть представлена, как суперпозиция плоских волн. Тогда каждой волне, т.е. каждой гармонике, в фокальной плоскости линзы X/, Y/ будет соответствовать точка с координатами х* = [А//(2л)]£а>ох, Ук = [Л//(2л)]кщу9 причем амплитуда в каждой из этих точек будет пропорциональна амплитуде соответствующей плоской волны. Другими словами амплитуды дифрагированных на транспаранте t(x9y) волн обуславливают распределение амплитуд поля электромагнитной волны 1/(х/,у/) в фокальной плоскости Х/9 Yf пропорциональное фурье-разложению at(x,y)*\ В сущности, дифракция света на транспаранте и есть физическое основание полученного формально из формулы дифракции Френеля соотношения (5.1) иАх/,У/) = Д7 JJ t(x,y)exp{-i-^(xxf + yyf)} dxdy. Проведя замену переменных х/ = (Xf/2n)a)X9 yf = (Xf/2n)(oy9 преобразуем эту формулу в привычный вид Ф(о)хшу) = ^- [f t(x9y)exp{-i(a)xx + a)yy)}dxdy. л/ JJ оо Если фурье-разложение есть результат дифракции света на транспаранте, то какова же роль линзы? Чтобы ответить на этот вопрос рассмотрим дифракцию света на щели, расположенной вдоль оси X в плоскости Х9 Y, так что волновые вектора к дифрагированных на щели волн будут 8) Именно по этой причине заднюю фокальную плоскость линзы часто называют фурье-плоскостью.
5.1. Дифракция света на транспарантах -J\y- 159 лежать в плоскости У, Z. Амплитудное пропускание такого «транспаранта» запишется как (I при |*|<„/2; [О при х > d/2 или х < -d/2, где d — ширина щели. Хорошо известно, что картину дифракции на щели можно наблюдать на экране без всякой линзы, если установить его на расстоянии z ^> k(d/2)2/2 = n{d/2)2/X от транспаранта, т. е. в так называемой «дальней зоне», где приемлемо приближение Фраунгофера Zr >• к(х? + у2)тах/2. Также хорошо известно, что распределение амплитуд дифрагированных на щели волн по углам дифракции (5.8) Проведя замену tp=x/z9) получим распределение амплитуд поля на экране, установленном на расстоянии z от транспаранта, по направлению х В то же время фурье-образ функции (5.7) 0t(<o) = d[sin(a)d/2)/(a)d/2)]. Другими словами, если по направлению х на нашем экрана нанести шкалу о) в масштабе о) = 2ях/гЯ, то в этом масштабе распределение амплитуд волн по направлению х с точностью до постоянного коэффициента будет соответствовать фурье-разложению функции (5.7). Так что линза здесь не при чем — мы обошлись без всякой линзы. Так нужна ли линза и зачем? Беда в том, что в реальных схемах фурье- оптики величина zf, удовлетворяющая условию Фраунгофера, непомерна велика. Это только для щели с d = 200 мкм, освещаемой, например, Не—Ne-лазером, экран должен отстоять от нее на расстояние несколько большее, чем 5 см. Но это совсем не так для реальных объектов фурье- оптики. Например, при обработке методами фурье-оптики стандартного кадра проявленной фотопленки с размерами 3,6 х 2,4 см2 расстояние до «дальней зоны» должно превосходить 2,3 км! И дело даже не в том, что иметь детектор, расположенный за километры от измеряемого объекта, мало сказать неудобно. Ситуация много хуже — интенсивность в районе столь далеко расположенного экрана будет столь ничтожна, что измерить что-либо (да и увидеть тоже) попросту не удастся. Линза необходима, во-первых, для того, чтобы выполнить условие Фраунгофера, не удаля- 9) Это и предыдущее равенства справедливы, когда правомерна замена sin <p «<р и tg ср « ср.
160 Глава 5. Фурье-оптика и фурье-спектроскопия ясь на километры. Действительно, фокальная плоскость линзы — это и есть «дальняя зона» для падающего на нее излучения. Во-вторых, линза необходима, чтобы сконцентрировать излучение, собрать расходящиеся лучи. При этом все лучи, падающие под углом <р на линзу с фокусным расстоянием /, будут собраны в точке фокальной плоскости, расположенной на расстоянии х = <pf от оси. Поэтому мы можем, проведя в формуле (5.8) замену q> = x/f, найти распределение амплитуд поля по направлению х в фокальной плоскости линзы s\n(dnx/fX) (5.10) Как видно, это распределение отличается от распределения (5.9), т.е. распределения амплитуд поля вдоль направления х на экране, установленном на расстоянии z от транспаранта лишь масштабами а), которые соответственно равны о) = inxjfX hw = 2nx/z&. 5.2. ФИЛЬТРАЦИЯ В ФУРЬЕ-ПЛОСКОСТИ Принципиальная схема устройства для фильтрации в фу- рье-плоскости показана на рис. 5.5. Как видно из рисунка, подлежащее фильтрации исходное изображение /(дс, у) помещается в передней фокальной плоскости первой по ходу лучей линзы и освещается плоской монохроматической волной. Соответственно, в задней фокальной плоскости этой линзы, т. е. в фурье-плоскости, формируется фурье-образ этого изображения Ф(а>Х9 <х)у). Вторая по ходу лучей линза производит сложения фурье-компонент так что в ее задней фокальной плоскости воспроизводится исходное изображение fix, у). В сущности, эта конфокальная система, состоящая из двух линз, представляет собой не что иное, как репродукционный объектив. Разница заключается лишь в том, что в системе, показанной на рис. 5.5, реализован доступ к фурье-плоскости, что позволяет воздействовать на фурье-спектр исходного изображения. Исходное изображение Фурье-плоскость Отфильтрованное изображение Рис. 5.5. Принципиальная схема устройства для фильтрации в фурье-плоскости
5.2. Фильтрация в фурье-плоскости 161 Впервые это было сделано более 100 лет тому назад в 1873 г. (так называемый «опыт Аббе»). Аббе помещал в переднюю фокальную плоскость первой линзы решетку, а в ее заднюю фокальную плоскость щель. Поворачивая от опыта к опыту щель на 90°, т. е. отфильтровывая последовательно либо горизонтальные, либо вертикальные компоненты фурье- спектра, Аббе наблюдал, что в восстановленном изображении, формируемом в задней фокальной плоскости второй линзы, остаются, соответственно, либо вертикальные, либо горизонтальные компоненты (рис. 5.6). Опыты в фурье-плоскости привели Аббе к созданию дифракционной теории разрешения оптических приборов, что будет предметом нашего внимания в следующем параграфе. Ititltr ■■■■■■■■■■■■■■■■! . I ■ ■ В ■ ■ ■ ■ ■■■■■■■■■■■■■а Illllllllllllir Рис. 5.6. Опыт Аббе: а) транспарант; б) фурье-спектр транспаранта; в) отфильтрованы лишь горизонтальные компоненты фурье-спектра; г) отфильтрованы лишь вертикальные компоненты фурье-спектра Очень часто фильтрация в фурье-плоскости используется для выделения необходимых для дальнейшей обработки волн дифрагированных в разных направлениях. Прежде всего, это касается голографии, где при
162 Глава 5. Фурье-оптика и фурье-спектроскопия восстановлении волновых фронтов формируются три, шесть или больше дифрагированных на голограмме волн, в то время как для дальнейшей обработки необходимы лишь одна или две волны10). Изменяя угол падения восстанавливающей волны (или волн) на голограмму можно совместить нужную волну с отверстием в диафрагме, установленной в фурье- плоскости, и этим отфильтровать необходимый порядок дифракции, с тем, чтобы на выходе схемы получить лишь одну (или две) необходимые волны. Такая же процедура необходима при обработке результатов измерений с гартмановской версией трехволнового интерферометра сдвига и в ряде других приборов. а б ' '"' ' в Рис. 5.7. Фильтрация в фурье-гоюскости: а) исходное изображение; б) его фу- рье-спектр; в) результат фильтрации Вторая распространенная задача фильтрации в фурье-плоскости — это подавление шумов, обусловленных зернистостью фотопленки, многоэлектронной компонентой электронно-оптического изображения П), спекл-струк- турами, и т. п. При выполнении этой процедуры в фурье-плоскость помещается ирисовая диафрагма, обрезающие высшие порядки фурье-спек- тра. Понятно, что эта процедура особенно успешна, когда спектр изображения и спектр шумов лежат в разных спектральных диапазонах — в этом случае такая фильтрация не ухудшает качество изображения. Если это не так, приходится искать компромисс; заметим компромисс не всегда удачный. Пример фильтрации с применением ирисовой диафрагмы приведен на рис. 5.7. Заметим, что сегодня такая фильтрация может быть легко реализована средствами вычислительной техники [2] (рис. 5.8). В чем же сегодня, а не вчера, когда это было невозможно, преимущества аналоговой фильтрации? Пожалуй, лишь в том, что в этом случае фильт- 10) Подробнее см. гл. 8. И) Многоэлектронная компонента электронно-оптических приборов, проявляющаяся в виде ярких точек на изображении, обусловлена флуктуациями рождения при фотоэмиссии не одного, а сразу нескольких электронов.
5.2. Фильтрация в фурье-плоскости 163 рация выполняется on-line — оперируя с ирисовой диафрагмой, вы одновременно наблюдаете отфильтрованное изображение, что облегчает поиск компромисса между его качеством и остающимися шумами. (Кстати, не всегда также имеется в наличии электронный аналог изображения.) Отметим еще одну возможность — если закрыть нулевой порядок (так называемый метод «темного поля»), в фокальной плоскости второй линзы формируется изображение с обращенным контрастом, что облегчает идентификацию контуров изображенных предметов. Рис. 5.8. Фильтрация средствами вычислительной техники [2] Наконец, проанализируем возможности решения уравнений свертки аналоговыми методами. Еще Э. Аббе показал возможность воздействия на изображение путем помещения в фокальную плоскость системы амплитудно-фазового транспаранта. В сущности, это было первое использование аналоговых оптических вычислений. В 50-х годах прошлого столетия А. Марешаль и его сотрудники начали активную разработку методов когерентной пространственной фильтрации для восстановления качества фотоснимков [3]. К сожалению, этот элегантный метод восстановления качества изображений не получил должного развития прежде всего благодаря бурному прогрессу вычислительной техники. Оказалось, что просканировать изображение, ввести его в компьютер и обработать, используя существующие программные продукты, проще, чем изготавливать фильтрующие компоненты. Какова же сегодня, так сказать «экологическая ниша» этого метода? Безусловно, он применим для коррекции коэффициента передачи в сложных оптических системах. В чем суть метода? Как мы знаем, восстановление входного сигнала по его выходному значению производится путем решения уравне-
164 —' Ь- Глава 5. Фурье-оптика и фуръе-спектроскопия ния Фт(й>) = Фоп\((л))/К{(о)12), где ^Г(^) < 1. Сущность этой процедуры — восстановление частотных компонент сигнала путем их умножения на величину 1/К(о))9 т. е. как раз во столько раз, во сколько они были ослаблены при похождении оптического прибора. При решении этого уравнения аналоговым методом возникают две трудности. Во-первых, К(ш) комплекснозначная функция, а изготовление фазовых фильтров весьма не простая задача. Однако, если аппаратная функция прибора, с помощью которого было получено изображение вещественная и четная (а в оптике это, в основном, так), то К(ш) = А((о)9 т.е. коэффициент передачи не содержит мнимой части, и, следовательно, надобность в фазовых фильтрах отпадает. Во-вторых, в отличие от численной обработки мы не можем путем фильтрации увеличить интенсивность ослабленных высокочастотных спектральных компонент. Да, не можем, но мы можем в разумном, достаточно широком спектральном интервале подавить низкочастотную часть спектра с тем, чтобы Ag(o)) Цю) « const, где Ag(a)) — фурье-образ аппаратной функции g(x), т. е. коэффициент передачи фотографирующего устройства, a L(<o) = A~l(o)) — фильтр. (Заметим, что, если аппаратная функция фотографирующего устройства есть дельта функция, то искажения частотного спектра не имеет места, поскольку в этом случае К(а)) = 1, так что требование Ag(a))L((o) « const есть условие отсутствия частотных искажений в скорректированном изображении.) Понятно, что корректирующий фильтр Цю), а точнее его физическая реализация — транспарант с амплитудным пропусканием t(x/) или t((o), где а) = (2л/А/)х/, должен быть установлен в фурье-плоскости. (Напомним, что множитель 2л/А/ определяет масштаб шкалы со в задней фокальной плоскости линзы.) Для того, чтобы изготовить такой транспарант необходимо: — получить негативное изображение аппаратной функции (скажем, освещая щель спектрографа с шириной меньшей «нормальной» (S <С fi) монохроматическим излучением); — проявить это изображение с обращением или отпечатать позитив, т. е. получит физическую реализацию изображения аппаратной функции g(x); — установить это изображение в передней фокальной плоскости входной линзы и осветить его волной с плоским волновым фронтом и амплитудой ао(х,у) = const, с тем чтобы получить в задней фокальной плоскости линзы фурье-образ g(x); 12) Для того, чтобы проще разобраться в принципиальной стороне вопроса и не перегружать изложение ненужными подробностями, посчитаем, что устойчивость решения обеспечивается его обрезанием на частоте <ос, такой при которой шум N((oc) все еще меньше, чем выходной сигнал Фоы((ос), а К(шс) > 0.
5.3. Дифракционная теория разрешения оптических приборов —■!/- 165 — поместить в задней фокальной плоскости линзы фотослой, после проявления которого мы получим негатив, физически реализующий А~1(о)) = L{p)), т.е. искомый нами фильтр. Все компоненты фурье-спектра с (о > а)с обрезаются с помощью диафрагмы. Корректность преобразования осуществляется подбором подходящих значений контрастности у в процессе двух проявлений, сопровождающих процесс получения L(a>). В этой связи уместно упомянуть, к сожалению неопубликованные, опыты Ю. П. Донцова (ИАЭ им. И. В. Курчатова, 1965 г.), который, используя описанную процедуру, в схеме подобной рис. 5.5 из спектрограмм с размытыми, практически неразличимыми спектральными линиями получал изображения с ярко выраженными мультиплетами. 5.3. ДИФРАКЦИОННАЯ ТЕОРИЯ РАЗРЕШЕНИЯ ОПТИЧЕСКИХ ПРИБОРОВ В этом параграфе мы рассмотрим возможности, которые предоставляет дифракционная теория разрешения оптических приборов. Последняя была предложена Эрнстом Аббе больше ста лет назад, но так и не стала практическим инструментом инженеров, исповедующих, в основном, привычную им геометрическую оптику. Это не странно, так как, во-первых, большинство практических задач, которые стояли перед оптиками на протяжении истекшего столетия, с успехом решались с помощью геометрической оптики и, во-вторых, потому, что за долгие годы совершенствования в рамках геометрических приближений были разработаны рецепты и приемы расчетов, обеспечивающих проектирование и разработку большинства оптических приборов. Одно из немногих плодотворных применений дифракционной теории разрешения оптических приборов — это дифракционная теория разрешения микроскопов. И здесь тоже нет ничего странного — просто в этом случае геометрическая оптика была бессильна. Сразу же заметим — наша задача вовсе не состоит в разработке альтернатив геометрической оптике. Наша цель показать, что дифракционная теория разрешения предоставляет иные возможности и позволяет реализовать другие пути исследования и создания оптических приборов и прежде всего приборов, используемых в экспериментальной физике. Э. Аббе в своих опытах обнаружил, что по мере уменьшения отверстия в диафрагме, установленной в фокальной плоскости линзы, из изображения сначала исчезают мелкие детали, затем сглаживаются резкие контуры изображенных предметов и, наконец, остается лишь размытая периодическая структура, если таковая имелась в изображении. Распределение интенсивности в фокальной плоскости — то, что мы сегодня
166 -J\s- Глава 5. Фурье-оптика и фуръе-спектроскопия называем фурье-спектром — Аббе называл «первичным изображением». Он установил, что именно наиболее удаленные от оптической оси компоненты «первичного изображения» ответственны за разрешающую способность. Безусловно, он понимал, что их наличие в «первичном изображении» определяется с одной стороны мелкомасштабными элементами изображения, обуславливающими наибольшие углы дифракции, а с другой — апертурой объектива обрезающей их. Сегодня, через 100 с лишним лет после Аббе нам просто рассуждать — обрезали фурье-спектр изображения, значит сгладили спроецированное объективом изображение, удалили из него высокие пространственные частоты, а вместе с ними и мелкие детали. Мы не будем излагать здесь собственно дифракционную теорию разрешения оптических приборов, а лишь, полагая, что предыдущее содержание этой главы прочитано со вниманием, ограничимся двумя примерами, иллюстрирующими ее методы и возможности. Начнем с вычисления коэффициента передачи К(а>) репродукционного объектива, в котором скорректированы сферические и хроматические аберрации. Напомним, что существует два метода исследования свойств линейных систем — частотный и импульсный (см. гл. 2). В первом случае (в оптике) на вход системы подается сигнал ^(х) = £0(1 + s\na)x)/2 и вся совокупность отсчетов выходных сигналов, полученных при разных значениях a) @oui(x) =: £оО +А(<о)sina)x)/2 используется для определения функции А((о)13). Во втором методе на вход подается сигнал типа 5-функции, при этом выходной сигнал и является аппаратной функцией g(x). Различие между этими двумя методами кажущееся. Действительно, спектр 5-функции тождественно равен единице £15(х)] = Ф((о) = 1, а это значит, что на вход системы также как и при частотном методе подаются все гармонические составляющие в пределах полосы пропускания системы. Просто в частотном методе они подаются последовательно, а в импульсном — одновременно. Поместим в переднюю фокальную плоскость нашего объектива транспарант с амплитудным пропусканием t(x) = (1 + cos(ox)/2 и осветим его волной с плоским волновым фронтом, распространяющейся вдоль оси Z (рис. 5.9). (Длина волны излучения — А, амплитуда ао(х,у) = const.) Как мы уже говорили в начале этой главы, угол дифракции на таком транспаранте ft = Ло)/2п. Это дифрагированное излучение будет сфокусировано в общей фокальной плоскости нашей конфокальной системы на рас- 13) Просто из симметрии следует, что, аппаратная функция объектива g(x) — функция четная, а это значит, что К{ш) = А(а>)9 т. е. коэффициент передачи не содержит мнимой части.
5.3. Дифракционная теория разрешения оптических приборов 167 стоянии x=f(} от ее оси14) и образует в плоскости второго объектива Х9 Y круглое световое пятно с радиусом г = D/2 (D — диаметр входного зрачка объектива) и центром окружности в точке х = 2//J, у = 0. Возникшая ситуация понятна из рис. 5.9, на котором видно, что из-за обрезания дифрагированных лучей оправами обоих объективов излучение будет проходить лишь сквозь заштрихованную область. Площадь этой, состоящей из двух равных сегментов, области S = Р-(а — sin а), где а — центральный угол. Величину а найдем из соотношения fp = rcos(a/2): fP/r = cos(a/2), т. e. a = 2 axccos(fp/r). Значение sin а получим из отношения половины хорды к радиусу — sin a = (2fP/r — (ff)/r)2. Соответственно S = ?{а - sin а) = 2? [arccos(/^/r) - Ц> Vl - (fP/r)21. (5.11) Заметим, что если р = 0, S = яг2 (т. е. излучение не обрезается вовсе), а при fP = г (рс = г If) излучение сквозь наш репродукционный объектив пройти не может. Отсюда несложно найти а)с — другими словами ширину полосы пропускания. Поскольку с одной стороны рс = r/f, ас другой — рс = Х(ос/2п9 имеем cdc = 2nrjfX = nD/fX. Отсюда видно, что полоса пропускания прямо пропорциональна относительному отверстию D/f. Поэтому реальный путь увеличения (ос, а значит и разрешающей способности состоит в увеличении диаметра второго объектива, что иногда и делается. Вид А Рис. 5.9. К вычислению коэффициента передачи К(а)) репродукционного объектива: 1 — транспарант; 2 — входной объектив; 3 — выходной объектив Проведя в выражении (5.11) замену р = Хш/2п получим S = 2Г2 |arccos(/*AaV27rr) - ^ Vl - </Ха>/2лг)21. 14) Относительные отверстия репродукционных объективов D/f обычно невелики (~ 1/3), так что замена/ tg p &fP внесет ошибку меньше одного процента.
168 Глава 5. Фурье-оптика и фурье-спектроскопия Пронормировав на единицу, т.е. разделив на яг2, найдем, что К((о) = - [агссо8(Дю/2лг) - ^ \Л - (fX(o/2nr)21. (5.12) я L 2яг J График функции К(ю) приведен на рис. 5.10. Поскольку функция К(<о) строго ограничена частотой а)с, аппаратная функция g(x) (т.е. фурье- преобразование К((о)) может быть представлена в сумматорном виде, например, с помощью соотношения (2.31). ч, ч^ ч ч* ч, S 0,08 0,6 0,4 0,2 0 2000 4000 6000 8000 МО4© Рис. 5.10. График функции К (со). Диаметр объектива D = 5 см, его фокусное расстояние / = 15 см, длина волны излучения А = 10~4 см. Размерность (О — [СМ"1] Рассмотрим дифракцию на прозрачной дифракционной решетке с позиций фурье-оптики. Пусть, как и раньше, монохроматическая волна с плоским волновым фронтом и амплитудой ао(х9у) = const, распространяющаяся вдоль оси Z, освещает установленный в плоскости X, Y транспарант. Теперь наш транспарант — это решетка с периодом Т, состоящая из чередующихся штрихов с амплитудным пропусканием t = 0 и t = 1 (см. функцию t(x) на рис. 5.11). Как мы установили раньше, для того, чтобы найти поля электромагнитных волн в каждом из направлений дифракции достаточно произвести фурье-преобразование функции а(х) = aot(x). Проведем эту операцию, т. е. операцию разложения в ряд Фурье функции а(х), полагая, что ширины непрозрачных а и прозрачных Ь штрихов нашей решетки а = Ь— Т/2. Последнее замечание означает, что четные гармоники в разложении отсутствуют (5.13) где щ = 2п/Т, Т — период решетки, а |л|=0,1,2,3, В этом конкретном разложении, т. е. при а = Ь= Т/2, коэффициенты ряда Фурье вычисляются по формулам: Ьо = яо/2, Ь„ = 0 при п = ± 2k, Ъп = до(- \)к/п(2к +1), если п= ± (2к+ 1), где £ = (|я| — 1)/2. Так что, интенсивность лучей, дифрагированных, например, в нулевой, первый и третий порядки дифракции составят: /0 = с%/4, /+i = /_i = al/n2(2k + I)2 = с$/п2л2 = а\/п2,
5.4. Фурье-спектроскопия JL 169 /+з = /-з = al/n2(2k -f I)2 = a\/n2n2 = а1/9л2. (Этот же результат можно получить, хотя и не столь просто, и другим, традиционным методом, в котором рассматривается дифракция на одной из щелей решетки, а затем суммируется излучение от их совокупности [4, 5].) Отсюда, в частности, следует, что интенсивность излучения в первом порядке дифракции, используемом чаще всего в спектрометрии, составляет ~ 40% от интенсивности излучения в нулевом порядке и всего ~ 10% от интенсивности, анализируемого излучения. Это и было причиной того, что несмотря на несомненные преимущества спектрографов с дифракционными решетками они долгие годы не находили широкого применения, сильно уступая призменным спектрографам по светосиле. Прорыв здесь наметился после предложения Рэлея использовать профилированные дифракционные решетки15*, рассмотрение которых мы отложим до следующей главы, отметив лишь, что первые профилированные дифракционные решетки были изготовлены блестящим физиком-экспериментатором Робертом Вудом. 1,5-• 0,5-- гТг\ X Рис. 5.11. Пропускание дифракционной решетки 5.4. ФУРЬЕ-СПЕКТРОСКОПИЯ В фурье-спектроскопии спектры исследуемых источников излучения восстанавливаются из зарегистрированных интерферограмм. Принципиальная схема типичного фурье-спектрографа приведена на рис. 5.12. Как видно из рисунка, ключевым элементом этой схемы является интерферометр Майкельсона16), одно из зеркал которого может перемещаться вдоль направления падающих на него лучей. Источник исследуемого излучения И помещается в фокальной плоскости входного объектива телескопа Т, формирующего плоскую световую волну, направляемую далее на полупрозрачное зеркало интерферометра 3\. Последнее делит падающие на него излучение на два луча, которые, после 15) Иногда называемые фазовыми решетками. 16) Вообще говоря, применение именно интерферометра Майкельсона в фурье- спектрографах совсем не обязательно — может быть использована любая интерферометрическая схема, допускающая изменение длины оптического пути одного из интерферирующих лучей.
170 Глава 5. Фурье-оптика и фурье-спектроскопия отражения от зеркал Зг (неподвижное) и Зз (подвижное), с помощью объектива О сводятся на фотоприемник ФП. Линейно во времени изменяющиеся напряжение от генератора ГЛН одновременно подается на исполнительный механизм Д ответственный за перемещение зеркала Зз, и пластины X осциллографа. В силу этого каждому положению х зеркала 33 однозначно соответствует точка с координатой х* на развертке осциллографа. На пластины Y осциллографа через разделительный конденсатор С подается сигнал фотоприемника. В качестве исполнительного механизма, перемещающего зеркало Зз> используются пьезоэлектрические, магнитострикционные или просто механические движетели. 32-Г-Т "\лл/ ГЛН Возвратно- поступательный движитель (Д) ФП Рис. 5.12. Принципиальная схема типичного фурье-спектрографа Пусть мы имеем дело с источником монохроматического излучения. Если частота излучения равна <о, а амплитуды двух пришедших на фотоприемник интерферирующих волн, отраженных ранее от зеркал 3i и Зз, соответственно равны а\ и п29 то, как это будет показано в гл. 7, их суммарная интенсивность на входе в фотоприемник Iz(x) = 2fli яг cos(wx), (5.14) где х = 7,2 — L\ — разница оптических путей этих двух волн, откуда следует, что при L\ = Z,2 x = 0 (как правило начало отсчета). Понятно, что если коэффициент отражения R зеркала 3\ составляет в точности 50%, т. е. а\ = аг = а, то /И*) = 2а2 + 2л2 cos(wx). Первый член этой суммы не зависит от изменяющейся во времени переменной x(t), поэтому передаваемый через разделительную емкость сигнал фотоприемника не будет содержать постоянной составляющей; другими словами сигнал на входе осциллографа 1(х) = 2а2ц\ cos(wx), где ц\ — квантовый выход фотопри-
5.4, Фурье-спектроскопия JL 171 емника на частоте а). Прежде чем двигаться дальше, обратим внимание на то, что масштаб по оси X в реальном приборе и масштаб вдоль оси X* развертки осциллографа различны, и это следует принимать во внимание при обработке результатов измерения. Ясно, что масштабный множитель М = (Xj — Xi)/(Xj — х*)9 причем, как мы уже говорили, любой наперед заданной координате хк, определяющей положение зеркала Зз в некоторый момент времени /*, всегда однозначно соответствует координата х% развертки осциллографа. Итак мы установили, что если входной сигнал фурье-спектрографа — это монохроматическое излучение с частотой (о и амплитудой а9 то на вход осциллографа придет и затем будет зарегистрирован сигнал 1(х) = = 2(£\i\ cos(ojx). Понятно, что если входной сигнал фурье-спектрографа характеризуется, скажем, частотой 2(о и амплитудой Ь, то на вход фотоприемника придет сигнал I(x) = 2b2Ц2 cos(2(ox); при подаче на вход фурье-спектрографа одновременно обоих этих сигналов на вход осциллографа придет сигнал 1(х) = 2а2ц(а)) cos(awc) + 2£2//(a>) cos(2iox). Прекратим суммировать гармоники и зададимся вопросом, как вычислить сигнал на входе осциллографа, если входной сигнал фурье-спектрографа характеризуется спектральной плотностью излучения S(cj)? Ответ ясен — нужно просто проинтегрировать по всем частотам, так что в этом случае оо = - [ S(a))ii(a))cosc»xda). (5.15) я J о Однако, если функция 1(х) вещественная и четная, а в нашем случае это именно так, то интеграл, стоящий в правой части равенства — это просто интеграл Фурье. Поэтому спектральная плотность излучения исследуемого источниками)) может быть вычислена по зарегистрированным значениям 1(х), как оо [ J I(x)cos(oxdx. (5.16) В современных условиях, если исследуются не сверхбыстрые процессы, системы регистрации и управления фурье-спектрографа могут основываться на элементах вычислительной техники. Конечно, центральная часть, изображенного на рис. 5.12 традиционного фурье-спектрографа, (интерферометр с подвижным зеркалом и фотоприемником) должна остаться без изменений, однако системы управления и регистрации могут быть с легкостью изменены. Например, если счетчик импульсов тактовой частоты будет периодически, после отсчета каждой наперед заданной их порции, пересылать в ЦАП, управляющий перемещением зер-
172 —II— Глава 5. Фурье-оптика и фуръе-спектроскопия кала Зз, число соответствующее общему количеству отсчитанных к этому времени импульсов, одновременно передавая АЦП, измеряющему выходной сигнал фотоприемника, команду произвести очередной отсчет, то и в генераторе линейно изменяющегося напряжения и в осциллографе отпадет нужда. Заметим, что при использовании дискретной техники удобно вычислять спектральную плотность исследуемого излучения по формуле ff/(x)coswx (5.17) где Ах — шаг перемещения зеркала 3^, п = (xmax — xmin)/Ax — число зарегистрированных отсчетов значений функции 1(х) и (хтах—лсщш) — полная длина перемещения зеркала Зз в процессе измерения. ЛИТЕРАТУРА 1. Гудмен Дж. Введение в фурье-оптику. — М.: Мир, 1970. 2. Грузман И. С, Киричук В. С, Косых В. Я., Перетягин Г. Я., Спектор А. А. Цифровая обработка изображений в информационных системах: — Новосибирск: Изд-во НГТУ, 2000. 3. Марешаль А., Франсом М. Структура оптического изображения. — М.: Мир, 1964. - 296 с. 4. Зайделъ А. Я, Островская Г. В., Островский Ю. Я. Техника и практика спектроскопии. — М.: Наука, 1972. — С. 44-53. 5. СивухинД.В. Оптика. - М.: ФИЗМАТЛИТ, 2002. - С. 320-323.
ГЛАВА 6 МЕТОДЫ СПЕКТРОСКОПИИ Физика обязана спектроскопии пониманием строения атомов, структуры молекул, определением ряда фундаментальных констант. Однако это история. Сегодняшняя спектроскопия — это область прикладной физики, нацеленной на решение практических задач фактически во всех областях человеческой деятельности от металлургии до микробиологии и экологии. Для решения этих задач, как правило, применяются не обычные классические спектрографы, а созданные на их основе специализированные приборы, бесчисленное множество которых мы естественно рассматривать не будем, сосредоточив свое внимание на принципах спектроскопии и основных особенностях спектральных приборов. 6.1. СПЕКТРАЛЬНЫЕ ПРИБОРЫ И ИХ ОСНОВНЫЕ ХАРАКТЕРИСТИКИ Назначение спектральных приборов — исследование спектрального состава излучения. Соответственно ключевую роль здесь играют элементы, разлагающие свет по длинам волн и оптические компоненты, обеспечивающие регистрацию спектров. Принципиальные схемы классических спектрографов приведены на рис. 6.1. Как видно из рисунка анализируемое излучение поступает в спектрограф сквозь щель i, устанавливаемую в фокальной плоскости коллимирующего объектива 2, Рис. 6.1. Принципиальные схемы классических спектрографов с призмой (а) и дифракционной решеткой (б): 1 — входная щель; 2 — объектив коллиматора; 3 — диспергирующий элемент (призма, дифракционная решетка); 4 — объектив камеры; 5 — фотоприемник
174 Глава 6. Методы спектроскопии что обеспечивает освещение диспергирующих элементов 3 волной с плоским волновым фронтом. Пройдя сквозь призму или отразившись от дифракционной решетки лучи разных длин волн отклоняются на разные углы, в силу чего фокусируются объективом 4 в разных участках фотоприемника 5. Роль последнего выполняют фотопленка, ПЗС-линейка, ПЗС или фотодиодная матрицы. Отметим принципиальные особенности конструкции спектрографов: во-первых, диспергирующие элементы освещаются волной с плоским волновым фронтом и, во-вторых, плоскости щели и фотоприемника оптически сопряжены. Это значит, что так называемые «спектральные линии», которые мы видим на спектрограммах, есть не что иное, как изображения входной щели, образованные лучами разных длин волн. Эти же принципиальные особенности реализуются и в спектрографах с отражательной оптикой — схема Черни—Тернера (рис. 6.2) и в автоколлимационных схемах. Принципы работы автоколлимационных схем понятны из рис. 6.3. Как видно из рисунка, объектив в такой схеме выполняет как роль коллиматора, формирующего волну с плоским волновым фронтом, так и объектива, фокусирующего дифрагированное излучение на фотоприемник. Входная щель и фотоприемник располагаются в одной плоскости друг под другом на равных расстояниях от оси Z. Поворот дифракционной решетки вокруг оси X позволяет приводить на фотоприемник разные участки спектра. Достаточно часто в автоколлимационных схемах используется и отражательная оптика. Вид А Рис. 6.2. Спектрограф с отражательной оптикой (схема Черни—Тернера): 1 — щель; 2 — дифракционная решетка; 3 — фоторегистратор; 4 — зеркала Рис. 6.3. Ход лучей в спектрографе с автоколлимационной схемой
6.1. Спектральные приборы и их основные характеристики Дифракционная решетка / 1 1 j. \ h \ w N. !f А В ft >'■' ш If ш ж л т ' Д« — \ \ [\ \ \ \ ll \\ \\ V \ \ \ \ \ 1 \ / I Фотоприемник Рис. 6.4. Спектрограф с вогнутой решеткой Особое место среди спектрографов занимают спектрографы с вогнутыми решетками (рис. 6.4). Как видно из рисунка, вогнутая фокусирующая (часто цилиндрическая) решетка с радиусом кривизны R касается в средней своей части виртуальной окружности с диаметром D = R (так называемый «круг Роуланда»). На круге Роуланда располагаются как входная щель, так и фотоприемник с цилиндрический поверхностью, примьпсающей к кругу Роуланда. Проследим ход лучей в этой схеме. Пусть входная щель располагаются в точке S круга Роуланда. Тогда луч SAy падающий на решетку под углом а, в нулевом порядке отразится под тем же углом и придет в точку С круга Роуланда (линия ОА — перпендикуляр к решетке, поскольку проведена из центра ее кривизны). Некоторый луч SB падает на решетку под тем же углом а, поскольку углы SAO и SBO опираются на одну и ту же дугу SO. Поскольку ОБ перпендикуляр к решетке, луч нулевого порядка отразится под тем же углом а и придет в ту же точку С, так как углы SAC и SBC опираются на одну и ту же дугу SC. Понятно, что в точке С соберутся все лучи нулевого порядка, лежащие внутри угла (р. Пусть луч AD — это некоторый луч, первого порядка дифракции, дифрагированный из точки А под углом /3 и пересекающий круг Роуланда в точке Z). Луч BD той же длины волны, дифрагированный из точки В — ясно, что под углом тем же самым углом )8 — также пересечет круг Роуланда в точке Д просто
176 —■ Vr Глава 6. Методы спектроскопии потому, что углы OAD и OBD равны, поскольку опираются на ту же самую дугу OD. Отсюда ясно, что все лучи первого порядка дифракции и одной и той же длины волны А, будут сфокусированы в точке DlK В современных спектрографах этого типа используются голографические решетки, позволяющие сфокусировать дифрагированное излучение не на цилиндрическую, а на плоскую поверхность, касательную к кругу Роуланда, что упрощает конструкцию фотоприемника. Монохроматоры отличается от спектрографов наличием выходной щели, выделяющей излучение в некотором, обычно узком спектральном интервале АЛ. Выходная щель устанавливается в плоскости оптически сопряженной с входной щелью, непосредственно перед фотоприемником (ФЭУ, фотодиод). Существует два основных способа использования монохроматоров. При стационарных или слабо меняющихся во времени процессах спектр сканируется мимо выходной щели путем поворота дифракционной решетки, а сигналы фотоприемника записываются как функция угла поворота (т. е. как функция длины волны). При исследовании быстропротекающих процессов сигнал фотоприемника отражает изменение во времени интенсивности выбранной спектральной линии. Полихроматором называется многоканальный спектрограф, в котором в отличие от монохроматора в плоскости оптически сопряженной с входной щелью, устанавливается не одна, а несколько щелей и, соответственно, несколько фотоприемников. Такой прибор удобен в тех случаях, когда нужно, например, измерить соотношение изменяющихся во времени интенсивностей отдельных спектральных линий или областей непрерывного спектра, что необходимо, в частности, при измерении температуры плазмы методом томсоновского рассеяния2). Впрочем, в этом последнем случае возможна конструкция полихроматора основанная не на диспергирующих элементах, а на селективных зеркалах. Принципиальная схема подобного устройства, используемого при измерении температуры плазмы методом томсоновского рассеяния на установке JET (Joint European Torus), приведена на рис. 6.5. Принцип действия такого полихроматора понятен из рисунка. Заметим, что такого типа поли- хроматор особенно полезен при исследовании протяженных источников излучения. Перечислим основные параметры, характеризующие спектральные приборы. Угловой дисперсией называется величина D^ = dipjdX, где dq> — изменение угла отклонения луча диспергирующим элементом при изменении длины волны на величину d\. Линейная дисперсия — Dt = dl/dX = 1) Формальное доказательство фокусирующих свойств вогнутых решеток можно найти в монографии [2, С. 320-323]. 2) См. гл. 9.
6.2. Диспергирующие элементы 177 где / — фокусное расстояние объектива камеры. Обратная дисперсия — Dj~l; чаще всего выражается в ангстремах на миллиметр. Разрешающая способность характеризуется аппаратной функцией g(A), иногда величиной ДА/А или обратной ей величиной А/'ДА, где ДА — полуширина функции g(A). Светосила прибора — это отношение энергии на выходе спектрографа к энергии источника излучения. Область дисперсии определяется спектральным интервалом Атах — Ащш, доступным для регистрации. В ряде спектрографов его можно изменять путем поворота дифракционной решетки, а также увеличивать или уменьшать, используя решетки с меньшей или большей частотой штрихов соответственно. Рис. 6.5. Принципиальная схема полихроматора, используемого при измерении температуры плазмы методом томсоновского рассеяния на установке JET 6.2. ДИСПЕРГИРУЮЩИЕ ЭЛЕМЕНТЫ Сегодня дифракционные решетки основной компонент большинства спектральных приборов — в наше время призменные спектрографы и монохроматоры большая редкость. Впервые дифракционные решетки, как устройства для разложения света по длинам волн, были предложены и исследованы еще в 1786 г. Дэвидом Риттенхаусом. Они состояли из множества тонких проволочек, натянутых на рамку3). Теория дифракционной решетки была создана в 1821 г. Фраунгофером; им же была предложена и дожившая до наших дней технология изготовления прозрачных4) и отражательных дифракционных решеток. Дифракция на таких решетках пояснена на рис. 6.6. Как известно, направления на главные максимумы дифракции определяется из условия кратности вели- 3) Понятно, что так изготовленные дифракционные решетки обладали очень малой угловой дисперсией. 4) Называемых иногда дифракционные решетки, работающие «на просвет».
178 Глава 6. Методы спектроскопии чине А разности Д длин оптических путей лучей, распространяющихся сквозь разные щели решетки: Д = кХ. (Собственно это и есть условие формирования волнового фронта дифрагированного излучения — поверхности с одинаковой фазой световой волны.) Как видно из рис. 6.6 для прозрачной решетки при дифракции в +1-й порядок Д = &\ + Дг и д = д2 — Д! при дифракции в —1-й порядок. При этом Д1 = Т sin iff, a Д2 = T sirup. (Из рис. 6.6 видно, что у/ — это угол падения излучения на решетку, а ср — угол дифракции.) Таким образом, например, для прозрачной решетки при дифракции в +1-й порядок Д = Д1 + Д2 = T(sxn<p + sin v) = кХ. (6.1) Обратим внимание на то, что волна нулевого порядка распространяется по направлению падения излучения на решетку у/, а углы дифракции волн +1-го и -1-го порядков симметричны относительно у/ (рис. 6.6). Заметим также, что для отражающей решетки напротив — Д = Д[ + Дг при дифракции в —1-й порядок (рис. 6.7) и Д = Дг — Ai при дифракции в +1-й порядок. Заметим, что при sintp = — sin у/ уравнение (6.1) удовлетворяется при любых А. Это условие формирования волны нулевого порядка, которая, как бы зеркально, «отражается» от поверхности решетки \(р = -у/). Углы дифракции волн +1-го и -1-го порядков симметричны относительно у/. а б Рис. 6.6. Дифракция света на прозрачной решетке: а) в + 1-й порядок дифракции (Д = Ai + Д2) и б) в -1-й порядок (Д = Дг - ДО. Направления лучей, дифрагированных в + 1-й и —1-й порядки дифракции выделены жирными линиями. BOi — волновой фронт падающего излучения, ВФг — волновой фронт дифрагированного излучения Дифференцируя уравнение (6.1) получим выражение для угловой дисперсии Dv = % = _*-. (6.2) v dX Tcos<p v '
6.2. Диспергирующие элементы 179 +1 a b Рис. 6.7. Дифракция света на отражающей решетке Проведем анализ дифракции на решетке традиционным методом, в котором рассматривается дифракция на одной из щелей, а затем суммируется излучение от их совокупности [1, 2]. Для того, чтобы упростить выкладки и тем самым облегчить понимание сути дела, начнем со случая нормального падения излучения на решетку. Действительно, пусть на пропускающую дифракционную решетку с параметрами а = Ь= Т/2, перпендикулярно ее плоскости падает монохроматическая волна с плоским волновым фронтом и амплитудой ао(х,у) = const. Разность оптических путей между волнами, исходящими из двух соседних щелей решетки при перпендикулярном падении на нее первичного излучения будет равна Tsinip, а разность фаз S = (2n/A,)Ts\nq>, где <р, как и раньше, угол дифракции. (Понятно, что разность фаз между волнами, исходящими из первой и третьей щелью будет равна 2S, между первой и четвертой 35 и т.д.) Поле в точке наблюдения (на бесконечности или в фокальной плоскости собирающей линзы) обусловленное излучением одной (пусть первой) щели будет равно величине Aq sin и/и, где при а = Ь= Т/2 Aq = uq/2, au = (n/A,)bsin<p. Результат интерференции лучей, исходящих из всех щелей решетки может быть представлен суммой Поскольку сумма в скобках представляет собой геометрическую прогрессию, суммарное поле световой волны в точке наблюдения запишется как -iN6 (6.3) sin и 1 — е и 1 - е-'° Соответственно, распределение интенсивности по углам дифракции (6.4) Переходя к тригонометрическим функциям, получим /(</>) = sin2 и sin2 —г it si sin v (6.5) Здесь v = (я/Л) Т sin q>.
180 Jl- Глава 6. Методы спектроскопии Этот результат может быть представлен в виде /(<?)= 4/i(")/2(v), (6.6) где/Ки) = sin2 и/и2 — обуславливает интенсивность гармоник разных порядков дифракции, a^(v) = sin2 Nv/sin2 v — является аппаратной функцией дифракционной решетки fi(v) = g(y) с предельно возможной минимальной полушириной 0min5). В общем случае, когда излучение падает на решетку неперпендикулярно, аргументы этих двух функций будут представлены выражениями и = -bcosy/sin(<p — у/); л (67) v = - r(sin <р — sin у/), л если А = Дг — Ai и и = -£costpsin(<p + у/); п (68) v = -г r(sin <p + sin у/) А при А = Ai -h A2. В остальном формула (6.5) останется неизменной. На рис. 6.8 показано распределение интенсивности по углам дифракции /(</?) = A^f\(u)f2(v) при нормальном падении излучения на решетку с параметрами я = Ь— Т/2, N = 10. (Столь малое количество интерферирующих лучей выбрано лишь затем, чтобы сделать наглядной иллюстрацию — иначе, при реальном количестве лучей и выбранном масштабе по оси аргумента, функция.£(v) предстала бы перед нами в виде отрезков прямых, перпендикулярных оси абсцисс.) Поскольку у/ = 0, Тsirup = kX, и = (n/X)bsin<p = nk(b/T), a v = (п/Х)Тsinq> = як, где к, как и раньше, порядок дифракции. Соответственно, при а — Ь= Т/2 и = v/2. Отметим, что ^(v) достигает так называемых главных максимумов каждый раз когда |v| = кп. Обратим внимание — между главными максимумами эквидистантно располагаются N — 2 дополнительных максимумов и N — 1 минимумов. Угловое расстояние между соседними дополнительными минимумами или максимумами, равно как и между главным максимумом и ближайшим к нему минимумом, определяются из условия Tsin<p = A(k+ В спектроскопии две близкие спектральные линии Х\ и Лг считаются разрешенными, если главный максимум дифракционной картины одной 5) Реально полуширина аппаратной функции обусловлена качеством объективов спектрографа.
6.2. Диспергирующие элементы 181 волны совпадает по своему положению с первым дифракционным минимумом другой <yw(Ai) = (Pminifa)- Соответственно Tsimp = Xxk = Ts\n<p = X2(k + l/N), откуда X\k = Хг(к+ l/N) или kN = A2/(Ai — A2). Поскольку Х\— Хг — ДА, разрешение дифракционной решетки т. е. равно произведению общего числа интерферирующих лучей (штрихов решетки) на порядок дифракции. Пусть, например, А = 5 • 10~5 см, решетка имеет 1200 штрихов/мм и ее длина 10 см. Тогда Дтш « 0,04 А в первом порядке дифракции и ~ 0,014 А в третьем; при этом области дисперсии остаются достаточно большими — 2500 А и 1250 А соответственно. Подчеркнем еще раз — это оценка снизу (лучше не бывает!), это то предельное разрешение, которое достигалось бы, будь решетка и объективы спектрографа идеальными. 1 0,9 0,8 0,7 . 0,6 0,4 0,3 0,2 0,1 П 7 / /1 / ...-••■ ' 1 \ \| • II \i 1 i ii 1 1 JL. i I | 1 L -9,42 -6,28 -Зтг -3,14 0 и 3,14 6,28 9,42 Зя Рис. 6.8. Распределение интенсивности по углам дифракции при нормальном падении на решетку с параметрами а= Ь= Т/2. Все кривые нормированы на 1 При определении области дисперсии дифракционных спектрографов исходят из того, что излучения разных порядков дифракции не должны перекрываться. Действительно, если в первом порядке дифракции
182 JL Глава 6. Методы спектроскопии под некоторым углом ср наблюдается излучение с длиной волны А, то под этим же углом будет наблюдаться излучение с длиной волны А/2 в спектре второго порядка, А/3 в спектре третьего порядка и т.д. Поскольку углы дифракции для налагающихся порядков одинаковы, из уравнения (6.1) следует, что А/А:, = A(/+i)£(/+i), т. е. kk = (к + 1)(А — ДА), откуда область дисперсии ДА = *тт- <610) Как видно из рис. 6.8 — и мы уже говорили об этом в предыдущей главе — интенсивность излучения в первом порядке дифракции, используемом чаще всего в спектрометрии, составит малую долю от интенсивности, анализируемого излучения. Это и было причиной того, что до внедрения в практику профилированных решеток спектрографы с дифракционными решетками сильно уступали призменным спектрографам по светосиле. Положение кардинально изменилось после предложения Рэлея, реализованного впервые Вудом, использовать профилированные дифракционные решетки (рис. 6.9). Как видно из рисунка, здесь также А = А\ Н- Д2 = T(sinq) + sinyr) = kX, Другими словами углы дифракции будут теми же, что и для непрофилированной решетки. Однако, поскольку из-за наклона отражающей грани штрихов имеет место дополнительный набег фазы, распределение интенсивности излучения по углам дифракции будет иным. Можно показать, что в этом случае аргумент функции/i(w), обуславливающей распределение интенсивности гармоник разных порядков дифракции, запишется как и= jbcos(y/ + a)sin(<p + v + 2a). (6.11) Изменяя угол наклона грани штриха решетки а, можно добиться концентрации излучения в желаемом порядке дифракции. Физический смысл этого эффекта иллюстрирует рис. 6.10. Пусть на профилированную решетку падает излучение перпендикулярно граням штрихов и под углом Литтрова, т. е. под углом у/, соответствующим первому порядку дифракции <р. Подберем такие параметры решетки (N, Ь, а), чтобы при у/ = tp нулевой порядок был бы направлен вдоль грани штриха (или под близким к этому направлению углом, что реализуется при \у/\ = |а|). В этом случае, во-первых, отсутствуют все отрицательные порядки дифракции, так как излучение не может распространяться во внутрь решетки. Во- вторых, поскольку волновой вектор к перпендикулярен грани штриха, вектор Е электромагнитного поля лежит в плоскости грани, так что перпендикулярно грани излучение максимально, а вдоль направления Е невозможно (см. диаграмму дипольного излучения на рис. 6.10). В такой схеме эффективность профилированных решеток, используемых, например, в стретчерах — устройствах для растягивания во времени фемтосе-
6.2. Диспергирующие элементы 183 кундных лазерных импульсов — достигает 90—95%. То есть практически все, падающее на решетку излучение, концентрируется в первом дифракционном порядке. 0 Рис. 6.9. Дифракция света на профилированной решетке Диаграмма ^| направленности дипольного излучения ) Рис. 6.10. Концентрация дифрагированного излучения в 1-й дифракционный порядок Впервые призма была использована для разложения «белого» излучения в спектр еще в XVII в. (Исаак Ньютон, 1672 г.). Затем долгие годы призма была основным диспергирующим элементом спектрографов; да и сегодня призменные спектрографы еще встречаются в лабораторной практике. Заметим также, что призма оказалась очень удобна при измерении показателя преломления и дисперсии прозрачных веществ. Ход лучей в призме с равными гранями, основанием Т и углом при вершине в показан на рис. 6.11. Из рисунка видно, что угол между волновыми векторами преломленного призмой изучения <р = а\ - /5\ + аг - ft, а угол при вершине в = ft + ft, так что <р = ct\ + аг — в. Углы а и /36) связаны соотношениями Синеллиуса: ns\nf}\; п sin ft, (6.12) 6) Понятно, что эти углы отсчитываются от нормали к соответствующей поверхности.
184 Глава 6. Методы спектроскопии где л, естественно, показатель преломления вещества призмы. По целому ряду причин предпочтительна такая схема установки призмы, при которой реализуется симметричный ход лучей, как это показано на рис. 6.11. (В этом случае, в частности, достигаются минимальный угол отклонения и наибольшая разрешающая способность призмы.) При этом а\ = cti = а, Pi = Pi = Р = в/2 и d<p _ 2 dn _ T^dn li~~n gaa7X ~ ~b~dX (6.13) Суммарная дисперсия ряда призм расположенных последовательно друг за другом равна сумме дисперсий отдельных призм, если каждая из них установлена по схеме минимального отклонения. В противном случае нужно учитывать возникающее угловое увеличение призм. Рис. 6.11. Ход лучей в симметричной призме Аппаратная функция призмы g(<p) обусловлена дифракцией на краях ограничивающей диафрагмы (рис. 6.12): (6.14) где и = nbsin((p)/X. Угловое расстояние А<р между главным максимумом (и = 0) и первым минимумом (и — я), как известно, равняется отношению Х/Ь. Напомним, в спектроскопии две спектральные линии считаются разрешенными, если угол между их волновыми векторами у больше или равен Аср. На рис. 6.12 показаны положения двух волновых фронтов А\ — В\ и Дг — 2*2 после преломления в призме излучения с длинами волн dn 7) При в = 60° ^ = ал 8) «Полуширина» этой функции р « 0,9л.
6.2. Диспергирующие элементы 185 А2 Рис. 6.12. Волновые фронты прошедшего сквозь призму излучения, с двумя близкими длинами волн А и А + ДА Ai и Аг. Угол между волновыми фронтами — а, следовательно, и между перпендикулярными им волновыми векторами В\Вг — _ 7" А2Вг 9) Запаздывание одного волнового фронта относительно другого и появление угла между ними обусловлено различаем показателей преломления п\(Х\) и п2(Х2) и различной длиной путей t\ и t2 в верхней и нижней частях призмы. Соответственно В\В2 = t2(ft\ — п2) = t2An9 где Дл = п\ — п2. Поскольку ширина светового пучка А2В2 — Ь Теперь условие разрешения у = Д<р = А/£ запишется как X = (t2 — откуда Для ряда призм, поставленных одна за другой А Если излучение покрывает всю призму (t\ = 0, ^ = Г) (6.15) (6.16) (6.17) 9) Ввиду малости угла у принято tgy = у.
186 Глава 6, Методы спектроскопии Отсюда видно, что разрешающая способность призмы зависит только от дисперсии показателя преломления и от разности длин оптических путей, проходимых в призме двумя крайними лучами светового пучка. К сожалению, дисперсия показателя преломления dn/dX нелинейна, откуда проистекают два следующих обстоятельства. Во первых, нелинейность шкалы А в спектрометре, что, естественно, не прибавляет энтузиазма при расшифровке спектрограмм и обработке результатов измерений. Во вторых, спектры сжаты в их красной области и расширены в синей. Как результат, различная (в несколько раз!) разрешающая способность. Заметим, что разрешающая способность призмы — величина очень полезная для всякого рода оценок — к сожалению, не есть разрешающая способность спектрографа, содержащего кроме призмы еще, по крайней мере, два объектива, не говоря уже об однородности показателя преломления вещества призмы и качестве полировки ее граней. Корректной мерой разрешающей способности спектрографа, конечно же, является аппаратная функция g(A), которую по целому ряду причин надежнее экспериментально измерять, чем рассчитывать. Разрез в плоскости YZ Разрез в плоскости XZ * Рис. 6.13. Причина искривления спектральных линий Две дополнительные беды призменных спектрографов — это астигматизм и искривление спектральных линий. Благодаря астигматизму каждая точка входной щели изображается в сопряженной выходной плоскости в виде короткого отрезка линии, перпендикулярного оси А. Это ухудшает пространственное разрешение вдоль щели, но не приводило бы к уширению линий спектра, т. е. к потере спектрального разрешения, если бы не искривление спектральных линий. Последнее пояснено на
6.3. Спектральные приборы с высоким разрешением -J\y- 187 рис. 6.13. В нижней части рисунка показан ход лучей в плоскости XZ. (В этой проекции щель выглядит в виде отрезка прямой длиной Л, обычно называемой «высотой щели».) Как видно из рисунка, лучи из центра щели (х = 0) падают на призму нормально к ее поверхности, а лучи исходящие не из центра (х ф 0) под некоторым углом — тем большим, чем больше координата х. Эти нецентральные лучи пройдут больший путь в теле призмы и соответственно отклонятся на больший угол, что приведет к сдвигу спроецированного изображения такой нецентральной точки по оси А в сторону более коротких длин волн. В результате спектральные линии окажутся искривленными, обращенными выпуклостью в сторону длинных волн. Подобные искривления спектральных линий имеют место и в спектрографах с дифракционными решетками, однако при достаточно больших фокусных расстояниях используемых объективов (~ 1 м) и относительно небольшой высоте щели (1—2 см) они ничтожны и не превышают полуширину аппаратной функции. 6.3. СПЕКТРАЛЬНЫЕ ПРИБОРЫ С ВЫСОКИМ РАЗРЕШЕНИЕМ Разрешающая способность спектрографов не превышает 104—105. Однако для целого ряда измерений (сверхтонкая структура спектральных линий, изотопные сдвиги и т. п.) требуется разрешение, по крайней мере на порядок лучшее, позволяющее разрешать спектральные компоненты различающиеся на 10~2—10~4 А. Такие приборы строятся на основе интерферометрических схем и носят название «приборы высокой разрешающей силы». Строго говоря, дифракционная решетка тоже интерференционный прибор, в котором высокая разрешающая способность обусловлена интерференцией множества световых пучков. В чем же разница? Как нам известно, в спектральных приборах, основанных на интерференции разрешение Я = А/ДА = kN = TV До/А, где До — разность хода между соседними интерферирующими пучками, &N — общее число интерферирующих пучков. В спектрографах с дифракционными решетками До невелико — несколько А — и высокое разрешение достигается за счет увеличения числа штрихов (вплоть до десятков тысяч), т. е. увеличением либо размера решетки, либо частоты штрихов. Однако, и то и другое ограничено. В приборах высокой разрешающей силы, напротив, число интерферирующих пучков относительно невелико (N = 10—100), но До = 0,5-50 см. «Обратная сторона медали» этих приборов высокой разрешающей силы, обеспечивающих сверхвысокое разрешение вплоть до десятитысячных долей ангстрема — это ограниченная область дисперсии. Действительно, условия образования интерференционных максимумов — это кратность величины До целому числу длин волн До = кХ
188 Глава 6. Методы спектроскопии (6.18) Ч Ч R или До = к'(Х + ДА). Минимальное значение ДА соответствует разности к — к! = 1, откуда несложно получить А = £ ~ к До' Эта величина носит название постоянной прибора. Пусть, например, До = 5 см, а А = 5 • 10"5 см. Тогда ДА = 5 • 10"10 см = 0,05 А. Как видим, совсем немного — такова плата за высокое разрешение. По этой причине эти приборы часто используются в схемах с дополнительными монохроматорами или спектрографами, о чем подробнее мы поговорим несколько позже. Как понятно из изложенного выше, основа таких приборов — оптическая схема, обеспечивающая интерференцию многих пучков с большой разностью фаз 2яДо/А между ними. Наиболее известны приборы, носящие названия «эшелон Майкель- сона», «пластинка Люммера—Герке», «эталон (интерферометр) Фабри— Перо». Первые два сегодня практически не употребляются, поэтому мы подробно разберемся лишь с эталоном Фабри—Перо, понимая, что принципы работы всех этих приборов одни и те же. Эталон Фабри—Перо состоит из двух обращенных друг к другу параллельных стеклянных или кварцевых пластинок, на внутренние поверхности которых нанесены отражающие покрытия. Наружные поверхности просветлены или закошены, чтобы избежать паразитной интерференции. Ход лучей в ин- ч ^ ч Рис. 6.14. Ход лучей в интерферометре Фабри—Перо терферометре Фабри—Перо показан на рис. 6.14. Условие образования интерференционных максимумов запишутся как 2Tcosq> = kX. (6.19) Найдем дисперсию эталона. Продифференцируем приведенное равенство по A dipjdX — —k/2Tsin(p9 исключим к — dipjdX — — 1/Atg<p, что при малых q> даст Л/л I (6.20) dip J Как видим, дисперсия эталона не зависит от расстояния между зеркалами Г и растет с уменьшением (р.
6.3. Спектральные приборы с высоким разрешением 189 800-10 1-3 600 10 1-3 400 10 1-3 1-3 j 4 : : !| •: { /i 1 1 1 1 / / J j i\ !\ 1 \ \ \ k ^ ■ .' ' —— /! / 1 .* | ' / / • !\ !\ 'i \ l 1 \ \ ч \ « 1 / | f / ' i • 1 *: 1 ■ 1 1 l 1 \ > \ 4 \ /(5,0,75) /(^,0,5) 200-10 0 _7,54 -3,77 0 3,77 7,54 — 37Г 5 ЗЯ Рис. 6.15. Интенсивность излучения в дальней зоне интерферометра Фабри— Перо при различных коэффициентах отражения зеркал: R = 0,95 ( ); R = 0,75 (—); R = 0,5 ( ) Для того чтобы найти результат интерференции, применим тот же алгоритм, который мы использовали при рассмотрении дифракционной решетки. Амплитуды волн, прошедшие сквозь интерферометр образуют бесконечную последовательность пучков с убывающей интенсивностью ах = Д)(1 - R), a2 =AqR(\ - R)e~i6, аъ = Д>Д2(1 - К)е~аб ..., сумма членов которой представляет собой убывающую геометрическую прогрессию: az = Д)(1 - Д)(1 + Re~i6 + R2e~a6 + Д3е~ш + ...). (6.21) Здесь Д) — амплитуда волны, падающей на интерферометр, R — коэффициент отражения по интенсивности зеркальных покрытий10), 6 = = 2яДо/Л = 4nTcos(p/X — разность фаз между следующими друг за другом лучами (первым и вторым, вторым и третьим и т. д.). Сумма этой геометрической прогрессии =4)" 1 - Re~l° так что интенсивность излучения, прошедшего сквозь интерферометр (1 - R)2 I = aza*z = /о- (6.22) 10) Напомним, что коэффициент отражения по интенсивности R = г2, где г — коэффициент отражения по амплитуде.
190 —/\/- /ля*д tf. Методы спектроскопии Это соотношение известно как формула Эри. (В приведенном выражении не учитывается поглощение в зеркальных покрытиях; при диэлектрических покрытиях оно достаточно мало, тем не менее, должно учитываться при R близкой к единицеП).) Выражение (6.22) и есть аппаратная функция эталона Фабри-Перо, ее графики при различных значениях R приведены на рис. 6.15; максимумы этой функции наблюдаются при 8/2 = кп. При этом До = кХ (на пути между зеркалами укладывается целое число полуволн) и / = /0. За критерий разрешения эталона Фабри—Перо принимается полуширина аппаратной функции /}, т. е. считается, что две спектральные линии могут быть идентифицированы как раздельные, если они отстоят друг от друга на величину р. Из (6.22) найдем, что отношение / 1 /max , . 4Л (6.23) 1 + (l-/02sin2(<5/2) откуда можно получить угол (или значение к), при котором / = /0,5 = /max/2. Если максимуму аппаратной функции соответствует 8/2 = кп, то значению /о,5 соответствует 8/2 = (к+Ак)п. В то же время sin(5/2) = |sin(fc+AA:)tt| = = | sin Дкп | « |Д£л|, если ДА: мало, откуда sin2 (5/2) = (Д&л)2. Подставляя это значение в (6.23), найдем значение ДА:, при котором реализуется значение / = /о,5 = /max/2 Ьк = 7=. Этому значению Д&, как понятно, соответствует значение )8/2; значению р будет соответствовать величина вдвое большая (6к = 2Д&), т. е. 6к=^й. (6.24) VR Как видно из соотношения (6.19), при малых углах падения света на эталон к = 2 Т/ А. Дифференцируя это равенство получаем \8к + к б А, = 0, откуда Л U <6-25) Подставляя сюда к = 2Т/Х и 8к из соотношения (6.24) получим, что ^ 2пТ \/R А 1-Я' (6.26) П) Поглощение может быть учтено введением в формулу (6.22) соответствующего коэффициента на основе равенства Тг + Аь И- R = 1, учитывающих соответственно пропускание ТГь поглощение Аь и отражение R зеркал. Заметим, что при Аь = 0, Тг = 1 - Л.
6.3. Спектральные приборы с высоким разрешением —IV/. 191 а минимальный разрешаемый интервал, выраженный в длинах волн «А = Л'(1"/?- (6.27) Чтобы покончить с формальной стороной вопроса поясним смысл так называемого «эффективного числа интерферирующих пучков» Neff. N& — это то количество интерферирующих пучков равной интенсивности, которые обеспечивают ту же разрешающую способность, что и бесконечная последовательность пучков с убывающей интенсивностью эталона Фабри—Перо K = kNeff = ^Ntft. (6.28) Комбинируя соотношения (6.28), (6.25) и (6.24) получим *« = tt (629) Используя формальный аппарат, мы получили много полезных сведений о интерферометре Фабри—Перо. А. Н. Тихонов говорил, что «математика тем хороша, что позволяет не думать — вы пишете исходные уравнения, проделываете формальные выкладки и результат готов». Достоинства математики и ее продуктивность при теоретическом анализе физических явлений бесспорны. Однако формально полученные решения недостаточны, чтобы грамотно планировать эксперимент, создавать новые измерительные средства, да и вообще двигаться вперед. Так что нам не остается ничего другого, как задумываемся о физическом смысле, полученных решений. Рассмотрим ситуацию, при которой монохроматическое излучение падает нормально к поверхности зеркал и на длине Т укладывается целое число полуволн Т = АгА/2. Тогда разность фаз между интерферирующими пучками S = АлТ/Х = Ink, т. е. 6/2 —пк и в соответствии с выражением (6.22) интенсивность падающего на интерферометр излучения и прошедшего сквозь него будут равны /о = /. Зададимся вопросом — почему система из двух последовательно стоящих зеркал, пропускание каждого из которых (1 — К) (подчас несколько процентов) оказалась прозрачна для излучения? Первый ответ, который напрашивается — все это результат синфазного суммирования вышедших из интерферометра световых пучков, предварительно многократно отраженных параллельно стоящими зеркалами. Ответ правильный. (Кстати, световые пучки внутри интерферометра также синфазно суммируются.) Однако, обратим внимание на следующее — излучение внутри интерферометра с интенсивностью /^иза ним, где / = /о, разделены выходным зеркалом с пропусканием (1 — К). Понятно, что такое возможно лишь в том случае, если /шП больше чем / = /о в 1/(1 — К) раз. Другими словами,
192 Глава 6. Методы спектроскопии интенсивность излучения, а значит и плотность энергии внутри интерферометра в 1/(1 - R) раз больше, чем вне его. Это явление хорошо известно специалистам лазерщикам, для которых лучевая прочность зеркал не пустой звук. По сходной причине падающее на интерферометр излучение не отражается от входного зеркала, оно становится как бы прозрачным для падающего излучения. На самом деле отражение, конечно же, имеет место (см. рис. 6.14), однако по тому же направлению распространяются и компенсирующие, находящиеся в противофазе лучи а*, а\, а\, Это и есть причина, по которой отражение как бы отсутствует. Заметим, что все сказанное имеет место в условиях резонанса, когда на длине Т укладывается целое число полуволн Т = &А/2, т. е. 6/2 = як, и в стационарной ситуации. Дело в том, что два параллельных зеркала образуют оптический резонатор или, если угодно, оптический накопитель энергии. Время установления колебаний в резонаторе Д* — это как раз время накопления внутри резонатора энергии, соответствующей такому значению /цщ, которое обеспечивает интенсивность излучения за интерферометром / = /о. Заметим также, что все полученные нами выше соотношения (6.22)-(6.29) точны также только в стационарной ситуации, после установления колебаний в резонаторе, т.е. по истечению времени ДЛ Оценка Д/ может быть получена из значения Neff — для того, чтобы хотя бы приблизиться к предельному спектральному разрешению, необходимо чтобы излучение по крайней мере #eff раз обежало резонатор. Ясно, что для этого потребуется промежуток времени Д/ = N^2T/ccosq>. Насколько точна эта оценка? К сожалению, не представляется возможным при ограниченном числе интерферирующих лучей получить аналитически нечто подобное формуле Эри. Однако, интенсивность излучения, прошедшего сквозь интерферометр при ограниченном числе интерферирующих лучей hm(N, R, 8) можно вычислить, ограничив число членов ряда (6.21), как I]im(N9R96) = яцтЯщп, и оттуда рассчитать разрешающую способность 8л. Результаты расчетов представлены на рис. 6.16. Как видно из рисунка, погрешность измерений при ■ = 1 в 1,3 раза превышает погрешность, достигаемую в стационарной 8л 0,075 0,05 0,025 0 1,0 2,0 Рис. 6.16. Зависимость погрешности измерения фазовых набегов 6 от безразмерного времени установления колебаний в резонаторе N^ \ ^ = 0,6 0/7_ 0,8 0,9
6.3. Спектральные приборы с высоким разрешением —/\у- 193 ситуации, но уже при N^ = 2 ошибка измерения будет отличаться от предельно возможной в третьем знаке после запятой. Есть и другой метод вычисления времени установления колебаний в резонаторе, которое можно найти используя соотношение WO = y^j(l -ехр{"£У2^'})' (630) При Neff = 2, т.е. при Д* = Neff4T/ccosq>9 1[ПП(0 будет отличаться от величины /о/(1 — В) также в третьем знаке после запятой. Значение Д/ = N^2T/ccosip — это оценка временного разрешения эталона Фабри—Перо, т. е. та минимальная длительность измерения, при которой погрешность в измерении б всего в 1,3 раза превысит предельно возможную. Понятно, что если Д/сЬ — характерное время изменения исследуемого физического процесса, то во избежание значительной потери точности необходимо выполнить условие Д/Сь > А'- Пусть расстояния между зеркалами Т = 10 см и коэффициент их отражения R = 0,95. Тогда Д*сЬ > 4 • 10"8 с = 40 не. (При R = 0,98 и Т = 10 см Д*сЬ > 0,1 мкс.) Уменьшив расстояние между зеркалами Т до 0,5 см, найдем, что Д^ь > > 2 • 10~9 с = 2 не. Другими словами и в этом случае эталон Фабри—Перо не пригоден для измерения в пикосекундном временном диапазоне. Можно, конечно, и дальше уменьшать расстояние между зеркалами или коэффициент их отражения, но тогда все преимущество в спектральном разрешении перед обычным спектрографом будет утрачено. Сравним разрешающую способность эталона Фабри—Перо с разрешающей способностью дифракционной решетки (см. с. 181). Пусть здесь также А = 5 • 10~~5 см, расстояния между зеркалами Т = 10 см и коэффициент их отражения R = 0,95. Тогда разрешающая способность эталона Фабри—Перо 5Amin составит 2 • 10~4 А — на два порядка лучше, чем у дифракционной решетки. К сожалению, не задаром — область дисперсии при этом катастрофически сожмется до 0,025 А. Понятно, что уменьшение величины Т пропорционально увеличит область дисперсии, но во столько же раз ухудшит разрешение. Так, если расстояния между зеркалами уменьшить до 2,5 мм, постоянная эталона увеличится до 1 А, а разрешение упадет до 8 • 10~3 А. Ясно, что и такая область дисперсии недостаточна для анализа спектра излучения содержащего совокупность различных длин волн. Поэтому в такой ситуации эталон Фабри—Перо используются в схемах с дополнительными монохроматорами или спектрографами. В первом случае ширина выходной щели монохроматора, стоящего перед эталоном Фабри—Перо, выбирается такой, чтобы обрезать все частоты, лежащие вне области дисперсии. Это позволяет исследовать тонкую структуру какой- либо одной или нескольких очень близко лежащих линий. Во втором
194 —'!/- Глава 6. Методы спектроскопии случае эталон Фабри—Перо, стоящий перед спектрографом, освещается слегка расходящемся пучком. При освещении монохроматическим излучением интерференционная картина, проецируемая на входную щель спектрографа, состояла бы из набора концентрических окружностей с уменьшающимися по мере удаления от центра расстояниями между ними, что, естественно, не проявится, если спектр излучения шире области дисперсии. Однако, после разложения по длинам волн, на выходе спектрографа будут наблюдаться четкие мультиплицированные интерференционные картины, каждая из которых будет отвечать соответствующей длине волны. При этом спектральные линии будут как бы перерезаны поперечными штрихами (вырезанная щелью центральная часть интерференционной картины). При обработке результатов измерения длина волны грубо определяется по положению спектральной линии на спектрограмме, а точно — по интерференционной картине. 6.4. СПЕЦИАЛЬНЫЕ МЕТОДЫ СПЕКТРАЛЬНОГО АНАЛИЗА В этом параграфе мы кратко рассмотрим физические принципы внутрирезонаторной лазерной спектроскопии и спектроскопии, основанной на когерентном антистоксовом рамановском рассеяния света (КАРС)12). Это методы спектрального анализа, применяемые, в основном, в научных исследованиях для изучения спектров молекул. Внутрирезонаторная лазерная спектроскопия — метод исследования поглощения веществ, обусловленных особенностями их молекулярной структуры. В долазерную эпоху эти задачи решались с помощью обычного спектрофотометра, что, кстати, при сильных поглощениях обеспечивает достаточную точность измерений. В этом случае искомые зависимости коэффициента поглощения fi((o) или сечения поглощения а(ш) от частоты излучения находятся из соотношения (6.31) где 1о((о) — интенсивность зондирующего луча, 1(<о) — интенсивность луча, прошедшего сквозь объект исследования п — концентрация поглощающих частиц, a L — длина поглощающего слоя. Экспериментально отношение 1((о)/1о((о) определяется либо частотным сканированием, т.е. изменением частоты узкополосного излучения зондирующего луча, либо напротив с использованием широкополосного зондирующего излучения, такого при котором ширина полосы излучения Да)р много больше спектральной ширины линии поглощения ка)а. В этом последнем случае прошедшее сквозь образец излучение регистрируется с помощью спектрографа. 12) CARS — Coherent anti-Stokes Raman scattering spectroscopy.
6.4. Специальные методы спектрального анализа —' w- 195 Из соотношения (6.31) видно, что при малых ц{ш) отношение I(o))/Iq((o) близко к единице, т.е. точность измерения мала. Улучшить ситуацию иногда помогает увеличение эффективной величины L, для чего используются многопроходные схемы, в которых, отражаясь от зеркал луч, многократно пересекает исследуемый объект, например, кювету с анализируемым газом. Однако, при большом количестве отражений резко уменьшается интенсивность зондирующего луча из за потерь на окнах кюветы, при отражении от зеркал, из-за виньетирования, связанного с расходимостью зондирующего луча и т. п. (Так, например, если потери на один проход составляют всего 10%, то после 10 двойных проходов сквозь кювету интенсивность зондирующего луча уменьшится на порядок величины.) Все это, естественно, приводит к потере точности измерений. Чтобы компенсировать эти, так называемые, «нерезонансные потери» исследуемый объект, как таковой, если это прозрачное твердое тело, или кювету с исследуемым газом или жидкостью, помещаются во внутрь резонатора лазера. При этом, во-первых, наличие активной усиливающей среды в резонаторе позволяет восполнить потери, возникающие как при отражении от зеркал резонатора, так и при прохождении окон кюветы или других оптических элементов, установленных внутри резонатора. Во-вторых — также как и в многопроходных схемах — кювета с исследуемым веществом просвечивается лучами, многократно отраженными от зеркал. При наличии внутри резонатора кюветы с поглощающим веществом при проходе от одного зеркала до другого коэффициент усиления в усиливающей и поглощающей средах составит величину к(а, ц, L) = Qxp{a(a))L{ - id(a))L2}, (6.32) где L\ — путь в активной среде, L2 — длина кюветы, р(<х)) — коэффициент поглощения в исследуемом веществе, а((о) = а((о)п — коэффициент усиления в активной среде, а а(<о) и п — сечение индуцированного излучения и концентрация атомов в инверсном состоянии соответственно. (Заметим, что при этом порог генерации достигается при A^ff exp{2[a(a))Li -/u(a>)Z,2]} = 1 или [a(<D)L\ - n(<o)L2] = - lnreff, где reff — коэффициент, учитывающий как потери на зеркалах, так и другие «нерезонансные потери».) Применив тот же алгоритм суммирования лучей внутри резонатора, что мы использовали при рассмотрении интерферометра Фабри-Перо (см. §6.3) получим13) 1 = 1 [l + rk(a9n,L)]t (6 33) ° [1 - гк(а, /х, L)]2 + 4/*(а, //, L) sin2(6/2)' 13) Более подробно см. Ландсберг Г. С. Оптика. — М.: ФИЗМАТЛИТ, 2006. — Гл. XV.
196—11- Глава 6. Методы спектроскопии Здесь /о — интенсивность излучения активной среды в отсутствии зеркал, / — интенсивность излучения за выходным зеркалом лазера, г и t — коэффициенты отражения и пропускания, и, также как и в интерферометре Фабри—Перо с оптическим путем Т между зеркалами, <5=2яДо/А= = 4тг Т cos q>/ А — разность фаз между следующими друг за другом лучами (первым и вторым, вторым и третьим и т.д.). В таком методе измерения необходимо чтобы ширина полосы излучения А(ор была много больше спектральной ширины линии поглощения Да>й. Поэтому достаточно часто используются лазеры на красителях, т. е. лазеры с активными средами, у которых широкая область люминесценции. Строго говоря, при таком методе зондирования исследуемый объект просвечивается не непрерывным по спектру излучением, а совокупностью частот, соответствующих продольным модам резонатора. (Другими словами, исследуемый объект зондируется дискретно с шагом ДА.) В этом нет ничего страшного, поскольку спектральное расстояние между модами ДА = А2/До достаточно мало. Так если А = 10~4 см, а длина резонатора 1 м, то ДА = 10~2 А, что существенно меньше спектральной ширины линии поглощения. При больших коэффициентах отражения зеркал резонатора, когда основная доля излучения содержится в резонансных модах (6/2 = як), можно пренебречь ничтожной интенсивностью излучения в областях спектра между модами и переписать соотношение (6.33) в виде [1 + та,Ы)М °[lA(Z)]2> где k(a,ti,L) = cxp{a(a))L\ — ii((x))Li\. Разрешив уравнение (6.34) относительно величины к и учитывая, что 21/lot ^> 1, получим к(а, /i, L) = exp{a(a>)Lx - fi((o)L2} 3 1 + ^ht/I = А, (6.35) откуда a(a))L{ -id((o)L2 = \nA = ln(l + y/2I0t/l) -lnr « y/2I0t/I-1nr. (6.36) Конечно, можно найти, пусть громоздкое, но точное решение уравнения (6.33). Однако, как мы увидим из дальнейшего, в этом нет нужды, и главная цель проделанных вычислений показать, что разность {a(a))L\ — fi(a))L2} равна некоторой величине In А, которая зависит только от параметров резонатора (г, /) и мощности накачки /о. Обратим внимание — в данном методе спектроскопии нет необходимости в абсолютных измерениях. Искомое поглощение //(о>) может быть найдено из отношения ii(o)) и а((о) = а((о)п, поскольку сечение а и величина п хорошо известны. Для этого лишь необходимо сравнить значения зарегистрированных на спектрограмме сигналов внутри измеряемой линии поглощения, где
6.4. Специальные методы спектрального анализа —1\у- 197 a((Oin)Li - fi(a)in)L2 = 1пу4 и в непосредственной близости от нее, где //(a>out)L\ = 0, a a((ooui)L\ = In A Точность внутрирезонаторной лазерной спектроскопии невелика (~ 10 %), однако выигрыш по чувствительности по сравнению со спектрофотомет- рией составляет шесть—семь порядков величины. КАРС — когерентное антистоксовое романовское рассеяние света — эффективный метод исследования молекулярного строения вещества. С его помощью просто определяются собственные частоты колебания молекул; он позволяет судить о их симметрии и динамике; характерные спектры рамановского рассеяния позволяют легко устанавливать состав сложных газовых смесей т.д. Однако, при том при всем, КАРС — это лишь следующий шаг в развитии рамановской спектроскопии. Поэтому, прежде чем, рассматривать процессы КАРС, перечислим те физические явления, которые имеют место при обычном рамановском рассеянии (Раман-эффект). • При Раман-эффекте в рассеянном средой свете14) помимо основной компоненты с частотой зондирующего излучения <ар появляются спутники (сателлиты), симметрично расположенные относительно (ор и отстоящих от нее на величину |л>о|, где а>о — собственная частота осцилляторов, характеризующих исследуемое вещество и не зависящая от частоты зондирующего импульса а)р. • Частоты, сдвинутые в «красную сторону», т.е. в сторону меньших частот, (ог = о)р — щ принято называть стоксовыми компонентами; частоты, сдвинутые в сторону больших частот а)ь = а)р + щ — антистоксовыми компонентами. Понятно, что в первом случае фотон зондирующего излучения тратит часть своей энергии на возбуждение молекулы, во втором случае — фотон зондирующего излучения получает добавочную энергию от возбужденной молекулы. Число молекул, находящихся в возбужденном состоянии Ni существенно меньше молекул невозбужденных Nk. Поскольку и Ni и Nk есть результат случайных флуктуации, обусловленных случайными столкновениями, соответствующие интенсивности излучений рассеиваемых в угол 4л 7} и Ik пропорциональны заселенности этих уровней, т.е. 7, ~ JV, и /* ~ Nk (см. гл. 9). Поэтому интенсивность «красных сателлитов» намного больше, чем сателлитов «синих». • Собственная частота колебания молекулы находится из соотношения H(Oq = £, — $к, где £,- и $к — дискретные энергетические уровни молекулы. При больцмановском расселении отношение числа молекул в возбужденном состоянии Ni к числу невозбужденных молекул Nk Nk V\ kT J V kT 14) Подробно о механизмах рассеяния света см. гл. 9.
198 —II- Глава 6. Методы спектроскопии откуда, в частности, видно, что при повышении температуры среды интенсивность «синих сателлитов» должна возрастать, что и наблюдается на опыте. По целому ряду причин именно антистоксовая компонента наиболее плодотворна с точки зрения измерения и последующей обработки и интерпретации результатов эксперимента. Однако, как мы установили, при обычном рамановском рассеянии как раз антистоксовая компонента наименее интенсивна, что, естественно, не упрощает эксперимент. При когерентном антистоксовом рамановском рассеянии эта проблема решается двумя путями — увеличением интенсивности рассеиваемой антистоксовой компоненты и кардинальным улучшением эффективности сбора рассеянных фотонов. Первая задача понятна — необходимо создать в исследуемой среде достаточное количество возбужденных молекул. Это не новое слово в экспериментальной физике — вся резонансная люминесценция основана на таком приеме. Однако, при возбуждении молекул на таком пути возникают значительные трудности, поскольку необходим перестраиваемый источник излучения в дальнем инфракрасном диапазоне, сегодня отсутствующий. Поэтому в методе КАРС используется другой способ резонансного возбуждения молекул. В исследуемый объем одновременно фокусируются два лазерных пучка видимого или ближнего инфракрасного диапазонов с частотами ю\ и а)2, подобранными так, чтобы их разность равнялась бы щ — собственной частоте возбуждаемого осциллятора. При достаточной их интенсивности за счет нелинейности в среде возникает волна биения с частотой (о)\ —o)2) = coq, возбуждающая молекулярные осцилляторы. Одновременно или с некоторой задержкой после достижения их достаточной концентрации исследуемый объект зондируется пробным лучом. (Заметим, что при использовании фемтосекундных лазеров с их широкополосным излучением часто возникает ситуация, при которой удается возбудить не один, а несколько молекулярных осцилляторов.) Однако не это главное в методе КАРС. Главное состоит в том, что возбуждаемые одной и той же электромагнитной волной колебания возбужденных молекул оказываются когерентными. Это замечательное обстоятельство влечет за собой два нетривиальных последствия. Во-первых, при рассеянии зондирующего луча на когерентно осциллирующих молекулах когерентно складываются и амплитуды рассеянных волн, так что интенсивность рассеянного излучения оказывается пропорциональна квадрату числа возбужденных молекул, а не пропорционально их числу, как это имеет место при обычном Раман-эффекте. Во- вторых, рассеянные фотоны распространяются в узком телесном угле, а не излучаются в угол равный 4я, как это имеет место при обычном Раман-эффекте. Дело в том, что если а)р — частота зондирующего излуче-
Литература —'b- 199 ния, (Dq — собственная частота осциллятора, a (os — частота рассеянного излучения, то должны выполняться следующие соотношения: Первое уравнение — это просто уравнение сохранения энергии, второе — ответственно за синфазность рассеянного излучения. Поскольку щ <^(х)р& o)S9 угол в между волновыми векторами кр и к$ достаточно мал, но подчас достаточен, чтобы развести зондирующий и рассеянный лучи. Таким образом, рассеянное излучение распространяется по направлению вектора к5, а его расходимость обусловлена поперечными размерами луча рассеяния, т. е. дифракцией. Оба этих обстоятельства — пропорциональность интенсивности рассеянного излучения квадрату числа возбужденных молекул и распространение рассеянного излучения в малом телесном угле — обеспечивают увеличение чувствительности КАРС-спектроскопии по сравнению с обычной рамановской спектроскопией на пять—шесть порядков величины. ЛИТЕРАТУРА 1. ЗайдельА.Н., Островская Г. В., Островский Ю. И. Техника и практика спектроскопии. — М: Наука, 1972. 2. СивухинЛВ. Оптика. - М.: ФИЗМАТЛИТ, 2002.
ГЛАВА 7 ИНТЕРФЕРОМЕТРИЧЕСКИЕ И ТЕНЕВЫЕ МЕТОДЫ Интерферометрия — один из самых прецизионных методов измерения. Практически нет других инструментов, которые позволяли бы измерять длины с точностью до одной сотой, или даже до одной тысячной, длины световой волны. Современная оптическая промышленность просто не могла бы существовать без интерферометрических инструментов — безусловного гаранта качества оптических изделий. Обтекание воздушными потоками моделей самолетов и ракет в аэродинамических трубах, моделирование входа космических аппаратов в плотные слои атмосферы, процессы формирования ударных и детонационных волн, измерения распределений плотности плазменных образований — вот далеко не полный перечень плодотворного использования интерферометрии. С помощью интерферометрии невозможно измерять длительность временных промежутков непосредственно. Однако можно измерять длину оптических путей, а значит и время необходимое для их преодоления. Типичный пример — классические опыты Альберта Майкельсона и Эдварда Морли. По своему значению их эксперимент, известный как эксперимент Майкельсона—Морли, считается в истории науки одним из наиболее важных, положивших начало созданию специальной теории относительности. В их опытах разница во времени распространения двух лучей, одновременно вышедших в разных направлениях из одной и той же точки пространства и вернувшихся обратно после отражения от зеркал измерялась с точностью порядка 3 • 10"17 с. Безусловный рекорд для того времени! Итог интерферометрических измерений — интерферограмма — результат интерференции световой волны прошедшей сквозь объект исследования или отраженной от него (так называемая «предметная» волна) с когерентной ей «опорной» волной, чаще всего волной с плоским волновым фронтом. Таким образом, для получения интерферограммы достаточно совместить в некоторой плоскости эти две волны. Устройства, реализующие это совмещение, называются интерферометрами. На сегодняшней день насчитывается не один десяток их типов. Мы не будем рассматривать множество их схем или их устройств, а сосредоточим свое
7.1. Распределение интенсивности света в интерференционной картине 201 внимание на физических аспектах интерферометрии, методах интерферометрии и способах обработки интерферограмм. 7.1. РАСПРЕДЕЛЕНИЕ ИНТЕНСИВНОСТИ СВЕТА В ИНТЕРФЕРЕНЦИОННОЙ КАРТИНЕ Пусть, в интерферометре Маха—Цендера (рис. 7.1), в качестве источника излучения использован одночастотный лазер, генерирующий плоскую волну U(t) = Щё***, которая распространяется вдоль оси Z. Здесь Щ — амплитуда, а ш — фаза волны. Рассмотрим распределение амплитуд световых волн на экране !), установленном за интерферометром параллельно плоскости X, Y. «Опорная» волна U\(t)9 т.е. волна не прошедшая сквозь объект исследования, на экране будет отставать по фазе от излученной, так что Ui(t)=tk\exp{ia>(t-Zi/c)}9 (7.1) где Щ\ — амплитуда «опорной» волны, си = 2/rv — ее круговая частота (v — частота световой волны), t — время, Z\ — расстояние от источника (начало координат) до точки наблюдения, т. е. до экрана. Лазер <Ч R = 0,5 R= 6Ь-\\-- Фоторегистратор \ R=\ Объект исследования Рис. 7.1. Интерферометр Маха-Цендера Естественно, что волна £^(0» прошедшая сквозь объект исследования, или, как говорят, «предметная» волна также будет отставать по фазе от излученной волны: /• / /.- ПАТ Т \ ~\ (7.2) !) Понятно, что «экран» в нашем случае это фотопленка, ПЗС-матрица, фотокатод электронно-оптического преобразователя или нечто тому подобное.
202 —' w- Глава 7. Интерферометрические и теневые методы где Uo2 — амплитуда «предметной волны», а (л— 1)AZ — увеличение длины оптического пути за счет распространения «предметной» волной в исследуемом объекте с показателем преломления п. Uoi (0/Г"' uwy I Обозначим фазу «опорной» волны 0i = o)(t — Z\/c), а фазу «предметной волны 02 = (D[t-(n-\)bZ/c-Z2/c]. Тогда сумма двух этих волн в точке пространства, где происходит их сложение, \ Uo2(t) запишется как i = #oiexp{/0i} - = Uzexp{i0z}, (7.3) Рис. 7.2. Векторная диаграмма, иллюстрирующая суммирование ™e Ъ ~ амплитуда результирующей све- двух интерферирующих волн товой волны, a 0z — ее фаза. Эту ситуацию иллюстрирует рис. 7.2. Фотослой, фотокатод, ПЗС-матрица, как почти всякий другой детектор, реагирует на освещенность или интенсивность падающего света Iz = UZUZ, где Щ — комплексно-сопряженная волна. Суммарная интенсивность = Ugx + tf2 + Uoi U02 [exp{/(0! - 02)} 4- exp{-/(0, - 02)}]. (7.4) Произведем преобразование, воспользовавшись известными формулами Эйлера. Тогда h = U& + Щ2 + llhx Uoicos(0! - 02). (7.5) Подставив значения в\ и 02 в равенство (7.5) получим h = Щ\ + ^о22 + 2l7oi и02 cos[<ot - (oZ\/c -Ш + <о(п - l)AZ/c + wZfc/c] и, заменив о)/с на 2я/Л найдем, что при равенстве плеч интерферометра Zi=Z2 Iz = u& 4- Ui2 + 2£ui U02 cos[2n(n - 1)AZ/A]. (7.6) Полученное выражение определяет интенсивность света в каждой точке интерференционной картины в плоскости экрана в зависимости от распределения показателя преломления в исследуемом объекта n(x,y,z)9 определяющего эффективную длину оптического пути Цх, у) = /^ п(х, у, z) dz = п(х9 у) AZ(x, у), где Z\ и Z2 — границы исследу-
7.1. Распределение интенсивности света в интерференционной картине 203 емого объекта, a AZ(x,у) = Zi{x9y) — Z\(x,y). Понятно, что в конечном счете распределение интенсивности света в интерференционной картине определяется кривизной фронта «предметной» волны, обусловленной разными фазовыми набегами в объекте исследования 2nAZ(x,y)n(x,y)/X = = Ф(х9у). Приняв такое обозначение фазовых набегов в исследуемом объекте, перепишем выражение (7.6) в виде h = 2U<n(x,y)U02(x9y)cos[<P(x,y)]. (7.7) причем вектор kx / = х sin При интерферометрических измерениях, как правило, интерферометр настраивают так, чтобы опорная волна приходила на экран под некоторым углом к волне предметной. Как будет видно из дальнейшего, это позволяет определить знак кривизны «предметной» волны. Так что, пусть «предметная» волна падает нормально плоскости экрана, а «опорная» — под некоторым углом fi к ней. Угол fi — это угол между волновыми вектора «предметной» волны к^ъ и «опорной» повернут в плоскости X9Z вокруг оси Y. Тогда при равенстве плеч интерферометра и отсутствии объекта исследования, из-за разности длин оптических путей, фазы «опорной» и «предметной» волн в плоскости экрана будут сдвинуты относительно друг друга на величину 27rxsin fi/X или при малых fi на величину 2nfix/X. (Опережение или запаздывание по фазе будет зависеть от знаков х и fi.) Сказанное поясняет рис. 7.3, где / = xslnfi — разность длин оптических путей двух интерферирующих волн, так что l/X = xsinfi/X — запаздывание в долях периода световой волны, a 2nxsinfi/X — запаздывание по фазе в радианах. Пространственное распределение интенсивности в интерференционной картине можно найти, учитывая, что в плоскости экрана фаза «опорной» волны зависит от х и равна 2nfix/X, а фаза «предметной» волны, функция х9у — Ф(х9у)9 откуда t fcub Z Рис. 7.3. Интерференция двух волн с плоскими волновыми фронтами Ых,у) = U&(x9y) + 2Uoi(x,y)UO2(x,y)cosl0(x,y) Infix/X]. (7.8) Если настроить зеркала интерферометра так, что fi = 0, распределение интенсивности в интерференционной картине будет описываться выражением (7.7). Как видно из равенства (7.7), в этом случае по интерференционной картине невозможно отличить Ф(х,у) от — Ф(х9у), т. е. фазовый фронт с положительной кривизной от фазового фронта с отрицательной
204 Глава 7. Интерферометрические и теневые методы кривизной, поскольку косинус — функция четная. В тех случаях, когда мы закашиваем на угол ($ «опорный» луч относительно «предметного» под знаком косинуса, наряду с Ф(х,у), появляется слагаемое 2л/be/A, знак которого зависит от знака угла /}. Теперь, если, например, производные дФ(х)/дх и d(2nf}x/\)/dx имеют разные знаки (см. формулу (7.8)), интерференционные полосы будут разряжаться вдоль оси X, а если одинаковые — сгущаться. Рисунок 7.4 иллюстрирует описанную ситуацию для случаев, в которых предметная волна имеет сферический фронт. В примере, показанном на рис. 7.4, a ft = 0 и интерференционная картина в плоскости X, Y — это концентрические окружности, причем одни и те же и при расходящемся и при сходящихся предметных волнах, если, конечно, кривизны волновых фронтов у этих двух предметных волн одинаковы. При расходящейся предметной волне и отрицательном )3 (рис. 7.4, б), там где производные дФ(х)/дх и d(2nfix/A)/dx имеют одинаковый знак (верхняя часть чертежа) интерференционные полосы сжимаются, а там, где знаки производных разные (нижняя часть чертежа) — растягиваются. Поэтому наши концентрические окружности трансформируются в овалы, вытянутые вдоль X в нижней части чертежа и сжатые — в верхней. При сходящейся предметной волне (рис. 7.4, в) картина будет похожа, но в верхней части чертежа — растянута, а в нижней — сжата. Сферический волновой фронт Плоский волновой фронт а б в Рис. 7.4. Интерференция волны с плоским фазовым фронтом и волн со сферическими фазовыми фронтами с положительной и отрицательной кривизной
7.1. Распределение интенсивности света в интерференционной картине 205 <Р\ Т >(*) Рис. 7.5. Графическая обработка интерферограмм: а) так называемая «невозмущенная интерферограмма» (без объекта исследования, лишь ф(х)); б) сумма фазовых набегов Ф(х) + (р(х). Соответственно отсчеты Ф(х) производятся от кривой (р(х) Рассмотренная нами картина соответствует, к сожалению, лишь практически не реализуемому идеальному случаю. Во-первых, потому что при всех стараниях невозможно обеспечить однородность интерферирующих пучков в плоскости экрана, поскольку ни распределение исходной интенсивности U(x,y) ф const, ни распределение коэффициента отражения полупрозрачных зеркал интерферометра R(x, у) Ф const. К тому же невозможно изготовить зеркала интерферометра с идеально плоскими поверхностями. Напомним, что мы стремимся измерять Ф(х,у) с точностью до одной десятой или даже с точностью до одной сотой доли периода световой волны, а это значит, что в идеальном случае поверхности зеркала интерферометра должны быть изготовлены с точностью лучшей, чем Л/100! К сожалению, это трудно выполнимо, а подчас практически невозможно и нам не остается ничего другого, как смириться с этим, как с неизбежным злом. Каков же выход? Хотим ли мы того или нет но это обстоятельство должна быть учтено. Как правило, это делают вводя под знак косинуса дополнительное слагаемое <р(х,у)9 ответственное за эти «паразитные» набеги фаз. Теперь остается переписать уравнение (7.8) в виде ,y) cos[0(x,y) + 2лРх/Л + <р(х9у)\. (7.9) Итак мы получили правильную формулу, которая, конечно же, нужна нам не сама по себе, а лишь для того, чтобы из зарегистрированной ин-
206 —ily- Глава 7. Интерферометрические и теневые методы терферограммы, т.е. из 1(х,у) найти Ф(х,у), откуда, в принципе, можно получить параметры объекта исследования. Все бы хорошо, да только на пять неизвестных: 1о\(х,у), 1о2(х9у), Ф(х,у), Infix/h и (р(х,у) имеется всего лишь одно уравнение. Как тут быть? Рецепт таков: сначала, попеременно перекрывая в интерферометре опорный и предметный лучи, найти 1о\(х,у) и 1о2(х,у); затем, регистрируя так называемую «невозмущенную интерферограмму», т. е. интерферограмму в отсутствие объекта исследования найти сумму слагаемых 2n$xj\ и (р(х,у), и лишь затем вычислить Ф(х,у). Имея пару интерферограмм, как «невозмущенную интерферограмму», так и интерферограмму, снятую с объектом исследования, Ф(х,у) можно найти графически. Рисунок 7.5 иллюстрирует эту процедуру в случае одномерных объектов, т. е. тогда, когда Ф(х). 7.2. ОБРАБОТКА ИНТЕРФЕРОГРАММ Используя описанную выше процедуру из уравнения (7.9), описывающего распределение интенсивности света в интерференционной картине, можно найти Ф(х,у). Для плоских объектов с одинаковой толщиной AZ = const, например при исследовании качества пластин из оптического стекла, это позволяет найти усредненное по направлению Z распределение показателя преломления п(х9 у) (или произведение п(х, у) &z(x, у) если Дг(х, у) ф const), поскольку у j n(x,y, z) dz = j-n(x,y)bZ = Ф(х,у). (7.10) z, Однако, найти трехмерное распределение n(x,y,z), используя методы традиционной интерферометрии нельзя, так как в принципе невозможно найти функцию трех переменных (3D) по двумерной (2D) реализации Тем не менее, в ряде случаев, обладая априорной информацией, можно найти распределение показателя преломления в трехмерных объектах. Прежде всего, это касается осесимметричных объектов (например, цилиндров или сфер), для которых в каждом поперечном сечении функция п(г) одномерна. (Линии n(r) = const нанесены на рис. 7.6.) Просветим такой объект перпендикулярно его оси, т. е. вдоль хорд его поперечного сечения в направлении Z (рис. 7.6). Тогда при фиксированном значении у суммарный набег фазы вдоль каждой хорды, пересекающей поперечное сечение цилиндра или сферы, будет зависеть только от х z /л(г)* (7Л1) -z
7.3. Теневые методы 207 где \Z\ = y/R2 — х2. Заменив переменные (z = VV2 —х = rdr/y/r2 —х2) и обозначив U(x) = Ф(х)Х/2п получим откуда dz = tf(*) = n{r)rdr Это уравнение Абеля, решение которого хорошо известно: _ J_ Г J/Mdx ~ nJ л/jc2 - г (7.12) (7.13) В конце этого параграфа заметим — при интерферометрических измерениях предполагается, что объект исследования просвечивается практически параллельными лучами вдоль оси Z, что происходит в том случае, когда градиенты показателя преломления дп/дх и дп/ду, ответственные за искривления лучей, распространяющихся в исследуемой среде, достаточно малы. В противном случае, когда в одну и ту же точку экрана будут приходить лучи, прошедшие разные и заранее неизвестные пути, а значит и имеющие разные и неизвестные фазовые набеги, расшифровка интерферограмм превращается в такую головную боль, что ни один сколько-нибудь разумный человек не ринется в это предприятие. Сечение по у = const Рис. 7.6. Расчет распределения показателя преломления в осесимметричных объектах (уравнение Абеля) 7.3. ТЕНЕВЫЕ МЕТОДЫ В целом ряде случаев нас интересует не пространственное распределение показателя преломления п(х,у)9 а лишь Vn(x,y,z). (Типичный случай — исследование ударных волн.) Кстати, до широкого
208 Глава 7. Интерферометрические и теневые методы внедрения интерферометрии в оптическую промышленность, теневые методы и, прежде всего метод Теплера, были основными методами измерения однородности стекла и качества оптических изделий, включая качество крупногабаритных астрономических инструментов [1]. Добавим: в теневых методах ограничение, приведенное в конце предыдущего параграфа, мало сказать несущественно — более того, чем больше градиенты дп/дх и дп/ду, тем контрастнее и четче регистрируемая картина. Что касается собственно теневой картины, то ее каждый мог многократно наблюдать, глядя в жаркий солнечный день вдоль нагретой асфальтовой ленты дороги — поднимающиеся вверх потоки воздуха хорошо видны невооруженным глазом. Конечно, можно и сфотографировать эту, к сожалению, малоконтрастную картину. Ее малый контраст обусловлен двумя обстоятельствами — во-первых, малой дифракционной эффективностью объекта фотографирования и, во вторых, — и это главное — очень большой интенсивностью нулевого порядка дифракции. К тому же при теневой съемке контраст зарегистрированного изображения будет пропорционален (для простоты ограничимся одномерной ситуацией) d2n/dx2, что, конечно, не прибавляет энтузиазма при обработке результатов измерения даже в том случае, если вы нуждаетесь лишь в определении dn/dx, не говоря уже о восстановлении значений п(х). Нож Фуко Фоторегистратор Рис. 7.7. «Метод темного поля» (метод Теплера) Как повысить контраст изображения? Рецепт прост — закрыть нулевой порядок дифракции. Оптическая схема, реализующая такой метод измерения, показана на рис. 7.7. (Этот метод носит названия «метод темного поля», шлирен-метод или метод Теплера.) Как видно из рисунка, здесь мы имеем дело с обычной фильтрацией в фурье-плоскости — подвижный экран (нож Фуко), кромка которого параллельна оси Y, перекрывая нулевой порядок дифракции, отсекает все, не отклоненные
7.3. Теневые методы 209 объектом исследования, лучи. Отношение фокусных расстояний софо- кусных объективов L\ и Li позволяет передать изображение на фоторегистратор в нужном масштабе. Z\ 71 Рис. 7.8. Рефракция на фадиенте показателя преломления п Угол отклонения лучей объектом исследования можно найти из следующих соображений. Пусть два луча с расстоянием Дх друг от друга распространяются вдоль оси Z и коэффициент преломления л тонкого слоя среды вдоль направления Z на коротком отрезке Дг можно считать неизменным (рис. 7.8). Пусть дп/ду = 0, а дп/дх = dn/dx. Выберем такой промежуток времени Д*, при котором нижний луч, распространяющийся по среде с показателем преломления п, пройдет расстояние д^ = L\ = ckt/n. Верхний луч распространяется по среде с большим показателем преломления, так что за то же время Д/ пройдет меньшее расстояние L2 = cAt/(n + Дл). В результате волновой фронт излучения (линия АВ), повернется вокруг оси Y на угол Д<р « tgq> = (L\ - L2)/&x. Соответственно, угол между волновым вектором к, перпендикулярным волновому фронту, и осью Z также окажется равным А(р. Разность оптических путей (L\ — L2) = c&t/n — cAt/(n+Дя) = сД/Д«/л(«+Дл)« Дл Дг/я, поскольку cAt = nAz, а при Дх —► 0 (я 4- Дл) —► л, т. е. п(п + Дл) —> л2. Таким образом, при малых Дх Д<р = (Zi — ^2)/Дх = ДлД^/Дхл. Переходя к пределу, получим J<p = (dn/dx)n~l dz, откуда (7.14) Здесь Zj и Z2 — границы просвечиваемого объекта, ах — так называемый прицельный параметр, т.е координата просвечивающего луча до встречи с объектом. Таким образом, интеграл (7.14) позволяет вычислить углы
210 -J\y- Глава 7. Интерферометрические и теневые методы рефракции как функцию координаты х. Ясно — для того чтобы этот луч не был бы обрезан ножом Фуко, перекрывающим нулевой порядок дифракции, необходимо чтобы угол <р был бы больше в — угла расходимости просвечивающего излучения. Соответственно минимальный угол рефракции, который может быть измерен при этом ^mm > б. Нож Фуко снабжен устройством микрометрического перемещения вдоль оси X, что позволяет, по мере его перемещения, отсекать все большие и большие углы, исчезающие при этом из формируемого изображения. При больших градиентах dn/dx приходится интегрировать вдоль криволинейной траектории луча: f^ (7.15) где dl = Вернемся к рис. 7.7. Как видно из рисунка, та часть объекта, что лежит выше оси Z будет обрезана ножом Фуко. В случае осесимметричных объектов это приведет лишь к потери интенсивности регистрируемого изображения; в противном случае эта часть объекта будет утрачена. Что здесь можно сделать? Чаще всего в этом случае в фурье-плоскости вместо ножа Фуко параллельно оси Y натягивают проволоку, пересекающую ось Z. Ее диаметр выбирается так, чтобы 0 =/0, где/ — фокусное расстояние объектива L\. Однако, на наш взгляд, существует другой более элегантный способ, при котором сначала получают негативное изображение нулевого порядка дифракции, помещая фотопленку в фурье-плос- кость и экспонируя ее без объекта исследования, а затем этот негатив устанавливают на оси Z в фурье-плоскости. ЛИТЕРАТУРА 1. Максутов Д. Д. Теневые методы исследования оптических систем. — М.: Го- стехиздат, 1934. — 171 с.
ГЛАВА 8 ГОЛОГРАФИЧЕСКИЕ МЕТОДЫ ИССЛЕДОВАНИЯ Суть голографии состоит в получении такого дифрагирующего объекта (голограммы), который при освещении его плоской световой волной восстанавливал бы предметную волну, т. е. волну, отраженную от объекта исследования или прошедшую сквозь него. В отличие от обычного фотоснимка, который несет в себе информацию лишь о пространственном распределении амплитуд предметной волны, голограмма содержит информацию и о распределении амплитуд и о распределении фаз, т. е. о фазовом фронте предметной волны. Это достигается за счет того, что в голографии также как и в интерферометрии, на фотоприемник помимо предметной волны, несущей информацию об объекте исследования приводится плоская опорная волна, интерферирующая с волной предметной, что и позволяет определить распределение фаз. Типичные оптические схемы для получения голограмм приведены на рис. 8.1, а и б. Как видно из этих рисунков, плоская высоко-когерентная световая волна делится на две части, из которых первая, как правило более интенсивная ее часть, направляется на объект исследования и отражаясь от него (а) или просвечивая его (б) попадает на фотоприемник (обычно фотослой), куда приводится, отражаясь от плоского зеркала, и вторая часть той же световой волны. Итак, пусть на фотослой (будущую голограмму) падает предметная волна где Ф(х,у) — распределение фаз, a asab(x,y) = \Usub(x,y)\ — пространственное распределение ее амплитуд, и опорная волна Сумма опорной и предметной волн на фотослое UAx,y) = Usub(x,y) + UKf(x,y) = asub(x,y)ei0(x>y) а результирующая интенсивность I(x,y)=Uz(x,y)U*(x,y) = = <4f + 4л(*> У) + 2aref flsub(x, у) со8[Ф(х, у) + щх]. (8.1)
212 Глава 8. Голографические методы исследования Рис. 8.1. Оптические схемы получения голограмм Таким образом на проявленном фотослое (голограмме) мы получаем периодическую структуру, в сущности интерферограмму, несущую информацию как о фазе Ф(х,у), так и об амплитуде а(х,у) предметной волны. Рассмотрим принципиальные основы и технические приемы, позволяющие, используя голограмму, воссоздать копию предметной волны. 8.1. ФОТОСЛОЙ В ГОЛОГРАФИИ Фотослой, как приемник излучения, используется в голографии по той простой причине, что при больших полуширинах Ф(х9у) частота интерференционных полос на голограмме достигает 104 см"1, а других фотоприемников, способных регистрировать изображения с такими пространственными частотами, к сожалению, пока нет. При рассмотрении проблем голографии по причинам, которые будут ясны из дальнейшего изложения, вместо почернения фотослоя D = lg(/o//) используется его пропускание Т. Пропускание фотослоя по интенсивности вводится (также, впрочем, как и его почернение) по определению: / = /о Т. В обоих случаях /о — интенсивность падающей на проявленный фотослой световой волны, а / — интенсивность волны, прошедшей сквозь фотослой. Другими словами, Т = ///о. Поскольку интенсивность световой волны есть квадрат ее амплитуды, амплитудное пропускание проявленного фотослоя t = \ff. Рассмотрим как изменяется прошедший сквозь фотослой свет с увеличением количества проявленных зерен, т. е. найдем зависимость 1(п), где п — поверхностная плотность проявленных зерен, т. е. количество зерен фотослоя, приходящихся на единицу
8.1. Фотослой в голографии —J\#- 213 его площади. Если а — эффективное поперечное сечение зерна, усредненное по их распределению, то величина an — это та доля площади фотослоя, через которую не пройдет свет. Поэтому dl = —Iadn, откуда после интегрирования получим ln/= —on Л- С. Постоянную интегрирования С найдем из условия I = Iq при п = О, откуда In/ = — an + In/о, ln(///0) = In T = -an, a lg(///0) = lg T = -D = -an lg e. (8.2) С другой стороны, как мы это выяснили в гл. 4, в «линейном» (в логарифмическом масштабе!) участке характеристической кривой, зависимость почернения фотослоя D от экспозиции £ запишется как £ = 7(lg£-lg£o). (8.3) Здесь £ = I* At — экспозиция, т. е. энергия, пришедшая на единицу площади фотослоя за время его экспонирования Д/ световым потоком с интенсивностью /*, у = i^(lg^) — коэффициент контрастности, a lg£0 — значение экспозиции на оси абсцисс в точке ее пересечения с продолжением линейного участка характеристической кривой (см. рис. 4.22). Понятно, что величина Igt5o тем меньше, чем выше светочувствительность фотослоя 5а. Последняя вводится по определению как величина обратно пропорциональная экспозиции, необходимой для достижения D=ll\ Воспользуемся уравнением (8.3), чтобы вычислить величину lg£0. Поскольку $х = 1/*Уд пРи -0= 1, по определению, получим y(lg(l/5A) — lg£o) = 1 = lg Ю, откуда после несложных преобразований найдем, что £0 = 1/Ю1//г5я и перепишем равенство (8.3) в виде D = y\gk& (8.4) где характеризующий конкретный фотослой коэффициент к — 101/г5д. Так как в соответствии с равенством (8.2) lg Т = —D, lg T = — у lg kg, т. е. Т = {к&уУ. (8.5) Из уравнения (8.5) видно, чего, впрочем, и следовало ожидать, что пропускание проявленного негатива будет тем меньше, чем больше экспозиция и выше чувствительность фотослоя. Однако, если фотослой проявить с обращением или отпечатать позитив, ситуация изменится на прямо противоположную — большей экспозиции или более высокой чувствительности будет соответствовать большее пропускание. Формально 1) По определению светочувствительности нормировочное почернение D = Д> +1. Однако, у низкочувствительных голографических фотослоев Do = 0,01—0,02, т. е. 1—2% от 1, в силу чего условие D = 1 достаточно точно отражает ситуацию.
214 -J\шш Глава 8. Топографические методы исследования это связано с тем, что у негатива у > 0 (см. рис. 4.22), а у позитива у < 0. Оптимальной считается такая обработка фотослоя, при которой достигается значение yopt = —2. В этом случае Т = (k@)~r = (k@)2, а пропускание фотослоя по амплитуде фс, у) = ^fT&J) = VW(x,y)]2 = Щ*,Д>) = кГ(х,у)М = ЯР <*,?), (8.6) где ЗС = к At. Отсюда видно, что пространственное распределение пропускания фотослоя по амплитуде t(x,y) с точностью до постоянного множителя К равно пространственному распределению интенсивности светового потока Г(х,у)9 которым был экспонирован фотослой. 8.2. ПОЛУЧЕНИЕ ГОЛОГРАММ И ВОССТАНОВЛЕНИЕ ВОЛНОВЫХ ФРОНТОВ Пусть две плоские электромагнитные волны Ux(x) = ах и U2(x) = а2(х) exp{i(Oox} (щ — пространственная частота, характеризующая изменение фазы вдоль пространственной координаты х) падают на фотослой. Первая из них (назовем ее опорной) распространяется по нормали к плоскости фотослоя X, Y, вторая (предметная) — под углом /3 к нормали, так что угол 0 — это угол между волновыми векторами этих двух волн. При этом набег фазы Дф(х) = —f— = щх А зависит от х так, что на расстояние х = {/щ фазы этих волн будут отличаться одна от другой на один радиан. Результирующая амплитуда в плоскости X, Y будет равна Udx) = ax+ а2(х) ехр{/а>ох}, (8.7) а суммарная интенсивность в плоскости фотослоя 1(х) = Uz(x) и£(х) — а{ + а](х) + а\а2(х) exp{m>o*} + flidb (*) ехр{-/а>0*} = = а\ + с%(х) + 2аха2(х) cos щх, (8.8) где Щ(х) — волна комплексно сопряженная с Ux(x). Если все значения l(x) At лежат внутри фотографической широты, т. е. на линейном участке характеристической кривой фотослоя, то в соответствии с равенством (8.6) амплитудное пропускание фотослоя, проявленного с обращением до значения yOpt = —2, запишется, как t(x) = К1(х) = JC[of + с%(х) + аха2(х) exp(ia)Ox) + аха2(х) ехр(-/й>0*)] = = <К[а{ + 4(х) + 2аха2(х) cos(w0*)] • (8.9) Заметим, что и t(x) и К1(х) и JC[af + a2(x)-\-2axa2(x)cos(o)ox)] безразмерны.
8.2. Получение голограмм и восстановление волновых фронтов —fly- 215 Итак, полученное нами пропускание проявленного фотослоя t(x), есть результат интерференции двух, падавших на него, плоских волн — U\ (x)=а\ (опорной) и Ui(jc) = аг(х) ехр{/й>о*} (предметной). Как это видно из соотношения (8.9), функция t(x) в данном конкретном случае представляет собой сумму постоянной составляющей <К[а\ + а\(х)] и синусоидальной структуры <К2а\а2(х)соъ(щх) с пространственным периодом равным \/2пщ. Дифракционная эффективность такого синусоидального транспаранта (см. гл. 5) зависит от глубины пространственной модуляции2) его пропускания, т.е. определяется структурой проявленного фотослоя t(x). (Структура t(x) в свою очередь обусловлена амплитудами интерферирующих волн и углом между их волновыми векторами.) Если осветить такой транспарант пространственно однородной волной с плоским волновым фронтом, то из-за дифракции света на нем, падающая перпендикулярно к его поверхности волна а распадется на три волны и будет распространяется вниз по потоку в виде трех волн. Из них первая волна д<ь т. е. нулевой порядок, будет распространяться по направлению падающей на транспарант волны; вторая волна а+\ ехрЦщх) — плюс первый порядок и третья волна а-\ ехр(—ia)ox) — минус первый порядок будут распространяться соответственно под углами ±р влево и вправо от нулевого порядка. Понятно, что максимальная интенсивность в боковых порядках будет наблюдаться при 100%-й глубине пространственной модуляции. При 100%-й глубине пространственной модуляции яо = а/2, а а+\ = а-\ = а/4. В общем случае, как это было показано в гл. 5, чтобы найти результат дифракции достаточно умножить а на t(x). Воспользуемся формулой (8.9), чтобы сделать это UKC(x) = at{x) = aKI(x) = = аК[а\ + а\(х) + а\аг(х) ехр(/а>ох) + аха2 (х) ехр(-/й>0*)] = = аК[а\ + а\(х)] + аа\К[аг(х)cxp(ia)Ox)] 4- аа{<К[а2(х)exp(-/w0*)]. (8.10) Прежде всего обратим внимание на то обстоятельство, что в результате мы получили (с точностью до постоянного множителя) копию предметной волны аа\К[а2(х) exp(ia)Qx)] и волну, комплексно-сопряженную этой копии, т.е. волну аа\К[а2(х)ехр(—гщх)]. Действительно, предметная волна и2(х) = а2(х) ехр{/й>о*} распространялась в том же направлении, а распределение ее амплитуд п2(х) прямо пропорционально распределению амплитуд восстановленной копии. Понятно, что любую волну U(x,y) = а(х,у)схр{Ф(х9у)} (здесь а(х,у) — распределение амплитуд, а 2) Напомним (см. гл. 5), что глубина пространственной модуляции формально определяется индексом модуляции т = (/W - fmin)//max, где / — коэффициент пропускания транспаранта по амплитуде.
216 —11— Глава 8. Топографические методы исследования Ф(х, у) — распределение фаз предметной волны) мы можем представить, как суперпозицию плоских волн, в силу чего полученный результат носит общий, а не частный характер. В сущности, в этом и заключается принцип голографии: интенсивность интерференционного поля, возникающего от сложения опорной и предметной волн, приводит к такой дифрагирующей структуре проявленного фотослоя, что при восстановлении голограммы, т. е. при освещении этой дифрагирующей структуры плоской волной, мы получим, как результат дифракции, копию предметной волны и волну ей комплексно-сопряженную. Заметим, что волновой вектор восстанавливающей волны вовсе не обязательно должен быть перпендикулярен голограмме. Пусть, например, восстановление голограммы (8.9) производится волной ае~'щх, т. е. волной, падающей под углом — р к голограмме ф = щ\/2п). Тогда UKC(x) = ae- = а<К[а\ + 4(x)]e-iw°x + аахК[а2(х)] + аа{К[а2(х)]е-2^х. (8.11) Как видно, в этом случае первый порядок, восстановленной волны распространяется перпендикулярно голограмме, нулевой порядок по углом — /5 (т. е. по направлению восстанавливающей волны) и минус первый порядок — под утлом —2)8. Заметим, что если фотослой переэкспонирован, например так, что вместо синусоидальной структуры имеем прямоугольную, в дифрагированном пучке мы получим множество убывающих по амплитуде порядков. Угол, под которым будет распространяться волна первого порядка дифракции относительно волны нулевого порядка будет пропорционален щх , второго — 2щх и т. д. Используя описанную процедуру, рассмотрим получение и восстановление голограмм в общем виде. Вернемся к выражению (8.1), представляющему результирующую интенсивность двух интерферирующих волн, падающих на фотослой: предметной USVLb(x,y) = авиЬ(х,у)е*ф(х>у) и опорной и„*(х,у) = aKfe-^x: y) + 2акГа$иЪ(х,у)соь[Ф(х,у) + щх]. Пусть, как и прежде все значения I(x9y)&t лежат внутри фотографической широты, т. е. на линейном участке характеристической кривой фотослоя, который проявлен с обращением до значения yopt = —2. В
8.3. Операции в схеме восстановления —'1/- 217 этом случае, в соответствии с равенством (8.6), амплитудное пропускание фотослоя, запишется, как {4г 4ь } (8.12) Воспользуемся для восстановления голограммы (8.12) волной ae~ia)°x, т. е. волной, падающей под углом — @ к голограмме ф = а)^\/2п). Тогда , У) + <* (8.13) Как видно из этого выражения, в результате восстановления мы получили (с точностью до постоянного множителя) копию предметной волны aaKfK[asab(x,y)Qxp{i0(x9y)}] и волну ей комплексно-сопряженную, т.е. волну aaKfK[aSUb(x,y)exp{—г[Ф(х9у) + 2щх]}]. На самом деле: предметная волна USUb(x,y) = аьиъ(х9у)е(ф(х>у) имеет тот же самый фазовый фронт Ф(х,у), а распределение ее амплитуд аыъ(х,у) прямо пропорционально распределению амплитуд восстановленной копии. Первый член этого выражения представляет собой волну нулевого порядка, которая распространяется по направлению восстанавливающей волны; копия предметной волны (второй член выражения (8.13)) распространяется по нормали к голограмме; третий член — комплексно-сопряженная волна распространяется под углом 2р=щ\/п по отношению к волне плюс первого порядка. Естественно, если поставить объектив и осветить его волной aaKf x х !К[ааа>(х9у)ехр{1Ф(х9у)}], то при соответствующем выборе экспозиции на фотопленке получится точно такое же распределение почернения, как получилось бы просто при фотографировании предмета. Эту же волну можно использовать для получения теневых картин и интерферограмм, для чего применяются различные схемы восстановления. 8.3. ОПЕРАЦИИ В СХЕМЕ ВОССТАНОВЛЕНИЯ Схема восстановления, предназначенная, в том числе, для получения голографических интерферограмм, показана на рис. 8.2. Зеркала М\, М2, Л/з, А/4 объединяются в устройство, которое расщепляет восстанавливающий луч на два и сводит их на голограмму Гтак, что они освещают ее под небольшим углом друг к другу. Вводя ослабляющий фильтр или выбирая нужным образом коэффициент отражения зеркал можно изменять интенсивность любого из этих двух лучей. Диафрагма-
218 Глава 8. Голографические методы исследования маска осуществляет фильтрацию в фурье-плоскости объектива L\. Объектив Хз строит восстановленное изображение на фотопленке или другом приемнике излучения, например на входе ПЗС-камеры3). За счет дифракции на голограмме каждая из двух освещающих ее волн при синусоидальной структуре интерференционных полос голограммы распадется на три волны, так что в фокальной плоскости первого объектива образуются две копии фурье-спектров, соответствующие двум освещающим волнам. Рисунок 8.3 иллюстрирует ситуацию в фурье-плоскости. Точки в фурье-плоскости, в которые на рис. 8.3 «сфокусированы» дифрагированные волны соответствуют более или менее случайному расположению зеркал. При изменении углов падения на голограмму любого из двух освещающих ее лучей происходит пространственное перемещение соответствующего фурье-спектра в фокальной плоскости объектива L\. Так, например, если мы повернем зеркало Мз (рис. 8.2) на угол у/2, один из фурье-спектров, как это показано на рис. 8.3, сдвинется на расстояние Д = yF, где F — фокусное расстояние объектива L\. Поэтому мы можем, изменяя наклоны зеркал Л^ и М3, и таким образом перемещая фурье-спектры в фокальной плоскости объектива L\, совмещать с отверстием диафрагмы выбранные нами порядки дифракции, т. е. осуществить фильтрацию требуемых порядков. В результате, если на объектив L\ падало шесть волн, то после фильтрации вниз по потоку будут распространяться всего две волны. Именно это используется при получения голографических интерферограмм. Например, пропуская через отверстие диафрагмы нулевой порядок одной копии фурье-спектра и первый порядок другой, мы получим точно такую же интерферограмму, как получили бы ее в обычной интерферометрической схеме. Фурье-плоскость Регистратор Рис. 8.2. Схема восстановления голограмм 3) Заметим, что в схеме восстановления голограмм, снятых в условиях, когда Ф(х,у) изменяется в широком диапазоне, необходима широкоапертурная оптика с высоким пространственным разрешением, если мы не хотим потерять информацию об областях с большими градиентами, вызывающих сильную рефракцию предметного луча.
8.3. Операции в схеме восстановления 219 Рис. 8.3. Ситуация в фурье-плоскости схемы восстановления Покажем это, рассмотрев ситуацию, при которой информация о предмете исследования сосредоточена не в распределении амплитуд, а лишь в распределении фаз предметной волны Ф{х,у). Это имеет место в целом ряде приложений, когда объекты исследования либо прозрачны (газодинамические среды, объекты физики плазмы, оптические элементы лазерных систем и т. п.), или полностью отражают излучение (зеркала, детали машин, плотные плазменные образования и т.д.). Совместим с отверстием диафрагмы (рис. 8.4, а) предметную волну а\е*ф(х'у\ а в качестве опорной волны используем волну дифракции нулевого порядка, которую направим на объектив L\ под углом /3* = Ла)%/2л4\ т.е. в качестве опорной волны используем волну а^е~ш^х. При этом центр пятна дифракции нулевого порядка не будет точно совпадать с центром отверстия в диафрагме, а будет отстоять от него на величину Д = fi*F, где, как и раньше F — фокусное расстояние объектива L\. Поскольку, как мы условились, амплитуды этих двух волн не зависят от координат, т. е. ао(х,у) = const и а\(х9у) = const, их суммарная амплитуда в плоскости фотоприемника, установленного за объективом 13, будет равна а интенсивность I(x,y)=Uz(x,y)UZ(x,y) = Ф(х,у)]} + аоа{ Ф(х,у)]} = , (8.14) 4) Заметим, что, как правило, ft* <С Р — угла, под которым опорный пучек направлялся на голограмму при ее получении.
220 Глава 8. Голографические методы исследования где, как понятно, 0* — угол между опорной и предметной волнами. Из полученного соотношения видно, что распределение освещенности в интерференционной картине, реализованной в схеме восстановления, в точности соответствует распределению освещенности в обычной ин- терферограмме (см. гл. 7). Рис. 8.4. Получение интерферограмм Совместим с отверстием диафрагмы, как это показано на рис. 8.4, б, компоненты фурье-спектров одного порядка, но различных знаков, т. е. рассмотрим интерференцию предметных волн плюс первого и минус первого порядков. Суммарная комплексная амплитуда в плоскости изображения определяется как а распределение освещенности в интерференционной картине запишется как E(x,y)=UI(x,y)U2(x,y) = -\ схр[-ПФ(х,у)] = >>)]. (8.15)
8.3. Операции в схеме восстановления —'\у- 221 Как видно, в этом случае мы получим двукратное увеличение чувствительности. Можно получить и большую чувствительность, если сбивать гармоники более высоких порядков. Так, например, при аналогичных операциях со вторыми порядками дифракции, получим распределение интенсивности в интерференционной картине с четырехкратным увеличением чувствительности: 2а2а.2 со8[4Ф(х,у)]. (8.16) 1(х,у) = а2 + а_2 Однако, при использовании более высоких порядков резко падает отношение сигнал/шум, поскольку интенсивность дифрагированных лучей (дифракционная эффективность) уменьшается с порядком дифракции, а шум, обусловленный паразитным рассеянием восстанавливающей волны на голограмме, растет. Как показывают многочисленные измерения, паразитное рассеяние, обусловленное шумом фотослоя, на котором записывается голограмма, изотропно по углам, а это значит, что спектральное распределение пространственных частот рассеянной компоненты соответствует белому шуму. В силу этого интенсивность шума, достигающего детектора излучения, просто пропорциональна площади отверстия в диафрагме. В то же время из выражений (8.14), (8.15) и (8.16) видно, что углы дифракции, в которых заключена информация о фазе Ф(х,у) увеличиваются пропорционально порядку дифракции. Поэтому, необходимо пропорционально порядку дифракции увеличивать и диаметр отверстия диафрагмы-маски, так что где Sn — площадь отверстия диафрагмы для я-го порядка дифракции. Естественно, что при этом в п2 раз увеличивается и шумовая компонента. Рассмотрим одно из важнейших свойств голографической интерферометрии — нечувствительность метода к постоянным фазовым искажениям, вносимым оптической системой (обозначим их, как и прежде, <р(х,у)). В этом случае на один и тот же фотослой регистрируются две голограммы: одна до опыта, т. е. без объекта исследования, другая в момент опыта, т. е. с объектом исследования. (В промежутке между двумя экспозициями изменяется угол, под которым опорная волна освещает фотослой.) Первая голограмма несет информацию о фазовых искажениях, вносимых оптической системой <р(х,у), вторая — о фазовых набегах, обусловленных совместно, как объектом исследования, так и оптической системой [Ф(х,у) + (р(х,у)]. Понятно, что при освещении такой голограммы двумя лучами мы получим в результате дифракции не шесть, как прежде, а двенадцать волн. Используя рассмотренную выше схему восстановления, отфильтруем ненужное, совместив с отверстием диафрагмы
222 —J Ь- Глава 8. Голографические методы исследования лишь волны U(x,y) = ахё#™) и Щх,у) = aieil<p^y)^^y)K В результате суммарная комплексная амплитуда в плоскости изображения Uz(x,y) = а распределение освещенности ) = U£(x,y)l%(x9y) = а\ + ^_! + 2ЛЩ-! со8[Ф(х,^)]. (8.18) Как видно, фазовые искажения, вносимые оптической системой, оказываются полностью скомпенсированы в результирующей интерферограмме. Кардинальное отличие обычной интерферограммы от голограммы5) состоит в том, что, если на основании интерферограммы мы можем реконструировать форму волнового фронта, т.е. вычислить функцию Ф(х,у), то используя голограмму мы можем (причем после опыта, в лабораторных условиях) восстановить предметную волну £4иь(*, У) = Osubfo y)e^XJ^. Именно это позволяет реализовать описанные выше процедуры повышения чувствительности и устранения влияния паразитных набегов (р(х,у). Однако этим далеко не исчерпываются все возможности голографии. Например, в той же схеме восстановления можно получать и теплеро- граммы, для чего необходимо лишь закрыть центральную приосевую область отверстия в диафрагме непрозрачным экраном, т. е. отфильтровать высокие пространственные частоты. В качестве иллюстрации на рис. 8.5 приведена пара интерферограмма — теплерограмма, полученная при восстановлении одной и то же голограммы. На этом рисунке приведены результаты воздействия высокоинтенсивного лазерного излучения на тонкую (6 мкм) алюминиевую фольгу. Фокусируемый лазерный импульс с энергией ~ ЮО Дж и длительностью 2 не обеспечивает на поверхности фольги в фокальном пятне диаметром ~ 250 мкм освещенность ~ 1014 Вт/см2 и давление порядка нескольких мегабар. В результате по направлению лазерного луча ускоряется облученный и нагретый до температуры 10—15 эВ участок фольги. В противоположном направлении, навстречу лазерному лучу распространяется формируемая в остаточном газе (Юторр) сферическая ударная волна. Заметим, что все неоднородности нагретого и уже превращенного в плазму ускоренного вещества наиболее отчетливо проявляются на теплерограмме. 5) В сущности отличие обычной интерферограммы от голограммы состоит лишь в величине угла р между волновыми векторами предметного и опорного лучей. Из двух слагаемых, стоящих под знаком косинуса, в первом случае Ф(х9у) ж 2лх sin ($/X, во втором — Ф(х,у) <IC 2ttxsinjS/A. Это позволяет при восстановлении голограмм развести в пространстве и отфильтровать нужные порядки дифракции.
8.3. Операции в схеме восстановления 223 Рис. 8.5. Формирование ударных волн Рис. 8.6. Интерферограммы, получен- в остаточном газе при облучении тон- ные при восстановлении одной и той кой металлической фольги лазерным же голограммы, но при разных на- импульсом. Интерферограмма (свер- правлениях угла падения луча дифрак- ху) и теплерограмма (участок, выделе- ции нулевого порядка ний на интерферограмме прямоугольником), получены в схеме восстановлении из одной и то же голограммы Отметим еще одну возможность использования обсуждаемой схемы восстановления. Изменяя угол )8*, под которым волна дифракции нулевого порядка направляется на объектив L\, мы можем изменять расстояния между полосами интерферограммы и/или их ориентацию (рис. 8.6), что в ряде случаев оказывается крайне полезно при дальнейшей обработке интерферограмм.
ГЛАВА 9 ЗОНДИРОВАНИЕ ЭЛЕКТРОМАГНИТНЫМИ ВОЛНАМИ Сегодня зондирование объектов исследования электромагнитными волнами — плодотворный и широко распространенный метод экспериментальной физики [1—3]. Мы уже сталкивались с его применением в главах 7 и 8 при изучении интерферометрии и голографии, основанных на измерениях изменения фазы электромагнитной волны при ее прохождении сквозь объект исследования или при отражении от него. Здесь же мы сосредоточим наше внимание, в основном, на рассеянии]) электромагнитного излучения [4], предварив этому рассмотрение распространения света в прозрачных изотропных средах. Рассеяние занимает особое место среди методов изменения, поскольку позволяет определять локальные параметры объекта исследования, в то время как в большинстве других оптических методов измеряемая величина представляет собой интеграл вдоль пути распространения зондирующих сигналов или интеграл вдоль направлений, по которым производятся наблюдения за эмиссиями исследуемого объекта. Сразу оговоримся — нелинейные явления рассматриваться не будут и наш анализ мы проведем для волн видимого и инфракрасного диапазонов, оставив рентгеновский диапазон до следующей главы. 9.1. РАСПРОСТРАНЕНИЕ ЭЛЕКТРОМАГНИТНЫХ ВОЛН В ВЕЩЕСТВЕ В физике под термином «прозрачные среды» понимают твердые, жидкие или газообразные вещества, в которых на длине распространения света его поглощение — так называемые «серые потери» — пренебрежимо малы. Таким образом, в этом случае основной итог взаимодействия излучения с веществом — изменение скорости распространения света в среде. Коэффициент, который показывает во сколько раз 1) Рассеяние — это возникновение слабых рассеянных волн с частотами и направлениями, отличающимися от частоты и направления распространения основной волны.
9.1. Распространение электромагнитных волн в веществе —'w- 225 скорость света в среде отличается от скорости света в вакууме п = принято называть «показателем преломления» (дар геометрической оптике). Здесь е — диэлектрическая постоянная, \i — магнитная проницаемость вещества. (Для большинства прозрачных сред // практически равно единице, исключая плазму с «вмороженным» магнитным полем, где \i может достигать пяти—шести порядков величины). С физической точки зрения е — это коэффициент, показывающий во сколько раз электрическое поле в среде меньше, чем в вакууме: D = eE = E + 4пР = Е + 4ппеехо, (9.1) где D — вектор электрической индукции, Е — электрическое поле электромагнитной волны в вакууме, Р — вектор поляризуемости, е — заряд электрона, ле — их концентрация и хо — амплитуда колебания электрона в осциллирующем поле электромагнитной волны. Величину хо найдем из уравнения колебаний х - ух + (о\х = -Еое~ш, (9.2) т решение которого хорошо известно х = хое-ш, (9.3) где хо = —т-^ « f 2. (9.4) т(а)0 — со + ту) т(щ — ы ) (Вдали от резонанса хо « еЕо/[т(а)1 — <о2)]9 поскольку \а>1 — <о2\ ^> \iayy\.) Отсюда „ П^е Е Пев Е /Л -v Р = яеехь = г~^2 w 7 г» (^-5) т(щ — а) 4- i(oy) т(щ — со ) 2 , , 4лпее2 1 , 4ппее2 /Л ,ч Е = ГГ =\-\ г 2 ^ ! + Т^ Г> (9*6) т((Оо — (о + itoy) т(щ — о) ) Последняя формула верна, во-первых, вдали от резонанса (где щ « а>) и, во-вторых, она получена исходя из гипотетического предположения о том, что в среде имеется единственный осциллятор. Однако, в реальной среде имеется не один, а множество осцилляторов с собственными частотами а>*. Поэтому, например в газе, приходится суммировать по 2) Заметим, что это и следующее соотношения позволяют вычислять п с хорошей точностью лишь тогда, когда второй член правой части этих равенств мал по сравнению с единицей.
226 —f\y- Глава 9. Зондирование электромагнитными волнами всем энергетическим состояниям молекул и/или атомов газовой смеси, учитывая больцмановское расселение: *£ (9.8) Здесь fk — так называемая «сила осциллятора» — безразмерный коэффициент, учитывающий вклад осцилляторов с собственными частотами ш& в дисперсию, другими словами их эффективность. (Пугающая сложность соотношения (9.8) не должна смущать — приемлемая точность вычислений достигается всего при нескольких а)к близких к со.) Комплексный показатель преломления можно представить в виде у/г = л(1 - /д), и из выражения (9.6) найти действительную и мнимую части, первая из которых определяет фазовую скорость, а вторая — затухание волны: 2 = 2v2 2 21 ' V^*xv/ m I \wq — о) ) ~г (О у \ Вблизи резонанса щ « о), поэтому (и>\—а)2) = (щ -\-а))(о)о—ш)« 2(о(щ—<о), что позволяет получить: (9.11) (9.12) ) [4(й>о - ft>)2 + г2] Учитывая, что д;2 <$: 1, найдем зависимость п((о) вблизи резонанса: 1 + F^ .2 . и • (9-13) Эту зависимость иллюстрирует рис. 9.1. Следует обратить внимание на то, что в районе резонанса п((о) уменьшается с увеличением <о. Эта особенность получила название аномальной дисперсии. Уравнение колебаний свободных электронов в плазме (щ = 0) запишется как /их = eEexp{-i<ot}. (9.14) 3) Эта формула полезна для всякого рода оценок. Точные же значения показателя преломления (равно как и значения fk), приводимые в справочной литературе, получены, естественно, из экспериментов.
9.2. Рассеяние электромагнитных волн на флуктуациях плотности 227 Отсюда хо = -еЕ/(то)2), Р = - е= 1- Annte2 та) <*>D (9.15) — плазменная частота, и, наконец, 0 где <Ор = у/4ппее1/т 1 (916) 2та> 2(0 Отметим, что коэффициентом преломления плазмы меньше единицы. Это значит, что если бы мы (в мысленном эксперименте) сделали из плазмы двояковыпуклую линзу, она работала бы как линза рассеивающая. п 1,0015 1,0000 0,9985 ' А У (1)0 О) Рис. 9.1. Зависимость п((о) вблизи резонанса Из соотношения (9.15) несложно получить дисперсионную кривую: k((o) = у/(о2-(х)2р1с2. Отсюда фазовая скорость ир = ш/к = c\/a)2/(a)2-(oj), групповая скорость ug = d(o/dk = (?/up. Заметим, что в плазме реализуется соотношение upug = с2. 9.2. РАССЕЯНИЕ ЭЛЕКТРОМАГНИТНЫХ ВОЛН НА ФЛУКТУАЦИЯХ ПЛОТНОСТИ Заметим, что формализм Гюйгенса-Френеля не допускает отклонения лучей света, прямолинейно распространяющихся в сплошной однородной среде на углы, большие дифракционных. Такое отклонение и, на самом деле, было бы невозможно, если бы плотность среды, через которую распространяется излучение, была бы строго однородна в пространстве. Действительно, пусть луч света с плоским волновым фронтом и, диаметром D распространяется сквозь однородную среду. Выделим некую плоскость, перпендикулярную направлению распространения, т.е. перпендикулярную волновому вектору ко (рис.9.2). Примем, что поле световой волны в этой плоскости A(t) = А§е~ш. Пусть небольшой объем среды Д V лежит в плоскости волнового фронта и со-
228 Глава 9. Зондирование электромагнитными волнами держит N = A Vn частиц, где п — их концентрация. Понятно, что электромагнитное поле излучения электронов (связанных или свободных), находящихся в осцилляторном поле первичной световой волны и лежащих в плоскости волнового фронта внутри объема AV, будет пропорционально N = AVn: Ae(t) ~ AoAVne~~ia)t. Поле в точке наблюдения As(t) = kAoAVnexp{-i(o(t - L/c)}, где L — расстояние от излучателя до приемника излучения, а к — коэффициент, показывающий во сколько раз амплитуда поля рассеянной волны меньше амплитуды первичной волны, т. е. Aq. (Характер и величина рассеянного излучения будут ниже обсуждаться подробно.) Как понятно из рис. 9.2, при не очень малых углах рассеяния мы всегда можем найти в плоскости волнового фронта, на расстоянии Ах точно такой же по величине объем Д V, но находящийся от приемника излучения на расстоянии L + А/2. Для этого лишь необходимо выполнить условие Ах sin в = Л/2, где в — угол между волновыми векторами АЬ и Ks, т. е. между волновыми векторами зондирующего и рассеянного излучения. Понятно, что лучи Ks\ и Ksi проинтерферируют и, находясь в противофазе, взаимно компенсируют друг друга. Всякому ли объему Д V найдется парный? Конечно, нет. При уменьшении в увеличивается Ах и при Ах = D (рис. 9.2) парный объем будет лежать уже за пределами распространяющегося луча. Однако в этом случае 26 = Л//), т. е. в — просто угол дифракции. Объект исследования Рис. 9.2. Рассеяние электромагнитных волн на флуктуациях плотности Итак, если бы плотность (концентрация) зондируемого объекта была бы строго однородна в пространстве, рассеяние вне дифракционного угла было бы в принципе невозможно. Однако, за счет тепловых флук-
9.3. Бриллюэновское рассеяние —If/- 229 туаций плотность в пространстве разнится и полной компенсации не происходит. Ясно, чтобы найти значение поля и интенсивности света, рассеянного в направлении Ks, нужно суммировать излучение из всех объемов А К, лежащих в плоскости волнового фронта: Az(t) = kAoAV^njexpi-icjit - <pj)}, I(t) = Az(t)A*z(t), (9.17) j причем (pj = Lj/c. Представим я, в виде rij = n + Srij, где п — средняя плотность, a Srij — случайная флуктуация. Тогда Az(t) = kAoA vY,(n+6nj) QXp{-ia)(t-ipj)} = кАоАУ£ <Ч QXp{-ia)(t-(pj)}, j J (9.18) поскольку, как показано выше £, лехр{-М/ - <ру)} = 0. Теперь ^)2 = 4 L * = 4ъ, (9.19) j j так как 6п = \/я. Заметим, что Nz — общее число излучающих электронов, находящихся в объеме К = £у Д V. Таким образом, интенсивность рассеянной волны пропорциональна общему числу электронов, находящихся в поле зондирующего излучения. 9.3. БРИЛЛЮЭНОВСКОЕ РАССЕЯНИЕ Неоднородности плотности могут быть связаны не только с тепловыми флуктуациями, но и с различного типа волнами, распространяющимися в среде. Типичный пример — бриллюэновское рассеяние, т. е. рассеяние электромагнитной волны на стоячей звуковой волне, возбуждаемой с помощью соответствующего вибратора в твердом теле, жидкости, газе или плазме. Ситуацию, возникающую при бриллюэнов- ском рассеянии, иллюстрирует рис. 9.3. Как видно из рисунка электромагнитная волна с плоским волновым фронтом и волновым вектором ко распространяется вдоль оси Z и рассеивается на флуктуациях плотности созданных стоячей звуковой волной. Последняя сформирована двумя, распространяющимися навстречу друг другу звуковыми волнами с волновыми векторами q и — q. При этом, как видно из рисунка, угол между q и осью X равен 0/2. Если, следуя Л. И. Мандельштаму, рассматривать бриллюэновское рассеяние как дифракцию на пространственной структуре стоячей звуковой волны, нетрудно понять, что угол между ко и волновым вектором рассеянной (дифрагированный) волны ks будет равен в (угол падения равен углу «отражения»). Убедимся, что это так. Опустим перпендикуляр из начала координат на вектор ks. Если прямая A—D лежит в плоскости волнового фронта рассеянной волны, то ее фаза
230 Глава 9. Зондирование электромагнитными волнами в точках А и D должна быть одна и та же. Одна и та же фаза волны и в точках Аи В, поскольку они обе лежат в плоскости волнового фронта падающей волны, перпендикулярного &о« Таким образом, для синфазности световых волн в точках А и D необходимо и достаточно, чтобы на пути B-C-D укладывалось бы целое количество длин волн лА. Как понятно из рис. 9.3, отрезки ВС и CD равны между собой, причем каждый из них равен A sin(0/2), где А — длина волны звуковых колебаний. Отсюда окончательно имеем 2Asin(0/2) = /iA, (9.20) что является не чем иным, как условием Вульфа-Брегта. Как мы увидим чуть позже, этот результат может быть получен гораздо проще, чисто формально, без предшествующих долгих рассуждений, цель которых лишь разъяснить феноменологическую картину. Рис. 9.3. Бриллюэновское рассеяние Из-за гармонического изменения пространственной плотности среды, создаваемой стоячей звуковой волной, рассеянный свет будет промоду- лирован (рис. 9.4), что приведет к появлению двух спектральных компонент в рассеянном излучении. Действительно, E(t) ~ jEb cosiot cosQt = -Eo[cos(a)Q + £2)t + где £2, как понятно, частота звуковой волны. (9.21)
9.3. Бриллюэновское рассеяние —fly- 231 Бриллюэновское рассеяние удобно рассматривать в квазиквантовом приближении. Для этого представим стоячую звуковую волну в виде двух одинаковых по амплитуде волн, распространяющихся навстречу друг другу, т. е. волн с волновыми векторами q и — q. Теперь напишем уравнения сохранения энергии и импульса в виде: Ншо - fUos = ±Ш\ (9.22) ftko - hks = ±hq. (9.23) Первое равенство демонстрирует физическую причину появления спектральных компонент при рассеянии фотонов на фононах — фотон либо приобретает, либо отдает энергию, равную энергии фонона. Второе равенство, графическое представление которого приведено на рис. 9.5, дает возможность получить несколько формул, которые будут очень полезны в дальнейшем. ks Рис. 9.4. Модуляция рассеянного излу- Рис. 9.5. Бриллюэновское рас- чения сеяние (векторная диаграмма) Прежде всего, как это ясно из рис. 9.5 |tf| = 2|fc|sin(0/2). (9.24) Подставляя в это равенство попеременно \q\ = 2n/A или \q\ = £2/vs, где vs — скорость звука, и, соответственно, \к\ = 2л/А или \к\ = а)/с9 а также учитывая, что модули волновых векторов ко и ks практически равны, т. е. \ко\ « \ks\ получим, во первых: A = 2Asin(0/2) (9.25) — аналог условия Вульфа—Брегга; во вторых: Q = 2—u>sin(0/2), (9.26) с или А (9.27)
232 -J\y- Глава 9. Зондирование электромагнитными волнами откуда видно, что спектральные смещения рассеянных компонент — это доплеровские смещения; и, наконец, найдем, что разность кр — к$, называемая разностным вектором и обычно обозначаемая как к будет равна по модулю 4я8У/2) (9.28) |*| У, Яо где, как понятно, Яо = 2пс/щ, 9.4. ТОМСОНОВСКОЕ, РЭЛЕЕВСКОЕ И РЕЗОНАНСНОЕ РАССЕЯНИЕ Из теории излучения следует, что мощность излучения осциллирующего электрона „2 Л2 е~Ъ с3 ' где с — скорость света, х — среднеквадратичное ускорение осциллирующего электрона, а е — его заряд. Дважды дифференцируя уравнение (9.3), найдем, что х = —io2xoe~ia)t, откуда *У *. (9-29) Теперь, принимая во внимание, что /о = сЕ2/(4л), где /о — интенсивность зондирующего излучения (т.е. 2$=4л/0/с), а так называемый классический радиус электрона го = ^/(/ис2), получим (luj - wz 4- iwr) J L 3 (Щ - (0 Величину, стоящую в квадратных скобках, обозначим, как а. Она имеет размерность площади и играет роль сечения рассеяния. Действительно, если мы умножим обе части этого равенства на длительность зондирующего импульса Af и концентрацию электронов п, то величина Pshtn = = IoaAtn будет представлять собой энергию, рассеиваемую п электронами единицы объема среды. Понятно, что Psktn/(hv) — это число фотонов, рассеиваемых единицей объема в телесный угол 4я. Результаты рассмотрения трех возможных ситуаций (щ <g: w; щ ^> а> и щ = (о) приведены в табл. 9.1. Как видно из таблицы сечение томсоновского рассеяния составляет всего лишь а « 10~25 см2, сечение рэлеевского рассеяния растет как 1/Я4 и, поскольку всегда у <^ со, сечение резонансного рассеяния на много порядков величины больше любого из них.
9.5. Рассеяние на движущихся электронах 233 Таблица 9.1 1 2 3 <л>о «С су ; 0)0 ^> (О 0>о = (О 8л 2 *= уП? 8тг 2/ л> \4 Томсоновское рассеяние Рэлеевское рассеяние Резонансное рассеяние Подчеркнем, что величина а характеризует полное эффективное сечение рассеяния одним электроном в телесный угол равный 4л. Индикатрисы рассеяния поляризованного и неполяризованного излучений показаны на рис. 9.6. Дифференциальное сечение рассеяния, т. е. рассеяние в элементе телесного угла dQ в направлении, составляющем угол ц> с направлением вектора Е зондирующей волны, запишется как: da = r$sin2(pdD. (9.31) Понятно, что /4яda = I = /max Sin2 <p / = /max( 1+ COS2 0)/2 Рис. 9.6. Индикатрисы рассеяния поляризованного (а) и неполяризованного (б) излучений 9.5. РАССЕЯНИЕ НА ДВИЖУЩИХСЯ ЭЛЕКТРОНАХ Пусть электрон движется со скоростью Ve и вектора Ко, Ks и Vt направлены так, как показано на рис. 9.7. Ясно, что благодаря до- плеровскому сдвигу осцилляция электрона будут происходить на частоте (932) Поскольку электрон движется, излучение, попадающее в неподвижный приемник, будет также смещено относительно частоты осциллирующего электрона: / Л/ F1 \ / Л/ V- \ (9.33)
234 Глава 9. Зондирование электромагнитными волнами Пренебрегая из-за малости членом окончательно имеем (9.34) где разностный вектор К = Ко — Ks- Отсюда с\К\ поскольку \К\ = (Оо/с. Рассмотрим спектр излучения, рассеянного электронами, имеющими максвелловское распределение и температуру Ге. Для любого из направлений функция распределения -^f\dV. (9.35) dne = Сместим начало отсчета в точку щ. Тогда a) = ^Ve, dV = da)/(Kcos<p) и, как и раньше, \К = 2(u>o/c)sin(0/2)|. Теперь dne = Bexpl , та) с \ da). (9.36) Отсюда несложно получить значение «полуширины» (FWHM) спектра излучения, рассеянного под углом в (9.37) Как видно из формулы (9.37) температура Ге определяется из относительных измерений — для ее вычисления нет необходимости измерять абсолютную величину рассеянного излучения. Рис. 9.7. Векторная диаграмма, иллюстрирующая рассеяние электромагнитной волны на движущихся электронах 9.6. КОМБИНАЦИОННОЕ РАССЕЯНИЕ В ПЛАЗМЕ Физическую суть комбинационного рассеяния демонстрирует рис. 9.8, на котором сравниваются две ситуации — когда длина волны зондирующего излучения либо много меньше рис. 9.8, а, либо много больше рис. 9.8, б дебаевского радиуса /ъ. В первом случае внутри дебаевской сферы электроны, перемещающиеся в электрическом поле волны в разные стороны и не создают пространственного заряда, т. е. рассеяние происходит на свободных электронах. Во втором случае электроны внутри дебаевской сферы смещаются в одну сторону, поэтому такое смещение создает пространственный заряд, а значит и возвращающую силу.
9.6. Комбинационное рассеяние в плазме —■!/- 235 (Оре й)0 (х)о Рис. 9.8. Две крайние ситуации при комбинационном рассеянии Плазма лц Рис. 9.9. Комбинационное рассеяние в случае, когда длина волны излучения и радиус Дебая близки Понятно, что при этом возбуждаются плазменные колебания с частотой о)р. Это физически ясное, но годящееся лишь при достаточно жестком условии А < /ь толкование не в состоянии объяснить ситуацию, показанную на рис. 9.9, где перпендикулярно зондирующему лучу имеет место томсоновское рассеяние, а под малым углом к ко — комбинационное. Здесь оказывается более плодотворным другое рассмотрение — фотоны рассеиваются не только на флуктуациях свободных электронов, но и на плазменных колебаниях, т. е. на плазмонах, подобно рассеянию на фононах (см. §9.3). Разница лишь в том, что волновые вектора плаз-
\ 236 —11/- Глава 9. Зондирование электромагнитными волнами менных колебаний хаотизированы в пространстве, т. е. принципиально рассеяние на плазмонах возможно под любым углом. Аналогично уравнениям сохранения (9.22) и (9.23) можно записать щ-cos = <*>р; (9.38) *о - ks = kp, (9.39) где (х)р и кр — частота и волновой вектор плазменных колебаний соответственно. Из рисунков 9.5 и 9.9 видно, что для рассеяния на большие углы необходимо, чтобы модуль вектора кр был порядка ко и ks. В целом ряде случаев это не выполняется, поскольку зачастую плазменные колебания с \кр\ « |Аь| не могут существовать в плазме из-за затухания Ландау. (Именно такую ситуацию иллюстрирует рис. 9.9). Возможность комбинационного рассеяния в плазме определяет критерий Солпитера а = — = А° к пАя*п(0/2У Комбинационное рассеяние имеет место, если а > 1. Заметим, что при комбинационном рассеянии плотность электронов в плазме может быть найдена из относительных измерений по смещению спектральных компонент, поскольку (ор = 4ппе2/т. Отметим также, что в целом ряде случаев при комбинационном рассеянии, возможно наблюдать также расщепление центрального максимума. Это происходит из-за рассеяния световых волн на волнах ионной плазменной частоты a)pi. При этом по значениям спектральных компонент (o)q ± a)pi) также из относительных измерений можно найти вдобавок и плотность ионов. Справедливости ради подчеркнем, что реализовать эту принципиальную возможность удается лишь в экзотических случаях. 9.7. АППАРАТУРНАЯ РЕАЛИЗАЦИЯ Возможны три основные схемы регистрации. В первой из них рассеянное плазмой излучение собирается в узком телесном угле и приносит информацию о температуре и плотности плазмы из небольшого объема пространства, образованного пересечением зондирующего лазерного луча и луча наблюдения (рис. 9.10, а). Момент измерения определен моментом генерации зондирующего лазерного импульса. Рассеянное плазмой излучение направляется в спектрограф или полихрома- тор4). Прошедшее спектрограф излучение регистрируется, как правило, с помощью набора ФЭУ, на фотокатоды которых приводится свет из 4) Используемые спектральные инструменты рассмотрены в гл. 6.
9.7. Аппаратурная реализация 237 разных областей спектра. Часто вместо спектрографа или полихромато- ра используется набор узкополосных фильтров, пропускающих в разных спектральных интервалах. Конечно, таким способом невозможно найти функцию распределения электронов по скоростям, но измерить температуру можно. Действительно, при термодинамическом равновесии функция распределения рассеянного излучения — гауссиана (см. §9.5), для определения параметров которой достаточно нескольких отсчетов. Эта самая простая реализация нехороша лишь тем, что позволяет в каждом измерении получить значение температуры только в одной локальной точке исследуемого объекта и лишь в один момент времени. Заметим, что по ходу зондирующего луча установлены две световые ловушки. Это необходимо, чтобы снизить паразитный фон, обусловленный рассеянием зондирующего излучения на входном и выходном окнах вакуумной камеры. Световая ловушка Плазма Зондирующее излучение Световая ловушка Плазма Рассеянное излучение Спектрограф ПЗС- линейка а б Рис. 9.10. Регистрация рассеянного излучения Во втором случае линия, вдоль которой распространяется зондирующий лазерный луч, проецируется на входную щель спектрографа (рис. 9.10, б). Проецируется так, чтобы линия распространения лазерного луча и щель спектрографа были бы оптически сопряжены. Это делает возможным измерять распределения температуры вдоль зондирующего луча поскольку, в этом случае будут получены спектры рассеянного излучения для каждой точки изучаемого объекта вдоль луча зондирования. Понятно, что здесь требуется двумерный регистратор, роль которого может играть ЭОП или высокочувствительная ПЗС-камера с охлаждением ПЗС-матрицы. В третьем подходе используется схема ЛИДАР5) (рис. 9.11), в которой плазма зондируется очень коротким лазерным импульсом (его длитель- 5) ЛИДАР — лазерный локатор (LIDAR — Light Detecting And Ranging), назван так по аналогии с РАДАР-ом (RADAR — Radio Detecting And Ranging).
238 -J\/- Глава 9. Зондирование электромагнитными волнами ность т определяет пространственное разрешение AZ = ст/2), а рассеянное назад излучение приводится на регистратор, записывающий спектр рассеянного излучения во времени /(/, Я). Понятно, что в этом случае каждый момент времени строго соответствует позиции зондирующего импульса в пространстве, что и позволяет получить распределение температуры и плотности вдоль направления зондирования, поскольку, как и в предыдущем случае, здесь будут получены спектры рассеянного излучения для каждой точки изучаемого объекта вдоль луча зондирования. Все три метода широко используются. Рассеянные Зондирующий импульсы импульс Рис. 9.11. ЛИДАР — принципиальная схема измерений Оценим требуемую энергию зондирующего лазерного импульса. Как понятно из пояснений к формуле (9.30), число фотонов, рассеиваемых электронами единицы объема в телесный угол 4л за время Д* Ps&tn/(hv) = = Ioaktn/(hv) = gan/(hv)9 где £ = /оД* — плотность энергии зондирующего лазерного импульса. При этом, если, соответственно, г], у, (л — коэффициенты, определяющие: эффективность сбора рассеянного излучения т] (обычно порядка 2 • 10~3—2 • 10~5 в зависимости от расстояния от рассеивающего объема до приемного объектива); у — потери в оптическом тракте (0,2—0,5); \х — квантовая эффективность фотоприемника (~ 0,3), a D — диаметр зондирующего луча, то Ne = {пТР-^щ^^АЬу^па — это число электронов, эмитированных фотокатодом фотоприемника или запомненных в структуре ПЗС-матрицы. Пусть мы имеем дело с Том- соновским рассеянием (а « 10~25 см2), концентрация электронов, как
9.7. Аппаратурная реализация 239 это имеет место в крупных термоядерных установках типа ТАКОМАК, п « 1014 см~3, длина волны зондирующего излучения 1,054 мкм, и энергия лазерного импульса nD1$/4 порядка 1 Дж. Тогда, если мы хотим иметь пространственное разрешение прядка 1 см, т. е. регистрировать излучение рассеянное одним кубическими сантиметром среды, то число фотонов, попадающих в апертуру приемника излучения, будет порядка 104, число фотоэлектронов составит примерно 600 и статистическая погрешность 1Д/^Уе около 4%. Эти оценки совпадают с экспериментальной практикой. 2,53/ 43,625 0,5 0 2,24/ 1 1 \ 44,825 1 1 7 _н 1 о в 0 ТО If41 1 L. А*. ' " ^\: \: 20 0 2,24/ 1 • 44,825 i I 2 4 R 2 4 R Рис. 9.12. Лазерное зондирование плазмы на установке JET (Joint European Torus) в момент инжекции в плазму DD-пелеты В заключение приведем результаты лазерного зондирования плазмы на установке JET (Joint European Torus) в моменты до и после инжекции в плазму DD-пелеты. В этом эксперименте использовался лазер, работающий на частоте повторения 1,2 Гц. В качестве регистратора применялась электронно-оптическая камера. Как видно из рис. 9.12 сразу же после инжекции в плазму DD-пелеты в центре плазменного шнура плотность плазмы возрастает больше, чем на порядок величины, а температура на порядок величины падает.
240 -J\^ Глава 9. Зондирование электромагнитными волнами ЛИТЕРАТУРА 1. Тихонов А. #., Пергамент М.И. Современные методы измерений и интерпретации наблюдений в высокотемпературной плазме // В кн.: Диагностика плазмы. Вып. 4 (II). — М.: Энергоиздат, 1981. — С. 130-147. 2. Пергамент М. И. Диагностика плазмы по рассеянному излучению // Энциклопедии низкотемпературной плазмы. — Т. II. — М.: Наука, 2000. — С. 569-572. 3. Пятницкий Л. Н, Лазерная диагностика плазмы. — М.: Атомиздат, 1976. 4. Ландау Л. Д, Лившиц Е.М. Электродинамика сплошных сред. — М: ФИЗ- МАТЛИТ, 2003. - С. 588.
ГЛАВА 10 РЕНТГЕНОВСКИЕ ИЗМЕРЕНИЯ Сегодня область измерений и исследований с помощью рентгеновского излучения простирается от биологии и медицины до кристаллографии и металлургии, причем в каждом случае необходимы подробные рассмотрения применяемых методов. Естественно, невозможно, да и не нужно, пытаться охватить всю эту обширную область. Поэтому мы сосредоточим наше внимание лишь на методах рентгеновских измерений, применяемых в экспериментальной физике, ограничив при этом рассматриваемый спектральный интервал, в основном, дальним, или, как принято говорить, вакуумным ультрафиолетовым (ВУФ) и мягким рентгеновским (МР) излучениями. 10.1. СПЕКТРАЛЬНАЯ ОБЛАСТЬ И ИСТОЧНИКИ РЕНТГЕНОВСКОГО ИЗЛУЧЕНИЯ Таким образом, предметом нашего рассмотрения будет диапазон длин волн от 200 до ~ 0,25 нм (соответственно при энергии фотонов от ~ 6 эВ до ~ 5 кэВ)!). Этот диапазон длин волн широко используется в экспериментальной физике не случайно. Во-первых, именно в этом диапазоне длин волн излучение активно реагирует с атомными структурами, открывая путь для их изучения и анализа2). Во-вторых, в этот диапазон длин волн сдвигается максимум излучения высокотемпературных объектов исследования, будь то лабораторная высокотемпературная плазма или астрофизические объекты. В третьих, длина волны излучения соизмеримая с межатомными расстояниями в твердых телах позволяет использовать это обстоятельство при измерениях. Обсуждаемый диапазон длин волн условно делится на вакуумное ультрафиолето- 1) Если длины волн выражены в нанометрах, а энергия фотонов — в электрон- вольтах то переход от одной системы единиц к другой осуществляется на основе равенства НшХ = 1239,842 эВ • нм. 2) Заметим, что равным образом, инфракрасное излучение, активно реагируя с молекулярными объектами, сыграло решающую роль в идентификации их структур и продолжает оставаться надежным источником при их анализе.
242 —I \s- Глава 10. Рентгеновские измерения вое (200—10 нм) и мягкое рентгеновское (10—0,25 нм) излучения. Именно условно, поскольку, если границы этого диапазона, как длинноволновая, так и коротковолновая, еще могут быть объяснены тем обстоятельством, что вне этих границ нет необходимости использовать вакуумную аппаратуру, то граница 10 нм, разделяющая ВУФ- и МР-излучения чисто условна. Сильное поглощения излучений этого диапазона (даже в воздухе при атмосферном давлении) создает дополнительные трудности при измерениях, что связано с необходимостью использовать вакуумные приборы, невозможностью применять оптические инструменты, основанные на рефракции, ограниченностью углов, в которых возможно отражение и т. п. Излучение в обсуждаемой области спектра обладает некоторыми особенностями, принципиально разделяясь на излучения связанные со свободно-свободными переходами, свободносвязанными переходами и связанно-связанными переходами. Первый тип излучений обычно называют «тормозным излучением». Как мы выяснили в гл. 9, мощность излучения электрона пропорциональна квадрату его ускорения х2 при движении электрона по траектории. Поэтому, например, в плазме, при движении в поле иона по криволинейной траектории, электрон излучает. Такова же природа синхротронного излучения, т. е. электромагнитного излучения электронов, движущихся по искривленным магнитным полем траекториям. Для создания таких траекторий применяют так называемый ондулятор или вигглер (магнит, создающий сильное поперечное знакопеременное магнитное поле), заставляющий пучок электронов двигаться по извилистой траектории, близкой к синусоиде. При таком движении пучок электронов теряет энергию, которая преобразуется в поток фотонов, излучаемых в узкий конус вдоль оси пучка. И в том, и в другом случаях генерируется излучение с непрерывным спектром. Свободносвязанные переходы реализуются при, так называемом «ре- комбинационном излучении», при котором свободные электроны занимают вакансии в ионизованных атомах, а излишек энергии сбрасывается путем рождения фотонов. В плазме этот процесс интенсифицируется при ее охлаждении, поскольку сечение рекомбинации растет при уменьшении скорости электронов. Интересно, что при этом создается инверсная заселенность, поскольку, в основном, сначала заполняются верхние подуровни и лишь затем электрон переходит в основное состояние, а излишек энергии уносится с родившимся фотоном. Заметим вскользь, что на этом пути ведутся работы по созданию рентгеновских лазеров. Наконец, связанно-связанные переходы, т.е. переходы электронов внутри атомной структуры. Различим процессы эмиссии фотонов с верхнего и внутренних атомных уровней. В первом случае электрон или фотон, возбуждающий атом, оставляя часть своей энергии, обуславливает
10.1. Спектральная область и источники рентгеновского излучения 243 переход связанного электрона внутри уровня с тем же главным квантовым числом в более высокое энергетическое состояние. По истечении времени жизни в возбужденном состоянии (~ 10~8 с, исключая мета- стабильные уровни) происходит релаксация, при которой атом возвращается в первоначальное состояние и генерируется фотон с энергией равной разности энергии этих двух энергетических состояний. Такой механизм, прежде всего, ответственен за генерацию излучения видимого спектрального диапазона. Однако у высокоионизованных ионов, например, водородоподобных ионов углерода или кислорода, которые часто наблюдается в горячей плазме, излучение лежит в рентгеновской области. (Те же серии Бальмера, Лаймана и Пашена, только сдвинутые в рентгеновский диапазон!) N М 4/7/2 45 р 35 .L3 •L2 тз •Kls Cu Kax = 8,048 эВ (1,541 A) Cu Kx2 = 8,028 эВ (1,544 A) Cu Kfix = 8,905 эВ Cu La, = 930 эВ Cu La2 = 930 эВ Cu Lpx = 950 эВ Рис. 10.1. Энергетическая структура атома меди Электрон или фотон при их достаточной энергии могут возбудить атом «выбивая» электрон и из внутренних оболочек. При релаксации осво-
244 Глава 10. Рентгеновские измерения бодившаяся вакансия, скажем на энергетическом уровне К, может быть замещена электроном с уровней L,M,N..., где K9L9M9N... — энергетические уровни с главными квантовыми числами 1,2,3,4..., соответственно. Как и прежде, энергия родившегося фотона будет равна разнице энергетических состояний атома до и после релаксации. Заметим, что при заполнении вакансии, скажем на уровне К электроном с уровня L, на последнем возникает вакансия, которая, в свою очередь, может быть заполнена электронами с вышележащих уровней. Излучение, генерируемое атомом при таких каскадных переходах, носит название «характеристического излучения». Линейчатый спектр характеристического излучения состоит из относительно небольшого количества спектральных линий, что способствует простоте идентификации химических элементов изучаемых объектов. Ситуацию иллюстрирует рис. 10.1, на котором в качестве примера показаны переходы, ответственные за генерацию спектров серий К и L. Охлаждающая " вода Рис. 10.2. Рентгеновская трубка: / — источник питания; 2 — накаливаемый катод; 3 — анод Перечисленные выше физические механизмы лежат в основе естественных или искусственно создаваемых источников рентгеновского излучения. Рассмотрим в основном те из них, которые используются в экспериментальной физике. Самым старым, но широко используемым и поныне (правда, прежде всего в медицине) источником рентгеновского излучения является рентгеновская трубка (рис. 10.2). Как видно из рисунка, этот вакуумный прибор состоит из накаливаемого катода, эмиттера электронов, охлаждаемого анода и источников питания. Верхняя граница генерируемого спектра обусловлена прикладываемым напряжением, нижняя — пропусканием колбы рентгеновской трубки. Это простой, надежный и достаточно компактный прибор. КПД преобразования электрической энергии в рентгеновское излучение у такого источника всего 1 %, но не это главный его недостаток. Прежде всего, нижняя
10.1. Спектральная область и источники рентгеновского излучения 245 граница генерируемого излучения лежит вне, имеющего первостепенного значения для экспериментальной физики диапазона ВУФ и МР. Во-вторых, это протяженный источник излучения, в то время как для подавляющего числа рентгеновских методов исследования, прежде всего зондирования, предпочтительны «точечные», т. е. малоразмерные, источники излучения. В-третьих, непрерывный (тормозной) спектр излучения тоже не подарок, поскольку в целом ряде случаев необходимо монохроматическое излучение, а это значит, что в дополнение к собственно источнику излучения необходим, причем вакуумный, монохроматор. Модификация описанного прибора была разработана для рентгеновского спектрофотометра в Ленинградском государственном университете (ЛГУ) в 60-х годах прошлого века. В этом спектрофотометре как таковой рентгеновской трубки нет — излучатель, содержащий источник электронов и сложный катод, помещены в общий откачиваемый корпус вместе с остальными компонентами прибора. Анод излучателя представляет собой многогранную призму, на грани которой прикрепляются пластины из материалов с разным Z (рис. 10.3). Призму можно, не нарушая вакуум, поворачивать вокруг своей вертикальной оси, подставляя под электронный луч ту или иную грань. Электронный луч формируется фокусирующим прожектором; ускоряющее электроны напряжение строго контролируется с тем, чтобы энергия электронов наилучшим образом соответствовала энергии ионизации возбуждаемого энергетического уровня. Как понятно из изложенного, речь идет о генерации характеристического излучения. Дискретный и сильно разреженный спектральный состав этого излучения облегчает монохроматизацию, допуская, в том числе, использование простых отражательно-поглощающих фильтров3). Последнее время достаточно широко используется синхротронное излучение. К сожалению, синхротрон, прежде всего в силу его габаритов, не есть источник, который мог бы быть использован на крупных экспериментальных установках. Объект исследования должен быть транспортирован к синхротрону, а не наоборот. Поэтому ряд синхротронов, используемых в качестве источников рентгеновского излучения, в так Рис. 10.3. Анод рентгеновского излучателя, предназначенного для генерации характеристического излучения 3) См. § 10.3.
246 Глава 10. Рентгеновские измерения называемых центрах коллективного пользования, оборудуется несколькими рабочими местами, где одновременно могут проводить свои исследования физики, биологи, химики, т. е. все те, кому для измерений достаточно иметь лишь рентгеновский луч. Что касается монохромато- ров, если они необходимы, детекторов, или других приборов или другого оборудования, так это забота самих исследователей. Молибденовые нити 0 20-30 мкм I = 100-200 кА Рис. 10.4. Точечный источник рентгеновского излучения (Jf-point) Иногда для генерации ВУФ-излучения используется разряд в капилляре. Расходимость генерируемого при этом излучения определяется лишь геометрией, т. е. отношением диаметра капилляра к его длине. В известном смысле это точечный источник, хотя его размер (диаметр выходного торца капилляра) не очень мал. Истинно «точечные» источники рентгеновского излучения основаны на иных принципах. Во-первых, это излучение плазмы, созданной сфокусированным лазерным лучом. Как показывают измерения, при облучении, например медной мишени, при интенсивности ~ 1014 Вт/см2 в фокальном пятне, около 50% энергии лазерного импульса преобразуется в рентгеновские излучение с энергией фотонов превышающих 100 эВ. При этом размеры излучающей области примерно равны размеру пятна фокусировки (30—100 мкм). Важно также то, что длительность рентгеновского импульса примерно соответствует длительности облучения. Это позволяет получать рентгеновские снимки с наносекундными временами экспонирования. Другой, используемый в последнее время «точечный» источник — это Х-пинч (if-point) — в сущности, это микро Z-пинч, в котором локализована область перетяжки. Схема этого устройства приведена на рис. 10.4. Показанная на рисунке конфигурация проводников (металлические нити с диаметром в несколько десятков микрон) приводит к формированию плотного и горячего плазменного образования в месте их пересечения. Размер этой зоны, сфотографированный за фильтром, отсекающим фотоны с энергиями меньшими, чем 1 кэВ, не превышает нескольких микрон.
10.2. Детекторы рентгеновского излучения —fly- 247 Более подробное описание физических процессов и разработанных на их основе источников рентгеновского излучения можно найти в основательной монографии Дэвида Аттвуда [1]. 10.2. ДЕТЕКТОРЫ РЕНТГЕНОВСКОГО ИЗЛУЧЕНИЯ Самым старым и, кстати, весьма надежным детектором рентгеновского излучения является фотослой4*. Основная трудность при применении обычных фотослоев — это поглощение МР- и ВУФ-излучений лишь в поверхностном слое фотоэмульсии. Это приводит с одной стороны к резкому сокращению фотографической ширины, а с другой — к ограничению поверхностной плотности активированных зерен, а значит и их общего числа, т. е. к резкому уменьшению отношения сигнал/шум. С этим можно бороться двумя путями — либо наносить на фотоэмульсию тонкий слой люминесцирующего вещества, преобразующего рентгеновское излучение в видимое, либо использовать относительно недавно разработанные, так называемые, «безжелатиновые» фотослои. Их фотоэмульсия прозрачна для мягкого рентгеновского излучения, в силу чего зерна фотослоя активируются по всей его глубине. Кстати заметим, что сцинтилляторы, широко используемые при регистрации жесткого рентгеновского, гамма и корпускулярного излучений, достаточно редко применяются в ВУФ- и МР-диапазонах. И понятно, почему. Сцинтилляторы в перечисленных выше измерениях служат как посредники при сочетании распространяемого в воздухе излучения с фотокатодами отпаянных (вакуумных) фотоэлектронных приборов (ФЭУ, ЭОП). При этом излучение, не проникающее сквозь колбу прибора или имеющее ничтожный квантовый выход, трансформируется сцин- тилляторами в видимый диапазон, где подобных проблем не существует. Таких проблем нет и области ВУФ и МР, правда, частично по другой причине — излучение этого диапазона длин волн в любом случае транспортируется в вакууме, а квантовый выход при фотоэффекте для столь энергичных квантов достаточно высок даже тогда, когда не используются специальные фотокатоды. Поэтому в этой области спектра применяются открытые фотоэлектронные умножители, в которых, как это показано на рис. 10.5, измеряемое излучение направляется непосредственно на первый динод, выполняющий роль фотокатода. Равным образом используются и рассмотренные нами в гл. 4 микроканальные умножители (МКУ) или их сборки5) — МР-излучение освещает входные торцы МКУ. В электронно-оптических преобразователях (ЭОП) в качестве фотока- 4)См. §4.4. 5)См. §4.2.
248 Глава 10. Рентгеновские измерения тода в МР-области спектра (hv > 100 эВ) обьино используется золотая фольга толщиной ~ 100 нм. Такие фотокатоды, освещаемые с фронтальной стороны, эмитируют электроны с тыльной стороны фольги. Временное разрешение ЭОП-ов в этой области спектра составляет 10—15 пс. ФЭУ используются, прежде всего, при регистрации слабых потоков излучения, поскольку их коэффициент усиления (коэффициент размножения электронов) достигает 106—107. Однако, их временная разрешающая способность не особенно велика; в лучших, специально сконструированных ФЭУ полуширина аппаратной функции превышает несколько десятков наносекунд. При регистрации интенсивных потоков излучения применяются открытые фотодиоды. Конструкция и схема включения одного из них приведены на рис. 10.6. Принцип действия такого устройства понятен из рисунка: фотокатод, находящийся под отрицательным потенциалом, освещается сквозь сетчатый, прозрачный для излучения анод; фотокатод соединяется с кабелем с помощью малоиндуктивного конденсатора. При конструировании фотодиодов с высоким временным разрешением особое внимание обращают Рис. 10.5. Открытый фотоэлектронный умножитель: 1—8 — ди- ноды; 9 — собирающий электрод на качество согласования собственно фотодиода с передающим его сигналы кабелем, т. е. на решение тех проблем, которые были подробно рассмотрены нами в гл. 3. При тщательном согласовании можно обеспечить временное разрешение на уровне 0,2—0,3 не. Калориметры, с точки зрения исследования быстропротекающих процессов, не обладают временным разрешением вовсе, но это, пожалуй, единственный прибор, обеспечивающий надежные абсолютные измерения в обсуждаемом спектральном интервале. Схема включения и конструкция термопарного калориметра, разработанного для измерений ВУФ и МР во Всероссийском НИИ физико-технических и радиотехнических измерений (ВНИИФТРИ), показана на рис. 10.7. Калориметр представляет собой залитую в компаунд и размещенную на алюминиевой платформе медь-константановую термобатарею с количеством термоспаев около 1000. Над «горячими» спаями батареи термопроводников находятся под-
10.2. Детекторы рентгеновского излучения 249 К регистратору Рис. 10.6. Конструкция и схема включения открытого фотодиода: / — сетчатый анод; 2 — фотокатод; 3 — малоиндуктивный конденсатор; 4 — согласующее сопротивление; 5 — коаксиальный кабель / 2 hv Горячие спаи Рис. 10.7. Схема включения и конструкция термопарного калориметра: 1 — приемный элемент/резистор замещения (20 мкм); 2 — диэлектрическая подложка (50 мкм); 3 — батарея термопар (1000 шт); 4 — разъем, 5 — корпус; 6 — рентгеновский фильтр; 7 — отвинчивающаяся диафрагма
250 —f\s- Глава 10. Рентгеновские измерения ложка из диэлектрика толщиной около 50 мкм и резистор замещения. Последний выполнен в виде змейки из манганиновой фольги толщиной 20 мкм и используется для абсолютной калибровки детектора. Калибровка осуществляется подачей на резистор замещения прямоугольного импульса тока известной длительности и амплитуды, чем определяется энергия, выделяющаяся в резисторе. Коэффициент покрытия площади входного торца змейкой составляет ~ 60%, соответственно ~ 60% процентов излучения поглощается в поверхностном слое резистора, остальное — в поверхностном слое диэлектрической подложки. Энергия, поглощенная калориметром, определяется по амплитуде выходного импульса, длительность фронта, нарастания которого примерно соответствует времени выравнивания температур и составляет 25-30 мс. Чувствительность описанного калориметров лежит в диапазоне 80-120 мВ/Дж. Ионизационные камеры, пропорциональные счетчики и счетчики Гейгера занимают особую нишу среди детекторов ВУФ- и МР-излучения. Их многогранность определена физическими процессами при, так называемом, «несамостоятельном разряде» в газах. Рассмотрим эти физические процессы, предварительно познакомившись с опытами Паше- на, изучавшего электрический пробой газовых промежутков при различных давлениях. Пашен обнаружил, что напряжение пробоя газовых промежутков зависит от произведения давления газа на расстояние между электродами6) и описывается уравнением a(pd) 0 где U — напряжение пробоя в вольтах, р — давление, d — расстояние между плоскими электродами, а а и b — постоянные, зависящие от состава газа. Для воздуха, если р выражено в атмосферах, a d в сантиметрах, а и Ь, соответственно, равны 43,6-104 и 8,195. Продифференцировав выражение (10.1) по (pd) нетрудно найти, что минимальному значению пробивного напряжения соответствует произведение pd = el~b. (10.2) Так, для воздуха минимальное напряжение пробоя реализуется при значении (pd) = 7,5 • 10~4 атм • см и равно ~ 330 В. Другими словами это значит, что при атмосферном давлении всего 330 В необходимо для пробоя воздушного промежутка в 7,5 мкм или, например, промежутка в 0,75 см при давлении 10~3 атм. Зависимость U(pd) (10.1), называемая кривой Пашена, приведена на рис. 10.8. (Там же показана схема его опытов.) 6) Не от р и d по отдельности, а именно от произведения pd.
10.2. Детекторы рентгеновского излучения 251 1104 8-Ю3 6-Ю3 4-Ю3 2-Ю3 U(pd) МО4 8-103 6 103 4 10- \ — 2,92- КГ4 3,04- КГ4 1-КГ1 Рис. 10.8. Кривая Пашена для воздуха (U выражено в вольтах, pd — в Торрсм) Сделаем несколько замечаний. Во-первых, пробой газовых промежутков это случайный процесс, зависящий от механизма развития электронных лавин. Поэтому рассчитанное по формуле Пашена напряжение пробоя можно рассматривать лишь как оценку математического ожидания, но не более того — газовый промежуток может пробиться и при несколько меньшем напряжении, а может не пробиться и при напряжении несколько большем. В этом смысле (pd) = 7,5 • 10~4 атм • см и (pd) = 1 мм Hg • 1 см7) (1 Торр • 1 см) практически характеризуют одну и ту же ситуацию, однако последнее не требует усилий при запоминании. Во-вторых, формула Пашена, и это известно, предсказывает несуразно большие значения пробоя в воздухе при (pd) < 2,75 • 10~4 атм • см, т.е. тогда, когда знаменатель соотношения (10.1) близок к 0. Это и есть причина, по которой ограничена применимость формулы Пашена. И, наконец, третье. В области переменных, лежащих ниже кривой Пашена, электрический пробой невозможен. В этой области параметров ток в газе 7) Напряжение пробоя, рассчитанное по формуле Пашена при (pd) = 1 мм Hg • см равно ~ 370 В.
252 Глава 10. Рентгеновские измерения может протекать лишь при искусственном создании носителей, т. е. при ионизации газа от постороннего источника8*. Как видно из рис. 10.8, напряжения пробоя увеличиваются справа и слева от минимума. Причину понять не трудно. Электрический пробой — это результат формирования электронных лавин, поэтому значение (pd), при котором напряжение пробоя минимально, соответствует наиболее благоприятным условиям их развития. На левой ветви кривой Пашена малое расстояние между электродами или малая плотность газа не могут обеспечить условия, необходимые для пробоя — число столкновений, приводящих к ионизации ускоренных в электрическом поле электронов с атомами или молекулами газа недостаточны для того, чтобы формируемая лавина переросла в пробой газового промежутка. На правой ветви кривой Пашена наоборот — число столкновений избыточно и ускоряемые электроны от столкновения до столкновения не успевают набрать энергию, достаточную для ионизации. В ионизационных камерах используются три режима: режим, в котором электронные лавины практически не развиваются; режим, в котором электронные лавины развиваются, но их развитие еще не приводят к пробою; и режим, в котором газовый промежуток пробивается. Окно для впуска излучения hv -0-р] U-\- 0 I ! i II IV U Рис. 10.9. Ионизационная камера На рис. 10.9 приведено схематическое изображение ионизационной камеры9). Это газонаполненный прибор с двумя электродами и окном для впуска ионизирующего излучения. В нижней части рисунка показана его вольтамперная характеристика (зависимость тока, протекающего 8) Ток в газе, обусловленный сторонним источником ионизации носит название «несамостоятельного разряда». 9) Реальные используемые в эксперименте ионизационные камеры устроены сложнее, но для понимания сути основных происходящих в них физических процессов достаточно предлагаемой упрощенной схемы.
\ 10.2. Детекторы рентгеновского излучения —>\у- 253 между электродами при строго фиксированной интенсивности ионизирующего излучения, от величины напряжения, приложенного к электродам). Как видно из рисунка, зависимость I(U) имеет четыре характерных участка. Практически линейное увеличение тока на первом участке вольтамперной кривой обусловлено улучшением сбора зарядов, рождаемых в межэлектродном промежутке. При малых напряжениях часть зарядов гибнет на стенках, не достигая электродов из-за незначительного отношения продольной скорости ускоряемых частиц к их трансверсаль- ной скорости, часть зарядов гибнет из-за рекомбинации, поскольку при малых напряжениях время сбора зарядов достаточно велико. На втором участке вольтамперной кривой (зона насыщения) все рожденные заряды достигают электроды, поэтому, измеряя ток, в принципе, можно вычислить интенсивность ионизирующего излучения. Именно такой режим работы называется режимом ионизационной камеры. Заметим также, что в этом режиме измеряемый ток, практически, не зависит от стабильности напряжения питания. Ионизационную камеру можно, в принципе, использовать и для счета отдельных частиц. Беда здесь одна — ничтожная амплитуда выходных импульсов (~ 5—10 мкВ), что требует применения усилителей с большим коэффициентом усиления. Эта трудность частично преодолевается в третьей зоне, где напряжение достаточно для формирования и развития электронных лавин, но недостаточно для пробоя. Приборы, работающие в этом участке вольтамперной характеристики, носят название пропорциональных счетчиков. Так называемый «коэффициент газового усиления», т.е. коэффициент размножения электронов в лавинах, в таком режиме может превосходить 104. На практике, по ряду причин, обычно ограничиваются величиной 5 • 102—5 • 103. Мы не станем останавливаться на этих причинах, отослав интересующихся тонкостями физических процессов несамостоятельного разряда и инженерными ухищрениями, позволяющими обеспечить строгую пропорциональность амплитуды регистрируемых импульсов первичному числу одновременно ионизованных частиц, к работе [2]. Для нас важно другое — подбором соответствующей газовой смеси такую пропорциональность можно обеспечить. Однако, число одновременно рожденных первичных электронов пропорционально энергии ионизующего фотона. Поэтому амплитуды выходных импульсов оказываются пропорциональны энергии фотонов, ответственных за ионизацию. В силу этого пропорциональный счетчик выполняет роль не только детектора, но и спектрографа, т. е. прибора, измеряющего при детектировании спектральный состав рентгеновского излучения. Понятно, что спектрограмму при обработке экспериментальных данных в этом случае получают с помощью многоканального амплитудного анализатора.
254 —fly- Глава 10. Рентгеновские измерения Одна из инженерных задач при создании пропорциональных счетчиков состоит в разработке конструкции, обеспечивающей стабильность при больших коэффициентах газового усиления, т. е. обеспечивающей устойчивость той тонкой грани, которая отделяет условия получения больших коэффициентах усиления от условий пробоя. Заметим, что эта задача осложняется еще и тем, что мы не вольны произвольно выбирать давление газа и размеры газовых счетчиков — размеры и давление газа должны обеспечивать полное поглощение энергии самого энергичного из регистрируемых фотонов. В значительной мере эта трудность преодолевается в цилиндрических газовых счетчиках, в которых катод представляет собой внутреннюю поверхность цилиндра, а анод — тонкую проводящую нить, монтируемую на изоляторах вдоль его оси. В таких приборах задача поглощения фотонов, тратящих свою энергию на ионизацию газа, и задача усиления первичных электронов разделены. Поскольку напряженность электрического поля в такой системе падает, как 1/г, лишь в узком слое вблизи анода создаются условия для лавин, т. е. для размножения первичных электронов. Остальная часть счетчика работает просто как ионизационная камера. Наконец, рассмотрим ту область вольтамперной характеристики, в которой любой затравочный фотон приводит к пробою газового промежутка. В сущности это газовый разрядник, инициируемый ионизирующим излучением. Известен, как счетчик Гейгера—Мюллера или гейгеровский счетчик. Основное достоинство — большая амплитуда импульсов, подлежащих счету. Основная проблема — ограничение скорости счета, определяемое временем восстановления электрической прочности межэлектродного промежутка. Добавление газовых добавок, способствующих деионизации газа, частично решает эту проблему, доводя скорость счета до ~ 106 импульсов в секунду, что, как понятно, определяет верхнюю границу измеряемой интенсивности. Особое место среди детекторов ВУФ и МР занимают полупроводниковые детекторы с р—п- и р—/—л-структурами. (С подобными структурами мы уже сталкивались при изучении ПЗС-камер.) Поскольку зона контакта двух полупроводников (р-п-псрсхоц) обладает односторонней проводимостью, при включении встречного напряжения — так, как это показано на рис. 10.10 — ток в электрической цепи отсутствует. При этом из-за приложенного напряжения в области /?-л-перехода создается тонкий обедненный носителями слой, в котором действует сильное электрическое поле. При облучении полупроводника квантами с энергией, большей ширины запрещенной зоны (A W = 1,12 эВ для Si и 0,67 эВ для Ge) в р—л-переходе и по обе стороны от него за счет фотоэффекта генерируются пары носителей заряда (электрон-дырочные пары), которые под действием электрического поля движутся к электродам, создавая этим
10.2. Детекторы рентгеновского излучения 255 К регистратору I - ток в цепи прибора. В достаточно широких пределах этот ток пропорционален интенсивности ионизирующего излучения и энергии поглощенных фотонов10), равно таким же образом, как это имеет место в газовых счетчиках. Фотодиод в этой электрической цепи играет роль переменного сопротивления, управляемого рентгеновским излучением. Заметим, что электрон-дырочные пары создаются во всем объеме полупроводника, а не только в р—л-переходе. Те из них, которые родились в прилегающих к р—«-переходу зонах на расстояниях, не превышающих диффузионной длины, диффундируют к переходу и, проходя сквозь него, также вносят свой вклад в общий ток. Рождение носителей в прилегающих к переходу слоях является паразитным эффектом, ухудшающим временные характеристики фотодиода, поскольку время диффузии носителей к переходу на порядки величин больше времени пролета носителей сквозь него. Само собой разумеется, что толщина />-я-перехода (зависящая от технологии изготовления и величины приложенного напряжения) выбирается такой, чтобы обеспечивать полное поглощение энергии самого энергичного из регистрируемых фотонов. Рис. 10.10. Схема включения полупроводникового детектора с р—«-переходом hv /-слой (зона дрейфа) Р+ -* Рис. 10.11. Полупроводниковые детекторы рентгеновского излучения В /ъ-/-л-фотодиодах для увеличения толщины обедненного слоя между р- и л-слоями помещен слой нелегированного полупроводника (/-слой), обладающего высоким сопротивлением (рис. 10.11, а). Его толщина несколько десятков микрон; слой л-Ь в р—i—л-фотодиодах наоборот делается тонким. Поэтому почти все кванты поглощаются в /-слое и носители ускоряются существующим там сильным полем. Это понижает инерционность и повышает частоту преобразования до нескольких гигагерц. 10) При комнатной температуре на рождение пары носителей в полупроводнике расходуется ~ 3—3,5 эВ.
256 —f\/- Глава 10. Рентгеновские измерения Повышение чувствительности достигается увеличением облучаемой поверхности; понижение емкости перехода — повышением напряжения смещения. Главное отличие лавинных фотодиодов (ЛФД) от р—/—и-фотодиодов заключается в лавинном размножении электронов внутри полупроводниковой структуры. Для этого у ЛФД добавляется /ьслой (рис. 10.11,6). При этом профиль распределения легирующих примесей выбирается так, чтобы наибольшее сопротивление, а следовательно, и наибольшую напряженность электрического поля имел этот /ьслой. При воздействии света в /-слое образуются электронно-дырочные пары, дрейфующие к соответствующим полюсам. Свободные электроны, попадая из /-слоя в /ьслой с высоким значением электрического поля, ускоряются там до энергий, достаточных для образования электронных лавин подобно тому, как это имеет место в пропорциональных газовых счетчиках. Этот процесс носит название лавинного усиления или умножения первичного фототока. Коэффициент умножения может достигать 103. ЛФД имеют высокое быстродействие (время нарастания импульсной характеристики может составлять ~ 0,1 не). 10.3. АППАРАТУРА И МЕТОДЫ ИЗМЕРЕНИЙ В РЕНТГЕНОВСКОМ ДИАПАЗОНЕ Как мы уже говорили, при измерениях в обсуждаемом диапазоне длин волн помимо технических неудобств, связанных с необходимостью использовать вакуумные приборы, существуют принципиальные ограничения. Прежде всего, это невозможность применять оптические инструменты, основанные на рефракции, и ограниченность углов, в которых возможно употреблять отражательную оптику. Дело в том, что отражение в области ВУФ и МР имеет место лишь в узком диапазоне углов полного внутреннего отражения, что возможно потому, что при столь коротких длинах волн, т. е. при столь высоких частотах электромагнитных волн, коэффициент преломления сред меньше единицы. Известно (см., например, монографию [1]), что максимальный, отсчитываемый от отражающей поверхности угол 0С ~ A\/Z, где А — длина волны падающего излучения, a Z — атомный номер материала, из которого сделана отражающая поверхность. Для оценок 0С весьма уместна следующая формула: вс = 10A\/Z, (10.3) где А выражена в микронах, а вс — в радианах. Безусловно, это не строгая формула, а всего лишь оценка, но нам, собственно, ничего другого и не нужно. Воспользуемся ей, чтобы понять каков масштаб бедствия. На
10.3. Аппаратура и методы измерений в рентгеновском диапазоне —'\/- 257 коротковолновой границе обсуждаемого нами диапазона (5 кэВ) максимально возможный угол полного внутреннего отражения не превосходит и одного углового градуса независимо от того используются ли зеркала из алюминия (Z = 13) или серебра (Z = 47) — как говорится: комментарии излишни. Однако, совсем не такая ситуация в приграничной зоне, прилегающей к условному разделу ВУФ и МР. Так, например, при энергии квантов 100 эВ, в зависимости от материала зеркал, 0С составляет несколько десятков угловых градусов. Даже при энергии квантов 250 эВ вс > 10°. Следовательно, в области ВУФ применима аппаратура, основанная на отражательной оптике. Таким образом, все спектрографы и монохроматоры с отражательной оптикой, подробно рассмотренные нами в гл. 6, могут быть использованы для регистрации ВУФ-излучения. Например, весьма популярен и достаточно широко применяется, несмотря на трудности с его юстировкой, спектрограф с вогнутой цилиндрической дифракционной решеткой (см. гл. 6). В области МР, как ясно из вышеизложенного, дифракционные решетки, как правило, применяться не могут. (Исключение составляют вскользь упомянутые в гл. 6, но редко употребляемые, прозрачные дифракционные решетки работающие «на просвет».) В этой области спектра вместо дифракционных решеток используются кристаллы. Спектрографам и монохроматорам, использующим кристаллы в качестве диспергирующих элементов, присущ ряд особенностей. Прежде всего, это касается условий «отражения» диспергируемого излучения. Дело в том, что, если угол падения анали- ф зирующего излучения на дифракционные решетки может быть любым, то отражение от кристалла возможно лишь при падении на него излучения под углом Вульфа-Брегга. Это ограничение с одной стороны затрудняет конструирование спектрографов и монохроматоров с кри- риС, ю.12. Ход лучей в обзорном сталлами, но с другой открывает не- спектрографе с выгнутым кристаллом которые новые возможности, в частности, когда анализируются спектры точечных источников излучения П). Так на рис. 10.12 показан ход лучей в обзорном спектрографе с выгнутым кристаллом. Как видно из рисунка, излучение точечного источника расходится в широком угле, и поэтому разные лучи падают на цилиндрическую поверхность кристалла под разными углами. При этом П) Например, мишеней лазерного термоядерного синтеза (ЛТС).
258 \ Глава 10. Рентгеновские измерения Изогнутые плоскости кристалла отражение от кристалла возможно лишь в тех его участках, для которых выполняется условие Вульфа—Брегга — чем короче длина волны, тем меньшим должен быть угол падения на поверхность кристалла. Поскольку зоны, в которых возможно отражение, весьма узкие разрешение подобных спектрографов (А/АА) может достигать 103. Однако, по той же причине светосила таких спектрографов, как видно из рисунка, удручающе мала. Тем не менее они часто применяется — особенно в начальной стадии исследования — из-за широкой области дисперсии Атах - Ащ^. Для того чтобы хорошо собрать анализируемое излучение применяются фокусирующие спектрографы с вогнутыми кристаллами, которые были подробно рассмотрены нами в §6.1. Эти спектрографы обладают на порядки большей светосилой, но, к сожалению, достаточно малой областью дисперсии. Заметим, что фокусирующие свойства дифракционных решеток обеспечиваются просто за счет их формирования на цилиндрической поверхности. С кристаллами все сложнее — кристаллические плоскости должны быть деформированы так, чтобы они приняли цилиндрическую (или сферическую) форму. Это достигается путем изгиба тонких кристаллов (дня обеспечения высокого спектрального разрешения толщина кристалла должна быть всего лишь больше пары сотен межплоскостных расстояний). Для этого кри- ^* сталлы под приложенным давле- ^ нием изгибаются и приклеивают- "^ ся к ложементу, имеющему требуемую форму (рис. 10.13). Рис. 10.13. Вид изогнутых кристаллических плоскостей 50-100 мкм 5 см Рис. 10.14. Многопластинчатый коллиматор Соллера Для освещения плоских дифракционных решеток от протяженных источников МР-излу- чения12) используется многопластинчатый коллиматор Соллера. Его устройство понятно из рис. 10.14. Расходимость излучения после коллиматора определяется из геометрических соображений. 12) Например, плазмы, удерживаемой магнитным полем.
10.3. Аппаратура и методы измерений в рентгеновском диапазоне 259 R н 0,5- » = 10" Р/6= 10 ~2 Во всех тех случаях, когда нет требований к высокому спектральному разрешению, широко используются фильтры, основанные на отражении или поглощении рентгеновского излучения, Так называемые отражательные фильтры применяются чтобы «обрезать» коротковолновую часть излучения. На рис. 10.15 показаны зависимости коэффициента отражения R от максимального угла полного внутреннего отражения 0С, рассчитанные для разных значений инкремента затухания. (Отношение /5/6, приведенное на рисунке, это отношение второго и третьего членов уравнения дисперсии, записанной в форме п(а)) = 1 — б + //8.) Как видно из рисунка, даже при значительном затухании коротковолновый край фильтра достаточно резкий и не превосходит половины угла 0С, который, как мы выяснили выше, в области МР по абсолютной величине составляет несколько угловых градусов. В поглощающих фильтрах ис- R пользуются окна прозрачности расположенные в районах K,L,M... q 5 скачков поглощения. В качестве примера на рис. 10.16 приведена кривая коэффициента поглощения меди. (В этой кривой размерность коэффициента поглощения \i — см"1, так что интенсивность прошедше- х 0,5 1 1,5 2,5 0/0с 0 0 Рис. 10.15. Зависимости коэффициента отражения R от максимального угла полного внутреннего отражения 0С го сквозь фильтр излучения / = /оехр{—/ш/}, где /о — интенсивность излучения до фильтра, a d — толщина фильтра в см.) Проиллюстрируем ситуацию, возникающую, например, в районе А'-скачка (Я = 0,1381 нм). Как видно из рисунка, значения ц до ^Г-скачка и после него отличаются почти на порядок величины, так что ц\ — Ц2 = 2,46 • 103. Это значит, что прозрачности медной фольги с толщиной 10 мкм до и после /(Г-скачка отличаются примерно в 12 раз, а фольги с толщиной 20 мкм — уже в 140 раз. Такая экспоненциальная зависимость пропускания фольг широко используется при определении температуры плазмы так называемым методом фильтров. Как известно, при максвелловском распределении электронов в плазме спектральный состав тормозного излучения характеризуется плотностью распределения вероятностей dv Vf ехр Г Avl или —- dJ_ d\ he Л (Ю.4)
260 Глава 10. Рентгеновские измерения f exp{"§ (Заметим, кстати, что график в логарифмическом масштабе первого из этих двух соотношений прямая, наклон которой тем больше, чем больше Т9 а максимум второй кривой имеет место при /rvmax = 2kT.) Из изложенного выше понятно, что суммарная интенсивность тормозного излучения плазмы за фильтром, характеризуемым коэффициентом поглощения n(hv) и с толщиной d где коэффициент А определяется выбранной системой единиц. Отсюда ясно, что в принципе достаточно зарегистрировать всего два значения Iz за фильтрами разных толщин или из разных материалов, чтобы из их отношения определить температуру, не прибегая к абсолютным измерениям. На практике в любом эксперименте, как правило, одновременно измеряют Iz за фильтрами и разных толщин и из разных материалов. Материалы фильтров и их толщины подбирают на основе прогнозируемой температуры, с тем, чтобы сигналы установленных за фильтрами датчиков были бы достаточной величины. ц, см -1 106 105 104 103 102 т У- - L-скач 1И2*= ок 10 100 А, А Рис. 10.16. Коэффициент поглощения меди Оптика рентгеновских изображений — это особая область, мало чем похожая на привычную нам со школьных лет оптику видимого диапазона. Лишь камеры-обскуры — древнейшие «объективы» — перекочевали в диапазон ВУФ и МР из видимого диапазона. Обскура это просто очень маленькое отверстие в непрозрачном материале. В англоязычной литературе камеры-обскуры называются pinhole camera (pinhole — отверстие, сделанное иголкой) — название, отражающее метод изготовления. Отверстия, обычно в фольге, так и изготовляются — фольга располагается
10.3. Аппаратура и методы измерений в рентгеновском диапазоне 261 на мягком материале (свинце или отожженной меди) и с помощью винта с микрометрической подачей прокалывается отверстие очень острой иголкой с заданным углом в вершине конуса иглы. Кстати, каждый может убедиться сам, что такой простейший «объектив» способен построить изображение очень не плохого качества. Для этого лишь нужно закрыть настольную лампу непрозрачным (лучше черным) листом бумаги с дырочкой, проколотой иглой, и на белом листе бумаги, расположенном ниже первого, увидеть изображение волоска лампочки. Ход лучей в камере-обскуре показан на рис. 10.17. Как видно из рисунка, две светящиеся точки, расположенные в плоскости предметов на расстоянии а от камеры-обскуры и на расстоянии х друг от друга, отобразятся в плоскости изображений (на расстоянии Ь от камеры-обскуры) в виде двух неперекрывающихся световых пятен, с расстоянием X между их центрами. Просто из геометрии несложно найти, что, характеризующее пространственное разрешение величина х = d(a Л- b)/b. Поскольку, как правило, b > а в первом приближении можно считать, что х « d, т.е. разрешение примерно равно диаметру отверстия обскуры d. Поэтому, казалось бы, сделай диаметр отверстия обскуры равной 1 мкм и разрешение мы получим также примерно равным 1 мкм. К сожалению, это далеко не всегда так, или скажем жестче, как правило, не так. (Это было бы так, лишь при угле х/а = X/b ^> X/dn\) Чтобы понять, что не так, найдем аппаратную функцию камеры-обскуры. Вид А •{■ а \л^-— Ъ Рис. 10.17. Ход лучей в камере-обскуре (геометрическое приближение) Рецепт известен: подадим на вход прибора сигнал, имеющий вид 6- функции (светящееся точка в предметной плоскости — см. рис. 10.18) и найдем распределение освещенности в плоскости изображения, т. е. аппаратную функцию. В геометрическом приближении (х/а = X/b ^> X/d) 13) Из-за малости углов здесь и далее принято sin <p « tg (р « (р.
262 Глава 10. Рентгеновские измерения в плоскости изображений мы получим равномерно засвеченный круг с диаметром Dg = 2(а + Ь)у, где у = d/2a, так что 2у — угловое разрешение, а Дх = lay — пространственное разрешение в предметной плоскости. В дифракционном приближении распределение интенсивности в плоскости изображений g(r) определяется дифракцией на отверстии камеры обскуры. Поскольку а^> d (больше, чем в 104 раз!), фронт волны в районе отверстия камеры обскуры может рассматриваться, как плоский. В этой ситуации, т. е. при дифракции плоской волны на круглом отверстии, распределение освещенности в плоскости изображений будет описываться бесселевой функцией первого рода, первого порядка: 2M<pd/\) <pd/X (10.6) где /о и А — интенсивность и длина волны падающего излучения, d и Ь, как и раньше, — диаметр отверстия обскуры и расстояние от камеры-обскуры до плоскости изображений и <р = rjb. Так что аппаратная функция g(r) 2Jx(rd/bX) rd/ЬХ направление на первый дифракционный минимум, определяющий по предложению Рэлея угловое разрешение, (ро = 1,22А/*/, диаметр центрального светового пятна в плоскости изображений D = 2Ь<ро, а пространственное разрешение в предметной плоскости Дл: = ащ = 1,22дА/</. D = 2,44А/<й> Рис. 10.18. Ход лучей в камере обскуре при геометрическом и дифракционном рассмотрениях Обратим внимание: если в геометрическом приближении разрешение определяется по расстоянию между двумя светящимися точками, изображения которых не перекрываются, то при дифракционном рассмотрении изображения двух точек, считающихся «разрешенными», частично перекрываются (условие разрешения по Рэлею — максимум распреде-
10.3. Аппаратура и методы измерений в рентгеновском диапазоне —'\^ 263 ления интенсивности, обусловленный свечением одной точки, должен совпадать с первым минимумом распределения интенсивности другой). Конечно это условность, пригодная лишь при оценках. Но сейчас мы этим и занимаемся. При обработке результатов измерения, т. е. при решении обратных задач, нам, конечно, потребуется не число, условно характеризующее разрешение, а функция, именно функция g(r). Для того, чтобы продемонстрировать масштаб бедствия, обратимся к численным оценкам. Пусть, как и раньше, d = 1 мкм, а = 2 см, Ь = 10 см и А = 10 нм (123,4 эВ). Тогда пространственное разрешение окажется равным ~ 240 мкм, а вовсе не ~ 1 мкм, как мы получили при геометрическом приближении. Причем дальнейшее уменьшение диаметра отверстия камеры обскуры, как понятно, приведет не улучшению, а к ухудшению пространственного разрешения. Правда, при регистрации излучения с энергией квантов в 1 кэВ разрешение окажется равным ~ 30 мкм, но это опять же не 1 мкм. Бессмысленно и не безвредно делать отверстие камеры обскуры в 1 мкм при разрешении 30 мкм. Дело в том, что источник, излучающий в угол 4л, освещает сферу с поверхностью Ana2. При площади отверстия обскуры nd2/4 утилизируется лишь одна nd2/4 : Ana2 часть полной энергии излучения. Другими словами, светосила нашего устройства (d/4a)2 и она пропорциональна d2. Оптимальный размер отверстия, при котором дифракция играет еще не столь существенную роль, найдем приравняв у=d/2a и, <р0 = 1,22X/d, откуда получим dopt = \/2,44дА. При регистрации излучения с энергией квантов в 1 кэВ (А = 1,324 нм) оптимальный размер dopt = 7,76 мкм. При таком отверстии разрешение в предметной плоскости составит ~ 4 мкм, а светосила будет равна ~ Ю~8. Что можно сделать, чтобы увеличить светосилу? Кардинальное решение — приблизить камеру-обскуру к объекту съемки. Так уменьшив это расстояние до 0,5 см, что, к сожалению, не всегда возможно по условиям эксперимента, можно увеличить светосилу до 1,5 • 10~7, а заодно и в два раза улучшить пространственное разрешение. Именно ничтожная светосила и недостаточное для целого ряда задач разрешение заставили искать другие средства построения изображений в области ВУФ и МР. Первое, что пытались — и иногда не безуспешно — это применять «объективы» на основе зонных пластинок. Зонная пластинка, как это видно на рис. 10.19, состоит из чередующихся прозрачных и непрозрачных кольцевых зон, радиусы которых совпадают с радиусами зон Френеля: rn = \Jn\f+^. (10.7) Здесь п — номер зоны Френеля, А — длина волны излучения и / — фокусное расстояние — точка на оси системы, куда собирается фокуси-
264 Глава 10. Рентгеновские измерения руемое излучение при освещении зонной пластинки волной с плоским волновым фронтом. Фокусирующие свойства зонной пластинки можно объяснить двояко. Во-первых, расстояния от соответствующей прозрачной зоны до фокуса (/„ = >/г2 -Ь/2) таковы, что в точку фокуса излучение от всех зон приходит синфазно. Во-вторых, углы дифракции А/Дгя в каждой прозрачной кольцевой зоне с шириной Дг„ = гп — гп-\ растут с радиусом, так что все дифрагированные лучи собираются в точке фокуса. О фокусирующих свойствах зонных пластинок было хорошо известно еще в позапрошлом веке. Равно как и о применимости формулы геометрической оптики, касающейся сопряженных плоскостей ! / ! Ь9 (10.8) Рис. 10.19. Зонная пластинка где / — фокусное расстояние, а а и b — расстояние от зонной пластинки до предметной плоскости и плоскости изображений соответственно. Разница заключается лишь в том, что зонная пластинка имеет несколько фокусов и является одновременно и положительной и отрицательной линзой, в соответствии с дифракцией на прямоугольном профиле пропускания прозрачных колец в +1, —1, +3, —3, +5 и последующие нечетные порядки дифракции. Забавно, что все параметры конкретной зонной пластинки однозначно определяются полным числом зон N и шириной внешней кольцевой зоны Дг=гдг — Глг_1. Действительно: диаметр зонной пластинки D=4Nkr, фокусное расстояние / = 47У(Дг)2/А, так называемая числовая апертура NA = А/2Дг, спектральная ширина ДЛ = A/N, интенсивность излучения в фокусе / = IoN2/n2 (как это следует из § 5.3 при прямоугольной форме штриха интенсивность излучения дифрагированного в каждый из двух первых порядков дифракции /+i = /_i = /о/я2) и наконец, пространственное разрешение в предметной плоскости 0,61 (Ю.9) Это значит — хотите иметь высокое пространственное разрешение — уменьшайте, сколь это возможно ширину внешней зоны Д/\ Уникальные в этом отношении зонные пластинки была сконструирована и изготов-
10.3. Аппаратура и методы измерений в рентгеновском диапазоне \ 265 лена содружеством Ливерморской Национальной Лаборатории им. Ло- уренса (LLNL) и Массачусетского Технологического Института (MIT). Параметры одной из них приведены в табл. 10.1, а внешний вид ее центральной части показан на рис. 10.20. Таблица 10.1 Дг 0,32 мкм N 500 D 0,64 мм Ах ~ 0,4 мкм ДА 2•10"3A а Разрешение ~ 0,4 мкм было получено экспериментально в областях спектра от 100 эВ до 6 кэВ при съемке в свете отдельных спектральных линий, т.е. при очень малой ширине полосы регистрируемого излучения. Расстояние от объекта съемки до зонной пластинки д«1м. Казалось бы, все в порядке — по меньшей мере, разрешение на порядок величины лучше, чем у камеры обскуры, хотя из-за большой величины а светосила прибора остается ничтожной (2,6 • 10~8). Но не это главная беда. Этот «объектив» обладает чудовищными хроматическими аберрациями и поэтому совершенно не пригоден для фотографирования объектов, спектр излучения которых достаточно широк, как, например, это имеет место при исследованиях по программе лазерного термоядерного синтеза. Рис. 10.20. Центральная часть зонной пластинки, изготовленной в Ливерморской Национальной Лаборатории им. Лоуренса (LLNL) Следующим шагом в оптике рентгеновских изображений стало создание «метода кодирующих апертур». Здесь зонные пластинки используются как транспаранты для создания искусственных голограмм. Суть метода пояснена на рис. 10.21, где, в качестве примера, показаны три точечных источника по-разному расположенных в предметном простран-
266 Глава 10. Рентгеновские измерения стве. Поскольку излучение объектов съемки лежит в областях спектра, где Дг = Д/min ^> Л на фотопленке после ее проявления будут получены четкие теневые фотоизображения зонной пластинки. Как это видно на рисунке, их расположение в плоскости фотопленки и размеры теневых изображений зонной пластинки будет зависеть от координат х, у и z источников излучения в предметной области. При восстановлении такой искусственной голограммы осуществляется трехмерная реконструкция этих источников излучения. При восстановлении голограмма освещается излучением с плоским волновым фронтом и длиной волны А > Armax, где A/max — максимальная ширина прозрачной зоны самой большой из зарегистрированных на фотопленке теневых изображений зонной пластинки. Заметим, что требования к зонным пластинкам, используемым в методе кодирующих апертур не столь строги (это ведь всего лишь транспарант!) по сравнению с требованиями к зонным пластинкам, применяемым в качестве линз. Так ширина внешней зоны большинства из них 2,5—15 мкм, диаметр — 1—20 мм. Зонные пластинки располагаются на расстоянии 1—20 см от объекта съемки, так что их светосила весьма велика (~ 5 • 10~2). Метод широко используется. Зонная пластина Френеля Рис. 10.21. Схема метода кодирующих апертур
Литература 267 12,0 12,5 13,0 13,5 14,0 А, нм Рис. 10.22. Зависимость от длины волны коэффициента отражения зеркальной поверхности с многослойным покрытием Наконец, нельзя не упомянуть об объективах с отражательной оптикой, в которых используется полное внутреннее отражение от поверхностей второго порядка. Однако, непомерно высокие требования к качеству их изготовления, возможности работы лишь при малых углах падения и чрезвычайные трудности их юстировки не позволили этому классу приборов получить сколь либо широкое распространение. Исключение составляют зеркальные объективы с многослойными покрытиями с чередующимися четвертьволновыми слоями из материалов, имеющих разные коэффициенты преломления. У такого рода объективов нет ограничений, связанных с углами полного внутреннего отражения. Так на рис. 10.22 приведена зависимость от длины волны коэффициента отражения зеркальной поверхности при угле падения всего на 5° отличающегося от нормали к поверхности. Эта зеркальная поверхность образована 40 парами Mo/Si слоев с периодом равным 6,77 нм. Как видно из рисунка, максимум коэффициента отражения при длине волны 13,2 нм составляет 0,665. (Отражающее многослойное покрытие было изготовлено в Ливерморской Национальной Лаборатории и тестировано в Национальной Лаборатории им. Лоуренса в Беркли.) Единственное, к сожалению, принципиальное ограничение — это узкая спектральная область, в которой коэффициент отражения значителен. ЛИТЕРАТУРА 1. Attwood David. Soft X-Rays and Extreme Ultraviolet Radiation — Principles and Applications. — University of California, Berkeley: Cambridge University Press, 2007. - 504 p. 2. Калашникова В. И., Козодаев М. С. Детекторы элементарных частиц. — М.: Наука, 1966. - 407 с.
ГЛАВА 11 КОРПУСКУЛЯРНЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ Такие методы исследований обычно называют масс-спектро- скопией, поскольку именно масс-спектроскопия чаще всего используется в науке и технике, как один из самых надежных и действенных методов однозначного определения качественного и количественного состава различных веществ. Приборы, используемые здесь, называются масс- спектрографами, хотя, как мы увидим из дальнейшего изложения, они равным образом пригодны и для анализа энергетического распределения компонент исследуемого вещества. Корпускулярные методы шире собственно масс-спектроскопии, так как наряду с последней, включают в себя зондирование объекга исследования ионами или атомами. 11.1. ОСНОВНЫЕ ПРИНЦИПЫ Измерение распределений компонентов объекга исследования по массам и энергиям в обсуждаемом методе производится на основе анализа движения заряженных частиц в электрических и магнитных полях: где Е и Н — соответственно, напряженности электрического и магнитного полей, М и v — масса и скорость заряженной частицы, eZ — ее заряд, а с — скорость света. Соответственно анализаторы, т. е. устройства, изменяющие скорость движения заряженных частиц и этим позволяющие разделить их по массам М и энергиям W = Mv1/! — это устройства с известными нам электрическими или магнитными полями, или с их комбинацией. Сделаем два замечания. Первое — в наличии одно уравнение и три неизвестных — М, Z и v, так что, даже если известна, скажем, энергия анализируемых частиц, мы можем найти отношение Z/M, а не М и Z по отдельности. Правда, как правило, наличие априорной информации позволяет избежать эту трудность, но отличить, скажем, ион дейтерия D+ от иона молекулы водорода Н^ не удастся никак. Естественно, если мы имеем дело с монохроматическим потоком частиц (W = const) или потоком частиц с одинаковой массой — проблем
11.1. Основные принципы 269 становится меньше. Второе замечание касается нейтральных частиц — как тут быть? Единственный путь — ионизовать их. Для этих целей служат, так называемые, камеры перезарядки. Принципиальное устройство газовой камеры перезарядки показано на рис. 11.1. Как видно из рисунка, камера перезарядки содержит газовое сопло, формирующее ленточный поток газа, сепаратор, позволяющий отделить ионную компоненту от неперезаряженных частиц и устройство дифференциальной откачки, обеспечивающее необходимые вакуумные условия до и после газовой камеры. Эффективность таких устройств, определяется сечением перезарядки и в случае резонансной перезарядки, например при реакции Н2 + Н2 —> Н2 + Н^ + е, может превосходить газокинетическое сечение столкновений больше, чем на порядок величины. Тем не менее, при интенсивных потоках нейтральных частиц часто для перезарядки используют тонкую металлическую фольгу, что, конечно, существенно проще, хотя сечение перезарядки в этом случае весьма невелико. Н2 "I Г -fl 1H2;H| Откачка Откачка Рис. 11.1. Схема устройства камеры перезарядки Детекторы корпускулярного излучения, по существу, те же, что были нами подробно рассмотрены в предыдущей главе, так что нам остается лишь учесть разницу в воздействии на детекторы фотонов и ионов. Так если в мягкой рентгеновской области используются тонкие безжелатиновые фотослои, обеспечивающие поглощение мягких рентгеновских квантов во вей толще фотоэмульсии, а не только в ее поверхностном слое, то при регистрации ионов слой фотоэмульсии значительно толще даже фотослоев, используемых обычно в видимом диапазоне. Понятно, что лучшая эффективность достигается в тех случаях, когда толщина фотослоя соизмерима с длиной свободного пробега иона в фотоэмульсии. (В подобных методах регистрации интересны тонкие пленки из специально разработанного в Великобритании полимера, в которых каждый ион прошедший сквозь пленку оставляет незаплывающее отверстие, отчетливо видное под микроскопом.) Мало чем отличаются и детекторы, основанные на связке сцинтиллятор—фотоумножитель, разве только химическим составом сцинтиллятора. Что касается открытых фотоумножителей (ФЭУ) или микроканальных усилителей (МКУ), то здесь вооб-
270 —J\^ Глава 11. Корпускулярные методы исследования ще нет никакой разницы. Просто, например в ФЭУ, при регистрации мягкого рентгеновского излучения первичные электроны рождаются на первом диноде за счет фотоэффекта, а при регистрации корпускулярного изучения — за счет ионно-электронной конверсии. То же касается и газовых счетчиков, независимо от режима их работы, будь то режим пропорционального счета или режим счетчика Гейгера. Естественно, при этом входное окно должно быть прозрачно для корпускулярного изучения, а газовое наполнение оптимизировано по эффективности рождения первичных электронов. 11.2. АНАЛИЗАТОРЫ КОРПУСКУЛЯРНОГО ИЗЛУЧЕНИЯ, МАСС-СПЕКТРОМЕТРЫ Рассмотрим типичные, часто используемые схемы анализаторов корпускулярного излучения и схемы масс-спектрометров. Простейший из них это так называемый пролетный масс-спектрометр. Принципы его работы удобно проследить по рис. 11.2, на котором показан пролетный масс-спектрометр, разрабатываемый в 1960-х годах для экспресс-анализа минералов в полевых условиях. Этот масс-спектрометр работает следующим образом. Сфокусированный лазерный импульс сравнительно небольшой энергии и мощности (1—3 Дж в импульсе ~ 25 не) создает на поверхности исследуемого образца плазменный факел. (Лазер снабжен устройством прицеливания, позволяющим воздействовать на любой участок поверхности или на выбранные для анализа вкрапления исследуемого образца.) Спустя промежуток времени, необходимый для расширения плазменного сгустка до значений его плотности, обеспечивающих благоприятные условия для вытягивания ионов, на устройство экстракции ионов (диафрагма с диаметром отверстия меньше деба- евского радиуса) подается короткий отрицательный импульс с напряжением U = 10—30 кВ. (Момент генерации импульса фиксируется в начале временной шкалы осциллографа.) Сразу же за диафрагмой ускоренные ионы разных масс А/} и различных степеней ионизации Zk имеют одну и ту же энергию W = Mv1/! = eZU, но разные скорости v = (2eZ* U/Mi)1/2. Поэтому время их дрейфа на расстояние L от устройства экстракции до ион-электронного конвертора tt = L/v = L[Mi/(2eZkU)]l/2 также будет разным. Таким образом, каждая из групп ионов, характеризуемая конкретными значениями пары М( и Zk будет приходить на ион-электронный конвертор (часто просто на медную пластину) в разное время. Эмитированные электроны дополнительно ускоряются и направляются на сцинтиллятор, пристыкованный к ФЭУ. Сигналы последнего записываются на осциллографе, измеряющим время пролета и и амплитуду каждого импульса. Зная ti9 несложно, по приведенным выше формулам,
11.2. Анализаторы корпускулярного излучения, масс-спектрометры 271 найти отношение M\jZk для каждой группы ионов. Отношение амплитуд записанных импульсов с учетом конверсионной эффективности каждой группы ионов позволяет определить относительное содержание компонент исследуемого вещества. Ионно-элекгронный конвертор Рис. 11.2. Пролетный масс-спектрограф Оценим разрешающую способность такого прибора. Пусть коэффициент, характеризующий разрешающую способность км = Mj/Mi9 где Mt hMj — близкие по массам ионы одной степени ионизации и Л/, > Щ, так что км<1- Тогда промежуток времени между приходом на конвертор этих двух групп ионов Поскольку ионы экстрагируются из плазмы с температурой Т, пакет ионов во время пролета расплывается, так что его протяженность во времени оказывается существенно больше длительности вытягивающего электрического импульса. Введем по аналогии с предыдущим коэффициент расплывания кт =W^/WX<\, где Wo = 2eZU9 2lWx = 2eZU + kT. Тогда величина расплывания может быть оценена как (11.3) Понятно (см. график в левом нижнем углу рис. 11.2), что условия разрешения по массам запишутся как Д/д/ > Ыт или км < кт- Отсюда комбинируя
272 Глава 11. Корпускулярные методы исследования два предыдущих выражения (11.2) и (11.3) несложно найти как разрешение по массам зависит от величины экстрагирующего напряжения: UeZ> kMkT 1-км' (П.4) Заметим, что пролетные масс-спектрографы сыграли немаловажную роль при исследованиях ускорителей плазмы (плазменных инжекторов). С их помощью удалось установить состав примесей в ускоренной плазме, структуру ускоренных плазменных сгустков, получить сведения, которые способствовали идентификации механизмов ускорения. В этих исследованиях перед экстракцией ионов плотность ускоренной плазмы предварительно уменьшалась до приемлемого предела рядом последовательно стоящих апертурных диафрагм. Рис. Н.Э. Многоканальный 180-градусный магнитный анализатор Типичным представителем приборов с магнитным полем является так называемый многоканальный 180-градусный магнитный анализатор. Его принципиальная схема показана на рис. 11.3. Как видно из рисунка, входная щель прибора ориентирована вдоль оси Z, а набор детекторов (в данном случае это ПЗС-линейка) — вдоль оси X. Центр щели и центр светочувствительных элементов ПЗС-линейки совпадают с осью X. Магнитное поле перпендикулярно чертежу, т. е. направлено вдоль оси Z, так что траектории ионов за щелью это ларморовские окружности с радиусом г = v/со = vMc/eZH, где со — ларморовская частота, a v — скорость иона. (Поскольку ларморовская частота со = eZH/Mc, время полного оборота иона по ларморовской окружности t = 2nr/v = In/<о, откуда г = v/(o = vMc/eZH, a v = га) = reZH/Mc.) Для ионов, влетающих в щель прибора вдоль оси Y, диаметр ларморовской окружности — это
11.2. Анализаторы корпускулярного излучения, масс-спектрометры —'\у- 273 расстояние от входной щели до соответствующего пикселя ПЗС-линей- ки. Поэтому ионы одинаковой степени ионизации и с одинаковой массой, но имеющие разную скорость, т. е. ионы, обладающие разной энергией, будут попадать в разные участки ПЗС-линейки (рис. 11.3). Рассмотрим разрешающую способность такого прибора, используемого в качестве анализатора энергии ионов, т. е. в том случае, когда ионы имеют одну и ту же степень ионизации и одинаковую массу, но разные энергии. Покажем, что разрешающая способность определяется светосилой прибора, т. е. тем углом 2<р, в котором собираются анализируемые ионы. Действительно, всегда найдется ион с энергией Wi = Mv^/2 = r^(eZH)2/2Mc2, влетевший в щель под углом <р, который придет в ту же точку ПЗС-линейки, что и ион с энергией W\ — rfieZH^/lMc2, но влетевший в щель вдоль оси У. (Эта ситуация показана на рис. 11.3.) Величина А (рис. 11.3) с одной стороны может быть найдена из соотношения Д2 = /f — /f, но с другой стороны Д = г\<р, поскольку угол (р достаточно мал. Поэтому MV=[(eZH)2/(2Mc)](r$-rj) = r}(p2(eZH)2/(2Mc), а относительная ошибка в измерении энергии ионов ^W- (11-5) Повторив подобные рассуждения нетрудно показать, что для ионов одной степени ионизации и с одинаковой энергией (например, предварительно ускоренных до значений W = const) относительная ошибка в измерении их масс определяется также, как b^MjM = <p2. Поэтому, как и в предыдущем случае имеет место.альтернатива — светосила или разрешающая способность. Такого рода приборы называются также масс-спектрографами с магнитной фокусировкой. В известном смысле это так. Действительно, как это видно из рис. 11.4, ионы, имеющие одни и те же значения v, M и Z и влетевшие в щель масс-спектрографа под углами +(р и — <р окажутся сфокусированы в точке В. Однако ионы влетевший в щель вдоль оси У соберутся в точке С. Понятно, что все ионы, собранные внутри угла 2<р покроют пространство между точками В и С, равное S. Из рисунка видно, что 6 = АС - АВ = 2г(1 - cos<p) = 4rsin2(<p/2) = rip2, поскольку 1 — cos<p = 2sin2(<p/2). Отсюда можно оценить полуширину аппаратной функции: $ ^ 8/2 = г<р2/2. Многоканальные 180-градусные магнитные анализаторы простые, надежные и удобные в эксплуатации приборы. Они полезны, когда, по крайней мере одно (а лучше два!) из неизвестных W, M, Z фиксированы, поскольку уравнение, связывающее измеряемую величину г с тремя неизвестными всего лишь одно: г = 2WMc2/(eZH)2. В ситуациях же, например типичных для плазмы с ионами разных степеней ионизации, разных масс и разных энергий, если нет надежной априорной информа-
274 Глава 11. Корпускулярные методы исследования ции, — расшифровка масс-спектров, полученных с помощью магнитных анализаторов дело не просто крайне сложное, но, по существу, безнадежное. Рис. 11.4. Фокусировка в магнитном поле и разрешающая способность 180-градусных магнитных масс-анализаторов В значительной мере эти трудности минимизируются при использовании масс-спектрографа Томсона. Его схематическое устройство показано на рис. 11.5. Как видно из рисунка в анализаторе масс-спектрографа Томсона используются одновременно электрическое и магнитное поля, причем вектора Е и Н параллельны между собой и перпендикулярны оси Z. Таким образом, ионы, двигающиеся вдоль оси Z, отклоняются в двух взаимно перпендикулярных направлениях, обеспечивая двумерную регистрацию. Пренебрегая краевыми эффектами, которые малы, поскольку зазор в магнитопроводе мал по сравнению с его размером вдоль оси Z, нетрудно найти компоненты скорости vx и vy, на выходе из анализатора. Предварительно отметим, что ускорение ионов происходит лишь за время пролета анализатора, т. е. за промежуток времени д/ = S/vZ9 где S — размер анализатора вдоль оси Z. Поэтому, поскольку y=vy = eZE/M, vy = (eZE/M)M = (eZE/M)6/vz. Расстояние L от анализатора до экрана, где L^> 8, ионы преодолевают за время L/vz, смещаясь параллельно оси Y со скоростью vy. Поэтому ионы, летящие со скоростью vz, пересекут плоскость экрана в точке с координатой L eZEL8 У= — Vy = г-. (П.6) а ч, eZ / ггч eZvzH 6 Аналогично найдем координату х: х = vx = —(vzH)9 vx = ХЖл — и, наконец, Мсу Мс eZHL6 (11-7)
11.2. Анализаторы корпускулярного излучения, масс-спектрометры 275 Из равенств (11.6) и (11.7) соответственно найдем \% = eZELS/(yM) и v% = [eZHL8/(xMc)]2. Приравняв правые части этих равенств, получим У = Мс2Е eZH2L5 ■х2. (11.8) Таким образом, на экране отобразится ряд парабол, параметрами которых будут являться отношения M/Z. Фотометрируя вдоль парабол можно найти энергетическое распределение ионов с выбранным отношения M/Z. Рис. 11.5. Масс-спектрограф Томсона Дж. Дж. Томсон использовал в качестве детектора фотопластинки — просто в то время других двумерных регистраторов не было. В наше время в Ливерморской национальной лаборатории регистрировали томсо- новские параболы с помощью ПЗС-матриц. В Курчатовском институте была разработана методика регистрации томсоновских парабол во времени. Для этого в плоскости экрана помещалась мелкоструктурная сетка, играющая роль ион-электронного конвертора. Эмитированные электроны дополнительно ускорялись и возбуждали излучение короткоживуще- го люминофора, свечение которого регистрировалось электронно-оптической кадровой камерой.
276 —11- Глава 11. Корпускулярные методы исследования На рис. 11.6 показаны траектории ионов в электростатическом анализаторе. Последний представляет собой цилиндрический конденсатор, соответственно с радиальным электрическим полем. Как видно из рисунка, входная щель анализатора находится в точке с координатами г = го, ц> = 0, на равном удалении от пластин конденсатора. Для иона, движущегося внутри конденсатора вдоль окружности и влетевшего в щель по касательной к ней, радиальное равновесие обеспечивается равенством центробежной силы М\Р-/г и силы, действующий на ион со стороны электрического поля eZE. (Как известно, электрическое поле внутри конденсатора Е(г) = 1//г\п(г2/г\)9 где U —- разность потенциалов между его пластинами, a i\ и гг — их радиусы.) В общем случае движение ионов, в поле цилиндрического конденсатора, в том числе и ионов, влетевших в щель не перпендикулярно радиусу, описывается системой уравнений в полярных координатах [1]: г*ф = const; ?_r2 = _eZU_J_ (H-9) М r\n(ri/r\Y Решение этой системы уравнений обычно записывается как (11.10) где угол <р, который отсчитывается от щели, при этом г = го + и, причем и < г0, «о = «max = кц/уД, к — функция угла 7 (рис. 11.6). Рис. 11.6. Электростатический анализатор Как видно из соотношения (11.10), при ц> = п/у/2 и(ф) = 0 при любых значениях щ. Это значит, что независимо от угла входа в анализатор ионы соберутся (сфокусируются) в точке с координатами г = го, <р = п/у/2. Заметим также, что при <р = л/2\/2, т.е на биссектрисе уг-
11.3. Методы измерений —11/- 277 ла tp = я/л/2, также независимо от угла входа в анализатор, и = итах, а векторы скоростей всех ионов будут параллельны между собой и перпендикулярны радиусу. Это значит, что разрезав анализатор по биссектрисе угла (р = л/\/2, его можно использовать как коллиматор (рис. 11.6) для ввода в щель масс-спектрометра, например, 180-градусного магнитного масс-спектрометра, пучка ионов от протяженного источника. Проясним физические основы фокусирующих свойств цилиндрического конденсатора. Предварительно напомним, что ионы, двигающихся внутри конденсатора по круговой орбите с радиусом го имеют постоянную скорость vv, а их радиальное равновесие обусловлено равенством центробежной силы и силы, действующий на ионы со стороны электрического поля: Afv2//^ = eZE. Это равенство не сохраняется при движении ионов по другим траекториям. Так на пути от входной щели до биссектрисы ионы, двигающиеся по траектории, проходящей над центральной окружностью, смещаются по радиусу против поля, а значит их энергияХ) и, соответственно, скорость убывают. По той же причине скорость ионов, двигающиеся по траектории, проходящей под центральной окружностью, т. е. смещающихся по полю на пути от входной щели до биссектрисы — увеличивается. Таким образом создается ситуация, при которой в первом случае — Мм^/г < eZE, а во втором — Mv2 /r > eZE. Как результат в первом случае под действием результирующей силы ионы приобретают радиальное ускорение, направленное к центру окружности, а во втором — от центра. 11.3. МЕТОДЫ ИЗМЕРЕНИЙ Особенно широкое внедрение корпускулярных методов исследования в практику физического эксперимента имело место в связи с началом работ по управляемому термоядерному синтезу. Это было обусловлено тем, что корпускулярные методы исследования практически единственный метод анализа ионной компоненты плазмы. Различают пассивные, активные и, так называемые, комбинированные методы корпускулярных исследований. В первом случае анализируется поток частиц, вылетающих из плазмы, во втором — плазма «просвечивается» потоком частиц и на основании их ослабления или рассеяния плазмой делается вывод о параметрах ионной компоненты. В третьем случае просвечивающий плазму пучок частиц служит мишенью, на котором перезаряжаются ионы плазмы, а сведения о ее параметрах извлекаются из 1) Понятно, что энергия ионов на пути от входной щели до биссектрисы уменьшится на величину равную разности потенциалов поля в точках с координатами Г=П), (р = 0 И Г = ГЪ + «max, Ц> = п/2л/2.
278 —'ь- Глава 11. Корпускулярные методы исследования спектральных измерений. Следует заметить, что признанными во всем термоядерном сообществе пионерами в этой области являются российские исследователи. Анализаторы нейтральных атомов, используемых в пассивных методах, являются основным инструментом исследования поведения ионов водорода и его изотопов в установках с магнитным удержанием плазмы. Они позволяют определять энергетические спектры и проводить изотопный анализ потоков атомов, испускаемых плазмой, измерять абсолютную интенсивность потоков и регистрировать изменение этих параметров во времени. Несомненным лидером в развитии диагностики термоядерной плазмы на основе анализа вылетающих из плазмы потоков нейтральных атомов является Физико-технический институт им. А. Ф. Иоффе РАН (ФТИ РАН) [2]. Работы этого института на протяжении последних нескольких десятков лет велись по двум направлениям: создание и совершенствование анализаторов нейтральных атомов и исследование ионной компоненты плазмы с помощью анализаторов, разработанных в ФТИ, в различных установках, включая крупнейшие термоядерные установки (JET, TFTR, JT-60). Измерение функции распределения ионов плазмы пассивными методами основано на следующих физических явлениях. В любой сколь угодно горячей плазме всегда присутствуют нейтральные атомы, проникающие в плазму со стенок установки или рождающиеся в самой плазме за счет рекомбинации. Как правило, таких нейтральных атомов в горячей плазме ничтожно мало, но достаточно, чтобы обеспечить уверенную регистрацию, перезаряжаемых на них ионов плазмы. Горячие ионы плазмы, резонансно перезаряжаясь на таких нейтральных частицах, сохраняют свою энергию, что и является физической основой измерения функции распределения ионов по энергиям. Не удерживаемые больше магнитным полем, теперь уже атомы, покидают плазму и могут быть проанализированы с целью измерения функций распределения ионов, как по массам, так и по энергиям. Ясно, что предварительно эти нейтральные атомы должны подвергнуться перезарядке, или, как говорят, «обдирке», т.е. должны быть снова превращены в ионы, что реализуется при прохождении атомов через газовую мишень или тонкую (20—30 нм), чаще всего, углеродную пленку. (В ряде случаев с целью повышения эффективности регистрации это вторичные ионы доускоря- ются.) Как правило, используются магнитные анализаторы. Детекторами служат матрицы микроканальных электронных умножителей (иногда сопряженные с ПЗС-структурами). С помощью таких приборов удается перекрыть диапазон от 100—200 эВ до ~ 4 МэВ. Заметим, что имеют место две трудности при интерпретации подобных измерений. Во-первых, разная локальная концентрация нейтральных атомов приводит к иска-
11.3. Методы измерений —Ib- 279 жению функций распределения ионов, что должно учитываться при обработке результатов экспериментов. Во-вторых, как всегда в пассивных методах, получаемые результаты усреднены по направлению наблюдения, т. е. по линии сбора ионов. Источник атомов Плазма Рис. 11.7. Рассеяние атомного пучка на ионах плазмы Эта последняя неприятность отсутствует в активных методах, в частности, в методах рассеяния. Схема измерения ионной температуры плазмы методом рассеяния атомного пучка на ионах плазмы приведена на рис. 11.7. Для зондирования плазмы, как правило, используются пучки с энергией атомов Ев = 10-40 кэВ и током 0,3-2,0 А. Столь существенные токи необходимы, чтобы создать достаточную концентрацию атомов зондирующего пучка в плазме и тем самым обеспечить условия, позволяющие отличить атомы, рассеиваемые именно на пучке, от атомов, рассеиваемых в его отсутствие. Часто в тех же целях используется модуляция зондирующего пучка. Атомы, рассеянные в достаточно малый, ограниченный диафрагмами угол 0, собираются в анализатор. Область усреднения измеряемых параметров плазмы ограничена размерами зондирующего атомного пучка и углом сбора рассеянных атомов (рис. 11.7). При рассеянии атомов пучка на ионах плазмы измеряемый энергетический спектр рассеянных атомов пропорционален функции распределения ионов по энергии. Если угол 0 невелик, а энергия атомов зондирующего пучка Ев много больше температуры ионов плазмы 7], последняя может быть найдена по формуле \ Мг 1 161п2Л/, где М\ и М2 — массы атомов зондирующего пучка и ионов плазмы соответственно, а АЕ — полуширина энергетического распределения атомов, рассеянных в угол 0.
280 Глава 11. Корпускулярные методы исследования Схема другого метода рассеяния, рассеяния пучка тяжелых ионов в плазме, удерживаемой магнитным полем, показана на рис. 11.8. В этом методе рассеяния используются однократно ионизованные ионы тяжелых атомов (например, ионы талия) с энергией 100—200 кВ. Как видно из рисунка, пучок ионов, попадая в магнитное поле, направленное перпендикулярно чертежу, движется по ларморовской окружности с радиусом превышающим размер плазмы и на выходе из установки попадает в детектор первичных ионов. Ионы, подвергнувшиеся дополнительной ионизации и превратившиеся в дважды ионизованные ионы, изменяют свою траекторию, поскольку радиус ларморовской окружности теперь уже в два раза меньше, и в зависимости от точки внутри плазмы, в которой произошла ионизация, попадают в один из ряда анализаторов ионов по энергиям. Эти дважды ионизованные ионы содержат информацию о потенциале плазмы в точке ионизации. Действительно, если <Pout — потенциал электрического поля вне плазмы, т. е. потенциал, под которым находятся источник ионов и анализаторы, a q>m — потенциал электрического поля в точке ионизации, то приращение энергии ионов зондирующего пучка = eZ{(<p0Vit - (pin) - </>out) = - (pout), (11.12) поскольку Z2 - Z\ = 1. Понятно, что если <pout = 0, то bW = ец>т. Этот метод сопряжен с рядом технических сложностей, однако он один из немногих методов измерения электрических полей в плазме. Плазма Детектор первичных ионов Рис. 11.8. Просвечивание плазмы тяжелыми ионами Наконец, комбинированные методы активной корпускулярной диагностики, в которых корпускулярные пучки служат мишенями для перезарядки или создания электрических полей в плазме. В первом случае ионы плазмы, перезаряжаясь на зондирующем пучке атомов и превра-
Литература JL 281 щаясь в атомы, сохраняют свою кинетическую энергию, а их излучение в видимом диапазоне позволяет по доплеровскому уширению спектральных линий измерить локальную ионную температуру. Во втором случае в плазму, находящуюся в магнитном поле, инжектируется поток ионов и возникающие при этом электрические поля Е = j x H позволяют использовать Штарк-эффект в спектральных измерениях. В сущности, так называемые комбинированные методы корпускулярной диагностики это методы спектроскопии плазмы, самостоятельной и настолько сложной дисциплины [3, 4], что разумно их оставить вне рамок настоящего изложения. ЛИТЕРАТУРА 1. Арцимович Л.А., Лукьянов СЮ. Движение заряженных частиц в электрических и магнитных полях. — М.: Наука, 1972. — 224 с. 2. Кисляков А Я, Петров М. Я Анализаторы нейтральных атомов и их применение для диагностики горячей плазмы (Обзор по работам ФТИ им. А. Ф. Иоффе РАН) // Физика плазмы. — 2009. — Т. 35, №7. - С. 585-602. 3. Грим Г. Спектроскопия плазмы. — М.: Атомиздат, 1969. — 452 с. 4. Грим Г. Уширение спектральных линий в плазме. — М.: Мир, 1978. — 491 с.
ГЛАВА 12 МЕТОДЫ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ Как мы уже говорили экспериментальные данные, как правило, данные косвенные. При этом получаемые в эксперименте данные U связаны с функцией или функциями Z, описывающими объект исследования, уравнением AZ = U, где А — оператор, обусловленный используемым методом исследования. Известно (и мы это уже обсуждали), что существуют два подхода к решению этого уравнения: либо нужно найти обратный оператор А~х!) и тогда Z = A~l U, либо нужно искать Z минимизируя функционал \\AZ* — U\\9 где Z* — модель, другими словами приближенное описание Z. 12.1. МОДЕЛИ Итак, информация об объекте исследования Z содержится в совокупности выходных данных U и наша задача — по U найти Z, или точнее, найти приближенное описание Z, т.е. модель Z*. Нахождение модели включает в себя две задачи: выбор класса модели и отыскание индивидуальной модели в заданном классе. При этом, чаще всего, действуют двумя способами — либо используют основную схему регуляризации А. Н. Тихонова, либо задают решение в параметрическом виде, а параметры определяют из сопоставления найденной совокупности восстановленных значений Z^c с совокупностью U, например, методом наименьших квадратов. Класс моделей — это некое множество функций Zm, задаваемых числом параметров М. Если известно, что реализация U, например, освещенность на выходе нашей измерительно-регистрирующей системы fout(xt), содержит N отсчетов, с дисперсией каждого из них а2, то по значениям N, М и о1 можно найти критическое значение ошибки 6UCT(N,M,(T2). SUCT определяется либо на основе тех или иных критериев проверки статистических гипотез (критерий Фишера, критерий х2 и т- п-)> либо, 1) Типичный пример обратного оператора — решение уравнения Абеля (см. уравнения (2.66) и (2.67)).
12.1. Модели -J\- 283 исходя из количества информации, содержащейся в выходном сигнале о входном [1]. Модель распределения входной освещенности, т. е. восстановленное распределение Е^ (х) Е Zm называется сопоставимой с совокупностью U, в том случае если выполняется условие р(£аррг, Д>ш) < SEct9 где Елррг(х) = = / EKC(xf)g(x-xf) ^» а р(£аРрг, Еохй) — среднее уклонение, вычисленное по значениям £аррг(*/) и Eout(Xj). Некорректность задачи проявляется в том, что существуют модели, одинаково сопоставимые с U, но сколь угодно сильно отличающиеся друг от друга. В этом случае из сопоставимых моделей выбирается самая простая. Мерой сложности (или простоты) может служить, например, число параметров М. В этом случае регуляризация состоит в том, что из сопоставимых с U выбирается модель, задаваемая минимальным числом параметров Mmin. Если М < Мтт, класс Zm не содержит моделей, сопоставимых с U, т.е. модели класса Zm в этом случае являются слишком грубыми, упрощенными. При М = Л/min ошибка приближения примерно равна 6ЕСТ9 так что объем информации, содержащийся в выходном изображении о входном, еще может оправдать сложность модели. Заметим, что положение существенно меняется, когда известны априорные данные о Е(х, у) — тогда ответ сразу разыскивается в заданном классе функций. Проследим, как реализуется изложенный выше подход, если решение представляется рядом Фурье. (В этом случае М — просто число гармоник.) Найдя, пусть методом наименьших квадратов, коэффициенты ряда ап и Ь„, мы определим и 52^с и ошибку приближения М - Eout(Xi)\2\ . (12.1) Теперь возможны две ситуации: либо р > Ест, либо р < Есг. В первом случае в выбранном нами классе не содержится моделей, сопоставимых по точности с U. Во втором случае в данном классе имеются модели, сопоставимые по точности с U, однако, имея несколько решений подкласса сопоставимых моделей, мы не можем отдать предпочтение ни одному из них и, по существу, должны иметь дело со всей их совокупностью, если нет дополнительной информации, позволяющей выбрать из них единственное. Естественно, что сопоставимыми с U окажутся и все решения при М > Afmin; не исключено даже, что одно из них случайно окажется ближе к Ет(х), чем Ет(х), найденное при М = A/min. Однако выбрать из бесчисленного множества таких, сопоставимых с U решений, это одно «счастливое» принципиально невозможно. Дело в том, что в «подробностях» распределений Екс(х), полученных при М > Mmin, содержится больше информации, чем в Eout(x), по которому они восста-
-Л- 284 j\> Глава 12. Методы обработки экспериментальных данных новлены, — типичный случай превышения точности. Реально увеличить точность восстановления можно только, если совокупность U содержит число отсчетов N ^> М. В этом случае, как показано в ряде работ, ошибка восстановления может быть уменьшена в yjN/(2M) раз. Итак, мы рассмотрели процедуру оптимального выбора сопоставимой с совокупностью экспериментальных данных функции Екс(х) е Za основанного на использовании критерия проверки статистических гипотез 6ЕСТ. При информационном подходе в качестве критерия точности используется, полученная на основе теории информации, оценка ошибки SEmin, называемая оценкой ошибки снизу2). Это та минимальная ошибка, которая может быть достигнута в принципе. Как показывает практика реальная ошибка восстановления при оптимальном коэффициенте регуляризации всего на 5—15% больше, чем 6Е„йП. Понятно, что результаты восстановления, при которых ошибка реконструкции 6ЕКС < SEm[n, абсурдны — в восстановленном изображении не может содержаться больше информации, чем ее содержалось в изображении, на основе которого и получено восстановленное изображение. Если, полученная при некотором значении а, ошибка восстановления 6ЕКС ^> бЕщм, класс Za не содержит моделей, сопоставимых с экспериментальными данными, т.е. в этом случае, как мы уже говорили, модели класса Za являются слишком грубыми, упрощенными. Разумное значение ошибки восстановления лежит в пределах 5Дщп < 8Е^С < у6Ет[п, где у — коэффициент порядка единицы, скажем 1,1. Возможное в принципе равенство в левой части этой формулы реально не реализуемо, поскольку из-за неизбежной неточности вычислений также происходит потеря информации. 12.2. ВОССТАНОВЛЕНИЕ ИСХОДНЫХ СИГНАЛОВ Рассмотрим имеющиеся возможности восстановления исходных сигналов на примере восстановления изображений. В качестве критерия точности при сравнении различных процедур восстановления используем среднеквадратичное уклонение 6Е= \ \8Е\2, квадрат которого +Х/2 \* = ± f [Ein(x)-EKC(x)]2dx (12.2) -Х/2 по определению. Здесь, как и раньше, X — область существования функции Ет(х) и длина реализации E^ixt). Прежде всего оценим точность измерения распределения исходной освещенности в тех случаях, когда мы 2) См. гл. 2, соотношение (2.60).
12.2. Восстановление исходных сигналов -J \~ 285 не проводим какой-либо математической обработки, а просто, считывая выходное изображение, принимаем, что Е^с(х) = ЕоЫ(х) » Ет(х). Предварительно сделаем несколько замечаний. Если время экспонирования т задано и квантовая эффективность ц известна, удобнее оперировать или с экспозициями £(х) = Е(х)т, т.е., в случае одномерных изображений, с энергией, отнесенной к единице длины, или, например, с пространственными распределениями плотности эмитированных фотоэлектронов щп(х) = ii$m(x). Напомним, что последнее равенство выполняется только в среднем — здесь мы имеем дело со случайным процессом, в котором величина у,$т(х) играет роль математического ожидания. В частности, поэтому выходной сигнал помимо детерминированной компоненты £соп(*) = f-ж finOO^K* — *') <№ содержит шум N(x), в силу чего считанные в точках х,- значения выходного сигнала £ош(*/) = £соп(*/) + Щъ) не лягут на сплошную кривую £COn(*)5 a будут группироваться вокруг нее с некоторым разбросом. Далее, если зависимость некой физической величины, пусть Е(х) (или /(/)), есть вполне непрерывная функция,,ее значения в точке х определяются как предел отношения измеряемой величины Е(х)Ах к Д при А —> 0. Такая операция, в нашем случае, особенно при слабых световых потоках, как правило, невозможна. На самом деле, при уменьшении апертуры Дх считывающего устройства, начиная с некоторого его значения Ах < 1/л(х), мы будем регистрировать лишь наличие или отсутствие электрона (или зерна фотослоя) в данной точке изображения. Поэтому п(х) будет принимать только два значения п(х) = 0 и п(х) = 1/Дх; причем ясно, что ни одно из них не будет соответствовать действительности. Избежать подобную неприятность можно лишь ценой усреднения, выбирая апертуру считывающего устройства Дх > 1/й(х). Это, естественно, приведет к увеличению систематической ошибки, что может быть учтено введением суммарного коэффициента передачи К(а>) = К\(а))К2((о), где К\(о)) — коэффициент передачи измерительного устройства, а К2((о) — считывающего. Величину 8$ найдем из равенства Парсеваля: ! 1^М^(х)|2^|||^(у)^(у)|2^ (12.3) -Х/2 где «v) - фурье-образ £(х), a |£in(v)-£out(v)|2 = \^(v){l -K(v)} -N(v)\2. Из трех слагаемых правой части уравнения (12.3) (2/Х) /0Vc \N(v)\2dv = 2a\vc, если шум белый, а перекрестный член (2/Х) /0Vc £m(v){ I — ^(v)} N(v) dv = 0, так как математическое ожидание M(N) = (2/Х) /0Vc N(v) dv = N(v) = 0, вследствие чего и математическое ожидание М[&m(v){\ — K(v)}N(v)] =
286 —»\/> Глава 12. Методы обработки экспериментальных данных [{1 - K(v)}]M[N(v)] = О, поскольку $m(v){\ - K(v)} и N(v) статистически независимы. В результате = 2a\vc с | ] [£in(v) - ^(v)K(v)]2dv = 8^ + S^m. (12.4) Отсюда, во-первых, следует, что случайная и систематическая ошибки складываются как ортогональные векторы, и, во-вторых, что, если суммарная ошибка 8$ зависит от апертуры считывающего устройства Д, т. е. 8& = 5£(Д), то минимум функции 5£(Д) достигается при 2<7qVc « (2/X)x х /(Til"" K(v)]2&L(y) dy- Понятно, что если функцию 5£(Д) можно задать аналитически, условия минимума определяются точно. В частном случае применения электронно-оптической техники для регистрации слабых световых потоков это сделать несложно. Действительно, в среднем количество электронов, которое должно попасть в апертуру считывания Д, будет равно £^Д. (Здесь, как и раньше, $ — энергия, приходящаяся на единицу длины изображения.) При пуассонов- ском распределении эмитированных электронов, имеющем место в_ нашем случае, дисперсия равна математическому ожиданию, т. е. а2 = £/хД, а это значит, что среднеквадратичное уклонение а = v£//Д, отношение сигнал/шум S/N = ёрА/у/ЩгК = \/1|пд, a (S/N)2 = ^Д. С другой стороны, в силу условия Котельникова высокочастотная составляющая энергии шума обрезается апертурой считывания Д на частоте vc = 1/2Д и поэтому случайная ошибка 8$^ = (2/Х) /^ \N(f)\2dv = 2agvc = ag/Д и, следовательно, (S/N)2 = $/(8$) = ^Д/о*^ Сопоставляя, найдем, что 0-2 _ £/^ а 8$^ = 2a\vc = ^///Д. Со вторым слагаемым правой части уравнения (12.4) еще проще. На самом деле A^(v) = Ai(v) Ki(v), при этом K\(v) = exp{—nv/d) и от Д не зависит, a Ki(v) = 8ш(Д7Гу)/(Дяу), если мы считываем прямоугольной щелью. Так что (125) Впрочем, значение 8{%оп удобнее вычислять по другому. Поскольку частотный спектр сигнала ограничен, функцию £ш(лг), определенную на интервале X, можно разложить в ряд г, , ч __ До , V"* Г 2лпх , . 2лпх~\ m 2 im^\_п х п X У л=1
12.2. Восстановление исходных сигналов -J\j- 287 откуда несложно найти, что I Xvc (А) = т; У (<?„ + Ь2п)[\ - Kz(vn)]29 (12.6) где а„, Ъп — коэффициенты ряда Фурье. И, наконец, последнее замечание. Используя в качестве описания входного распределения $т(х) совокупность значений £ш(х/), мы вносим еще одну дополнительную погрешность. Действительно, в этом случае -Х1^ •> 1 ХР 1 L №nfo) ~ £out(*i)l Ф J J IfinW ~ £out(*)| <b (12.7) /=1 -X/2 просто потому, что хотим ли того или нет, мы, в сущности, вычисляем интеграл, стоящий в правой части по методу прямоугольников. Естественно, что эта дополнительная погрешность существенна лишь при относительно больших значениях Ах. Таким образом, мы рассмотрели погрешность измерения в общем случае и ошибку возникающую в тех случаях, когда входной сигнал представляется совокупностью дискретно считанных значений выходного сигнала, определив на какой сетке и при каких условиях ошибка представления fKc(x) =./out(x) ttfinix) минимальна. В условиях большой информационной избыточности (L > 1, a l/vc > j8) никакой другой обработки, как правило, и не требуется. К сожалению, такая ситуация нетипична для экспериментальной физики и это значит, что, если мы хотим уменьшить ошибку результата, необходимо решать обратную задачу восстановления исходных сигналов. Применение к восстановлению исходных сигналов метода регуляции А. Н. Тихонова можно пояснить следующим образом. Пусть имеется интегральное уравнение первого рода +оо (12.8) Тогда для любой правой части iw(x) вместо уравнения (12.8) решается вариационная задача минимизации функционала M=f[ f &KC(x')g(x-x')dx'-eoat(x)\ dx+a — OO (12.9) 3) Понятно, что в случае, когда информация об объекте исследования содержится во временной структуре сигнала, уравнение (12.8) запишется как
288 —fly- Глава 12. Методы обработки экспериментальных данных При этом функция £а(дс), реализующая этот минимум при соответствующем выборе коэффициента регуляризации а, явится приближенным решением уравнения (12.8). Первый интеграл соотношения (12.9) есть мера уклонения, а второй — мера гладкости решения. Чем он больше, тем возможны больше амплитуды и скорости изменения £гес(х). Заметим, что для уравнения типа свертки в фурье-пространстве может быть сконструирован и обратный оператор. В общем случае = Если аппаратная функция g(y) вещественная и четная, то К(а)) = К*(а)) и равенство (11.10) может быть представлено в виде где q(o)) = (1 + о)2)/К(о)) — как раз и есть функция, ограничивающая стремление к нулю знаменателя этого уравнения при высоких частотах. Здесь Фа(о)) и Фот(<*>) соответственно фурье-образы $а(х) и £OutC*)> a ~~ выполняет роль коэффициента регуляризации, а q((o) — функция, растущая с (со). В целом член ад(со) сглаживает решение, причем тем сильнее, чем болы^е коэффициент а. Заметим в заключение: А. Н. Тихонов показал, что при определенных (естественных, с физической точки зрения) ограничениях на вид функций, входящих в (12.8), и при N(co) —► 0 функция fa(x) =/ес(х) монотонно стремится к точному решению, т.е. к^х). 12.3. ПЕРВИЧНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ, ФИЛЬТРАЦИЯ Рассмотрим нередко встречающуюся ситуацию, при которой l/vc^>j8, но отношение сигнал—шум невелико, т.е. мало L (типичный случай показан на рис. 12.1). Понятно, что решать обратную задачу восстановления исходных сигналов здесь не надо, поскольку во всей ширине полосы частот сигнала, т. е. при v < vc K(v)« 1. Это означает, что никакого ослабления частотных компонент сигнала в измерительно-регистрирующем тракте не происходит, а значит и в частотной коррекции выходной сигнал не нуждается. В сущности, обработка сигналов в обсуждаемой ситуации заключается в том или ином способе фильтрации шумов. Самый простой способ — обычное усреднение. При этом вся реализация выходного сигнала/оиЛЬ) разбивается на интервалы At = (tn - tn-\) < l/2vc и вычисляются как среднее значение fout(ti) = [l/(^-7)]Ly^ut(^/) на каждом интервале [4, tj], так и среднеквадратичная погрешность ±а(х) это-
12.3. Первичная обработка экспериментальных данных, фильтрация 289 го усредненного значения fout(ti), например, с помощью соотношений (1.15) и (1.16). Результат такой первичной обработки экспериментальных данных в условиях, когда Д/ < l/2vc приведен на рис. 12.2. Наряду со значениями fout(ti) на рисунке приведены области усреднения Д/ (горизонтальные отрезки) и погрешность ±а(х) (вертикальные отрезки). Ясно, что среднеквадратичная погрешность усредненного значения foutUi), вычисленного таким способом будет падать как квадратный корень из числа отсчетов fout(tj), попадающих в интервал [/*, tj\. Отсюда понятно желание увеличить интервал Д/ настолько, насколько это только возможно. Однако, здесь нас подстерегают две следующие главные опасности. Во-первых, уже при Д/« l/2vc высокочастотная часть спектра сигнала будет ослаблена, т. е. отфильтрованная функция fout(t), представляемая теперь значениями foutUi), будет излишне сглажена. Во-вторых, если в пределах Д/ изменения производной ^ut(0 существенны, вычисленные значения />ut(f/) окажутся смещенными, т. е. как бы сдвинутыми относительно их истинного положения. Отметим, кстати, что эти два разных следствия вызваны одной и той же причиной — сравнимостью Д/ и l/2vc. Как поступают в этой противоречивой ситуации, когда с одной стороны увеличение области усреднения Д* приводит к такого рода ошибкам, а с другой стороны хотелось бы увеличить At, с тем чтобы уменьшить а. Обычно применяемый рецепт — введение весовых коэффициентов, с тем чтобы дальше отстоящие от центра области усреднения отсчеты входили бы в усредненное значение fout(tj) с меньшим «весом». Логическим завершением такого подхода является фильтрация так называемыми «локальными фильтрами» [2], при котором сглаженная (отфильтрованная) функция fout(t) находится в результате операции 40 35 30 25 20 15 10 5 0 20 40 60 80 100 120 Рис. 12.1. Дискретные значения выходного сигнала в случае, когда отношение сигнал—шум невелико При этом на функцию q(t) накладываются следующие ограничения ее полуширина $ < l/2vc, a /f^ q(t) dt = 1. Пример действия такого ло- f ■ ,v ► ♦♦♦ ♦
290 Глава 12. Методы обработки экспериментальных данных кального фильтра показан на рис. 12.3. (Как видно из этого рисунка здесь реализация fOvx(t) содержит существенно больше отсчетов fout(ti)9 чем в предыдущем случае, в силу чего в отфильтрованном сигнале удается выявить гораздо больше подробностей.) Погрешность, возникающая при такого рода фильтрации, может быть оценена с помощью соотношения аналогичного выражению (12.4): 7 * j J <v) Q(v)]2dv = Здесь — фурье-образ^и1(0, Qout(v) — фурье-образ q(t), т.е. в наших терминах коэффициент передачи4), a 6f£n(t) и 6f£n(t)9 как и раньше, случайная и детерминированная (вызванная действием фильтра) компоненты погрешности. Ясно, что фильтрация «локальными фильтрами» несколько улучшает ситуацию по сравнению с рассмотренной выше «фильтрацией» путем тривиального усреднения. Однако не исчезает старая дилемма — уменьшая случайную компоненту погрешности путем увеличения полушины р фильтрующей функции q(t), мы одновременно увеличиваем ее детерминированную составляющую. Как найти оптимум? 0 20 40 60 80 100 120 Рис. 12.2. Фильтрация помех путем усреднения зарегистрированных экспериментальных данных В ряде случаев это удается сделать и пример тому так называемая Ви- неровская фильтрация. Суть ее состоит в построении такого фильтра L((o), который бы воздействуя на сумму сигнала и шума, регистрируемую на выходе измерительной системы, минимизировал бы среднеквадратичную погрешность 8f*ut(t). Пусть известно, что не только шум в канале N(t), но и выходной сигнал foUt(t) являются случайными гаус- совскими процессами, причем спектральные плотности сигнала и шума 4) Заметим, что в работах К. Шеннона наоборот — коэффициент передачи называется частотным фильтром. Разница здесь лишь в терминологии.
12.3. Первичная обработка экспериментальных данных, фильтрация 291 равны соответственно S((o) и R(a>). Очевидно, что fout(t) =foUt(t) + N(t), где N(t) — шум — есть гауссовский процесс с нулевым средним и дисперсией а2, т.е. ЛГ2(/) = а2. Рассмотрим класс линейных оценок/^(/) = 5S / Ц(0) [ф°« где 4&t(a0 - фурье-образ/о^(/), \ФЦ<»)\2 = ^(*>), #*(«>) = R(<o), а множитель, подлежащий определению. При этом Цсо) должно реализовать минимум среднеквадратичной ошибки, усредненной по случайным распределениям сигнала и шума. 40 30 20 10 0 25 50 75 100 Рис. 12.3. Действие «локального фильтра»: 1 — выходной сигнал; 2 — отфильтрованный сигнал; 3 — исходный (входной) сигнал 1 , i, JullliL 3 У1 rTTT* Ir Г 1 f"BB ' Согласно равенству Парсеваля оо 2dt = -L J = h S -ОО ОО Ща>)}]2<1а> = R(w)}]du>, поскольку N(o))=Q. Дифференцируя подынтегральное выражение и приравнивая производную нулю находим, что минимуму погрешности соответствует значение Д»> - тт^тк, (12-11) в силу чего отфильтрованный выходной сигнал определится как Тп где — фурье-образ/от(0.
292 Глава 12. Методы обработки экспериментальных данных На рисунках 12.4, а и £ показаны два Винеровских фильтра L(a))9 рассчитанных для условий, когда области существования функций S(co) и R(cd) практически не пересекаются (рис. 12.4, а) и, когда функция R(a)) частично лежит в области сигнала (рис. 12.4,6). Заметим, что функции S(oj) и R((o), показанные на этих рисунках, выбраны таковыми лишь с тем, чтобы иллюстрация была более наглядна. Так не нужно быть Н. Винером, чтобы понять, что если сигнал и шум лежит в разных спектральных диапазонах (рис. 12.4, а), то лучший способ фильтрации — это просто «обрезание» всех частот о) > сос на выходе измерительно-регистрирующей системы. Ясно также, что если в некоторой частотной области шумовая компонента аномально велика, то именно эта часть спектра должна быть подавлена. Однако уже тут, если нужны не общие рассуждения, а точный рецепт, как минимизировать ошибку, без соотношения (12.11) нам не обойтись. 1,2 1 0,8 0,6 0,4 0,2 ft 1 / 1 ) ( J 1 \ \ , з \| 1 \ у ч а 1,2 1 0,8 0,6 0,4 0,2 0 1 / / \\ 1 \}/ 2l\W /\\ б 3 0) 0 4 10 16 22 28 34 40 46 52 58 64 15 9 13 17 21 25 29 33 37 41 Рис. 12.4. Винеровская фильтрация: 1 — спектральная плотность сигнала S(cj); 2 — спектральная плотность шума R((o); 3 — коэффициент передачи винеровского фильтра Цш) 0 25 50 75 100 Рис. 12.5. Кусочно-полиномиальная аппроксимация исходного сигнала (аппроксимация сплайнами): 1 — выходной сигнал; 2 — модель входного сигнала; 3 — исходный (входной) сигнал Другой подход к фильтрации подробно рассмотрен нами в § 12.1. Напомним, что он состоит в том, что исходя из представления о свойствах решения выбирается класс моделей М, по значениям М, N (число
12.4. Квазиреальные эксперименты -J\^ 293 отсчетов) и а2 на основе одного из критериев проверки статистических гипотез вычисляется критическое значение ошибки 6fCT(N, M, а2). Методом наименьших квадратов, например, находится одна из моделей класса М f*ut(t), и затем по значениям /£&(%) nfoui(ti) вычисляется p(foUt,fOut), т. е. среднее уклонение модели от экспериментальных данных, которое и сопоставляется с критическим значением ошибки SfCT(N, M, а2). Если оказывается, что р > SfCT выбирается следующий, более высокий класс моделей и описанная выше процедура повторяется. Как правило, сопоставимая с экспериментальными данными модель foUt(t) находится после двух-трех итераций. Пример такой обработки экспериментальных данных представлен на рис. 12.5. 12.4. КВАЗИРЕАЛЬНЫЕ ЭКСПЕРИМЕНТЫ Исследование возможностей восстановления исходных сигналов, сопоставление различных алгоритмов восстановления и опытная проверка правильности оценок погрешностей восстановления, как правило, производится в вычислительном эксперименте. Однако, прежде чем начать в вычислительном эксперименте восстановление исходных сигналов, необходимо путем решения прямой задачи получить так называемые «квазиреальные экспериментальные данные», т. е. совокупность значений выходного сигнала/>ut(x/) или/>и1(//). Принцип получения квазиреальных данных прост: задается входной сигнал/п(х) или (fm(t)), затем вычисляется детерминированная часть выходного сигнала, равная его математическому ожиданию, и наигрывается шум. Для того, чтобы по входному сигналу fm(x) (или fm(t)) получить в вычислительном эксперименте совокупность />ut(*/)» представляющие собой так называемые «квазиреальные экспериментальные данные», необходимо: — задать входной сигнал и провести его дискретизацию, установив число отсчетов по значениям аргумента и функции; — вычислить фурье-образ входного сигнала; ограничить (если это необходимо) высокие пространственные частоты фурье-спектра и по полученному фурье-образу восстановить модифицированный (при ограничении фурье-спектра) дискретизированный входной сигнал. Именно этот сигнал и будет представлять в полученных квазиреальных экспериментальных данных совокупность ./in(х;); — задать аппаратную функцию g(x); вычислить ее полуширину /5 и коэффициент передачи К (со), т.е. фурье-образ аппаратной функции; — вычислить обусловленную сверткой, детерминированную часть выход- "] / Фт((о)К(о)) ехр(юис) da> = ^(У^М)^;
294 Глава 12. Методы обработки экспериментальных данных — разыграть на ЭВМ случайную величину & с дисперсией а; вычислить все значения шумовой компоненты N(Xi)=(i\fCOn(Xi)]1^2 и найти совокупность значений квазиреального выходного сигнала^и1(*/)=Ус для заданных g(x) и а. 1,2 0,8 0,4 0 E(x)/L 1 \ \ / 1 \ 1 1 1 1 1 1 ! 1 б -10 -5 1,8 0,9 •f / в E(Xi) 250 200 150 100 50 -10-8 -6-4-2 £»,(*) 240 180 120 60 0 2 4 6 8 -3 -2 -1 360 270 180 90 0 п п п J и U 1 й# W У ч о 360 270 180 90 ММ и у \ \\ \г ; у 1_ 200 400 600 800 п п J v п П И ц 200 400 600 800 -500 -300 -100 100 300 Рис. 12.6. Процедуры получения квазиреальных экспериментальных данных и восстановления (реконструкции) входного сигнала по их совокупности: а) входной сигнал (штриховая мира на фоне паразитной засветки); б) дискретизированный входной сигнал /тЫ (при ограничении фурье-спектра); в) аппаратная функция g(x); г) детерминированная часть выходного сигнала fcon(x) = ffm(x')g(x—x')ax'; д) совокупность значений квазиреального выходного сигнала fout(xi) =jkon(*/) 4- N(xt); е) сопоставление восстановленного fKC(x9 a) (7) и входного /шМ (2) сигналов Получение совокупности этих квазиреальных экспериментальных данных и есть первая часть нашей задачи. Подобного рода квазиреальные данные представляют двоякий интерес. Во-первых, эта весьма точная модель выходного сигнала позволяет анализировать его качество в зависимости от амплитуды входного сигнала, аппаратной функции, уровня шумов и т. п. Во-вторых, при решении обратной задачи, т. е. при восстановлении входного сигнала по выходному, наличие такой модели делает возможным проверку и сопоставление различных алгоритмов восстановления, поскольку есть эталон сравнения — ведь входной сигнал в этом случае известен точно\
12.5. Погрешности восстановленных сигналов -Jl/. 295 Для восстановления (реконструкции) входного сигнала по совокупности полученных квазиэкспериментальных данных необходимо: — найти значение частоты (номер гармоники), при которой фурье- компоненты выходного сигнала близки к нулю или меньше соответствующей фурье-компоненты шума; — по найденному номеру гармоники вычислить, учитывая значение Q, информацию, содержащуюся в выходном сигнале и минимально_воз- можную относительную ошибку восстановления fKC(x), т.е. бЕт^/Е; — варьируя значения коэффициента регуляризации а вычислить со- вокупность/еС(х, а) = Екс(х9 а) и найти ошибки реконструкции 6ЕКС при оптимальном значении а. Процедуры получения квазиреальных экспериментальных данных и восстановления (реконструкции) входного сигнала по их совокупности иллюстрирует рис. 12.6. 12.5. ПОГРЕШНОСТИ ВОССТАНОВЛЕННЫХ СИГНАЛОВ Используем процедуру вычислительного эксперимента для изучения характера и величины погрешностей, возникающих при восстановлении исходных сигналов. Проведем постановку эксперимента. Ясно, что особенности восстановления интересно рассмотреть в таких случаях, при которых просто необходима операция восстановления, т.е. тогда, когда световые потоки малы, шумы достаточно велики, a l/vc порядка р. В то же время требования не должны быть настолько жесткими, чтобы делать бессмысленными сами измерения. Другими словами, результирующая погрешность не должна превосходить некоторую разумную для практики величину, скажем 10—20%. Попытаемся найти такие условия. Пусть на вход электронно-оптической системы подается сигнал Ет(х)9 состоящий из постоянной и переменной составляющих, так что Ет(х) = = Е[П + Е\п. График функции Дп(х), характеризующий освещенность фотокатода, удобнее всего рассмотреть на рис. 12.7. Как видно из рисунка, здесь мы имеем дело с традиционным случаем фотографирования штриховой миры в условиях малой освещенности и на фоне паразитной засветки. (Кстати реальная картина распределения Eout(x) на экране электронно-оптического преобразователя в условиях малой освещенности фотокатода практически ничем не отличается от показанного на рис. 12.7.) Отличие от типичных условий фотографирования штриховой миры состоит, во первых, в том, что световые потоки крайне малы — всего 1,7 • 10~14 Дж/см в максимуме пропускания миры! Во вторых мы ограничили производную Е'{х) и тем самым критическую частоту vc. При таком ограничении достаточно всего четыре гармоники ряда Фурье, чтобы
296 JL Глава 12. Методы обработки экспериментальных данных описать переменную составляющую сигнала Ет(х) с точностью в 2%, что, конечно же, существенно упрощает вычисления при получении квазиреальных экспериментальных данных. Малость этой величины по сравнению с ожидаемой погрешностью дает основание считать, что с достаточной точностью vc=4vi и, значит, позволяет вычислить Дс = l/2vc = l/8vi. Теперь выберем отношение Д/jS, близкое к его оптимальному значению, и учтем, что как это следует из информационной оценки (см. формулу (4.16)), нижняя граница погрешности Выписанные соотношения достаточны, чтобы, задавшись величиной погрешности, определить условия эксперимента. Применительно к масштабам рис. 12.7 найдем, что vc = 80 см"1, Дс = 6,25 • 10~3 см и выберем /J = 1,2- 10~2 см. Как видно, эти условия несколько хуже оптимальных с точки зрения реализации пропускной способности канала передачи информации, но выбраны так, чтобы более рельефно подчеркнуть влияние аппаратной функции на выходной сигнал. (Характер возникающих при этом искажений показан на том же рис. 12.7, где дана кривая Есоп(х), т.е. Eout(x) в отсутствии шумов и при условии, что L —► оо, а Д —► 0.) Тем не менее при этом энергетические затраты, приведенные к входному сигналу, остаются на уровне рекордных, не превышая 3 • 10""10 эрг/бит, если квантовый выход фотокатода у, = 0,3. Это значит, что сигнал с энергией всего в 2,5 • 10~15 Дж (всего ~ 104 фотонов!) достаточен, чтобы пять штрихов испытательной миры были восстановлены с указанной выше точностью, т.е. с точностью в пределах 10-20%. Понятно, что, если квантовый выход будет хуже, например, в три раза, для достижении тех же результатов потребуется втрое больше энергии, т. е. втрое больше фотонов. Теперь дело за экспериментом. «Подадим» на вход сигнал &т(х) — его параметры приведены на рис. 12.7, — а с выхода, используя описанную выше процедуру «считаем» значения &Out(xi)- При этом от серии к серии экспериментов будем изменять шаг «считывания» Д. Таким образом было вычислено по 6—8 совокупностей $out(Xi) для каждого значения Д, причем в каждом эксперименте разыгрывалась иная реализация шума. (Некоторые из входных сигналов £Out(*/)> полученных при Д равном 80, 20 и 4 мкм, показаны соответственно на рис. 12.8, а-в.) Массивы £Out(*/) поступали в блок восстановления, в котором по основной схеме регуляризации с использованием критерия %2 вычислялись значения &kc(xj). Такой порядок действий позволял промоделировать весь тракт, включающий в себя измерительно-регистрационную систему, устройство считывания и блок обработки и представления.
12.5. Погрешности восстановленных сигналов 297 //£, см 3,2- К 1,4-10 5 х, мм 3,2-104 1,4-104 1,6 104 0,8-104 ■^Ш' TIP 'W V *■ 1 .1 ■PWVM'.JlfW 1 I '4 я 1 J I T IT ■ 5 x, мм //£, CM 3,2-104 l,4 104 1,6-104 0,8-104 0 1 2 3 4 5 jc, мм Рис. 12.7. Входной и выходной сигналы Ет(х) и Eout(x) и восстановленное по выходному изображению распределение исходной освещенности ы Ml cto Проанализируем полученные результаты. На рис. 12.8 сопоставлены значения ошибок восстановления и составляющих их компонент, как рассчитанных по приведенным выше формулам, так и полученных в вычислительном эксперименте. Ошибки восстановления вычислялись для области существования сигнала X = 2,5 мм. Это, в частности, означает, что при //£пшх(*) = 2,4 • 104 см"1 //£(*) = 1,76 • 104 см"1. Исходя из такой величины ц$(х) рассчитана зависимость а(Д)/£= 2ао/с/&= представленная на рис. 12.8. Функция 5£С0П(Д)/£ вычислена по формуле (12.6) с учетом поправок, следующих из комментария к неравенству (12.7); а функция 6&z(/S)/g — исходя из того, что 6^z = 8$2^п + 6^оп. Для экспериментальных данных помимо средних значений «измеряемых» величин приведены и среднеквадратичные уклонения. Из рисунка хорошо видно, что tf^ran непрерывно падает с Д, а 5£соп перестает уменьшаться, как только Д становится существенно меньше /J. Полученные в вычислительном эксперименте значения <5£С0П(Д)/£ и 6&z(A)/g с завидной для реального эксперимента точностью ложатся на расчетные кривые. Приведенные на том же рисунки реализации £Out(*) иллюстрируют ситуацию: при больших Д (рис. 12.8, а), когда случайная компонента погрешности мала, но кривая £Out(*) чрезмерно сглажена и суммарная ошибка велика за счет 6§соп; при малых Д (рис. 12.8, в), где очень высок
298 Глава 12. Методы обработки экспериментальных данных уровень шума и поэтому велика суммарная погрешность; и оптимальных Д (рис. 12.8,6), т.е. в условиях, когда 6^ примерно равна 5£соп. 0,25 0,2 0,15 0>1 1,25 2,5 5 10 20 40 Д, мкм Рис. 12.8. Ошибки восстановления пространственного распределения исходной освещенности Итак, существует некоторое вполне определенное значение оптимальной апертуры считывания Дорь при котором выходной сигнал £ош(*) имеет наименьшее уклонение от входного сигнала, т. е. от £щ(х) и этот оптимум, как мы уже говорили, реализует ситуацию, при которой ошибка представления fKC(x) =fout(x) «/nW минимальна. Однако вовсе не этот выходной сигнал, считанный с шагом Дорь несет наибольшую информацию о сигнале, поступившем на вход измерительной системы. Как следует из изложенных выше представлений теории информации, энтропия считанного изображения H(Y) —> Hmax при Д —► 0. Это означает, что при восстановлении входного сигнала по выходному следует использовать возможно большее количество отсчетов £out(x/) — т. е. считывать с достаточно малым шагом Д — пусть даже при этом точность каждого из отсчетов и не велика. В том, что это действительно так, нетрудно убедиться посмотрев на кривую 5£гес(Д), представленную на рис. 12.8, или на восстановленный выходной сигнал^£гес(х), показанный на рис. 12.7. Здесь относительная ошибка ^^(Д)/^ да 0,15, хотя £&;(д)/£ да 0,5.
12.5. Погрешности восстановленных сигналов —'\у- 299 Обсудим полученные результаты. Прежде всего попытаемся понять, почему при восстановлении лучше иметь побольше — пусть неточных — отсчетов выходного сигнала, чем существенно меньшее их число, но зато гораздо большей точности. В чем заключается физический смысл этого информационного парадокса — кажущегося противоречия здравому смыслу? Чтобы ответить на этот вопрос рассмотрим крайнюю ситуацию. Пусть мы считываем выходной сигнал с шагом Ах < \/п(х). (Это, кстати, иногда делается при очень слабых световых потоках.) Тогда совокупность выходных отсчетов будет состоять лишь из нулей и единиц, отвечая на вопрос, есть ли в окрестности Ajc координаты х, электрон (или зерно фотослоя). Мы не станем в этом случае искать значения п(х) как 1/Ах, что, понятно, бессмысленно, а просто запишем координаты, в которых обнаружены электроны (или зерна). В этом крайнем случае мы пересчитаем все электроны, формирующие выходное изображение, и, указав координаты каждого из них, считаем всю информацию, заключающуюся в выходном изображении — именно всю, другой просто нет, поскольку нет других электронов (или зерен). Вот, собственно, подоплека того, почему с уменьшением шага считывания растет точность восстановления. Ясно, что запись, состоящая из нулей и единиц, не позволит подчас наглядно представить себе £out(;c) — ведь мы при этом как бы переходим от амплитудной модуляции считываемого сигнала к частотной — но ведь этого и не требуется. Нам необходимы входные данные для восстановления £in(x) и только. Как далеко следует заходить при уменьшении шага считывания? Ведь продвижение в область малых Л совсем не безболезненно — увеличивается время считывания, растут информационные массивы, а значит, время на их пересылку и обработку и т. п. Рецепт здесь ясен — чтобы избежать дополнительной потери информации при считывании коэффициент потери мощности считывающего устройства К должен быть близок к единице. Как видно из рис. 12.8, в нашем случае для этого достаточно считывать с А на порядок меньшим, чем /J. Можно, конечно, и дальше уменьшать А, но выигрыш в точности восстановления при этом будет меньше, чем разброс от реализации к реализации. Перейдем к оценкам точности восстановления. Как следует из рис. 12.8 при большом числе отсчетов на определенный параметр N/M = Ас/А оба способа оценки точности (5£гес > 5&;\/2Д/Дс и 6$кс > &/L*) приемлемы и дают сходные результаты, отличающиеся и друг от друга и от «экспериментальных» данных меньше, чем на 1 %. При малых выборках, т.е. при малых N/M, информационная оценка (6&кс >$/L*) лучше согласуется с совокупностью экспериментальных данных. Но важнее, на наш взгляд, другое — практическая эквидистантность кривых 5£гес(Д)/£ и 1/Z*(A) наглядно подтверждает не только правомерность,
300 -J\y- Глава 12. Методы обработки экспериментальных данных но и корректность информационных оценок. Казалось бы, поскольку теория информации — это ветвь математической статистики, было бы странно, если бы различные способы статистического оценивания давали бы разные результаты, а стало быть, вроде и нет нужды в подобного рода экспериментальных доказательствах. И это было бы так, если бы все представления и идеи теории информации — и прежде всего идея К. Шеннона о применимости к информации законов сохранения — были бы обусловлены строгими математическими доказательствами, а не являлись бы результатом интуитивного видения. Ведь именно на такого рода идеях основываются наши оценки точности восстановления. Так, результат 8&кс > &/L* получен нами просто исходя из представления о том, что в восстановленном изображении не может быть больше информации, чем ее содержится в выходном изображении о входном. Все остальное — это просто техника, если информацию содержащуюся в выходном сигнале о входном мы умеем рассчитать. Наконец, обратим внимание на работы [3] и [4], в которых оценка снизу точности восстановления проводится с использованием представления колмогоровской энтропии. Авторы этих работ рассматривают не методы вычисления энтропии зарегистрированного массива (предполагается, что информация, содержащаяся в правой части уравнения об подынтегральной функции, известна или оценена), а ищут ту минимальную погрешность, которая будет допущена в решении, если в качестве алгоритма использовать самый лучший. Заметим, что если оценка сверху — это значение погрешности при конкретном алгоритме восстановления, то оценка снизу — принципиальная граница точности. Естественно, что в оптимальном случае обе оценки сходятся. ЛИТЕРАТУРА 1. Пергамент М. И. Информационные аспекты получения и обработки оптической и спектральной информации // Энциклопедии низкотемпературной плазмы. - Т. И. М.: Наука, 2000. - С. 424-442. 2. Тихонов А. Я, Пергамент М.И. Современные методы измерений и интерпретации наблюдений в высокотемпературной плазме // В кн.: Диагностика плазмы. Вып. 4 (И). — М: Энергоиздат, 1981. — С. 130-147. 3. Петров А. Я, Хованский А. В. Оценка погрешности решения линейных задач при наличии ошибок в операторах и правых частях уравнений // ЖВМ и МФ. - 1974. - Т. 14, JSfe 2. 4. Пергамент А. X. Метод регуляризации и задачи статистического оценивания функций. - Препринт / ИПМ АН СССР. №53. - М., 1984. - 24 с.
—J 1 шт Издательский Дом У ИНТЕЛЛЕКТ Глава 1 ЧТО ТАКОЕ ФУРЬЕ-ОПТИКА? § 1. Линейные фильтры, принцип суперпозиции, собственные функции § 2. Гармонические колебания в задачах линейной фильтрации § 3. Пространственная фильтрация § 4. Плоские волны § 5. Спектральное разложение. Преобразование Фурье § 6. Спектральный подход к задачам линейной фильтрации § 7. Временная и пространственная модуляции § 8. Демодуляция и детектирование § 9. 8 -функция § 10. Заключение Г л а в а 2 МАТЕМАТИЧЕСКОЕ ДОПОЛНЕНИЕ § 1. Некоторые важные задачи сложения гармонических колебаний § 2. Преобразование Фурье § 3. Некоторые свойства преобразований Фурье § 4. Сигналы и их спектры. Соотношение неопределенностей § 5. Теорема Котельникова § 6. Поля и пространственные спектры. Соотношение неопределенностей Г л а в а 3 ДИФРАКЦИЯ § 1. Введение. Постановка задачи § 2. Распространение волн в свободном пространстве § 3. Граничные условия Кирхгофа § 4. Формула Грина и принцип Гюйгенса- Френеля § 5. Область геометрической оптики § 6. Дифракция Френеля § 7. Принцип Бабине (дифракция на дополнительном экране) § 8. Теорема Котельникова в оптике (применение к расчету френелевских дифракционных картин) § 9. Дифракция Фраунгофера и метод стационарной фазы § 10. Принцип Гюйгенса-Френеля и дифракция Фраунгофера § 11. Разрешающая способность дифракционной решетки Г.Р. Локшин Основы радиооптики Серия «Физтеховский учебник» Глава4 ДИФРАКЦИОННАЯ ТЕОРИЯ ФОРМИРОВАНИЯ ИЗОБРАЖЕНИЯ И РАЗРЕШАЮЩАЯ СПОСОБНОСТЬ § 1. Введение § 2. Модуляционная характеристика линзы § 3. Элементарная оптическая система § 4. Поле в фокальной плоскости линзы § 5. Поле в оптически сопряженной 4,9 плоскости, функция рассеяния точки § 6. Структура оптического изображения (полевой подход) § 7. Структура оптического изображения (спектральный подход) § 8. Аберрации и дефокусировка § 9. Собственные функции (моды) оптической системы § 10. Принцип двойной дифракции § 11. Экстремальные свойства системы Lo Глава5 ОБРАБОТКА ИНФОРМАЦИИ В КОГЕРЕНТНЫХ ОПТИЧЕСКИХ СИСТЕМАХ § 1. Корреляционная фильтрация § 2. Математические преобразования, осуществляемые оптическими системами § 3. Методы улучшения качества изображения § 4. Аподизация § 5. Восстановление объекта по изображению, «испорченному» дифракционными эффектами. Сверхразрешение § 6. Оптические системы с обратной связью § 7. Пространственно периодические поля § 8. Фазовая проблема в оптике. Принципы голографии § 9. Цифровая голография. Метод фазовых шагов § 10. Радиоголография. Радиолокатор с синтезированной апертурой § 11. Принципы корреляционной фильтрации и фазовая проблема § 12. Принципы корреляционной фильтрации в голографии § 13. Эффект Талбота и визуализация фазовых структур § 14. Восстановление фазовой структуры волны по картине интенсивности в фурье-плоскости
§ 15. Соотношение между амплитудой и фазой оптического сигнала в фурье- плоскости § 16. Алгоритм Гершберга—Сектона § 17. Метод бегущей тени § 18. Устранение искажений в оптической системе. Инверсная фильтрация § 19. Винеровский фильтр § 20. Согласованная фильтрация и задача распознавания образов § 21. Синтез когерентных пространственных фильтров. Введение § 22. Модуляционная микроскопия § 23. Допплеровская пространственная фильтрация Список литературы ИНТЕЛЛЕКТ Ю.А. Розанов Лекции по теории вероятностей Серия «Физтеховский учебник» 1. Опыт с равновероятными исходами. Вероятность и частота. Некоторые комбинаторные формулы. Формула Стирлинга 2. Комбинации событий. Пространство элементарных событий. Закон сложения вероятностей 3. Связь различных событий. Условные вероятности. Независимые события. Количество информации 4. Общая теоретико-вероятностная схема. Случайные величины и распределения вероятностей. Математические ожидания 5. Среднеквадратичное значение и неравенство Чебышева. Дисперсия. Коэффициент корреляции. Закон больших чисел. Вероятность и частота 6. Испытания Бернулли. Биномиальное и пу- ассоновское распределения. Теорема Му- авра—Лапласа. Нормальное распределение вероятностей 7. Производящие и характеристические функции. Предельные теоремы 8. Цепи Маркова. Возвратные и невозвратные состояния. Финальные распределения вероятностей. Стационарность 9. Марковские процессы с конечным или счетным числом состояний. Дифференциальные уравнения Колмогорова. Финальные распределения вероятностей 10. Ветвящиеся процессы. Дифференциальное уравнение для производящей функции. Эффекты вырождения и взрыва 11. Простейшая модель игры двух лиц. Оптимальные стратегии. Одна схема управляемой цепи Маркова. Уравнение Беллмана www.id-intellect.ru Ю.М. Белоусов, В.П. Кузнецов, В.П. Смилга Практическая математика. Руководство для Издательский Дом интеллект начинающих изучать теоретическую физику Серия «Физтеховский учебник» Глава 1 АКСИОМАТИЧЕСКИЙ МЕТОД 1.1. Введение 1.2. «Начала» Евклида 1.3. Система аксиом Г. Вейля Глава2 ЭЛЕМЕНТЫ ЛИНЕЙНОЙ АЛГЕБРЫ 2.1. Основные понятия 2.2. Преобразования системы базисных векторов 2.3. Эрмитовы операторы и матрицы
ГлаваЗ ПРЕОБРАЗОВАНИЯ СИММЕТРИИ В ТРЕХМЕРНОМ ПРОСТРАНСТВЕ 3.1. Преобразования системы координат 3.2. Преобразования поворота 3.3. Отражения в плоскости 3.4. Группа преобразований симметрии Глава4 ВЕКТОРНАЯ И ТЕНЗОРНАЯ АЛГЕБРА В ТРЕХМЕРНОМ ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 4.1. Введение 4.2. Скаляр, вектор, тензор 4.3. Операции с тензорами 4.4. Симметрии трехмерного пространства и матрица поворота 4.5. Инварианты Глава 5 ЭЛЕМЕНТЫ ВЕКТОРНОГО АНАЛИЗА В ТРЕХМЕРНОМ ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 5.1. Основные понятия векторного анализа 5.2. Действия с оператором V 5.3. Операции векторной алгебры в тензорных обозначениях 5.4. Интегральные формулы векторного анализа 5.5. Преобразование интегральных выражений Главаб ОРТОГОНАЛЬНЫЕ СИСТЕМЫ КООРДИНАТ 6.1. Основные физические системы координат 6.2. Операторы V и А в цилиндрической системе координат 6.3. Операторы V и А в сферической системе координат Глава7 ЗАМЕНА ПЕРЕМЕННЫХ, ЯКОБИАН 7.1. Замена переменных в многомерных интегралах 7.2. Якобиан Глава8 ПСЕВДОЕВКЛИДОВО ПРОСТРАНСТВО 8.1. Метрический тензор 8.2. Метрика Минковского 8.3. Тензорная алгебра в четырехмерном пространстве Минковского Глава 9 НЕКОТОРЫЕ ПРИМЕНЕНИЯ ТЕОРИИ ФУНКЦИЙ КОМПЛЕКСНОГО ПЕРЕМЕННОГО 9.1. Основные понятия 9.2. Дифференцирование и интегрирование аналитических функций 9.3. Нули и особые точки аналитических функций 9.4. Вычеты. Контурное интегрирование 9.5. Гамма-функция и другие функции, определенные интегралами 9.6. Метод Бореля Глава 10 ПРИМЕНЕНИЕ ОБОБЩЕННЫХ ФУНКЦИЙ ЮЛ. Введение 10.2. 8 -функция 10.3. Представления S -функции 10.4. Свойства S -функции 10.5. Функция Хевисайда в (х), sign x и @> \/х 10.6. Некоторые свойства обобщенных функций ГлаваП ГЕОМЕТРИЯ И АЛГЕБРА В МАТЕМАТИЧЕСКОМ АППАРАТЕ КВАНТОВОЙ МЕХАНИКИ 11.1. Основные понятия 11.2. Операторы в гильбертовом пространстве 11.3. Собственные значения и собственные векторы операторов 11.4. Проекционный оператор 11.5. Представление векторов и операторов матрицами 11.6. Непрерывный спектр ГлаваП НЕКОТОРЫЕ ПРИМЕНЕНИЯ ФУНКЦИЙ ГРИНА 12.1. Основные понятия и свойства функции Грина 12.2. Функция Грина волнового уравнения. Запаздывающие потенциалы 12.3. Функция Грина стационарного уравнения Шредингера 12.4. Функция Грина свободной частицы Историческая справка Список литературы www.id-intellect.ru
Учебное пособие Заявки на книги присылайте по адресам: zakaz@id-intellect.ru solo@id-intellect.ru id-intellect@mail.ru тел. (495) 579-96-45 факс (495) 579-96-70 В заявке обязательно указывайте свои реквизиты (для организаций) и почтовый адрес! Подробная информация о книгах на сайте http://www.id-intellect.ru Михаил Иосифович Пергамент МЕТОДЫ ИССЛЕДОВАНИЙ В ЭКСПЕРИМЕНТАЛЬНОЙ ФИЗИКЕ Компьютерная верстка - А.А. Пярнпуу Корректура автора Художник - С.Ю. Биричев Ответственный за выпуск — Л.Ф. Соловейчик Формат 60x90/16. Печать офсетная. Гарнитура Ньютон. Печ. л. 19. Тираж 2000 экз. Зак. № 459 Бумага офсетная № 1, плотность 80 г/м2 Издательский Дом «Интеллект» 141700, Московская обл., г. Долгопрудный, Промышленный пр-д, д. 14, тел. (495) 617-41-85 Отпечатано в ООО «Чебоксарская типография № 1» 428019, г. Чебоксары, пр-т И. Яковлева, д. 15