Текст
                    Applications
of Digital
Signal Processing
Allan V. Oppenheim, Editor
Massachusetts Institute of Technology Cambridge, Mass.
Prentice-Hall,
Inc., Englewood Cliffs,
New Jersey
1978


Применение цифровой обработки сигналов Под редакцией Э. Оппенгейма Перевод с английского под редакцией канд. техн. наук Л. М. Рязанцева РЕСПУБЛИКАНСКАЯ ЛАЯ" S им. В. И. Л Издательство «Мир» Москва 1980
УДК 621.372.542 В книге рассматриваются применения цифровых методов для обработки сигналов в системах связи, геофизике, радио- и гидроло- гидролокации, а также для анализа речевых сигналов и двумерных изобра- изображений. Большое внимание уделено вопросам первичной обработки эхо-сигналов дальностно-доплеровских радио- и гидролокаторов. Ис- Использование цифровых методов в геофизике иллюстрируется на за- задачах, связанных с сейсмическими исследованиями и разведкой по- полезных ископаемых. Книга представляет значительный интерес для научных работни- работников и инженеров, использующих методы цифровой обработки сиг- сигналов. Редакция литературы по новой технике 2403000000 30401-169 :!«.;/>'© 1978 by Prentice-Hall, Inc. П41/П11 ЯП ЮУ—oil ' vii(vi) аи ЯП аи перевод на русский язык, «Мир» 1980
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА Вопросам обработки сигналов, преобразованных в цифровую форму, посвящены многочисленные публикации в виде статей и книг. В большей части публикаций рассматриваются или алгорит- алгоритмы цифровой обработки сигналов (ЦОС) определенного вида — речевых, радиолокационных, гидролокационных, изображений,— или устройства, используемые при такой обработке. Некоторые алгоритмы, например алгоритм быстрого преобразования Фурье, применяются для всех видов сигналов, другие — для некоторых из них. В этой книге описаны применения ЦОС в разных областях техники, что позволяет проследить за особенностями реализаций алгоритмов обработки сигналов с различными параметрами и ис- искажениями, допускаемыми техническими требованиями к системе или свойствами органов восприятия человека. Сначала цифровые методы применялись для обработки рече- речевых и сейсмических сигналов, имеющих сравнительно узкий час- частотный спектр. С увеличением быстродействия и объема памяти ЭВМ стало возможным проводить обработку более широкополос- широкополосных сигналов в реальном времени, а также многоканальных и мно- многомерных сигналов. Целью обработки сигналов, в том числе цифровой, является ре- решение двух задач: определение истинных параметров сигнала, иска- искаженного действием помех или среды, через которую передается сигнал, и оценка влияния характеристик этой среды на параметры сигнала. Авторы книги стремились сначала описать влияние среды на сигнал и определить ожидаемые изменения параметров сигнала в среде, т. е. оценить характеристики модели среды, а затем рас- рассмотреть известные алгоритмы цифровой обработки, используемые для определения параметров первоначального сигнала или харак- характеристик среды. Для основных алгоритмов обработки сигналов приводятся схемы их реализации на основе аналого-цифровых пре- преобразователей, процессоров для быстрого преобразования Фурье и других устройств. Хотя принцип построения всех глав книги один и тот же, при изложении материала наблюдаются различия. Это объясняется спецификой излагаемых вопросов и, по-видимому, научными инте- интересами авторов. Так, при описании цифровой обработки речевых
Предисловие редактора перевода "и сейсмических сигналов, а также сигналов изображений много места отведено алгоритмам. В главах, посвященных обработке гидроакустических и звуковых сигналов, большое внимание уделя- уделяется физическим процессам, происходящим при распространении сигналов в воде и закрытых помещениях. В главе по обработке сигналов в радиолокационных системах более полно описываются этапы и устройства поточной схемы обработки сигналов. Дополнительные сведения по затронутым в книге вопросам приведены в тематическом выпуске журнала «Труды института ин- инженеров по электротехнике и радиоэлектронике» по цифровой об- обработке сигналов A975, том 63, № 4). Цифровой обработке сигна- сигналов изображений посвящена монография Л. П. Ярославского «Вве- «Введение в цифровую обработку изображений». М.: Советское радио, 1979. Данная книга, отражающая достижения цифровой обработки сигналов, несомненно, окажет большую помощь при создании но- новых цифровых систем как в описанных областях техники, так и во многих других. В частности, все большее применение находит ЦОС в комплексной медицинской диагностике, комплексном, или си- системном, изучении океана и атмосферы. Перевод выполнен канд. техн. наук Ю. Н. Александровым (гла- (главы 5, 6), А. Л. Зайцевым (предисловие, главы 2, 4, 7), канд. техн. наук Э. Г. Назаренко (глава 1), Н. Н. Тетекиным (глава 3). А. М. Рязанцев
ПРЕДИСЛОВИЕ Цифровая обработка сигналов (ЦОС) интенсивно развивается' уже свыше десяти лет. За этот период разработаны новые алго- алгоритмы, создана прогрессивная технология производства электрон- электронных устройств и расширено применение ЦОС. Совершенствова- Совершенствование технологии позволило перейти от дискретных полупроводни- полупроводниковых приборов к большим и сверхбольшим интегральным схемам с плотностью свыше тысячи элементов на кристалл. Кроме того, повысилась роль аналоговых устройств хранения и обработки дан- данных, таких, как приборы с зарядовой связью. Создание недорогих быстродействующих микропроцессоров и возрастающие возмож- возможности специальных микросхем с высокой степенью интеграции позволяют надеяться на практическое использование все более сложных алгоритмов. Например, сравнительно недавно реализа- реализация многих интересных с теоретической точки зрения систем сжа- сжатия речи считалась нецелесообразной из-за того, что при спект- спектральном анализе с высоким разрешением на основе быстрого пре- преобразования Фурье требуются высокопроизводительные процессо- процессоры. Благодаря достигнутому уровню технологии приборов с заря- зарядовой связью, используемых в устройствах спектрального анализа и фильтрах с конечными импульсными характеристиками, стало возможным создавать некоторые считавшиеся ранее нерентабель- нерентабельными системы обработки речи на основе небольшого количества больших интегральных схем. Этот и подобные примеры показыва- показывают, что ЦОС имеет весьма благоприятные перспективы развития, обусловленные, в частности, успехами технологии. По мере расширения областей применения цифровых методов важное значение приобретают вопросы сходства и различия в ис- использовании основных методов и аппаратуры ЦОС в разных обла- областях техники. Различия отчасти можно объяснить тем, что исход- исходные предпосылки и ограничения, такие, как скорость передачи дан- данных, требование работы в реальном времени и т. д., не одинаковы. Однако в ряде случаев различия возникали просто из-за недоста- недостаточного обмена информацией между разными областями техники, и часто знакомство с методами применения ЦОС в одной области техники способствовало успеху в другой. В данной книге обсуждается ряд важных применений ЦОС в различных областях техники за последние десять лет. В некоторых
Предисловие гиз них, таких, как обработка речевых и сейсмических сигналов, методы ЦОС применялись с самого начала, что во многом способ- способствовало их совершенствованию. В других случаях, например при ¦обработке звуковых сигналов, раньше использовали главным обра- образом аналоговые методы и лишь недавно стали переходить на циф- цифровые методы, что обусловлено снижением стоимости аппаратуры. Однако становится все более очевидным, что успехи современной технологии приближают нас к качественному скачку в обработке звуковых сигналов. Причины использования ЦОС в различных отраслях техники весьма разнообразны. В некоторых случаях, таких, как обработка радиолокационных, гидролокационных и сейсмических сигналов, основными соображениями в пользу применения методов ЦОС яв- .ляют.ся их универсальность и высокая точность. В других случаях, например при обработке речевых и звуковых сигналов, существен- существенным фактором становится ожидаемый долгосрочный выигрыш в стоимости. При написании каждой из глав этой книги преследовались две основные цели. Прежде всего авторы хотели изложить предвари- предварительные сведения и дать основополагающие принципы соответст- соответствующей области техники для тех читателей, которые знакомы с ос- основами ЦОС, но не являются специалистами в данной области ее применения. Методы ЦОС, используемые в разных областях тех- техники, наряду с многими общими чертами имеют свои особенности, и нет сомнения в том, что глубокое понимание влияния этих ме- методов на одну область знания будет в сильной степени способст- способствовать развитию другой области знаний. Кроме того, авторы стре- стремились показать современное состояние цифровой обработки сиг- сигналов в рассматриваемой области техники, что, несомненно, представит интерес для специалистов в этой области. Поэтому мы надеемся, что каждая глава в отдельности и вся книга в целом за- заинтересуют широкий круг специалистов. Это будет способствовать созданию новых методов и появлению новых идей в ЦОС. Хочется выразить благодарность всем соавторам за тщатель- тщательность, с которой они готовили свои главы, а также за выполнение в срок различных этапов работы. Подготовка главы для коллек- коллективной монографии неизменно требует больше времени и усилий, чем ожидается вначале. Многие соавторы откладывали другие свои обязательства с тем, чтобы обеспечить выход книги в срок. В заключение я хотел бы поблагодарить г-жу Монику Эделмен за ее добрый характер и отличное выполнение обязанностей секрета- секретаря, связанных с моей ролью редактора этой книги. Массачусетский Э. Оппенгейм технологический институт, Кембридж, Массачусетс
Глава 1 НЕКОТОРЫЕ ПРИМЕНЕНИЯ ЦИФРОВОЙ ОБРАБОТКИ СИГНАЛОВ В СИСТЕМАХ СВЯЗИ С. Л. Фрини, Дж. Ф. Кайзер, X. С. Макдональдс 1.1. Введение В любой системе связи применяется какой-либо метод обра- обработки сигналов. В последние годы все большее внимание уделяет- уделяется использованию цифровой обработки сигналов в системах связи. Это объясняется в значительной степени возрастающей доступ- доступностью цифровых интегральных схем (ИС) средней (СИС) и боль- большой (БИС) степени интеграции, обладающих такими желатель- желательными показателями, как малые размеры и потребляемая мощ- мощность, небольшая стоимость, помехоустойчивость и надежность. В течение нескольких последних лет авторы участвовали в прове- проведении научно-исследовательских работ фирмы Bell System по при- применениям цифровой обработки сигналов; наиболее существенные результаты этих работ будут достаточно детально рассмотрены в этой главе. Чтобы помочь читателю, авторы избрали скорее описа- описательный, чем строго математический характер изложения мате- материала. Кроме того, они попытались использовать как можно мень- меньше узкоспециальных, а иногда и не очень понятных терминов, ко- которыми насыщена литература. Изложение материала начинается с краткого обзора некоторых частей системы связи, где цифровая техника может быть наиболее- эффективно использована. К ним относятся подсистемы передачи цифровых сигналов и цифровой коммутации, оконечные устройства передающих систем с импульсно-кодовой модуляцией (ИКМ) и частотным уплотнением каналов (ЧУК), подсистемы контроля ис- исправности системы и эхо-сигналов. Далее обсуждаются задача раз- разработки программируемого процессора цифровых сигналов, взаи- взаимосвязь структуры, разрядности слова и нелинейных эффектов, а также роль вспомогательных устройств процессора. Детально опи- описываются широкие возможности программируемого процессора цифровых сигналов и его использование. Завершается глава про- прогнозом на ближайшее будущее. " S. L. Freeny, Bell Telephone Laboratories, Inc., Holmdel, N. J. 0773?;: J. F. Kaiser, Bell Telephone Laboratories, Inc., Murray Hill, N. J. 07974;,, H. S. Me. Donald, Bell Telephone Laboratories, Inc., Holmdel, N. J. 07733;
_10 Глава 1 \.2. Обзор систем связи Поскольку сигналы в значительной степени определяют струк- структуру систем связи, обработка сигналов в этих системах играет важную роль. Чтобы избежать искажений и перекрестных помех при уплотнении множества сигналов в высокоскоростной цифровой линии связи или в широкополосном аналоговом радиоканале, сиг- сигналы необходимо тщательно отфильтровывать. Телефонные номе- номера передаются между крупными телефонными станциями в виде сигналов, закодированных частотами, и многие современные теле- телефонные аппараты вместо дисковых номеронабирателей имеют час- частотную сигнализацию. При генерировании и детектировании сиг- сигналов при тастатурном наборе необходимо применять соответст- соответствующую обработку. Задача обработки широкого класса сигналов возникает также при использовании тестов для контроля работо- работоспособности аппаратуры и обнаружения неисправностей. 1.3. Цифровая передача Поскольку обрабатывать сигналы необходимо во всем комплек- комплексе системы связи, происходит все большее внедрение цифровой техники в большинство подсистем этого комплекса [1]. Сдвиг в сторону цифровой техники произошел в начале 60-х годов, когда было показано, что по паре медных проводов диаметром ~ 0,64 мм можно передавать информацию со скоростью 1,5 Мбит/с на рас- расстояние ~2000 м без существенных ошибок. Расстояние в 2000 м оказалось как раз той дистанцией, на которой в линии устанавли- устанавливались нагрузочные индуктивности для компенсации завала уров- уровня сигнала на высоких частотах, вызываемого шунтирующей ем- емкостью. Заменяя нагрузочную катушку индуктивности активным блоком, содержащим предусилители, формирователи импульсов и выходные импульсные усилители, можно регенерировать входную импульсную последовательность и передавать ее до следующего ретранслятора. Таким образом, простая пара проводов, по которой обычно пе- передавался один телефонный разговор, может быть использована для передачи цифрового сигнала со скоростью свыше 1 Мбит/с. С учетом этого была разработана новая система передачи, изве- известная среди связистов как система с Т-несущей, позволяющая пе- передавать по единственной паре проводов в цифровом виде одно- одновременно 24 телефонных разговора со скоростью 1,544 Мбит/с. В этой системе сигнал каждого телефонного разговора дискрети- зуется 8000 раз в секунду и каждая выборка квантуется для после- последующей передачи в виде цифры в двоичном коде. Такой процесс называется импульсно-кодовой модуляцией. В этом случае каж- каждое двоичное число представляет собой значение амплитуды на- напряжения (тока) аналогового сигнала в определенный момент.
Применение ЦОС в системах связи ГУ- Рис. 1.1. Ретранслятор системы Т1 на интегральных схемах. В системе с Т-несущей используется ИКМ, известная как ju-255 сжатая (или логарифмическая) ИКМ [2], поскольку каждое чис- число представляет (приблизительно) логарифм мгновенного значе- значения амплитуды сигнала. Чтобы обеспечить желаемое отношение сигнал/шум, при ИКМ такого типа для представления слова тре- требуется только 8 бит вместо 13 бит при обычной линейной ИКМ. Экономические преимущества этих ИКМ-систем настолько ве- велики, что после их появления в 1961 г. наблюдается 40%-ный го- годовой рост их числа в течение целого десятилетия 1965—1975 гг. В настоящее время работают телефонные линии с цифровой несу- несущей суммарной длиной свыше 100 млн. км. На рис. 1.1 показана фотография телефонного ретранслятора ИКМ-системы со скоро- скоростью передачи 1,544 Мбит/с. В будущем цифровая техника будет применяться во многих системах передачи сигналов [3j. Поскольку эфир все больше я больше заполняется сигналами, для увеличения объема радиопе- радиопередач необходимо будет либо использовать все более высокие ча- частоты, либо применять системы, в которых энергия, несущая ин- информацию, передается направленно. В обоих случаях из-за прису- присущих каналам передачи свойств возникает необходимость в исполь- использовании цифровой модуляции. При применении высокочастотных радиосистем, использующих распространение радиоволн в преде- пределах прямой видимости, возникает проблема многолучевости, обус- обусловленная переотражениями радиоволн от плоских поверхностей на трассе связи. Подобный эффект наблюдается в волноводах и: оптических волокнах, поскольку энергия различных мод распрос-
|2 Глава 1 траняется в них с разными скоростями. Проблема многолучевости может быть решена при использовании цифровой модуляции, поз- позволяющей восстанавливать искаженный сигнал. К концу двадцато- двадцатого столетия, возможно, половина всех сигналов будет передавать- передаваться в цифровом виде. В настоящее время во многих крупных горо- городах, таких, как Хьюстон в шт. Техас, по меньшей мере в половине всех линий, связывающих районные станции, применяются цифро- цифровые линии с Т-несущей. Но к 1980 г. в большинстве штатов более половины линий связи будут цифровыми. 1.4. Цифровая коммутация Цифровые методы проникли и в цифровую коммутацию. В на- настоящее время в Чикаго, шт. Иллинойс, работает крупный между- междугородный коммутатор [4]. Эта коммутационная система (называе- (называемая Системой электронной коммутации № 4, или сокращенно № 4 ESS) является крупнейшим коммутатором, превосходящим по числу каналов не менее чем в 4 раза обычные междугородние коммутаторы (на 10 000 линий). Основой для создания таких круп- крупных коммутаторов служит принцип цифрового временного разде- разделения каналов (ВРК). Ограниченные размеры коммутационных матриц обычных коммутаторов препятствуют построению больших сетей. Матрица 16X16 является типичной в обычном электронном исполнении. Для очень больших сетей, где каждый из входов мо- может быть подсоединен к любому из десятков тысяч выходов, необходимо иметь многозвенную систему коммутационных матриц. При этом из-за очень большой разветвленности сетей и малых размеров матриц межзвенные соединения оказываются очень ред- редкими. Это приводит к низкой занятости и, следовательно, к ма- малой эффективности использования коммутатора. Таким образом, создание очень больших сетей объединением групп небольших коммутаторов нецелесообразно. Временное разделение решает эту дилемму, позволяя с помощью, казалось бы, небольших коммута- коммутаторов (например, 16X16) подключать одновременно до 120 сиг- сигналов к каждому из его 16 входных или выходных контактов. Та- Таким образом, для создания крупных междугородных коммутато- коммутаторов необходимо переходить к цифровым методам. Создание коммутатора на основе ВРК имеет и другие преиму- преимущества. Сигналы, поступающие в этом случае по линиям в ком- коммутатор, не нужно преобразовывать в аналоговую форму, и для их обработки достаточно использовать буферную память, что дает ¦существенную экономию средств. Схемы цифрового контроля эхо- сигнала и цифровые приемники тональных сигналов также оказы- оказываются более дешевыми и надежными, чем их аналоговые эквива- эквиваленты. При ВРК экономятся и соединительные провода, посколь- поскольку по единственному проводу (цифровой уплотненной линии) од- одновременно передаются сотни разговоров.
Применение ЦОС в: системах связи 13 Будущие коммутаторы, по-видимому, еще больше расширят возможности систем с ВРК и позволят на основе иерархической структуры мультиплексоров одновременно с речевыми каналами передавать медленно сканирующие и управляющие сигналы. При этом по линиям телефонной сети будет происходить обмен инфор- информацией между управляющими ЭВМ и микропроцессорами, служа- служащими для сопряжения аппаратуры цифровой обработки сигналов. В будущем сигналы будут преобразовываться в цифровую фор- форму сразу же при поступлении их по кабелю в местный телефон- телефонный узел [5]. При этом к каждой паре кабелей в зависимости от типа линии — абонентской, промежуточной или специальной — бу- будет подключаться соответствующий блок сопряжения [6]. Посту- Поступающие сигналы далее должны быть пропущены через фильтр, дискретизованы и преобразованы в цифровую форму. Затем к входным — выходным основным сигналам должны быть добавлены специальные сигналы для проверки и управления различными функциями устройства сопряжения, например сигналы контроля состояния линии по постоянному току или состояния тестовых ре- реле и реле вызова [7]. Цифровой блок каждого устройства сопря- сопряжения должен быть стандартизован с тем, чтобы он подходил к любому свободному гнезду статива сопряжения. Все внутренние подключения к этому стативу должны осуществляться через циф- цифровую уплотненную линию с использованием нескольких уровней уплотнения. Многие свойства такой системы, названной «цифро- «цифровой телефонной станцией», демонстрировались в лабораторном эксперименте [5]. Этот эксперимент показал, что применительно к местной телефонной станции новая система позволит более чем в 200 раз по сравнению с существующими системами сэкономить на соединительных проводах. Цифровые системы дают возмож- возможность разработчику оптимизировать число проводов. Перспективы появления местных полностью цифровых телефонных станций в последние два десятилетия нашего столетия являются весьма мно- многообещающими. Таким образом, по техническим и экономическим соображени- соображениям [8] в системах связи постепенно переходят к цифровым мето- методам коммутации и передачи сообщений, а поскольку в связи обра- обработка сигналов играет существенную роль, цифровая обработка сигналов будет иметь важнейшее значение в будущих системах. 1.5. Цифровая обработка сигналов в передающих терминалах с импульсно-кодовой модуляцией Функции ограничения полосы частот в передающих термина- терминалах, реализуемые в настоящее время аналоговыми фильтрами, в будущем будут частично выполнять цифровые фильтры [в терми- терминалах с временным и частотным разделением каналов (ВРК и ЧРК). В терминалах с ВРК канальный блок D (цифровой) слу-
14 Глава 1 жит для прямого и обратного преобразования группы аналоговых речевых сигналов в высокоскоростной последовательный цифровой поток. В современных блоках D применяются LC- или активные RC-фильтры с частотой среза ~3,2 кГц, подавляющие любые бо- более высокие частоты, которые могли бы вызвать наложение час- частот в канале передачи (при частоте дискретизации ~8 кГц) или помехи в других парах проводов, находящихся в этом же кабеле. Кроме того, для исключения помех на частотах питающей сети в систему необходимо поставить фильтр верхних частот. Обычно фильтр верхних частот имеет второй порядок, а фильтры нижних частот являются фильтрами пятого порядка с несколькими пара- парами комплексных нулей на краю полосы. В существующих систе- системах после фильтров стоит дискретизатор, подключаемый к обще- общему ИКМ—кодирующему устройству. На рис. 1.2а показана блок- схема такого терминала. В другом варианте системы цифровой обработки [8, 35] ана- аналоговый сигнал дискретизуется с большой частотой (например, 32 кГц) и преобразуется в цифровую форму с использованием ли- линейной ИКМ или дифференциальной ИКМ (ДИКМ). При большой частоте дискретизации цифровые фильтры позволяют удалить энергию на частотах выше 3,2 кГц, а также шумы на частотах ни- ниже 200 Гц. Несмотря на это, все же необходимо ставить перед аналого-цифровым преобразователем (АЦП) простой аналоговый фильтр нижних частот. В этом случае частоту дискретизации, не опасаясь, можно уменьшить до 8 кГц отбрасыванием трех отсчетов из каждых четырех. Линейная ИКМ, необходимая для выполнения цифровой фильтрации, должна быть далее преобразована в 15-сег- ментный (х-код, используемый в ВРК-линиях. В противоположном направлении (при приеме) должна использоваться подобная циф- цифровая обработка, в результате чего код линеаризуется, увеличи- увеличивается число отсчетов методом интерполяции и получается пере- передаваемый аналоговый сигнал. Блок-схема такого цифрового бло- блока D системы показана на рис. 1.26. Цифровой вариант системы имеет следующие преимущества: 1. Мультиплексируемые цифровые фильтры будут, возможно, дешевле аналоговых при дальнейшем уменьшении стоимости ин- интегральных схем. 2. В цифровых фильтрах не возникает проблем, связанных с дрейфом нуля и с точностью подбора элементов схем. 3. За цифровым процессором, фильтрующим цифровой дискре- тизованный с большой частотой сигнал, можно поставить интер- интерполятор отсчетов, что позволит избежать необходимости синхро- синхронизации частоты дискретизации в каналах со скоростью передачи данных в линии. Другими словами, частота дискретизации может быть синхронизована с частотой обратного преобразования и тог- тогда, когда скорости передаваемых и принимаемых двоичных чисел слегка различаются.
Применение ЦОС в системах связи Схема наяала Дисирети- затор А ИМ Магистраль [Блоки других каналов) Общие схемы Общий ИКМ- повер Общий ИКМ- Зепавер Схемы защиты линии 1 Синхронизатор \ Схема срор- мирования цикла в линии • Цифро- Цифровая линия Рис. 1.2а. Цифровая система уплотнения каналов, фильтры. использующая аналоговые Г I {Блоки других паналов) I i И КМ Магистраль 1 Дискретизация с частотой — 132кГи Кодер Схема терми- терминала Цшрра- вой фильтр Преобразо- Преобразование кода Схемы зашиты линии Цифровая линия Цифро- Цифровой фильтр Интерполя- Интерполяция отсче- отсчетов Схема Фор- Формирования цикла в линии Рис. 1.26. Цифровая система уплотнения каналов, использующая цифровые фильтры.
_I6 Глава 1 ¦ 4. Использование КОДЕКов (кодер — декодер) в каждой ли- линии с последующим цифровым мультиплексором уменьшает веро- вероятность заметных межканальных помех. Недостатками цифровой системы уплотнения каналов по срав- сравнению с аналоговой являются следующие: 1: При существующей стоимости интегральных схем цифровые фильтры несколько дороже аналоговых. 2. В цифровых фильтрах нет дрейфа нуля, но всегда есть шум округления, так что для более точного представления сигнала здесь приходится использовать дополнительное число двоичных разрядов. 1.6. Цифровая обработка сигналов в передающих терминалах с частотным разделением каналов На таких телефонных станциях, как № 4 ESS, где сигналы ком- коммутируются в цифровой форме, необходимо преобразовывать в цифровой вид все аналоговые сигналы, которые должны прохо- проходить через станцию. Это относится не только к индивидуальным абонентским линиям, но и к любым линиям с частотным разделе- разделением каналов, по которым передаются к станции группы модули- модулированных аналоговых сигналов с одной боковой полосой. Очевид- Очевидный подход здесь состоит в том, чтобы демодулировать сигналы с одной боковой полосой обычным методом и затем обрабатывать их так же, как сигналы индивидуальных абонентских линий. Од- Однако существует возможность использования цифрового метода обработки на более высоком уровне за счет дискретизации слож- сложного сигнала до его демодуляции и последующего цифрового раз- разделения каналов. (Здесь описывается только приемная часть. Оче- Очевидно, что возможен симметричный процесс, т. е. преобразование цифровых речевых сигналов в сигналы с одной боковой полосой.) В первую очередь следует выяснить, на каком уровне системы с ЧРК нужно производить преобразование. При стандартном уп- уплотнении в телефонной линии речевые сигналы объединяются в 12-канальную группу, далее в 60-канальную супергруппу E групп) и 600-канальную сверхгруппу A0 супергрупп). Выбор уровня пре- преобразования будет зависеть от 1) относительной стоимости и труд- трудности кодирования и декодирования различных по объему паке- пакетов сигналов с одной боковой полосой, 2) относительной стоимо- стоимости цифровой обработки в каждом случае, 3) надежности, которая снижается при увеличении числа каналов, обрабатываемых одним устройством. В экспериментальной системе, созданной фирмой Bell Labora- Laboratories, для преобразования был взят наименьший пакет (т. е. 12-канальная группа), хотя другие исследователи предлагали ис- использовать 60-канальную супергруппу [9],
Применение ЦОС в системах связи 17 Аналоговый # модулятор sinBv2O00t) smBn(fc-2000)D Рис. 1.3. Получение сигнала с одной боковой полосой методом Уивера. Следующим важным вопросом является выбор алгоритма циф- цифровой обработки, который должен быть использован для разделе- разделения преобразованных в цифровую форму сигналов с одной боко- боковой полосой. Рассматривалось большое число рабочих алгоритмов [9—11]. Окончательный выбор алгоритма в значительной степе- степени будет зависеть от наиболее эффективного согласования между различными алгоритмами и уровнем технологии производства цифровых ИС ко времени создания системы. Поскольку техноло- технология ИС постоянно развивается, в настоящий момент трудно пред- предсказать окончательный вариант алгоритма. Одним из эффектив- эффективных способов, который использовался в упомянутой выше экспе- экспериментальной системе, является вариант метода модуляции/демо- модуляции/демодуляции сигналов с одной боковой полосой, впервые предложен- предложенный Уивером [12]; он иллюстрируется на рис. 1.3. Проще начать рассмотрение с аналогового варианта метода модуляции Уивера (естественно, этот метод относится к аналого- аналоговым системам, поскольку Уивер разработал его задолго до появ- появления цифровой обработки сигналов). Кроме того, наиболее удоб- удобно рассмотреть устройство сопряжения, в котором сигналы базовой полосы преобразуются в сигналы с одной боковой полосой. Как и раньше, здесь существует абсолютно симметричный обратный процесс. Предполагается, что спектр каждого речевого полосового сигнала заключен в пределах от 100 Гц до 4 кГц. Сигнал подается параллельно на два модулятора с несущими, сдвинутыми по фазе на 90° и равными средней частоте канала B кГц). Полученные спектры изображены на рис. 1.3. Эти спектры являются графическими представлениями преобразований Фурье, в которых перекрывающиеся боковые полосы показаны раздельно (без суммирования). Этот "^у^тррч»ь.тй ДриРМ.„ШЖОГя?Т п_п,^я' 2_зВд (РЕСПУБЛИКАНСКАЯ |
18 Глава 1 зать, как различные боковые полосы взаимно уничтожаются в со- соответствующих точках. Два идентичных фильтра нижних частот (ФНЧ) не пропускают энергию на частотах выше 2 кГц. На вто- втором этапе модуляции полученные ранее комбинации боковых по- полос переносятся в нужный участок спектра группы полос (стан- (стандартная группа в телефонии состоит из 12 полос по 4 кГц, зани- занимая диапазон частот от 60 до 108 кГц). Если теперь сложить два модулированных сигнала, то ненужные боковые полосы взаимно уничтожатся. Степень подавления, конечно, зависит от идентич= ности коэффициентов передачи для двух подавляемых боковых полос в двух сигнальных ветвях. Отметим, что именно поэтому трудно реализовать этот тип модуляции в системах с аналоговой обработкой сигналов. Однако стабильность и высокая степень воспроизводимости являются основными достоинствами цифровых схем, а необходи- необходимая точность в цифровом варианте модулятора Уивера может быть получена выбором соответствующей длины слова для пред- представления сигналов. Следует также отметить еще одно преимуще- преимущество метода Уивера, состоящее в том, что подавление ненужной боковой полосы происходит здесь в самом рассматриваемом кана- канале, а не в смежном, как это имеет место в других основных мето- методах получения сигналов с одной боковой полосой частот. Эта осо- особенность значительно снижает требования к степени подавления боковой полосы. При проектировании цифрового варианта модулятора Уивера, в котором стандартные ИКМ-речевые сигналы с частотой дискре- дискретизации 8 кГц преобразуются в аналоговые сигналы с одной бо- боковой полосой частот, необходимо ответить на ряд дополнитель- дополнительных вопросов. Первый вопрос касается того, какой должна быть общая частота дискретизации сигналов. Поскольку наибольшая частота всей группы сигналов равна 108 кГц, частота дискретиза- дискретизации должна бы быть по меньшей мере в два раза выше. Однако есть возможность использовать незанятый участок спектра на ча- частотах ниже 60 кГц, размещая там псевдогруппу сигнала и затем отфильтровывая первое отображение этого сигнала, которое яв- является результатом конечного цифро-аналогового преобразования (ЦАП). Легко убедиться в том, что подойдет любая частота дис- дискретизации в диапазоне от 108 кГц до 2X60=120 кГц. Однако не- необходимо учесть, что сначала в системе обрабатываются стандарт- стандартные ИКМ-сигналы, дискретизованные с частотой 8 кГц. Для упро- упрощения синхронизации предпочтительно использовать частоту дис- дискретизации, кратную 8 кГц. Окончательный выбор частоты дис- дискретизации сводится к величине 14X8 = 112 кГц. После этого можно построить цифровой модулятор Уивера, ра- работающий с частотой дискретизации 112 кГц; он аналогичен пред- представленному на рис. 1.3 с той лишь разницей, что аналоговые мо- модуляторы и фильтры заменены на цифровые. Необходимо будет,
Применение ЦОС в системах связи 19 конечно, заменить частоту дискретизации на входе с 8 кГц на 112 кГц, используя метод интерполяции отсчетов, описанный, на- например, в работе [13]. При этом, однако, сложные цифровые фильтры нижних частот должны работать на частоте дискретиза- дискретизации 112 кГц, хотя на самом деле и они, и предшествующие им мо- модуляторы с несущей 2 кГц могли бы нормально работать на ба- Частата дискре- дискретизации ЗмГц Частота дискре- дискретизации /72 кГц ЖМ- вход 'f.l Интврполяторь/ oJjjcvsmoB 20ff0)tl Выход- грулповой поло- Рис. 1.4. Цифровой модулятор Уивера. зовой входной частоте дискретизации 8 кГц. Таким образом, име- имеет смысл переходить с 8 кГц на 112 кГц сразу после ФНЧ, по- поскольку это в 14 раз снижает количество элементов, необходимых для этих фильтров. Окончательный вариант цифрового модулято- модулятора Уивера показан на рис. 1.4. Подробно эта система описана в работах [10, 14]. Грубой оценкой сложности системы цифровой обработки слу- служит число умножений в секунду и требуемая емкость памяти в Метод Уивер, 216 кГц Уивер, 112 кГц Уивер, 112 кГц Интерполяция после ФНЧ Уивер, 112 кГц Интерполяция после ФНЧ, комбинация интер- интерполяции и модуляции на выходе Число умноже- умножений в 1 с 6 048 000 3 136 000 1 088 000 640 000 Память, бит 388 388 392 400
20 Глава I битах. Полезно сравнить эти показатели для различных разраба- разрабатывавшихся вариантов описанного выше модулятора Уивера. Ни- Ниже приводятся данные, соответствующие обработке одного канала. Четвертый вариант, приводящий к дальнейшему уменьшению числа умножений, слишком сложен для краткого описания. В ос- основе метода лежит сложение 12 каналов на выходе. Операции ин- интерполяции и модуляции на выходе комбинируются таким обра- образом, что математически этот вариант напоминает алгоритм быст- быстрого преобразования Фурье. 1.7. Детектирование тональных сигналов Еще одной областью применения цифровой обработки в буду- будущих системах связи станет детектирование и генерирование то- тональных сигналов. Центральные телефонные станции передают те- телефонные номера абонентов с помощью либо импульсов постоян- постоянного тока, либо тональных сигналов. На принимающей централь- центральной станции тональные сигналы детектируются, а импульсы под- считываются с тем, чтобы узнать вызываемый номер. В цифровой центральной станции представляется наиболее экономичным ис- использование цифровых детекторов, обрабатывающих сигналы, по- поступающие в цифровой форме. При приеме импульсов номерона- номеронабирателя подходящим детектором может служить комбинация простого цифрового фильтра нижних частот третьего порядка с частотой среза ~40 Гц и детектора уровня с петлей гистерезиса. Казалось бы, детектором может служить быстродействующий компаратор без предварительной фильтрации, однако, учитывая возможности существующих контактных реле в передатчиках и наличие шумов питания в линиях связи, разработчик приходит к выводу, что для обеспечения надежной работы системы необходи- необходима цифровая фильтрация. Действительно, реле современных элек- электромеханических телефонных систем, служащие для детектирова- детектирования импульсов номеронабирателя, построены на таких элементах, как катушки индуктивности, якорь электромагнита и иногда об- обмотки задержек, и поэтому сами по себе действуют подобно филь- фильтру нижних частот третьего порядка, за которым следует детектор с петлей гистерезиса. Во многих телефонных системах для вызова абонента вместо импульсов постоянного тока используются тональные сигналы. В телефонах с тастатурным вызовом информация о набираемом номере передается на центральные телефонные станции в виде «двух из восьми возможных частот». Тональные сигналы выбира- выбираются так, что детектор позволяет почти идеально отличать их от речевых сигналов. Это позволяет избегать ошибок набора но- номера в тех случаях, когда абонент после набора одной цифры на- начинал бы говорить в трубку, а детектор воспринял бы речь как цифру. Такая особенность систем называется речевой развязкой
Применение ЦОС в системах связи 2| или защитой от имитации цифры. На рис. 1.5 показана блок-схема подобного детектора. Фильтр верхних частот на его входе не про- пропускает как шум питания (прежде всего 60 Гц), так и сигнал вы- вызова, присутствующий при приеме первой цифры номера. Отфиль- Отфильтрованный таким образом сигнал поступает далее на два полосо- полосовых режекторных фильтра, один из которых предназначен для подавления верхней группы из четырех тональных частот, а дру- другой— для подавления такой же нижней группы. Выходные сигна- сигналы с этих фильтров далее ограничиваются и поступают на две группы из четырех полосовых фильтров, которые выделяют восемь частот. Если принимаемый сигнал действительно является сигналом номеронабирателя, состоящим из суммы двух чистых тонов, то после полосовых режекторных фильтров на ограничители посту- поступят одиочастотные сигналы, а на выходе получатся колебания сим- симметричной прямоугольной формы. Если же на детекторы поступит речевой сигнал, то на входах ограничителей окажутся колебания сложной формы. В результате переходы нуля в выходных сигна- сигналах будут нерегулярными. Если пороги ограничителей подобраны так, что они всего на несколько децибел ниже ожидаемого на вы- выходе полосовых фильтров уровня сигнала прямоугольной формы, то речевой сигнал, производящий колебания сложной формы на выходах ограничителей, не вызовет превышения порога точно в двух из восьми каналов, что соответствовало бы передаче цифры. Таким образом, динамический диапазон и степень речевой развяз- развязки зависят от работы ограничителя и точности установки порога в каналах выделения тональных сигналов. Фирмой Bell Laboratories на основе программируемого процес- процессора цифровых сигналов разработан цифровой вариант тастатур- ного приемника вызовов. Процессор представляет собой мульти- мультиплексируемый 128-секционный цифровой фильтр второго порядка. Кроме того, процессор выполняет масштабирование и такие нели- нелинейные операции, как ограничение и выпрямление, задаваемые программой, которая содержит также коэффициенты для 128 сек- секций фильтра. На рис. 1.6 показана блок-схема одной секции второ- второго порядка этого процессора. Поскольку для построения тастатур- ного приемника вызовов необходимо иметь лишь 24 из имеющих- имеющихся 128 секций, процессор позволяет создать пять таких приемни- приемников одновременно. На рис. 1.5 рядом с названиями секций фильт- фильтра второго порядка в кружках указаны номера этих секций. Эта схема является еще одной иллюстрацией гибкости и возможностей мультиплексирования. Цифровой вариант детектора отличается от аналогового осо- особенно в отношении работы ограничителя и стабильности порога. Наиболее критичным моментом является, видимо, регулировка уровня порога в схеме, следующей за детекторами тональных сиг- сигналов. Слишком низкий порог уменьшает степень речевой развяз-
Вход 9ВЧ ТВЧ Полосовой режентор ный дзильтр Полосовой рижеятор- ш/а фильтр Полосовой режектор- ный фильтр Щ Промежуточ- Промежуточная память Промежуточная память Полосовой режентор- нып фильтр Полосовой режентор- ный фильтр Полосовой реже/гтор- ный /рильтр Промежуточ- Промежуточная память Полосовой фильтр 1209Гц Полосовой фильтр 1336Гц Полосовой фильтр 1477 Гц Полосовой фильтр 1633 Гц Полосовой фильтр 697 Гц Полосовой рилшр 770 Гц Полосовой фильтр 852Гц Чолосовой фильтр 941 Гц <РНЧ 9НЧ ТНЧ ТНЧ A1) из) VH4 <РНЧ B4) Рис. 1.5. Блок-схема тастатурного приемника, использующего для цифрового фильтра второго порядка 24 секции процессо- процессора. (Каждый пронумерованный квадрат представляет один такт процесса второго порядка. Частота дискретизации равна 8 кГц.)
Применение ЦОС в системах связи 23 Предыдущая сепиия К следующей селции Управля- Управляющая память Прямой цифровсги сигнал Полупв- риодмыи выпрями- выпрямитель Рис. 1.6. Блок-схема программируемого процессора цифровых сигналов, содержа- содержащего мультиплексируемый цифровой фильтр второго порядка. ки. Слишком высокий порог приводит к уменьшению ширины по- полосы фильтров, выделяющих тональные сигналы, и, следовательно, увеличивает чувствительность к частоте сигнала или к смещению частотной характеристики. В цифровом приемнике вызовов нет ни дрейфа уровня порога, ни смещения частотной характеристики, поскольку цифровые вычисления выполняются точно и аккуратно. Динамический диапазон ограничителя зависит от качества анало- аналого-цифрового преобразователя в системе, поскольку ограничение состоит всего лишь в выборе знакового разряда. Системы, выпол- выполненные в цифровом виде, являются, как правило, исключительно стабильными и точными. 1.8. Искажения из-за наложения частот, влияние нелинейности Системы, выполненные в цифровом виде, имеют, однако, и свои недостатки, которых нет в подобных аналоговых системах. Нели-
24 Глава 1 нейные операции в системах с дискретными данными могут вызы- вызывать появление новых спектральных составляющих подобно тому, как это происходит в аналоговых системах. Но в системах с дис- дискретными данными наблюдаются отображения новых спектраль- спектральных составляющих, расположенные симметрично относительно ча- частоты дискретизации. Если новые частоты превышают половину частоты дискретизации, они оказываются расположенными в ос- основной полосе. Например, такие нелинейные элементы, как огра- ограничитель или двухполупериодный выпрямитель, будут создавать но- новые спектральные составляющие, являющиеся гармониками перио- периодического входного сигнала. В тастатурном приемнике вызовов ограничитель вызывает появление пятой и седьмой гармоник F680 и 9352 Гц) тонального сигнала на частоте 1336 Гц, которые из-за наложения частот (при частоте дискретизации 8 кГц) при- приводят к появлению составляющих на частотах 1320 и 1352 Гц. В результате сложения этих составляющих с исходным сигналом на частоте 1336 Гц последний оказывается модулированным по амплитуде с частотой модуляции 16 Гц и глубиной модуляции ~17%. Для того чтобы порог в приемнике по-прежнему удовлет- удовлетворял требованиям к речевой развязке и ширине полосы фильтра, он должен быть уменьшен в этом канале на 1,4 децибел. Искажения из-за паразитной модуляции, вызванной нелиней- нелинейными операциями над отсчетами, присущи всем системам с диск- дискретными данными, и поэтому очень важно понимать их природу, особенно при разработке детекторов. Эти эффекты, названные искажениями из-за наложения частот, очень важно учитывать в детекторах систем связи, где сигналы имеют обычно частоты, близ- близкие к частоте Найквиста (половина частоты дискретизации), и поэтому их гармоники часто выходят за пределы полосы. Алгоритм детектирования хорошо известных и часто используе- используемых в терминалах ЭВМ ЧМ-сигналов (с частотной манипуляцией) типа 103—113 показывает, каким образом можно избежать описан- описанных искажений. Сигналы типа 103—113 обеспечивают двусторон- двустороннюю связь (полный дуплекс): при этом верхняя пара частот B025 и 2225 Гц) применяется для связи в одном направлении, а нижняя пара частот A070 и 1270 Гц)—-для связи в другом направ- направлении. Детектирование частоты 2025 Гц вызывает затруднения в свя- связи с тем, что ее четвертая гармоника (8100 Гц) отстоит от часто- частоты дискретизации 8 кГц всего на 100 Гц. Если на вход детектора (рис. 1.7), состоящего из пары полосовых фильтров, двухполупе- риодного выпрямителя, схемы вычитания и фильтра нижних час- частот, подается синусоидальное колебание с частотой 2025 Гц, то постоянное напряжение на выходе фильтра нижних частот будет иметь пульсации величиной 50% на частоте 100 Гц. На выходе двухполупериодного выпрямителя постоянное напряжение имеет пульсации величиной 13,3%, вызванные эффектом наложения чет-
Применение ЦОС в 'системах связи 25 вертой гармоники, но операция вычитания в дискриминаторе уменьшает постоянную составляющую, так что пульсации возра- возрастают до 57%. Это делает данный цифровой вариант детектора очень чувствительным к уровню порога и, следовательно, непри- неприемлемым. Второй тип детектора ЧМ-сигналов основан на методе подсче- подсчета числа пересечений нуля, при каждом из которых генерируется Вход Полосовой (рильтр(Л<Р) 1в00-2ШГц Полосовой рильтр 2025Гц Полосовой, фильтр 2225 Гц Пульсации величиной /3,3% с частотой /ООГи Схема 1 вычитаниях И Поро- Пороговая схема Пульсации величиной свыше 50°/о с частотой 1ООП( Рис. 1.7. Построенный на дискриминаторе детектор ЧМ-сигналов, иллюстрирую- иллюстрирующий эффект искажения из-за наложения частот. импульс стандартной величины. Эти импульсы усредняются фильтром нижних частот и далее ограничиваются на определен- определенном уровне (/т = 2125 Гц), в результате чего получаются метки паузы или посылки. Блок-схема такого детектора показана на рис. 1.8. Появившаяся после ограничения гармоника на частоте ~8100 Гц дает на выходе фильтра нижних частот в результате эффекта наложения частот относительно частоты дискретизации 8000 Гц, как и в первой схеме, пульсации с частотой 100 Гц. До- Дополнительная нелинейность, связанная с формированием импуль- импульсов, затрудняет вычисление величины пульсаций после ограничите- ограничителя методом Фурье-анализа. Однако такой расчет можно гораздо проще выполнить во временной области. На частоте 2025 Гц на выходе ограничителя пересечения нуля происходят каждые 494 мкс, и если период дискретизации равен 125 мкс, то на каждый период должно было бы быть 3,95 отсчета. В действительности большую часть времени на один период приходится четыре отсчета, но иног- иногда—-только три. Такие периоды с тремя отсчетами следуют через Vioo с и вызывают изменение максимума сигнала на входе филь- фильтра нижних частот на 25%. Этот дополнительный модулирующий сигнал затрудняет детектирование, и, следовательно, такой алго- алгоритм для детектирования ЧМ-сигналов также не годится. Существует, однако, еще один способ детектирования ЧМ-сиг- ЧМ-сигналов с применением элемента задержки сигнала и умножите- умножителя-демодулятора; схема детектора показана на рис. 1.9. Если за- задержка подобрана так, что является нечетно кратной 90° на цент- центральной частоте B125 Гц), лежащей посредине между частотами посылки и паузы, то сглаженное произведение входного и задер-
26 Глава 1 жанного сигналов будет положительным для частоты посылок и отрицательным для частоты пауз. Известно, что задержка диск- дискретных сигналов обеспечивается простым запоминанием отсчетов; фазовый сдвиг на 95,6° на частоте 2125 Гц достигается запомина- запоминанием только одного отсчета. Фазовый сдвиг на 5,6°, необходимый для выравнивания фазы до 90° на частоте 2125 Гц, легко получить 1 Полосовой фильтр 38OD-2400Гц Ограни- Ограничитель Гене- Генератор им- импульсов f ТНЧ Поро- Пороговая схема I/O 1 Пульсации величиной 25°/ё Рис. 1.8. Основанный на методе подсчета пересечений нуля и сглаживании детек- детектор ЧМ-сигналов, иллюстрирующий эффекты искажения из-за наложения частот. с помощью однозвенного фильтра верхних частот, поставленного на втором входе умножителя-демодулятора. Умножитель-демодулятор является нелинейным устройством и, следовательно, источником новых спектральных составляющих, ко- которые могут попасть в основную полосу за счет эффекта наложе- наложения частот и создать помехи при детектировании. Однако произ- произведение синусоидального сигнала и этого же, но задержанного сиг- сигнала порождает лишь вторую гармонику, которая в случае ЧМ-сигнала находится в пределах от 4050 до 4430 Гц, что при на- наложении частот дает соответственно 3950 и 3550 Гц. Эти гарМОНИ- Поло- Полосовой фильтр 9ВЧ 5,6° на частоте 2125Гц Задержка 12i~M/tc Умножитель, демодулятор Лоло- совай фильтр Поро- Пороговая схема I/O Рис. 1.9. Детектор ЧМ-сигналов на основе умножителя-демодулятора, не внося- вносящий искажений сигнала за счет наложения частот. ки удаляются фильтром нижних частот, поставленным до огра- ограничителя, и поэтому не оказывают влияния на детектирование. Для детектора с умножителем требуется обеспечить больший ди- динамический диапазон ограничителя, чем для детекторов с ограни- ограничителем или с выпрямителем, поскольку в данном алгоритме из- изменение входного сигнала на 15 дБ вызовет изменение сигнала на выходе умножителя-демодулятора на 30 дБ. К счастью, увеличе- увеличение динамического диапазона в цифровой системе достигается
Применение ЦОС в системах^связи 27 достаточно просто и дешево добавлением дополнительных разря- разрядов к базовой длине слова. Таким образом, этот алгоритм детек- детектирования является вполне подходящим для построения цифрово- цифрового детектора. 1.9. Контроль эхо-сигналов Еще одной возможной областью применения цифровой обра- обработки сигналов в телефонии является контроль эхо-сигналов в протяженных линиях передачи. Для экономии линия абонента (т. е. та часть телефонной сети, которая служит для подсоедине- подсоединения каждого абонента к его центральной телефонной станции) де- делается двухпроводной (т. е. и приходящий, и уходящий сигналы переносятся одной и той же парой проводов). Это достигается за счет того, что телефонный аппарат абонента, соединительная па- пара проводов и оконечное устройство (гибридная катушка) в теле- телефонной станции образуют сбалансированную мостовую схему, в которой гибридная катушка в точке преобразования двухпровод- двухпроводной линии в четырехпроводную позволяет разделять сигналы, про- ходкщие в противоположных направлениях (рис. 1.10). В идеаль- идеальном случае это разделение можно осуществить с большой степенью точности. В действительности, однако, экономически не- невыгодно подбирать на центральной телефонной станции для каж- каждого абонента свою гибридную катушку. Но так как абонентские линии имеют отличающиеся импедансы, то вышеупомянутая мо- Лриходящип сигнал Гибридная. jtamyiuna Уходящий сигнал Аппарат абонента Центральная станция Рис. 1.10. Преобразование двухпроводной линии в четырехпроводную. стовая схема часто может быть существенно разбалансированной, что приводит к отражению заметной части передаваемого сигнала и возвращению его к говорящему в виде эхо-сигнала. Для теле- телефонных разговоров на расстояниях до нескольких сотен километ- километров задержка отраженного сигнала составляет лишь несколько миллисекунд, и, как показывает опыт, влияние даже больших эхо-
28 Глава 1 Трансвереальный фильтр Аппарат абонента Эхо- подавитель Центральная теле/ранная станция Рис. 1.11. Эхо-подавитель. сигналов при таких задержках ¦ несущественно. Для более протя- протяженных линий и особенно линий связи через спутники, в которых задержка может достигать нескольких сотен миллисекунд, влияние эхо-сигнала является очень заметным. Для линий длиной в несколько тысяч километров (задержка в несколько десятков миллисекунд) проблему эхо-сигнала решают с помощью устройств, известных как эхо-заградитель. Эхо-загра- Эхо-заградитель ставят в такое место схемы, где есть доступ к обоим на- направлениям передачи сигнала. Он находит в каждый момент вре- времени направление, в котором идет передача, и устанавливает за- затухание для противоположного (незанятого) направления, преры- прерывая таким образом обратный путь и подавляя (или значительно ослабляя) эхо-сигнал. Однако необходимо понимать, что этот ме- метод контроля эхо-сигнала вносит свои собственные искажения в передачу, а именно создает прерывания речи в моменты, когда разговор идет в обоих направлениях одновременно. Тем не менее эхо-заградители представляют приемлемое решение проблемы эхо-сигналов для географической территории с размерами конти- континентальных Соединенных Штатов. Возрастающая величина задержки для более протяженных ли- линий осложняет задачу подавления эхо-сигнала и требует приме- применения для этого более сложных методов. Наиболее перспективное решение этой задачи связывают с применением эхо-подавителей. Схема такого устройства изображена на рис. 1.11. В его основе лежит.трансвереальный фильтр с конечной импульсной характери- характеристикой, (КИХ), включенный, как показано, между двумя линиями передачи. Приходящий сигнал используется у этого фильтра как входной^ а весовые коэффициенты на его отводах подбираются так, чтобы получить как можно более близкую копию сигнала, прошед- прошедшего- через гибридную катушку. Эхо-подавители можно строить и
Применение ЦОС в системах связи * 29 на аналоговых элементах, однако цифровой вариант гораздо более привлекателен, поскольку он обеспечивает высокую стабильность, точность установки весовых коэффициентов (к тому же быстро подбираемых) и, кроме того, цифровая схема может использовать- использоваться одновременно для многих линий благодаря временному разде- разделению каналов. Но эхо-подавитель, будь он аналоговым или цифровым, являет- является достаточно дорогим устройством, так что его невыгодно ста- ставить на каждую абонентскую линию. Поскольку количество вызо- вызовов, связанных с большими задержками отраженного сигнала и требующих применения эхо-подавителей, относительно невелико в общем количестве вызовов, то каждый эхо-подавитель сможет обслуживать большое количество абонентов по их требованию. А это означает в свою очередь, что трансверсальный фильтр эхо- подавителя должен быть достаточно сложным (т. е. иметь доста- достаточное число отводов), чтобы охватить все множество передаточ- передаточных функций системы с гибридной катушкой. Точная оценка не- необходимой сложности фильтра еще не получена, однако можно полагать, что для подавления эхо-сигнала на 35—40 дБ, что необ- необходимо для нормальной работы линии, потребуется трансверсаль- трансверсальный фильтр с 200 отводами и точностью весовых коэффициентов, обеспечиваемой 10 разрядами. Оценка количества отводов сдела- сделана в предположении, что эхо-подавитель размещен так, что позво- позволяет обслуживать много абонентов и все же находится не очень далеко (в пределах нескольких сотен километров) от места преоб- преобразования двухпроводной линии в четырехпроводную. В противном случае число отводов, часть из которых должна использоваться для компенсации задержки на участке от эхо-подавителя до гиб- гибридной катушки, будет недопустимо велико. Из этого также сле- следует, что необходимо иметь два эхо-подавителя, по одному у каж- каждого конца телефонной линии, связывающей двух абонентов. Описываемый эхо-подавителв должен обладать способностью быстро перестраивать значения весовых коэффициентов (за вре- время порядка нескольких сотен миллисекунд) всякий раз, когда ус- устанавливается новый переговорный маршрут, используя лишь те сигналы, которые имеются в это время в линии. Требование нали- наличия специального .начального тренировочного периода усложнило бы существующую, протяженную телефонную сеть и, более того, не позволило бы эхо-подавителю отслеживать медленные измене- изменения, происходящие в линии во время переговора. К счастью, суще- существует метод быстрой настройки весовых коэффициентов примени- применительно к рассматриваемому случаю; это впервые описанный Сонд- хи [15] адаптивный алгоритм. В основе метода лежит расчет текущей функции корреляции между приходящим и уходящим сигналами (рис. 1.11) и последовательное изменение значений весо- весовых коэффициентов фильтра таким образом, чтобы получался ми- минимум среднеквадратичного значения функции взаимной
30 Глава 1 __ ляции. Эта адаптивная схема напоминает схемы, которые исполь- использовал Лакки [16] для установки отводов адаптивных выравнива- выравнивателей при передаче данных. К сожалению, этот адаптивный алгоритм можно использовать только при наличии приходящего сигнала и отсутствии уходящего сигналов (но не его эхо-сигнала). Энергия сигнала от близкого абонента оказывает сильное влияние на работу алгоритма и часто может вызывать существенное отклонение весовых коэффициентов фильтра от их оптимальных значений. Наиболее простое решение этой проблемы состоит в отключении схемы настройки коэффици- коэффициентов и замораживании последних на время присутствия сигна- сигналов от близких источников. Это предопределяет необходимость быстрого распознавания сигналов, которые коррелированы, воз- возможно, очень сложным образом с приходящим сигналом, и некор- некоррелированных с ним сигналов. Задача эта не простая, поскольку информация о сигнале от близкого источника на эхо-подавителе обычно отсутствует. Предложен ряд перспективных решений за- задачи, однако вопрос этот все еще активно исследуется. 1.10. Особенности разработки элементов аппаратуры систем с цифровой обработкой сигналов Приведенные в этой главе примеры взяты из областей приме- применения систем с речевыми сигналами. Здесь нет примеров примене- применения методов цифровой обработки в системах с видео- и частотно- модулированными сигналами. Такой выбор областей применений обусловлен несколькими причинами. Во-первых, возможности при- применения цифровой обработки в системах с речевыми сигналами шире, что объясняется самой природой систем связи. Во-вторых, благодаря сравнительно узкой ширине полосы обрабатываемых сигналов по отношению к быстродействию существующих инте- интегральных схем применяемый синхронизатор, управляющий процес- процессором, может иметь быстродействие в несколько тысяч раз выше частоты дискретизации в каждом канале. Однако необходимость мультиплексной передачи нескольких тысяч каналов редко возни- возникает в телефонной сети, и большие возможности применения муль- мультиплексирования здесь ограничены. К счастью, это противоречие не приводит к дилемме, потому что системы с последовательной передачей данных (в противоположность системам с параллель- параллельной передачей данных) позволяют за счет увеличения числа так- тактов на операцию существенно уменьшить потребляемую мощность и количество схем в арифметическом устройстве [17]. По указан- указанным выше причинам в центре обсуждения аппаратной части сис- систем будут процессоры с высокой степенью мультиплексирования (с числом каналов от 32 до 128), которые обычно выполняются с использованием последовательной арифметики [18].
Применение ЦОС в системах связи 31 1.10.1. Выбор структуры систем При проектировании системы для обработки сигнала в первую очередь концентрируют внимание на создании цифрового фильтра, поскольку значительная часть всей аппаратуры, в том числе ариф- арифметические и запоминающие устройства, предназначена для вы- выполнения фильтрации при обработке сигнала. Для реализации нелинейных процессов, как правило, требуется более простая ап- аппаратура, чем для выполнения функций умножения и задержки элементами цифровых фильтров. В детекторах, входящих в состав демодуляторов ЧМ-сигналов, операции ограничения, двухполупе- риодного выпрямления или умножения с демодуляцией реализуют- реализуются на основе части вентилей, используемых при построении циф- цифровых фильтров. Существует несколько возможных структур цифровых фильт- фильтров (последовательная, параллельная, в прямой форме и др.). Вы- Выбор структуры зависит от параметров фильтра, типа разрабаты- разрабатываемого арифметического устройства (АУ), а также от предпочи- предпочитаемого типа управления или программирования. В случае фикси- фиксированного набора идентичных секций фильтра, как это было, на- например, в системе уплотнения ИКМ-каналов, перспективным может оказаться последовательное соединение секций второго по- порядка с умножителями на основе постоянных запоминающих уст- устройств (ПЗУ) [19, 20]. Поскольку операция фильтрации имеет итеративный характер, т. е. коэффициенты фильтра не меняются, то арифметические операции можно свести к вычислению с по- помощью ПЗУ сумм произведений на каждую секцию второго по- порядка. На первый взгляд может показаться, что фильтры высокого порядка лучше всего реализовать в прямой форме, поскольку вы- вычисление с помощью ПЗУ суммы четырех или пяти произведений оказывается даже более эффективным, чем для трех слагаемых. Однако для большинства цифровых фильтров, имеющих большой коэффициент усиления и порядок выше третьего, прямая форма реализации при соответствующих начальных условиях может под- поддерживать колебания предельного цикла с большой амплитудой даже при арифметике с насыщением [21]. Большое усиление мо- может быть связано как с полюсами, имеющими высокую доброт- добротность Q, так и с полюсами, расположенными вблизи частоты дис- дискретизации. Для многих систем, в которых начальные условия, не- необходимые для колебаний предельного цикла, образуются при включении питания, такой фильтр будет неприемлем. Если нет необходимости иметь множество идентичных фильт- фильтров, а нужен один программируемый фильтр, как, например, в контрольно-измерительной аппаратуре, следует использовать ум- умножитель с двумя входами. Из всех существующих структур для программируемых фильтров лучше всего подходит последователь-
32 Гшва 1 ное соединение секций второго порядка.; Например, в терминалах для сигналов с одной боковой полосой используются как рекурсив- рекурсивные секции второго порядка, так и трансверсальные фильтры с ко- конечной импульсной характеристикой. В этом примере в пользу вы- выбора трансверсального фильтра говорит и то, что 13 из каждых 14 входных отсчетов равны нулю. Вообще же опыт показывает, что КИХ-фильтры в основном найдут применение в тех случаях, ког- когда желательно иметь возможность изменять частоту дискретиза- дискретизации с целью упрощения схемы [22]. Последовательная структура из секций второго порядка не при- пригодна еще в ряде случаев. Так, если секция имеет полюсы с очень высокой Q (для обеспечения крутых срезов) или частота полюса очень мала, усиление каждой секции второго порядка может быть очень большим. В одном примере в качестве ФНЧ для фор- формирования импульсов набора номера использовался ФНЧ второго порядка с полосой 40 Гц, работающий с частотой дискретизации 32 кГц и имеющий усиление свыше 15 600, или около 14 бит. Та- Таким образом, при длине входного слова 16 бит выходное слово может иметь только 2 бит A6—14)! Чтобы избежать такого гру- грубого квантования на выходе, была выбрана структура, в которой масштабирование при фильтрации происходит после каждой сек- секции первого порядка (т. е. эта структура является парой связан- связанных секций первого порядка). В примере с фильтром для им- импульсов набора номера каждый каскад имеет усиление до 7 бит, так что выходной сигнал может иметь 9 бит вместо 2 бит. Масштабирование, используемое для предохранения от неже- нежелательного грубого квантования сигнала, является важным аспек- аспектом построения цифрового фильтра [23—25]. Оно связано с вы- выбором длины слова данных и со структурой, как это видно из предыдущего примера. Хотя масштабирование и не влияет на ха- характеристики фильтра, именно оно главным образом определяет от- отношение сигнал/шум фильтра и шумовые параметры этого же незанятого канала. Родственной проблемой является распределение членов с нуля- нулями и полюсами по различным каскадам фильтра. Имеется ряд публикаций по этому вопросу [25—32], где отыскиваются распре- распределения, обеспечивающие минимальный шум, и читатель может их изучить по этим работам. Определение порядка каждой секции является важным шагом при создании фильтра, и непродуманный выбор порядка может привести к потере большого числа двоич- двоичных единиц, определяющих точность представления сигнала. Существует и ряд других структур для реализации фильтра. Секции второго порядка могут быть соединены параллельно, по- последовательно-параллельно или в других комбинациях, при кото- которых все коэффициенты оказываются действительными. Однако, по всей видимости, нет каких-либо больших преимуществ у всех дру- других способов соединения секций второго порядка перед последо-
Применение ЦОС в системах связи 33 вательным. Есть еще волновая структура [33, 34], которую реко- рекомендуют для применения из-за низкой чувствительности к точно- точности представления коэффициентов. Однако на практике волновая структура имеет ограниченное применение, поскольку фильтры на ее основе трудно мультиплексировать. 1.10.2. Чувствительность к точности представления коэффициентов Вопросы, связанные с чувствительностью к точности представ- представления коэффициентов, оказываются не столь важными для фильт- фильтров, описанных в качестве примеров в этой главе. Как правило, длина информационного слова, выбранная из условия обеспече- обеспечения необходимого отношения сигнал/шум и уровня шумов в неза- незанятом канале на выходе системы, превышает длину коэффициен- коэффициентов, требуемую для обеспечения желаемой точности воспроизве- воспроизведения характеристик фильтра. Например, для фильтров нижних частот в описанных ИКМ-терминалах требовалась точность пред- представления коэффициентов словами в 8 бит, чтобы обеспечить от- отклонение частотной характеристики от идеальной в пределах ±0,2 дБ. 1.10.3. Разработка цифровых систем с помощью ЭВМ Перед разработчиком системы цифровой обработки стоит за- задача выбора множества решений, касающихся частот дискретиза- дискретизации, длин слов, структур, типов логики, распределения вентилей арифметических устройств для необходимых схем памяти [18, 35]. Однако найти наилучшее решение не слишком трудно, по- поскольку цифровая система может быть очень точно смоделирована на цифровой вычислительной машине. Действительно, моделирова- моделирование позволяет точно предсказать, как будет работать каждый ва- вариант разрабатываемой системы. При наличии хороших программ для разработки системы и ее испытаний наряду с хорошими моде- моделирующими программами цифровая система может быть изготов- изготовлена с малыми расходами на разработку и высокой гарантией ка- качества. Использование ЭВМ является ключевым моментом для повышения качества разработки цифрового процессора, и вполне естественно, что хорошая разработка дает хорошую систему. 1.11. Некоторые применения программируемого процессора цифровых сигналов Гибкость программируемого процессора цифровых сигналов, который можно настроить на выполнение целого ряда задач, поз- позволяет эффективно использовать его в контрольно-измерительной ¦аппаратуре для систем связи. Одно такое программируемое уст- устройство позволяет проводить все испытания аппаратуры связи,
34 Глава 1 для выполнения которых в настоящее время используется свыше десятка различных контрольно-измерительных приборов. Кроме того, оно может служить в качестве терминала, обеспечивающего доступ к универсальной ЭВМ для получения дополнительной ин- информации, записи результатов испытаний и поиска неисправностей. Процессор цифровых сигналов, показанный в виде блок-схемы на рис. 1.6, запрограммирован для выполнения функций таких устройств, как: 1) измеритель шума; 2) прецезионный генератор тональных сигналов; 3) генератор последовательностей тональных сигналов для ис- испытания приемников этих сигналов; 4) свип-генератор; 5) приемник вызовов при тастатурном наборе; 6) тональный приемник средних частот; 7) измеритель и фильтр тона звонка; 8) генератор наборов сигналов; 9) импульсный генератор шума; 10) схема для измерения импеданса; 11) синтезатор речи; 12) генератор музыки [36, 37]. Этот список будет постоянно расширяться, поскольку возмож- возможности программируемого процессора исключительно большие. До- Дополняя фильтр схемами обычного (Процессора, такими, на которых построен микропроцессор, можно быстрые сложные операции с от- отдельными отсчетами проводить в специализированном арифмети- арифметическом устройстве, а последовательный контроль и видоизменения этапов испытаний выполнять как обычные операции ЭВМ. На рис. 1.12 показана фотография специализированного арифметиче- арифметического устройства, выполняющего в 1 секунду 1 024 000 вычислений в секции второго порядка. Это устройство предназначено для не- непосредственного подключения к магистрали памяти имеющихся в продаже микропроцессорных систем. Процессор был разработан X. Г. Эллисом, специалистом фирмы Bell Laboratories. Представьте себе небольшой чемодан типа «дипломат», в ко- который помещены показанные на рис. 1.13 небольшая электронно- электроннолучевая трубка (ЭЛТ) в качестве дисплея, панель управления, небольшой кассетный магнитофон и ряд выводов, подсоединяемых к испытываемому оборудованию. Такая система может выполнять ряд важных задач гораздо лучше оператора, использующего обыч- обычные приборы. Хорошим примером такой задачи является баланси- балансировка гибридной катушки при преобразовании двухпроводной ли- линии в четырехпроводную. В настоящее время балансировка осуще- осуществляется настройкой магазина емкостей до момента получения минимума отраженного сигнала на одной частоте. Программируе- Программируемая система позволяет измерять отраженный сигнал за несколько секунд на многих частотах и безошибочно определять оптимальное
Применение ЦОС в системах связи 35 фильтра в секции ЩП,ЦАП, сопря- сопряжения Q Панель управления ~) Программирг/я- Микро- Микропроцессор Кассетный •магнитофон Рис. 1.13. Л^граммируемый контрольно-измерительный прибор.
36 Глава 1 значение емкости. Кроме того, могут быть проверены такие пара- параметры, как помехи сети, шумы, пределы импедансов. Для прове- проведения новых видов испытаний аппаратуры другого типа достаточно лишь изменить программу. Система позволяет проводить авто- автокалибровку. Работа такой системы демонстрировалась в лабора- лаборатории. Поскольку стоимость БИС, ориентированных на примене- применение в терминалах, снижается, появление таких серийных систем — лишь вопрос времени. 1.12. Заключение Тенденция увеличения числа цифровых линий передачи и циф- цифрового коммутационного оборудования в системах связи открыла много новых возможностей для цифровой обработки сигналов. Цифровые системы имеют такие необходимые показатели, как малые габариты и потребляемая мощность, помехоустойчивость, повышенная надежность и уменьшенное число элементов и соеди- соединительных проводов. В этой главе были кратко описаны некоторые возможные применения цифровой обработки сигналов в системах связи, а именно в передающих терминалах с ИКМ. и ЧРК, при детектировании тональных сигналов и при контроле эхо-сигналов. Подробно обсуждались особенности разработки и применения мультиплексируемого программируемого процессора цифровых сигналов. В связи с ускоряющейся разработкой БИС, а теперь и микро- микропроцессоров, можно ожидать, что они появятся в составе оборудо- оборудования систем связи в 80-х годах. ЛИТЕРАТУРА 1. Danielson W. E., Exchange Area and Local Loop Transmission, Bell Lab. Re- Record, 53, 1, 40—49 A975). 2. Kaneko H., A Unified Formulation of Segment Companding Laws and Synthe- Synthesis of Codecs and Digital Compandors, Bell System Tech. L, 49, 7, 1555—1588 A970). 3. O'Neill E. F., Radio and Long Haul Transmission, Bell Lab. Record, 53, 1, 50—59 A975). 4. Vaughan H. E., An Introduction to No. 4 ESS, Proc. 1972 Intern. Switching Symp., Cambridge, Mass., 1972, pp. 19—25. 5. McDonald H. S., An Experimental Digital Local System, Proc. 1974 Intern. Switching Symp., Munich, Germany, 1974, pp. 212.1—212.5. 6. Condon J. H., Breece H. Т., Ill, Low Cost Analog-Digital Interface for Telepho- Telephone Switching, Proc. 1974 Intern. Conf. on Comm., Minneapolis, Minn., 1974, pp. 13.B.1—13.B.4. 7. Alles H. G., Condon J. H., Fischer W. C, McDonald H. S., Digital Signal Pro- Processing in Telephone Switching, Proc. 1974 Intern. Conf. on Comm., Minneapo- Minneapolis, Minn., 1974, pp. 18.E.1—18.E.2. 8. McDonald H. S., Impact of Large-Scale Integrated Circuits on Communications Equipment, Proc. Natl. Electron. Conf., 24, 569—572 A968). 9. Bellanger M. G., Daguet J. L., TDM-FDM Transmultiplexer: Digital Polyphase and FFT, IEEE Trans. Comm. Tech., COM-22, 9, 1199—1205 A974).
Применение ЦОС в системах связи 37 10. Freeny S. L, Kieburtz R. В., Mina К. V:, Tewksbury S. К.; Systems Analysis of a TDM — FDM Translator/Digital A-Type Channel Bank, IEEE Trans. Comm. Tech., COM-19, 6, 1050—1059 A971). 11. Kurth С F., SSB/FDM Utilizing TDM Digital Filters, IEEE Trans. Comm. Tech., COM-19, 1, 63—71 A971). 12. Weaver D. K-, Jr., A Third Method of Generation and Detection of Single- Sideband Signals, Proc. IRE, 44, 12, 1703—1705 A956). 13. Crochiere R. E., Rabiner L. R., Optimum FIR Digital Filter Implementations for Decimation, Interpolation and Narrow Band Filtering, IEEE Trans. Acoust. Speech Signal Processing, ASSP-23, 5, 444—456 A975). 14. Freeny S. L, Kieburtz R. В., Mina K. V., Tewksbury S. K-, Design of Digital Filters for an All Digital Frequency Division Multiplex-Time Division Multiplex Translator, IEEE Trans. Circuit Theory, CT-18, 6, 702—711 A971). 15. Sondhi M. M., An Adaptive Echo Canceller, Bell System Tech. J., 46, 3, 497— 511 A967). 16. Lucky R. W., Techniques for Adaptive Equalization of Digital Communication Systems, Bell System Tech. J., 45, 255—286 A966). 17. Jackson L. В., Kaiser J. F., McDonald H. S., An Approach to the Implementa- Implementation of Digital Filters, IEEE Trans. Audio Electroacoustics, AU-16, 3, 413—421 A968); Digital Signal Processing, Rabiner and Rader, eds., IEEE Press, New York, 1972, pp. 210—218. 18. Freeny S. L, Special-Purpose Hardware for Digital Filtering, Proc. IEEE, 63, 4, 633—648 A974). [Имеется перевод: Фрини С. Л. Специализированные ап- аппаратные средства для цифровой фильтрации. — ТИИЭР, 1975, т. 63, № 4, с. 108—126.] 19. Croisier A., Esteban D. J., Levilon M. E., Riso V., Digital Filter for PCM En- Encoded Signals, U. S. Patent 37777130, Dec. 4, 1973. 20. Peled A., Liu В., A New Hardware Realization of Digital Filters, IEEE Trans. Acoust. Speech Signal Processing, ASSP-22, 6, 456—462 A974). 21. Debasis Mitra, Large Amplitude, Self-Sustained Oscillations in Difference Equations Which Describe Digital Filter Sections Using Saturation Arithmetic, IEEE Trans. Acoust. Speech Signal Processing, ASSP-25, 2, 134—143 A977). 22. Crochiere R. E., Rabiner L. R., Further Considerations in the Design of Deci- mators and Interpolators, IEEE Trans. Acoust. Speech Signal Processing, ASSP-24,4, 296—311 A976). 23. Jackson L. В., On the Interaction of Round-off Noise and Dynamic Range in Digital Filters, Bell System Tech. L, 48, 2, 159—184 A970). 24. Jackson L. В., Roundoff Noise Analysis for Fixed-Point Digital Filters Realized in Cascade or Parallel Form, IEEE Trans. Audio Electroacoustics, AU-18, 2, 107—122 A970). 25. Jackson L. В., Roundoff Noise Bounds Derived from Coefficient Sensitivities for Digital Filters, IEEE Trans. Circuits Systems, CAS-23, 8, 481—485 A976). 26. Hwang S. Y., On Optimization of Cascade Fixed-Point Digital Filters, IEEE Trans. Circuits Systems, CAS-21, 2, 163—166 A974). 27. Lee W. S., Optimization of Digital Filters for Low Roundoff Noise, IEEE Trans. Circuits Systems, CAS-21, 3, 424—431 A974). 28. Lueder E., Hug H., Wolf W., Minimizing the Roundoff Noise in Digital Filters by Dynamic Programming, Frequenz, 29, 7, 211—214 A975). 29. Liu В., Peled A., Heuristic Optimization of the Cascade Realization of Fixed Point Digital Filters, IEEE Trans. Acoust. Speech Signal Processing, ASSP-23, 5,464—473 A975). 30. Hirano K., Sakaguchi H., Liu В., Optimization of Recursive Cascade Filters, Proc. 1976 IEEE Intern. Conf. on Acoust. Speech Signal Processing, Philadel- Philadelphia, Pa., 1976, pp. 513—516. 31. Lapp T. R., Gabel R. A., An Algorithm for Optimally Ordering the Sections of a Cascade Digital Filter, Proc. 1976 IEEE Intern. Conf. on Acoust. Speech Sig- Signal Processing, Philadelphia, Pa., 1976, 517—520.
'38 Глава 1 ¦32. Steiglitz К.. Liu В., An Improved Algorithm for Ordering Poles and Zeros of Fixed-Point Recursive Digital Filters, IEEE Trans. Acoust. Speech Signal Pro- Processing, ASSP-24, 4, 341—343 A976). '-53. Fettweis A., Digital Filter Structures Related to Classical Filter Networks, Arch. Elek. Ubertragung., 25, 2, 79—89 A971). 34. Sedlmeyer A., Fettweis A., Digital Filters with True Ladder Configuration, Intern. J. Circuit Theory Appl., 1,1, 5—10 A973). 35. Heightley J. D., Partitioning of Digital Filters for Integrated Circuit Realiza- Realization, IEEE Trans. Comm. Tech., COM 19, 6, 1059—1063 A971). 36. Alles H. G., A Hardware Digital Music Synthesizer EASCON'75 Record, 1975, pp. 217A —217C. 37. Alles H. G., The Teaching Laboratory General Purpose Digital Filter Music Box, IEEE Proc. 1975 ISCAS, 1975, pp. 387—389.
Глава 2 ЦИФРОВАЯ ОБРАБОТКА ЗВУКОВЫХ СИГНАЛОВ Б. Блессер, Дж. М. 2.1. Введение К задачам звуковой техники относятся запись, хранение, пере- передача и воспроизведение сигналов, воспринимаемых людьми с по- помощью органов слуха. На практике чаще всего такими сигналами является обычная музыка, хотя к ним следует отнести также пе- пение птиц, электронную музыку, театральные представления, гидро- гидроакустические сигналы и т. д. В отличие от задач цифровой обра- обработки речевых сигналов, где основным требованием является раз- разборчивость речи, при цифровой обработке звуков в большинстве случаев должны также учитываться какие-то критерии точности воспроизведения звуков. Подобные критерии неизбежно имеют субъективный характер, так как окончательное заключение о ка- качестве звука составляется на основе восприятия сигналов слуша- слушателями. По этой причине в данной главе часто будет идти речь о человеческом восприятии, причем для специалистов по акустике одной из основных проблем является определение технических параметров звуковых сигналов, влияющих на восприятие этих зву- звуков человеком. В силу широкой распространенности и важности устройств для воспроизведения музыки большая часть работ в об- области цифровых звуковых систем связана с музыкой. Далее в этой главе музыка, преобразованная в цифровой сигнал, будет рассматриваться как представитель широкого класса сигналов, на- называемых звуковыми сигналами. С момента своего возникновения звуковая техника находилась на стыке различных отраслей науки и пользовалась достижениями химии и физики, особенно таких областей, как электроника, маг- магнетизм и акустика. Цифровая обработка сигналов, которая по своей сущности, видимо, более всего тяготеет к математике, явля- является новейшей отраслью науки, вошедшей в «звуковое семейство». Многие специалисты полагают, что это приведет к скачку в ка- качественных характеристиках звуковых систем. Хотя методы циф- цифровой обработки сигналов только начинают применяться в области звуковой техники, уже сейчас видны связанные с этим потенциаль- '> В. Blesser (Massachusetts Institute of Technology, Cambridge, Mass. 02139; J. M. Kates (Teledyne Acoustic Research, Norwood, Mass. 02062).
'40' Глава 2 ные возможности. К моменту написания книги данная область тех- техники находилась на начальной стадии своего развития; многие из наиболее сложных методов цифровой обработки пока еще не наш- нашли применения в звуковых системах. Можно не сомневаться, что iB ближайшем будущем это положение изменится. Необходимость цифровой обработки звуковых сигналов с пер- первого взгляда не очевидна. Поэтому следует проанализировать хотя бы часть тех трудностей, с которыми связано появление му- музыки в квартире слушателя. Цепочка технических устройств при прохождении звука от микрофона до акустической колонки оказы- оказывается очень длинной. В нее может быть включено до 100 само- самостоятельных систем, каждая из которых выполняет свою полезную функцию, но вносит при этом искажения. Довольно часто каждый инструмент ансамбля записывается на отдельную дорожку много- многоканального магнитофона, причем число этих каналов может дохо- доходить до 24. Такой процесс дает звукооператору большие возмож- возможности: можно, например, при необходимости заново записать пар- партию какого-либо инструмента. Это также помогает исполнителю избавиться от фонового акустического шума. Однако при такой записи звучание становится несколько неестественным и отличает- отличается от того, которое слышится при исполнении в концертном зале, поскольку в записи отсутствует реверберация и могут появиться заметные спектральные искажения, зависящие от положения мик- микрофона. Подобные недостатки часто можно устранить путем кор- коррекции сигналов при их смешивании (микшировании). Микшер- Микшерный пульт дает возможность звукооператору по-разному обраба- обрабатывать каждую дорожку первичной записи. К числу наиболее рас- распространенных методов обработки звуковых сигналов относятся введение искусственной реверберации и других специальных эф- эффектов, выравнивание спектров, сжатие динамического диапазона, подавление шумов, ограничение. По своей сложности этот процесс и выполняющие его устройства приближаются к функциям и ап- аппаратуре Центра управления космическими полетами (NASA). После того как высококвалифицированный звукооператор объ- объединит обработанные первичные сигналы во вторичную стереофо- стереофоническую или квадрафоническую запись, ее подвергают дополни- дополнительной обработке с тем, чтобы сформировать сигнал, пригодный для записи на грампластинку или магнитную ленту. Полученная рабочая лента используется для управления резцом точного ре- рекордера или магнитокопирователем. В последнее время в рекор- рекордерах также появились свои собственные сложные системы обра- обработки сигналов, предназначенные для динамического управления резцом № создающие компенсацию и предыскажения в рамках не- нелинейной обработки, применяемой как при изготовлении, так и при воспроизведении записей. Более того, первичная копия, полу- полученная в рекордере, является лишь результатом первого этапа сложного процесса, в результате которого получается запись, про-
Цифровая обработка звуковых сигналов игрываемая дома или на студии. Столь же длинный путь звук проходит и на радиовещании. Акустическая система в доме слу- слушателя и громкоговорители образуют важное последнее звено звуковоспроизводящей цепи. Таким образом, процесс звуковоспро- звуковоспроизведения можно представить в виде трех основных этапов; 1. Создание и запись первоначальных сигналов. 2. Хранение и передача этих сигналов. 3. Воспроизведение сигналов в форме акустических волн. Может показаться, что некоторые сложные элементы процесса звуковоспроизведения являются необязательными, однако оказы- оказывается, что каждый этап процесса важен, причем часто как сред- средство исправления технических погрешностей, вносимых на другом этапе процесса. Например, сжатие сигнала на этапе первоначаль- первоначальной записи необходимо потому, что запоминающие устройства хранения имеют ограниченный динамический диапазон. Многие разработки в области цифровой звукотехники имеют целью замену слабых элементов цепи звукозаписи или звукопере- дачи. Примерами могут служить цифровые магнитофоны и циф- цифровые системы передачи звуковых сигналов. Несложные-по идее, эти системы оказываются сложными в реализации. Однако их создание привело к резкому улучшению качества воспроизведе- воспроизведения звуков. Управление микшерным пультом также было переве- переведено на цифровую технику, чтобы освободить звукооператора от трудной обязанности фактического регулирования сотен парамет- параметров в реальном масштабе времени. На смену механическим ревер- берационным устройствам пришли цифровые электронные ревер- ревербераторы. Созданы синтезаторы, позволяющие из пары стереофо- стереофонических сигналов в домашних условиях создавать определенные акустические поля, характерные для больших залов. В лабораториях нашли применение более совершенные методы для восстановления старых звукозаписей. В настоящее время имеются восстановленные записи выступлений Карузо, сделанных в начале века, причем после исправлений записи крайне низкого качества стали звучать гораздо лучше. Цифровая обработка при- применяется также в исследованиях, направленных на усовершенство- усовершенствование электроакустических преобразователей. В звуковоспроизво- звуковоспроизводящей цепи громкоговоритель является одним из самых слабых и наименее исследованных звеньев. Он влияет на амплитудные, фа- фазовые и пространственные характеристики получаемого звукового сигнала, а также обусловливает различного вида искажения сиг- сигналов. Цифровая обработка сигналов применяется для экспери- экспериментального определения физических характеристик акустических преобразователей, а также для оценки влияния этих характери- характеристик на восприятие звука. Во всех подобных системах имеются общие блоки — аналого- цифровой и цифро-аналоговый преобразователи (АЦП и ЦАП). ° силу своего фундаментального- характера вопрос об этих преобг
42 Глава 2 разователях будет рассмотрен здесь самостоятельно. Любые ис- искажения, вносимые на данном этапе обработки сигнала, могут су- существенно обесценить достоинства цифровой обработки. Характе- Характеристики преобразователей необходимо согласовывать с особенно- особенностями восприятия звуковых сигналов по ряду причин. 1. Чрезмерно большая разрядность при квантовании отсчетов в АЦП достигается за счет больших экономических затрат, а из- за большой скорости поступления информации на последующих этапах может потребоваться слишком большое быстродействие. 2. Искажения, определяемые приборами, не всегда замечают- замечаются на слух. Вопрос усложняется также конструктивными проблемами, ко- которые могут существенно повлиять на качество работы системы. Поэтому существуют различные способы преобразования и выбор определяется назначением всей системы. Инженер должен знать соотношение между физическими и электрическими характеристиками системы и кажущимся качест- качеством звука. Классическое определение отношения сигнал/шум, на- например, основано на вычислении отношения максимальной мощ- мощности сигнала к мощности шума, измеренной в отсутствие сигнала. Однако восприятие шума зависит от степени его спектрального сходства или различия с сигналом, от вида распределения вероят- вероятностей и характера изменения шума во времени. Так, два различ- различных шумовых процесса, отличающиеся по мощности на 20 дБ, мо- могут создавать помехи, на слух воспринимаемые как одинаковые. Подобные примеры указывают, что теория звуковых систем в 1болыией мере должна опираться на психоакустические исследо- исследования, чем на теорию систем. Теория систем рассматривает пути решения задачи, а психоакустика в данном случае описывает ха- характер желаемого результата. Так, в вышеупомянутом примере цель состоит в том, чтобы сделать шум неслышным, хотя пол- полностью подавлять его не обязательно. Экономические последствия неправильного выбора конечной цели могут оказаться очень пе- печальными. Как правило, шумы 16-разрядного АЦП не восприни- воспринимаются ухом и не замечаются приборами, однако стоит этот пре- преобразователь раз в 100 больше, чем 12-разрядный АЦП. Поэтому звуковая техника должна строиться с учетом особенностей и ап- аппаратуры, и слуховой системы человека с тем, чтобы в итоге оп- оптимизировать субъективные оценки качества звуковоспроизве- звуковоспроизведения. 2.2. Основы аналого-цифрового преобразования Аналого-цифровые и цифро-аналоговые преобразователи явля- являются общим элементом всех цифровых звуковых систем. С них на- начинается и ими заканчивается любая система цифровой обработ- обработки. Ниже подробно рассматриваются конструктивные вопросы, по-
Цифровая обработка звуковых сигналов 43 скольку преобразователи могут повлиять на характеристики системы гораздо сильнее, чем можно ожидать с первого взгляда. Требования, предъявляемые к преобразователям в звуковой тех- технике, в некоторых отношениях отличаются от принятых в других областях применения цифровой обработки. Особое внимание сле- следует уделить скорости создания информации, поскольку ее пони- понижение существенно сказывается на стоимости и сложности частей системы, связанных с хранением, передачей и обработкой инфор- информации. Как было указано выше, способ построения системы силь- сильно влияет на субъективную оценку качества. Компромисс, к кото- которому приводят многочисленные и противоречивые соображения, должен быть выбран очень тщательно, поскольку ошибки в звуко- звуковых системах широкого применения обходятся достаточно дорого. Это, конечно, не относится к лабораторным образцам, так как преобразователи любого качества можно при необходимости по- получить в специализирующихся по ним фирмах. Действие аналого-цифровых преобразователей в принципе до- достаточно просто: в них происходит преобразование дискретизован- ных аналоговых сигналов в соответствующую последовательность двоичных чисел. Однако сделать это можно многими способами, включая линейную импульсно-кодовую модуляцию (ИКМ), диф- дифференциальную импульсно-кодовую модуляцию (ДИКМ), дельта- модуляцию (ДМ), адаптивную дельта-модуляцию (АДМ) и дру- другие методы. 2.2.1. Линейная импульсно-кодовая модуляция Блок-схема цифровой системы обработки звуковых сигналов, в которой используется АЦП с импульсно-кодовой модуляцией, изображена на рис. 2.1. На входе системы включен аналого-циф- аналого-цифровой преобразователь, а на выходе — цифро-аналоговый. Вход- Входной сигнал пропускается через фильтр нижних частот, устраняю- устраняющий наложение спектров, и дискретизуется, причем аналоговый сигнал сохраняется в неизменном виде в течение всего цикла пре- преобразования. С помощью цифровой логической схемы определяет- определяется кодовая комбинация, которая после преобразования в соответ- соответствующую аналоговую величину аппроксимирует значение отсчета входного сигнала. Эти кодовые комбинации (по одной на каждый отсчет) и образуют цифровой вариант входного сигнала. Выход- Выходное напряжение преобразователя устанавливается с помощью на- набора транзисторных ключей, образующего своеобразный двоичный потенциометр. Число разрядов, представленное числом ключей, определяет число получаемых уровней напряжения и, следователь- следовательно, разрешающую способность преобразователя. Цифровая логиче- логическая схема находит наилучшее приближение к значению отсчета аналогового сигнала и делает это с помощью ряда последователь- последовательных приближений, начинающихся со старшего разряда и заканчи-
44 Глава 2 вающихся младшим разрядом. Первым замыкается ключ старшего разряда, и схема сравнения определяет, превосходит ли получен- полученное напряжение входной сигнал. Если превосходит, то разряд ¦сбрасывается, а если нет, то остается. Процесс последовательной проверки разрядов продолжается до тех пор, пока не будет опре- определено значение самого младшего разряда1*. На выходе цифровой системы происходит обратный процесс. Кодовая комбинация вводится в выходной регистр ЦАП, содержа- содержащего ключевую схему, аналогичную применяемой в АЦП. Отсчет, сформированный из кодовой комбинации, сохраняется в запоми- запоминающей схеме до поступления следующего кода. Фильтр нижних частот ослабляет высокочастотные компоненты, лежащие выше частоты Найквиста, а апертурный фильтр корректирует затухание I ! Входное устройство цифрового процессора Блок вычисления или передачи Выходное устройство процессора Рис. 2.1. Блок-схема системы аналого-цифрового преобразования, предназначен- предназначенной'для'ввода сигнала в цифровой процессор. Выходной сигнал процессора по- поступает в систему цифро-аналогового преобразования. ФНЧ — фильтр нижних частот, ослабляющий составляющие, лежащие вне найквистовского диапазона- СЗО— схема запоминания отсчетов, сохраняющая отсчет входного сигнала в те- течение цикла преобразования; СС — аналоговая схема сравнения, сравнивающая отсчет с его аппроксимацией, полученной в цифро-аналоговом преобразователе; ЦАП — блок цифро-ана- цифро-аналогового преобразования с цифровым входным и аналоговым выходным сигналами; РПА— регистр запоминания последовательных аппроксимаций, в котором выполняется преобразова- преобразование (стандартная БИС); п разрядов представляют кодовую комбинацию (двоичное число), соответствующую отсчету аналогового сигнала. В процессоре входные числа преобразуются в отсчеты выходного сигнала. Если необходимо задержать сигнал, то процессор работает как запоминающее устройство, если же необходимо ввести реверберацию, то в качестве процессора используется вычислительная машина. " Такой способ аналого-цифрового преобразования называется поразрядным взвешиванием. — Прим. перев.
Цифровая обработка звуковых сигналов 45 в области верхних частот, вносимое выходной запоминающей схе- схемой. В литературе можно найти более подробное описание подоб- подобных преобразователей [8, 75] и примеры схемных решений для ЦАП [2]. Поскольку конструкции высококачественных цифро-ана- цифро-аналоговых преобразователей непрерывно совершенствуются в связи с развитием полупроводниковой техники, мы полагаем, что боль- большинство потребителей будут покупать готовые устройства, а не разрабатывать свои собственные. Тем не менее характеристики [76] преобразователей, используемых в звуковых системах, долж- должны соответствовать тем особым условиям, которые характерны для данной области техники. Как уже упоминалось, число двоичных разрядов, используемых в процессе преобразования, определяет число дискретных уровней, •с помощью которых можно представлять аналоговый сигнал. Ли- Линейный гс-разрядный преобразователь имеет 2п уровней и позво- позволяет преобразовывать сигналы амплитудой до 2n~i уровней. Мак- Максимальная ошибка квантования равна половине уровня. Если преобразуются широкополосные сигналы большой величины, то ошибки квантования можно представить в виде последовательно- последовательности статистически независимых случайных величин с равномерным распределением. В этих условиях ошибки квантования образуют стационарный белый шум [1], эквивалентный обычному шуму, присутствующему в аналоговых системах. Качество звуковых систем обычно характеризуют величиной их динамического диапазона. Она равна отношению уровней наиболь- наибольшего сигнала, не вызывающего нелинейных искажений, и наи- наименьшего сигнала, различимого в собственных шумах системы. Та- Таким образом, величина динамического диапазона равна макси- максимальному значению отношения сигнал/шум (S/N), когда шум яв- является аддитивным и стационарным. В цифро-аналоговом преобразователе где п — число разрядов кодовой комбинации. Если сигнал мал по величине или имеет узкополосный характер, то ошибки квантова- квантования, получающиеся в процессе аналого-цифрового преобразования, больше похожи на искажения сложного вида, чем на шум. Рас- Рассмотрим, например, преобразование слабого синусоидального ко- колебания, смещенного по напряжению так, что его «середина» по- попадает в точку перехода от одного уровня АЦП к другому, а амп- амплитуда равна величине уровня (шагу квантования). Квантованный сигнал имеет форму меандра и состоит из бесконечного ряда не- .Четных гармоник. В данном случае ошибки квантования приводят к результату, эквивалентному гармоническим искажениям в ана- аналоговых системах. Однако зависимость величины этих искажений от уровня сигнала отличается от соответствующей зависимости в ^Налоговых системах. В аналоговых системах коэффициент гар-
46 Глава 2 моник возрастает с увеличением уровня сигнала, хотя для беско- бесконечно малых сигналов систему можно считать абсолютно линей- линейной. В рассмотренном выше примере перескоки между соседними уровнями квантования дают результат, подобный результату, по- получаемому после идеального ограничителя, который подавляет компоненты с наибольшими амплитудами. Здесь искажения уве- увеличиваются с уменьшением уровня сигнала. Если слабый сигнал имеет высокую частоту, то механизм ис- искажения усложняется за счет дискретизации, выполняемой в про- процессе преобразования. Гармоники меандра, обусловленные ошиб- ошибкой квантования, при дискретизации как бы перемножаются с сиг- сигналом, частота которого равна частоте взятия отсчетов, и образу- образуют комбинационные колебания, попадающие в основную полосу [7]. Если бы эти гармоники присутствовали в исходном сигнале, то они были бы отфильтрованы входным фильтром нижних частот, который задерживает все компоненты сигнала, выходящие за ча- частоту Найквиста. Однако если такие гармоники вносятся после фильтра нижних частот, то вызываемые ими помехи уничтожить невозможно. Этот процесс поясняется на рис. 2.2. Пусть частота дискретизации равна 31 кГц. Тогда пятая гармоника входного сиг- сигнала с частотой 6 кГц за счет эффекта наложения частот образует мешающую составляющую с частотой 1 кГц. Гармоники, возника- возникающие при квантовании, и образуемые ими комбинационные часто- частоты создают очень неприятный звук, иногда называемый шумом дробления. С увеличением амплитуды входного синусоидального сигнала коэффициент корреляции между сигналом и ошибкой уменьшается от 0,5 до 0,01 и менее [4], однако мощность каждой гармоники шума дробления остается почти неизменной [1]. Ком- Компоненты, связанные с наложением частот, исчезают полностью, лишь когда входной сигнал становится широкополосным. Существует несколько способов, позволяющих избавиться от неприятных эффектов, связанных с шумом дробления. Наиболее очевидный подход состоит в увеличении числа разрядов кванто- квантователя до такой степени, чтобы уровень комбинационных гармо- гармоник, возникающих из-за ошибок квантования, опустился за порог восприятия. Второй подход состоит в использовании аддитивного вспомогательного раскачивающего шума (dither noise) [4], застав- заставляющего ошибку квантования изменяться от одного отсчета к другому более или менее случайным образом. Простым приближе- приближением к раскачивающему шуму, имеющему равномерную плотность вероятности, является аддитивный гауссовский шум. Кроме того, можно применять такие методы аналого-цифрового преобразова- преобразования, в которых роль раскачки будут играть колебания предельного цикла, возникающие в процессе преобразования [6]. Если регу- регулярный характер ошибки квантования удается подавить, то ее- можно рассматривать как аналоговый шум.
Цифровая обработка звуковых сигналов 47 —*• —*¦ I I ФНЧ Одно- Диспре- ТНЧ % разрядный тиэатор - ,-5 квантователь "s Г\ - &Б V/' дБ\ f fo S& Sf0 7f0 ЮдБ ~20дБ -40дБ C) G) W t 6 8 г E) 10 12 Рис. 2.2. Пояснение процесса возникновения шума дробления при малых уров- уровнях синусоидального входного сигнала. 'Сигнал частоты fo=9,33 кГц дискретизуетгя с частотой 30 кГц. Частота среза фильтров ниж- «их частот равна 15 кГц. а — модель системы аналого-цифрового преобразования для слу- случая, когда амплитуда синусоидального сигнала меньше величины шага квантования, а «центр» сигнала совпадает с местоположением порога. Квантователь действует как одно- одноразрядный АЦП; б—входной синусоидальный сигнал частоты fo=9,33 кГц и его спектр; в — сигнал после квантователя и его спектр; г — спектр сигнала после дискретизации и низко- низкочастотной фильтрации содержит комбинационные гармоники на частотах, соответствующих биениям гармоник спектра сигнала с частотой дискретизации. Например, третья гармоника C) входного сигнала с частотой 28 кГц создает биения с частотой 2 кГц. (Перепечатано из статьи Блессера [7] с разрешения Общества звукотехники.) Подобные и столь же неприятные явления происходят и в той случае, когда входной сигнал превышает максимально допусти- допустимый уровень квантователя или запоминающего усилителя в дис-
48 Глава 2 кретизаторе. Эта проблема встречается особенно часто в связи с тем, что в различных звуковых системах обычно вводят предыска- предыскажения, выражающиеся в подъеме частотных характеристик в об^ ласти верхних частот [11]. При ограничении сигнала в усилителях возникают шумовые компоненты, лежащие за частотой Найквиста. При этом спектральная плотность сигнала в районе одной трети частоты дискретизации может увеличиваться, а вместе с ней воз- возрастает и вероятность перегрузки усилителей. Частоты, лежащие вблизи одной трети частоты дискретизации, наиболее опасны с точки зрения симметричных искажений, так как их третья гармо- гармоника равна частоте дискретизации. Поскольку частота компонент,, образующихся за счет наложения спектров, оказывается ниже ча- частоты вызвавшего их сигнала, то музыкальный сигнал обычно не маскирует эти компоненты. Такой вид помехи часто называют чириканьем (birds), поскольку звучание помехи напоминает пение птиц. С технической точки зрения эти помехи идентичны шуму дробления. Чтобы преодолеть подобную трудность, входной усили- усилитель АЦП рассчитывается обычно так, чтобы максимальный уро- уровень сигнала был на 3 дБ ниже последнего уровня АЦП. Запас- необходим потому, что меандр, профильтрованный фильтром ниж- нижних частот, превращается в синусоиду с амплитудой, превышаю- превышающей уровень первоначального сигнала. Рекомендуется также при- применять сжимающие или ограничивающие усилители, управляемые- напряжением, снимаемым с запоминающей схемы дискретизатора. Более тонкие эффекты, связанные с ограничением или кванто- квантованием, наблюдаются тогда, когда уровни квантования в АЦП или ЦАП из-за производственных погрешностей располагаются1 неравномерно или же усилитель, запоминающий отсчет входного' сигнала, имеет утечку в режиме запоминания и не обеспечивает постоянства отсчета. В обоих случаях эквивалентная нелинейность располагается после фильтра нижних частот. Хуже того, эти эф- эффекты в наибольшей степени проявляются в середине диапазона- преобразования, являющейся рабочей зоной при квантовании сла- слабых сигналов. «Чириканье», возникающее в выходном сигнале цифро-аналого- цифро-аналогового преобразователя, имеет другой механизм образования. Вы- Выходная запоминающая схема обычно имеет утечки, приводящие к убыванию напряжения в интервалах между моментами смены отсчетов по закону, близкому к линейному. Было показано [9]„ что отличие между идеальным запоминающим устройством и сис- системой с постоянным спадом создает ошибку вида E=sign{xn—xn_1} ¦ {xn—xn_iJ, где хп — п-й отсчет аналогового сигнала на выходе ЦАП. Ошибку можно устранить, если в запоминающей схеме ввести интегриро- интегрирование на интервале между отсчетами, что линеаризует переход от отсчета к отсчету. _
Цифровая обработка звуковых сигналов 2,2.2. И КМ с плавающей запятой Вопрос о необходимом для преобразователя числе разрядов- является сложным и требует всестороннего анализа. Лаборатор- Лабораторные измерения показали, что динамический диапазон слуховой системы человека может доходить до 130 дБ. В практических усло- условиях он близок к 90 дБ. Звуки в нижней части измеренного в ла- лаборатории динамического диапазона в реальном мире обычно за- заглушаются шумовым фоном. Сильные звуки в верхней части дина- динамического диапазона вызывают неприятные ощущения или боль. При исполнении симфонической музыки в концертных залах иног- иногда регистрировались звуковые выбросы, доходящие до 100—ПОдБ [77], а шумовой фон на высоких частотах был ниже 20 дБ [78]. Эти наблюдения указывают, что для неискаженного воспроизведе- воспроизведения подобных программ необходимо стремиться получить динами- динамический диапазон аппаратуры 90 дБ. Если музыка, подлежащая квантованию, уже была записана или обработана обычными ана- аналоговыми устройствами, то необходимый динамический диапазон будет значительно меньше. Для студийных магнитофонов, напри- например, он составляет 75 дБ [79]. Исходя из вышеприведенного простого соотношения между ди- динамическим диапазоном и разрядностью чисел в системе, можно- определить, что при динамическом диапазоне 90 дБ и ширине по- полосы сигнала 17,5 кГц необходимы 15-разрядные числа и частота дискретизации не ниже 35 кГц. К сожалению, создание 15-разряд- 15-разрядного АЦП с частотой отсчетов 35 кГц близко к пределу возмож- возможностей современной техники и потому обходится очень дорого. Это нетрудно понять, если учесть, что такой преобразователь должен давать на 10-вольтовой шкале разрешение 300 мкВ, а все опера- операции, связанные с определением значения одного разряда, должны длиться не более 2 мкс. Следует, однако, отметить, что необходимость большого дина- динамического диапазона определяется не условием получения опреде- определенной точности, а диапазоном изменения уровней сигналов, пред- представляемых в цифровой форме. В методике измерения динамиче- динамического диапазона предполагается, что шум является стационарным и аддитивным, а минимальный сигнал равен шуму. Но этот шум влияет только на слабые сигналы и незаметен при сильных. Зада- Задача аналого-цифрового преобразования значительно упрощается, если можно допустить, чтобы уровень шума повышался вместе с уровнем сигнала. При этом можно ввести новый критерий, а имен- именно отношение сигнал/шум при условии, что шум измеряется в присутствии сигнала. Введем обозначение S/NCc(A), где индекс ее указывает, что шум измеряется в присутствии сигнала, а Л — ам- амплитуда сигнала. Из введенного определения следует, что SfNcC(A) зависит как от свойств канала, так и от особенностей сигнала. Этим оно отличается от обычного определения отноше- 4—359
«К> Глава 2 ния сигнал/шум, которое задается как отношение максимального неискаженного сигнала к постоянному аддитивному шуму. По- Поскольку стандартное отношение сигнал/шум обычно измеряется в отсутствие сигнала, будем для него применять обозначение S/Ncc, где индекс бс указывает, что шум измеряется без сигнала. Отно- Отношение S/Nqc эквивалентно динамическому диапазону, и эти поня- понятия взаимозаменяемы. Для обычного АЦП «i Для того чтобы шум лежал ниже порога слышимости, в боль- большинстве случаев необходимо, чтобы отношение S/NCC(A) составля- составляло около 60 дБ [10], откуда следует, что АЦП должен быть 10-разрядным. При этом S/Ntc по-прежнему близко к 90 дБ. По- Подобные характеристики, по-видимому, может обеспечить гибрид- ;ный АЦП, где применяется арифметика с плавающей запятой. ,В подобном преобразователе, блок-схема которого показана на ,рис. 2.3, перед ступенью аналого-цифрового преобразования рас- расположен переключаемый нормирующий усилитель. Его коэффи- коэффициент усиления регулируется логическим устройством, которое стремится удерживать уровень сигнала на входе преобразователя в верхней половине диапазона преобразования. Если на вход по- поступает более слабый сигнал, коэффициент усиления увеличива- увеличивается. В итоге кодовая комбинация, изображающая квантованный отсчет сигнала, содержит две части — масштабный коэффициент (порядок) и мантиссу. Преобразователь (рис. 2.3) имеет предуси- литель с четырьмя рабочими состояниями 0, +6, +12 и +18 дБ, ^которые кодируются 2-разрядным числом. Далее включен обыч- иый 12-разрядный АЦП. Если уровень входного сигнала лежит в диапазоне Он—24 дБ, то АЦП работает в верхней половине свое- своего диапазона и S/Ncc задается соотношением S[NCC (А) =[66 + А | mod6] (дБ) при 0 > А (дБ) > -24. Если входной сигнал уменьшается за этот предел, то нормирую- нормирующий предусилитель остается в режиме максимального усиления и S/Ncc выражается как при Л(дБ)<—24. При таком методе преобразования полный динамический диапа- диапазон равен сумме динамического диапазона преобразователя и диапазона, нормирования, т. е. c = 90 дБ. Числа, представленные в системе с плавающей запятой, не- нетрудно записать в обычном двоичном виде, поскольку информация
Цифровая обработка звуковых сигналов 51 I Стандарт- Стандартный 12-раз- рядный АЦП Z-разрядный порядок 12-раз- 12-разрядная мантисса Рис. 2.3. Метод преобразования с плавающей запятой. Вслед за фильтром нижних частот (ФНЧ) и схемой запоминания отсчетов (СЗО) введен' каскад с переключаемым усилением. На схеме показан каскад с четырьмя значениями ко- коэффициента усиления 0, +6, +1'2 и +18 дБ. Схема регулировки усиления отыскивает такое положение переключателя, при котором уровень сигнала на входе АЦП максимален, но не попадает в область перегрузки. Схема сравн&ния (СС) проверяет, не выходит ли сигнал из диапазона преобразователя; если сигнал выходит из этого диапазона, то регулятор умень- уменьшает усиление, пока не прекратится перегрузка. Регулятор увеличивает усиление, если уро- уровень сигнала оказывается меньше половины шкалы АЦП. В некоторых системах увеличение усиления производится с задержкой (например, в 200 мс). Это уменьшает число переклю- переключений и снижает требования к точности изготовления и настройки системы без ухудшения ее характеристик. Код числа на выходе состоит из двух частей: 12-разрядной мантиссы и 2-раз- 2-разрядного порядка, поэтому и появилось название преобразование с плавающей запятой. Вы- Выбор шага усиления в 6 дБ позволяет без затруднений представлять эти числа в стандартном двоичном виде. о состоянии нормирующего усилителя указывает число разрядов, на которые мантиссу надо сдвинуть вправо. Динамический диапа- диапазон АЦП с плавающей запятой можно увеличить, если расширить диапазон регулировки нормирующего усилителя до восьми ступе- ступеней, т. е. описывать его состояние 3-разрядным числом. В настоя- настоящее время это превышает любые практические потребности и в нормальных условиях пока не применяется. Управление нормирующим усилителем может быть мгновен- мгновенным или послоговым. В первом случае оптимальное значение ко- коэффициента усиления определяется для каждого отсчета. Во вто- втором случае усиление сразу уменьшается, если преобразователю угрожает перегрузка, однако при слабом сигнале коэффициент усиления возрастет только тогда, когда сигнал будет находиться в нижней половине шкалы в течение определенного интервала ожидания. Типичная длительность этого интервала равна
52 Глава 2 ЮОч-300 мс, что соответствует длительности слога речи или музы- музыкальной ноты. Выходной сигнал в этом случае образует массивы ;с поблочно плавающей запятой (см. стр. 102). Выбор между мгновенным и послоговым управлением опреде- определяется особенностями реализации АЦП. При использовании мгно- мгновенного алгоритма необходимо, чтобы точность установки коэф- коэффициента усиления нормирующих усилителей была близка к точ- точности следующих за ними преобразователей. Послоговый алгоритм в большей мере допускает неточности в установке коэффи- коэффициентов усиления. В нормальных условиях переключения усиле- усиления осуществляются лишь несколько раз в секунду, и эти неточ- неточности не замечаются на слух, так как они появляются в моменты изменения характера музыки. Поскольку послоговый АЦП с пла- плавающей запятой обычно не вносит заметных искажений и прост в реализации, то ему, как правило, и отдают предпочтение. Выход- иой блок системы проектируется аналогичным образом, т. е. пос- после ЦАП включается масштабный усилитель. Данный метод преобразования стал типичным, и появился ряд его разновидностей [3, 12, 80]. В некоторых случаях, рассматри- рассматриваемых ниже, первоочередной задачей является сокращение до минимума разрядности чисел. Поскольку сжатие легче осущест- осуществляется в цифровом виде, высококачественные системы преобразо- преобразования часто выполняют роль входного блока в устройствах сокра- сокращения избыточности информации. 2.2.3. Дельта-модуляция При дельта-модуляции (ДМ) в цифровом виде представляется разность величин последовательных отсчетов сигнала. Основным достоинством преобразователей, входящих в данный класс, явля- является простота конструкции, так как здесь в отличие от ИКМ не требуются поразрядное взвешивание, запоминающие усилители, фильтры для устранения наложения спектров, нормирование и де- детали с повышенной точностью номиналов. Тем не менее в такой ¦системе можно получить высокие значения SfN^c, например ~ 65 дБ. Недостатком дельта-модуляции является то, что для до- достижения заданного качества сигнала обычно необходима гораз- ;до большая скорость передачи информации, чем при использова- использовании ИКМ. Поэтому ДМ лучше подходит для тех систем, где не- недопустимы большие затраты на хранение или обработку отсчетов. Примером! может служить рассматриваемая ниже линия задерж- задержки, применяемая в системе имитации акустики больших залов. В литературе [47] можно найти подробный анализ систем с дель- дельта-модуляцией, здесь же приводится лишь краткий обзор таких систем. Одноразрядный дельта-модулятор, изображенный на рис. 2.4, ^образует ггоостейший АЦП. На каждом тактовом интервале выно-
Цифровая обработка звуковых сигналов 53 1 »• 1—> П- триггер Тактовые импульш ijxdt) пролей- мании X Передатчик „ Поток двоичных ци/рр (Jxdt) Блок ап- прокси- проксимации Блок кодирования I Приемник Рис. 2.4а. Одноразрядная система дельта-модуляции. Входной сигнал сравнивается с сигналом, вырабатываемым в блоке аппроксимации (БА), ¦изображенном" в виде интегратора. На выходе схемы сравнения (СС) появляются двоичные единицы или нули, которые с каждым тактовым импульсом поступают в 0-трлггер. Если .разность между входным сигналом и аппроксимирующим его значением положительна, то вырабатывается двоичная едииица; если разность отрицательна — то двоичный нуль. В бло- блоке аппроксимации при поступлении двоичной единицы создается ток положительного на- направления, а для двоичного нуля — отрицательного направления. В нормальных условиях выходной сигнал блока аппроксимации будет сравнительно близок к входному сигналу. По- Поскольку в данный .блок поступает такой же поток двоичных цифр, что и в передатчик, то в приемнике будет вырабатываться аналогичный аппроксимирующий сигнал. Выходной сигнал блока аппрокси- аппроксимации Передаваемый поток двоич- двоичных чисел Рис. 2.46. Сигналы в системе дельта-модуляции: входной, выходной в блоке аппроксимации и передаваемый поток двоичных чисел, на основе которого в приемнике создается аппроксимирующий сигнал. Если передаются одинаковые числа, то имеет место ограничение .скорости нарастания ап- аппроксимации, поскольку аппроксимирующий сигнал не успевает отслеживать изменения вход- входного сигнала. Если передаются непрерывно чередующиеся числа, то аппроксимирующий сигнал колеблется относительно правильного значения. сится бинарное решение путем сравнения уровня входного сигна- сигнала с величиной аппроксимированного предыдущего отсчета, сохра- сохраняемого в модуляторе. Если сигнал больше аппроксимированного значения, то к последнему добавляется фиксированное прираще- приращение, и наоборот, если сигнал меньше предыдущего отсчета, прира- Щение вычитается. Процесс повторяется для каждого отсчета, и аппроксимированное значение сигнала все время удерживается
54 Глава 2 вблизи истинного значения входного сигнала. Точность аппрокси- аппроксимации прямо связана с величиной приращения. Одноразрядные числа, на основании которых в кодировщике строится аппроксими- аппроксимированное значение входного сигнала, можно передать в другое ме- место и там восстановить по ним ту же самую величину сигнала. При одноразрядном преобразовании возникают два вида иска- искажений сигнала. Если входной сигнал быстро увеличивается, то ап- аппроксимированное значение сигнала не успевает нарастать вслед, за ним, так как максимальная скорость изменения выходного сиг- сигнала равна всего одному шагу квантования за интервал дискре- дискретизации. Это приводит к затягиванию фронтов входного сигнала (slope overload), известному также под названием «ограничение скорости изменения» (slew-rate limiting) или «ограничение первой производной» (clipping of the first derivative). Вторым видом искажений являются грубые ошибки при слабых сигналах, когда величина сигнала меньше единицы приращения выходного сигна- сигнала. В этом случае возникает рыскание, или, что то же самое, коле- колебания относительно истинного значения сигнала, соответствующие шуму квантования в преобразователе с ИКМ. Такой вид искаже- искажений называют также шумом дробления. Качество работы одноразрядного преобразователя полностью определяется частотой дискретизации и, следовательно, скоро- скоростью создания информации. При заданной величине шага кванто- квантования создается шум дробления определенного уровня, а макси- максимальное значение сигнала определяется допустимой скоростью изменения сигнала и его частотой. Удваивая частоту дискретиза- дискретизации, можно в два раза повысить допустимую скорость изменения и тем самым при неизменной частоте удвоить максимальную ам- амплитуду сигнала. Если же сохранить скорость изменения сигнала и в два раза уменьшить шаг квантования, то шум дробления по- понизится вдвое. Можно найти оптимальную величину шага кван- квантования, определяемую статистическими свойствами входного- сигнала, при которой отношение сигнал/ошибка становится мак- максимальным [51, 55]. При таком анализе ошибки, связанные с за- затягиванием фронтов и шумом дробления, выражаются одним об- общим показателем. Однако оказалось, что слуховое восприятие затягивания фронтов сильнее зависит от мощности ошибки в про- производной звукового сигнала, чем от мощности ошибки в самом звуковом сигнале [53]. Кроме того, затягивание фронтов харак- характерно для случая высокочастотных сигналов, которые препятст- препятствуют восприятию комбинационных гармоник. С другой стороны, шум дробления проявляется тогда, когда уровень сигнала стано- становится малым. Одной из характеристик звуковоспроизводящей системы явля- является ширина динамического диапазона, причем S/Ыбс чаще всего измеряется на частоте 1 кГц. Эту частоту обычно применяют и для определения максимальной величины основного тона долгих музы-
Цифровая обработка звуковых сигналов 55 кальных нот. Составляющие более высоких частот либо являются ¦более слабыми обертонами основного тона, либо возникают в не- неустановившихся процессах, вызванных игрой ударных инструмен- инструментов. Можно показать, что для простого одноразрядного дельта- модулятора S/Л/вс определяется соотношением j где /о — частота дискретизации, fs — частота синусоидального сиг- [ нала, a W — ширина полосы, в которой измеряется мощность шу- шума [66]. При дискретизации с частотой 500 кГц, когда скорость ^ создания информации равна 500 кбит/с, для синусоидального сиг- ] нала в частотой 1 кГц можно достичь 5/ЛАбс = 50 дБ, если допусти- допустимая ширина полосы кодируемого сигнала равна 14 кГц. Заметим, что эта цифра значительно меньше, чем для ИКМ-преобразовате- ля, рассмотренного выше. Нетрудно найти причину такого разли- различия. При ДМ удвоение скорости создания информации (т. е. час- частоты дискретизации) увеличивает S/Nqc лишь на 9 дБ, а удвоение разрядности в преобразователе с ИК.М увеличивает S/N&C экспо- экспоненциально (удваивает его значение в децибелах). Поэтому там, где требуются большие значения S/Ncc, дельта-модулятор являет- является не лучшим вариантом. Пояснить сказанное можно следующими соображениями. Уд- Удвоение частоты дискретизации позволяет уменьшить шаг квантова- квантования только вдвое (на 6 дБ) и вдвое расширить полосу частот, в которой распределяется шум квантования. Последнее снижает спектральную плотность шума на 3 дБ. Чтобы получить в системе с ДМ удовлетворительное качество звука, частота дискретизации должна составлять несколько мегагерц и столь же высокой долж- должна быть скорость создания информации. Однако при низкой час- частоте дискретизации и соответственно низком S/Nqc линейный дель- дельта-модулятор оказывается не хуже обычного преобразователя с ИКМ [67]. Поэтому ДМ больше подходит для передачи речи по телефону, чем для высококачественных систем звуковоспроизве- звуковоспроизведения. В блоке аппроксимации (рис. 2.4) вместо простого интеграто- интегратора или фильтра нижних частот можно применить интегрирующую цепь второго порядка. В этом случае S/Nec выражается формулой где fo — частота дискретизации, fs — частота сигнала, a W — поло- полоса частот, в которой измеряется шум квантования [66]. Для тех же значений частоты сигнала A кГц) и полосы A4 кГц) отноше- отношение S/Л/бс увеличивается от 50 почти до 65 дБ. Однако для полу- получения этого выигрыша приходится преодолевать новые трудности.
56 ' Глава 2 Одна из них состоит в том, что характеристики шума становятся зависимыми от устойчивости системы. Дело в том, что если не принять специальных мер в процессе конструирования устройства^ то задержка между отсчетами и фазовый сдвиг в интегрирующей цепи второго порядка могут дать набег фазы, превышающий 180° [69, 47]. В системе второго порядка перегрузки приводят к ограничению- не первой, а второй производной. Поэтому во избежание искаже- искажений максимально допустимый входной сигнал должен уменьшать- уменьшаться со скоростью 12 дБ/октава. На практике возможность появле- появления слышимых искажений увеличивается, так как в музыке высо- высокочастотные компоненты убывают с ростом частоты не слишком быстро. В итоге часть добавочной ширины динамического диапа- диапазона, создаваемой интегратором второго порядка, теряется, по- поскольку входной сигнал приходится уменьшать, чтобы устранить заметные искажения, связанные с ограничением второй произ- производной. Некоторое дополнительное улучшение характеристик преобра- преобразователя можно получить тщательным выбором характеристик его- петли. Непосредственно перед схемой сравнения можно ввести компенсационный фильтр, который управляется сигналом ошибки [52]. При этом несколько ухудшаются переходные характеристи- характеристики, но уровень шума понижается примерно на 8 дБ. Вышеописанный дельта-модулятор второго порядка, вероятно, окажется вполне пригодным для многих бытовых звукопроизводя- щих систем. Для дальнейшего улучшения характеристик системы следует применять адаптивные методы. 2.2.4. Адаптивная дельта-модуляция При линейной дельта-модуляции создается шум с постоянным уровнем и отношение S/NCc максимально только при максималь- максимальной величине сигнала. При уменьшении сигнала пропорциональ- пропорционально падает отношение S/NCc, что вообще характерно для любых АЦП без регулировки характеристики преобразования. В дельта- модуляторах, однако, можно применить вариант алгоритма преоб- преобразования с плавающей запятой, при котором S/Nec значительно увеличивается без изменения частоты дискретизации или скоро- скорости создания информации. В системе, изображенной на рис. 2.5, величина шага квантова- квантования изменяется в зависимости от характера сигнала. Если величи- величина сигнала быстро увеличивается, то шаг квантования увеличива- увеличивается, чтобы избежать ограничения скорости нарастания выходного сигнала. При малых сигналах шаг квантования уменьшается с тем, чтобы понизить шум дробления. Качество работы АЦП зависит от свойств алгоритма перемены шага квантования и от величины диапазона изменения, шага квантования. Чтобы правильно вое-
Цифровая обработка звуковых сигналов 57 остановить сигнал в декодере, алгоритм согласования шага кванто- квантования должен основываться только на передаваемом потоке дво- двоичных чисел, но не на входном сигнале АЦП. Поэтому логично полагать, что решения о моментах и величине изменения шага квантования должны опираться на значения предыдущих отсчетов сигнала. В простейшем случае в таком алгоритме могут использоваться только текущий и предшествующий отсчеты [50, 70]. Если оба от- отсчета имеют одинаковые знаки, то шаг квантования увеличивает- увеличивается в Р раз. В противном случае (т. е. если отсчеты поочередно имеют знаки + и —•) шаг квантования уменьшается в Q раз. Та- Такая система будет устойчивой при условии [70] Если произведение P.Q превышает единицу, то неустойчивость системы приводит к быстрому увеличению уровня шума. Когда PQ находится между 0,8 и 1, отношение S/Ncc остается приблизи- приблизительно постоянным. Для речевых сигналов можно утверждать, что оптимальными являются значения =1,5 и />Q= если оптимизация основана на измерении мощности ошибки [70]. Однако в измерениях, проводимых методом прослушивания, было Передаваемые двоичные числа Управление размером шага si еров шага квантования Рис. 2.5. Блок-схема преобразователя с адаптивной дельта-модуляцией. Двоичные числа 'на выходе триггера управляют знаком шара поправки. Величина шага ре- регулируется. В приведенной схеме 3-разрядный ЦАП позволяет получить 8 размеров шага. Управляющее логическое устройство определяет размер шага на основе предшествующих Двоичных чисел. Если, например, образуется последовательность двоичных единиц, что Указывает на недостаточную скорость нарастания выходного сигнала, то шаг увеличива- увеличивается с тем, чтобы сигнал в блоке аппроксимации «догнал» входной сигнал. Если на вы- выходе триггера поочередно появляются нули и единицы, что свидетельствует о колебаниях, то шаг уменьшается.
5Я Глава 2 установлено [68], что оптимальное значение Р близко к 1,2. Это, очевидно, вызвано тем, что людям шум дробления кажется более неприятным, чем искажения, связанные с перегрузками. К сча- счастью, при выборе Р = 2 и Q = 0,5 качество преобразования снижа- снижается незначительно, но конструкция аппаратуры упрощается [71]. Данный алгоритм нельзя считать достаточно совершенным, поскольку при его использовании одинаковые знаки двух последо- последовательных чисел всегда свидетельствуют о недостаточной скоро- скорости изменения выходного сигнала, а разные знаки — о наличии шума дробления. Улучшить качество преобразования можно за счет определения величины шага квантования на основе не одно- одного, а нескольких предшествующих чисел. Один из таких алгорит- алгоритмов, в котором анализировалось шесть предыдущих двоичных цифр вместо одной, позволил увеличить S/Ncc почти на 8 дБ [49]. Число предшествующих чисел, на которые следует опираться при анализе, в сильной степени зависит от соотношения частоты сиг- сигнала и частоты дискретизации. Чем выше частота дискретизации,, тем более плавно изменяются отсчеты сигнала. Вышеприведен- Вышеприведенные цифры были взяты из работы, посвященной речевым сигна- сигналам, когда частота дискретизации была невысокой и превосходила наибольшую частоту сигнала в 14 раз. При дискретизации музыки с частотой 500 кГц сигнал, как правило, можно аппроксимировать отрезками с постоянным наклоном или, в худшем случае, отрезка- ми параболической кривой. В одном из вариантов метода адаптивной дельта-модуляции на основе потока двоичных цифр определяется основное направление изменения сигнала. При этом двоичная единица указывает, что следует продолжать изменение сигнала в том же направлении, а> нуль — что все остается без изменений [72]. Возможность приме- применения такого преобразователя в высококачественных системах звуковоспроизведения глубоко не изучалась, однако уже имею- имеющиеся результаты показывают, что можно построить недорогую систему с ДМ, в которой скорость создания информации будет не выше, чем в стандартном преобразователе с ИКМ. Эксперимен- Эксперименты, проведенные одним из авторов главы (Блессером), показыва- показывают, что для сигнала с частотой 1 кГц при полосе 15 кГц можно получить отношение S/NCc, равное 70 дБ. В одном из опытов отно- отношение S/Nec, зависящее от диапазона изменения шага квантова- квантования, достигало значения 96 дБ. Поток последовательных двоичных одноразрядных чисел до- довольно просто хранить и передавать, но очень трудно обрабаты- обрабатывать. При обработке сигнала, поступающего в такой форме, дель- та-модулированный сигнал приходится преобразовывать в стан- стандартный двоичный формат. В отличие от этого сигнал, полученный в неадаптивном дельта-модуляторе, можно обрабатывать непо- непосредственно. Обычно его подвергают цифровой низкочастотной фильтрации, чтобы подавить шум, лежащий вне звукового диапа-
Цифровая обработка звуковых сигналов 59 зона, и затем дискретизуют с другой 'частотой [74]. Полученные таким образом отсчеты эквивалентны отсчетам на 'выходе обыч- .ного АЦП. 3.2.5. Адаптивная дифференциальная импульсно-кодовая модуляция (АДИКМ) Гибридную форму аналого-цифрового преобразователя, в кото- которой сочетаются дифференциальные свойства дельта-модулятора и двоичное представление чисел, характерное для ИКМ, можно по- получить, описывая ошибку аппроксимации не одноразрядными, а многоразрядными числами [54, 93]. Рассмотрим, например, при- применение 3-разрядного кода. В этом случае информация о величине ошибки передается одним из восьми чисел, что обеспечивает го- гораздо более высокое разрешение по сравнению с простой схемой, где определялся только знак ошибки. Однако для поддержания скорости создания информации на прежнем уровне частоту диск- дискретизации необходимо понизить в три раза. Главное преимущество АДИКМ состоит в том, что адаптация на каждом интервале дискретизации производится на основании большего количества информации. Так, в упомянутом примере ве- величина ошибки может попадать в один из четырех диапазонов (плюс знак). Каждому из этих диапазонов можно сопоставить масштабный множитель, служащий для адаптивного изменения шага квантования. Для речевых сигналов обычно применяются множители 0,9; 0,9; 1,25; 2. Так, если предшествующее двоичноо число имело вид 101, то на следующем интервале дискретизации шаг квантования будет уменьшен до 0,9 от прежней величины. Ес- Если же поступило число 111, что указывает на недостаточную ско- скорость изменения выходного сигнала, размер шага будет увеличен в два раза. В зависимости от статистических свойств входного сигнала могут применяться и другие множители. Схемы с запоми- запоминанием более чем одного предшествующего числа, по всей види- видимости, еще не изучались. Преобразователи с АДИКМ подробно исследовались примени- применительно к речевым сигналам, причем для сравнения был взят пре- преобразователь с ИКМ и безынерционным сжатием характеристики. По критерию минимальной мощности ошибки квантования АДИКМ лучше ИКМ примерно на 1,5 разряда. Прослушивания, однако, по- показали, что выигрыш близок к 2,5 разряда. Сигнал с 4-разрядной АДИКМ оценивался выше, чем сигнал с 6-разрядной логарифми- логарифмической ИКМ, но виже, чем сигнал с 7-разрядной логарифмической ИКМ [56]. Снижение скорости создания информации составляло '(по крайней мере для речевых сигналов) ~40%. Данных по 'применению АДИКМ в системах воспроизведения "Музыки нет, но, основываясь на измерениях, проведенных с сину- синусоидальными сигналами, можно едеяать некоторые выводы. Сиг-
60 Глава 2 нал частоты 800 Гц был пропущен через 4-разрядный преобразо- преобразователь с АДИКМ, имеющий полосу шириной 2,8 кГц; отношение S/yVCc получилось равным 20 дБ. По этим данным можно оценить характеристики преобразователя применительно к музыке, для че- чего необходимо учесть коэффициент 9 дБ/октава, относящийся к увеличению частоты дискретизации, и W0*5, учитывающий расши- расширение полосы. Тогда 8-разрядный преобразователь с АДИКМ при частоте дискретизации 50 кГц должен обеспечить для сигнала с частотой 800 Гц в полосе 15 кГц отношение S/JVCC) равное 64 дБ. Скорость создания информации, равная 0,4 Мбит/с, сравнима или даже меньше соответствующей скорости в системе с 10-разрядной: ИКМ с плавающей запятой, где два разряда задают масштаб шка- шкалы, а частота дискретизации равна 35 кГц. Можно ожидать даль- дальнейшего улучшения характеристик при использовании в алгорит- алгоритме адаптации более одного предшествующего отсчета. Однако в силу происходящего при этом усложнения аппаратуры пока неяс- неясно, будет ли такой способ применяться на практике. 2.2.6. Психоакустические факторы Качество работы различных преобразователей трудно сравни- сравнивать аналитически, поэтому полезно провести такое сравнение психоакустическими методами. Определив необходимую скорость создания информации для гипотетического преобразователя, со- согласованного со свойствами человеческого слуха, можно оценить, насколько обычные аналого-цифровые преобразователи отлича- отличаются от идеального. Это отличие определяет показатель, который часто применяют для оценки качества речевых систем. Можно,, например, задать вопрос: чему равна скорость создания информа- информации в преобразователе, идеально согласованном с человеческой слуховой системой? Этот вопрос можно рассматривать как относи- относительно всех звуковых сигналов, полностью перекрывающих дина- динамический и частотный диапазоны слуха, так и применительно к более узкому кругу сигналов, называемых обычной музыкой. В обоих случаях оптимальным будет преобразователь, который создает минимум ошибок, замечаемых человеком. Музыка пред- представляет собой класс ограниченных звуковых сигналов, посколь- поскольку она создается при возбуждении механических резонансов или имеет вид ограниченных во времени ударных звуков. Преобразо- Преобразователь, предназначенный для широкого класса всех звуковых сиг- сигналов, даст, конечно, более универсальные результаты, но при проектировании звуковоспроизводящих систем широкого назначе- назначения обычно стараются сохранить их стоимость в разумных преде- пределах. Оптимальным является преобразователь, у которого скорость создания информации уменьшена до такого минимального значе- значения, при котором различие между квантованным и неквантован-
Цифровая обработка звуковых сигналов ным сигналами не воспринимается на слух. Для достижения этой цели необходимо глубокое понимание психоакустических эффек- эффектов, роздаваемых различными видами ошибок преобразования. К сожалению, полной модели слухового восприятия не существу- существует, а есть лишь обширная литература по этим вопросам, где опи- описываются различные явления. При изучении кодирования звуковых сигналов наиболее по- полезными являются исследования, посвященные обнаружению сиг- сигналов в различных условиях [16, 82]. Вообще для каждой частоты акустического сигнала существует определенный уровень, ниже которого он не слышен. В присутствии другого сигнала этот порог значительно повышается. В первом случае (без мешающего сигна- сигнала) определяется такой абсолютный порог слышимости, что звук заданной частоты с уровнем, не превышающим этого порога, со- совершенно не слышен. На рис. 2.6 показаны пороговые уровни для людей с нормальным слухом [124]. Из приведенных кривых вид- видно, что область наибольшей чувствительности слуха занимает ди- диапазон от 1 до 5 кГц. На более высоких частотах чувствитель- чувствительность слуха уменьшается, и на частоте 15 кГц она на 20 дБ мень- меньше максимальной. Аналогично возрастает порог чувствительности, на низких частотах. Во втором случае имеет место маскировка сигнала, когда присутствие одного звука затрудняет восприятие другого звука. При этом происходит сдвиг порога восприятия. Если звучат длинные периодические сигналы, то звук с данной ча- частотой маскирует сигналы на соседних частотах и делает их со- совершенно неслышными. Кратковременные ударные звуки заглуша- заглушают сигналы, звучащие до и после соответствующего переходного- процесса. В обоих случаях звуковой сигнал может полностью за- заглушить как шум квантования, так и другие звуковые сигналы. Это позволяет при разработке АЦП игнорировать те сигналы, ко- которые будут замаскированы, а также не обращать внимания на шум квантования, возникающий в АЦП, если он не будет слышен на фоне полезного сигнала. На рис. 2.7 приведены результаты экспериментов по маски- маскировке сигналов в частотной области [18]. Группе людей давали возможность слушать звуковой сигнал на фоне синусоидального- колебания частоты 1200 Гц с уровнем звукового давления (УЗД), равным 80 дБ. Частота и амплитуда контрольного тона изменя- изменялись, чтобы найти область, в которой он не воспринимается. На графике эта область отмечена словами «только помеха». В ней происходит полная маскировка и слышен только звук с частотой 1200 Гц. Вне этой области контрольный сигнал прослушивается как отдельный тон или в виде биений. Если маскирующий тон заменяется на узкополосный шум [19], то получается несколько иной результат (рис. 2.8). Для музыки такой вид сигнала более характерен, чем одночастотный чистый тон. Из представленных на рис. 2.8 кривых видно, что область
•62 Глава 2 100 toooo 1000 Vacmoma, Гц Рис. 2.6. Линии одинаковой громкости. ^Каждая кривая соединяет уровни синусоидальных сигналов, воспринимаемые на слух как одинаковые по громкости. Нижняя кривая является порогом слышимости (по Флетчеру и Мансону). 1 I 1 t 90 80 70 № 50 40 30 20 I 10 400 \ \ Ч \/й Ураве Hb ПОЛ 1BXU Смесь\ //^4// меха, н% umoHpt, ^ но с mi 1 Помеха и контроль- / ный тон / / кт-Я 70Н/<О чаи \ и ч 1 См есб тонов I 'i ь тон итонрютс/тК \. ной частошиГх \//амеха. и ризносткай Тальке помеха тон \ чаете У, г г Смесь танов I I I ~+-l—I оме на, к чльныйг тонраз ной час \ ты \ Ml 10/ но mi 4 i Ч 1 А// Лу % BOO 800 1000 1200 F00 Уастота контрольного тона 2000 2400 3200 4000 Рис. 2.7. Маскировка контрольного синусоидального сигнала (с переменной ам- амплитудой и частотой) синусоидальной помехой частоты 1200 Гц с уровнем зву-. кового давления 80 дБ выше порога слышимости. Если контрольный тон опускается в область, лежащую ниже сплошной линии, то он не вляяет на слышимость помехи. Выше сплошной линии контрольный тон создает сложные- эффекты, которые воспринимаются или как би&ния, или как смесь тонов, или как то и дру- другое вместе. [Из работ Ликлайдера (^51), Флетчера A929)), Уэгела и Лэйна [18]. Воспро- Воспроизведено с разрешения John Wiley and Sons, Inc., D. Van Nostrand Company, Bell Telepho» ne Laboratories.)
Цифровая обработка звуковых сигнала» 63 спектра, в которой наблюдается маскировка, в сильной степей» зависит от амплитуды заглушающего сигнала. Чем больше еп> амплитуда, тем шире диапазон маскировки. Обширные сведения- 0 маскировке при различных сочетаниях свойств заглушающего- (маскирующего) и контрольного сигналов приведены в рабо- работе [82]. Другим важным явлением является маскировка во временной; области. В этом случае помехи могут помешать восприятию более- слабого сигнала, звучащего примерно в это же время. Если гром- громкий звук маскирует следующий за ним слабый звук, то явление- называется маскировкой вперед; оно может продолжаться до» 250 мс. Границы областей маскировки (рис. 2.9) в логарифмичес- логарифмическом масштабе изображаются линиями, близкими к прямым [17]. Громкий звук может также маскировать звук, воспроизводимый» до него; это явление называется маскировкой назад, его длитель- длительность составляет ~20 мс [125]. Из вышеприведенных результатов следует, что для узкополос- узкополосных сигналов необходимое отношение сигнал/шум 5/Л/сс состав- составляет лишь ~30 дБ. Предположим, например, что входной сигнал пропущен через гребенку полосовых фильтров и верхний сигнал! каждого фильтра преобразован в цифровую форму. Требования! к S/Ncc и, следовательно, число разрядов, необходимое в каждом АЦП, определяются условиями различимости шума, находящегося- в полосе каждого фильтра. Из рис. 2.8 видно, что в присутствии' сигнала с уровнем 80 дБ в такой узкой полосе будет полностью' заглушён любой сигнал или шум с уровнем, не превышающим 50 дБ. Поэтому для достижения заданного отношения S/Ncc в-- принципе требуется только шесть разрядов. Проблему обеспече- обеспечения динамического диапазона в каждой из частотных полос мож- можно решить с помощью какой-либо методики преобразования с по- поблочно плавающей запятой, описанной ранее. Длительность откли- отклика системы с плавающей запятой определяется временем маски- маскировки вперед, которое сравнительно велико. Поэтому условие по- получения большого S/N6c не очень влияет на выбор скорости созда- создания информации. Ширина этих частотных поддиапазонов, называ- называемых критическими полосами, увеличивается с ростом частоты1 [87]. Критические полосы имеют ширину —'.100 Гц на частотах ДО' 1 кГц и расширяются постепенно до 2 кГц на частоте 10 кГц. По- Поведение сигналов в критических полосах довольно сложное, ш> анализ имеющихся данных приводит к выводу, что сигнальные- составляющие, попадающие в одну полосу, проще исследовать,, чем набор таких составляющих в различных полосах. Описанная система отличается от системы с поблочно плаваю- плавающей запятой только тем, что сигналы в каждой из частотных по- полос обрабатываются независимо друг от друга. Недостатком обыч- обычной системы является то, что (при сжатии характеристики АЦП для всего диапазона) отношение S/Nzc, равное 60 дБ, не гаранти-
Глава 2 ZOO 300 400 500700 1000 2000 3000 5000 Частота, Гц юооа. Рис. 2.8. Области маскировки сигналов узкополосной шумовой помехой на ча- частоте 410 Гц с полосой 90 Гц при различных мощностях помехи. Контрольный сигнал, лежащий ниже кривой, не слышен. Полоса глушения расширяется с увеличением мощности помехи. (Воспроизведено из работы [19] с разрешения Американского акустического общества.) Назад - — —" —-^J> 1 и У w ч 500 Гц 1000 Ги 4000 Вперед 100 50 20 10 0 0 10 20 Интервал маскировки, мс 50 ЮО Рис. 2.9. Маскировка вперед и назад контрольного тона белым шумом. Звучал короткий отрезок шумового сигнала, а после него (маскировка вперед) или перёд зшм (маскировка назад) включался контрольный тон с меньшим уровнем. Показана зави- зависимость сдвига порога об'наружимости контрольного тона от интервала между тоном и по- помехой. Маскировка проявляется еще сильнее, если помеха имеет не широкополосный шумо- шумовой, а гармонический характер. (Воспроизведено с разрешения Американского акустического общества из его журнала, том 34, № 8, 1962.)
Цифровая обработка звуковых сигналов 65 рует отсутствия слышимых шумов. Сильный сигнал, сосредоточен- сосредоточенный в одном конце диапазона, не повлияет на слышимость широ- широкополосных шумов. Низкочастотный сигнал с большой амплитудой приведет к явному усилению шума квантования, так как подобный сигнал не создает эффективной маскировки. Эта проблема разре- разрешается путем сжатия характеристики АЦП в отдельных узких полосах. Аналогичные решения были найдены при создании клас- классических нецифровых систем шумоподавления [38, 88], хотя в та- таких системах применялись частотные каналы гораздо большей ширины, чем критические полосы. Сигнал, поступающий из каждого полосового фильтра, дискре- тизуется с частотой, вдвое превышающей ширину полосы фильтра, и полученные отсчеты подвергаются многоканальному уплотнению. Эквивалентная частота дискретизации при этом не изменяется, так как сумма всех частот по-прежнему равна удвоенной ширине полосы всей системы. Исходя из вышеизложенного, можно ожи- ожидать, что скорость создания информации здесь будет близка к 0,2 Мбит/с, а не к 0,3 Мбит/с, характерной для системы с поблочно плавающей запятой. Некоторое дополнительное сокращение скорости поступления информации можно получить, если учесть, что соседние частотные каналы могут сильно маскировать друг друга. Поэтому можно сделать адаптивным распределение числа разрядов между канала- каналами. Тому из каналов, который заглушается мощным сигналом из соседних каналов или сильным сигналом в удаленном высокочас- высокочастотном канале, можно отвести меньше разрядов. Подобный адап- адаптивный метод довольно трудно описать математически и может оказаться, что его будет очень трудно реализовать, но тем не ме- менее можно надеяться, что он позволит сократить скорость поступ- поступления информации на 20—30%. Проведя этот предварительный анализ, можно сделать вывод, что оптимальный АЦП для одной монофонической программы, в котором используется психоакустическое согласование, по всей видимости, будет иметь скорость создания информации порядка 0,15 Мбит/с. Это примерно втрое лучше, чем при использовании 15-разрядного АЦП с постоянной характеристикой и частотой дис- дискретизации 35 кГц, или вдвое лучше, чем для системы сжатия с плавающей запятой. Пока не ясно, будет ли усложнение аппаратуры оправдано уменьшением объема информации. В некоторых случаях, когда стоимость передачи или хранения информации высока, сокраще- сокращение объема информации, по-видимому, компенсирует дополнитель- дополнительные расходы. Так, например, для фонотеки, где хранится 10 000 рулонов пленки, тройное сокращение объема пленки может ока- оказаться достаточной компенсацией усложнения аппаратуры. Анало- Аналогично стоимость линии связи может значительно перекрыть стои- 5-359
66 Глава 2 мость аппаратуры сжатия, так как, например, 5000 км высокока- высококачественной линии связи стоят чрезвычайно дорого. 2.3. Звукозапись Значительная, а может быть и большая, часть всей музыки в настоящее время приходит к слушателям с помощью звукозаписи. Даже музыка, передаваемая по радио, почти полностью воспроиз- воспроизводится с грампластинок. Поэтому звукозапись является важной областью применения техники звуковоспроизведения, так как она во многом определяет качество сигнала, воспроизводимого в доме. 2.3.1. Цифровые магнитофоны Студийная запись музыки сейчас практически полностью вы- выполняется на нескольких дорожках, причем на каждой дорожке записывают партию одного исполнителя или группы исполнителей. Кроме того, отдельные части музыкального произведения могут быть записаны в разное время. Для создания окончательной запи- записи могут потребоваться разрезание и склейка пленки, а также пе- перезапись исходного материала с многих отдельных дорожек. Каж- Каждое проигрывание магнитной записи на обычном аналоговом маг- магнитофоне приводит к ухудшению сигнала, и окончательная запись содержит сумму всех помех и искажений, внесенных на каждом этапе редактирования и монтажа (микширования) записей. Преимущества цифровой магнитной записи легче заметить, проанализировав свойства обычных аналоговых систем. Студийные магнитофоны основаны на тех же принципах, что и бытовые, но имеют гораздо большую надежность. Тонкая лента, покрытая маг- магнитным материалом, на постоянной скорости протягивается возле записывающей головки. Головка представляет собой электромаг- электромагнит, спроектированный так, что его магнитное поле концентриру- концентрируется в узком зазоре, с которым соприкасается пленка. Записываю- Записывающая головка создает магнитное поле, модулированное музыкаль- музыкальным сигналом, и это поле ориентирует на пленке магнитные домены. В результате на пленке образуется сравнительно устойчи- устойчивая физическая структура, отображающая записываемое музы- музыкальное произведение. При воспроизведении магнитные свойства этой структуры воспринимаются головкой за счет электромагнит- электромагнитной индукции и создается электрический сигнал. Искажения воз- возникают по двум основным причинам: 1) неидеальности характери- характеристик магнитного материала и магнитофонных головок и 2) несо- несовершенства механической системы для протяжки пленки с посто- постоянной скоростью. Магнитные материалы, из которых делаются пленки, восприим- восприимчивы к аддитивным шумам, а также имеют нелинейные передаточ- передаточные характеристики даже при оптимальных параметрах записыва-
Цифровая обработка звуковых сигналов ющего устройства [31]. В лучшем случае достигается S/Nec, рав- равное 70 дБ1*, если даже применяются специальные дополнительные шумоподавляющие устройства [38]. На высоких частотах динами- динамический диапазон ограничивается еще сильнее, если только длина волны записываемого на пленке сигнала не увеличена за счет по- повышения скорости протяжки (например, до 76,2 см/с). Шум, созда- создаваемый на пленке в процессе записи, не является стационарным, а модулируется сигналом, т. е. образует сложную модуляционную помеху [29]. При воспроизведении синусоидального сигнала, как правило, у синусоиды появляются боковые полосы, содержащие шумовой сигнал. Этот вид помехи очень заметен, когда частота сигнала близка к 1 кГц, где отношение S/NCc опускается ниже 40 дБ [30]. Недостаточно хорошее качество пленки и загрязнения на ней создают быстрые флуктуации амплитудной и фазовой ха- характеристик, особенно заметные в области высоких частот [33]. Эти флуктуации приводят к низкому качеству записи и отчетливо слышны на фоне чистых тонов таких инструментов, как орган или флейта. Любые эксцентриситеты во вращающихся частях лентопротяж- лентопротяжного механизма, таких, как ведущий вал с маховиком или инер- инерционные обводные ролики, приводят к непостоянству скорости движения ленты при записи и воспроизведении. Это создает час- частотную модуляцию, к которой ухо особенно чувствительно. Кон- Конструкторы студийных магнитофонов обычно стараются уменьшить детонации звука до уровня, меньшего 0,1%, особенно для флуктуа- флуктуации с частотой ~4 Гц [34]. Поддержание постоянной скорости протяжки связано с большими трудностями. Из-за нелинейной за- зависимости коэффициента трения между пленкой и головками (от натяжения пленки) при движении пленки могут наблюдаться мик- микроскопические рывки. Механические резонансы при движении сла- слабо натянутой ленты могут усиливать рывки. Подобную неравно- неравномерность, связанную с трением, можно уменьшить за счет пра- правильного расположения обводных роликов [30]. Из-за перечисленных трудностей, а также в силу неизбежной нестабильности и ненадежности аналоговых устройств магнитофо- магнитофоны с цифровой записью найдут широкое применение в технике студийной звукозаписи. Особенно это относится к изготовлению 11 Методика измерения S/A^c зависит от применяемых стандартов, которые неодинаковы в разных странах и даже в различных отраслях науки и техники. Так, например, максимальный сигнал можно определить как среднее квадрати- ческое значение (СКЗ) синусоидального колебания с частотой 1 кГц, которое со- создает гармонические искажения величиной 0,4; 1 или 3°/о- Частота может отли- отличаться от 1 кГц. Аналогично шум может быть спектрально-окрашенным и ха- характеризоваться максимальным, средним или средним квадратическим значени- значением. Иногда шум измеряется на чистой пленке, иногда — на размагниченной. Все эти варианты следует учитывать при оценке измеренного значения отношения 0; сравнение различных магнитофонов является весьма трудной операцией, измерения не производились в одинаковых условиях.
68 Глава 2 первичных записей и архивному хранению звукозаписей. Постро- Построено несколько экспериментальных систем цифровой магнитной за- записи [20, 22, 32]. Фирма Nippon Columbia уже приступила к вы- выпуску музыкальных записей, смонтированных с применением циф- цифровой магнитной записи. В скором времени следует ожидать по- появления серийных цифровых магнитофонов, предназначенных для звукозаписи. Принцип действия цифровых магнитофонов несложен (рис. 2.10). Сигнал в каждом из входных каналов подвергается низко- низкочастотной фильтрации, дискретизуется, и его отсчеты превраща- превращаются в числа с помощью одного из методов, рассмотренного выше. Потоки двоичных чисел уплотняются в один общий канал, при- причем вводятся дополнительные разряды для синхронизации, исправ- исправления ошибок, проверки на четность и поблочного нормирования. Образующаяся сложная последовательность двоичных цифр в мо- модуляторе преобразуется в соответствующую последовательность аналоговых импульсов. При воспроизведении все процессы проис- происходят в обратном порядке. Считанный с ленты сигнал декодиру- декодируется, из него выделяются служебные разряды, исправляются ошибки и производится разделение по каналам. Если полагать, что ошибок после исправления не остается, то качество восстановлен- восстановленного сигнала определяется только характеристиками АЦП и ЦАП. Хотя из-за неидеальности механизма протяжки скорость плен- пленки будет оставаться непостоянной, интервалы между воспроизве- воспроизведенными числами можно уравнять с помощью выходного буферно- буферного накопителя. Как показано на рис. 2.11, кольцевой накопитель заполняется с переменной частотой, пропорциональной скорости пленки, а считывание происходит с постоянной частотой, задавае- задаваемой кварцевым генератором. Очевидно, что если между этими ча- частотами в среднем имеется постоянная разница, то в некоторый момент накопитель опорожнится или переполнится. Чтобы этого не произошло, вырабатывается вспомогательный сигнал, описыва- описывающий степень заполнения накопителя и управляющий скоростью вращения сервопривода тонвала. Разность между входным и вы- выходным адресами, взятая по модулю емкости накопителя, вводит- вводится в простой цифро-аналоговый преобразователь. Различие меж- между этой величиной и напряжением, равным половине емкости на- накопителя, является сигналом ошибки, по которому управляется ос- основной сервопривод тонвала. Таким образом, если накопитель на- начинает опорожняться, сигнал ошибки приводит к увеличению ско- скорости протяжки, и наоборот, если накопитель заполняется слишком быстро, сигнал ошибки снижает скорость протяжки. Не- Необходимая емкость накопителя пропорциональна постоянной вре- времени сервопривода тонвала. Оказалось, что достаточно иметь на- накопитель емкостью в 100 слов [32]. Более трудной задачей является выбор плотности записи и обеспечение заданной вероятности ошибок, так как они зависят
11 Комму- Коммутатор и ТНЧ СЗО и АЦП Генератор лровероц- наго разряда fi/70/f 00~Ъ ния разр и накош deouvNt VUCSJ1 едине- ядов /X Разделитель канялре и ЦАП Блок обнару- обнаружения и ис- исправлении ошибок Нольиевоп синхраии- аируюший накопитель Мовулятор К записывающей головке О О, От считывающей головни Демоду - лятор Рис. 2.10. Блок-схема цифрового магнитофона. В каждом из трактов, где распространяется цифровой сигнал, передача отсчетов может происходить в последовательном или параллельном коде. Число линий, подходящих к за- записывающей или считывающей головке, равно числу дорожек.
70 Глава 2 Вход накопителя К регулятору скорости Опорный сигнал Выход накопителя Кольиевой накопитель Рис. 2.11. Кольцевое накопительное ЗУ для синхронизации сигнала при считыва- считывании цифровой магнитной записи. Кодовые комбинации (числа) поступают на вход накопителя из считывающей головки и заносятся в последовательные ячейки ЗУ. Числа последовательно считываются из накопи- накопителя и поступают в блок цифро-аналогового преобразования. от процесса записи на пленку. Низкая плотность записи увеличи- увеличивает помехоустойчивость при воспроизведении, но приводит к большему расходу пленки при записи. Наоборот, при высокой плотности записи пленка расходуется более экономно, зато повы- повышается вероятность ошибок. Поскольку цифровые магнитофоны предназначаются для высококачественных систем, все ошибки должны устраняться с помощью некоторого алгоритма обнаруже- обнаружения и исправления ошибок. При высокой плотности записи этот алгоритм должен быть весьма эффективным. Чтобы оправдать расходы на замену дорогостоящего сущест- существующего студийного оборудования, цифровые магнитофоны долж- должны обеспечить существенное повышение качества записей. Таким образом, можно полагать, что в каждом канале необходимо обес- обеспечить скорость обработки информации, по крайней мере равную 0,3 Мбит/с (если только не будут созданы более эффективные спо- способы сокращения избыточности). Тогда в 4-канальной системе по- потребуется скорость 1,2 Мбит/с, но скорее предпочтение будет отда- отдано 8-канальным системам, и уже сейчас применяются 16-каналь- ные студийные системы записи. Указанные скорости создания информации очень высоки для обычного магнитофона со скоро- скоростью протяжки 38,1 или 76,2 см/с. По этой причине лабораторный цифровой магнитофон для записи звуковых сигналов, описанный Сато [22], был построен на базе видеомагнитофона, у которого ширина полосы воспроизводимых частот гораздо больше, чем у обычных магнитофонов. Два звуковых сигнала, для которых ско- скорость потока информации составляла 1,28 Мбит/с, записывались на пленку шириной 25 мм при скорости протяжки 19,05 см/с. Эф-
Цифровая обработка звуковых сигналов 71 фективная скорость протяжки, однако, равнялась 1750 см/с, что достигалось за счет движения вращающейся головки, а фактиче- фактическая плотность записи составляла всего ~20 импульс/мм. Для за- записи восьми звуковых сигналов на такой же видеомагнитофон при скорости 38,1 см/с применялась более эффективная схема моду- модулятора [21]. Инженеры исследовательских лабораторий Британ- Британской радиовещательной корпорации Би-би-си построили экспери- экспериментальную систему на базе 16-дорожечного магнитофона [32]. Каждый из 16 кодовых разрядов записывался на отдельную до- дорожку при плотности записи ~20 импульс/мм. Вопрос о схемах модуляторов достаточно сложен и подробно рассматриваться здесь не будет. Дополнительные сведения можно найти в литературе [28, 39]. Схемы модуляторов разделяются на два различных класса: самосинхронизирующиеся и с внешней синхронизацией. Во втором случае для установления местоположе- местоположения каждого разряда необходим вспомогательный синхросигнал. В первом случае вся информация о расположении разрядов созда- создается в модуляторе. Ясно, что для таких схем предпочтительно при- применять самосинхронизирующиеся коды, поскольку запись опорных импульсов приводит к дополнительному расширению спектра сиг- сигнала. Если предположить, что в состав цифрового магнитофона включена какая-то система обнаружения и исправления ошибок, то выбор кода должен производиться только на основе критерия максимума скорости записи информации. Предел скорости опре- определяется пропускной способностью канала, в данном случае маг- магнитной пленки. Анализ этой величины связан с детальным иссле- исследованием ширины полосы пропускания и отношения SJNCC в кана- канале (пленке), но такие сведения трудно получить, и их нельзя при- применить в стандартной линейной модели, поскольку свойства плен- пленки далеки от идеальных. Передаточные характеристики пленки имеют сильную нелинейность и гистерезис, которые изменяются в зависимости от типа (и даже рулона) пленки, свойств магнитофон- магнитофонных головок и т. д. При этом также меняется отношение S/NCc- При заданной ширине пленки увеличение числа дорожек при- приводит к уменьшению ширины каждой из них. Это уменьшает 5/Л^бС, но плотность записи, измеряемая числом импульсов на квадратный миллиметр, увеличивается, поскольку S/A^c часто ос- остается больше необходимого минимума. К моменту написания книги эти вопросы еще не были проработаны в достаточной сте- степени, и, вероятно, характеристики экспериментальной системы да- далеки от оптимальных. Опыт разработки стандартных цифровых магнитофонов для вычислительных машин малопригоден для выяснения предельных возможностей цифровой звукозаписи. Запо- Запоминающие устройства на магнитных лентах для ЭВМ. проектиру- проектируются на основе повышенных технических требований и должны обеспечивать минимальные вероятности ошибок. Как правило, в них применяются несамосинхронизирующиеся коды и имеется от-
72 Глава 2 , дельная синхродорожка. Плотность записи на каждой дорожке составляет всего 32 импульс/мм. Можно, однако, изготовить экспе- экспериментальные образцы магнитофонов с плотностью записи до 1200 импульс/мм, и считается возможной запись с плотностью до 3200 импульс/мм. Методы записи — воспроизведения с исправлением ошибок мо- могут оказаться весьма полезными с точки зрения снижения требо- .ваний к плотности записи, поскольку в этом случае плотность раз- размещения информации на пленке часто можно существенно повы- повысить, не опасаясь потерь информации. Простой метод исправления ошибок в цифровой магнитной записи состоит во введении допол- дополнительного разряда, служащего для проверки на четность пяти старших разрядов отсчета, и использовании какого-нибудь метода скрывания обнаруженной ошибки [22, 32]. Такое скрывание мож- можно выполнить путем линейной интерполяции между двумя сосед- соседними отсчетами (интерполяция первого порядка) или путем за- запоминания и повторения предыдущего отсчета (интерполяция ну- нулевого порядка), как это делалось [23] при передаче сигналов на большие расстояния (см. разд. 2.4.2). Однако такие методы мало- малопригодны для применения в цифровых магнитофонах, где ошибки обычно появляются пакетами, а не поодиночке. Скрываемые ошибки незаметны на слух, если они случайны и появляются с от- относительной частотой порядка 1 -10 5 [25]. Ошибки в магнитных записях чаще всего получаются из-за де- дефектов пленки и загрязнений. Экспериментальные данные пока- показывают, что подобные «провалы» в воспроизведенном сигнале имеют длительность порядка 100 мкс, если скорость протяжки равна 76,2 см/с [33]. При плотностях записи 400 импульс/мм та- такие пропадания будут создавать пакеты ошибок объемом до 50 двоичных цифр. Поэтому указанный простой подход вряд ли позволит справиться с ошибками, концентрация которых столь ве- велика. Вместо него следует использовать какой-либо алгоритм, специально предназначенный для исправления пакетов ошибок. Ни в одном из вышеупомянутых экспериментальных цифровых маг- магнитофонов такого исправления ошибок не было предусмотрено, поэтому их следует рассматривать как не совсем совершенные. Поскольку вопрос об исправлении ошибок является сложным и обширным и выходит за рамки данной книги, рекомендуем чи- читателю обратиться к соответствующей литературе [26, 83]. Ис- Исправление ошибок основано на дополнении информационных раз- разрядов, образующих «сигнальную» последовательность, некоторым количеством избыточных проверочных разрядов. В приемнике эта избыточность позволяет исправить ошибки. Степень избыточности можно описать расстоянием Хемминга, т. е. числом разрядов ко- кодовой последовательности, при изменении которых получается другая допустимая кодовая последовательность. Сигнальные по- последовательности, в которых нет избыточных разрядов, т. е. не пре-
Цифровая обработка звуковых сигналов 73 дусмотрена защита от ошибок, имеют расстояние Хемминга, рав- равное 1, поскольку изменение любой двоичной цифры превращает одну допустимую последовательность в другую, столь же возмож- возможную и допустимую. В качестве противоположного примера рас- рассмотрим две единицы информации, представленные кодовыми комбинациями 111000 и 000111. Расстояние Хемминга равно ше- шести, поскольку необходимо изменить шесть разрядов, чтобы прев- превратить одно сообщение в другое. Такая степень избыточности позволяет исправлять ошибки в двух разрядах, а также обнару- обнаруживать, но уже без возможности исправления, ошибки в трех раз- разрядах. В приведенном примере избыточность обходится очень до- дорого, поскольку каждая двоичная единица информации кодирует- кодируется в комбинацию из шести двоичных цифр. Одним из первых появившихся кодов с исправлением ошибок является блочный код Хемминга [84]. Кодируемая информация разбивается на блоки объемом по k разрядов. На основе этих k разрядов определяются значения п — k избыточных разрядов, ко- которые включаются в передаваемый блок. Поскольку наличие ошибки в любом из я разрядов блока должно обнаруживаться по информации, содержащейся в п — k избыточных разрядах, то необходимо, чтобы выполнялось следующее неравенство: Так, например, четыре избыточных разряда позволяют описать одну из 16 возможных ситуаций: одиночная ошибка в одном из разрядов 15-разрядного блока или отсутствие ошибок1* в блоке. Аналогично для исправления единственной ошибки в 31-разряд- 31-разрядном блоке нужно отвести для целей контроля пять разрядов. Другой характеристикой кода является его эффективность, опре- определяемая отношением скорости передачи полезной информации к фактической частоте посылок. Для 31-разрядного блока, напри- например, эффективность равна 0,84. Однако помехозащищенность об- обратно пропорциональна эффективности. Так, эффективность 255-разрядного блочного кода равна 0,97, но в каждых 255 разря- разрядах можно исправить только одну ошибку. Условие случайности моментов появления ошибок не требуется Для другого класса кодов, называемых кодами с исправлением пакетов ошибок. Существует достаточно много видов таких кодов, Различающихся характером исходных предпосылок об особенно- Стях пакетов ошибок и сложностью реализации. Обзор таких ко- Дов дан в работе [85]. Код с исправлением пакетов ошибок про- ' Точнее, этот код позволяет обнаружить отсутствие в блоке одиночных Шибок. Если искажено несколько разрядов блока, то результат будет выгля- адть как другое сообщение с единственной ошибкой или без нее. — Прим. перев.
74 Глава 2 стейшей формы можно непосредственно получить на основе слу- случайных кодов, хотя они, как правило, оказываются или малоэф- малоэффективными, или трудными для реализации. В принципе код Хем- минга можно превратить в код, исправляющий пакет ошибок. Для этого нужно поочередно передавать разряды из нескольких блоков. Допустим, что информационная последовательность разбита на 63 блока длиной по 57 разрядов каждый. Как уже отмечалось, к каждому блоку нужно добавить по шесть проверочных разрядов. Тогда на приемном конце в каждом блоке можно будет исправить по одной ошибке. Вместо того чтобы по очереди передавать каж- каждый блок целиком, передадим сначала все первые разряды, затем все вторые и т. д. Поскольку соседние разряды одного блока в процессе передачи будут разделены 62 разрядами других блоков, любой пакет ошибок длиной не более 63 разрядов сможет иска- исказить в каждом блоке не более одного разряда. На практике ошибки в цифровых магнитофонах получаются вследствие того, что 1) пропадания сигнала создают пакеты оши- ошибок и 2) фоновый шум приводит к появлению случайных ошибок. Код Хемминга с переплетением разрядов позволяет исправлять ошибки обоих видов, поскольку переплетение не влияет на воз- возможность исправления одиночных ошибок. Кроме того, пакеты ошибок, получающиеся при попадании в тракт соринок или из-за плохого качества пленки, вряд ли будут появляться очень часто. Один пакет ошибок на каждые 100 000 двоичных цифр будет, по всей видимости, указывать на низкое качество пленки. Однако в совокупности пакеты ошибок и одиночные ошибки, вызванные фо- фоновым шумом, могут создать значительную неисправленную ошибку. Пакет размером в 30 разрядов приведет к тому, что в 30 исходных блоках нельзя будет допускать одиночные случайные ошибки. Существуют более сложные коды, которые позволяют исправлять и пакеты, и одиночные ошибки. Пример рекурсивного кода можно найти в работе [85]. Помимо всего прочего код та- такого типа сравнительно просто реализуется в аппаратуре. К сожа- сожалению, в литературе почти отсутствуют экспериментальные ре- результаты по применению таких кодов с исправлением ошибок для цифровых магнитофонов с высокой плотностью записи. Поскольку потенциальные возможности цифровой записи го- гораздо шире, чем аналоговой, то можно ожидать, что звукозапи- звукозаписывающие фирмы в конечном итоге перейдут на цифровую техни- технику. К числу ее достоинств относятся следующие: 1. Возможность получения сколь угодно больших значений S/Л^бс и SINCC, ограниченных только характеристиками АЦП и плотностью записи. 2. Полное отсутствие детонаций звука, так как равномерность появления отсчетов обеспечивается кварцевой стабилизацией. 3. Отсутствие гармонических искажений вблизи верхнего края пияпазона.
Цифровая обработка звуковых сигналов 75 4. Отсутствие перекрестных искажений1' при многоканальной записи. 5. Небольшие колебания намагниченности пленки не вызыва- вызывают флуктуации амплитуды сигнала. 6. Ширина диапазона может доходить до частоты Найквиста. 7. Отсутствие сложных шумовых боковых полос вблизи часто- частоты сигнала, связанных с мультипликативным характером помех. 8. Отсутствие копирэффекта2) в слоях пленки. Все это совершенно недостижимо в аналоговых устройствах и является крайне желательным даже с учетом дополнительных расходов. 2.3.2. Редактирование и монтаж записей После того как отдельные части музыкальной программы за- записаны, из них необходимо составить единое музыкальное произ- произведение. Куски программы могут быть записаны многократно, и в окончательную запись эти дубли могут войти как целиком, так и по частям. В случае многодорожечной записи отдельные дорожки должны быть отредактированы и смонтированы в окончательную запись. В процессе редактирования и монтажа (микширования) по усмотрению звукооператора и режиссера могут выполняться фильтрация, изменение громкости и другие операции по обработ- обработке сигналов. Процесс микширования может быть крайне сложным. Предпо- Предположим, например, что стереофоническая запись (оригинал) состав- составляется из рабочего материала, записанного на 16 дорожках. С самого начала необходимо решить, какой инструмент или груп- группа инструментов будут звучать в каждом из двух (или четырех) каналов окончательной записи. Отсюда следует, что сигналы со всех дорожек должны быть смешаны в разных пропорциях и под- подведены к каждому из двух или четырех каналов, причем эти про- пропорции с течением времени могут изменяться. Кроме того, сигнал с каждой дорожки может подвергаться от- отдельной обработке. Это может быть простое изменение громкости, фильтрация или введение специальных эффектов. Параметры фильтра, изменяющего тембр, могут быть одинаковыми для всей дорожки или же меняться во времени, если различные отрывки музыкального произведения требуется корректировать по-разному. '' Перекрестные искажения вызываются попаданием сигнала в чужой канал из-за наводок на магнитные головки или из-за паразитных связей в усилителях. Цифровая система допускает минимальную развязку 20 дБ, а аналоговая систе- система требует 60 дБ. 2) Копирэффект является своеобразным видом перекрестных искажений меж- Ду соседними слоями пленки. При намотке пленки прилегающие слои намагни- намагничивают друг друга. Как и в случае перекрестных искажений, в аналоговой си- системе допустим уровень — 60 дБ, а в цифровой — 20 дБ.
76 ^ Глава 2 В широких масштабах могут применяться специальные эффекты, такие, как искусственная реверберация. В результате всех этих действий получается музыка, которая возникла на магнитной пленке и никогда в таком виде не исполнялась, причем качество звука, который воспроизводится перед слушателем, ограничивает- ограничивается только возможностями электроники. На микшерный пульт, применяемый в описанном процессе, мо- может быть выведено более сотни органов регулировки и подстрой- подстройки. Оператор должен установить те их положения, которые необ- необходимы на каждом этапе программы, и производить в ходе запи- записи все необходимые изменения. Регулировки могут быть настоль- настолько сложными и многочисленными, что запомнить их бывает про- просто невозможно. Весьма трудной задачей оказывается также выполнение регулировок в реальном масштабе времени. Для облегчения монтажа записей в нескольких фирмах были созданы автоматизированные микшерные пульты. Эти устройства по существу являются небольшими специализированными вычис- вычислительными машинами, предназначенными для управления раз- размещенными на пульте органами регулировки. Оператор может запрограммировать начальные положения регуляторов, а также моменты изменения этих положений. Обработка сигналов, однако, по-прежнему производится аналоговыми средствами. При обычных редактировании и монтаже, если даже они про- производятся с применением автоматизированной аппаратуры, встре- встречается много трудностей. Одна из них заключается в необходимо- необходимости приобретения большого количества аппаратуры и связанных с этим расходах. В аналоговой схеме на каждом интервале време- времени может обрабатываться только один сигнал. С пульта прихо- приходится управлять шестнадцатью и более каналами, причем для каждого канала необходимы регулировки уровня, управляемые фильтры и т. д. Конечно, не все возможные регулировки исполь- используются одновременно. Дополнительная аппаратура обработки сиг- сигналов, как правило, стоит весьма дорого, и студия в состоянии приобрести лишь ограниченное число таких приборов. Поэтому пл мере надобности их приходится переносить из одной аппаратной в другую. При работе с ними приходится заново присоединять все кабели, как только потребуется создать специальный эффект в каком-то другом канале. Поэтому не очень сложные устройства по переключению и обработке сигналов вводятся в каждый канал, что удобно, но дорого. Специализированные же устройства, как встроенные в пульт, так и дополнительные, имеются лишь в огра- ограниченном количестве, и их не хватает на все каналы. Вторая группа трудностей связана с ограниченными возможно- возможностями аналоговых устройств. На микшерном пульте можно выпол- выполнить только те действия, которые были предусмотрены при его создании. Диапазон возможностей дополнительных устройств для создания специальных эффектов также ограничен параметрами
Цифровая обработка звуковых сигналов 77 схем и пределами регулировок, введенных при изготовлении при- приборов. Любые изменения или усовершенствования в способах об- обработки сигналов связаны либо с переделкой существующей аппа- аппаратуры, если это возможно, либо с покупкой новой. Несмотря на сложность современной акустической техники, ее возможности во многих отношениях ограничены. Система, в которой применяется цифровая обработка с про- программируемым выполнением операций, позволяет преодолеть мно- многие трудности, характерные для микширования с применением обычной аппаратуры. Небольшую вычислительную машину можно запрограммировать так, чтобы она в каждом канале выполняла цифровую обработку сигналов, а также управляла режимом и син- синхронизацией процесса смешивания сигналов. В отличие от анало- аналоговых пультов цифровые системы обеспечивают при обработке сигналов неограниченную гибкость. Можно запрограммировать любые характеристики цифровых фильтров и менять их с учетом конкретной ситуации и характера музыкальной программы. Изме- Изменение параметров фильтров и регулировку громкости можно син- синхронизировать с элементами числовой последовательности, пред- представляющей собой музыкальную программу, и такая синхрониза- синхронизация может быть введена с точностью до конкретного отсчета. Так как все эти операции хранятся в машине в виде программ, можно добавлять, изменять или совсем отменять те или другие операции по обработке сигналов, что позволяет экспериментировать со все- всевозможными эффектами, не испортив предыдущую программу. Кроме того, в архиве вместе с музыкальной записью можно хра- хранить точную схему обработки. Цифровые системы являются мощным средством для обеспече- обеспечения наглядного представления и анализа музыки. Если в систему входит устройство графического отображения, то на нем можно одновременно показывать параметры входного и обработанного сигналов, т. е. непосредственно наблюдать, как обработка влияет на сигнал. В цифровой системе легко выполняется спектральный анализ сигналов, что позволяет синтезировать характеристики фильтров в частотной области для создания специальных звуковых эффектов. Цифровая техника дает возможность показывать на микшерном пульте положение регуляторов, задающих способ об- обработки сигнала, и отмечать моменты изменения их положения. В любой большой системе одной из главных проблем является взаимодействие человека с машиной, а устройство отображения, управляемое ЦВМ, позволяет отображать информацию гораздо лучше, чем это получается на любом аналоговом пульте. Еще одним достоинством цифровых систем монтажа записей является возможность непосредственной обработки цифровых за- записей. В обычных микшерных пультах для обработки записи тре- требуется преобразовать числовую последовательность в аналоговый сигнал, а потом для хранения снова преобразовать его в цифро-
78 Глава 2 __ вую форму. Если обработка происходит в цифровой форме, то можно не опасаться искажений сигнала, вызванных многократны- многократными кодированиями и декодированиями. Как показывает опыт, для успешного проведения цифрового монтажа музыкальной програм- программы необходимо иметь высококачественный цифровой магнитофон. Наряду с достоинствами цифровая обработка музыки имеет и явные недостатки. Для обработки сигналов требуется вычислитель- вычислительная машина с очень высоким быстродействием. Скорости вычис- вычислений на несколько порядков превышают возможности серийных мини-ЦВМ. При обработке в реальном масштабе времени также встречаются трудности, поскольку увеличивается время обработки и становятся необходимыми промежуточные запоминающие уст- устройства. В малой ЦВМ. типичным ЗУ большой емкости является магнитный диск с емкостью порядка 106 чисел, что соответствует 30-секундной широкополосной записи. Это существенно ограничи- ограничивает реальные возможности систем, которые можно создать на базе современной техники. Построены специализированные вычислительные машины, предназначенные для обработки звуковых сигналов (см. разд. 2.3.3), но стоимость этих машин очень высока. Более того, такие несложные операции, как сжатие динамического диапазона или выравнивание спектра, могут занимать большую часть машинно- машинного времени и на цифровое смешение сигналов, поступающих с разных дорожек, все равно придется отводить специальные интер- интервалы времени. Тем не менее Стокхэм [126, 127] построил цифро- цифровую систему для микширования сигналов на основе машины PDP 11/45 и дискового ЗУ емкостью 800 Мбит. Этой емкости хватает для записи 26-минутного одноканального сигнала с частотой дис- дискретизации 32 кГц, квантованного в 16-разрядные числа. Разра- Разработана универсальная система программирования, позволяющая при микшировании выполнять такие операции, как регулировка уровня, панорамирование и выравнивание спектра. Система Сток- хэма предназначена для работы с цифровым магнитофоном, при- причем перед обработкой отрезки музыки переписываются в ЗУ вы- вычислительной машины. Для хранения и последующего использова- использования результаты обработки сигналов записываются на магнитную ленту. Поскольку в системе все операции выполняются в цифро- цифровой форме, многократное повторение операций обработки сигна- сигналов не приводит к характерному для таких случаев ухудшению качества. С точки зрения качества цифровой монтаж несомненно лучше аналогового, но это улучшение связано со значительными материальными затратами. 2.3.3. Искусственная реверберация Для выполнения многих операций в процессе монтирования музыкальной записи необходимы специализированные устройства 'няппимео, системы для создания искусственной реверберации,
I Цифровая обработка звуковых сигналов 79 сжатия динамического диапазона, шумоподавления). Эти опера- операции обычно выполняются с помощью аналоговых устройств, но цифровые методы дают выигрыш и в качестве, и в гибкости обра- обработки сигналов. В настоящее время для монтажа записей почти везде применяют аналоговые системы, и такое положение сохра- сохранится в ближайшем будущем, поэтому специализированные циф- цифровые устройства должны согласовываться с аналоговой частью системы с помощью стандартных преобразователей. По тем же причинам цифровая аппаратура должна обеспечивать обработку в реальном масштабе времени. К сожалению, необходимое быст- быстродействие не обеспечивают не только существующие мини-ЦВМ, но и большинство более крупных машин. Это стимулировало раз- разработку специализированных быстродействующих процессоров, архитектура которых оптимальным образом приспособлена к за- задаче обработки звуковых сигналов. Было бы полезно, чтобы регулировки на пульте машины соот- соответствовали естественным параметрам музыки; в частности, неже- нежелательно, чтобы звукооператор вводил программу с помощью устройства типа пишущей машинки. На пульт следует вывести такие регулируемые параметры, которые связаны с привычными физическими или психоакустическими величинами, причем пре- подчтительнее второй вариант. Конструктору не просто выполнить данное требование, ибо для этого нужно глубоко понимать особен- особенности выполняемой обработки и в то же время знать, как она влияет на восприятие музыки человеком. Эти проблемы рассмат- рассматриваются ниже при обсуждении вопроса о реверберации. Звуки, которые мы слышим, сильно зависят от акустических особенностей окружающего нас пространства или помещения. Звуковая энергия, излученная в пространство, отражается от раз- различных поверхностей, так что слушатель воспринимает суммар- суммарный звук, образованный многочисленными отражениями, прихо- приходящими с разных направлений и постепенно ослабевающими из- за потерь энергии. Человеку очень неприятно находиться в безэхо- вой камере, где полностью отсутствует реверберация, и наоборот, в большом соборе возникает приятное ощущение огромного прост- пространства, связанное с очень высоким уровнем реверберации. В про- промежуточных случаях слушатель также воспринимает акустику окружающего пространства, но делает это не совсем осознанно. Тем не менее для человеческого слуха реверберация является очень важным фактором. Разница между великолепным концерт- концертным залом и посредственной аудиторией почти полностью связа- связана с наличием и силой реверберации. Ощущение пространства зависит от времени прихода отражен- отраженных звуковых волн, скорости их затухания, направленности от- отдельных отражений. Изменение всех этих параметров в простран- пространстве и времени создает впечатление, что слушатель находится в большом зале, а изменение какого-либо одного параметра такого
80 Глава 2 впечатления не создает. В комнатах жилых домов обычно не об- образуется сильного реверберационного поля, характерного для кон- концертного зала, поэтому при прослушивании музыки в домашних условиях замечают, что реверберация в записях наблюдается только со стороны громкоговорителей. Поскольку бытовые музы- музыкальные системы основаны на применении двух раздельных кана- каналов, то реверберация слышится только с этих двух направлений. Далее будет показано, как с помощью системы имитации акусти- акустики большого зала можно создать отражения звуковых сигналов с такими запаздываниями и направленностью, которые отсутству- отсутствуют в двухканальных системах. Тем самым у слушателя создается впечатление, что он находится в большом зале. В настоящем раз- разделе рассматриваются способы получения реверберации в записан- записанном сигнале. Необходимость создания искусственной реверберации обычно бывает вызвана тем, что во время первоначальной записи микро- микрофон располагается рядом с исполнителем. При многодорожечной записи для каждого инструмента или группы инструментов уста- устанавливается свой микрофон, что улучшает отношение сигнал/шум и позволяет лучше разделить отдельные сигналы. Но это мешает записывать естественную реверберацию, существующую в помеще- помещении. При записи популярной музыки также целесообразно приме- применять многодорожечную запись, поскольку различные исполнители могут записывать свои партии в разное время. Любой из исполни- исполнителей может при необходимости записать свою партию заново, не привлекая других участников. Это не только выгодно экономиче- экономически, но и дает звукооператору более широкие возможности при со- составлении окончательного варианта записи. Таким образом, в по- популярной музыке часто вообще не бывает «исходного исполнения» как такового. Однако в небольших студиях, где чаще всего запи- записывают подобную музыку, реверберация отсутствует или очень слаба. Многие специальные эффекты вводятся уже после того, как все исполнители запишут свои партии. Имеется не один пример, когда исполнителя поочередно записывали на ряде дорожек, а за- затем создавали законченное произведение, исполненное «оркестром одного музыканта». Классическую музыку часто записывают с искусственной ре- реверберацией. Это делается как с целью регулирования уровня ре- реверберации, содержащейся в окончательной записи, так и для снижения фонового шума. Если расположить микрофоны в парте- партере, то звук будет естественным, но к нему неизбежно прибавится фоновый шум, вызванный работой вентиляторов, лифтов, движе- движением транспорта, пролетающими самолетами и (если запись де- делается во время концерта) людьми, находящимися в зале. Уста- Установка микрофонов на сцене снижает фоновый шум, так как гром- громкость звука вблизи оркестра примерно на 20 децибел больше, чем в зале. Находящиеся в зале люди не только создают шум, но и
Цифровая обработка звуковых сигналов называют влияние на реверберацию. В пустом зале время ревер- реверберации бывает на 20—30% больше, чем в заполненном. Конечно, кустические условия, при которых получается «естественный» ре- ультат, существуют только во время настоящих концертов, но [з-за сопутствующего шума в это время невозможно сделать вы- ококачественную запись. Проблема фонового шума является еще более острой при за- завей звука для телевизионных фильмов и кино. Съемочная аппа- >атура и обслуживающие съемку люди создают шум, который южно уменьшить с помощью микрофонов с узкой диаграммой на- равленности или производя озвучивание отснятых пленок. Кро- ie того, декорации часто ухудшают акустические свойства съемоч- юй площадки. В настоящее время применяются три метода создания искусст- )енной реверберации: 1) акустические камеры [98]; 2) листовые ревербераторы [96]; 3) пружинные ревербераторы [97]. 'ам, где возможно, для создания реверберации используется по- 1ещение с отражающими стенами, иногда заполняемое предмета- пи нерегулярной формы. «Сухой» сигнал проигрывается через ¦ромкоговорители, размещенные в реверберирующем помещении, I звук, воспринимаемый в другой части помещения, смешивается ta записи с исходным сигналом. Предметы помещают в камеру я того, чтобы исказить регулярную волновую структуру, харак- характерную для прямоугольных помещений. Если все рассчитано пра- шльно, то акустические камеры создают удовлетворительную ре- реверберацию. Однако характеристики камеры почти не поддаются зменению. В более распространенных системах используются ме- механические колебания в пластинах из сплавов золота [94, 95]. Вибратор, находящийся в одной точке пластинки, возбуждает в ней колебания, а датчик, расположенный в другой точке, воспри- воспринимает акустические колебания, пришедшие к нему сквозь пла- пластину по различным путям. В аналогичных системах используют также неоднородные пружины. Но все эти методы не обеспечива- обеспечивают достаточно хорошего качества звука. Создание подобных механических систем очень сложно и гра- граничит с искусством. Оно даже приобретает некоторый оттенок кол- Довства, когда конструктор пытается преодолеть резко выражен- йые недостатки устройств. На пружине, например, необходимо сделать нерегулярные проточки, чтобы в ней было много резонан- сов и возникали квазислучайные отражения. Параметры пластин, Изготавливаемых из сложных и дорогих сплавов, должны выдер- выдергиваться с исключительной точностью. Но даже при очень совер- совершенной технологии производства подобные механические системы °Чень плохо работают на высоких частотах, когда из-за малой Длины волны и высокой скорости ее распространения получаются
«2 Глава 2 очень сильное затухание сигнала и малый динамический диапа- диапазон системы. В течение последних 15 лет проводились исследования, направ- направленные на создание электронных систем искусственной ревербера- реверберации, основанных на цифровых методах. Чтобы понять, как созда- создаются подобные системы, следует разобраться в механизме возник- возникновения естественной реверберации. Звуковая волна, излученная в комнате, частично отражается от всевозможных поверхностей до тех пор, пока не будет погло- поглощена вся ее энергия. Коэффициенты отражения волны от любых поверхностей всегда меньше единицы, поэтому энергия звуковой волны уменьшается после каждого отражения. Большинство строи- строительных материалов имеет низкую отражательную способность для волн высокой частоты, а поглощение в воздухе приводит к дополнительным потерям. При теоретическом анализе процесс ре- реверберации полностью описывается формой эхо-сигнала или струк- структурой импульсного отклика помещения. Весь процесс, конечно, ли- линеен, и сцену можно рассматривать как вход, а кресло слушате- слушателя— как выход линейной системы. Преобразование Фурье от им- импульсного отклика помещения является еще одним видом описа- описания процесса реверберации. Однако детальная структура эхо-сигнала достаточно сложна и ее трудно измерить, поэтому невозможно получить исчерпываю- исчерпывающее описание процесса реверберации. Производились попытки измерить импульсный отклик помещения, возбуждая звук искро- искровым разрядом (фактически получался двойной щелчок) и запи- записывая эхо-сигнал в местах расположения слушателей. Но чтобы уровень сигнала был выше уровня фонового шума, необходимо повышать мощность разряда, а это приводит к нелинейным явле- явлениям в воздухе. Кроме того, плотность эхо-сигналов столь вели- велика, что любые воздушные потоки и обычное затухание звука в воздухе приводят к неповторяемости результатов от измерения к измерению, а это не позволяет воспользоваться статистическими методами анализа (усреднением) результатов измерений. Аппрок- Аппроксимации начальной части реверберационного процесса были по- получены на масштабных моделях бостонского симфонического зала [60]; вычисления, основанные на лучевом методе и проведенные на ЭВМ, дали аналогичные результаты [99]. Слуховое восприятие процесса реверберации, по-видимому, за- зависит не от конкретных особенностей тонкой структуры процесса, а от его общих свойств. Поэтому нужно детально моделировать не конкретный процесс реверберации, а только те его физические свойства, которые влияют на процесс слухового восприятия. Дан- Данные, описывающие восприятие реверберации, отсутствуют; есть только результаты, относящиеся к некоторым частным аспектам. Поэтому в процессе разработки системы часто приходится делать
Цифровая обработка звуковых сигналов 83 некоторые предположения, а затем экспериментально проверять их справедливость. Исследования в области физической акустики показывают, что средняя плотность потока эхо-сигналов в прямоугольной комнате выражается формулой dN __ 4чсз ^ dt V ' где V — объем комнаты, а с — скорость звука. Для помещения неправильной формы это выражение изменяется, но имеет тот же характер, если определяющим является статистический аспект процесса. Начальная часть эхо-сигнала определяется конкретны- конкретными особенностями формы помещения. Беранек, изучавший кон- концертные залы всего мира, отмечает [65], что во всех залах, оцени- оцениваемых экспертами на пять с плюсом, задержка между прямым звуком и первым отражением составляет от 10 до 20 мс. Такая величина задержки, по-видимому, обусловливает ощущение «ин- «интимности». Иногда реверберационные системы характеризуют величиной интервала времени, за который плотность потока эхо-сигналов до- достигает значения 1000 с. В высококачественных системах это время близко к 100 мс. Такой параметр использовался для оцен- оценки систем искусственной реверберации [100, 64], но его не при- применяли для предсказания акустических характеристик концертных залов. Рэтер и Мейер [101] предложили определять «чистоту» зву- звука как отношение энергии реверберационного сигнала за началь- начальные 50 мс к полной его энергии. В такой характеристике не учи- учитывается структура начальной части эхо-сигнала, а вместо этого берется величина энергии, отраженной от стен и перекрытий зала в начальной части процесса. Для нью-йоркского концертного зала Эвери Фишер-холл это отношение составило —3 дБ [102], причем было найдено, что изменение его на несколько децибел резко из- изменяет акустику зала [63]. В нормальных условиях мощность процесса реверберации дол- должна экспоненциально убывать с течением времени. В работе [107], посвященной исследованию процесса реверберации в помещениях неправильной геометрической формы, показано, что он действи- действительно затухает экспоненциально. Однако при некоторых формах зала может наблюдаться неэкспоненциальное затухание. Время, за которое мощность процесса уменьшается до уровня —60 дБ, называется временем реверберации Тр. Эта величина являет- является, по всей видимости, наиболее важной характеристикой, определяющей субъективную оценку качества акустики помеще- помещения. В соборе, например, время реверберации очень часто может Доходить до 5 с, а в гостиной обычного дома оно, как правило, Не превышает 1 с. По сообщению Беранека [60], в лучших кон-
<84 Глава цертных залах среднее время реверберации, оцененное на средних звуковых частотах, составляло 1,9 с. Методом прослушивания, однако, было обнаружено, что ощу- ощущение объемности и время реверберации при исполнении непре- непрерывного музыкального произведения в основном определяются за- затуханием звука в первые 160 мс [114], т. е. доминирующую роль играет начальная стадия процесса реверберации. Следует поэтому различать слышимую реверберацию (running reverberance) и полную реверберацию (stopped reverberance). При исполнении музыкального произведения слушатель на фоне музыки может уловить только начальную (слышимую) часть процесса ревербе- реверберации, соответствующего отдельной ноте. С другой стороны если нота внезапно обрывается, то в паузе слышен весь (полный) сиг- сигнал реверберации. Анализ в частотной области (в отличие от вышеприведенных соображений, относящихся « анализу ibo временной области) поз- позволяет взглянуть на процесс реверберации с других позиции, свя- связанных с понятием окрашивания спектра музыки. Зал с присущи- присущими ему акустическими свойствами действует как линейный фильтр, ослабляющий одни частоты и усиливающий другие. Общепринято полагать, что при исполнении музыки было бы желательно, что- чтобы частотная характеристика этого фильтра была равномерной. Однако даже значительные отклонения частотной характеристики концертного зала от равномерной совсем не обязательно будут заметны на слух. Дело в том, что выбросы характеристики, как правило, достаточно узки, так что даже самые чистые тона зани- занимают по нескольку пиков и провалов характеристики. Степень нерегулярности спектра можно описать статистически- статистическими параметрами. Действительную и мнимую части частотной ха- характеристики зала будем рассматривать как гауссовские случай- случайные процессы. Тогда плотность вероятности логарифма мощности «сигнала (в децибелах) равна / м 1п(Р3 exp(z)l, z=—— тде W— плотность вероятности, а р —случайная величина, описы- описывающая звуковое давление [106]. Оказалось, что среднее квадра- тическое отклонение характеристики от ее среднего значения со- составляет 11 дБ. Таким образом, для 70% всех частот отклонения от среднего коэффициента пропускания не будут превышать 11 дБ. Другие экспериментальные данные, собранные в _1У кон- концертных залах, показывают, что средняя разность уровней после- последовательных максимумов и минимумов близка к 9 дЬ и не зави- зависит от объема зала и времени реверберации [WbJ. Ьыло выясне- но, что разнос соседних максимумов по времени равен b,M/iP, тде Гр — время реверберации.
Цифровая обработка звуковых сигналов 85 Поскольку во всех этих концертных залах у слушателей не возникало ощущения неестественности звучания музыки, можно сделать вывод, что неравномерность частотной характеристики не является вредным фактором и, даже наоборот, она естественным образом связана с процессом реверберации. Причиной неравно- неравномерности является то, что в большом зале существует много резо- резонансных частот, или собственных тонов (полюсов). Для залов пра- правильной формы плотность пиков частотной характеристики опре- определяется соотношением dN 4nV ,2 / > df с3 где V — объем зала, с — скорость звука, а / — частота в герцах. В среднем все резонансы имеют высокую добротность Q, которая пропорциональна времени реверберации. Если собственные тона зала очень редки (т. е. частотная характеристика имеет низкую плотность пиков), что характерно для залов с долгой ревербера- реверберацией, то каждый резонанс будет очень острым, а спектр музыки ¦сильно окрашенным. Примером такого окрашивания вследствие низкой плотности собственных тонов и долгой реверберации может служить акустика плавательного бассейна. Были проведены исследования [103] с целью определения ве- величины плотности расположения собственных тонов, необходимой для систем искусственной реверберации. В одном из эксперимен- экспериментов реверберация возбуждалась импульсами белого шума со спек- спектром шириной в октаву. Затем прямой сигнал был подавлен, а реверберационный сигнал сжат так, чтобы его уровень был по- постоянным. Слушателей спрашивали, находят ли они какое-ни- какое-нибудь различие между этим и исходным сигналами. Результаты ис- исследования показали, что необходима плотность расположения собственных тонов порядка 0,1 Гц на низких частотах и 3 Гц~' на частоте 1 кГц. По-видимому, это было наиболее серьезное ис- исследование необходимого значения плотности пиков частотной ха- характеристики помещения. В другом, более простом эксперименте стационарным белым шумом возбуждали гребенку фильтров; ре- результат анализа показал, что для получения минимального окра- окрашивания необходимо иметь плотность пиков 0,14 Гц~! [104]. Эта методика исследования больше связана с окрашиванием, вызван- вызванным слышимой реверберацией, а предыдущая методика скорее от- относится к исследованию полной реверберации. В дальнейшем ста- станет ясно, что этих данных все же недостаточно для определения расчетных критериев, необходимых для создания электронных ре- ревербераторов. Шредер и Логэн [109] опубликовали предварительные резуль- результаты работ по моделированию естественной реверберации на циф- цифровых вычислительных машинах. Было замечено, что на выходе
Глава 2 \Эадержка r\ X 111 I ЛА/ Рис. 2.12. Моделирование процесса реверберации с помощью линии задержки, охваченной обратной связью. Одиночный импульс, поступающий на вход, создает последовательность импульсов, повто- повторяющихся через интервал, равный времени задержки. Амплитуда импульсов убывает экс- экспоненциально со 'скоростью, зависящей от коэффициента обратной связи. системы с линией задержки, охваченной обратной связью1^ (рис. 2.12), создается процесс, -подобный реверберации. Импульс- Импульсная характеристика такой системы состоит из ряда импульсов с уменьшающейся амплитудой, повторяющихся через интервал, рав- равный времени задержки. Частотная характеристика системы напо- напоминает характеристику гребенки фильтров, причем частотный раз- разнос фильтров равен обратной величине от времени задержки. Вре- Время реверберации равно Т — зг где g—коэффициент обратной связи, а Т — длительность задерж- задержки. Рассмотренная простая система малопригодна для моделиро- моделирования реверберации, так как высокая плотность потока эхо-сиг- эхо-сигналов здесь сопровождается низкой плотностью расположения собственных тонов. Однако можно взять несколько таких систем и включить их последовательно. При этом плотность потока эхо- сигналов увеличивается согласно формуле d = ^"^J, где п — число ¦> Такую систему в радиолокации называют рециркулятором. — Прим. перев.
Цифровая обработка звуковых сигналов 87 -9 I I ill! Рис. 2.13. Всепропускающая (фазосдвигающая) система с равномерной частот- частотной характеристикой. Она отличается от рециркулятора (рис. 2.12) тем, что входной сигнал поступает как на вход, так и (без задержки) на выход. последовательных рециркуляторов. Разнос пиков частотной харак- характеристики, соответствующих собственным тонам, здесь равен об- обратной величине от полной задержки всей системы. В принципе подобная цепочка рециркуляторов может давать хорошую аппроксимацию естественной реверберации. Однако в структуре, составленной из дискретных блоков, может оказаться, что некоторые собственные тона будут общими для нескольких ре- рециркуляторов и на этих частотах будут наблюдаться очень силь- сильные резонансы. Другие же частоты могут подвергаться многократ- многократному ослаблению. Шредер заметил, что каждый из рециркулято- рециркуляторов можно превратить во всепропускающую (фазосдвигающую) систему с плоской частотной характеристикой, если часть входного сигнала подвести к выходу линии задержки, как показано на рис. 2.13.
88 Глава 2 Передаточная функция такой системы описывается выраже- выражением I где g — коэффициент обратной связи, а Т — длительность задерж- задержки. Достоинством системы с равномерным коэффициентом про- пропускания является то, что сигналы, отстоящие далеко от резонан- сов и поэтому не подвергающиеся сильной реверберации, прохо- дят без ослабления к следующим блокам, где они могут вызвать реверберацию. В результате каждый резонанс будет возбуждаться с одинаковой интенсивностью. Если бы в схеме не было цепей для непосредственной передачи сигнала с входа на выход, обеспечи- обеспечивающих равномерность частотной характеристики, то в общей ха- характеристике преобладало бы лишь несколько резонансов. После многочисленных опытов Шредер остановился на схеме с пятью всепропускающими блоками (типа изображенной на рис. 2.13); задержки в блоках равнялись 100, 68, 60, 19,7 и 5,85 мс, а коэф- коэффициент обратной связи составлял 0,7. В итоге плотность разме- размещения собственных тонов получилась равной 0,25 Гц-1, что явля- является удовлетворительным с точки зрения окрашивания звука по критерию слышимой реверберации. Плотность потока эхо-сигналов в системе нарастает со временем как tA, т. е. быстрее, чем при естественной реверберации. Позднее Шредер усовершенствовал исходную схему и получил систему, показанную на рис. 2.14 ,[111, 112]. Та часть системы, ко- которая определяет основные характеристики процесса ревербера- реверберации, не содержит всепропускающих цепей, так как все четыре ре- циркулятора возбуждаются параллельно. Длительности задержек в системе были, однако, недостаточно велики для получения боль- большой плотности потока эхо-сигналов. Для повышения этой плот- плотности применяются всего два всепропускающих блока. Они же одновременно сглаживают неравномерность частотной характери- характеристики гребенчатого фильтра. Длительности задержек в четырех рециркуляторах находятся в интервале 30—-45 мс и выбираются так, чтобы они были в максимальной степени «несоизмеримыми»1'. В отличие от первоначальной схемы здесь легко регулировать дли- длительность процесса реверберации, а время реверберации можно сделать зависящим от частоты сигнала [113]. Все вышеприведенные системы моделировались на машине IBM 7090, которая по сегодняшним стандартам обладает крайне низким быстродействием. Машина не обеспечивала обработку сиг- сигнала в реальном масштабе времени, поэтому короткие отрывки музыки записывались в цифровом виде и затем создавалась ревер- реверберация. Это ограничивало объем экспериментов [ПО]. Опираясь 1> То есть чтобы отношения задержек не были рациональными дробями.— Прим. перев. ; .
Цифровая обработка звуковых сигналов 89 на собственный опыт слушателя, Шредер сделал вывод, что искус- искусственная реверберация ничем не отличалась от естественной даже для таких трудных сигналов, как щелчки и белый шум. Повторение опытов Логэна и Шредера на специализированной вычислительной машине [108], описанной ниже, показало, что для чистых музыкальных тонов создание искусственной реверберации таким способом не дает адекватных результатов. Рассмотрим, на- например, ноту, воспроизведенную на флейте. Частота звука помече- помечена на оси частот рис. 2.15 черточкой. При реверберации вблизи этой частоты могут возникнуть два заметных резонанса, обозна- обозначенных на графике как два полюса. Введение искусственной ревер- реверберации создает в мелодии характерную модуляцию огибающей, частота которой равна разносу полюсов по частоте. Этот эффект называется вибрирующим эхо и по своему звучанию напоминает звук, образующийся в коридорах или пустых комнатах с тверды- твердыми стенками. При естественной реверберации плотность размеще- размещения собственных тонов весьма высока, и в хороших концертных залах не наблюдается такой регулярной модуляции, обусловленной преобладанием пары полюсов. Наоборот, модуляция огибающей осит случайный характер, и ширина полосы спектра модулирую- Выхад i Рис. 2.14. Полная схема системы искусственной реверберации (по Шредеру). 'Четыре рециркулятора обеспечивают долговременную реверберацию, а две последующие Всепропускающие цепи — требуемую плотность потока эхо-сигналов в начальный период ¦Р&вербе.рационного сигнала. (Воспроизведено с разрешения Общества эвукотехники из его 1 журнала, т. 23, № 9 [115].) i
90 Глава 2 щего процесса составляет 10—30 Гц. В модельных экспериментах, проведенных Шредером и Логэном, использовалось много частот с огибающими, модулируемыми периодическими сигналами с час- частотой от 1 до 4 Гц. Это явление легко воспринимается на слух и оставляет неприятное впечатление. X X х ххх х *Х XX ¦¦Сй„ 6 Рис. 2.15. Эффекты при моделировании реверберации, вызванные очень низкой плотностью размещения собственных тонов. а — s-плоскость с показанными на 'ней двумя доминирующими резонанеа'ми, расположенными вблизи частоты Шо музыкального тона; б — огибающая отрезка тона с частотой соо, на ко- которой наблюдаются пульсации с частотой, равной разности частот двух резшавсога; в —при- —пример очень высокой плотности собственных тонов (резонансов) при естественной ревербера- реверберации; г — огибающая музыкального тона, отличающаяся от экспоненциалыной кривой только1 наличием 'слабых флуктуации с высокой частотой. Для создания звукообрабатывающих систем, полностью осно- основанных на электронных устройствах, потребовалось интенсивное исследование принципов формирования искусственной ревербера- реверберации. Это ускорило разработку специализированных вычислитель- вычислительных машин, позволяющих обрабатывать музыку в реальном време- времени [115]. В исследованиях, направленных на создание искусственной ре- реверберации, одна из основных трудностей связана с созданием цифровой системы, обладающей одновременно и высокой универ- универсальностью, и хорошим быстродействием, которое обеспечивало бы возможность обработки музыки в реальном времени. Для мо- моделирования реверберации с использованием вышеприведенных методов можно построить специализированные устройства, позво- позволяющие работать в реальном масштабе времени. Но в подобные системы с фиксированной логической структурой очень трудно вносить какие бы то ни было существенные изменения. Универ- Универсальные ЦВМ намного удобнее для решения задач моделирования. Однако высокая скорость поступления информации плохо согла- согласуется с возможностями подобных ЦВМ. Для высококачественно-
Цифровая обработка звуковых сигналов 91 го представления музыки необходимо, чтобы отсчеты следовали примерно через каждые 30 мкс. Таким образом, за 30 мкс ЦВМ должна успеть выполнить все операции по программе и к момен- моменту прихода следующего отсчета быть готовой к выполнению сле- следующего цикла операций. В описанной схеме моделирования на протяжении одного интервала дискретизации выполняются 6 за- задержек, 10 умножений, 13 сложений и различные команды по пе- пересылке чисел. В обычной ЦВМ, где все команды хранятся в па- памяти, тактовый интервал составляет 1 мкс, но операция умноже- умножения, выполняемая в специализированном блоке, длится от 30 до 300 мкс. Архитектура большинства ЦВМ больше подходит для сложных расчетов или для операций с различными информацион- информационными массивами, чем для обработки сигналов. Вследствие этого для экспериментов по обработке музыкаль- музыкальных сигналов была создана специализированная мини-ЦВМ [115]. При ее разработке была поставлена цель — достигнуть быстродей- быстродействия, которое вдвое превышало бы потребности простой ревербе- рационной системы Шредера — Логэна. Увеличение быстродейст- быстродействия потребовалось для введения фильтров в цепь обратной связи, охватывающей линию задержки, с тем чтобы сделать время ревер- реверберации зависящим от частоты сигнала. Быстродействие, однако, зависит не только от скорости выполнения команд, но и от числа команд, необходимых для проведения конкретных операций. Так, если программа задержки состоит из семи команд, каждая из ко- которых выполняется за 100 не, то вся операция задержки займет 700 не. Машина с другой структурой, где для той же цели требу- требуются лишь три команды, будет обладать большим быстродействи- быстродействием, даже если каждая команда выполняется за 200 не. В резуль- результате оптимизации структуры машины применительно к задачам обработки музыки была разработана ЦВМ, структура и взаимо- взаимосвязи элементов которой показаны на рис. 2.16. Машина содержит запоминающие устройства двух типов. Ос- Основное ЗУ емкостью 16 К слов используется для выполнения опе- операций задержки, а сверхоперативное ЗУ — для хранения програм- программы и промежуточных результатов. Основное ЗУ позволяет полу- получать задержки, превышающие 400 мс, но длительность его цикла Довольно велика. Однако низкая скорость ЗУ не ухудшает быст- быстродействия всей системы, поскольку в структуре ЦВМ предусмот- предусмотрено разделение адресации и процесса пересылки данных. После того как в цикле обращения к памяти будут выполнены началь- начальные операции, машина может продолжать работать по другим Командам основной программы, пока из ЗУ не поступят нужные Данные. В отличие от основного ЗУ сверхоперативное ЗУ имеет емкость всего в 512 слов, но оно построено на быстродействующих элементах транзисторно-транзисторной логики (ТТЛ). Все арифметические операции выполняются в регистрах А и В, йо для умножений используется регистр М. Для занесения данных
92 Глава 2 Сверхоперативное ЗУ Схема чения Ig 1 — *—J Кч Прира- щение Адресный регистр дыходной регистрзу Дельта Основное ЗУ Буферный регистр *\ЗапросР?\ \?мгация'P?f TAB Дельта Z т Рис. 2.16. Структура специализированной вычислительной машины, предназна- предназначенной для моделирования систем искусственной реверберации. На схеме при- приведены только основные линии передачи сигналов. (Воспроизведено из статьи [115] с разрешения Общества звукотехники.) в эти регистры и дальнейшего выполнения требуемых операций применяются последовательно выполняемые команды. Эффектив- Эффективная скорость их исполнения повышается, однако, за счет того, что код команды состоит из двух частей, каждая из которых может содержать самостоятельную команду. Например, во время выпол- выполнения арифметической операции можно заносить данные во вход- входной регистр. За счет применения структуры с элементами поточ- поточной обработки и сдвоенных команд эффективное быстродействие повышается вдвое. Перемножение двух 16-разрядных чисел обычно занимает мно- много времени. Однако для представления музыки не требуется той точности, которую обеспечивает 16-разрядное квантование. Как правило, если динамический диапазон сигнала велик, то для пред- представления сигнала достаточна точность в доли децибела. По
Цифровая обработка звуковых сигналов 93 Рис. 2.17. Пример программы для специализированной вычислительной машины, создающей искусственную реверберацию. Сверху приведена логическая схема операции :мешива<вия двух сигналов с одновременным их ослаблением. В машине эта операция выполняется ва 8 тактов по программе, записан- записанной внизу. Заметим, что в программе не участвуют 6 полуком'анд, которые можно исполь- использовать одновременно для выполнения других операций. Таким образом, эффективная про- продолжительность операции равна 1 мкс. (Перепечатано из статьи [115] с разрешения Об- Общества звукотехники.) 1. CLB LAR а Очистить регистр В, занести « регистр А содержимое ячейки сверхоператив- сверхоперативного ЗУ г адресом а, куда в ходе предыдущих операций был записан отсчет сигнала (му- (музыки) Z&. 2. LML 6 Занести в регистр М число из ячейки сверхоперативного ЗУ, имеющей ад- адрес Ъ. В эту ячейку ранее был записан коэффициент Ki- 8. MUL— — — Умножить отсчет из регистра А (записанный туда в первом машинном цик- цикле) на четыре младших разряда числа, находящегося в регистре М. 4. SCL LAR с Выполнить масштабирование числа, находящегося в регистре А, в соответст- соответствии со следующими четырьмя разрядами числа из .регистра М и результат прибавить к со- содержимому регистра В. Поскольку в первом цикле, согласно команде CLB, регистр В был очищен, то теперь там будет (находиться произведение Za-Ki. Одновременно занести в ре- регистр А число из ячейки сверхоперативного ЗУ с адресом с, куда ранее был записан от- отсчет Zfo. 5. LML d Занести в регистр М новый коэффициент, находящийся в сверхоператив- сверхоперативном ЗУ в ячейке с адресом d. В эту ячейку при выполнении предшествующей части про- программы был записан коэффициент Кг- 6. MUL Умножить отсчет сигнала музыки, занесенный на 4-м машинном цикле в> регистр Л на 4 младших разряда числа из регистра М. 7. SCL Выполнить масштабирование числа в регистре А в соответствии с четырьмя1 старшими разрядами числа из регистра М и результат прибавить к числу, хранящемуся в регистре В. Поскольку в регистре В находился взвешенный отсчет первого сигнала, то в нем получится искомая сумма обоих взвешенных сигналов. 8. -SBR е Переслать число из регистра В в ячейку сверхоперативного ЗУ с адресом е. команде MUL выполняется умножение на 4-разрядный множи- множитель, лежащий в интервале от 0,97 до 0,5. Дополнительная команда SCL (scale — нормировать) позволяет изменить число в 2я раз. Любая из команд SCL и MUL исполняется за один машин- машинный цикл продолжительностью 200 не. Более того, поскольку каж- каждая из этих команд записывается в половине полного кода коман- команды, она может исполняться одновременно с другими операциями. На рис. 2.17 (вверху) приведен пример простой операции по обработке сигналов. Сложение двух взвешенных (ослабленных) сигналов Za и Zb занимает 1,6 мке и выполняется по программе,, записанной на рис. 2.17 внизу. Заметим, что несколько полукоманд в этой программе не за- заняты и могут быть отведаны под другие действия. Если удастся это сделать, то эффективное время исполнения всей операции бу- Дет равно 1 мкс. Этот результат является очень хорошим даже Для самых быстродействующих из современных ЦВМ. В общем списке команд есть отдельная группа команд, обес- обеспечивающих моделирование линий задержки. Обращение к коль-
94 Глава 2 цевому накопителю осуществляется с помощью трех особых команд, которые превращают основное ЗУ в эквивалент линии за- задержки. Для получения отвода от линии задержки дополнительно затрачивается всего лишь 200 не. Основную память можно раз- разбить на произвольное число линий задержки. Для каждой из них в программе используются по четыре полукоманды. На такой ЭВМ была построена модель системы с 15 линиями задержки, в которой выполняются 35 умножений, 48 сложений и ряд вспомогательных операций. Модель обеспечивала обработку музыки в реальном масштабе времени (т. е. на полную обработку каждого отсчета сигнала затрачивалось не более 30 мкс). С по- помощью подобных машин можно испытывать различные сложные схемы искусственной реверберации. В результате проведенных ис- исследований была построена система искусственной реверберации [80]. В ней имеется квадрафонический выход, причем выходные сигналы между собой некоррелированы, время реверберации мож- можно менять от 0,3 до 4,5 с, на низких и высоких частотах время реверберации зависит от частоты, задержка между прямым и пер- первым отраженным сигналами регулируется, а отношение сигнал/шум превышает 70 дБ. Такие характеристики явно выходят за рамки возможностей любых механических систем. Можно ожидать, что с понижением стоимости цифровых элементов подобные системы полностью вытеснят механические устройства искусственной ревер- реверберации. Возможность регулирования параметров, непосредственно свя- связанных с особенностями слухового восприятия (например, време- времени реверберации как функции частоты), обеспечивает высокую гибкость и универсальность описанной системы, а также позволя- позволяет моделировать акустику разных помещений. Оператор может управлять переменными, соответствующими размеру зала, погло- поглощающей способности стен, расстоянию от исполнителя до слуша- слушателя. Механические системы, напротив, имеьот лишь одну регули- регулировку скорости затухания механических волн. 2.3.4. Эффект хора и другие дополнительные эффекты Вышеописанная система и ей подобные дают возможность при- применять и другие виды обработки сигнала. Продемонстрировать это лучше всего, по-видимому, на примере системы, позволяющей одному солисту заменить хор с любым числом певцов. Такая систе- система уже существует [80] и здесь рассматривается потому, что она несложная и создаваемые в ней звуковые эффекты очень полезны для записи музыки. Когда группа исполнителей поет в унисон, им не удается начи- начинать все ноты абсолютно одновременно и высота тона у каждого исполнителя немного отличается от других. В целом, конечно, ис- исполнители поют согласованно, но в тонкой структуре музыкаль-
Цифровая обработка звуковых сигналов 95 Вход ч "\ ч ч г,\ \ " 1г —пз 3 ч г \ 4- \ »е°) Рис. 2.18. Система имитации хорового пения. «Сухой» голос или звук одного инструмента поступает на вход четырех неодинаковых ли- линий задержки. Время задержки в каждой линии задается независимым источником шума со спектром в полосе 0—20 Гц. Для образования «хорового» сигнала все выходные сигналы суммируются. ного сигнала наблюдаются более или менее случайные отклоне- отклонения моментов вступления и тембров. В итоге каждую ноту сопро- сопровождает некоторый разброс в спектральной и временной областях, по которому слушатели определяют, что поют несколько исполни- исполнителей. На рис. 2.18 приведена блок-схема системы, позволяющей один голос превратить в хор из пяти голосов. Каждое устройство задержки вносит свой вклад в многообра- многообразие музыкальных нот, обусловленное ошибками в синхронности при реальных групповых выступлениях. Все задержки, однако, за- задаются внешним управляющим устройством, что удобно в двух отношениях: 1) время задержки в каждом канале меняется от но- ноты к ноте и 2) изменение задержки соответствует изменению высоты тона по случайному закону. В долгих нотах результат сло- сложения фазовых, вариаций соответствует эффекту, создаваемому хо- хоровым пением. Нестационарность времени задержки коротких нот и взрывных звуков также увеличивает естественность звучания. Входной сигнал (см. рис. 2.18) поступает на входы четырех ли- линий задержки. Время задержек лежит в интервале от 10 до 50 мс, что соответствует диапазону несогласованности в хоровом пении. Время задержки задается низкочастотным псевдослучайным шу- шумом [123] с шириной спектра порядка 5 Гц. Максимальные откло- отклонения высоты тона (в зависимости от распределения мощности Шума) необходимо ограничивать пределами 0,1—1 Гц. Несколько
Глава 2 иные эффекты получаются яв- ШШШщт более мощными, а стоимость их будет понижаться. 2.4. Передача программ с помощью радиовещания и других средств После завершеш* обработки сигнала в полнителя к слушателю, оно стало одним из наиболее в ГеГГернТ колите? JSSS^SSS «еГЬолее того »-; ?окоэффективные сети связи позволяют перад^ать на радиос^ дию звуковую программу из мест, расположенных очень дал СТУКиРоавДещаТтельные системы Соединенного Королевства и евро- пейских стран вполне обоснованно являются предметом наци _ нальной гордости. В Соединенном Кородевстве, кОР^Д^6^ .си является квазинезависимои государгтвеннои 0^^ ^ .обязанности которой входит передача нескольких ежедневных у
Цифровая обработка звуковых сигналов 97 грамм по всей Англии, Уэльсу, Шотландии и Северной Ирландии. Считается, что эти программы слушают практически в каждой квартире. Владельцы радиоприемников ежегодно вносят опреде- определенную плату. Вплоть до недавнего времени программы поступа- поступали на местные ретранслирующие радиопередатчики с помощью стандартных средств, применяемых для передачи телефонных сиг- сигналов: кабельных линий, модулированных несущих, СВЧ и т. д. Качество сигнала на больших дальностях от студий иногда было довольно низким. Даже просто с позиций технического престижа желательно иметь высококачественные передачи. В свою очередь слушателям не хотелось бы отдавать свои деньги за низкокачест- низкокачественные передачи. Несколько лет назад в Великобритании были начаты большие исследования с целью изучения возможности перевода линий рас- рассылки радиовещательных программ на цифровую технику [36]. Из-за отсутствия необходимых широкополосных радиовещатель- пых линий вначале предполагалось кодировать звуковое сопро- сопровождение телевизионных передач в цифровую форму и передавать его вместе с телевизионными синхроимпульсами [44]. Такая систе- система была создана. Однако в настоящее время британское мини- министерство связи, контролирующее связь и радиовещание, внедрило цифровые линии связи с пропускной способностью 2,048 Мбит/с, что позволило передавать звуковые программы в цифровом виде. В результате отношение сигнал/шум S/Nqc в радиовещательных системах отдаленных районов страны было повышено с 40 до 60 и более децибел во всей полосе частот. Многие радиовещательные компании Европы оборудуют сейчас свои передающие станции цифровыми системами со стандартизованным форматом. Количество вещательных программ, которые можно передавать в цифровой форме по линиям британского министерства связи с применением уплотнения каналов определяется только скоростью получения информации из АЦП. Эта скорость равна произведению разрядности чисел (определяющей динамический диапазон) на частоту дискретизации (определяющую ширину полосы частот сигнала). При использовании описанных выше АЦП информация в каждом звуковом канале создается со скоростью 0,5 Мбит/с. В таких условиях по каждой цифровой линии связи с примене- применением метода уплотнения можно передать только четыре монофо- монофонические или две стереофонические программы. Поэтому примерно в 1970 г. были развернуты дальнейшие исследования по развитию методов сжатия полосы сигнала с тем, чтобы построить системы сжатия, позволяющие снизить скорость информации без внесения в программу воспринимаемых на слух искажений. 2.4.1. Сжатие объема звуковой информации Первые эксперименты по сжатию объема звуковой информации проводились в исследовательских лабораториях Би-би-си с целью 7—359
98 Глава 2 определения требуемого динамического диапазона аналого-цифро- аналого-цифровых преобразователей. Методом массового прослушивания было установлено, что для фортепьянной музыки необходим динамиче- динамический диапазон АЦП в 84 дБ A4 разрядов). В этом случае 90% слушателей не замечают шума дробления [37]. Позднее к тем же выводам независимо пришли исследователи в ФРГ '[40]. Однако шум дробления можно сделать незаметным для слуха, если к полезному сигналу перед квантованием прибавить белый шум, уровень которого вдвое превышает уровень шума дробления. Было также замечено, что этот дополнительный шум можно без вреда уменьшить на 6 дБ, если добавить еще меандр с частотой, равной половине частоты дискретизации. Такие добавки увеличи- увеличивают уровень шума всего лишь на 2 дБ по сравнению с шумом дробления. Эти результаты наводят на мысль, что если к полез- полезному сигналу добавлен «раскачивающий» сигнал, то динамический диапазон 78 дБ A3 разрядов) будет более чем достаточен. Сле- Следует заметить, что подобный ограниченный динамический диапа- диапазон был признан удовлетворительным в основном потому, что на радиостанциях в качестве источника музыки для передачи обычно используются записи, в частности магнитофонные, динами- динамический диапазон которых не превышает 75 дБ {79]. Поэтому пет необходимости в том, чтобы качество системы передачи было на- намного лучше, чем качество передаваемого материала. Сама по себе величина отношения 5/Л^бс (т. е. ширина дина- динамического диапазона) не является решающим фактором, опреде- определяющим допустимый уровень шума в присутствии сигнала. Сжа- Сжатие объема информации может быть достигнуто только за счет увеличения уровня шума в те моменты, когда в тракте присутст- присутствует сигнал. Одной из таких систем является компандер. Перед аналого-цифровым преобразованием осуществляется преобразова- преобразование, сжимающее динамический диапазон сигнала, а после восста- восстановления аналогового сигнала выполняется обратное преобразо- преобразование, расширяющее динамический диапазон. Степень сжатия сиг- сигнала непосредственно определяется уровнем сигнала, а также за- законом возрастания ошибки квантования. В соответствии с данным методом, давно применяемым к рече- речевым сигналам [45, 46], перед АЦП включается блок с определен- определенной нелинейностью амплитудной характеристики и соответствую- соответствующая нелинейность вводится после ЦАП. Обычно эти нелинейно- нелинейности являются линейно-логарифмическими, как, например, ^-харак- теристика; где х — значение входного сигнала, F(x) —значение сигнала пос- после нелинейного преобразования, поступающее на вход АЦП, а
. Цифровая обработка звуковых сигналов 99 коэффициент р, определяет степень сжатия. С ростом ;х отношение S/iVcc остается постоянным во все более широком диапазоне значений полезного сигнала, но его величина при этом умень- уменьшается. Нелинейность является логарифмической при больших значениях сигнала и линейной — при малых. Коэффициент: fx оп- определяет уровень, при котором происходит переход от линейного участка к логарифмическому. Аналогичная система, предназначенная для передачи музыки, исследовалась специалистами министерства почт ФРГ ![40]. Ха- Характеристика сжатия имела несколько иной вид (так называемая Д-характеристика); она описывается соотношениями х\) I V где параметр сжатия А выбран равным 87,7. В данном примере выигрыш за счет сжатия составлял 24 дБ и был равен разнице между коэффициентами усиления при сильиых и слабых сигналах. Это позволило обойтись 10-разрядными числами в системе, где динамический диапазон должен обеспечиваться 14-разрядными числами; однако отношение S/Ncc составляло всего 50 дБ при из- изменении сигнала от максимума до —24 дБ и линейно убывало, когда уровень сигнала становился меньше —24 дБ. Такие харак- характеристики являются предельно допустимыми для высококачествен- высококачественных передач. В психоакустических экспериментах было выяснено, что при высоком уровне громкости короткие ноты с частотой от 500 Гц до 5 кГц плохо маскируют шум и требуется отношение «S/jVco превышающее 50 дБ [10]. С другой стороны, низкие тона органа и некоторые ноты других инструментов (например, англий- английского рожка) также плохо маскируют шум, и здесь тоже необхо- необходимы высокие значения отношения S/NCc- Низкие тона органа соз- создают особую проблему, поскольку при большой собственной мощ- мощности они слабо воспринимаются ухом, а шум квантования явля- является широкополосным и его среднечастотные составляющие плохо заглушаются органом. Чтобы решить эти проблемы, перед сжатием и после расшире- расширения динамического диапазона звуковых сигналов проводят филь- фильтрацию, искажающую, а затем восстанавливающую сигнал. По европейскому стандарту (CCITT) уровень сигнала требуется по- понижать на 13 дБ на частотах ниже 2 кГц и повышать на 4 дБ на частотах выше 5 кГц. На выходе цифро-аналогового преобразо- преобразователя включается обратный фильтр. Это удобно по двум при- причинам. Во-первых, ослабляются мощные низкочастотные состав- составляющие музыки, так что система, состоящая из блока сжатия и 7*
100 Глава 2 АЦП, не работает в режиме больших сигналов, когда величина ошибки квантования максимальна, т. е. таким образом уменьша- уменьшается уровень шума квантования. Во-вторых, ослабление высоко- высокочастотных компонент выходного сигнала понижает уровень шума, возникающего в АЦП. Однако уровень сигнала приходится не- несколько понижать, чтобы не допустить перегрузки АЦП. Такие фильтры повышают SjNCc с 50 до 58 дБ. Компандеры получили широкое распространение в звукотехпи- ке лишь в последнее время. Дело в том, что нелинейность их ха- характеристик приводила к ошибкам различного вида, увеличиваю- увеличивающим уровень шума. Некоторые цепи были склонны к самовоз- самовозбуждению и трудно настраивались. Амплитудную характеристику компандера можно, однако, реализовать в цифровом виде с по- помощью кусочно-линейной аппроксимации требуемой характеристи- характеристики. На рис. 2.19 показано, каким образом стандартный 14-разряд- 14-разрядный АЦП может выполнять квантование с учетом вида амплитуд- амплитудной характеристики компандера. Здесь, как и при использовании метода поразрядного взвешивания, квантование сигнала произ- производится в несколько этапов путем сравнения отсчета со скачко- скачкообразно изменяемым опорным напряжением. Однако величина приращения опорного напряжения зависит не только от номера (старшинства) проверяемого разряда, но и от значений преды- предыдущих разрядов и соответствует фиксированному шагу (завися- (зависящему только от старшинства разряда) вдоль оси аргументов ку- кусочно-линейной характеристики. Специалисты из исследовательских лабораторий Би-би-си, изу- изучавшие ту же проблему [42], пришли к другому решению, отли- отличающемуся от предложенного инженерами министерства почт ФРГ. После многочисленных прослушиваний, проведенных с привлече- Вхадяой сигнал Логическая схгма стандартного АпП Нелинейный преобразователь 1 $ ¦I Рис. 2.19а. Аналого-цифровой преобразователь с кодированием методом пора- поразрядного взвешивания, в котором реализуется нелинейная характеристика схемы сжатия. Стандартная логическая схема поразрядного взвешивания управляет схемой келинейногсг преобразования, так что уровни, подаваемые на схему сравнения, соответствуют заданной нелинейной характеристике. Выходной сигнал связан с входным нелинейной ааавсвмость,кь.
Цифровая обработка звуковых сигналов 101 Уровни квантования В нелинейной системе ° ИЛИ 1В 15- 14- 13- 12- 11- ю- 9- 8~ tf t2 U t5 Время Рис. 2.196. Принцип действия нелинейного АЦП. Слева показаны уровни в 5-разрядном (четыре значащих разряда плюс знак) преобразова- преобразователе с логарифмической характеристикой и равномерная последовательность уровней обычно- обычного ЦАП. При логарифмическом квантовании используются не все уровни ЦАП. Справа изо- изображена схема образования последовательности уровней, с 'которыми поочередно сравнива- сравнивается отсчет входного сигнала1)- Нелинейное логическое устройство задает величину при- Ращения в зависимости от значения уровня, выбранного на предыдущем шаге. В данном примере основой 5-разрядного преобразователя служит 8-разрядный линейный АЦП. При малых значениях входного сигнала линейный и 'Нелинейный преобразователи дают одинако- одинаковое разрешение; при более сильных сигналах нелинейный АЦП пропускает большинство уровней квантования. " Уровни нелинейного АЦП пронумерованы здесь от / до 16, т. е. за начало отсчета выбран уровень с номером Л Поэтому номера уровней, подаваемых на схему сравнения, сдвинуты на единицу: в первом цикле на схему сравнения по- покупает уровень /, во втором — 9, в третьем — 5 или 13 и т. д. — Прим. черев.
Ш __ Глава 2 у, __ нием широкого круга слушателей и с использованием самой раз- разной музыки, был выбран метод сжатия на основе преобразования с плавающей запятой, называемый также послоговым сжатием. Выходной сигнал 13-разрядного АЦП был представлен в виде чи- чисел с плавающей запятой, имеющих 10-разрядную мантиссу и 2-разрядный порядок. Четыре значения порядка позволяют учи- учитывать изменение коэффициента усиления от 0 до 18 дБ, т. е. динамический диапазон S/N6c можно довести до 78 дБ. При 10-разрядной мантиссе удается получить постоянное отношение S/Ncc, равное (в среднем) 57 дБ, если уровень сигнала изменя- изменяется от максимума до —24 дБ. Частотное предыскажение и вос- восстановление сигнала, согласно европейскому стандарту (CCITT), позволяют поднять S/NCc примерно до 65 дБ. В данной системе было принято представление чисел в фор- форме с поблочно плавающей запятой [41], поэтому 2-разрядный по- порядок сопровождает не каждую 10-разрядную мантиссу. Последо- Последовательность чисел, поступающих из 13-разрядного АЦП, записы- записывается в буферный накопитель. Емкость накопителя достаточна для записи сигнала длительностью 1 мс. Все числа в накопителе масштабируются так, чтобы наибольшее из чисел не вызывало переполнения. После этого два разряда, определяющие порядок чисел в блоке, передаются со сравнительно низкой частотой, а 10-разрядные мантиссы—с частотой дискретизации. Таким обра- образом, средняя разрядность чисел понижается до 10,125 двоичных знаков. Многочисленные контрольные прослушивания показали, что музыку, кодированную таким способом, невозможно отличить от исходной. Однако слушатели считают, что музыка, прошедшая че- через систему сжатия с 9-разрядной мантиссой, а также через не- немецкую систему с мгновенным сжатием, ухудшается по сравне- сравнению с исходной [11]. Сжатие музыкальных сигналов в системе с поблочно плаваю- плавающей запятой не создает слышимого шума, поскольку изменение уровня шума следует за изменением уровня сигнала с постоян- постоянной времени 1 мс. Это на несколько порядков быстрее отклика человеческой слуховой системы, и получающаяся задержка впол- вполне допустима. Скорости создания информации в системе мгновен- мгновенного сжатия с Л-характеристикой и в системе сжатия с поблочно плавающей запятой одинаковы, но вторая система дает более высокое качество звука, поскольку отношение S/Ncc в ней больше на б дБ, что крайне важно. Строго говоря, это преимущество соз- создается не структурой системы, а особенностями статистики музы- музыкального сигнала. В системе сжатия с поблочно плавающей запя- запятой предполагается, что на коротких интервалах музыка имеет невысокое отношение максимального значения к среднему (пик- фактор). Это среднее выражается в отсчетах порядка и передается с низкой скоростью. Система с мгновенным сжатием, напротив,
Цифровая обработка звуковых сигналов ЮЗ может отследить скачки в любом отсчете, не влияя на соседние отсчеты. Такая система окажется лучше, если музыкальные сиг- сигналы имеют очень узкие и высокие пики, поскольку ошибки квантования будут малыми для большей части сигналов и увеличиваются только в моменты появления узких пиков. В систе- системе с плавающей запятой ошибка квантования минимизируется на основе наибольшего пика, появившегося в течение интервала в 1 мс. В принципе это хуже, чем мгновенное сжатие. Но так как большая часть музыки образуется с помощью акустических или механических колебаний и хотя бы частично сопровождается ре- реверберацией, то предположение о малости пик-фактора музыки оказывается приемлемым. Однако если в качестве источника сиг- сигнала взять электромузыкальные инструменты, то лучше исполь- использовать другую систему, так как электронная музыка может иметь более некоррелированный характер. Из этого примера видно, что неявные предположения об особенностях источника сигнала могут привести к значительным трудностям. Поэтому более надежный подход состоит в согласовании характеристик преобразователя со свойствами человеческого слуха, поскольку к последним следует подстраивать характеристики сигнала. 2.4.2. Влияние ошибок, возникающих при передаче, на качество звука При передаче цифровых сигналов по линиям связи нельзя ожидать, что ошибки будут появляться с частотой, меньшей 1-10~6 (т. е. одна ошибка на 106 чисел), поэтому детально было проанализировано влияние ошибок, возникающих при передаче, на восприятие музыки. На рис. 2.20 показано, как воспринима- воспринимаются на слух ошибки в отдельных разрядах отсчетов в зависимо- зависимости от положения разряда. Данные были получены во время пауз музыкальных передач. Заметим, что ошибки в старших разрядах всегда оцениваются как нежелательные, так как они проявляются в виде отчетливого щелчка, если даже появляются с частотой 1 • 10~6. Ошибки в младших разрядах, наоборот, малозаметны даже при сравнительно высокой (вплоть до 1-10~4) частоте появле- появления [23]. При передаче старших разрядов вопрос о применении кодов с исправлением ошибок или же кодов с проверкой на четность в основном решался, исходя из условия допустимой сложности аппаратуры. Для определения наличия ошибок в старших разря- разрядах применялся простой 5-разрядный код с проверкой на чет- четность. В случае обнаружения ошибки при приеме в сигнал вместо не- неправильного отсчета вводился новый. Для определения наиболее эффективного метода маскировки ошибки было исследовано не- несколько алгоритмов. В их число входили:
104 Глава 2 \) глушение: подстановка нулевого отсчета; г 2) экстраполяция нулевого порядка (простая): повторение пре- предыдущего отсчета; : 3) интерполяция первого порядка (линейная): усреднение двух \ соседних отсчетов; ; 4) экстраполяция первого порядка (линейная): определение \ отсчета по двум предыдущим. Эффективность различных алгоритмов маскировки зависит от характера музыки, передаваемой в момент появления ошибки. В паузах все они эквивалентны, так как дают нулевой отсчет. При низких музыкальных тонах интерполяция первого порядка позволяет получить наилучшее приближение к фактическому сигналу. Экстраполяция нулевого порядка несколько хуже линей- линейной интерполяции, за исключением сигналов высоких частот, где оба алгоритма эквивалентны [23]. Линейная экстраполяция во всех случаях оказывается хуже интерполяции. Контрольные прослушивания показали, что для маскировки ошибки достаточно применить простую экстраполяцию. При про- простой экстраполяции частота ошибок может быть увеличена на полтора порядка при сохранении заданного уровня качества сиг- СуНьенгтшвная сиен к а степени ухудшения сигнала Недопустимо Б Определенно нежели - 5 тгльна Несколько нежена- а. тельно Вполне заметно,но не раэдра- 3 жает Еле р заметно Незаметно I 1О'а IO'S /О'4 ID'3 IO~Z Вероятность искажения разряда Рис. 2.20. Субъективная оценка влияния ошибок при передаче двоичных цифр (разрядов отсчетов) в системе с ИКМ без сжатия. Все отсчеты взяты во время пауз в программе. 0 обозначает старший разряд. (Воспроиз- (Воспроизведено из работы [23].)
Цифровая обработка звуковых сигналов 105 нала [25]. Этот результат был получен .в системе с 13-разрядными числами без сжатия динамического диапазона. В системе с по- поблочно плавающей запятой ситуация сложнее, так как ошибка в масштабном множителе повлияет на 30 отсчетов сразу. С дру- другой стороны, масштабный множитель передается с очень низкой скоростью, что уменьшает частоту появления таких ошибок. Тем не менее было рекомендовано при передаче пар двоичных чисел, определяющих порядок блока, добавлять к ним проверочный раз- разряд [43]. Этот дополнительный разряд практически не влияет на скорость создания информации. 2.4.3. Направления дальнейшего развития Учитывая успех, достигнутый в Великобритании, можно ожи- ожидать, что в будущем большинство стран переведут свои системы распространения радиовещательных программ на цифровую тех- технику. Качество передач даже в самых отдаленных уголках Вели- Великобритании значительно повысилось. Соответствующие организа- организации ФРГ, Швейцарии, Италии и Франции заняты проектирова- проектированием подобных систем; эти работы находятся на разных стадиях завершенности. В силу тесной взаимосвязи европейских систем радиовещания значительное внимание уделяется стандартизации форматов данных и методов синхронизации. Однако часто это осложняется политическими соображениями. В Соединенных Штатах большая часть вещательных программ составляется в местных радиостудиях. Между некоторыми круп- крупными городами США сейчас сооружаются стандартизованные ци- цифровые линии связи, но применения их для целей радиовещания пока не ожидается. Помимо всего прочего пропускная способность этих линий составляет 50 Кбит/с. Заглядывая в отдаленное будущее, можно представить себе, Что сигнал будет передаваться в цифровой форме от микро- микрофона до приемника радиослушателя и только в нем деко- декодироваться. Это гарантировало бы максимально возможное каче- качество. Но для решения такой задачи необходимо, во-первых, суще- существенно сократить объем информации, представляющей звуковой сигнал в цифровом виде, с тем, чтобы значительно сузить полосу Частот, и, во-вторых, сделать цены на аппаратуру декодирования Цифрового сигнала доступными для массового радиослушателя. Для сокращения объема информации требуется разработать новые Методы аналого-цифрового преобразования, чтобы кодирование эФфективно согласовывалось с особенностями речи и музыки. Стои- Стоимость аппаратуры будет зависеть от успехов в улучшении харак- характеристик и технологии производства интегральных схем.
106 Глава 2 2.5. Прием электрических звуковых сигналов и преобразование их в акустические колебания После того как звук записан и обработан, он поступает в ап- аппаратуру, находящуюся у слушателя дома. На последней стадии звуковоспроизведения обработка звукового сигнала проводится в очень ограниченных масштабах, поскольку в аппаратуру слуша- слушателя поступает сигнал, пригодный к преобразованию в звук. Обычно этот сигнал является двухканальным, и домашняя музы- музыкальная установка должна быть спроектирована так, чтобы в ней воспроизводились отсутствующие в записи реверберационные сиг- сигналы. Фронтальный реверберационный сигнал обычно вводят не- непосредственно в запись, а отраженные сигналы, приходящие с боковых направлений и сзади, должны быть синтезированы. В ре- результате создается эффект присутствия в зале, хотя настоящий реверберационный сигнал, приходящий сзади, при записи утрачи- утрачивается. В квадрафонических системах этот недостаток пытаются восполнить введением пары каналов заднего эхо-сигнала, но, как правило, основная информация по-прежнему извлекается из двух- канальной записи. Только в системе с четырьмя раздельными ка- каналами (в бытовых условиях такие системы почти всегда основы- основываются на специальных 4-дорожечных магнитофонах) можно по- получить реальные эхо-сигналы, приходящие сзади. Матричная квадрафоиия имеет ограниченные возможности при имитации аку- акустики концертного зала, поскольку дополнительные сигналы обра- образуются в основном как суммы и разности основных, а задержан- задержанные эхо-сигналы отсутствуют. Ощущение замкнутости пространства возникает па основе восприятия отражений, пришедших с разных направлений и с разными задержками. Эксперименты с использованием искусствен- искусственно созданных эхо-сигналов показали [128], что добавление к основному сигналу задержанных копий сигнала, приходящих с боковых направлений, создает впечатление расширения источника сигнала или же увеличения размеров зала. В результате этих экспериментов было предложено использовать в качестве харак- характеристики кажущихся размеров помещения отношение энергии сигнала, приходящего сбоку, к энергии сигнала, приходящего спе- спереди за первые, 80 мс после прямого звука. Хотя звук, создавае- создаваемый фронтальными громкоговорителями стереофонической систе- системы, содержит реверберационный сигнал, а также подвергается дополнительной реверберации в комнате, энергия боковых ре- верберационных сигналов получается очень низкой. Степы поме- помещений хорошо поглощают звуковые волны, и поэтому эхо быстро затухает. Таким образом, независимо от величины эхо-сигнала, включенного в основную запись, для создания полного ощущения пространства необходимы какие-то дополнительные меры. Стерео-
Цифровая обработка звуковых сигналов №7 фоническое звуковоспроизведение может дать только ограничен- ограниченное ощущение пространства. Независимо от направления, с которого отраженный звук при- приходил к микрофону во время записи в зале или в студии, при воспроизведении в домашних условиях реверберационный сигнал исходит от фронтальных громкоговорителей. Эта реверберация необходима для создания впечатления, что музыка исполняется в болыиом хорошем концертном зале, но она не может создать у слушателя ощущения, что он сам находится в этом зале. Слу- Слушатель как бы заглядывает в зал, но не сидит в нем. Стереофони- Стереофоническая музыка на слух воспринимается так, как если бы слуша- слушатель находился в небольшом фойе, соединенном с залом откры- открытой дверью. Этот эффект наиболее заметен при прослушивании церковной музыки и наименее заметен в записях камерной музыки. Пространственные и временные свойства воспринимаемого слухом звукового поля весьма сложны. Различия в моментах при- прихода и громкостях звуков от фронтальных громкоговорителей поз- позволяют слушателю локализовать сигналы [58]. Эхо-сигналы, при- приходящие с небольшими задержками и с разных направлений, соз- создают ощущение замкнутости пространства [62]. Отраженные сиг- сигналы, приходящие с большой задержкой, помогают почувствовать размеры зала. В лучших концертных залах эхо-сигналы с боко- боковых направлений начинают приходить через 10—20 мс после пря- прямого звука [65]. Примерно через 100 мс поток отражений становится весьма плотным и эхо-сигналы приходят с частотой более 1000 [64]. Время, за которое мощность реверберации уменьшается на 60 дБ, называется временем реверберации; оно зависит от размеров зала и поглощательной способности стен зала и находящихся в зале предметов. Одним из способов увеличения кажущегося объема помещения' является создание боковых отражений акустическим путем. Часть., громкоговорителей направляют звук по всем направлениям. Волны,' излученные в стороны, отражаются от стен и создают впечатле- впечатление сильного источника звука, расположенного сбоку от акусти- акустической колонки. Часто такой прием дает вполне удовлетворитель- удовлетворительное ощущение большей ширины источника или большего объема комнаты. Однако это увеличение не слишком велико, так как обычно получается только одна сильная отраженная волна, ко- которая приходит к слушателю с того же направления, что и пер- первичная волна. Кроме того, эффект зависит от взаимного располо- расположения колонок и мебели. Чтобы создать полное ощущение пространства, в системе долж- должны формироваться боковые отражения. Эти отражения по суще- существу являются задержанными копиями основного сигнала, и их Не надо записывать или передавать. При воспроизведении записи можно предусмотреть в системе обработки необходимые задержки И подавать задержанные сигналы на специальные громкогоЕорп-
108 Глава 2 тели, имитирующие отражения. При этом комната будет казаться гораздо больше, чем она есть. Система имитации акустики концертных залов была построена Болтом, Беранеком и Ньюмэном [60, 61] на основе 12-канальной системы, воспроизводящей структуру звукового поля, которое слу- слушатель почувствовал бы, сидя в зале. С помощью масштабной Генератор импульсов р0 Т разряд Г,". S '..¦ а ы «г . ufr Рис. 2.21. Методика определения векторного импульсного отклика концертного зала. В данном примере 12 микрофонов с узкими диаграммами направленности были расставлены вокруг одного кресла. Источником возбуждающего импульса служил искровой разряд. Сиг- Сигналы, получаемые во всех микрофонах, записывались для последующей обработки и ана- анализа. модели бостонского симфонического зала по 12 направлениям был измерен импульсный отклик акустической системы, в которой сцена рассматривалась как вход, а кресло слушателя — как выход. На рис. 2.21 поясняется процесс измерения. Искровой разряд соз- создавал звуковой импульс (фактически получался двойной щелчок), служивший возбуждающим сигналом. С помощью 12 микрофонов с узкими диаграммами направленности записывали звук вблизи конкретного кресла в зале. Затем этот импульсный отклик модели- моделировался с использованием многоотводной линии задержки, форми- формировавшей начальный участок эхо-сигналов (т. е. слышимую ревер- реверберацию). Задержка в линии составляла 150 мс, а отводы соот- соответствовали временным интервалам 10 мс. Сигналы с отводов подавались на вход 12-канальной системы с ¦ амплитудами, подо-
Цифровая обработка звуковых сигналов 109 бранными так, чтобы аппроксимировать измеренный отклик. Ко- Конечный период процесса реверберации формировался посредст- посредством добавления сигналов с листового ревербератора или из ре- верберационной камеры. Такое моделирование можно выполнить с помощью обыкно- обыкновенной стереофонической записи. Сигналы из двух стереофониче- стереофонических каналов поступают на два фронтальных громкоговорителя и создают стереоэффект. Кроме того, оба сигнала складываются и подаются на входы 12 трансвер'сальных фильтров, каждый из ко- которых питает соответствующий громкоговоритель. Такой метод моделирования был назван методом предельной верности (the ultimate hi—fi), поскольку звуковое поле, создаваемое вокруг слушателя, воспринимается так же, как звук в настоящем кон- концертном зале. Слушатели, хорошо знающие бостонский симфони- симфонический зал, могли указать даже номер кресла [61]. В фирме Teledyne Acoustic Research для тех же целей была построена цифровая система задержки [129]. Для кодирования монофонического сигнала здесь использовалась 12-разрядная ИКМ. Квантованные отсчеты сигнала, взятые с частотой 32 кГц, записываются в ЗУ с произвольным доступом емкостью 8192 сло- слова, что позволяет создать задержку до 256 мс. В системе имеется 16 выходных каналов, причем в каждом регулируется задержка (с шагом 1 мс) и уровень сигнала. С приходом нового отсчета 16 отсчетов, соответствующих выбранным задержкам, преобразу- преобразуются в аналоговые напряжения с помощью ЦАП и считываются через 16-канальный коммутатор. Значения задержек выбираются согласно расчетным значениям времени запаздывания первых эхо-сигналов в прямоугольном по- помещении с размерами концертного зала. Каждый из 16 сигналов поступает на свой громкоговоритель. Громкоговорители расстав- расставлены вокруг слушателя в два яруса и каждый питается сигналом с задержкой, равной запаздыванию первого эхо-сигнала для дан- данного громкоговорителя. Эта система отличается от системы Болта, Беранека и Ньюмэна тем, что в каждый громкоговоритель посту- поступает только один эхо-сигнал, а не 12, и что моделируется некото- некоторый объем, а не конкретный концертный зал. Долговременная часть реверберационного процесса к сигналу не добавляется, так. как в большинстве записей реверберация вводится при составле- составлении программы. Слушатели положительно оценили эту систему, поскольку она легко создает ощущение большого пространства, причем кажущийся объем легко изменяется регулировкой громко- громкости и задержки сигналов. Обе описанные системы являются исследовательскими устат новками. Применяемая в них аппаратура пока что слишком до- дорога для массового покупателя, но подобные устройства являются' прообразом звуковоспроизводящих систем будущего. Для широ- широкого потребления были разработаны более простые системы. '
110 Глава 2 В работе [57] показано, что задержка обоих стереофонических сигналов на 12 мс значительно улучшает ощущение объемности. Следует признать, что такая система несовершенна, но все же является шагом вперед. Кроме того, по мнению некоторых слу- слушателей, она создает лучшее звучание, чем системы матричной квадрафонии [91]. Введение только двух, а не бесконечного мно- множества эхо-сигналов по схеме, приведенной на рис. 2.22, также создает отчетливое впечатление расширения размеров источника звука и ощущение объемности пространства. Если дискретные эхо-сигналы появляются с нужной задержкой, то они сливаются с прямым звуком и не воспринимаются как эхо [62]. Поскольку в системе, предложенной Мэдсеном, задержки не очень велики, то требования к объему памяти оказываются впол- вполне умеренными даже при сравнительно высокой скорости создания информации. Более совершенная система имитации акустики зала серийно выпущена фирмой Hybrid Systems; ее схема показана на рис. 2.23 [92]. В отличие от системы- Мэдсена реверберационные сигналы для боковых и задних громкоговорителей формируются из сиг- сигнала реверберации, присутствующего в основном стереосигнале, который воспроизводится через фронтальные громкоговорители. Сигналы из обоих каналов складываются и поступают на вход линии задержки, являющейся элементом рециркулятора, т. е. сиг- сигнал с выхода линии задержки подается на ее вход через цепь об- обратной связи. Принцип формирования реверберации в этой системе основан на получении импульсных откликов в рециркулято- ре по отсчетам основных стереосигналов. Поскольку ревербераци- реверберационные составляющие в соседних отсчетах основных сигналов мож- можно считать некогерентными, то и выходные сигналы системы, пред- предназначенные для питания задних громкоговорителей, также будут некогерентными. Основные стереосигналы в свою очередь состоят из суммы прямого сигнала и эхо-сигналов, обусловленных ревер- реверберацией. Тогда сигналы задних громкоговорителей будут содер- содержать прямой сигнал и совокупность эхо-сигналов, которая образу- образуется в виде свертки исходной (содержащейся в записи) ревербе- реверберации и импульсной характеристики рециркулятора. Все четыре реверберационных сигнала представляются слушателю совершен- совершенно некогерентными. Качество работы любой системы имитации эффекта присутст- присутствия зависит от того, насколько ее конструктор знаком с положе- положениями психоакустики. В таких системах не дублируются процес- процессы, происходящие в концертных залах, а образуются некоторые слуховые аналоги, которые создают у слушателя ощущение боль- большого замкнутого пространства. Поскольку структура звукового поля, создаваемого рассмотренными выше системами, не зависит от архитектурных особенностей помещения, слушатель может по собственному усмотоению имитировать акустическую обстановку
Цифровая обрабЬтка звуковых сигналов t " Левый канал Правый канал Задер жка Зас/ерж- •ис. 2.22. Методика имитации акустики большого зала в домашних условиях (по Мэдсену). два боковых громкоговорителя подаются те же сигналы, что и на фронтальные громко- громкоговорители, но с задержкой, так что получаются два сильных эхо-сигнала. Левый , передний сигнал Правый передний сигнал Левый. задний сигнал Правьш задний сигнал Рис. 2.23. Система «Audiopulse» имитации акустики больших залов. В системе применен несложный алгоритм формирования реверберации, основанный на ре- Циркуляции входного звукового сигнала по внутренним петлям блок-схемы. iB систему по- поступает стереосигнал из обоих каналов, в результате получается пара дополнительных сиг- сигналов, воспроизводимых через два громкоговорителя, расположенных по бокам слушателя ил'и за ним.
112 Глава 2 и подстраивать ее даже применительно к конкретному музыкаль- музыкальному произведению. Некоторые из слуховых эффектов, создавае- создаваемых системой, вообще невозможно получить в обстановке реаль- реального концертного зала. Таким образом, обработка сигналов дает возможность копировать известные акустические эффекты и соз- создавать новые, и поэтому в будущем она станет важной частью процесса звуковоспроизведения. 2.6. Проектирование громкоговорителей Начиная с этого раздела, будем рассматривать те приложения цифровой обработки звуковых сигналов, которые характерны преж- прежде всего для лабораторных условий, как, например, методика из- измерений при разработке цифровых систем звуковоспроизведения. Приборы для звуковых измерений, как и большая часть всей аппаратуры, связанной со звуковоспроизведением, основывались на аналоговых методах обработки сигналов. Эта аппаратура пред- предназначалась для измерения таких характеристик, как коэффици- коэффициенты гармонических или интермодуляционных искажений, ампли- амплитудно-частотная и фазово-частотная характеристики, импульсный отклик, время нарастания (attack time), время затухания (ревер- (реверберация). Она почти полностью удовлетворяет нуждам специали- специалистов по звукотехнике, за исключением разработки конструкций громкоговорителей. Конструкции и механизм работы электро- электроакустических преобразователей очень сложные, поэтому их проек- проектирование и изготовление является искусством, хотя и не в такой степени, как это изображают некоторые изготовители. Характеристики большей части электронной аппаратуры до- довольно просто измерить. Усилители, например, можно, спроекти- спроектировать так, что они практически не будут вносить в сигнал ам- амплитудных и частотных искажений. Такой элемент звуковоспро- звуковоспроизводящего тракта можно назвать прозрачным в том смысле, что- он не оказывает на сигнал заметного влияния. Громкоговорители, напротив, очень часто оцениваются субъективно, поскольку почти все они звучат по-разному, а специалисты сильно расходятся в мнении относительно того, как оценивать хорошие и очень хоро- хорошие громкоговорители. Громкоговоритель является устройством для излучения энер- энергии, которое преобразует электрические сигналы в акустические волны в частотном диапазоне шириной 10 октав. Длина звуковой волны изменяется от 10 м до 2 см, т. е. от величины, в 30 раз превышающей размер излучателя, до величины, на порядок мень- меньшей этого размера. Кроме того, громкоговорители обычно соз- создают искажения сложного вида, а их характеристики имеют го- гораздо большую неравномерность, чем у электрических цепей, под- подводящих сигнал к акустической колонке. Сложности усугубля- усугубляются тем, что в отличие от маломощных электроакустических
" Цифровая обработка звуковых сигналов преобразователей типа микрофонов громкоговорители оперируют с большими мощностями, иногда порядка сотен ватт. К тому же необходимо знать распределение энергии акустических волн в> трехмерном пространстве. Инженерам не удается сделать громко- громкоговоритель «прозрачным» элементом звуковоспроизводящей си- системы, и поэтому они вынуждены оценивать роль различных аку- акустических эффектов при восприятии звукового сигнала, так как оптимизация конструкции зачастую основывается на субъективных оценках, получаемых путем прослушиваний. В принципе следова- следовало бы учитывать только искажения, заметные на слух. Однако пока не существует единого мнения о том, какие акустические эффекты действительно незаметны если не для всех, то хотя бы для большинства слушателей. Типичная акустическая система состоит из корпуса и одной», или нескольких головок. Головка сама по себе является слож- сложным электромеханическим устройством. Электродинамическая го- головка, например, состоит из конического или куполообразного диффузора, к которому прикреплена звуковая катушка, помещен- помещенная в магнитное поле. При пропускании через катушку электри- электрического тока на нее действуют электромагнитные силы, приводя- приводящие в движение катушку и диффузор, в результате чего созда- создаются акустические волны. На низких частотах диффузор работает как поршень, перемещая сравнительно большой объем воздуха,, но на высоких частотах его уже нельзя рассматривать как абсо- абсолютно жесткое тело. Если длина волны излучаемого колебания- близка к размерам диффузора, то в нем возбуждаются собствен- собственные колебания, причем разные участки колеблются в противопо- противоположных направлениях. Такие собственные колебания могут про- проявляться очень отчетливо и создавать значительную неравномер- неравномерность характеристик излучателя. Эту трудность можно преодолеть путем включения в акусти- акустическую систему нескольких головок, каждая из которых создает излучение в определенном диапазоне частот. С выхода раздели- разделительных фильтров низкочастотные компоненты сигнала подаются на большие низкочастотные головки, среднечастотные — на сред- нечастотное звено, а составляющие с высокими частотами — на высокочастотные головки. При расчете и конструировании подоб- подобных систем следует учитывать, что сигналы с разными частотами излучаются из различных точек, так что интерференция волн мо- может создать серьезные трудности. В связи с направленностью излу- излучателей возникает интересный вопрос: следует ли их проектиро- вать так, чтобы частотная характеристика, измеренная по интен- интенсивности излучения вдоль главной оси, была максимально рав- равномерной, или же в качестве критерия брать полную акустиче- акустическую мощность? Признанные авторитеты имеют по этому вопросу диаметрально противоположные мнения. 8—359
114 Глава 2 Конструкция корпуса, в 'который помещаются акустические го- головки, также очень сильно влияет на характеристики всей аку- акустической системы. Элементы корпуса, крепежные детали и даже другие головки, размещенные здесь же, могут создавать отраже- отражения, которые повышают неравномерность частотной характеристи- характеристики и усложняют вид диаграммы направленности акустической си- системы. Кроме того, обратная сторона диффузора головки излучает сигнал в глубь корпуса, который отражается от стенок корпуса к ¦слушателю. Все эти явления приводят к очень сильным неравно- мерностям частотных и фазовых характеристик акустической си- системы, а оценить влияние этих неравномерностей на восприятие музыки весьма трудно. Кроме упомянутых линейных эффектов в акустических головках наблюдаются различные нелинейные эффекты, также создающие искажения. Звуковая катушка колеблется в магнитном поле, но это поле неоднородно, и сила, действующая на диффузор, зависит ¦от его текущего положения. Если на вход головки подается боль- большой сигнал, то перемещение' диффузора ограничивается элемен- элементами его подвески; если излучаемый сигнал имеет широкий спектр, то его низкочастотные составляющие могут порождать доплеров- ский сдвиг частоты высокочастотных компонент. При создании громкоговорителя или всей акустической систе- системы нужно применять соответствующую измерительную аппарату- аппаратуру, которая позволяла бы получать полное описание физических •свойств разрабатываемой конструкции. Необходимо иметь таккке методику для анализа и интерпретации результатов таких изме- измерений. Для этой цели очень подходит цифровая обработка сиг- сигналов. 2.6.1. Методы измерений Измерения характеристик громкоговорителей можно выполнять в частотной или во временной области. Обычно для измерений применяют генераторы качающейся частоты; для устранения иска- искажений частотной характеристики, вызванных отражениями от стен помещения, измерения выполняются в специальных безэховых ка- камерах. Измерения фазы, особенно на высоких частотах, обычно не проводятся как не очень важные. Таким образом, проектирова- проектирование громкоговорителей в большинстве случаев основывается на неполных измерениях характеристик акустических систем и труд- трудно определить, какое значение имеют характеристики, оставшиеся неизмеренными. Кроме результатов измерений в частотной области для получе- получения характеристик громкоговорителя можно использовать им- цульсный отклик, который полностью описывает линейную систе- систему. Однако во избежание перегрузки громкоговорителя амплитуда возбуждающих импульсов в таком случае должна быть неболь-
Цифровая обработка звуковых сигналов М5 Усил ^тель 'ности Гене- Генератор импуль- импульсов 1с Jmkc JJJJL. JXX сигнд/7 a/Tiff/?!//? L/ccj гедив; \r1unpoipm | громкогово- громкоговоритель .Акустическая камера (ЗШм3,времяреверберации 1с) Цифровой слентроашлизатор ЦВМЯР2100 10-разрядный А ЦП. с частотой дискре- дискретизации 50кГц Микро- фОННЬШ усили- тель Сменный шильтр оля защитьгот наложений J Задержанный, запускающий импульс Рис. 2.24. Блок-схема установки для измерения импульсных откликов ворителей. Результаты многократных измерений записываются и усредняются с помощью ЦВМ. (Вос- (Воспроизведено из 'работы [121] с разрешения Общества звукотехники.) шой. Но при слабом сигнале импульсный отклик заглушается фо* новым шумом. Одним из путей преодоления этой трудности явля- является усреднение результатов многократных измерений с помощью Цифровой вычислительной .машины i[121]. Блок-схема экспери- экспериментальной установки представлена на рис. 2.24. Исследуемый громкоговоритель возбуждается последователь- последовательностью слабых импульсов, а высококачественный измерительный Микрофон воспринимает звуковые волны. Сигнал квантуется и записывается в ЦВМ. Процесс многократно повторяется, так что. Полученный импульсный отклик является средним по множеству
116 Глава 2 независимых измерений. Усреднение по 1000 импульсам позволяет понизить уровень шума на 30 дБ. Точность измерений в принципе здесь может быть задана произвольно, необходимо только время для накопления достаточного числа импульсов. Звуковой импульс приходит к микрофону намного раньше пер- первого эхо-сигнала, отраженного от стен. Это устраняет необходи- необходимость применения безэховых камер, поскольку влияние окружаю- Время ¦¦; : 8-нратнае увеличение по вертикали 64- -нратнае //велиуе- мс/е ло вертикали Время, мс Рис. 2.25. Импульсный отклик громкоговорителя, полученный методом накопле- накопления с усреднением. ¦Средняя и 'нижняя кривые являются увеличенными вариантами верхней записи и показыва- показывают импульсный отклик в более крупном масштабе. (Воспроизведено из работы [121] с раз- разрешения Общества звукотехнккн.) щей обстановки начинает проявляться существенно позже, после прихода импульса от исследуемого громкоговорителя. Пусть, на- например, громкоговоритель и микрофон установлены в середине комнаты размером 4X4 м2 на расстоянии 1 м друг от друга. Тогда первый импульс, отразившийся от стен, будет принят при- примерно через 9 мс после прихода прямого сигнала. Поэтому запись ¦импульсного отклика следует обрезать до этого момента времени. Пример подобного импульсного отклика, взятый из статьи [121], показан на рис. 2.25. Дополнительное увеличение масштаба по вертикальной оси показывает, что отраженные импульсы сущест- существуют в помещении примерно в течение 7 мс. Однако психоакусти- психоакустические свойства данного громкоговорителя без дальнейшего ана- анализа определить невозможно. Приведенные данные наиболее верно описывают свойства громкоговорителя, причем характеристики громкоговорителя, по- полученные с помощью импульсного метода, являются более точными по сравнению с данными, измеренными аналоговыми устройства- устройствами. В отличие от измерений с применением качающейся частоты В этом случае особенности помещения никак не влияют на ре- результаты измерений, а тонкая структура амплитудной и фазовой
Цифровая обработка звуковых сигналов 117 ^—- \ювв 0,2 Частота, - + 180° -0° --4О° -л 0,5 к Гц f 2 5 \ t 10 /5 Г Рис. 2.26. Частотная и фазовая характеристики исследуемого громкоговорителя, полученные вычислением преобразования Фурье от импульсного отклика, приве- приведенного на предыдущем рисунке. Внизу приведены фактическая фазовая характеристика (а) и фазовая характеристика, по- полученная с помощью преобразования Гильберта от частотной характеристики, рассмат- рассматриваемой как функция с минимальной фазовой задержкой (б). (Воспроизведено из рабо- работы [121] с разрешения Общества звукотехники.) характеристик не смазывается за счет быстрого изменения частоты зондирующего сигнала. С помощью обычного алгоритма БПФ на основе импульсного отклика можно получить стандартные частотную и фазовую ха- характеристики, подобные приведенным на рис. 2.26. Но, как и прежде, не очень ясно, какое значение имеют различные неравно- неравномерности характеристик. Два глубоких провала частотной харак- характеристики на частотах 1,1 и 2,2 кГц можно скомпенсировать с помощью выравнивающего фильтра, согласованного с этой ха- характеристикой. Поведение характеристики в диапазоне выше 6 кГц не имеет существенного значения, так как данная головка работает в низкочастотном звене акустической системы и на нее не поступают высокочастотные составляющие сигналы. Тем не ме- менее интерпретировать эту характеристику весьма непросто. Для сравнения рядом с измеренной фазовой характеристикой изобра-
48 Глава 2 жена фазовая характеристика, полученная с помощью преобразо- преобразования Гильберта от частотной характеристики, которая рассмат- рассматривалась при этом как функция с минимальной фазой. Расхожде- Расхождение характеристик указывает на существование дополнительных фазовых сдвигов, а это означает, что передаточная функция име- имеет нули в правой полуплоскости. Таким образом, в данном и по- подобных случаях фазовые характеристики могут иметь существен- существенное значение. Вследствие большой гибкости алгоритма БПФ можно восполь- воспользоваться другими формами представления данных. На рис. 2.27, например, дан интегральный переходной спектр (частотно-пере- (частотно-переходная характеристика) громкоговорителя. Показан временной ход отклика громкоговорителя на разных частотах. Такой спектр по- получается, если запитать головку синусоидальным сигналом с по- постоянной амплитудой, а затем резко выключить сигнал и регист- регистрировать процесс затухания акустических колебаний. Измерения повторяются на всех частотах. Из рис. 2.27 видно, что огибающие на разных частотах ведут себя по-разному. Распределение энергии по спектру при внезапном отключении питающего сигнала отра- отражает индивидуальные особенности громкоговорителя гораздо от- отчетливее, чем частотная и фазовая характеристики или импульс- Время/ частота Vac то та, нГк маси/maff) Рис. 2.27. Частотно-переходная характеристика исследуемого громкоговорителя. Данное представление позволяет демонстрировать одновременно спектральные и временные за.висиности. «Хребты», появляющиеся в определенные моменты времени, указывают на возникновение когерентных отражений; «хребты» на определенных частотах указывают на существование резонансов, которые в стационарном состоянии могут быть не видны. (Воспроизведено из работы [121] с разрешения Общества звукотехники.)
Цифровая обработка звуковых сигналов 119 7 Рис. 2.28. Волновые фронты, создаваемые шестью различными высокочастотны- высокочастотными акустическими головками при возбуждении импульсом колоколообразной формы [130]. (Перепечатано с разрешения Общества звукотехники.) ный отклик. Вычисление интегрального переходного спектра про- проводится с использованием БПФ импульсного отклика, но резуль- результат получается таким же, как при измерениях с отключением гармонического питающего сигнала. Анализ переходного спектра выявляет в нем вполне опреде- определенные особенности. Максимум отклика, появляющийся через 0,8 мс после выключения сигнала, по всей видимости, связан с от- отражением от задней стенки акустической колонки. Высокий уро- уровень спектральной плотности на частоте 3,8 кГц, наблюдаемый по истечении 2 мс, указывает, что диффузор, по-видимому, сильно резонирует на этой частоте. Отметим, что этот резонанс наблюда- наблюдается и в установившемся режиме, но там он поднимается выше общего уровня частотной характеристики всего на несколько де- децибел. В концевой части переходной характеристики этот резо- резонанс оказывается доминирующим. Подобный способ изображения
120 Глава 2 характеристик громкоговорителя представляется удачным, так как ухо является спектроанализирующей системой, различающей рас- распределение звуковой энергии по спектру только за короткие ин- интервалы времени. Из обычной частотной характеристики не вид- видно, как распределяется энергия по спектру во времени, а в инте- интегральной характеристике это можно проследить. Практическая ценность вышеупомянутых методов измерения» еще не выяснена. Одним из способов проверки справедливости результатов интерпретации данных является моделирование на ЦВМ. Характеристики громкоговорителя можно изменять, исполь- используя ЦВМ как цифровой фильтр, или же можно обрабатывать на ЦВМ записанные отсчеты музыки с учетом задаваемых измене- изменений импульсного отклика, а потом сравнивать акустические эф- эффекты, обусловленные этими изменениями. Из-за того что данный метод совсем новый, и, возможно, по коммерческим соображениям соответствующие сведения пока нет опубликованы. Однако этот метод является многообещающим. Кроме того, можно применять ЦВМ для графического изображе- изображения информации. На рис. 2.28 показаны волновые фронты, созда- создаваемые шестью различными высокочастотными головками, воз- возбуждаемыми импульсом колоколообразной формы [130]. Разли- Различия вполне очевидны, но пока не совсем ясно, как их интерпре- интерпретировать. 2.7. Более совершенные методы обработки сигналов Все рассмотренные в предыдущих разделах приложения циф- цифровой обработки сигналов имели сугубо практический характер. Цифровые методы внедряются в технику звукозаписи либо для улучшения характеристик существующих систем, как, например, в случае цифровых магнитофонов, либо для обработки сигналов с целью создания определенных звуковых эффектов, например для имитации акустики больших залов. Методы обработки сигналов, применяемые в подобных случаях, сравнительно несложные и основаны на теории линейной фильтрации. Существуют и более совершенные методы обработки сигналов, однако в силу своей сложности и большой стоимости соответст- соответствующей аппаратуры они пока не нашли применения в звукозапи- звукозаписывающих системах массового назначения. Это в некотором смыс- смысле решения, для которых еще не найдено задач. Однако соответ- соответствующие математические положения развиты в достаточно высо- высокой степени и в лабораторных условиях проведены успешные опыты с применением таких методов. Очень интересное направление в цифровой обработке сигналов, называемое обобщенной линейной или гомоморфной обработкой, основано на работах Оппенгейма [116]. Идея состоит в том, что сигналы, представленные в виде произведения или свертки не-
Цифровая обработка звуковых сигналов скольких функций, подвергаются нелинейному преобразованию, в результате которого вместо свертки или произведения появляется сумма. Затем полученная аддитивная комбинация обрабатывается классическими методами линейной фильтрации, а результат воз- возвращается в исходные координаты с помощью обратного нелиней- нелинейного преобразования. На основе такого метода можно построить систему сжатия динамического диапазона, отделять звуковой сиг- сигнал от сопутствующих ему эхо-сигналов или же улучшать каче- качество старых звукозаписей. Ниже эти задачи рассматриваются бо- более подробно. 27.1. Системы сжатия Музыкальный сигнал можно рассматривать в виде произведе- произведения двух колебаний. Одно колебание образует медленно меняю- меняющуюся огибающую e(t), а второе колебание v{l) изменяется с го- гораздо .большей скоростью; сигнал s(t) имеет вид s(t) = e(t)v(t). B.1) Огибающая всегда положительна, а колебания v(t) могут быть положительными и отрицательными. Комбинацию сигналов B.1), представленную в виде произве- произведения, с помощью логарифмирования можно преобразовать в сумму: logs(t) = loge(t) + logv(t). B.2) Поскольку v(t) может быть и положительным, и отрицательным, перед логарифмированием следует представить s(t) в комплекс- комплексной форме. Аргумент (фаза) сигнала v(t) будет равен 0 или зт; этот угол образует мнимую часть логарифма, а логарифм модуля s(t) —действительную часть. Вслед за таким преобразованием сиг- сигнал подвергается линейной обработке. После фильтрации сигнал можно возвести в степень и получить новый музыкальный сигнал s'(t) = e'(t)v'(t). Блок-схема соответствующей системы представ- представлена на рис. 2.29. Данный метод обработки является полезным в том случае, когда посредством классической линейной фильтра- фильтрации удается разделить loge(t) и log |yG)|. Если, например, спект- спектры этих двух компонент занимают неперекрывающиеся полосы частот, то при фильтрации каждую компоненту можно обработать по-разному. Как следует из графика рис. 2.30, для речевых и му- музыкальных сигналов это именно так и есть. Спектр логарифма оги- огибающей сосредоточен на частотах, лежащих ниже 16 Гц, а спектр логарифма быстропеременной компоненты находится выше 16 Гц. Допустим, что коэффициент усиления линейного фильтра равен
122 Глава 2 единице на частотах выше 16 Гц и равен К ниже 161 Гц. Тогда log \v(t) | при фильтрации не изменится, a log e(^) станет равным Kloge(t) или, что то же самое, \og[eK(t)]. Таким образом, на выходе системы получится сигнал вида s'(t) =eK(t)v(t). Если К меньше единицы, то амплитуда огибающей уменьшается и тем самым достигается сжатие динамического диапазона. При /С = 0 sit) log Im{log[s{tj\] = arg(t) He [log[s(tj\}=lag\s(t)\ [Линейная система args'it) log \s'{t)\ exp s'(t) Рис. 2.29. Блок-схема системы гомоморфной фильтрации сигналов, являющихся произведением нескольких сигналов. В линейной системе происходит фильтрация логарифма модуля входного сигнала. (Воспроизведено из работы [120] с раз- разрешения Института инженеров по электротехнике и радиоэлектронике.) получается система автоматической регулировки усиления, так как на выход пропускается только быстропеременная составляющая с постоянной амплитудой. Система с К>1 является экспандером, т.е. в ней увеличивается динамический диапазон сигнала. Описанные системы можно построить как в цифровой, так и в аналоговой форме. Однако для получения высококачественных, . Спектр log \s(t)\ 16 Гц Рис. 2.30. Спектр логарифма модуля типичного звукового сигнала. Большая мощность низкочастотных компонент свидетельствует о широком динамическом диапазоне, высокочастотные компоненты определяют тонкую структуру звукового сигнала. Низкочастотные и высокочастотные компоненты можно фильтровать по-разному. (Воспро- (Воспроизведено 'из р'аботы |[Г20] с разрешения Института инженеров по электротехнике И радио- радиоэлектронике.) записей необходимо, чтобы все нелинейности были высокоста- высокостабильными, а их передаточные характеристики должны быть очень точно определены. Отсюда следует, что более высокое качество записи будет обеспечивать именно цифровая система. Поэтому в цифровой микшерной системе логично предусмотреть сжатие или расширение динамического диапазона записи.
Цифровая обработка звуковых сигналов i 123 2.7.2. Подавление эхо-сигналов Метод гомоморфной обработки позволяет восстановить в пер- первоначальном виде сигнал, искаженный добавлением нежелатель- нежелательных эхо-сигналов. В этом случае искаженный сигнал описывается не произведением, а сверткой, и поэтому для восстановления нуж- нужно проводить другие операции. Однако методика обработки в ос- основном такая же, как для сигналов, представляемых в виде про- произведения двух процессов. Рассмотрим случай единственного эхо-сигнала. Импульсный отклик системы имеет вид h{t) = l{f) + ab{t—T). B.3) Если исходным "сигналом является колебание s{t), то на выходе искажающей системы образуется сигнал b{t-T)\. B.4) В частотной области он описывается соотношением X(F) = S(F)(l+ae-''i*FT). B.5) Задача состоит в том, чтобы отделить исходный сигнал от эхо- сигнала. Сначала прологарифмируем соотношение B.5). В ре- результате получим равенство log X(F) = log S(F)+ log {\+aer**FT). B.6) Поскольку сумма \-\-ае~^я?Т является периодической функцией частоты, то и логарифм этой суммы будет периодической-функ- периодической-функцией F, т. е. в соотношение B.6) он будет входить как аддитивная периодическая компонента. Тогда для подавления эхо-сигналов из сигнала logX(F) необходимо удалить периодическую состав- составляющую, период которой равен 2я/7\ Преобразование Фурье log X(F) является спектром логарифма спектра сигнала и называется кепстром. Поскольку logX(F) яв- является суммой двух компонент, а преобразование Фурье обладает свойством линейности, то кепстр сигнала x(t) также можно пред- представить в виде суммы двух составляющих, одна из которых явля- является кепстром полезного сигнала s(t), а другая — кепстром эхо- сигнала. Фильтрация, предложенная в предыдущем абзаце, выпол- выполняется как умножение на корректирующую функцию в простран- пространстве кепстров. Таким образом, если сигнал сосредоточен в прост- пространстве кепстров вблизи точки ^ = 0, то эхо-сигналы можно пода- подавить, выделяя начальный участок кепстра [117]. В этом случае предполагается, что сигнал является медленно изменяющейся ¦функцией частоты, а эхо-сигнал изменяется быстро; поэтому умно- умножение на весовую функцию, равную единице вблизи начала коор- координат и нулю на остальных участках оси, позволяет восстановить исходный сигнал.
124 Глава 2 Можно поступить и по-другому. Если удалось установить рас- расположение пиков кепстра, связанных с наличием эхо-сигналов, то в соответствующих точках можно включить режекторные фильтры, подавляющие эти пики0. На рис. 2.31 показаны характеристики двух возможных вариантов фильтра, подавляющего эхо-сигналы. Фильтрация выполняется как умножение в пространстве кепстров. Бремя Время . Рис. 2.31. Характеристики двух фильтров для выделения компонент в кепстре сигнала с однократным эхо. а — характеристика селектора начального участка кепстра; б — характеристика периодиче- периодического режекторного фильтра. Хотя такие методы применялись исключительно для обработки речевых и сейсмических сигналов, в равной мере они пригодны и для обработки музыки. Однако высокие требования к скорости вычислений, связанные с характерными для музыки значениями скорости создания информации, крайне усложняют такую задачу. Тем не менее в случае необходимости подавления мешающих эхо- сигналов цифровая обработка сигналов является единственным реальным средством выполнения такой операции. Фильтрацию в пространстве кепстров довольно сложно пред- представить в виде какого-либо физического процесса. Независимый параметр этого пространства соответствует времени, отсчитывае- отсчитываемому от начала события или сигнала, поэтому периодический режекторный фильтр должен подавлять пики, которые повторя- повторяются с интервалом, равным задержке эхо-сигнала. Таким образом, этот фильтр ослабляет все периодические компоненты кепстра 1) Аргументом кепстра является переменная, имеющая размерность времени,, поэтому режекторные фильтры фактически реализуются в виде стробирующей схемы, подавляющей соответствующие участки кепстра. — Прим,, перев.
Цифровая обработка звуковых сигналов 125> с периодом, равным задержке эхо-сигнала. Фильтр, который про- пропускает компоненты кепстра, лежащие вблизи начала координат, и подавляет все остальные, можно назвать селектором начально- начального участка кепстра. Он пропускает компоненты с малыми значе- значениями независимого параметра. Существует фильтр концевого- участка кепстра. При подавлении эхо-сигналов периодический режекторный1 фильтр почти не влияет на музыку, за исключением случая, когда в ней содержатся повторения, следующие с теми же интервалами,, что и эхо-сигналы. Однако если задержка эхо-сигнала не изменя- изменяется, то ширину интервалов режекции можно выбрать очень малой и тем самым свести к минимуму влияние фильтра на музыку. К сожалению, пока нет экспериментальных данных о качестве ра- работы подобной системы. 2.7.3. Неопределенная инверсная свертка Подавление нежелательных эхо-сигналов оказалось возможным потому, что свойства одного из разделяемых сигналов были из- известны с абсолютной точностью. В основе фильтрации лежат све- сведения о распределении кепстра музыки или о задержке эхо-сиг- эхо-сигнала. Однако часто бывает, что характеристики обоих сигналов- неизвестны или известны лишь частично, но сигналы нужно раз- разделить между собой. Подобная задача называется неопределенной' инверсной сверткой (или инверсной фильтрацией «вслепую»), так. как в этом случае требуется устранить влияние на неизвестный1 сигнал фильтра с неизвестными характеристиками, когда имеется1 только искаженный сигнал. Стокхэм [119] использовал методику неопределенной инверс- инверсной свертки для восстановления старых звукозаписей. При этом1 не были точно известны ни записываемый музыкальный сигнал, ни- форма передаточной характеристики записывающего устройства.. В распоряжении экспериментатора была только шеллачная грам- грампластинка. Стокхэм заметил, что старые записи звучат не очень естественно, и объяснил это влиянием острых резонансов механи- механической записывающей системы. Все элементы звукозаписывающего тракта, начиная от рупора и кончая мембраной с закрепленной на», ней иглой, имеют заметные резонансы; более подробное описание' старых звукозаписывающих устройств можно найти в работе- [118]. Наличие резонансов было, вероятно, связано с необходи- необходимостью снижения потерь на трение, чтобы поднять до максимума" Уровень выходного сигнала. Хотя частотную характеристику мож- 'но было сделать более равномерной, основной целью было полу- "Чение максимального отношения сигнал/шум. Эти резонансы создают в частотной характеристике очень боль- большие пики и провалы, особенно вблизи частоты 1 кГц. Амплитуда этих выбросов может доходить до 20 дБ, а их ширина достаточно
126 Глава 1 ^ велика. Это создает весьма заметное окрашивание спектра музы- музыки. Неравномерность частотной характеристики не очень заметна, 'если пики имеют небольшую ширину. Так, за счет реверберации 'Создаются очень резкие пики и провалы, но ширина их обычно .не превышает 1 Гц или даже долей герца. Резонансы в системе ме- механической звукозаписи могут иметь ширину до 10—50 Гц. Если голос певца пересекает один из таких резонансов, то сила: звука изменяется очень резко. Таким образом, кроме «окрашивания» .спектра процесс звукозаписи вносит очень сложные изменения в динамику музыкального произведения. Характерное звучание ста- старых записей в большей степени связано с резонансами, чем с по- повышенным уровнем шума или с недостаточной шириной полосы .записанного сигнала. Чтобы устранить влияние фильтра, характеристики которого неизвестны, необходимо сделать предположение о свойствах сиг- сигнала или фильтра, или о том и другом. При анализе звукозаписей .целесообразно сделать два основных предположения. Во-первых, следует считать, что характеристики фильтра линейны и не изме- изменяются в течение всей записи. Это предположение, по-видимому, •справедливо почти всегда, хотя частотная характеристика может ¦слегка изменяться за счет небольших смещений рта певца относи- относительно рупора фонографа. Тем не менее спектральный состав голоса исполнителя на протяжении музыкальной фразы остается ¦сравнительно постоянным, и в среднем спектр мужского голоса при исполнении одной и той же части произведения вряд ли изменился ¦с 1906 г. Во-вторых, следует предположить, что длина музыкаль- музыкального отрывка гораздо больше длительности импульсного отклика •фильтра, а это позволяет проводить усреднение, что необходимо .для выделения сигнала. При инверсной фильтрации всегда необ- необходимо иметь какие-либо сведения о сигнале и искажающем фильтре. Так, например, если имеется единственная запись, полу- полученная с помощью 'некоторого совершенно нового музыкального инструмента, то провести инверсную фильтрацию невозможно. Для иллюстрации этого процесса рассмотрим работы Стокхэма по восстановлению старых записей выступлений Карузо, сделан- сделанных в 1906 г. Инверсная фильтрация основывается на гомоморф- но-й обработке сигналов; здесь применяются те же операции, что и при ослаблении эхо-сигналов. Пусть v(t) —записанный сигнал, s(t) —записываемая мелодия, a h(t) —импульсный отклик систе- системы записи. Тогда v{t) = s{t)*h{t). B.7) Преобразование Фурье обеих частей этого равенства имеет вид H{F), B.8)
Цифровая обработка звуковых сигналов 127" а комплексные логарифмы правой и левой частей соотношения B.8) связаны равенством B.9> которое обладает свойством аддитивности. Желательно найти та- такое линейное преобразование, с помощью которого из последнего равенства можно определить точный вид H(F). Если эта функция, известна, па ее основе можно создать обратный фильтр, устраняю- устраняющий внесенное в процессе записи окрашивание спектра. Если бы: спектры двух слагаемых правой части равенства B.9) заметно различались, то их можно было бы разделить путем линейной фильтрации, как это было сделано при подавлении эхо-сигналов. Но в данном случае основные спектральные составляющие H(F) и S (F) лежат в одном и том же диапазоне, а именно между 100• и 1000 Гц. Однако Н (F) не изменяется в течение всей записи, a S(F) непрерывно флуктуирует. Этот факт подсказывает, что всю запись- можно разделить на большое число участков длиной, превышаю- превышающей длину импульсного отклика записывающей системы, и путем усреднения по всем участкам оценить характеристики фильтра.. В сумме B.9) слагаемое log H(F) на всех участках одинаково, а слагаемое log S(F) изменяется. Для анализа следует брать за- запись, сделанную в один прием, так как в следующем сеансе запи- записи могли быть изменены регулировки фонографа или взят другой, аппарат. Равенство B.9) для г'-го участка имеет вид logV^n^logSiin + logHiF). B.10> При усреднении необходимо учесть, что в соотношениях B.9)—¦ B.10) фигурируют комплексные функции и следует усреднять по отдельности их модули и аргументы. Среднее значение модуля; равно — 2 log\Vl(F)\ = log\H(F)\+ -jr S log|S,(/=•)[, B.11) а среднее значение аргумента -1 2 arg Vt (F) = arg H (F) + -L | arg St (F). B.12) JW i=i yv i=i Левую часть соотношения B.11) можно оценить экспериментально- и из нее получить оценку \og\H(F)\, если каким-то образом. Удастся найти оценку второго слагаемого правой части. Это сла- слагаемое является оценкой спектральной плотности, характерной длят голоса данного певца. Его аппроксимацию можно найти, если:
128 Глава 2 (Подвергнуть такой же обработке современную запись. В резуль- результате получается следующее уравнение, эквивалентное B.11): 1 ll^^)! B.13) Егде H'(F) = l, поскольку современные звукозаписывающие аппара- аппараты не окрашивают спектров. Разность между соотношениями •<2.11) и B.13) равна L^^ B.14) т.е. дает оценку модуля H(F). Предположение о том, что средние •спектры голосов двух певцов при исполнении одного и того же отрывка арии будут одинаковыми, по всей видимости, является разумным. При этом любые ошибки будут создавать слабое окра- окрашивание спектра, подобное тому, что получается при неправиль- неправильной установке регуляторов тембра. Экспериментальные данные, •соответствующие соотношению B.11), приведены на рис. 2.32, а „результаты сглаживания современной записи — на рис. 2.33. Разность между этими функциями была взята в качестве оцен- жи \og\H(F) |. Практически такой процесс дает только приближе- лие к log | // (Z7) |, так как характеристики фильтра, получаемые при обработке современных записей, содержат заметные пики и ¦провалы, которые нельзя отнести ни к особенностям среднего спектра голоса, ни к окрашиванию в процессе записи. В спектре .наблюдаются гармоники частоты электросети, появляющиеся, по- видимому, из-за несовершенства блоков питания современной зву- звукозаписывающей аппаратуры. Тем не менее данный метод являет- является достаточно точным и позволяет заметно повысить качество за- записи. По сообщениям Стокхэма, исправленные записи выступле- выступлений Энрико Карузо «звучат несколько неестественно, но ясность выражений, текстура голоса и художественное впечатление очень сильно улучшились». При обработке удалось устранить изменения .силы звука, связанные с резонансными явлениями, и в записи ис- исчез «мегафонный» оттенок звука. Компенсирующий фильтр был построен на основе обращения гмодуля H(F); фазовая информация при этом не использовалась шз-за математических трудностей, связанных с усреднением фаз, .'входящих в равенство B.12). Эти трудности обусловлены тем, что „для усреднения необходимо иметь истинные значения фаз, а не 1их главные значения. Главное значение средней фазы не равно среднему от главных значений. Так, например, среднее для уг- углов 0 и 370° равно 185°, однако если угол 370° представить его главным значением, равным 10°, то среднее будет равно 5°. Из-за сложности вычислений Стокхэму не удалось найти для H(F) фа-
о -w 20 i -60 -7О -60, л > У*} 1 f 1 1 I > \ 100 WOO Частота, Ги 5000- Рис. 2.32. Усредненный спектр записи «Vesti la Guibba»1' в исполнении Энрико Карузо, сделанной в 1907 г. Спектр соответствует соотношению B.11). (Воспро- (Воспроизведено из работы [119] с разрешения Института инженеров по электротехнике и радиоэлектронике.) 11 Ариозо Канио из оперы Леонкавалло «Паяцы». — Прим. перге. О -20 -50 -ВО -70 -80, " 4, N I \ 10 100 1000 Частота, Гц 5000 Рис. 2.33. Усредненный спектр современной записи «Vesti la Guibba» в исполне- исполнении Джусси Бьерлинга, соответствующий соотношению B.11). Спектр подверг- подвергнут сглаживанию. (Воспроизведено из работы [119] с разрешения Института ин- инженеров по электротехнике и радиоэлектронике.) 9-359
130 Глава 2 зовой функции, хотя подобная задача рассматривалась в литера- литературе [116, 117]. Причиной, позволяющей отбросить фазовую ком- компенсацию, является нечувствительность человеческого слуха к фа- фазовым ошибкам. Однако фактические пределы восприятия фазы пока что не выяснены, и какая-то доля остаточного окрашивания, прослушивающегося в восстановленных записях, может быть свя- связана именно с этим эффектом. Даже при использовании самых быстродействующих современ- современных ЦВМ расчеты, необходимые для восстановления записей, за- занимают очень много времени. Обработка записи длиной в несколь- несколько минут может длиться несколько часов. Музыкальный сигнал необходимо разделить на отдельные отрывки и каждый из них пе- перевести в спектральную область с помощью БПФ. Число отрывков доходит до 500, поэтому для определения параметров фильтра при- приходится усреднять 500 логарифмов от спектров, полученных пос- после БПФ. Структура фильтра настолько сложная, что обработку музыки выполняют в частотной области, для чего музыку подвер- подвергают преобразованию Фурье и умножают ее спектр на коэффи- коэффициенты передачи обратного фильтра. Объем необходимых вычис- вычислительных операций вынуждает проводить такую обработку толь- только в стенах научного учреждения. Тем не менее результаты полу- получаются очень впечатляющими. Благоприятная реакция слушателей свидетельствует об эффективности восстановления записей. 2.8. Заключение Уже сейчас цифровая техника глубоко внедрилась в область звукозаписи и звуковоспроизведения, где прежде применялась только аналоговая техника. Цифровая обработка стала приме- применяться на всех этапах процесса, начиная от записи и кончая пере- передачей сигнала к домашним звуковоспроизводящим установкам. На каждом этапе цифровые методы позволяют повысить качество сигнала или обрабатывать его более гибко, чем с помощью стан- стандартных аналоговых приборов. Нетрудно представить себе звуковоспроизводящую систему, полностью построенную на цифровых элементах. Между микро- микрофоном и соответствующим предусилителем будет включен АЦП, а ЦАП встроен в громкоговоритель. Все остальные блоки цифро- цифровые. Запись производится на цифровом магнитофоне, а для редак- редактирования и монтажа применяется цифровая вычислительная ма- машина, в программе которой предусмотрены все необходимые для обработки сигнала операции. Введение реверберации, сжатие ди- динамического диапазона, выравнивание спектров, подавление шу- шумов, выбор каналов и установка уровней выполняются с помощью цифровых методов. : Сигналы также передаются в цифровом виде по цифровым ли- линиям связи или посредством дисков с видеозаписью. Скорость соз-
Цифровая обработка звуковых сигналов дания информации в процессе квантования сигнала станет менее критичным фактором в связи с совершенствованием методов обра- обработки и созданием новых материалов, допускающих повышенную плотность записи. В результате этих технических усовершенствований качество работы бытовых систем звуковоспроизведения значительно повы- повысится, звук будет передаваться с большей точностью, а звучание станет более естественным. В дополнение к традиционным регули- регулировкам будут введены новые, позволяющие изменять кажущиеся размеры помещения, что будет создавать эффект присутствия в концертном зале. Системы расширения и сжатия динамического диапазона позволят регулировать характер изменения музыкаль- музыкального сигнала, что даст возможность осуществить сжатие при про- прослушивании более слабых фоновых звуков и расширение для вос- восстановления естественных динамических уровней. Электроакусти- Электроакустические преобразователи, завершающие звуковоспроизводящую си- систему, в случае использования цифровой обработки сигналов обес- обеспечат очень точное воспроизведение звуковых колебаний. Все эти прогнозы пока что далеки от реального воплощения, однако в каждом из упомянутых направлений уже ведутся науч- научные исследования. Преимущества применения цифровой обработ- обработки сигналов при звуковоспроизведении вполне ясны, и создание системы, полностью основанной на цифровой технике, является всего лишь вопросом времени. Авторы хотели бы выразить искреннюю признательность Ро- Роберту Берковицу (Teledyne Acoustic Research) за полезные заме- замечания. ЛИТЕРАТУРА 1. Bennett W., Spectra of Quantized Signals, Bell System Tech. I., 27, 7, 446— 472 A948). 2. Hoeschele D., Analog-to-Digital/Digital-to-Analog Conversion Techniques, Wi- Wiley, New York, 1968. 3. Kriz J., A 16 Bit A-D-A Conversion System for High-Fidelity Audio Research, IEEE Trans. Acoust. Speech Signal Processing, ASSP-23, 1, 146—149 A975). 4. Jayant N., Rabiner L., The Application of Dither to the Quantization of Speech Signals, Bell System Tech. I., 51, 6, 1293—1304 A972). 5. Manson W., Digital Sound Signals: Subjective Effect of Timing Jitter, BBC Monograph, Great Britain, 1974/11. 6. Candy J., A Use of Limit Cycle Oscillations to Obtain Robust Analog-to-Digi- tal Conversion, IEEE Trans. Commun., COM-22, 3, 298—305 A974). 7. Blesser В., An Investigation of Quantization Noise, /. Audio Eng. Soc, 22, 1, 20—21 A974). 8. Blesser В., Lee F., An Audio Delay System Using Digital Technology, /. Audio Eng. Soc, 19, 5, 393—397 A971). 9. Freeman D., Digital-to-Analog Conversion Distortion, MIT internal memoran- memorandum, Lebel Laboratory, RLE, Massachusetts Institute of Technology, Cambrid- Cambridge, Mass., 1975.
132 Глава 2 — 10. Blesser В., Ives F., A Re-examination of the S/N Question for Systems with Time-Varying Gain or Frequency Response, /. Audio Eng. Soc, 20, 8, 638^-641 A972). 11. Osborne D., Croll M., Digital Sound Signals: Bit-Rate Reduction Using an Experimental Digital Compandor, BBC Monograph, Great Britain, 1973/41. 12. Lexicon Delay System: Delta T 102, Lexicon Corp., Waltham, Mass. 13. A. Zverev, Handbook of Filter Synthesis, Wiley, New York, 1967. 14. Huelsman L., Active Filters: Lumped, Distributed, Integrated, Digital and Pa- ram entric, Ch. 2, McGraw-Hill, New York, 1970. 15. Stockham Т., A-D and D-A Converters: Their Effect on Digital Audio Fidelity, in Digital Signal Processing, L. Rabiner and Rader, eds., IEEE Press, New York, 1972. 16. Jeffress L., Masking, in Foundation of Modern Auditory Theory, J. Tobias, ed., Academic Press, New York, 1970. 17. Kuescher E., Zwislocki J., Adaptation of the Ear to Sound Stimuli, I. Acoust. Soc. Amer., 21, 135—139 A949). 18. Wegel R., Lane C, The Auditory Masking of One Pure Tone by Another and Its Probable Relation to the Dynamics of the Inner Ear, Phys. Rev., 23, 2, 266—289 A924). 19. Egan J., Hake H., On the Masking Pattern of Simple Auditory Stimulus, /. Acoust. Soc. Amer., 22, 622—630 A950). 20. Myers J., Feinberg A., High-Quality Professional Recording Using Digital Techniques, /. Audio Eng. Soc, 20, 8, 622—628 A972). 21. Iwamura H., Hayashi H., Miyashita A., Anazawa Т., Pulse-Code Modulation Recording System, J. Audio Eng. Soc, 21, 7, 535—541 A973). 22. Sato N., PCM Recorder — A New Type of Audio Magnetic Tape Recorder, /. Audio Eng. Soc, 21, 7 A973). 23. Chew J., Moffat M., Pulse Code Modulation for High-Quality Sound-Signal Distribution: Protection Against Digital Errors, BBC Monograph, Great Bri- Britain, 1972/18. 24. Jones A., Chambers J., Digital Magnetic Recording: Conventional Saturation Techniques, BBC Monograph, Great Britain, 1972/9. 25. Mitchell G., Moffat M., Pulse Code Modulation for High-Quality Sound-Signal Distribution: Subjective Effect of Digital Error, BBC Monograph, Great Bri- Britain, 1972/40. 26. Peterson W., Error Correcting Codes, The MIT Press, Cambridge, Mass., 1961. [Имеется перевод: Питерсон У., Коды, исправляющие ошибки. — М.: Мир, 1964.] 27. Hecht M., Guida A., Delay Modulation, Proc. IEEE, 57, 1, 1314—1316 A969). [Имеется перевод: Хект М., Гуида А. Модуляция с задержкой. — ТИИЭР, 1969, т. 57, № 7, с. 161—163.] 28. Kobayashi H., A Survey of Coding Schemes for Transmission of Recording of Digital Data, IEEE Trans. Comtnun. Technol., 1087—1100, 1971. 29. Melis J., A Visual Display of Tape Modulation Noise with Audio Recording, /. Audio Eng. Soc, 19, 11, 939—941 A971). 30. Trendell E., The Measurement and Subective Assessment of Modulation Noise in Magnetic Recording, I. Audio Eng. Soc, 17, 6, 644—653 A969). 31. Naumann K., Daniel E., Audio Cassette Chromium Dioxide Tape, /. Audio Eng. Soc, 19, 10, 822—828 A971). 32. Bellis F., Smith M., A Stereo Digital Sound Recorder, BBC Monograph, Great Britain, 1974/39. 33. Comstock D., Misner R., Roberts E., Zenner R., Dropout Identification and Cleaning Methods for Magnetic Tape, J. Audio Eng. Soc, 22, 7, 511—520 A974). 34. McKnight J., Development of a Subjective Flutter Measurement Standard, 40th Audio Engineering Society Convention, Apr. 1971, preprint No. 790. 35. Nippon Columbia, Tokyo, Japan, Issued PCM Recordings: NCB 8001, NCB 8002, NCB 8003.
Цифровая обработка звуковых сигналов 133 36. Shorter D., Chew В., Application of Pulse-Code Modulation to Sound-Signal Distribution in a Broadcast Network, Proc. Inst. Etec. Eng., 119, 10, 1442— 1448 A972). 37. Croll M., Pulse-Code Modulation for High Quality Sound Distribution : Quan- Quantization Distortion at Very Low Signal Levels, BBC Monograph, Great Bri- Britain, 1970/18. 38. Dolby R., An Audio Noise Reduction System, /. Audio Eng. Soc, 15, 4, 383— 388 A967). 39. Bennett W., Davey J., Data Transmission, McGraw-Hill, New York, 1965. 40. Hessenmueller H., The Transmission of Broadcast Programs in a Digital. In- Integrated Network, IEEE Trans. Audio Electroacoustics, AU-21, 1, 17—20 A973). 41. Croll M., Osborne D., Reid D., Digital Sound Signals: Multiplexing Six High- Quality Sound Channels for Transmission at a Bit-Rate of 2.048 mbs, BBC Monograph, Great Britain, 1973/42. 42. Osborne D., Digital Sound Signals : Further Investigation of Instantaneous and Other Rapid Companding Systems, BBC Monograph, Great Britain. 1972/1931. 43. Reid D., Croll M., Digital Sound Signals: The Effect of Transmission Errors in a New Instantaneous Digitally Companded System, BBC Monograph, Great Britain, 1974/24. 44. Shorter D., Chew J., Howorth D., Sanders J., Pulse-Code Modulation for High Quality Sound-Signal Distribution, BBC Monograph, Great Britain, 1968/75. 45. Bell Telephone Laboratories Staff, Transmission Systems for Communications, Western Electric Co. Technical Publications. Winston-Salem. N. C. 1971. 46. Smith В., Instantaneous Companding of Quantized Signals, Bell System Tech. I., 36, 653—709 A957). 47. Steele R., Delta Modulation Systems, Wiley, New York, 1975. 48. Dalton C, Delta Modulation for Sound-Signal Distribution : A General Survey, BBC Eng., 4—14 A972). 49. Zetterberg L., Uddenfeldt J., Adaptive Delta Modulation with Delayed Deci- Decision, IEEE Trans. Commun., COM-22, 9, 1195—1198 A974). 50. Song C, Garodnick J., Schilling D., A Variable Step Size Robust Delta Mo- Modulator, IEEE Trans. Commun., COM-19, 6, 1033—1044 A971). 51. Slepian D., On Delta Modulation, Bell System Tech. I., 51, 10, 2101—2136 A972). 52. Schindler H., Linear, Nonlinear, and Adaptive Delta Modulation, IEEE Trans. Commun., COM-22, 11, 1807—1823 A974). 53. Levitt H., McGonegal C, Cherry L., Perception of Slope Overload Distortion in Delta Modulated Speech Signals, IEEE Trans. Audio Electroacoustics, AU-18, 3, 240—247 A970). 54. Jayant N., Digital Coding of Speech Waveforms: PCM, DPCM, and DM Quan- Quantizers, Proc. IEEE, 62, 5, 611—631 A964). [Имеется перевод: Джайант Н. Цифровое кодирование речевых сигналов. Квантизаторы для ИКМ, ДИКМ и ДМ. — ТИИЭР, 1974, т. 62, № 5.] 55. Greenstein L., Slope Overload Noise in Linear Delta Modulators with Gaus- Gaussian Inputs, Bell System Tech. I., 52, 3, 387—421 A973). 56. Cummisky P., Jayant N., Flanagan J., Adaptive Quantization in Differential PCM Coding of Speech, Bell System Tech. I., 52, 7, 115—118 A973). 57. Madsen E., Extraction of Ambience Information from Ordinary Recordings, ... .J. Audio Eng. Soc, 18, 5, 490—496 A970). 58. Wallach H., Newman E., Rosenzweig M., The Precedence Effect in Sound Lo- Localization, Amer. I. PsychoL, 62, 315—336 A949). 59. Haas H., Ueber den Einfluss eines Einfachechos auf die Hoersamkcit von Sprache, Acustica, 1, 49—58 A951). 60. Horral Т., Blanchard В., Watters В., An Auditorium Acoustic Simulator, 79th Meeting Acoust. Soc. Amer., Apr. 21, 1970. 61. Horral Т., частное сообщение, 1972. 62. Gardner M., Image Fusion, Broadening, and Displacement in Sound Locali- Localization, J. Acoust. Soc. Amer., 46, 2 (part 2), 339—348 A969).
13*4 Глава 2 63. Schultz Т., Acoustics of the Concert Hall, IEEE Spectrum, 2, 56—67 A965). 64. Schroeder M., Natural Sounding Artificial Reverberation, J. Audio Erig. Soc, 10, 3, 219—223 A962). 65. Beranek L., Rating of Acoustic Quality of Concert Halls and Opera Houses, 4th Intern. Congr. Acoust., vol. 2, Copenhagen, 1972, pp. 15—29. 66. DeJager F., Delta Modulation, a Method for PCM Transmission Using the 1-unit Code, Philips Res. Rept, vol. 7, 1952, pp. 442—466. 67. Dalton С J., Delta Modulation for Sound-Signal Distribution : A General Sur- Survey, BBC Eng. Rev., July 1972, pp. 4—14. 68. Jayant N., Rosenberg A., The Preference of Slope Overload to Granularity in Delta Modulation of Speech, Bell System Tech. J., 50, 10, 3117—3125 A971). 69. Nielsen P., On the Stability of Double Integration Delta Modulators, IEEE Trans. Commun. Technol., COM-19, 364—366 A971). 70. Jayant N., Adaptive Delta Modulation with a One-Bit Memory, Bell System a- Tech. L, 49, 3, 321—342 A970). ¦ 1\. Cummisky P., Adaptive Differential Pulse-Code Modulation for Speech Pro- Processing, Ph. D. Dissertation, Newark College of Engineering, Newark, N. J., 1973. 72. Rouquette R., Audio Delta Modulator Design and Evaluation, S. M. Disserta- Dissertation, Massachusetts Institute of Technology, Cambridge, Mass., 1975. 73. Blesser В., неопубликованные экспериментальные данные. 74. Goodman D., Greenstein L., Quantizing Noise of Delta Modulation PCM En- Encoders, Bell System Tech. I., 52, 2, 183—204 A973). 75. Schmid H., Electronic Analog/Digital Conversitons, Van Nostrand Rainhold, New York, 1970. [Имеется перевод: Шмид Г. Устройство и принцип действия преобразователей аналог — код. — ГОНТИ, 1971г, перевод № 4211 G1).] 76. Sheingold D., Analog-Digital Conversion Handbook, Analog Devices, Inc., Nor- Norwood, Mass., 1972. 77. Ehara S., Amplitude Distribution of Orchestral Music, Proc. 6th Intern. Congr. Acoust., vol. D, Tokyo, Japan, 1968, pp. 133—136. 78. Beranek L., Acoustics, Chapter 31, McGraw-Hill, New York, 1954. 79. Gravereaux D., Gust A., Bayer В., The Dynamic Range of Disc and Tape Re- Records, /. Audio Eng. Soc, 18, 5, 530—535 A970). 80. Electronic Reverberation: EMT 250, Franz Vertriebsgesellschaft m.B.H., Lahr, West Germany. 81. Kahr D., The Codebreakers: The Story of Secret Writing, Weidenfeld and Ni- colson, London, 1967, pp. 588—599. 82. Zwicker E., Feldtkeller R., Das Ohr Als Nachrichtenempfaenger, 2nd ed., S. Hirzel Verlag, Stuttgart, West Germany, 1967. [Имеется перевод: Цви- кер Э., Фельдкеллер Р. Ухо как приемник информации. — М.: Связь, 1971.] 83. Lin S., An Introduction to Error-Correcting Codes, Prentice Hall, Englewood Cliffs, N. J., 1970. 84. Hamming R., Error Detecting and Error Correcting Codes, Bell System Tech. J., 29, 147—160 A950). 85. Forney G., Burst-Correcting Codes for the Classical Bursty Channel, IEEE Trans. Commun. Technol., COM-19, 5, 772—781 A971). 86. Massey J., Implementation of Burst-Correcting Convolutional Codes, IEEE Trans. Inform. Theory, IT-11, 416—422 A965). 87. Scharf В., Critical Bands, in Foundations of Modern Audiotry Theory, J. To- Tobias, ed., vol. 1., Academic Press, New York, 1970. 88. Orban R., A Program Controlled Noise Filter, I. Audio Eng. Soc, 22, 1, 2—9 A974). 89. Kuttruff H., Room Acoustics, Ch. 4, Wiley (Halstead Press), New York, 1973. 90. Atal В., Schroeder M., Sessler G., Subjective Reverberation Time and Its Re- Relation to Sound Decay, Proc. 5th Intern. Congr. Acoust., Liege, 1965, pre- preprint G32.-. ¦ :;
Цифровая обработка звуковых сигналов 135 91. Quadraphony: An Anthology, preprints from the J. Audio Eng. Soc, the So- ciety, New York, 1975. 92. DeFreites R., A System for Home Reverberation, 54th meeting of the Audio4 Engineering Society, Los Angeles, 1976. 93. Jayant N., Adaptive Quantization with One-word Memory, Bell System Tech. J., 52,7, 1119—1144 A973). 94. Baeder K-, Anwendung der Nachhallplatte, Kino Tech., West Germany, 6r 183—188 A960). 95. Kuhl W., Eine Kleine Nachhallplatte ohne Klangfarbung, 7th International? Congress on Acoustics, Budapest, Proceedings, 1971, pp. 461—464. 96. Kuhl W., The Acoustical and Technological Properties of the Reverberation Plate. European Broadcast Union Rev., part A., 49, 8—14 A958). 97. AKG Division of Phillips, Vienna, Austria, фирма-изготовитель. 98. Rettinger M., Reverberation Chambers, Л Audio Eng. Soc, 20, 9, 734—737 A972). 99. Krokstad A., Strom S., Sorsdal S., Calculating the Acoustical Room Response by the Use of Ray Tracing Techniques, /. Sound Vibration, 8, 118 A968). 100. Baeder K-, Bestimmung der Eigenshaften von Nachhallerzeugern, Radio Men- Mentor, 5, 346—A970). 101. Meyer E., Definition and Diffusion in Rooms, /. Acoust. Soc. Amer., 26, 630—- 636 A954). 102. Schroeder M., Atal В., Sesseler G., West J., Acoustical Measurements in Phil- Philharmonic Hall, New York, J. Acoust. Soc. Amer., 40, 434—440 A966). 103. Kuhl W., Notwendige Eigenfrequenzdicte zur Vermeidung der Klangfaerbung von Nachhall, 6th International Congress on Acoustics, Proceedings, Tokyo, 1968, pp. E69 —E72. 104. Atal В., Schroeder M., Perception of Coloration in Filtered Gaussian Noise-' Short Time Spectral Analysis by the Ear, the International Congress on Acoustics,. Proceedings, Copenhagen, 1962, Sess. H31. 105. Kuttruff H., Thiele R., Ueber die Frequenzabhangigkeit des Schalldrucks in Raumen, Acustica, 4, 614—617 A954). . . 106. Schroeder M., Die Statistichen Parameter des Frequenzkurven von grossen Raumen, Acustica, 4, 594—600 A954). 107. Sabine W., Collected Papers on Accoustics, Harvard University Press, Cambrid- Cambridge, Mass., 1927. 108. Blesser В., неопубликованные данные. 109. Schroeder M., Logan В., Colorless Artificial Reverberation, J. Audio Eng. Soc, 9, 192—197 A961). 110. Schroeder M., частное сообщение. 111. Schroeder M., Natural Sounding Artificial Reverberation, /. Audio Eng. Soc, 10, 219—223 A962). 112. Kuttruff H., Kuenstlicher Nachhall, Frequenz, 16, 91—96 A962). 113. Date H., Tozuka Y., An Artificial Reverberator Whose Amplitude andiRever- beration Time Characteristics Can Be Controlled Independently, Acustica, 17, 42—47 A966). \ 114. Atal В., Schroeder M., Sessler G., Subjective Reverberation Time and Its Re- Relation to Sound Decay, 5th International Congress on Acoustics, Liege, Sept. 1965. 115. Blesser В., Baeder K., Zaorski R., A Real-Time Digital Computer for Simulating Audio Systems, /. Audio Eng. Soc, 23, 9, 698—707 A975). 116. Oppenheim A., Schaefer R., Stockham Т., Non-linear Filtering of Multiplied and Convolved Signals, Proc. IEEE, 56, 1968, 1264—1291 A968). [Имеется перевод: Оппенгейм А. В., Шеффер Р., Стокхэм мл. Т. Нелинейная фильтра- фильтрация сигналов, представленных в виде произведения и свертки. — ТИИЭР, 1968, т. 56, № 8, с. 5—34.] 117. Schaefer R., Echo Removal of Discrete Generalized Linear Filtering, TR 466, Research Laboratory of Electronics, MIT, Cambridge, Mass., 1969. 118. Read O., Welch W., From Tin Foil to Stereo, Howard W. Sams Co., Indiana- Indianapolis, Ind., 1959.
136 Глава 2 119. Stockham Т., Cannon Т., Ingebretsen R., Blind Deconvolution Through Digi- Digital Signal Processing, Proc. IEEE, 63, 678—692 A975). [Имеется перевод: Стокхэм Т., Кэннон Т., Ингебретсен Р. Цифровое восстановление сигналов посредством неопределенной инверсной свертки. — ТИИЭР, 1975, т 63 № 4 с. 160—177.] 120. Stockham Т., The Application oi Generalized Linearity to Automatic Gain Control, IEEE Trans. Audio Electroacoustics, AU-16, 1968, 267—270 A968). 121. Berman J., Loudspeaker Evaluation Using Digital Techniques, Proc. 5th Con- Convention of the Audio Engineering Society, London, Mar. 4, 1975. 122. Fincham L., Loudspeaker System Simulation Using Digital Technique, Proc. . 5th Convention of the Audio Engineering Society, London, Mar. 4, 1975. .123. Rabiner L., Gold В., Theory and Application of Digital Signal Processing, Prentice-Hall, Englewood Cliffs, N. J., 1975, pp. 565—571. [Имеется перевод: Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов.— М.: Мир, 1978.] 124. Robinson D., Dadson R., A Re-determination of the Equal Loudness Relations for Pure Tones, Brit. J. Appl. Phys., 7, 166—181 A956). 125. Robinson C, Pollack I., Interaction Between Forward and Backward Masking : A Measure of Integrating Period of the Auditory System, /. Acoust, Soc. Amer., 53, 1313—1316 A973). 126. Stockham Т., частное сообщение, 1976. 127. Easton R., Soundstream — The First Digital Studio, recording engineer/pro- engineer/producer. 128. Barron M. F. E., The Effects of Early Reflections on Subjective Acoustical Quality in Concert Hall, thesis for the Ph. D. degree, University of Sout- Southampton, Southampton, England, 1974. 129. Berkovitz R., Mclntosh D., A 16-Channel Programmed Delay Network, 54th Convention of the Audio Engineering Society, Los Angeles, May 1976. 130. Nomoto I., Iwahara M., Onoye H., A Technique for Observing Loudspeaker Wave Front Propagation, /. Audio Eng. Soc, 24, 1, 9—13 A976). 131. Levy A., Preliminary High Linear Density Recording Study: Phase II — Pushing the Limits, Internal Memorandum, Bell and Howell, 1975.
Глава 3 ЦИФРОВАЯ ОБРАБОТКА РЕЧЕВЫХ СИГНАЛОВ Э. Оппенгейм^ 3.1. Введение Методы обработки речевых сигналов активно развивались в те- течение нескольких десятилетий применительно к широкому кругу задач — от техники связи до читающих автоматов {4]. Вплоть до середины 60-х годов почти все системы, предназначенные для об- обработки речевых сигналов, строились в виде аналоговых уст- устройств. Вместе с тем в этот же период было создано несколько систем на базе универсальных цифровых вычислительных машин. Однако такие системы обычно моделировали работу аналоговых устройств в произвольном масштабе времени и основывались на алгоритмах, приспособленных к существующей аналоговой аппа- аппаратуре [41]. Гибкость, присущая цифровым вычислительным машинам, ес- естественным образом привела к постановке экспериментов с более сложными алгоритмами, хотя заранее было ясно, что на практике такие алгоритмы невозможно реализовать в виде аналоговых уст- устройств. По мере развития методов цифровой обработки сигналов как за счет расширения возможностей цифровой аппаратуры, так и за счет создания новых алгоритмов становилось все более оче- очевидным, что цифровые методы и аппаратура должны существенно повлиять на процессы обработки речевых сигналов. Многие усо- усовершенствования техники цифровой обработки сигналов были внедрены в системы обработки речевых сигналов отчасти потому, что полосы частот, характерные для речевых сигналов, хорошо со- согласовывались с быстродействием имевшихся машин. В последнее время наблюдается тенденция к внедрению цифровой обработки сигналов в системы обработки речевых сигналов; почти все совре- современные системы обработки речи хотя бы частично основаны на цифровых алгоритмах обработки сигналов. Задачи, связанные с обработкой речевых сигналов, можно раз- разделить на три класса. К первому классу относятся задачи, свя- '> А. V. Oppenheim, Massachusetts Institute of Technology Cambridge Mass. 02139.
138 Глава 3 занные с анализом речи. Например, в автоматических системах распознавания речевых сигналов исходным является речевое ко- колебание, на основе которого принимается решение. Другими при- примерами, в которых требуется только анализ речи, служат опозна- опознание и подтверждение личности по голосу. Задачи, входящие во второй класс, связаны только с синтезом речи, когда, например, на вход читающей машины подается печатный текст, а с выхода снимается речевой сигнал. Задачи такого типа встречаются в ин- информационных системах. Иногда желательно получить информа- информацию из машины в словесной форме, например обращаясь к маши- машине по обычному телефону. Подобная система позволяет врачу с большого расстояния иметь доступ к историям болезней, храня- хранящимся в центральной вычислительной машине. В задачах третьего класса сначала выполняется анализ рече- речевого сигнала, а затем следует его синтез. Примерами могут слу- служить системы передачи речевых сигналов с засекречиванием и системы сжатия полосы речевого сигнала. Если речь передается с применением дискретизации сигнала во времени и квантования, то требуется скорость передачи информации порядка 90 000 бит/с. Применяя анализ речи с последующим кодированием, передачей и синтезом в приемнике, Эту величину (в зависимости от вида системы и требуемого качества синтезированной речи) можно уменьшить в 10—50 раз. Еще одним примером систем анализа — синтеза являются системы накопления — выдачи речевых сообще- сообщений, такие, как автоматический секретарь в телефонной линии. В системе накопления — выдачи речи анализ сообщения может выполняться в произвольном масштабе времени, а результаты анализа запоминаются в памяти вычислительной машины. При формировании требуемого словесного ответа эти результаты ис- используются для управления синтезатором речи. Другими приме- примерами задач третьего класса являются растяжение и сжатие рече- речевых сигналов во времени и улучшение низкокачественных запи- записей речи. Методы цифровой обработки речевых сигналов в общем мож- можно разделить на два больших класса [10]. В одном из них ис- используются такие же способы кодирования колебаний, как и для произвольных звуковых сигналов. К ним относятся импульсно-ко- довая модуляция (ИКМ), дельта-модуляция (ДМ), дифференци- дифференциальная импульсно-кодовая модуляция (ДКИМ) и другие. Во всех перечисленных способах предполагается, что ширина спектра сиг- сигнала ограничена и никаких других предположений о сигнале не делается. Методы обработки, относящиеся к другому классу, в большей мере связаны со структурой речевых сигналов. Они ос- основываются на моделировании органов речи линейной системой с медленно изменяющимися параметрами, возбуждаемой соответ- соответствующим сигналом.
Цифровая обработка речевых сигналов В гл. 2, где рассматривались акустические сигналы общего ви- вида, были описаны некоторые методы цифровой обработки сигна- сигналов, не связанные с речью. Данная глава посвящена методам об- обработки, применяемым к речевым сигналам. В разд. 3.2 рассмот* рена упрощенная модель образования речевого сигнала. Хотя такая модель и является в некотором смысле чрезмерно упрощен- упрощенной, она послужила основой для многих систем обработки речи и в общем полезна для изучения многих важных свойств речевых сигналов. 3.2. Модель речевого сигнала Методы анализа и синтеза речевых сигналов можно рассмат- рассматривать с помощью модели, в которой речевой сигнал является откликом системы с медленно изменяющимися параметрами на периодическое или шумовое возбуждающее колебание {13, 4]. По существу речеобразующий механизм (голосовой тракт) явля- является акустической трубкой, возбуждаемой соответствующим источ- источником при создании желаемого звука. Для звонких звуков источ- источнику возбуждения соответствует квазипериодическая последова- последовательность импульсов, представляющая поток воздуха, протекаю- протекающий через колеблющиеся голосовые связки. Фрикативные звуки образуются при проталкивании воздуха сквозь сужение голосового тракта. При этом получается турбулентный поток, который явля- является источником шума, возбуждающего голосовой тракт. Разрез голосового механизма показан на рис. 3.1. Пример речевого сиг- сигнала, содержащего звуки обоих видов, приведен на рис. 3.2. Как упоминалось выше, речевой сигнал можно промоделиро- промоделировать откликом линейной системы с переменными параметрами (го- (голосового тракта) на соответствующий возбуждающий сигнал. При неизменной форме голосового тракта выходной сигнал равен свертке возбуждающего сигнала и импульсного отклика голосово- голосового тракта. Однако все разнообразие звуков получается путем из- изменения формы голосового тракта. Если форма голосового тракта изменяется медленно, то на коротких интервалах времени выход- выходной сигнал логично по-прежнему аппроксимировать сверткой воз- возбуждающего сигнала и импульсного отклика голосового тракта. Такая модель вместе с временными и соответствующими частот- частотными характеристиками для звонкого звука приведена на рис. 3.3. Из примера со звонким звуком видно, что если на коротком ин- интервале времени входной сигнал является периодическим с посто- постоянной основной частотой, то и выходной сигнал является перио- периодическим. Систему можно рассмотреть и в частотной области. Преобразование Фурье речевого сигнала равно произведению пре- преобразований Фурье возбуждающей функции и импульсного ка голосового тракта (рис. 3.3,6).
Глава 3 -рог:; •РОТ". -ело;., ¦¦-пен ¦ -/оласоаая мель Рис. 3.1. Разрез голосового механизма (по Маркелу и Грею). В частности, спектр, соответствующий периодическому возбуж- возбуждающему сигналу, является линейчатым. Интервал между сосед-, ними линиями спектра равен 2п/Г, а форма огибающей спектра определяется формой воздушного импульса, выходящего из гор-. тани; Частотная характеристика голосового тракта является срав- сравнительно гладкой функцией частоты; поскольку голосовой тракт представляет собой полость, то в первую очередь он харак- характеризуется акустическими резонансами, соответствующими резонансным частотам этой полости, которые обычно на- называются форматными частотами. Спектр речевого сиг- сигнала образуется перемножением линейчатого спектра воз- возбуждающего сигнала и спектра, соответствующего голосовому тракту, и, следовательно, тоже является линейчатым, а его оги- огибающая характеризует передаточную функцию голосового тракта. Поскольку при создании различных звуков форма голосового ¦тракта изменяется, огибающая спектра речевого, сигнала будет, жонечно, тоже изменяться с течением времени. Аналогично при изменении периода сигнала, возбуждающего звонкие звуки, ча-
гооми I * 1 "Л 1 _L i } w I L. >. ll _l_ J L J_ I I Jhb^4^^4~ -J J ,_ I Рис. З.2. Пример речевого колебания, иллюстрирующий звуки различных клас- классов. Произнесена фраза «should we chase...». Л Л Л Голосовой тракт, vlt) S(t) Illllll гшТЫыт^ Рис. 3.3. Модель формирования речи как отклика квазистационарной линейной системы. а—описание во временной области; б — описание в частотной области.
142 Глава 3 \ 0-- ' Рис. 3.4. Спектрограммы высказывания «there was some delay on the rayon stocking». a — широкополосная спектрограмма; б — узхополосная спектрограмма. стотный разнос между гармониками спектра будет изменяться. Следовательно, необходимо знать вид спектра речевого сигнала на коротких отрезках времени и как он изменяется во времени. Изображение кратковременного спектра речевого сигнала в ко- координатах время — частота — яркость называют спектрограммой речих) [29]. На практике обычно рассматриваются широкополос- широкополосные и узкополосные спектрограммы речи. Широкополосная спек- спектрограмма имеет сравнительно высокое разрешение по времени, и поэтому на ней хорошо видны периоды речевого сигнала. Однако разрешение по частоте недостаточно для изучения тонкой структуры спектра речи, определяемой возбуждающим сигналом. На узкополосной спектрограмме хорошо наблюдаются частотные гармоники возбуждающего сигнала, однако разрешение по вре- времени не столь высокое, как на широкополосной спектрограмме. На рис. 3.4 приведены примеры широкополосной и узкополосной '> Иногда его также называют отпечатком голоса (voiceprint) по марке рас- распространенной машины для снятия спектрограмм речевых сигналов.
Цифровая обработка речевых сигналов 143 спектрограмм одного и того же высказывания. На этих рисунках амплитуды спектральных составляющих кратковременных спект- спектров представлены различной яркостью, причем большим амплиту- амплитудам спектра соответствуют более темные участки. На рис. 3.4, а дана широкополосная спектрограмма, соответствующая фильтрам с эффективной полосой 300 Гц. При произнесении звонких звуков отчетливо наблюдаются резонансы голосового тракта, проявляю- проявляющиеся на спектрограмме в виде темных полос. Можно также за- заметить, как изменяется во времени период основного тона. Видны участки с глухими звуками, когда возбуждающий сигнал является шумовым, а не периодическим. Заметим, что отдельные гармоники возбуждающего сигнала звонких звуков по оси частот не разреша- разрешаются. Таким образом, по существу широкополосная спектрограм- спектрограмма представляет собой аппроксимацию огибающей спектра как функции времени. На рис. 3.4, б представлена узкополосная спек- спектрограмма, соответствующая фильтрам с эффективной полосой 45 Гц. Если сравнить ее со спектрограммой рис. 3.4, а, то можно увидеть, что теперь отдельные гармоники возбуждающего сигна- сигнала разделяются по частоте, а разрешение спектральных состав- составляющих по времени ухудшилось. Более подробно кратковремен- кратковременный спектральный анализ речевых сигналов будет описан в разд. 3.4. С помощью приведенной модели удобно описывать основные принципы синтеза и анализа речи. В системах анализа речевых сигналов обычно пытаются разделить возбуждающую функцию и характеристики голосового тракта. Далее в зависимости от кон- конкретного способа анализа получают параметры, описывающие каждую компоненту. Можно возбуждающую функцию классифи- классифицировать как периодическую или шумовую и задать частоту ос- основного тона, если она периодическая. Характеристики голосового тракта можно представить или отсчетами его частотной характе- характеристики, или постоянными параметрической модели. Согласно мо- модели рис. 3.3, синтез речи можно рассматривать как получение отклика линейной системы с медленно изменяющимися парамет- параметрами на периодический или шумоподобный возбуждающий сигнал. При синтезе речи в рамках системы анализа — синтеза рече- речевых сигналов значения параметров линейной системы и возбуж- возбуждающего сигнала поступают из анализатора, поэтому структура синтезатора в значительной мере обусловлена структурой анали- анализатора. В разделах 3.4—3.6 будет рассмотрен ряд структурных схем систем анализа — синтеза. Существует также много схем, которые можно применить в задачах, требующих только синтеза речи. Два конкретных класса таких схем описаны в следующем разделе. Несколько других систем синтеза будут также рассмотре- рассмотрены при обсуждении систем анализа — синтеза речи.
144 Глава 3 3.3. Речевые синтезаторы, воспроизводящие передаточную функцию голосового тракта, и синтезаторы — аналоги акустической трубки Для синтеза речи обычно применяются два класса синтезато- синтезаторов: 1) синтезаторы, воспроизводящие передаточную функцию го- голосового тракта, и 2) синтезаторы — аналоги акустической трубки. Синтезаторы первого класса представляют собой систему, переда- передаточная функция которой аппроксимирует передаточную функцию голосового тракта без учета особенностей строения голосового тракта. Таким образом, в этом случае учитывается влияние голо- голосового тракта на конечные результаты речеобразования. В анало- аналогах акустической трубки моделируются давление или поток воз- воздуха как функция времени и расстояния вдоль акустической трубки, поперечное сечение которой изменяется по ее длине. Таким образом, в синтезаторах — аналогах акустической трубки в некотором смысле сделана попытка более естественно отразить физические изменения, происходящие в голосовом тракте в про- процессе речеобразования. Общая структура синтезатора, воспроизводящего передаточ- передаточную функцию голосового тракта, который называется также фор- мантным синтезатором, изображена на рис. 3.5. В основе синте- синтезаторов этого класса лежит следующее наблюдение: поскольку голосовой тракт является акустической трубкой, то он характе- характеризуется набором мод или резонансных частот. Поэтому его пере- передаточную функцию можно аппроксимировать последовательным Звонкая Глухая °Рильтр- формироратель возбуждения Голосовой, тракт, Пг) Сопротив- Сопротивление из- излучении Форманта Форманта * Форманта Параметры формант JL Форман нт | , Рис. 3.5. Общая структура синтезатора речевого сигнала, воспроизводящего пе- передаточную функцию голосового тракта. соединением резонансных цепей, каждая из которых представляет одну моду или резонанс голосового тракта [17, 19, 20]. При из- изменении формы голосового тракта изменяются резонансные ча- частоты. В силу этого в резонансных цепях должна быть преду- предусмотрена возможность изменения параметров, определяющих центральные частоты и ширину полос резонаторов. Если на син- синтезатор поступает последовательность импульсов (при звонком
Цифровая обработка речевых сигналов 145 звуке) или белый шум (при глухом звуке), то необходим фильтр— формирователь возбуждающего сигнала, чтобы обеспечить благо- благоприятное «окрашивание» спектра. Этот фильтр обычно имеет по- постоянные параметры. Кроме того, необходим фильтр, обеспечиваю- обеспечивающий эффект согласования акустической трубки со свободным про- пространством (т.е. с акустической трубкой бесконечного сечения). Это тоже фильтр с постоянными параметрами, который по своим характеристикам приближенно соответствует дифференциатору. Если формантный синтезатор выполняется в виде аналогово- аналогового устройства на элементах с сосредоточенными параметрами и работает в реальном масштабе времени, то необходим еще один фильтр, называемый корректором высокочастотных полюсов. Вве- Введение этого фильтра обусловлено тем обстоятельством, что аку- акустическая трубка представляет собой систему с распределенными параметрами, имеющую бесконечное число резонансов, т. е. ее пе- передаточная функция имеет бесконечное число полюсов. Хотя в полосу синтезатора попадает лишь конечное число полюсов (че- (четыре или пять), остальные полюсы также влияют на общую форму спектра в полосе синтезатора. Таким образом, для цепочки анало- аналоговых резонаторов с сосредоточенными параметрами необходима дополнительная частотная коррекция. Как было впервые отмечено Голдом и Рабинером [23], этого не требуется в цифровом синте- синтезаторе речи, так как его частотная характеристика периодична и, следовательно, фактически он имеет высокочастотные полюсы. Это же можно увидеть на примере простой акустической трубки, закрытой на одном конце и открытой на другом. Ее импульсным откликом является последовательность импульсов, которую легче получить в цифровом, чем в аналоговом фильтре, имеющем рацио- рациональную передаточную функцию. На рис. 3.6 сравниваются частот- частотные характеристики простой акустической трубки, цифрового и аналогового фильтров с пятью полюсами; из приведенных кривых очевидна необходимость коррекции высокочастотных полюсов в аналоговом фильтре. В формантном синтезаторе, изображенном на рис. 3.5, пред- предполагается, что передаточная функция голосового тракта описы- описывается только полюсами, т. е. она не имеет нулей-антирезонансов. На самом же деле в спектрах звуков появляются нули. Это обус- обусловлено влиянием носовой полости, когда мягкое небо открыто Для носовых звуков типа m или же когда язык делит голосовую полость на две слабо связанные полости, как для звука I [13, 16]. В некоторых формантных синтезаторах имеется цепь для создания нулей частотной характеристики, но часто эффекты, связанные с влиянием этих нулей, могут имитироваться подстройкой ширины полосы первой форманты. Речевые синтезаторы — аналоги акустической трубки основаны на аппроксимации голосового тракта набором соединенных отрез- Ю—359
146 Глава 3 ков акустических трубок, имеющих одинаковую длину (рис. 3.7) [4, 21, 83]. Обычно предполагается, что звук, распространяющий- распространяющийся в каждом из отрезков, можно рассматривать как плоскую вол- волну и можно пренебречь потерями в отрезке, влиянием носового тракта и связью голосовой щели и голосового тракта. При таких предположениях анализ модели акустической трубки становится сравнительно несложным и приводит к структуре фильтра, пара- параметры которого меняются в соответствии с изменениями парамет- 2 3 4-5 Частота, кГц Рис 3 6 Сравнение частотных характеристик аналогового и цифрового фильтров с пятью полюсами и простой акустической трубки (по Гоулду и Рабинеру). Д — акустическая трубка; Б — цифровой фильтр, бполюсов, 10 кГц; В — аналоговый фильтр, в полюсов. ров акустической трубки. В частности, согласно работе Маркела и Грея [83], состояние акустической полости можно описать с помощью давления или объемной скорости воздушной струи как функций времени и расстояния вдоль трубки. Внутри каждого отрезка эти величины можно представить в виде комбинации пря- прямой и обратной бегущих волн, причем прямая волна соответствует прохождению звука от голосовой щели к губам, а обратная — от губ к голосовой щели. Если обозначить через ит(х, t) объемную скорость в m-м отрезке {х = 0 соответствует середине отрезка), то ит(х, t) можно представить как (х, /) = »*(' 7 C.1) где iim и Um обозначают соответственно прямую и обратную бегу- бегущие волны, ас — скорость звука в воздухе.
Цифровая обработка речевых сигналов Голосовая щель- ПлощаЗь сечения Ат Рис. 3.7. Представление голосового тракта набором соединенных трубок одина- одинаковой длины, но различного сечения. Давление рт(х, t) в т-тл отрезке также выражается через объемные скорости прямой и обратной бегущих волн: рп(х, t)=-^\um(t ^Л tM-^ + -iLY|, C.2) Am L\ с/ \ c/J где р — плотность воздуха. Прямая и обратная волны в каждом отрезке должны быть взаимосвязаны так, чтобы объемные скорости и давления на гра- границах между отрезками были непрерывными. В силу этого на границах часть прямой волны излучается в следующий отрезок, а часть отражается назад в виде обратной волны. В каждом от- отрезке аналогичное утверждение справедливо и для обратной вол- волны. Коэффициент отражения цт волн на границе между отрез- отрезками с номерами т и т—1 равен л л п. = пг~1 т (з 3) где Ат и Ат-\ — площади поперечного сечения m-го и (т—1)-го отрезков соответственно. Обозначив длину отрезка через / и на- наложив условие, что объемные скорости и давления на границах отрезков непрерывны, получим ll^it -)-т) = A а ) liin—x (t х) U tlti (t т) C 46) где т, равное //2с, соответствует половине времени пробега волны от одного конца отрезка до другого. Основываясь на соотношениях C.4а) и C.46), связь между Прямыми и обратными волнами потока можно выразить с помощью 10*
148 Глава 3 /п-й от-1 'резок (т-д-й отрезок площадью площадью Am Задерж- Задержка на 2 Г Задерж- Задержка на2г '-? на на 2 т Задерж- Задержка наВГ • Рис. 3.8. а — два отрезка акустической трубки из модели рис. 3.7, на которых показаны прямые н обратные волны; б — направленный граф, описывающий соотношение между прямыми и обратными .волнамси (по <Маркелу и Грею). линейного направленного графа. На рис. 3.8, а показаны два со- соседних отрезка модели акустической трубки, а на рис. 3.8,6 — соответствующий линейный направленный граф, связывающий прямую и обратную волны. Линейный направленный граф, опи- описывающий соотношение, между прямыми и обратными волнами модели акустической трубки, изображен на рис. 3.9. Предполага- Предполагается, что на конце трубки, моделирующем губы, давление равно нулю, а также что со стороны голосовых связок (М—1)-й отрезок соединен с источником воздушного потока, обладающим некото- некоторым сопротивлением, которое может быть описано коэффициентом отражения на этом конце цм- Данный граф можно интерпретиро- интерпретировать как схему цифрового фильтра, если считать, что время за- задержки в каждом отрезке, равное 2x = ljc, соответствует единичной задержке в цифровом фильтре. Келли и Лохбаум [21] первыми рассмотрели применение мо- модели, подобной приведенной на рис. 3.9, для синтеза речевых сиг- сигналов. Ряд вариантов этой структуры, дающих выигрыш в числе умножений, длине слов (разрядности чисел) и т.п., предложен Маркелом и Греем [83]. Вышеприведенный материал представляет собой введение в синтез речевых колебаний. В нескольких последующих разделах
Цифровая обработка речевых сигналов 149 в рамках систем анализа — синтеза рассматриваются другие схе- схемы синтезаторов. Как будет показано в разд. 3.6, синтезатор — аналог акустической трубки хорошо согласуется:с определенной процедурой анализа — синтеза, называемой обработкой методом линейного предсказания. Источник . ¦ орости 1 Мм Единич- Единичная за- задержка Единич- Единичная за- задержка 'И-м-1 Единич- Единичная за- задержка Им-1 l'MM-t Единич- Единичная за- задержка *—i Ь -ft Единич- Единичная за- задержка Mi 1-Л. Единич- Единичная за- задержка -1 Голосовая щвль и, Губы- Рис. 3.9. Линейный направленный граф, описывающий соотношения между пря- прямой и обратной волнами в модели акустической трубки, приведенной 'На рис. 3.7 (по Маркелу и Грею). 3.4. Спектральный анализ на коротких интервалах времени и синтез речи В разд. 3.2 было показано, что в частотной области спектр ко-* ротких отрезков речевого сигнала можно представить в виде про- произведения огибающей, характеризующей состояние голосового тракта, и функции, описывающей тонкую структуру, которая ха- характеризует возбуждающий сигнал. Поскольку основным парамет- параметром сигнала, возбуждающего звонкий звук, является разнос гар- гармоник основного тона, а характеристики голосового тракта с достаточной полнотой определяются частотами формант, то при анализе весьма удобно исходить из представления речи в частот- частотной области. При создании разных звуков форма голосового трак- тракта и возбуждающий сигнал изменяются. При этом изменяется и спектр речевого сигнала. Следовательно, спектральное представ- представление речи должно основываться на кратковременном спектре, по- получаемом из преобразования Фурье. Рассмотрим дискретизованный речевой сигнал, представленный последовательностью s(n). Его кратковременное преобразование Фурье S(co, n) определяется как S(w, п)= 2 s(k)h (n — k) C.5) Таким образом, оно описывает преобразование Фурье взвешенно- взвешенного отрезка речевого колебания, причем весовая функция h(n) сдвигается во времени, как показано на рис. 3.10. Есть два рас- распространенных способа выполнения кратковременного спектраль- спектрального анализа согласно соотношению C.5). Первый способ осуще-
150 Глава 3 ствляется с помощью набора фильтров, что является типичным приемом реализации анализатора, если спектральный анализ дол- должен производиться с помощью аналоговой системы. При вычис- вычислении кратковременного преобразования Фурье цифровыми ме- методами может быть применен алгоритм быстрого преобразования Фурье (БПФ) или же гребенка цифровых фильтров. Чтобы пояс- п Рис. 3.10. К выполнению кратковременного фурье-анализа. нить, как выражение C.5) связано с характеристикой гребенки цифровых фильтров, заметим, что оно соответствует свертке весо- весовой функции h(n) с сигналом s(n), промодулированным колеба- колебанием е~№п, т. е. 5(со, n) = \s(n)e-'mn]*h(n), C.6) где знак * обозначает свертку. Таким образом, S(co, n) может быть получено с помощью системы, изображенной на рис. 3.11. Другой вариант построения гребенки фильтров получается, если формулу C.5) переписать в виде k=— с или S (со, п) = е-'"'п {s («) * \h (п) ё*:т]}. C.7) C.8) Фильтр с импульсной характеристикой h{n)ei<s>n является поло- полосовым с центральной частотой ш. Система, описываемая равенст- равенством C.8), изображена на рис. 3.12. Выбор между системами, пред- представленными на рис. 3.11 и 3.12, в основном определяется сообра- соображениями удобства. В первом случае используется цифровой фильтр нижних частот с импульсной характеристикой h(n), а входной сигнал модулируется с частотой, зависящей от значения со, при котором нужно измерить S(co, n). Система рис. 3.12 более удобна для параллельного измерения S (со, п) на нескольких частотах со.
Цифровая обработка речевых сигналов 151 Оценку кратковременного преобразования Фурье на равноот- равноотстоящих частотах (ог = 2яг/Л/, г = 0,1, ..., N—1, можно получить с помощью алгоритма БПФ. В частности, обозначая отсчеты 5(о), п) через Sr(n), так что S,(/&) = S(a>,, n), C.9) получим Sr(n)= 2 s(k)h{n — N C.10) 'J sfn) NC-/ hfn) г —*¦ S(oj,n) Рис. 3.11. Система для определения кратковременного преобразования Фурье. С помощью замены переменных k = но переписать в виде соотношение C.10) мож- мож>',(*) = 2 — / — гп —/ — г A+п) о N n)-h(-t)e C.11) Суммирование в C.11) можно сначала провести на интервалах длиной N, а затем просуммировать чаатичные суммы, так что 2к ' 2- —j — гп ~ mN+N—l . —j — lr > —* Л' ^ ^ *(l-±-n)h( — l)e N . C.12) ¦ SCu),n)eJ Рис. 3.12. Другая система для нахождения кратковременного преобразования Фурье. Заменив переменные во внутренней сумме и используя периодич- 'ность комплексной экспоненты ехр{—/I—)/г}, равенство C.12) можно привести к виду S,{n) = — / — гп Л'—1, 2 s(k, п)е л' , C.13a)
152 Глава 3 {-1) N N N ,1. N N-точеч- N-точечное Б ПФ [по к) Рис. 3.13. Оценка кратковременного преобразования Фурье с помощью алгоритма БПФ. где s(k, n)= mN)h(—k—mN), /г=0,1,---, Л^—1. C.136) Можно заметить, что при любом фиксированном п сумма (по k), стоящая в правой части выражения C.13а), является УУ-точечным дискретным преобразованием Фурье (ДПФ) для последователь- последовательности s(k, n), и, следовательно, ее можно вычислить по алгорит- алгоритму БПФ. Процесс вычисления Sr(n) из s(n), согласно равенствам C.13), поясняется на рис. 3.13.
____ Цифровая обработка речевых сигналов 153 Другой важный метод вычисления кратковременного преобра- преобразования Фурье для набора равностоящих частот вкючает подста- подстановку величины ^ ^^^ C.14) 2 2 2 в уравнение C.10), что дает -/-*¦ У=- 5(сог, п) = е1пГ 2 s(k)h{n—k)e '" eN ^ C.15) При любом фиксированном п это можно представить как S{wr, n)=e~177 r'\gn{k)*e~1W "l. (ЗЛба) где gn(k) = s(k)h(n-k)e~'"'1'. C.166) Таким образом, вычисление кратковременного преобразования для каждого п сведено к вычислению свертки. Важно отметить, что формулы C.6) — C.8) и C.16) выражают кратковременное преоб- преобразование в виде свертки, но между ними имеется существенное ^отличие: в противоположность формулам C.6) и C.8) свертка [C.16) дает набор отсчетов спектра при фиксированном значе- [ нии п. Методика спектрального анализа с помощью формул C.16) впервые была предложена Блюстейном [31] и развита затем Ра- бинером, Шафером и Рейдером [30]; в доработанной форме она получила название алгоритма z-преобразования с ЛЧМ-фильтра- цией. Хотя этот алгоритм более сложен для вычислений, в неко- некоторых случаях он обладает важными преимуществами. В частно- частности, если весовая функция h(n) имеет конечную длительность, то свертку C.16 а) можно получить, пропуская последовательность gn(k) через фильтр с конечной импульсной характеристикой, яв- являющейся отрезком комплексной последовательности е^лк2/2. По- Поскольку фильтры с конечной импульсной характеристикой осо- особенно просто реализуются на основе полупроводниковых устройств с зарядовой связью или других полупроводниковых приборов с переносом заряда, то и устройства для спектрального анализа на основе формулы C.16) реализуются на базе такой же микро- микроэлектронной техники [36, 38, 39]. Как было указано в разд. 3.2, представление амплитуд спект- спектральных составляющих кратковременного преобразования Фурье речевого сигнала в координатах время — частота — яркость явля-
154 Глава 3 Рис. 3.14. Спектрограмма высказывания «Two churches in Honolulu...». a — широкополосный анализ; б — узкополосный анализ. Полная шкала по оси времени соответствует 2,2 с, то оси частот — 3,5 кГц. ется спектрограммой речи. Примеры, приведенные на рис. 3.4, получены с помощью аналогового спектрографа речевых сигна- лов. Ясно, что аналогичные спектрограммы можно получить циф- цифровыми методами с использованием БПФ [32, 33, 35]. На рис. 3.14. приведены примеры широкополосной и узкополосной спектро- спектрограмм, вычисленных согласно формуле C.13) и схеме, приведен- приведенной на рис. 3.13. Если проанализировать различия узкополосной и широкополосной спектрограмм (как на рис. 3.14, так и на рис. 3.4), то можно увидеть, что существует компромисс между разрешением спектральных составляющих по частоте и разреше- разрешением их по времени. В частности, чтобы кратковременное преоб- преобразование Фурье речевого сигнала могло успевать отслеживать изменения в голосовом тракте и возбуждающем сигнале, необхо- необходимо, чтобы весовая функция h(n) или импульсная характеристи- характеристика фильтров анализаторов была короткой. Так, чтобы обеспечить хорошее разрешение по времени, длина весовой функции для ши- широкополосной спектрограммы выбрана порядка одного периода основного тона. Полученное при этом разрешение по частоте не позволяет разделить отдельные гармоники основного тона, однако форманты в общем различаются. При узкополосном спектральнрм анализе эквивалентный фильтр (рис. 3.11 или 3.12) выбран узко- узкополосным, но для этого требуется, чтобы длительность h(n) со- составляла несколько периодов основного тона. В таком случае от- отдельные гармоники возбуждающего сигнала разделяются, но раз- разрешение по времени при этом ухудшается.
Цифровая обработка речевых сигналов 155 Важной областью применения кратковременного преобразова- преобразования Фурье является графическое изображение речи с помощью спектрограмм. Другие его применения встречаются при анализе — синтезе речи. Одна из таких систем была воплощена в фазовом во- вокодере, разработанном Фланаганом и Голденом [42], который был затем преобразован в цифровое устройство и усовершенствован sin) тЯт-*> • Ип)е>Тп h(n) S0(n) Рис. 3.15. Набор фильтров для кратковременного спектрального анализа. Шафером и Рабинером [47] и Портновым [48]. В основе системы лежит равенство C.10), которое можно преобразовать, как было сделано с формулой C.5), к виду S,(n)e+lwar=\s(n)*hr(n)], где .271 hr(n)=k(n)e C.17а) C.176) Последовательность hr(n) можно рассматривать как характе- характеристику комплексного полосового фильтра с центральной частотой со= Bn(N)r. Тогда формулы C.17) описывают процедуру прове- проведения спектрального анализа последовательности s(n) с помощью гребенки комплексных полосовых фильтров, как показано на рис. 3.15. Если частотная характеристика низкочастотного фильт- фильтра выбрана так, что суммарная частотная характеристика всех фильтров гребенки (рис. 3.15) на всех частотах равномерна, то s(n) можно восстановить, сложив сигналы на всех выходах гре- гребенки. В частности, можно показать [47, 48], что д/ 1 . 2ти 1 1 1 s(«)=-- 2 Sr(n)e при всех п, C.18)
156 Глава 3 __ если h (л) выбрано так, что А@) = 1, А(л)=0 при n±N, ±2N, . . . . C.19) Формула C.17а) является основным уравнением анализатора с кратковременным преобразованием Фурье, а формула C.18) — основным уравнением для соответствующего синтезатора. Из ра- равенства C.13) видно, каким образом можно выполнить анализ с применением БПФ. Из этого равенства следует, что для каждого п необходимо вычислять свое БПФ. Однако рис. 3.11 подсказывает, что для любого г сигнал Sr(n) наблюдается на выходе фильтра нижних частот. Следовательно, из Sr(n) можно взять отсчеты по переменной п и затем восстановить его интерполяцией, применив любую из множества существующих конструкций интерполирую- интерполирующих фильтров. При выполнении синтеза важно иметь в виду, что соотношение C.18) не является дискретным преобразованием Фурье и, следо- следовательно, его нельзя получить с помощью БПФ. Однако Портнов [48] разработал весьма эффективную процедуру, позволяющую воспользоваться преимуществами алгоритма БПФ при построении системы, реализующей уравнение синтеза C.18). Анализ и синтез речи с использованием кратковременного пре- преобразования Фурье не слишком тесно связаны с основной моделью образования речевого сигнала (рис. 3.3). Сигнал на выходе всей системы получается очень высококачественным и не имеет иска- искажений, характерных для многих систем анализа — синтеза, кото- которые будут рассмотрены ниже. С другой стороны, поскольку дан- данный метод слабо связан с моделью речеобразования, он малопри- малопригоден для систем сжатия полосы речи. Имеется еще одна область применения данного метода, а именно он оказался весьма полез- полезным при изменении темпа речи. Здесь метод пригоден для такого изменения речевого сигнала, что преобразованная речь будет соответствовать ускоренному или замедленному темпу разговора. Чтобы более полно воспользоваться основной моделью образо- образования речи (рис. 3.3), в большинстве систем анализа — синтеза делается попытка каким-то образом- «восстановить» речевой сиг- сигнал, т. е. отделить функцию возбуждения от характеристик голо- голосового тракта. Такие системы в общем дают довольно значитель- значительное снижение скорости создания информации, используемой для дальнейшего хранения или передачи речи, хотя обычно это при- приводит к некоторому ухудшению качества, поскольку инверсную фильтрацию невозможно выполнить с абсолютной точностью, а модель рис. 3.3 является лишь приближенным описанием процес- процесса речеобразования. Один из стандартных подходов к аппроксимации передаточной функции голосового тракта основан на применении кратковремен-
Цифровая обработка речевых сигналов 157 ного преобразования Фурье. При рассмотрении спектрограмм ре- речевого сигнала отмечалось, что на широкополосных спектрограм- спектрограммах разрешение по частоте слишком мало для разделения отдель- отдельных гармоник возбуждающего сигнала. Поэтому кратковременный спектр с достаточно низким разрешением по частоте может по- послужить аппроксимацией огибающей спектра или передаточной функции голосового тракта. Иначе говоря, в этом случае речь анализируется с помощью гребенки широкополосных фильтров. Тогда огибающая колебания на выходе каждого фильтра пред- представляет собой оценку амплитуды огибающей спектра речевого колебания на центральной частоте данного полосового фильтра. Огибающую выходного сигнала полосового фильтра получают пу- путем детектирования и последующей низкочастотной фильтрации. Полученные сигналы — огибающие соответствуют выходным сиг- сигналам анализатора. Как будет указано в конце данного раздела, для определения параметров возбуждающего сигнала дополни- дополнительно проводится самостоятельный анализ речи. Аппроксимация спектра исходной речи в соответствующем синтезаторе получается возбуждением гребенки полосовых фильтров с помощью возбуж- возбуждающего сигнала, сформированного на основе этих параметров. Коэффициенты усиления выбираются в соответствии с уровнями сигналов в каналах анализатора. Для получения речевого колеба- колебания выходные сигналы полосовых фильтров синтезатора затем суммируются. Основные элементы всей системы, называемой по- полосным вокодером, изображены на рис. 3.16 [40, 43, 44]. Полосной вокодер — один из самых распространенных типов аналоговых систем для сжатия полосы речевого сигнала. При вы- выборе характеристик полосовых и низкочастотных фильтров, при- применяемых в анализаторе и синтезаторе, и детализации блок-схемы рис. 3.16 следует учесть ряд факторов [45]. Цифровой вариант полосного вокодера может быть построен на основе полосовых и низкочастотных фильтров, выполненных в цифровом виде [41]. Но спектральный анализ, выполняемый набором фильтров, можно выполнить с помощью дискретного преобразования Фурье. В од- одном из таких полосных вокодеров, разработанных Байэли и Ан- Андерсоном [46], воздействие гребенки фильтров анализатора на речевой сигнал заменено вычислением кратковременного преобра- преобразования Фурье; операции, выполняемые детекторами и фильтра- фильтрами нижних частот, формировавшими в аналоговом полосном воко- вокодере огибающие канальных сигналов, заменены вычислением мо- модуля кратковременного преобразования Фурье. Преобразование Фурье может быть вычислено либо непосредственно, либо по ал- алгоритму БПФ. В упомянутом выше вокодере применялось непо- непосредственное вычисление преобразования Фурье. Структура от- отдельного канала вокодера показана на рис. 3.17. Сигналы, полученные в каналах анализатора, используются в синтезаторе для задания амплитуд отрезков синусоид с частотами,
158 Глава 3 .1 Вхо речевой > Полосовой фильтр 100Гц Полосовой фильтр 200Гц Детектор иФНЧ Детектор и ФНЧ — ¦ Полосовой 3200 Гц Детептар иФНЧ Анализатор возбуждающего сигнала^*- 1 U 1 Параметр возбужда- возбуждающего сигнала а Параметр 1д щего сигнала Генератор возоуждаю- щего сигна- сигнала Полосовой фильтр 100 Гц Полосовой фильтр 200 Гц Полосовой срильтр 3200 Гц Выходной речевой сигнал Рис. 3.16. Блок-схема полосного вокодера. а— анализатор; б — синтезатор. равными центральным частотам каналов анализатора, а получен- полученные взвешенные синусоиды складываются. Если все отрезки сину- синусоид приведены к одинаковой фазе, то получающийся импульсный отклик синтезатора симметричен (т. е. имеет нулевую или линей- линейную фазу). Параметры возбуждающего сигнала, полученные в
Цифровая обработка речевых сигналов 159 Отсчеты речевого сигнала о s(nT) Т= 100 мне созпно0пТ ,а(пТ) hlkT) (пТ) + Ь2(пТ) Ь(лТ) Выход s(mojo,nT) sin mworiT h№) 111- -1 О Т 2ТЗТ 99T kT Рис. 3.17. Структура одного из каналов анализатора полосного вокодера (по Байэли и Андерсону). анализаторе, используются для генерации возбуждающего сигна- сигнала, представляющего собой или последовательность импульсов, разнесенных на период основного тона (для звонкой речи), или шумоподобную последовательность (для глухого речевого сигна- сигнала). Структура синтезатора показана на рис. 3.18, а. На рис. 3.18,6 поясняется фактическая процедура формирования импульсного отклика. Схема цифрового аналога обычного полосного вокодера пока- показана на рис. 3.17 и 3.18; существует ряд ее разновидностей, в том числе использующие умножение входного сигнала на весовую функцию, что позволяет улучшить эффективные частотные харак- характеристики фильтров в каналах. В разд. 3.5 и 3.6 будут рассмот- рассмотрены другие виды цифровых систем анализа — синтеза, не имею- имеющие соответствующих аналоговых эквивалентов. До сих пор определение параметров возбуждающего сигнала особо не обсуждалось. Как будет показано в следующих разделах, некоторые системы анализа — синтеза предназначены для полу- получения параметров возбуждающего сигнала. Для полосных воко- Деров это не так. Поэтому в полосных вокодерах чаще применя- применяйся класс алгоритмов анализа возбуждающего сигнала во вре- временной области, который не является специфическим для какой- либо одной системы анализа — синтеза речи.
160 Глава 3 На коротких интервалах времени звонкий речевой сигнал бли- близок к периодическому колебанию. В этом случае задача анализа- анализатора возбуждающего сигнала заключается в измерении частоты, или, что то же самое, периода основного тона. Если сигнал строго периодичен, определить его частоту можно с помощью ряда простых измерений во временной области. Например, если перио- периодический сигнал пропустить через фильтр нижних частот, так что в нем сохранится лишь несколько гармоник, то вполне пригоден простой алгоритм, такой, как измерение интервала между макси- максимумами сигнала или моментами пересечения сигналом нулевого уровня. Однако если колебание не совсем периодично, простые процедуры такого типа часто будут давать неопределенные или Деко- диро- дирование Характе- Характеристики основного тона Восстановленные сигналы в каналах Фильтр уастотной коррекции и сглаживания Генератор импульсного \ отклика Свертка Генератор возбуждающего сигнала I I I. -ПО ЦАП зг J-?. Л„ (/(Г) =2 Н) ~ AnJ cos 0<k<99 Рис. 3.18. a — структура синтезатора цифрового полосного вокодера; б — алгоритм генерации им- импульсного отклика (по Байэли и Андерсону).
Цифровая обработка речевых сигналов неправильные результаты. Поэтому необходимо применять более онкие методы. Один из наиболее удачных подходов, первона- первоначально предложенный Голдом '[49] и усовершенствованный Гол- дом и Рабинером [54], заключается в выполнении не одного, а нескольких параллельных элементарных измерений и определении основной частоты сигнала с помощью счетного алгоритма. Если различные измерения дают противоречивые результаты, речь счи- 'ается глухой. Весьма успешным для анализа речи оказалось применение кратковременной автокорреляционной функции речевого колеба- колебания. Если временной интервал, на котором вычисляется автокор- автокорреляционная функция, составляет несколько периодов основного она, то функция будет иметь максимумы, отстоящие друг от дру- друга на период основного тона. Следовательно, частоту основного тона можно определить, выделив эти максимумы. Аналогично отсутствие этих максимумов свидетельствует о глухом характере речи. Одна из проблем, характерная для автокорреляционных ана- анализаторов возбуждающего сигнала, обусловлена большой шириной главного лепестка автокорреляционной функции. Чтобы сузить автокорреляционную функцию в области малых аргумен- аргументов, Сонджи [53] предложил отбрасывать значения сигнала вбли- вблии нулевого уровня и ограничивать максимальные значения сиг- сигнала, а только потом вычислять автокорреляционную функцию. Введение такой нелинейности обычно позволяет получить в авто- автокорреляционной функции узкие, хорошо заметные максимумы в точках, кратных периоду основного тона. Хотя оба класса алгоритмов позволяют решить, глухой или звонкий характер имеет речь, обычно дополнительно вводят пред- предварительную операцию различения звонкой и глухой речи, осно- основанную на измерении энергии сигнала за короткий промежуток времени. Для глухой речи эта энергия обычно значительно мень- меньше, чем для звонкой. Сравнивая энергию, накопленную за корот- короткий промежуток времени, с некоторой пороговой энергией, можно вынести предварительное решение, является ли речь звонкой или глухой. Затем этот результат вместе с измерениями высоты ос- основного тона используется для принятия окончательного решения о характере речевого сигнала. 3.5. Гомоморфный анализ и синтез речевых сигналов Как было отмечено в разд. 3.2, речевое колебание является сверткой возбуждающей функции с импульсным откликом голо- голосового тракта. Общий метод нелинейной фильтрации, называемый \гомоморфной фильтрацией [60, 59, 8], оказался особенно при- пригодным для задач инверсной фильтрации речевого сигнала. Общая структура гомоморфных систем, применяемых для ин- инверсной фильтрации сообщений, показана на рис. 3.19. Свойства И—359
162 Глава 3 системы ?>* определяются следующим соотношением: X(z) = logX(z), C.20). где X(z) и X(z) —г -преобразования х(п) и х(п) соответственно. Поскольку в общем случае функция X(z) имеет комплексные зна- значения, необходимо ввести подходящее определение ее логарифма [60]. Система L является линейной, а система, обозначенная как Xl/lJ BJJ A Линейная система уш __ nit-1 У(п) Xfz) = logXfzJ Y<zJ = log Y(z) Рис. 3.19. Каноническое представление гомоморфных систем для фильтрации последовательностей с помощью инверсной свертки. D~*, обратна по отношению к системе D*. Если последователь- последовательность х(п) является сверткой двух компонент х\(п) и Х2(п), так что X(z) = Xi(z)Xi(z), C.21) то из определения системы D* вытекает, что Следовательно, C.22)' C.23) Таким образом, система /)* преобразует свертку компонент в сум- сумму, что позволяет разделить эти аддитивные компоненты с по- помощью линейной фильтрации. Сигнал на выходе системы ?>* обыч- обычно называют комплексным кепстром [60]. Ряд свойств комплексного кепстра делает рассматриваемый способ анализа особенно удобным для анализа и синтеза речевых сигналов. Эти свойства перечислены ниже. 1. Рассмотрим последовательность v(n) с ращшнальньщ ^-преобразованием вида Pi ПA- k=l pn ckz~1) П A — dkz) C.24) где |a/i|, \bk\, \ck\ и \dk\ меньше единицы, так что сомножители вида 1—ukZ~l и 1—ckz~l соответствуют нулям и полюсам функции, лежащим внутри единичного круга, а сомножители 1—bkz и. 1—dkz соответствуют нулям и полюсам функции, расположенным.
Цифровая обработка речевых сигналов 163 вне единичного круга. Тогда в общем случае комплексный кепстр v(n) имеет вид Iog | Л1 при п = 0, j mi V IB, 4 n >ji ь2- n при при n я > < 0, 0. C25) 2^ . h=\ П k=\ П Отсюда можно сделать вывод, что комплексный кепстр убывает не медленнее по крайней мере, чем 1/|л|. Таким образом, комп- комплексный кепстр последовательностей, имеющих г-преобразование вида C.24) (что соответствует последовательностям, представляе- представляемым в виде сумм комплексных экспонент), в основном сосредото- сосредоточен вблизи п = 0. 2. Комплексный кепстр последовательности Р(п)~ S akb(n—kN) C.26) А'=— об имеет вид />(«)= 2 №(n—kN). C.27) Другими словами, последовательность, состоящая из равноот- равноотстоящих (но не обязательно одинаковых по величине) импульсов, имеет комплексный кепстр того же вида. 3. Пусть Vm(n) является последовательностью с минимальной фазой1\ имеющей преобразование Фурье Vm(e^). Тогда Vm(n)—Q при п<0. Далее рассмотрим последовательность ve, определенную так, что V, (e/m) = Re {Vт (О] =log I Vm (О | . C.28) Из определения C.28) следует, что ve(n) является четной частью vm(n) и может быть найдена на основе логарифма модуля Vm(e}<a), а не из комплексного логарифма, как требует формула C.20). Можно показать, что ve(Q) при « = 0, vm(n)= ¦ 2ve(n) при « > 0, C.29) 0 при п < 0. Основным следствием данного свойства является то, что для вы- вычисления комплексного кепстр а последовательности с минималь- '' Имеется ряд эквивалентных определений последовательности с минималь- минимальной фазой. Обычно удобно полагать, что последовательность такова, если все нули и полюсы ее z-преобразования лежат внутри единичной окружности. И*
164 Глава 3 ной фазой можно обойтись логарифмом действительной, а не комп- комплексной функции. 4. Пусть v(n) является последовательностью с неминималь- неминимальной фазой и имеет преобразование Фурье V {eia ), и пусть ve(n) обозначает обратное преобразование Фурье от log| V(e^)|, [т.е. ve(n) соответствует четной части комплексного кепстра по- последовательности и(л)]. Рассмотрим, наконец, последователь- последовательность vm(n), определенную соотношением ve@) при п=0, vm (n)= 2ve (п) при п > 0, C.30) 0 при п < 0. Тогда vm(n) является комплексным кепстром последовательности с минимальной фазой vm(n), преобразование Фурье которой рав- равно по модулю преобразованию Фурье последовательности v (п), т. е. *a)\ = \Vm(ei*)\. C.31) В силу этих четырех свойств приемы гомоморфной обработки, оказываются весьма удобными для анализа и синтеза речевых сигналов. Как указывалось в разд. 3.2, короткие отрезки речевых колебаний можно промоделировать откликом линейной системы,, возбуждаемой сигналом в виде последовательности импульсов, если звук звонкий, или в виде шума, если звук глухой. Обычно- полагают, что передаточная функция линейной системы, представ- представляющей голосовой тракт, является рациональной функцией z, т. е. имеет форму C.24). Следовательно, согласно свойству I, комп- комплексный кепстр импульсного отклика голосового тракта имеет вид C.25) и, в частности, сосредоточен в основном вблизи точки п=0. В случае звонкого звука сигнал, возбуждающий голосовой тракт, определяется формулой C.26), и, следовательно, его комп- комплексный кепстр описывается формулой C.27). Таким образом, комплексный кепстр возбуждающего сигнала состоит из импуль- импульсов, повторяющихся через интервал, равный периоду основного1 тона. Поскольку комплексный кепстр импульсного отклика голо- голосового тракта сосредоточен вблизи п = 0, то в случае звонкой речи комплексные кепстры возбуждающего сигнала и импульсного от- отклика голосового тракта в основном занимают неперекрываю- неперекрывающиеся временные интервалы. Тогда значения кепстра, представ- представляющие голосовой тракт, могут быть извлечены из общего кепст- кепстра с помощью линейной системы, которая умножает значения, соответствующие начальным значениям времени, на единицу, а остальные — на нуль. Пример такого восстановления показан на рис. 3.20. На рис. 3.20, а изображен речевой сигнал в виде отрезка гласного
Цифровая обработка речевых сигналов 165 -~-~>/""^, V^L»~-v^'l^^v'V-4 8 звука, а на рис. 3.20,6 — его комплексный кепстр, полученный после умножения сигнала рис. 3.20, а на весовую функцию Хем- минга. В комплексном кепстре хорошо виден максимум в точ- точке, соответствующей периоду основного тона. Сигнал воз- возбуждения (рис. 3.20, е) был получен таким подбором ли- линейного фильтра в схеме рис. 3.19, что сохранялись только составляющие кепстра, соответствующие большим значениям времени. С по- помощью фильтра, сохранявше- сохранявшего кепстр только при началь- начальных значениях времени, был получен восстановленный им- импульсный отклик речевого тракта (рис. 3.20, г). На рис. 3.20, в хорошо просматри- просматривается влияние взвешивания сигнала, выполненного перед вычислением комплексного кепстра. Для проверки того, что импульс, приведенный на рис. 3.20, г, действительно яв- является хорошей оценкой им- импульсного отклика голосового тракта, была вычислена сверт- свертка этого импульса с идеаль- идеальным возбуждающим сигналом. Таким сигналом служила по- последовательность импульсов с тем же периодом, какой был у основного тона исходной речи (рис. 3.20,6). Полученное ис- искусственное речевое колебание показано на рис. 3.20, д, где хорошо видно его близкое сходство с исходным колебанием. До сих пор в ходе обсуждения предполагалось, что кепстр вы- вычисляется по формуле C.20), когда сохраняется как амплитудная, так и фазовая информация. Но широко известно, что человече- человеческое ухо нечувствительно к фазе. Пользуясь свойствами 3 и 4 и предполагая, что речевой сигнал на входе является минимально- фазовым, можно вычислить обратное преобразование от логариф- логарифма модуля преобразования сигнала. Если же входной речевой сигнал фактически не является минимально-фазовым (что почти -10 -5 10 Время, мс Рис. 3.20. Восстановление речевого сигнала с помощью гомоморфной фильтрации. а —отрезок гласной; 6 — комплексный кепстр сигнала а; в — выделенная взвешен- взвешенная последовательность импульсов основ- основного тона; г — восстановленный импульс- импульсный отклик голосового тракта; д—речевой сигнал, синтезированный но импульсному отклику г и возбуждающему сигналу, оце- оцененному из кепстра б (по Оппенгейму и Шаферу).
166 Глава 3 наверняка и должно быть), то полученные значения кепстра бу- будут содержать информацию только о величине спектральных со- составляющих, но не об их фазах. Более популярно можно пояснить механизм восстановления ре- речевого сигнала с помощью кепстров следующим образом. Как уже отмечалось, спектр звонкого звука образуется умножением оги- огибающей, представляющей состояние голосового тракта, на функ- дию, определяющую тонкую структуру спектра и описывающую возбуждающий сигнал. Тогда логарифм спектра равен сумме ло- логарифмов огибающей спектра и спектра возбуждающего сигнала. Логарифм огибающей спектра с ростом частоты изменяется мед- медленно, а логарифм спектра возбуждающего сигнала изменяется быстрее и периодичен. Тогда обратное преобразование Фурье от логарифма огибающей спектра сконцентрировано вблизи началь- начальных значений времени, а обратное преобразование от логарифма спектра возбуждающего сигнала состоит из набора линий, что отражает периодичность его в частотной области. Чтобы выделить логарифм огибающей спектра из полного спектра логарифма, необходимо сгладить спектр логарифма. Для этого кепстр взвеши- взвешивают «окном», «открытым» только в начальные моменты време- времени, т.е. выделяют начальный участок кепстра [59]. Эту проце- процедуру сглаживания полного спектра логарифма, предназначенную для получения логарифма огибающей спектра речевого сигнала, называют сглаживанием кепстра. -i Эффект сглаживания кепстра показан на рис. 3.21. Рис. 3.21, а содержит кепстры, полученные для последовательных отрезков ре- речевого сигнала. На рис. 3.21,6 изображены соответствующие гра- графики логарифмов спектра с наложенными на них графиками ло- логарифмов огибающей спектра, полученными методом сглажива- сглаживания кепстра. Измерение огибающей спектра методом сглаживания кепстра оказалось полезным для широкого круга приложений. Оппенгейм [61] использовал его как основу системы анализа — синтеза речи, а Шафер и Рабинер [62] — для автоматического измерения па- параметров формант. В системе анализа — синтеза, основанной на гомоморфной фильтрации, начальные значения кепстра служат параметрами, описывающими состояние голосового тракта или огибающую спект- спектра речевого сигнала. Значения кепстра при больших значениях времени используются для оценки параметров возбуждающего сигнала. Блок-схема гомоморфной системы анализа изображена на рис. 3.22, а. Параметры возбуждающего сигнала определяются по конце- концевой части кепстра. В частности, в кепстре звонкой речи наблюда- наблюдаются пики в точках, кратных периоду основного тона. Такие пики хорошо видны на рис. 3.21. В спектре глухой речи эти пики от- отсутствуют. Следовательно, основными операциями анализатора
Цифровая обработка речевых сигналов 167 w ^ - Квпсгпрш 1 л r x ¦ Л J - „A,, -- ¦¦¦ ,¦ ¦* - -г 1 Спектры ¦ Время, Рис. 3.21. Оценка огибающей спектра методом сглаживания кепстра. а — кепстры для последовательных отрезков речевого сигнала; б —графики логарифмов спектра и графики логарифмов огибающей, полученные методом сглаживания кепстра (по Шаферу и Рабинеру). возбуждающего сигнала являются: 1) определение наличия (или отсутствия) пиков в концевой части кепстра, что является при- признаком звонкой или глухой речи; 2) при наличии импульсов — определение местоположения пиков в кепстре с целью измерения периода основного тона [51]. На вход гомоморфного синтезатора поступают начальная часть кепстра и параметры возбуждающего сигнала. В синтезаторе из начального участка кепстра формируется аппроксимация импульс- импульсного отклика голосового тракта. На основе параметров возбуж- возбуждающего сигнала генерируется функция, которая после свертки с
168 Глава 3 МпТ) Преобра- Преобразование Фурье Вычисление логарифма модуля кш) Обратное првобра - зование Фурье НпТ) Умно- Умножение . s(nT) s(nT) Время 5 to) Час ma ma - Время Преобра- Преобразование Турье Петзнци- oaeam/e Параметры возбуждающего сигнала Обратное л ре обра- образование че v{nT) Свертка е(пТ) Генерация возбуждаю\ щего -. сигнала| . « • « Т Т Т Т Звонкая речь Глухая речь Рис. 3.22. Блок-схема гомоморфной системы анализа — синтеза, а — структура 'анализатора; б — структура синтезатора.
Цифровая обработка речевых сигналов Г695 импульсным откликом (полученным из начального участка кеп- стра) и дает синтезированный речевой сигнал на выходе. В анализаторе речевого сигнала кепстр вычисляется по лога- логарифму модуля спектра, в силу чего он является четной функцией. Если в синтезаторе для расчета импульсного отклика голосового тракта берется симметричный набор значений кепстра, то и полу- получающийся отклик будет симметричен, т. е. будет иметь нулевую (или линейную) фазу. Импульсный отклик можно вычислить и по-другому, пользуясь формулой C.30), что дает функцию с ми- минимальной фазой. Блок-схема синтезатора изображена на рис. 3.22, б. Прослушивания, проведенные в рабочем порядке, под- подтвердили, что при синтезе с минимальной и нулевой фазами по- получаются практически неразличимые результаты. В целом же син- синтез с нулевой фазой выполнить проще, так как преобразование Фурье от четной последовательности является действительной функцией. Очевидно, что вид аппаратурной реализации гомоморфной си- системы анализа — синтеза во многом определяется устройством вы- вычисления кратковременного преобразования Фурье. В настоящее время в наиболее перспективных типах такой системы для вы- выполнения спектрального анализа применяют устройства с заря- зарядовой связью [39]. Некоторые модификации анализаторов и син- синтезаторов, построенные на базе таких приборов, обладают допол- дополнительными возможностями. В одной из модификаций, например, вместо сглаживания логарифма преобразования Фурье путем сгла- сглаживания кепстра можно использовать фильтрацию этого логариф- логарифма с помощью фильтра нижних частот, имеющего конечную им- импульсную характеристику. Тогда при анализе и синтезе речи требуется выполнять только по одному преобразованию Фурье. 3.6. Анализ — синтез методом линейного предсказания Как альтернативу способа получения информации о голосовом тракте с помощью сглаживания спектров, проиллюстрированного на примере процедуры анализа в гомоморфной системе или в системе с гребенкой фильтров, можно рассмотреть подход, осно- основанный на оценке параметров модели" голосового тракта. В каче- качестве такой модели можно взять модель, в которой характеристики голосового тракта описываются с помощью передаточной функции в виде рациональной дроби ч H(z)=G '¦— ¦ C.32? l) Такой подход иногда называют отождествлением модели. — Прим. перев.
170 Глава 3 При этом параметрами, описывающими голосовой тракт, явля- являются коэффициенты числителя и знаменателя и масштабный множитель G. В общем случае импульсный отклик (или частот- частотная характеристика), соответствующий передаточной функции C.32), является нелинейной функцией коэффициентов числителя и знаменателя. Следовательно, при оценке этих параметров для отрезка речевого сигнала в общем случае необходимо решать си- систему нелинейных уравнений. В частном случае, когда порядок многочлена в знаменателе равен нулю, определение параметров по критерию минимальной средней квадратической ошибки сводится к решению системы линейных уравнений. В случае, когда правая часть формулы C.32) является дробной функцией, т. е. порядок числителя равен нулю (что соответствует модели, имеющей только полюсы), определение параметров модели также сводится к ре- решению системы линейных уравнений, получаемых из условия ми- минимизации средней квадратической ошибки, возникающей в про- процессе обратной фильтрации. Отрезки речевых сигналов, конечно, имеют достаточно слож- сложный вид, и не следует ожидать, что их можно точно описать мо- моделью, такой, например, как C.32), и тем более упрощенными моделями, имеющими только нули или полюсы. Однако, как было указано в разд. 3.2, важной особенностью передаточной функции голосового тракта является то, что она в основном характеризу- характеризуется резонансами, которые в свою очередь хорошо представляются с помощью полюсов. Поэтому логично ожидать, что многие важ- важные характеристики передаточной функции голосового тракта со- сохранятся при использовании модели только с полюсами. Данный раздел будет полностью посвящен методике моделирования голо- голосового тракта с помощью дробной передаточной функции (содер- (содержащей только полюсы). Такой метод расчета обычно называют линейным предсказанием [68, 70, 82, 83]. В разд. 3.7 положения данного и предшествующего разделов будут распространены на случай моделировавния речи с применением передаточной функ- функции, имеющей как полюсы, так и нули. Сначала рассмотрим задачу оценки параметров модели только с полюсами, если импульсная характеристика известна. Пусть H(z)—дробная передаточная функция (тИлько с полюсами), имеющая вид H(z)=G - . C.33) Импульсная характеристика v(n), соответствующая H{z), удов- удовлетворяет разностному уравнению а=1
Цифровая обработка речевых сигналов 171 или при п > 0/ ¦ v(n)=%akv(n — k). C.35) Таким образом, при п>0 характеристика v{n) представляет собой линейную комбинацию р своих предыдущих значений (т. е. может быть линейно предсказана по ним). Если моделируемые данные точно соответствуют импульсному отклику фильтра только с по- полюсами, то соотношение C.35) будет удовлетворяться точно. В противном случае линейная комбинация предыдущих значений будет давать только некоторое приближение к v(n). Обозначим это приближение через v(n), причем »(«)=2?(л-*)' п>0, C.36) а получающаяся при этом ошибка е(п), называемая иногда ос- остатком, равна е(п) —v{n) — v(n) = v(n)— ^akv(n—k). C.37) Если прогнозируемые коэффициенты а^ выбираются из условия минимума среднего квадрэтического значения ошибки, то их можно определить путем решения системы линейных уравнений. В частности, рассмотрим полную среднюю квадратическую ошиб- ошибку, задаваемую в виде bakv{n k)}\ C.38) J где верхний предел N—1 определяется длиной имеющегося отрез- отрезка сигнала. Параметры аи можно найти, положив = 0, i = \, 2, . . ., р, C.39) что дает систему уравнений р где ф.й= J]v(n — l)v{n— k). C.406) Подставляя в уравнение C.38) выражение C.40), получим фор- формулу для средней квадратической ошибки Ет: 2 к—1
172 Глава 3. В дополнение к прогнозируемым коэффициентам в формуле C.34) необходимо задать масштабный множитель G. Ниже схематично описан один из возможных способов его выбора. Если характеристика v(n) известна при любых п, то в сумме C.38) верхний предел, равный JV—1, можно положить равным бес- бесконечности, и соотношение C.406) будет тогда иметь вид (л-0о(«-А). к = °' I' 2' • • ¦' Р' C.42) 1 Z Р Поскольку v(n)=0 при и<0, коэффициенты cp(ft, определяемые формулой C.42), являются коэффициентами автокорреляции по- последовательности v (пI). Если имеется только конечный отрезок импульсной характеристики и(я), то верхний предел в сумме C.40 б) следует выбирать так, чтобы в сумму входили только из- известные значения v(n). В этом случае коэффициенты <pi& уже не являются коэффициентами автокорреляции. В приведенных рассуждениях предполагалось, что имеется ко- конечный отрезок импульсной характеристики v(n). При моделиро- моделировании речевых сигналов с помощью модели, имеющей только по- полюсы, исходными данными являются речевые колебания, соответ- соответствующие свертке импульсного отклика голосового тракта с воз- возбуждающим сигналом. Из этих данных нужно найти коэффициен- коэффициенты (fih уравнений C.40). Обычно применяются две процедуры. В одной из них, называемой автоковариационным методом, в ка- качестве аппроксимации конечного отрезка v(n) берут отрезок s(n) длиной в период основного тона (или другой конечной длины) и находят коэффициенты аи с помощью системы уравнений C.40) [70]. Во втором методе отрезок длиной в несколько периодов ос- основного тона взвешивают с помощью гладкой функции [73]. По- Поскольку требуются небольшие значения аргумента, то автокорре- автокорреляционная функция взвешенного отрезка речи может служить ап- аппроксимацией автокорреляционной функции импульсной характе- характеристики v(n) голосового тракта. Таким образом, коэффициенты автокорреляции взвешенного отрезка речи непосредственно при- применяются в качестве коэффициентов ф,& в системе C.40). По вполне очевидным причинам этот метод обычно называется авто- автокорреляционным методом. В любом из двух методов процедура анализа применяется к последовательным отрезкам речевого сиг- сигнала, так что коэффициенты модели непрерывно обновляются, что отражает изменение характеристик голосового тракта с течением времени. Автокорреляционный и автоковариационный методы при- применяются для анализа речи, однако первый метод используется •> Следует иметь в виду, что коэффициенты ср*ь являются коэффициентами автокорреляции только при I, й^О и если i и k не равны нулю одновременно.
Цифровая обработка речевых сигналов чаще. Одним из главных его преимуществ является то, что матри- матрица коэффициентов <р,-й является теплицевой, т. е. все элементы мат- матрицы, расположенные на одной диагонали, равны между собой [65]. Таким образом, при вычислении элементов матрицы доста- достаточно найти одну ее строку. Кроме того, как будет показано ниже, существуют эффективные методы для решения получающейся си- системы уравнений (т.е. для обращения матрицы Теплица), Допол- Дополнительно отметим, что матрицы Теплица никогда не являются сингулярными и при отсутствии ошибок вычисления искомое ре- решение для фильтра только с полюсами оказывается устойчивым. Автоковариационный метод таких гарантий не дает. Главное до- достоинство автоковариационного метода состоит в том, что он в некотором смысле более точен. В частности, если последователь- последовательность можно точно промоделировать импульсной характеристикой фильтра, имеющего только полюсы, и имеется лишь конечный от- отрезок последовательности, то при использовании автоковариаци- автоковариационного метода выходной сигнал фильтра только с полюсами пол- полностью совпадет с исходной последовательностью, а при исполь- использовании автокорреляционного метода этого не произойдет. Однако такое различие при анализе речи методом линейного предсказа- предсказания, по-видимому, можно отнести на второй план, потому что практически никогда сигнал точно не совпадает с колебанием на выходе фильтра только с полюсами. С другой стороны, очевидны практические достоинства метода, при использовании которого не появляются сингулярные системы и неустойчивые решения. В оставшейся части раздела будет применяться только автокор- автокорреляционный метод. Обозначим коэффициенты автокорреляции последовательности v(n) через R(k) и выразим соотношения C.40) и C.41) ¦через R{k): akR(i-k)=R(i), i = l,2,...,p, C.43) = R@)-vH0)-f]akR(k). C.44) Общепринято и вполне логично определять масштабный мно- множитель G в формуле C.34) так, чтобы полные энергии сигналов, прошедших через фильтр с характерисикой v(n), и фильтр с им- импульсной характеристикой, имеющей только полюсы, были равны. Пусть h(n) —импульсная характеристика фильтра, соответствую- соответствующего формуле C.34), a Rh(k) — ее корреляционная функция, при- причем коэффициенты ak в формуле C.34) найдены решением систе-
174 Глава 3 мы уравнений C.43). Тогда h(n) удовлетворяет разностному урав- неншо h (п) = V akh (n—k) + G 8 («). C.45) Умножив обе части уравнения C.45) на h(n—i), i>0, и просум- просуммировав по п, получим f,a*Rh(i-k) = Rh(!). C.46) Поскольку G выбрано так, что л=0 я=0 [т.е. так, что Rh@)=R@)], то из сравнения формул C.46) и C.43) следует, что R(k)=Rh(k), k=0, I p. C.47) Таким образом, при моделировании методом линейного предска- предсказаний с моделью в виде фильтра только с полюсами первые р+1 коэффициентов автокорреляции импульсной характеристики филь- фильтра приравниваются к соответствующим коэффициентам автокор- автокорреляции исходных данных. Умножив обе части уравнения C.45) на h(n), просуммировав по п и учитывая, что h@) =G, получим *A(O)=ije*?ft(*)+G2. C-48) Наконец, преобразуя C.48) с применением равенства C.47), бу- будем иметь G*=R @)— ^ ctjfi (k). C.49) k=\ Итак, если прогнозирующие коэффициенты аи найдены, то мас- масштабный множитель G очевидным образом определяется по фор- формуле C.49). Сравнивая, наконец, соотношения C.44) и C.49), можно заметить, что полная средняя квадратическая ошибка Ет и масштабный коэффициент G связаны соотношением ET=G2—v2@). C.50) Важным достоинством метода линейного предсказания является наличие эффективных приемов решения системы уравнений C.43).
Цифровая обработка речевых сигналов 175 В автоковариационном методе матрица коэффициентов не явля- является теплицевой, однако ее можно обратить с помощью одного из нескольких сравнительно эффективных методов [81, 82]. При автокорреляционном методе можно воспользоваться очень эффек- эффективными итеративными алгоритмами, первоначально предложен- предложенными Левинсоном [64] и усовершенствованными Дэрбином [66, 67]. По методу Дэрбина, коэффициенты, получаемые при реше- решении разностного уравнения ?-го порядка вида C.43), рекуррентно выражаются через решения разностного уравнения вида C.43) лорядка i—1. Эти соотношения имеют вид af=-klt C.516) P, 1 </</—!, C.51в) , . C.51г) где а()\ /=1, 2, ..., t, являются коэффициентами предсказываю- предсказывающего устройства t'-ro порядка. Коэффициент Ei связан соотноше- соотношением E!p=Ei—у2@) с полной средней квадратической ошибкой Е^\ получающейся в предсказывающем устройстве i-ro порядка. Система уравнений решается последовательно для i—\, 2, .... р, исходя первоначально из соотношения ?0 = R@). Окончательное решение получается при условии aj = af, / = 1, 2 , р. C.52) 'Поскольку при каждой итерации вычисляется Et, имеется возмож- возможность исследовать поведение ошибки с увеличением порядка пред- предсказывающего устройства. Вспомогательные параметры kt, назы- называемые коэффициентами отражения, фактически являются коэф- коэффициентами отражения на границах соседних отрезков акустиче- акустической трубки, когда отрезки имеют одинаковую длину и различ- различные сечения. Линейное предсказание при анализе речевых сигналов обычно используется в двух основных направлениях. Одно из них — про- проведение кратковременного спектрального анализа речи в спектро- спектрографах и спектроанализаторах. Второе направление—построение систем анализа — синтеза. Спектральный анализ речевых сигна- сигналов при использовании параметров, вычисляемых в процессе ли- линейного предсказания, выполняется довольно эффективно. Если параметры найдены, то значения спектра H(eiw) на дискретном множестве частот можно вычислить с помощью соотношения C.33). Дополнительно можно заметить, что для равноотстоящих
176 Глава 3 точек единичной окружности отсчеты полинома, стоящего в зна- знаменателе дроби C.33), можно получить, если применить алгоритм БПФ к конечной последовательности h~l (я), имеющей вид 1 при я=0, — ап при п=1, 2, . . ., р, О в остальных случаях. Эта последовательность фактически является импульсной харак- характеристикой фильтра, обратного к фильтру только с полюсами, т. е. где б (п) —¦ единичный импульс. Если требуется получить N отсче- отсчетов Н (z) в равноотстоящих точках единичной окружности, то по- последовательность hrl{n), содержащую р+1 отсчетов, следует до- дополнить N—р—1 отсчетами, равными нулю. В силу тесной связи со спектральным анализом [74, 83] ли- линейное предсказание позволяет получать хорошие аппроксимации огибающих спектров. На рис. 3.23 изображены спектр импульсной характеристики фильтра только с полюсами, полученный методом линейного предсказания, и преобразование Фурье соответствую- соответствующего взвешенного речевого сигнала. На рис. 3.24 сравниваются результаты спектрального анализа речевого сигнала, полученные с помощью кратковременного пре- преобразования Фурье, гомоморфного анализа и линейного предска- предсказания. Исследовался отрезок синтезированного гласного звука с известными частотами формант. Первые два спектра соответствуют преобразованию Фурье от речевого сигнала, взвешенного по Хем- мингу при длине «окна» 51,2 и 12,8 мс соответственно. Как было показано в разд. 3.4, такая операция по существу является анали- анализом сигнала с помощью гребенки фильтров. На рис. 3.24, а приве- приведены результаты анализа сигнала с высоким разрешением по ча- частоте, что подтверждается наличием отчетливо видной тонкой структуры спектра, связанной с возбуждающим сигналом. На рис. 3.24, б эффективная ширина полосы фильтров больше, о чем свидетельствует форма спектра, в котором отсутствует хорошо разрешенная тонкая структура сигнала. Максимумы огибающей спектра сигнала, соответствующие формантам, в общем заметны, но несколько расширены за счет взвешивания сигнала. На рис. 3.24, в представлена огибающая спектра, полученная гомоморфной фильтрацией речевого сигнала. Хорошо видны фор- макты и отсутствие тонкой структуры спектра. Наконец, на рис. 3.24, г приведен спектр, полученный при анализе сигнала ме- методом линейного предсказания с 12 коэффициентами. Этот спектр имеет наиболее ровный характер с отчетливо выделяющимися формантами. Плавный характер спектра при линейном предскада- нии объясняется тем,'что при моделирований спектра' применялся
Цифровая обработка речевых сигналов 177 1 Ж А. . тлпвч ч 1 1 ' V 1 I А Л > m J о 2 3 5 6 Уас/лота, it Гц 10 Рис. 3.23. Спектральный анализ речевого сигнала методом линейного предсказа- предсказания с 28 полюсами. Спектр, полученный при линейном предсказании, изображен на фоне преобразования Фурье от взвешенного речевого сигнала (по Макхоулу). О Fl F2 F3 F4 F5 5 FI = 0,720 кГц F2 = \ F4 = 3,400 нГн Рис. 3.24. Спектральный анализ синтезированной гласной. а — преобразование Фурье отрезка сигнала длительностью 51,2 мс, взвешенного по Хеммин- гу. б — преобразование Фурье отрезка сигнала длительностью 12,8 мс, взвешенного по Хем- ми'нгу; в — огибающая спектра, полученная гомоморфной фильтрацией отрезка длительно- длительностью 30 мс; г —огибающая спектра, полученная при анализе методом линейного предска- предсказания Сс 12 параметрами). ' ¦•'.'. '. 'Л 12—359
J78 Глава 3 лолином 12-го порядка, в силу чего в спектре не может быть более шести максимумов. Приведенные рассуждения, конечно, не гаран- гарантируют, что максимумы спектра получатся на частотах формант. •Однако в данном примере эти частоты совпали, и опыт показы- показывает, что чаще всего так и бывает. Линейное предсказание применяют не только для спектраль- спектрального анализа речевых сигналов. Оно играет важную роль и в системах анализа — синтеза. Параметры, входящие в функцию предсказания, через формулу C.33) определяют параметры пере- передаточной функции голосового тракта. При заданных параметрах речь можно синтезировать любым из способов, рассмотренных в разд. 3.3. Предложено несколько вариантов структуры анализа- анализатора, пригодных для построения синтезатора и реализующих пере- передаточную функцию голосового тракта. Структуру прямой формы можно получить непосредственно по коэффициентам функции предсказания. С другой стороны, дробь C.33) можно преобразо- преобразовать в произведение и получить структуру последовательной (кас- (каскадной) формы. Оба варианта соответствуют синтезатору, воспро- воспроизводящему передаточную функцию голосового тракта. Во всех случаях, однако, выявляются трудности одного поряд- порядка. Параметры синтезатора непрерывно обновляются при смене анализируемых участков (кадров) речи. Чтобы избежать эффек- эффектов, связанных со скачками значений параметров, необходимо ллавно изменять параметры с помощью интерполяции при пере- переходе от одного участка речи к другому. При прямой форме синте- синтезатора, однако, набор интерполированных значений параметров может соответствовать неустойчивому фильтру, хотя исходные значения относились к устойчивому фильтру. В последователь- последовательной (каскадной) структуре устойчивость обеспечивается проще. Здесь, однако, появляется трудность, связанная с тем, что поря- порядок, в котором расставлены элементарные блоки, должен сохра- сохраняться в интервалах между последовательными моментами изме- изменения параметров, что является результатом влияния начальных условий непосредственно перед сменой параметров. Эти трудности не встречаются при использовании синтезиро- синтезированных структур, моделирующих голосовой тракт акустической трубкой. Такие структуры особенно хорошо соответствуют анализу речи методом линейного предсказания. Существует ряд таких структур, тесно связанных между собой. Несколько неожиданным оказывается, что параметры таких структур получаются в процес- процессе решения по алгоритму Левинсона уравнений, фигурирующих в автокорреляционном методе. В частности, коэффициенты k\ уравнения C.51), названные коэффициентами отражения, соответ- соответствуют коэффициентам отражения на границах соседних отрезков акустической трубки, имеющих одинаковую длину и неравное се- сечение, и непосредственно соответствуют коэффициентам отраже- отражения цт в структурах рис. 3.8 и 3.9.
Цифровая обработка речевых сигналов 179 Определение параметров возбуждающего сигнала в системе анализа — синтеза с линейным предсказанием обычно основыва- основывается на исследовании сигнала ошибки, получаемого пропусканием исходного речевого сигнала через фильтр с характеристикой, об- обратной той характеристике, которая аппроксимирует передаточ- передаточную функцию голосового тракта. Полученный сигнал ошибки является аппроксимацией сигнала, возбуждающего речевое коле- колебание. Для определения параметров, возбуждающего сигнала можно применить любой из множества алгоритмов различения звонкой и глухой речи (а также оценки периода основного тона), основанных на анализе сигналов во временной области, например автокорреляционный анализ [56, 83]. Итак, линейное предсказание представляет собой мощное сред- средство для цифрового анализа речевых сигналов. Его возможности очень удачно согласуются с характеристиками речевых сигналов. Кроме того, алгоритмы, основанные на этом методе, являются изящными и эффективными и хорошо соответствуют современно- современному уровню техники в области микропроцессоров и других цифро- цифровых устройств. В данной главе были затронуты лишь некоторые из многих аспектов этого метода. Подробнее эти вопросы изложе- изложены в превосходной книге Маркела и Грея [83]. 3.7. Моделирование речи с применением передаточной функции, содержащей полюсы и нули При рассмотрении характеристик голосового тракта и основ- основной модели образования речевых сигналов было отмечено, что голосовой тракт неплохо описывается с помощью рациональной передаточной функции, содержащей полюсы и нули. Полюсы соот- соответствуют резонансам голосового тракта, а нули появляются вслед- вследствие таких явлений, как коартикуляция и связь между голосовым трактом и носовой полостью. Во многих системах анализа и син- синтеза речи голосовой тракт представляется моделью, передаточная функция которой содержит только полюсы, а явления, обусловлен- обусловленные нулями передаточной функции, учитываются выбором шири- ширины полосы первой форманты. К настоящему времени полностью еще не выяснено, в какой степени для системы анализа — синтеза речи необходимо точное знание количества нулей и их расположе- расположения. Неопределенность обусловлена отчасти тем, что не было надежных способов обнаружения нулей передаточной функции. В более общем анализе речевых сигналов, проводимом, например, с целью автоматического распознавания высказываний при иссле- исследованиях лингвистических аспектов речи и физиологических осо- особенностей ее образования, сведения о нулях спектра речевого сигнала привлекаются для выявления ряда важных признаков речи. . ' . .:. "¦У1
Ш Глава 3. При анализе речевых сигналов методом линейного предсказа- предсказания с использованием модели, содержащей только полюсы, ана- анализировались взвешенные отрезки речевого сигнала. В силу осо- особенностей метода линейного предсказания как средства спект- спектрального анализа результирующий спектр определялся в основном ¦огибающей спектра речи и в модели с не очень большим числом полюсов не зависел от тонкой структуры спектра речи. В противо- противоположность этому любой из существующих методов исследования нулей спектра очень чувствителен к тонкой структуре спектра. Причину этого можно пояснить, обратившись к схеме рис. 3.3: .любой метод обнаружения нулей спектра будет чувствителен к тому, что амплитуда спектра между гармониками основного тона стремится к нулю. Ошибочно эти значения можно принять за нули спектра. Поэтому при использовании метода исследования нулей спектра речи важно, чтобы перед выполнением анализа речевой сигнал был подвергнут инверсной свертке. В основном применяются три метода инверсной свертки. Сог- Согласно первому методу, выделяют отрезок сигнала длительностью в один период основного тона и полагают, что колебание явля- является импульсным откликом голосового тракта. Результат, конечно, верен только в том случае, когда импульсный отклик голосового тракта короче периода основного тона. Методику, основанную на таком методе распознавания речевого сигнала, называют синхрон- синхронным анализом (анализом, синхронным с основным тоном). Второй метод инверсной фильтрации основан на линейном предсказании с применением модели, передаточная функция которой содержит только полюсы. Если огибающая спектра речи содержит и по- полюсы, и нули, то порядок передаточной функции, содержащей только полюсы, должен быть очень высоким, так как нули также приходится аппроксимировать с помощью полюсов. В результате анализа с применением модели высокого порядка получается ап- ироксимация импульсного отклика голосового тракта, или, что то же самое, огибающая спектра речи, которую можно предста- представить с помощью модели меньшего порядка с передаточной функ- функцией, имеющей полюсы и нули. В третьем методе применяется гомоморфная инверсная фильтрация, дающая аппроксимацию им- импульсного отклика голосового тракта, к которой можно применить анализ нулей и полюсов [94]. Теоретически разработано несколько методов моделирования речевого сигнала на основе передаточных функций, имеющих нули и полюсы. Методы, требующие проведения операций с большими матрицами, и способы с итеративной оптимизацией обычно оказы- оказываются малопригодными для анализа речи, когда предъявляются высокие требования к быстродействию и объему памяти и часто требуется обработка сигналов в реальном масштабе времени. По- Поэтому наиболее приемлемыми оказываются методы, основанные на критерии наименьших квадратов и сформулированные так,
Цифровая обработка речевых сигналов 181 чтобы они сводились к решению линейных уравнений. Обычно это условие приводит к методам, когда сначала определяются полюсы и затем нули, а не одновременно и то и другое. Оценить полюсы независимо от нулей можно с помощью автоковариационного ва- варианта метода линейного предсказания. В частности, чтобы опи- описать импульсную характеристику голосового тракта v(n) моделью, ¦содержащей полюсы и нули, рассмотрим последовательность v(n), задаваемую разностным уравнением вида v (п) = 2 bk ь (n-k) + 2 akv(t—k). C.53) ft-0 k=\ При n>q, где q— общее число нулей, уравнение C.53) при- принимает вид v(n) = ^akv(n-k), л > д, C.54) k = \ так что при любом п>ц последовательность v(n) можно линейно предсказать по ее р предыдущим отсчетам. Таким образом, даже при наличии в модели нулей полюсы можно оценить, определив в уравнении C.54) коэффициенты аи, минимизирующие ошибку предсказания. Но, поскольку уравнение C.54) справедливо толь- только при n>q, в данном случае необходимо следить за тем, чтобы значения v (n) не выходили за этот предел, даже если после ин- инверсной фильтрации функция v(n) известна при всех п. Далее допустим, что е(п) обозначает ошибку предсказания, так что р е (n)=v (и) — V akvin—Щ-> п > Ц- C.55) k=i Выберем коэффициенты аи так, чтобы суммарная средная квад- ратическая ошибка предсказания, равная Ет= 2 еЦп), C.56) была минимальна. Повторяя операции, сделанные при выводе формул C.40), получим систему уравнений для коэффициентов оператора предсказания аи в виде р 2 д*Ф« = Ф/о. /=1, 2 р, C.57а) где <Ь= S v{n-i)v{n-k). C.576)
182 Глава 3 Матрица коэффициентов <p,ft симметричная, но, как и автокова- автоковариационном методе, не является теплицевой. После определения коэффициентов аА можно воспользоваться методом, предложен- предложенным Шенксом [86], и находить коэффициенты Ьк в уравнении C.53) путем минимизации средней квадратической ошибки меж- между v(n) и импульсной характеристикой искомого фильтра с по- полюсами и нулями. В результате получается система линейных уравнений ч 2 bkRlk = Vl, i = 0, I, . . ., q, где Rik =^w (n — i)W (n—k), C.58a) причем последовательность w(n) является импульсной характери- характеристикой фильтра, имеющей только полюсы, т. е. р w (п) = 2) akw (n —k) + 8 (n) C.586) и 00 ]/.= 2 у {n)w (n — i). C.58в) Другая возможная процедура оценки нулей состоит в том, что исходную последовательность и (я) фильтруют обратным филь- фильтром, устраняя полюсы, затем обращают спектр, чтобы превратить нули в полюсы, и далее методом линейного предсказания оцени- оценивают полюсы сигнала с обращенным спектром. Такой метод по- подобен методике, первоначально предложенной Дэрбин'ом [66, 67]. На рис. 3.25 приведены результаты исследования нулей и по- полюсов спектра этими методами. На рис. 3.25, а изображен спектр естественного носового согласного звука т. Отчетливо видны два глубоких провала в спектре: один на частоте 650 Гц, другой на частоте 3,2 кГц. На рис. 3.25,6 показан спектр, выделенный при гомоморфной инверсной фильтрации. Далее этот спектр был до- дополнительно проанализирован методом линейного предсказания с 12 полюсами; результат приведен на рис. 3.25, в. Бросается в гла- глаза, что данный спектр точно отражает наличие максимумов, но не провалов в спектре. На рис. 3.25, г и д показаны спектры, полу- полученные с помощью модели, содержащей 12 полюсов и 10 нулей. Нули на рис. 3.25, г вычислялись по методу Шенкса, а на рис. 3.25, д — линейным предсказнием обращенного сигнала ошиб- ошибки. Из двух последних графиков хорошо видно, что применение
Цифровая обработка речевых сигналов 183 Л\Л^ О 1 2 3 4 кГц. б > ^ — 4 пГц О I 2 3 4 кГц рис. 3.25. Иллюстрация анализа полюсов и нулей спектра речевого сигнала. а — ппектв .носового согласного звука т; б-огибающая спектра, полученная сглаживанием кепстра в - результат анализа предыдущего спектра методом линейного предсказания для модели с 12 полюсами; г-спектр, соответствующий модели с 12 полюсами и 10 нулями по- лученными методом Шенкса; а-спектр, соответствующий модели с 12 полюсами и 10 ну- нулями полученными методом линейного предсказания обращенного сигнала ошибки (по Копеку).
184 Глава 3 линейного предсказания с обращением позволит более точно оце- оценить провалы в спектре. Этот вывод согласуется с тем, что обычно наблюдается как для естественной, так и для синтезированной речи [94]. Несколько отличный и менее обоснованный подход к модели- моделированию с использованием дробных функций, содержащих полюсы и нули, основан на применении аппроксимаций Падэ [91]. Теория аппроксимации Падэ основана на идее отыскания для заданной аналитической функции аппроксимирующей функции в виде рацио- рациональной дроби с заданными порядками числителя и знаменателя. Аппроксимирующая рациональная функция выбирается так, что- чтобы первые (j.+'v+l членов ее разложения в ряд и разложения ап- аппроксимируемой функции попарно совпадали, причем ци v озна- означают соответственно порядок числителя и знаменателя аппрокси- аппроксимирующей функции. Еще один чисто теоретический подход к моделированию рече- речевого сигнала функцией с нулями и полюсами основан на том, что линейно-взвешенный комплексный кепстр последовательности от- отсчетов речевого сигнала содержит полюсы в точках, где исходная последовательность имеет нули или полюсы [93]. В частности, рас- рассмотрим последовательность v(n) с z-преобразованием V(z) и предположим, что V{z) является рациональной функцией вида V(z)~ По определению комплексного кепстра v его z-преобразование V(z) равно Тогда г-преобразование линейно-взвешенного кепстра nv(n) опре- определяется как —z[dv(z)jdz] и имеет вид УУ(г) __ D(z)N'(z)-N(z)D'(z) dz ~ г N(z)D(z) ' ^-оу> где штрих означает диффернцирование по г. Таким образом, если полюсы последовательности nv{n) определены, например, линей- линейным предсказанием, то они представляют собой полюсы и нули v (п). При использовании этого метода требуется определить, какие из полюсов nv(n) являются полюсами, а какие — нулями v(n). Это можно сделать несколькими способами. Один из подходов состоит в том, что отдельно анализируется последовательность v(ri) методом линейного предсказания и находятся ее полюсы; оставшиеся полюсы nv(n) являются нулями v{n). Другой способ состоит в исследовании вычетов последовательности nv(n). Не- Нетрудно показать, что нули v (n), лежащие внутри единичного кру-
Цифровая обработка речевых сигналов 185 га, будут порождать отрицательные вычеты, а полюсы, лежащие внутри единичного круга, — положительные вычеты. Существует тест для разделения полюсов и нулей v(n), лежащих вне единич- единичного круга. Интересно отметить, что распознавание речевого сиг- сигнала, обычно необходимое при моделировании на основе дробных функций с полюсами и нулями, в данном процессе по существу выполняется автоматически, так как значения кепстра, относящие- относящиеся к начальным моментам времени, содержат информацию только об импульсном отклике голосового тракта. Еще одна возможность моделирования импульсного отклика голосового тракта заключается в построении модели с нулями и полюсами для линейно-взвешенного кепстра. Это соответствует мо- моделированию импульсного отклика голосового тракта с помощью дробной модели с нулями и полюсами (т. е. модели, в которой полюсы и нули могут иметь нецелый порядок). Однако в настоя- настоящее время эти идеи изучены еще недостаточно глубоко и поэто- поэтому являются весьма проблематичными. 3.8. Заключение В данной главе были представлены основные идеи и методы цифровой обработки речевых сигналов. Более подробно рассмат- рассматривались методы и системы, которые опираются на основную мо- модель формирования речи. Большая часть рассуждений относилась к тому, что главной проблемой в обработке речевых сигналов яв- является инверсная фильтрация сигнала на компоненты, представля- представляющие по отдельности характеристики возбуждающего сигнала и голосового тракта. Кратковременный спектральный анализ и го- гомоморфная фильтрация весьма тесно связаны с вычислением пре- преобразования Фурье и, следовательно, с применением алгоритма быстрого преобразования Фурье. Анализ речи методом линейного предсказания, в котором используется параметрическая модель, основан на применении эффективных алгоритмов обращения кор- корреляционной или ковариационной матрицы. Метод линейного пред- предсказания обладает рядом важных преимуществ, обусловленных параметрическим характером модели, однако по сравнению с дру- другими методами он менее универсален. Все рассмотренные методы хорошо согласуются с современным состоянием цифровой техники и позволяют применять при созда- создании аппаратуры большие интегральные схемы, микропроцессоры и т. д. Для систем, рассмотренных в разд. 3.3 и 3.4, кроме того, подходят приборы с зарядовой связью. Поскольку подобные уст- устройства очень удобны для создания систем спектрального анали- анализа с высокой разрешающей способностью, то они могут стать ба- базой для недорогих речевых систем, в которых необходим такой анализ. Следовательно, можно ожидать продолжения исследова- исследований и ускоренного развития всех методов и систем.
186 Глава 3 В области обработки речевых сигналов остается еще много не- нерешенных проблем. Хотя метод линейного предсказания и явля- является эффективным при описании речи математическими моделями, содержащими только полюсы, для создания моделей с полюсами и нулями или более общих параметрических моделей пока не най- найдено столь же надежного и эффективного метода. Воз- Возможно, такие методы будут найдены в работах по идентификации и моделированию систем. Некоторые результаты упомянутых ис- исследований применялись для обработки речевых колебаний, но часто оказывались неприемлемыми, так как основывались на пред- предположениях, которые не соответствуют специфике исследований речи. Следовательно, при изучении возможностей применения та- таких методов следует тщательно учитывать предпосылки и характер условий, на которых они основаны. Однако при последующем раз- развитии алгоритмов обработки речи, по-видимому, все больше будет учитываться непостоянство характеристик систем во времени и в большем объеме будут применяться методы анализа систем, хоро- хорошо зарекомендовавшие себя в> других областях, таких, как опти- оптимальное управление и моделирование систем с переменными па- параметрами. ЛИТЕРАТУРА Литература общего характера 1. Gold В., Rader С. М., Systems for Compressing the Bandwidth of Speech, IEEE Trans. Audio'Eledroacoustics, AU-15, 3, 131—135 A967). 2. Gold В., Rader С. М., Digital Processing of Signals, McGraw-Hill, New York, 1969. (Имеется перевод: Голд Б., Рейдер С. М. Цифровая обработка сигна- сигналов.— М.: Сов. радио, 1973.) 3. Flanagan J. L., Coker С. H., Rabiner L. R., Schafer R. W., Umeda N., Syn- Synthetic Voices for Computers, IEEE Spedrum, 7, 10, 22—45 A970). 4. Flanagan J. L., Speech Analysis Synthesis and Perception, 2nd ed., Springer- Verlag, New York, 1972. 5. Rabiner L. R., Rader С. М., eds., Digital Signal Processing, IEEE Press, New York, 1972.: 6. Schafer R. W., A Survey of Digital Speech Processing Techniques, IEEE Trans. Audio Eledroacoustics, AU-20, 4, 28—35 A972). 7. Brigham E. 0., The Fast Fourier Transform, Prentice-Hall, Englewood Cliffs, N. J., 1974. x. Oppenheim A. V., Schafer R. W., Digital Signal Processing, Prentice-Hall, Englewood Cliffs, N. J., 1975. [Имеется перевод: Оппенгейм А. В., Ша- Шафер Р. В. Цифровая обработка сигналов. — М.: Связь, 1980.] 9. Rabiner L. R., Gold В., Theory and Application of Digital Signal Processing, Prentice-Hall, Englewood Cliffs, N. J., 1975. [Имеется перевод: Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов. — М.: Мир,. 1978.1 10. Schafer R. W., Rabiner L. R., Digital Representations of Speech Signals, Proc. IEEE, 63, 4, 662—677 A975). [Имеется перевод: Шафер Р. В., Раби- Рабинер Л. Р. Цифровое представление речевых сигналов. — ТИИЭР, 1975, т. 63, № 4.]
Цифровая обработка речевых сигналов 187 И. Digital Signal Processing Committee'of the IEEE Acoustics, Speech and Sig- Signal Processing Society, eds., Selected Papers in Digital Signal Processing II IEEE Press, New York, 1976. Модель речеобразования 12. Miller R. L., Nature ol the Vocal Cord Wave, /. Acoust. Soc. Amer., 31, 667— 677 A959). 13. Fant G. С. М., Acoustic Theory of Speech Production, Mouton and Co., The Hague, The Netherlands, 1960. [Имеется перевод: Фант Г. Акустическая тео- теория речеобразования. — М.: Наука, 1964.] 14. Flanagan J. L., Source-System Interactions in the Vocal Tract, Ann. N. Y. Acad. Sci., 155, 9—15 A968). 15. Rosenberg A. E., Effect of Glottal Pulse Shape on the Quality of Natural Vo- Vowels, /. Acoust. Soc. Amer., 49, 583—590 A971). 16. Fant G. С. М., Speech Sounds and Features, The MIT Press, Cambridge Mass., 1973. Синтезаторы речевых сигналов 17. Steward J. Q., An Electrical Analogue of the Vocal Organs, Nature, 110, 311— 312 A922). 18. Dudley H. R. R., Watkins S. S. A., A Synthetic Speaker, /. Franklin Inst., 227, 739—764 A939). 19. Dunn H. K-, The Calculation of Vowel Resonances and an Electrical Vocal Tract, /. Acoust. Soc. Amer., 22, 740—753 A950). 20. Stevens K. N., Fant G. С. М., An Electrical Analog of the Vocal Tract, J. Acoust. Soc. Amer., 25, 734—742 A953). 21. Kelly J. L., Jr., Lochbaum C, Speech Synthesis, Proc. 4th Intern. Congr. Acoust., G42, 1—4 A962). 22. Flanagan J. L., Coker С. Н., Bird С. М., Digital Computer Simulation of a Forrnant-Vocoder Speech Synthesizer, 15th Ann. Meeting Audio Engr. Soc, 1963, Preprint 307. 23. Gold В., Rabiner L. R., Analysis of Digital and Analog Formant Synthesizers, IEEE Trans. Audio Electroacoustics, AU-16, 81—94 A968). 24. Rabiner L. R., Digital-Format Synthesizer for Speech Synthesis, J. Acoust. Soc. Amer., 43, 822—828 A968). 25. Rabiner L. R., Jackson L. В., Schafer R. W., Coker С. Н., Digital Hardware for Speech Synthesis, IEEE Trans. Commun. Tech., COM-19, 1016—1020 A971). 26. Flanagan J. L., Voices of Men and Machines, J. Acoust. Soc. Amer., 51, 1375—1387 A972). 27. Flanagan J. L., Rabiner L. R., eds., Speech Synthesis, Dowden, Hutchinson & Ross, Stroudsburg, Pa., 1973. 28. Gray A. H., Jr., Markel J. D., Digital Lattice and Ladder Filter Synthesis, IEEE Trans. Audio Electroacoustics, ALJ-21, 491—500 A973). Спектральный анализ речи 29. Potter R. К., Kopp G. A., Kopp H. G., Visible Speech, Dover, New York, 1966. 30. Rabiner L. R., Schafer R. W., Rader С. М., The Chirp Z-Transform Algorithm and Its Applications, Bell System Tech. J., 48, 1249—1292 A969). 31. Bluestein L. I., A Linear Filtering Approach to the Computation of the Discre- Discrete Fourier Transform, IEEE Trans. Audio Electroacoustics, AU-18, 451—455 A970). 32. Oppenheim A. V., Speech Spectrograms Using the Fast Fourier Transform, IEEE Spectrum, 7, 57—62 A970). 33. Mermelstein P., Computer Generated Spectrogram Displays for On-Line
188 Глава 3 Speech Research, IEEE Trans. Audio ElectroacousUcs, AU-19, 44—47 A971). 34. Schafer R. W., Rabiner L. R., Design of Digital Filter Banks for Speech Ana- Analysis, Bell System Tech. I., 50, 10, 3097—3115 A971). 35. Murphy J. F., An Improved Sound Spectrograph, 1972 Conf. Speech Commun- and Processing, pp. 420—422. 36. Means R. W., Buss D. D., Whitehouse J. H., Real Time Discrete Fourier Trans- Transforms Using Charge Transfer Devices, Proc. CCD Applications Conf. Pro- Proceedings, San Diego, Calif., Sept. 1973, pp. 127—139. 37. Silverman H. R., Dixon N. R., A Parametrically Controlled Spectral Analysis System for Speech, IEEE Trans. Acoust. Speech Signal Processing, ASSP-22, 362—381 A974). 38. Brodersen R. W., Hewes C. R., Buss D. D., Spectral Filtering and Fourier Analysis Using CCD's IEEE Advanced Solid-State Components for Signal Processing, IEEE Intern. Symp. Circuits and Systems, Newton, Mass., Apr. 1975, pp. 43—68. 39. Buss D. D., Brodersen R. W., Hewes С R., Tasch A. F., Jr., Communication Applications of CCD Transversal Filters, Natl. Telecommunications Conf., New Orleans, La., Dec. 1975, p. 1. Анализ — синтез речи на основе кратковременного преобразования Фурье 40. Dudley H., Remaking Speech, /. Acoust. Soc. Amer., 11, 169—177 A939). 41. Golden R. M., Digital Computer Simulation of a Sampled-Data Voice .Excited Vocoder, I. Acoust. Soc. Amer., 35, 1358—1366 A963). 42. Flanagan J. L., Golden R. M., Phase Vocoder, Bell System Tech. J., 45, 1493— 1509 A966). 43. Schroeder M. R., Vocoders: Analysis and Synthesis of Speech, Proc. IEEE, 54, 720—734 A966). [Имеется перевод: Шредер М. Вокодеры: йнализ и син- синтез речи. — ТИИЭР, 1966, т. 54, № 5.] 44. Gold В., Rader С. М., The Channel Vocoder, IEEE Trans. Audio Electro- acoustics, AU-15, 4, 148—160 A967). 45. Golden R., Vocoder Filter Design: Practical Considerations, /. Acoust. Soc. Amer., 43, 803—810 A968). 46. Bially Т., Anderson W., A Digital Channel Vocoder, IEEE Trans. Commun. Tech., COM-18, 4, 435—442 A970). [Имеется перевод: Байли Т., Андер- Андерсон В. Цифровой полосный вокодер. — Зарубежная радиоэлектроника, 1971, № 7, с. 3—16.] 47. Schafer R. W., Rabiner L. R., Design and Simulation of a Speech Analysis- Synthesis System Based on Short-Time Fourier Analysis, IEEE Trans. Audio ElectroacousUcs, AU-21, 165—174 A973). 48. Portnoff M. R., Implementation of the Digital Phase Vocoder Using the Fast Fourier Transform, IEEE Trans. Acoust. Speech Signal Processing, ASSP-24, 3, 243—248 A976). Анализаторы возбуждающего сигнала 49. Gold В., Computer Program for Pitch Extraction, /. Acoust. Soc. Amer.. 34, 916—921 A962). 50. Gold В., Note on Buzz-Hiss Detection, /. Acoust. Soc. Amer., 36, 1659—1661 A964). 51. Noll A. M., Cepstrum Pitch Determination, /. Acoust. Soc. Amer., 41, 293— 309 A967). 52. Schroeder M. R., Period Histogram and Product Spectrum: New Methods for Fundamental-Frequency Measurement, /. Acoust. Soc. Amer., 43, 4, 829—834 A968). 53. Sondhi M. M., New Methods of Pitch Detection, IEEE Trans. Audio Electro- acoustics, AU-16, 262—266 A968).
Цифровая обработка речевых сигналов 189 54. Gold В., Rabiner L. R., Parallel Processing Techniques for Estimating Pitch Periods of Speech in the Timev Domain, /. Acoust. Soc. Amer., 46, 2, 442—449 A962). 55. Noll A. M., Pitch Determination of Human Speech by the Harmonic Product Spectrum, the Harmonic Sum Spectrum, and a Maximum Likelihood Estimate, Computer Processing in Communications Proceedings, J. Fox, ed., Polytechnic Press, New York, 1969. 56. Markel J. D., The Sift Algorithm for Fundamental Frequency Estimation, IEEE Trans. Audio Electroacoustics, AU-20, 367—377 A972). 57. Maksym J. N.. Real-Time Pitch Extraction by Adaptive Prediction of the Speech Waveform, IEEE Trans. Audio Electroacoustics, AU-21, 149—153 A973). 58. Ross M. J., Shaffer H. L., Cohen A., Freudberg R., Manley H. J., Average Magnitude Difference Function Pitch Extractor, IEEE Trans. Acoust. Speech Signal Processing, ASSP-22, 353—362 A974). Гомоморфная обработка речевых сигналов 59. Oppenheim A. V., Schafer R. W., Homomorphic Analysis of Speech, IEEE Trans. Audio Electroacoustics, AU-16, 221—226 A968). 60. Oppenheim A. V., Schafer R. W., Stockham T. G., Nonlinear Filtering of Mul- Multiplied and Convolved Signals, Proc. IEEE, 56, 1264—1291 A968). 61. Oppenheim A. V., Speech Analysis-Synthesis System Based on Homomorphic Filtering, /. Acoust. Soc. Amer., 45, 459—462 A969). 62. Schafer R. W., Rabiner L. R., System for Automatic Analysis of Voiced Speech, I. Acoust. Soc. Amer., 47, part 2, 634—648 A970). 63. Weinstein C, Oppenheim A., Predictive Coding in a Homomorphic Vocoder, IEEE Trans. Audio Electroacoustics, AU-19, 3, 243—249 A971). Линейное предсказание 64. Levinson N., The Wiener RMS (Root-Mean-Square) Error Criterion in Filter Design and Prediction, /. Math. Phys., 25, 261—278 A947). 65. Grenander U., Szego G., Toeplitz Forms and Their Applications, University of California Press, Berkeley, Calif., 1958. [Имеется перевод: Гренандер У., Cere Г. Теплицевы формы и их приложения. — М.: ИЛ, 1961.] 66. Durbin J., Efficient Estimation of Parameters in Moving-Average Models, Bio- metrika, 46, parts 1 and 2,306—316 A959). 67. Durbin J., The Fitting of Time-Series Models, Rev. Inst. Intern. Statist., 28, 3, 233-243 A960). 68. Atal B. S., Schroeder M. R., Predictive Coding of Speech Signals, Proc. 1967" Conf. Speech Commun. Processing, 360—361< A967). 69. Atal B. S., Schroeder M. R., Adaptive Predictive Coding of Speech Signals,. Belt System Tech. I., 49, 6, 1973—1986 A970). 70. Atal B. S., Hanauer S. L., Speech Analysis and Synthesis by Linear Prediction of the Speech Wave, J. Acoust. Soc. Amer., 50, 637—655 A971). 71. Itakura F., Saito S., Speech Information Compression Based on the Maximum- Likelihood Spectral Estimation, /. Acoust. Soc. Japan, 27, 463—472 A971). 72. Burg J. P., The Relationship Between Maximum Entropy Spectra and Maxi- Maximum Likelihood Spectra, Geophysics,.37, 2, 375—376 A972). 73. Markel J. D., Digital Inverse Filtering —A New Tool for Formant Trajecto- Trajectory Estimation, IEEE Trans. Audio Electroacoustics, AU-20, 129—137 A972). 74. Itakura F., Speech Analysis and Synthesis Systems Based on Statistical' Method, Doctor of Engineering Dissertation, Department of Engineering, Na- goya University, Japan, 1972. 75. Makhoul J., Wolf J., Linear Prediction and the Spectral Analysis of Speech, NTIS No. AD-749066, BBN Report No. 2304, Bolt Beranek and Newman, Inc., Cambridge, Mass., 1972.
190 Глава 3 76. Boll S. F., A Priori Digital Speech Analysis, Computer Science Division, Uni- University of Utah, Salt Lake City, Utah, UTEC-CSC-73-123, 1973. 77. Markel J. D., Gray A. H., On Autocorrelation Equations as Applied to Speech Analysis, IEEE Trans. Audio Elecrtoacoustics, AU-20, 69—79 A973). 78. Makhoul J., Spectral Analysis of Speech by Linear Prediction, IEEE Trans. Audio Electroacoustics, AU-21, 140—148 A973). 79. Eykhoff P., System Identification: Parameter and State Estimation, Wiley, New York, 1974. [Имеется перевод: Эйкхофф П. Основы идентификации си- систем управления. Оценивание параметров и состояния. — М.: Мир, 1975.] ¦80. Hofstetter E. M., An Introduction to the Mathematics of Linear Predictive Filtering as Applied to Speech Analysis and Synthesis, MIT Lincoln Labora- Laboratory Technical Note 1973—36, Rev. 1, Apr. 12, 1974. 81. Morf M., Fast Algorithms for Multivariable Systems, Ph. D. Dissertation, Stanford University, Stanford, Calif., 1974. ¦82. Makhoul J., Linear Prediction; A Tutorial Review, Proc. IEEE, 63, 561—580 A975). [Имеется перевод: Макхоул Дж. Линейное предсказание. — ТИИЭР, 1975, т. 63, № 4, с. 20—45.] 83. Markel J. D.,Gray А. Н., Jr., Linear Prediction of Speech, Springer-Verlag, New York, 1976. Модели речи с нулями и полюсами ¦84. Bell С. G,, Fujisaka H., Heinz J: M., Stevens К- N., House A. S., Reduction of Speech Spectra by Analysis-by-Synthesis Techniques, /. Acoust. Soc. Amer., 33, 1725—1736 A961). 85. Fujimura O., Analysis of Nasal Consonants, /. Acoust. Soc. Amer., 34, 1866— 1875 A962). 86. Shanks J. L., Recursion Filters for Digital Processing, Geophysics, 32, 1, 33—51 A967). ¦87. Tretter S. A., Steiglitz K-, Power-Spectrum Identification in Terms of Rational Models, IEEE Trans. Automat. Control, AC-12, 185—188 A967). 88. Evans A. G., Fischl R., Optimal Least Squares Time-Domain Synthesis of Re- Recursive Digital Filters, IEEE Trans. Audio Electroacoustics, AU-21, 61—65 A973). 89. Oppenheim A. V., Tribolet J. M., Pole-Zero Modeling Using Cepstral Predi- Prediction, QPR No. Ill, Research Laboratory of Electronics, MIT, Cambridge, Mass., 1973, pp. 157—159. 90. Tribolet J. M., Identification of Linear Discrete Systems with Applications to Speech Processing, Master's Thesis, Department of Electrical Engineering, Massachusetts Institute of Technology, Cambridge, Mass., Jan. 1974. '91. Morf M., Kailath Т., Dickinson В., General Speech Models and Linear Esti- Estimation Theory, IEEE Speech Proc. Conf., Carnegie-Mellon University, Pitts- Pittsburgh, Pa., Apr. 15—19, 1974. '92. Kopec G. E., Speech Analysis by Homomorphic Prediction, S. M. Thesis, MIT, Cambridge, Mass., 1975. S3. Oppenheim A. V., Kopec G. E., Tribolet J. M., Signal Analysis by Homomorphic Prediction, IEEE Trans. Acoust. Speech Signal Processing, ASSP-24, 4, 327— 332 A976). 94. Kopec G. E., Oppenheim A. V., Tribolet J. M., Speech Analysis by Homo- Homomorphic Prediction, IEEE Trans. Acoust. Speech and Signal Processing, ASSP-25, 1, 40—49 A977). Распознование речевых сигналов 95. Reddy D. R., Computer Recognition of Connected Speech, /. Acoust. Soc. Amer., 42, 2, 329—347 A967). 96. Atal B. S., Automatic Speeaker Recognition Based on Pitch Contours, Ph. D. Theisis, Polytechnic Institute of Brooklyn, Brooklyn, N. Y., 1968.
Цифровая обработка речевых сигналов 19 Г 97. Broad D. J., Formants in Automatic Speech Recognition, Intern. J. Man- Machine Studies, 411—424 A972). 98. Atal B. S., Effectiveness of Linear Prediction Characteristics of the Speech Wave for Automatic Speaker Identification and Verification, /. Acoust. Soc. Amer., 55, 1304—1312 A974). 99. Itakura F., Minimum Prediction Residual Principle Applied to Speech Recog- Recognition, IEEE Trans. Acoust. Speech Signal Processing, ASSP-23, 67—72 A975). 100. Makhoul J., Linear Prediction in Automatic Sleech Recognition, Speech Recog- Recognition: Invited Papers Presented at the 1974 IEEE Symposium, D. R. Reddy,. ed., Academic Press, New York, 1975, pp. 183—220. 101. Reddy D. R., ed., Speech Recognition, Academic Press, New York, 1975.
Глава 4 ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Б. Р. Хант1) 4.1. Введение Данная глава является введением в ту область применений цифровой обработки сигналов, на которую последние достижения в технике цифровой обработки повлияли, mo-видимому, в боль- большей степени, чем .на многие другие из рассматриваемых в книге. Развитию цифровых методов обработки изображений способство- способствовали создание новых алгоритмов (например, БПФ) и появление недорогих интегральных полупроводниковых микросхем, таких, как применяемые в запоминающих устройствах современных си- систем демонстрации изображений. Значение этих технических усовершенствований для цифровой обработки изображений опре- определяется экономическими соображениями: для цифрового пред- представления изображения требуется от ГО5 до 106 чисел, а обработ- обработка и запоминание этих чисел с помощью техники образца 1965 г. вряд ли возможны. В одной главе невозможно с достаточной полнотой описать все вопросы цифровой обработки изображений, которые интенсивно развивались в течение последних 5—10 лет. Изданы или находят- находятся в 'печати несколько книг ото этим вопросам, но даже эти книги вместе не отражают полностью современного состояния техники обработки информации. Таким образом, цель данной главы со- состоит в том, чтобы осветить ряд разделов цифровой обработки изображений, которые или являются «классическими» (т. е. эти- этими вопросами занимаются на протяжении 10 и более лет), или по- получили быстрое развитие благодаря своей важности (как, напри- например, методы восстановления изображений по их проекциям и при- применение этих методов в рентгеновской диагностике заболеваний). Второй особенностью главы является то, что основное внимание уделяется обработке сигналов, а не их анализу или 'Классифика- 'Классификации. Интенсивное развитие за последнее время методов цифровой обработки изображений способствовало решению ряда техниче- технических проблем, начиная от создания искусственного интеллекта и кончая извлечением из изображений разного рода информации. Хотя зт.и задачи и представляют большой теоретический и пра<к- " В. R. Hunt, University of Arizona, Tucson, Ariz. 85721.
Цифровая обработка изображений 193 тический интерес, отнесение их к обработке сигналов (в класси- классическом смысле этих слов) или же к анализу и классификации сиг- сигналов является делом вкуса. Автор- предпочитает первую точку зрения, поэтому вопросы анализа изображений и распознавания образов в данную главу не вошли. Глава состоит из пяти 'больших разделов. В разд. 4.2 приво- приводятся .основные понятия, связанные с формированием и записью изображений, и описываются основные процессы, понятия и тер- термины цифровой обработки изображений. Для читателя, который не занимался обработкой изображений, но знаком с теорией ли- линейных систем, основные процессы, происходящие при формиро- формировании изображений, будут описаны с помощью теории линейных систем и интегралов свертки. В отличие от обычных одномерных линейных систем, связанных с функциями времени, линейные си- системы, оперирующие с изображениями, описываются двумерными функциями от двух пространственных переменных. Будут рассмот- рассмотрены процессы, с помощью которых воспринимается и записывает- записывается изображение. Инженер, знакомый с линейными системами, при изучении процессов приема и записи изображений встретится с неприятной проблемой нелинейности датчика и записывающего устройства. И наконец, будут рассмотрены особенности «вантова- ния и повторной демонстрации изображений, на которые оказыва- оказывает непосредственное влияние нелинейность записывающей систе- системы. Раздел заканчивается анализом основных характеристик зре- зрения человека, которому в конечном счете и адресуется изобра- изображение. В разд. 4.3 рассматривается одно из применений цифровых ме- методов— сокращение избыточности изображения. Интуиция под- подсказывает, что в обычном изображении содержится много избы- избыточной информации. Но как измерить и сократить эту избыточ- избыточность? Будет показано, что избыточность можно определить ме- методами математической статистики, а сокращение избыточности выполняется либо в исходной области пространственных перемен- переменных, описывающих изображение, либо с помощью преобразования изображения в новую систему координат. Можно будет увидеть, что схемы сжатия двумерных сигналов в пространственной обла- области естественным образом связаны с методами теории предсказа- предсказания, применяемыми для сжатия одномерных сигналов (не являю- являющихся изображениями). Будет, наконец, показано, что алгоритмы быстрых преобразований, таких, как БПФ, оказавшиеся очень важными во многих приложениях методов цифровой обработки сигналов, очень полезны также для схем сжатия, основанных на обработке посредством преобразований. В разд. 4.4 рассматривается цифровое восстановление изобра- изображений. При формировании изображения происходит свертка сиг- сигнала излучения, несущего информацию об объекте, с импульсным откликом системы, формирующей изображение. В результате это- 13—359
194 Глава 4 го изображение изменяется. .Иногда степень изменения изображе- изображения незначительна или лежит в допустимых пределах, что харак- характерно для достаточно высококачественного изображения, а иногда искажения бывают большими, например если фотоаппарат был (расфокусирован или находился е движении. В обоих случаях •восстановление изображения связано с устранением недостатков ¦изображения, вызванных ненулевой шириной импульсного откли- отклика системы, формирующей изображение. Можно показать, что эта задача «е имеет единственного решения и усложняется присутст- присутствием шума. Существует много методов восстановления изображе- изображений, и к тому же каждый из них имеет несколько вариантов в за- зависимости от того, как учитываются нелинейности датчика и за- записывающей системы. Задача усложняется и тем, что система, формирующая и одновременво ухудшающая изображение, не обя- обязательно имеет постоянные параметры, а может изменяться слу- случайным образом. Примером подобного рода является наблюдение сквозь турбулентную атмосферу. В разд. 4.5 рассматривается процесс' получения изображения на основе проекций предмета. В медицинской диагностике неко- некоторые способы формирования изображения связаны с проектиро- проектированием трехмерных тел на двумерную плоскость: типичным при- примером является обычная рентгенография. Однако 'во многих об- областях медицины (например, в хирургии) необходимо знать про- пространственную структуру объекта, и поэтому требуется устранить неоднозначности, возникающие при получении проекций. Описа- Описание изображений с помощью преобразования Фурье подсказывает способы устранения подобных неоднозначностей. Более того, при- применение БПФ дает возможность восстанавливать изображения, представленные в виде двумерной структуры <в спектральной об- области, при больших объемах информации. В разд. 4.6 рассматривается задача повышения качества изо- изображений. Повышение 'качества изображений является субъектив- субъективным процессом: то, что для одного человека выглядит улучшени- улучшением, для другого представляется помехой. В этом случае матема- математические вопросы обработки сигналов-изображений отступают на второй план. Совершенствование аппаратуры для цифровой обра- обработки сигналов повлияло на решение задач повышения качества изображений в большей мере, чем в других рассмотренных про- проблемах. В настоящее время появились высококачественные уст- устройства отображения информации, которые позволяют в реаль- реальном масштабе времени выполнять действия, связанные с улучше- улучшением изображения, например изменять контрастность и вводить псевдоцвет. Появление подобных отображающих устройств непо- непосредственно связано с успешным применением цифровой техники при создании различных запоминающих устройств и быстродейст- быстродействующих цифро-аналоговых преобразователей.
Цифровая обработка изображений 195 Данная глава в основном посвящена цифровой обработке сиг- сигналов (как, впрочем, и ,все главы книги). Связь техники цифро- цифровой обработки сигналов с обработкой изображений для читателя, впервые сталкивающегося с этой тематикой, может показаться довольно неясной. Причинами, по-видимому, являются привычный характер изображений '(мы «видим» их каждый день) и психоло- психологическое восприятие «сигналов» как .величин, встречающихся в электрических линиях и электронных схемах. Однако при вни- внимательном чтении главы станет ясно, что цифровая обработка сигналов тесно связана с обработкой изображений. Интересно отметить, что система зрения человека начинается с сетчатки гла- глаза. Дискретность ее структуры, состоящей из палочек и колбо- колбочек, подтверждает предположение о том, что человеческое зрение может оказаться процессом, связанным с цифровой обработкой изображений. Предполагается, что читатель хорошо знаком с цифровой об- обработкой сигналов и ее математическими основами. От него не требуется знания физических принципов, управляющих процессом формирования изображений. Разд. 4.2, посвященный 'формирова- 'формированию и записи изображений, включен ,в главу для того, чтобы по- пояснить читателю основные понятия, относящиеся к изображени- изображениям. При изучении материала последующих разделов рекомендует- рекомендуется возвращаться к этому разделу. Относительно других понятий Предполагается, что читатель знаком с ними на уровне книги Оппенгейма и Шафера i[ll], посвященной цифровой обработке сигналов. Здесь используются термины, применяемые в упомяну- упомянутой книге. •4.2. Основные понятия Цифровая обработка изображений является той частью циф- цифровой обработки сигналов, где сигналом служит изображение. Слово «изображение» в толковом словаре определяется как «вос- «воспроизведение или представление формы человека или предмета». Существенное значение имеет физический механизм, который со- создает упомянутое «воспроизведение или представление». В повсе- повседневной жизни получение изображения ассоциируется со зрением, т. е. с 'возбуждением сетчатки глаза; в этом случае формирование изображения подчиняется законам оптики. Однако техника откры- открыла много других путей получения изображений без участия сет- сетчатки. В последнее время часто получают изображения с по- помощью систем датчиков, регистрирующих такие виды энергии, на которые не реагирует орган зрения (сюда относятся, например, радиолокаторы с синтезируемой апертурой, акустическая гологра- голография и системы, использующие проникающую радиацию). К счастью, при всем разнообразии случаев, в которых создаются и регистрируются изображения, их можно описать с помощью об-
196 Глава 4 Плоскость объекта Плоскость изображения' Система, формирующая изображение Запись изображения Рис. 4.1. Схематическое представление процесса формирования изображения. щего математического аппарата. Целью данного раздела являет- является описание некоторых элементов процесса формирования и ре- регистрации изображений. 4.2.1. Формирование и регистрация изображения Основные элементы, участвующие в создании изображения, схематически представлены на рис. 4.1; «ящик» является устрой- устройством, способным воздействовать на энергию, излучаемую объек- объектом (однако не исключается возможность того, что сам «ящик» излучает какую-то энергию и затем воздействует на результат взаимодействия этой энергии с объектом, как, например, это про- происходит в радиолокаторах с синтезируемой апертурой). Дейст- Действия «ящика» завершаются в плоскости изображения, где создается изображение объекта. В плоскости изображения помещают какое- либо чувствительное устройство, с помощью которого изображе- изображение, создаваемое «ящиком», воспринимается и записывается. Та- Таким образом, по своей сущности изображения связаны с «ощупы- «ощупыванием» удаленных участков пространства косвенным путем, за счет переноса энергии, а физические принципы переноса энергии, управляющей процессом восприятия, являются основой процесса формирования изображения. Математический аппарат, описываю- описывающий все эти процессы, более 'важен, чем физические особенности «ящика». К счастью, соответствующие разделы математики на- находятся на достаточно высокой ступени развития и связаны с тео- теорией линейных систем, знакомой специалистам, работающим в других областях цифровой обработки сигналов.
Цифровая обработка изображений 197 Изображения в процессе формирования <в реальных системах сглаживаются. Это означает, что точка (х, у) в плоскости изобра- изображения будет содержать не только изображение соответствующей точки (х\, г/i) в плоскости объекта, но и, возможно, сведения об энергии, излучаемой другими точками из некоторой (даже из бес- бесконечно удаленной) окрестности точки (х\, уу). Изображение g(x, У), соответствующее функции f(xu y\) распределения энергии, излучаемой объектом, является результатом сложения всех таких бесконечно малых составляющих. Считая, что «ящик» воздейству- воздействует на излученные сигналы линейным образом, и допустив, что эти излученные сигналы накапливаются в плоскости изображения ли- линейно, процесс формирования изображения можно описать с по- помощью соотношения g(x, У) = [ j h(x, у, xlt yx)f{xv y^dx.dy,. D.1) В равенстве D.1) функция h связывает распределение энергии, излучаемой в окрестности некоторой точки объекта, с распределе- распределением энергии вблизи изображения этой точки. В общем случае функция h должна зависеть от всех четырех пространственных пе- переменных, чтобы можно было изменять вид сглаживания при из- изменении положения точки в пространстве. На практике уравнения формирования изображения удается решить (при допустимых затратах труда) только тогда, когда функция h не зависит от координатных переменных плоскости объекта (инвариантна в плоскости объекта). В этом случае вклад, вносимый в изображение какой-либо точки другой точкой, лежа- лежащей в окрестности первой, зависит только от их взаимного распо- расположения. Тогда функцию h можно упростить: h(x, у, хи yx) = h{x—xJ; у—уд D.2) и уравнение формирования изображения сводится к соотношению (x—xlt у—#,)/(*i. y^dXidyi. D.3) У)= J Полученное равенство описывает двумерную линейную cuctphu, инвариантную к сдвигам-, оно является естественным обобщением уравнения, описывающего поведение эквивалентных одномерных систем. В теории обработки изображений вместо термина «инва- «инвариантный к сдвигам» часто используется название «пространст- «пространственно-инвариантный». Функцию h, являющуюся импульсным от- откликом системы, обычно называют аппаратной функцией или функцией рассеяния точечного источника (point-spread function). Термин «аппаратная функция» обычно ассоциируется с опти- оптическими изображениями, а соотношение D.3) естественным обра- образом возникает при анализе процесса образования оптического
198 Глава 4 изображения .[1]. Однако с помощью равенств типа D.3) можно описывать многие системы формирования изображений, не явля- являющиеся оптическими (т. е. не содержащие линз и не построенные на принципе использования видимого света). Например, подоб- подобным соотношением можно описать процесс формирования изобра- изображений, получаемых с помощью проникающей радиации. Более подробно с этим можно познакомиться в книге Эндрюса и Ханта ¦[¦2], где детально рассматриваются процессы формирования изо- изображений ib активных и пассивных системах, использующих про- проникающую радиацию. Уравнения типа D.1) или D.3) описывают столь большое число процессов формирования изображений пото- потому, что восприятие изображений основывается на переносе энер- энергии. Различные способы получения изображений определяются характеристиками процесса переноса энергии, являющегося обыч- обычно линейным, аддитивным и пространственно-инвариантным [1, 2]. Уравнения, описывающие формирование изображений, изуча- изучались весьма обстоятельно, особенно в оптике. Однако уравнения, описывающие процессы восприятия и регистрации изображений, исследованы не столь глубоко. Система, формирующая изобра- изображение, оказывается бесполезной, если отсутствуют средства для восприятия и регистрации изображения. При анализе методов цифровой обработки изображений выясняется, что современная вычислительная техника не обеспечивает выполнения многих не- необходимых операций (например1, линейной фильтрации) по обра- обработке изображений, изменяющихся в реальном времени. Под та- такими изображениями можно понимать последовательность изме- изменяющихся изображений, пространственное разрешение и частота кадров которых (т. е. «временная» ширина полосы) соответству- соответствуют стандартам телевидения. В отличие от многих операций по цифровой обработке одномерных сигналов цифровая обработка изображений в реальном времени обычно не производится. Для воспроизведения и записи изображений используются два основных способа: фотохимический и фотоэлектронный. Приме- Примерами реализации этих способов являются фотография и телевиде- телевидение1* соответственно, которые дают исходные данные для цифро- цифровой обработки изображений. В фотопленках используется эффект изменения галоидных со- солей серебра под воздействием света; следствием происходящих при этом процессов является осаждение чистого серебра во время химической обработки (проявления) пленки. После этого незасве- ченные зерна галоидного серебра удаляются с помощью закре- закрепителя (полное описание химии фотографических процессов мож- можно найти в книге Миса [3]). Картина, полученная из зерен осаж- осажденного серебра, представляет собой изображение. Количествен- Количественный анализ уравнений записи изображений с помощью пленок та- '» «Телевидение» понимается здесь в обобщенном смысле, а не как коммер- коммерческое телевизионное вещание.
Цифровая обработка изображений 199 лоидного 'серебра основывается на работе Хертера и Дриффилда, которые экспериментально определили, что масса отложенного серебра логарифмически связана с экспозицией Е, определяемой соотношением E=po(t)dt, D.4) где /о — интенсивность света, падающего на пленку во время ее экспонирования. Хертер и Дриффилд показали, что массу отло- отложенного серебра можно связать с величиной, измеряемой оптиче- оптическими средствами и называемой оптической плотностью: D = \g±-. D.5) '2 В формуле D.5) 1\ обозначает интенсивность света эталонного источника, освещающего проявленную пленку, а /г — интенсив- интенсивность света, прошедшего сквозь пленку (или отраженного от нее), причем во всех случаях h>-h- Исходя из определения оптической плотности D.5), Хертер и Дриффилд показали, что D = k1mAg, D.6) где niAS — масса осажденного серебра, a k\—нормирующая по- постоянная. Связь .между величинами, входящими в формулы D.4) — D.6), была представлена Хертером и Дриффилдом в виде ^ «§ имение LogE, экспозиция =/ г Ie df ti Рис. 4.2. Характеристическая кривая фотопленки. характеристической кривой (называемой также кривой Я—D) в координатах D и log Е. Типичная для фотопленки характеристи- характеристическая кривая приведена на рис. 4.2. Она имеет линейный участок и два нелинейных участка, соответствующих большим и малым экспозициям и называемых областями насыщения и фотографи- фотографической вуали.
200 ' Глава 4 Результаты, полученные в работе Хертера и Дриффилда, мож- можно пояснить, осветив пленку пучком света. Интенсивность прошед- прошедшего (или отраженного) пучка подчиняется закону Byirepa — Ламберта [4] /2==/1ехр(—/v"Ag), D.7) где h и 1\ — величины, входящие в формулу D.5). С учетом вы- выражения D.6) получается равенство /2 = /iexp(-D). D-.8) Если пленка экспонировалась на линейном участке кривой Я—D (рис. 4.2), то D0, D.9) где у — наклон линейного участка, a Do — постоянная, показы- показывающая, что при экстраполяции линейный участок не проходит че- через начало координат. Предположим, что за время экспозиции вели- чина Io(t) не изменялась, a h—^i=l (что не приводит к потере общности). Подставив эти величины в формулу D.8), получим /2 = /1exp(-Tlog/0 + D0) = /J(/0)-(. D.10) Таким образом, наблюдаемая интенсивность /2 является нелиней- нелинейной функцией интенсивности падающего пучка /о. При у =— 1 ве- величины /2 и /о связаны линейно. Пленки, для которых величина у отрицательна, называются позитивными, а пленки, для которых у положительна, — негативными. Данная терминология представ- представляется неудачной и может приводить к недоразумениям, но она, по-видимому, слишком прочно укоренилась и ее трудно изме- изменить. Из формулы D.10) видно, что с помощью фотохимических датчиков получается нелинейная (по степенному закону) запись интенсивности потока энергии, излученного объектом и падающе- падающего на поверхность чувствительного элемента. Такая нелинейность неизбежна (кроме случая у — — 1), и ее необходимо учитывать при выполнении многих цифровых операций над изображениями (часто предполагают, что нелинейностью можно пренебречь; это удобно, но не точно). Нелинейность, характерная для фотохимического способа ре- регистрации изображений, неизбежна и при использовании фото- фотоэлектронных датчиков. В подобных устройствах падающий свет вызывает фотоэмиссию электронов. Чтобы собрать и зарегистри- зарегистрировать излученные электроны, обычно необходимы весьма слож- сложные схемные и 'конструктивные решения и фактические характе- характеристики прибора чаще определяются эмпирическим путем, а не с помощью детального моделирования. Коэффициент преобразова-
Цифровая обработка изображений 201 ния фотоэлектронных датчиков обычно описывается степенным за- законом вида е = КA0)\ ¦ D.11) где ke — постоянная, уе —показатель степени, характерный для устройства (и являющийся непосредственным аналогом коэффи- коэффициента контрастности 7 для фотопленки), а е — сила электронно- электронного тока. По своему внешнему виду уравнения D.1,1) и D.10) сов- совпадают с точностью до знака показателя степени. Различие в знаке является существенным фактором, так как оно ослабляет нелинейный характер зависимости между входными и выходными величинами. Кроме того, весьма часто в приборах стремятся по- получить величину уе, близкую к единице, так что нелинейность пе- передаточных характеристик всей системы выражена слабо. Напри- Например, б коммерческих системах телевидения, как правило, -уе = 0,& [5,6]. Однако при получении информации об интенсивности изобра- изображения невозможно избавиться от шума, вносимого чувствитель- чувствительным элементом. Любой датчик искажает измеряемые им величины за счет собственного шума, и датчики изображений не являются исключением. Шум, возникающий в фотоэлектронных датчиках, можно определить довольно просто. Во-первых, при эмиссии фо- фотоэлектронов наблюдаются случайные флуктуации. При малых освещенностях эти флуктуации имеют пуассоновскую плотность вероятности, переходящую в гауссовскую плотность, когда осве- освещенность увеличивается. Дисперсия флуктуации увеличивается с увеличением уровня освещенности, а это означает, что шум за- зависит от сигнала [7]. Вторым источником шума являются тепло- тепловые шумы в схемах усиления и обработки фототоков. Фотоэлект- Фотоэлектронный и тепловой шумы являются некоррелированными процес- процессами типа белого шума. Фотохимические датчики (пленки) также создают помехи, но более сложного типа. Изображение на пленке образуется из зерен серебра, откладывающегося после экспозиции и проявления. Зер- Зерна неодинаковы по форме и размерам. Кроме того, в объеме эмульсионного слоя фотопленки они располагаются не равномер- равномерно, а случайным образом. В результате получается очень слож- сложный шумовой процесс, статистически зависимый от уровня сигна- сигнала, как и в фотоэлектронных датчиках. Однако взаимосвязь меж- между шумом и сигналом более сложная (и о ней до сих пор яет единого мнения; см., например, работы [8—10]). Обычно считает- считается, что распределение амплитуд шумов пленки является гауссов- ским [3]. Шум зернистости пленки не коррелирован по простран- пространству только в том случае, если рассматриваются участки плевки,, расстояние между которыми превышает размер зерна. Процессы формирования изображения, его воспроизведения и записи в идеализированном виде можно представить блок-схе-
202 ... . . ' ¦ ¦¦¦Глава 4 м-ой рис. 4.3. Энергия, излучаемая объектом, превращается в энергию, излучаемую изображением, с помощью линейной си- системы, имеющей аппаратную функцию h. Энергия, излученная изображением, преобразуется датчиком с откликом s. Эта опера- операция является нелинейным взаимно-однозначным преобразованием (в.отличие от преобразования, когда h распространяется на неко- некоторую область пространства). Однако полученные интенсивности , , Энергия излууения падающего на объект на объект . ¦ f(x,yy **| h I А 5 1 ¦ >(+)-*¦ 1 ' дЛх,и) ' S9dtf.y) ^-^ Энергия ирлу/е/шя. Полученное переносящего изображение (наблюдаемое' l: '^in- ' , изображение Формирование ,, Запись i/зображеная изображения ¦ f Рис. 4.3. Блок-схема процесса формирования и записи изображения. Невозможно записать без внесения шума, поэтому в схему вклю-; чен источник аддитивного шума. В общем случае этот шум весь-. ма сложен; при наличии сигнала он зависит от записываемых »н- тенсавностей gi. В результате, получается запись изображения (снимок) g. • Модель рис. 4.3 пригодна как для пленок, так и для случая фотоэлектронной регистрации. При использовании пленки нели- нелинейное 'преобразование s описывается характеристической (или Н^В) кривой фотопленки, связывающей экспозицию с оптической плотностью (и, следовательно, с массой отложенного серебра). Флуктуации массы серебра, осевшего на пленке, создают шум, причем в той области, где записывается сигнал, шум является аддитивным. Таким образом, интенсивности точек светового поля отображаются на пленке с помощью локальных масс серебра, а-'функция s и шум описывают реально происходящие процессы. Подобие степенных зависимостей, фигурирующих в формулах D.10) для пленки и D.11) для фотоэлектронных датчиков, ука- указывает, что аналогичная модель '.справедлива и для фотоэлектрон- фотоэлектронных систем, отличающихся тем, что откликом «а падающий свет является поток электронов. Из соотношения D.11) видно, что и в этом случае, т. е. для фотоэлектронных систем, можно вывести логарифмическое соотношение между воздействием и откликом, в точности повторяющее формулу D.9). Рассуждения, приведенные выше, позволяют выявить важную особенность: излучение, соответствующее изображению g,- рис. 4.3, в процессе записи преобразуется в новую переменную ga- Для фо- фотопленок .переменной ga служит локальная плотность серебра. Следовательно, записанное изображение является плотностным изображением (в виде оптической плотности, пропорциональной
Цифровая обработка изображений 203 .плотности серебряной пленки), т. е. логарифмом исходного ярко- стного изображения. (Аналогичные рассуждения можно привести и для фотоэлектронного способа регистрации изображений, одна- однако обычно это не делают.) Наличие шума в пространстве записан- записанных плотностей является весьма существенным фактором. По- Поскольку D.12) то применение обратного оператора s~"' к обеим частям этого ра- равенства дает соотношение л]. D.13) Так как s является нелинейной функцией, то формула D.13) по- показывает, что обратное преобразование записи изображения, со- содержащей аддитивный шум, в область интенсивностей (достигае- (достигаемое .применением оператора s~l) не приводит к созданию яркост- ного изображения, содержащего аддитивную комбинацию сигнала и шума. С другой стороны, в области, где шум и сигнал склады- складываются, интенсивности падающего света преобразуются нелиней- нелинейно, что следует из формулы D.12). Такая связь между сигналом: и шумом характерна только для процессов обработки изображе- изображений, а разработка оптимальных методов разделения сигнала и шу- шума в настоящее время является важной задачей. На практике принято обходить эту трудность с помощью аппроксимаций вида или ¦ ' ' g=s (gi) + n = s (h**f) + п ж h**f + п. D,15) К счастью, эти аппроксимации позволяют получить хорошие ре- результаты, что и оправдывает их применение. 4.2.2. Дискретизация и квантование изображений Сформированное и записанное изображение необходимо пре- преобразовать в форму, пригодную для цифровой обработки. Если- изображения записываются фотоэлектронным способом, то это^ обычно не составляет трудности, так как из сканирующего фото- фотоэлемента поступает электрический ток, пригодный для дискрети- дискретизации и квантования. Таким образом, данный случай можно рас- рассматривать как распространение соответствующих методов циф- цифровой обработки одномерных сигналов на двумерные сигналы. При этом ошибки квантования можно учесть введением в блок- схему дополнительного источника шума [11]. Расстояние между отсчетами должно удовлетворять теореме Найквиста для двумер-г «ых колебаний [1]. .
Щ Глава 4 Устройства для дискретизации и квантования изображений ос- основаны на технике микроденситометрии. В подобных системах на пленку проектируется луч света с интенсивностью 1\. Интенсив- Интенсивность /г света, прошедшего сквозь пленку (или отраженного от нее), измеряется фотоумножителем. По коэффициенту пропуска- пропускания Г=-^ D.16) h с помощью соотношения D.5) можно вычислить оптическую плот- плотность. После этого световое пятно на пленке можно сместить скачком и таким образом получить отсчеты изображения. Мате- Математически этот процесс описывается соотношением giix, У)= j JMx—х„ y—yi)g(xv yjdxtdy^ D.17) где g—.изображение «а пленке; ha — распределение яркости в се- сечении луча, освещающего пленку; g\ — эквивалентное изображе- изображение, из которого берутся отсчеты (т. е. в дискретных точках х= = /Ах, y = kky сканирующий фотоприемник измеряет именно g\). Матрица отсчетов g\(jAx, kky) представляет собой дискретизован- ное, или цифровое, изображение. Из равенства D.17) (справедливого также для случая дискре- дискретизации изображений, полученных фотоэлектронными средствами) видно, что в процессе дискретизации записанное изображение под- подвергается искажениям. За счет правильного выбора распределе- распределения ha и расстояния между -отсчетами изображение можно фильт- фильтровать в -процессе дискретизации. Фильтрацию, связанную с про- процессом дискретизации [согласно (формуле D.17)], можно исполь- использовать для подавления эффектов наложения, возникающих из-за того, что ширина спектра изображения обычно не ограничена (из- за шума зернистости пленки и других высокочастотных состав- составляющих) [12]. Дискретизация коэффициента пропускания экви- эквивалентна дискретизации яржостного изображения, а дискретиза- дискретизация плотности эквивалентна дискретизации штотностного изображения. Часто можно услышать, что предпочтительнее кван- квантовать плотность, так как логарифмическая зависимость приво- приводит к уменьшению динамического диапазона. Однако подобные упрощенные рассуждения могут приводить к ошибкам [13]. 4.2.3. Восстановление и демонстрация цифровых изображений При цифровой обработке одномерных сигналов восстановле- восстановление аналогового сигнала из последовательности чисел достигается путем низкочастотной фильтрации, что теоретически обосновыва- обосновывается теоремой об интерполяции колебаниями с ограниченным
цисрриаин иирииинш изиириж спектром '[11]. В идеальном случае для такой интерполяции сле- следует применять функцию вида sin х/х. Однако данная функция •не имеет двумерного варианта, который можно; было бы исполь- использовать для восстановления аналоговых изображений, так как им- импульсный отклик идеального фильтра нижних частот, имеющий вид sin х/х, принимает отрицательные значения, а это выдвигает требование получения отрицательного света, невыполнимое при восстановлении изображений. Аналоговое изображение можно восстановить с помощью уст- устройства, подобного примененному при дискретизации изображе- изображения. На чистую пленку проектируется луч -света, а интенсивность этого записывающего луча модулируется в соответствии с число- числовыми значениями изображения. В качестве источника света, з. также для непосредственной демонстрации изображений можно также применять электронно-лучевые трубки (ЭЛТ). Световое пятно перемещается тю поверхности пленки согласно растровой сетке. Нетрудно увидеть, что процесс восстановления изображе- изображения описывается соотношением g2(x, у)= \ Г hd(x — xit y — iJiJgAXi, y^d^diji, D.18) где ha—'распределение яркости записывающего пятна, g\ — мат- матрица отсчетов функции D.17), представленная здесь набором взвешенных б-импульсов, разнесенных на расстояния (х, у) друг от друга, a g2 — восстановленное непрерывное изображение. Рас- Распределение яркости записывающего пятна является импульсным «откликом интерполирующего фильтра, аналогичного применяемо- применяемому при восстановлении од-номерных аналоговых сигналов. Прак- Практически во всех системах восстановления 'изображений записыва- записывающее пятно имеет несложное распределение яркости (например, гауссовское). По этой причине точно восстановить изображение не удается, поскольку простые распределения не дают возможно- возможности полностью подавить высокочастотные копии спектра изобра- изображения, возникающие при дискретизации. К счастью, обычно это не создает существенных трудностей, и в простых системах полу- получается хорошее изображение. Из вышеизложенного видно, что при дискретизации ъ демонст- демонстрации изображений возникают искажения спектра. Подобные ¦искажения можно скорректировать в процессе цифровой фильтра- фильтрации квантованных изображений [12]. Восстановление непрерывных изображений связано с другой 'Проблемой, а именно с проблемой верности изображения. Если «число, находящееся в памяти машины, представляет значение оп-
zuo Глава 4 тической плотности изображения в конкретной точке, то абсолют- абсолютно верное воспроизведение получится, если лленка, предназначен- предназначенная для демонстрации, будет иметь точно такую оптическую плотность, как записано в памяти ЭВМ. (Аналогичные требования можно сформулировать для коэффициента пропускания пленки и для характеристики фотоэлектронной системы.) Подобное I 1 ! н i Уисло в машине (яркость на входе) Уисло в машине (яркость на вха&е}; Рис. 4.4. а __,сквозные характеристики "идеальной системы отображения; б — сквозные характеристики типичной реальной системы отображения. устройство отображения должно иметь сквозные характеристики, совпадающие с приведенными «а рис. 4.4, а. Однако такие иде- идеальные характеристики встречаются редко. Характеристики ре- реальных устройств отображения больше напоминают приведенные на рис. 4.4,6, где наблюдается значительное отклонение от иде- идеальной прямой с наклоном 45е. Хорошее приближение к идеаль- идеальной характеристике можно получить путем линеаризации харак- характеристики устройства отображения. Для этого необходимо выпол- выполнить следующие действия: 1. Сформировать набор фиксированных значений коэффици- коэффициента пропускания или оптической плотности, подать их на устрой- устройство отображения и измерить фактический его отклик на каждое из значений коэффициента пропускания или оптической плот- плотности. 2. Измерения, полученные на этапе 1, задают характеристику устройства отображения do = f(di). Линеаризованная характери- характеристика описывается соотношением di = f(d0). Это обратное преоб- преобразование можно найти эмпирическим путем и представить в виде таблицы или полинома, вычисленного методом наименьших квад- квадратов.
Цифровая обработка изображений 207 3. Перед демонстрацией изображения числовые данные следу- следует преобразовать согласно функции f~K В результате в них будут введены предыскажения и значения яркостей, записанные в Маши- Машине, будут 'воспроизведены на экране без погрешностей. Метод линеаризации характеристик устройств отображения успешно применялся во многих исследовательских институтах. Точная линеаризация, конечно, невозможна, так кале форма нели- нелинейной характеристики изменяется в зависимости or особенностей проявления пленки, чистоты химикатов, старения (или поврежде- повреждения) люминофора ЭЛТ и т. п. Однако, приложив определенные усилия, можно линеаризировать устройство отображения так, что отклонения от линейности чне будут превышать ±5% максималь- максимального значения. Следует отметить, что линеаризация характери- характеристики устройства отображения является операцией, применяемой при восстановлении аналоговых изображений; при обработке од- одномерных сигналов линейными электронными схемами она обычно ие используется. 4.2.4. Свойства системы зрения человека Очень часто окончательную оценку изображения делает чело- человек. Если бы человеческое зрение было идеальным и отвечало на световое воздействие с абсолютной точностью и совершенной ли- линейностью, то его можно было бы и не изучать. Однако система зрения человека обладает нелинейной характеристикой, а ее от- отклик не является абсолютно верным. Важность этих положений для получения изображений признана довольно давно '[ТЗ], одна- однако они не в полной мере использовались при обработке изобра- изображений. Одной ;из характеристик системы зрения человека является способность восприятия яркости света. Эксперименты по определе- определению восприятия людьми минимально различимых градаций ярко- яркости .света, поступающего от калиброванного источника, показали, что яркость света воспринимается глазом нелинейно. Если начер- начертить график зависимости величины этой минимально различимой градации яркости от эталонной яркости, то при изменении яркости в пределах нескольких порядков этот график имеет логарифмиче- логарифмический характер [14]. Такие субъективные экспериментальные ре- результаты согласуются с объективными данными, полученными в экспериментах на животных, в которых было показано, что све- светочувствительные клетки сетчатки и оптический нерв возбужда- возбуждаются с частотой, пропорциональной логарифму интенсивности подводимого к ним света [15]. По вполне понятным причинам по- подобные объективные измерения на людях не проводились. Тем не менее объективные данные для животных и субъективные пока- показания для людей более чем убедительно подтверждают вывод
208 Глава 4 Амплитуда is зд 45 тГ^ Пространственная частота, период / град а б Рис. 4.5. ! а—сечение (осеоимметричной) аппаратной функции глаза человека; б — сечение (осеиш- метрачной) частотной характеристики глаза человека. о том, что яркость -света воспринимается по логарифмическому закону. Это существенно нелинейный закон. Другой отличительной характеристикой системы зрения чело- человека является ее лространственночастотный отклик. Импульсный отклик глаза, рассматриваемого в виде двумерной линейной си- системы (т. е. линейной после начального логарифмического преоб- преобразования интенсивности наблюдаемого света), не является б-функ'цией Дирака. Реакция глаза на приходящее световое поле описывается аппаратной функцией, сечение которой показано на рис. 4.5, а [16]. Острый центральный пик и отрицательные боко- боковые лепестки импульсного отклика глаза показывают, что глаз обрабатывает пространственные частоты так же, как фильтр верх- верхних частот. Точная форма частотной характеристики глаза иссле- исследовалась с помощью ряда психовизуальных экспериментов; было показано, что глаз подавляет низкие и ослабляет высокие прост- пространственные частоты. В грубом приближении пространственно- частотный отклик глаза имеет полосовой характер. Подобная ха- характеристика (рис. 4.5,6), например, была получена в ряде экс- экспериментов, проведенных 'Манносом и Сакрисоном [17]. Наконец, особенностью зрения человека является способность к насыщению, т. е. к ограничению отклика при очень больших или очень малых интенсивностях наблюдаемого светового потока. Перечисленные свойства системы зрения можно описать моделью, представленной в виде блок-схемы на рис. 4.6. Однако данная мо- модель совершенно не отражает других известных свойств системы зрения. Например, есть сведения, что некоторые стороны процес- процесса вооприятия изображения можно объяснить только наличием не одной, как на рис. 4.6, а нескольких линейных систем, включен- включенных параллельно, т. е. в рамках модели с частотными каналами
Цифровая обработка изображений 209 [18]. Другие 'визуальные явления (такие, как иллюзия одновре- одновременного контраста) . указывают, что логарифмическое преобразо- преобразование, введенное в блок-схеме рис. 4.6, является слишком боль- большим упрощением. Но, несмотря ,на известные недостатки, модель» представленная на рис. 4.6, является полезной, поскольку она 1) объясняет ряд важных явлений, таких, как восприятие яр- яркости света и полосы Маха; Наблюдаемая яркость Влоп /юга- ригрми- Линейный простран- пространственный фильтр [Г, Воспринятая ярюгет Насыщение Рис. 4.6. Блок-схема системы зрения человека. 2) указывает, что в системе зрения содержатся некоторые элементы системы обработки информации. В частности, система зрения человека, по-видимому, выполняет некоторые операции го- гомоморфной обработки информации [19]. Полезно связать логарифмическое преобразование изображе- изображения, выполняемое глазом, с рассмотренным ранее вопросом о ллотностном ш яркостном изображениях. Можно заметить, что поскольку яркость света воздействует на глаз по логарифмиче- логарифмическому закону, глаз воспринимает изображение как плотноетное, если даже оно представлено (с помощью устройства отображения) в виде яркости ого изображения. 'Представляется логичным воспользоваться моделями системы зрения человека при анализе возможных применений цифровой обработки изображений. Однако это делать нужно осторожно, так как система зрения человека настолько сложна, (Что .необоснован- .необоснованное применение упрощенных моделей зрения может принести больше вреда, чем пользы. Манное <и Сакрисон .{Л7] доказали при- применимость модели зрения для исследования вопроса о сокращении избыточности изображений. Однако пока еще не определены все области возможного применения моделей зрения. 4.3. Применение цифровой обработки для сокращения избыточности изображений Сокращение избыточности изображений является первой об- областью применения цифровой обработки изображений, которая бу- будет здесь рассмотрена. Интенсивное развитие цифровых методов повлияло на все отрасли техники передачи и хранения информа- информации в силу присущих цифровым системам преимуществ в помехо- помехозащищенности, возможности исправления ошибок, гибкости при коммутации сообщений, постоянно понижающейся стоимости
210 Глава 4 и увеличивающейся надежности. Одновременно с внедрением циф- цифровой техники расширялось использование изображений в различ- различных областях науки и техники, например в медицине, экспери- экспериментальной физике, 'бесконтактной дефектоскопии, исследовании природных ресурсов. Такая параллельность развития цифровой техники и расширения области применения изображений привела к естественному результату, а именно к интенсивным исследова- исследованиям в области передачи и записи изображений цифровыми ме- методами. Типичное изображение содержит очень много избыточной ин- информации, что заметно даже при беглом взгляде на большинство изображений. Эта избыточность приводит к экономическим по- потерям. Ширина 'полосы частот, необходимая для передачи изобра- изображения в цифровой форме, зависит от числа отсчетов изображения, разрядности отсчетов, времени, отведенного на передачу, и от мощности передатчика. С расширением полосы увеличиваются не- необходимая мощность (передатчика и расходы. Деньги и энергия не являются проблемой, но электромагнитный спектр1 предельно загружен. Поэтому сокращение избыточности при передаче изо- изображений является очень важной задачей. Столь же важно оно и для хранения изображений в цифровом виде. Если бы требова- требовалось хранить только одно изображение, то об этом молено было бы не беспокоиться. Однако во многих существующих и проекти- проектируемых системах, таких, как геологоразведочный спутник NASA ERTS (Earth Resources Technology Satellite), получается большое количество изображений, которые целесообразно получать и хра- хранить в цифровой форме. Хотя цифровые запоминающие устройст- устройства и становятся все дешевле, число получаемых изображений на- настолько увеличивается, что сокращение их избыточности является задачей первостепенной важности. 4.3.1. Некоторые замечания о сокращении избыточности изображений Избыточность видеоинформации может быть описана функци- функцией корреляция между отсчетами изображений; она проявляется в высокой степени взаимной статистической ¦прогнозируемое™ близколежащих отсчетов, взятых :из изображения. Конечной целью операции сжатия видеоинформации является устранение этой статистической прогнозируемости (т. е. необходимо в макси- максимально возможной степени уменьшить коррелированность отсче- отсчетов). На блок-схеме рис. 4.7 показаны основные операции, выпол- выполняемые системой сжатия видеоинформации. Сначала выполняется операция по максимальному уменьшению коррелированности от- отсчетов изображения. Затем отсчеты должны быть соответствую- соответствующим образом квантованы. Квантованные отсчеты кодируются в форму, благоприятную для передачи (при этом, конечно, может быть обеспечена возможность обнаружения или исправления оши- ошибок).
Квантование и кодирование выполняются с учетом общих пра- правил, не зависящих от особенностей схемы декоррелящии, выбран- выбранной для первого этапа обработки. Поэтому системы сжатия ви- видеоинформации различаются видом схемы, выполняющей опера- операции, относящиеся к первому этапу. В силу этого способам реали- реализации первого блока схемы рис. 4.7 здесь будет уделено больше Уменьшение коррелированное/пи omevemae Квантование отсчетов Кодирование Рис. 4.7. Блок-схема системы сокращения избыточности видеоинформации. внимания, чем вопросам построения второго и третьего блоков. Такой подход полностью соответствует замыслу данной книги, посвященной техническим применениям цифровой обработки сиг- сигналов, т. е. задачам, в основном относящимся к первому блоку. При разработке принципов реализации первого блока схемы рис. 4.7 следует учесть ряд соображений. Рассмотрим сначала ста- статистические свойства изображений. Если отсчеты изображения образуют сетку точек размером NX.N и каждый отсчет представ- представлен Р-разрядным двойным числом, то при записи и передаче изо- изображения с помощью обычной ймпульсно-кодо'вой (модуляции (ИКМ) потребуется N2P двоичных разрядов. Однако, как было отмечено выше, типичное изображение имеет большую избыточ- избыточность. Один из способов, позволяющих измерить эту избыточность и сравнить ее с номинальным числом N2P разрядов, заключается в построении гистограммы яркости изображения и вычислении со- соответствующей энтропии. С помощью Р-разрядных чисел можно описать квантование по 2Р уровням. Для этого следует проанали- проанализировать все А/*2 отсчетов и подсчитать, сколько раз встречается каждый уровень квантования. Затем следует построить гисто- гистограмму яркости изображения, т. е. для каждого уровня квантова- квантования указать число его появлений в изображении. Разделив эти числа на общее число точек N2, можно получить аппроксимацию плотности вероятности процесса, порождающего изображение. Ес- Если обозначить нормированные частоты через pi (i=l, 2, ..., 2Р)У то энтропия по определению выражается суммой DЛ9) и равна средней информации (измеряемой числом бит, приходя- приходящихся на элемент изображения), содержащейся в каждом элемен- элементе изображения. Анализ изображений показал, что типичное зна- значение h гораздо меньше числа разрядов Р, 'необходимого для стандартного представления с помощью ИКМ. В работе [20] от- 14*
212 Глава 4 мечалось, что энтропия имеет величину порядка 1 бит/точка. Это означает, что разрядность массива, описывающего изображение, можно (хотя бы теоретически) сократить без потерь информации в среднем до 1 бит/точка. Энтропия служит мерой статистической избыточности, но не дает сведений о ее происхождении. Источником избыточности, как лодсклзьпвает наблюдателю его зрение, является высокая степень однородности ¦изображения на малых участках. Эту пространст- пространственную избыточность можно определить с помощью ковариацион- ковариационной матрицы изображения. Сначала лексикографически преобра- преобразуют матрицу из Ny^N отсчетов изображения в А^-компонентный вектор [т. е. элементы первой строки (или столбца) матрицы g{j, k) становятся компонентами вектора с номерами от 1 до N, элементы второй строки (столбца) —компонентами с номерами -от N-j-l до 2 N и т. д.]. Затем вычисляют ковариационную матри- матрицу изображения где Е — среднее значение по ансамблю, a g — вектор, построен- построенный из отсчетов изображения. На практике редко оказывается возможным проводить усреднение по ансамблю и ковариацион- ковариационную матрицу получают с помощью оценки пространственной кор- корреляции [21]. Ковариационные структуры, такие, как матрица [Cs], не име- имеют взаимно-однозначной связи с исходным изображением. Коул [21] показал, что многие неодинаковые изображения могут ока- оказаться весьма сходными в ковариационном (или спектральном) смысле. Следовательно, имеются основания для замены сложной матричной структуры типа [Cg] более простой. В частности, рас- рассматривалось (см., например, работу [22]) применение модели с авторегрессионным марковским процессом я-го порядка, где п обычно невелико (например, /г=3). Тот факт, что подобные мо- модели оказываются корректными и (применение их оправдано при анализе методов сжатия информации, таких, как дифференциаль- дифференциальная импульсно-кодовая модуляция (ДИКМ), указывает на высо- высокую степень взаимосвязи между соседними участками изображе- изображения. При сжатии видеоинформации кроме статистических свойств изображения весьма важно учитывать и особенности получателя изображений. Зрение человека обладает ограниченными возмож- возможностями и характеризуется некоторыми известными (отчасти) от- отличительными особенностями. Использование конкретных особен- особенностей зрения для сокращения избыточности изображений назы- называется психофизической обработкой. Известно, например, что при восприятии яркости света, попадающего в глаз, зрительная систе- система ведет себя как нелинейная система с логарифмической харак- характеристикой. Кроме того, система зрения человека не чувствитель-
Цифровая обработка изображений на к очень высоким или очень низким пространственным часто- частотам, а в области средних частот ведет себя почти как полосовой фильтр, что обусловлено торможением нервных клеток сетчатки глаза. Нелинейность и частотная зависимость чувствительности зрительной системы позволили -создать оптимальные системы сжа- сжатия 'видеоинформации. В этих системах для достижения большей устойчивости к ошибкам, появляющимся при кодировании и пе- передаче, изображение обрабатывается примерно так же, как и в зрительной системе человека. Впервые это [Предложение было сде- сделано Стокхэмом ['23]. Сокращение избыточности информации математически строго обосновывается положениями теории кодирования кри заданном критерии точности [24]. Как отмечали Манное и Са,крисон {17], эффективные теоремы теории кодирования при заданном крите- критерии точности в задачах сжатия видеоинформации -применить не удалось. Основной причиной этого явилась сложность выбора кри- критерия допустимой величины ошибок, согласующегося со свойст- свойствами системы зрения 'человека. Манное и Сакрисон смогли пока- показать, что можно пользоваться критерием, связанным с нелиней- нелинейными .и лро-страмствеадо-частотяыми свойствами зрения. Их работа имеет очень важное значение для дальнейшего развития методов сокращения избыточности изображений. Введение под- подходящей предварительной обработки вю всех схемах, которые бу- будут рассмотрены ниже, может значительно улучшить качество ра- работы систем сжатия видео-информации. 4,3.2. Схемы сокращения избыточности изображений с обработкой в пространственной области В одном из возможных вариантов схемы -сокращения избыточ- избыточности видеоинформации в первом 'блоке (схема рис. 4.7) выпол- выполняется операция тождественности, т. е. исходная картинка никак не изменяется, а -все сжатие достигается за счет квантования и кодирования. Однако сжатие информации невозможно выпол- выполнять без использования критериев, учитывающих -особенности на- наблюдателя и свойства 'передаваемых данных. Если, например, на- наблюдателю нужна точность '/юоо, то необходимое число уровней квантования получается при использовании 10-разрядных двоич- двоичных чисел; если же допустима точность Vs, то достаточно взять 3-разрядные числа. Следовательно, квантование при сжатии ин- информации играет ограниченную -роль. Однако сокращения избы- избыточности можно добиться при кодировании, и одной из основ- основных задач после создания -Шенноном теории информации было построение кодов, оптимальных с точки -зрения сокращения из- избыточности информации. Шеннон доказал, что существует «од, для которого скорость передачи совпадает со скоростью создания информации источникам. Таким образом, для изображений с эн-
214 Глава 4 тропией порядка 1 (бит/точка существуют схемы кодирования, по- позволяющие построить коды со средней длиной в 1 'бит/точка. К сожалению, само по себе существование таких кодов .бесполез- .бесполезно, если отсутствуют алгоритмы их построения. Известны алго- алгоритмы построения кодов, приближающихся к оптимальным. На- Например, кодирование по Хаффмену является эффективной проце- процедурой для согласования кода со статистикой источника информа- информации и дозволяет сократить длину сигнала по сравнению со стан- стандартной ИКМ. Однако подобные коды имеют переменное число символов (т. е. при передаче сообщений кодовые слова состоят из различного числа символов); при кодировании и декодировании требуются сложные алгоритмы, связанные с записью, синхрони- синхронизацией и вспомогательным накоплением информации. Кроме того,, вид подобных кодов очень сильно зависит от вероятности созда- создания символов источником, и любые изменения 'вероятности могут привести к ухудшению характеристик кода (очень аначительному в некоторых случаях). Следовательно, кодирование с квантовани- квантованием может служить основным средством сжатия видеоинформа- видеоинформации лишь в ограниченном числе случаев, так что необходимо искать другие методы. В качестве метода сжатия видеоинформации в плоскости про- пространственных координат, выполняемого в первом блоке схемы рис. 4.7, наиболее широко применяется дифференциальная им- пульсно-кодовая модуляция (ДИКМ). По своей структуре схемы ДИКМ совпадают со схемами кодирования методом линейного предсказания (КЛЛ), применяемым при сжатии полосы речевых сигналов, и поэтому схемы ДИКМ изображений иногда называ- называют схемами сжатия методом предсказания. Блок-схема ДИКМ приведена на рис. 4.8. В этом методе используется статистическая взаимосвязь яркостей отдельных точек изображения и для каж- каждой точки формируется оценка яркости в виде линейной комби- комбинации яркостей предшествующих точек. Под предшествующими точками подразумеваются точки, расположенные перед рассмат- рассматриваемой точкой при развертке изображения сверху вниз и слева направо (как в телевидении), благодаря чему создается вполне определенный порядок следования точек изображения. Подобная схема, конечно, будет применима и тогда, когда изображение уже «развернута» методом сканирования. Затем вычисляется и кван- квантуется разность между фактическим значением яркости и ее оценкой. Квантованная разность подвергается кодированию и пе- передается по каналу. На приемном конце символы декодируются, а информация восстанавливается с помощью схемы линейного предсказания я-го порядка (конечно, идентичной соответствующей схеме на передатчике), в которой формируются оценки яркости, добавляемые к разностям, полученным по каналу. Схемы предсказания, изображенные на рис. 4.8, называются схемами с предсказанием назад, поскольку квантование сигнала
Цифровая обработка изображений 215 Прогнозирующее , устройство м-го порядка ПриемниЛ—*¦ Прогнозирующее устройство n-го nopaffxcr Рис. 4.8. Блок-схема системы сжатия методом ДЩМ с предсказывающим устройством /г-го порядка. происходит внутри петли обратной связи, а при восстановлении сигнала предсказанное значение подается по схеме назад. Можно спроектировать схемы ДИКМ, в которых предсказанные значе- значения сигнала подаются вперед, а также создать схемы ДИКМ, где блок квантования расположен вне петли обратной 'связи. Од- Однако такие системы дают восстановленное изображение с боль- большими ошибками. Схема с предсказанием назад необходима в при- приемнике потому, что символы поступают последовательно. При ис- использовании в передатчике аналогичной схемы предсказания на- назад в случае отсутствия ошибок, связанных с квантованием, мож- можно было бы восстановить изображение с абсолютной точностью. Если схему квантования 'включить в петлю предсказывающей схемы передатчика, то. и в приемнике, и в передатчике предска- предсказание будет осуществляться на основе одинаковых квантованных отсчетов, что позволит уменьшить ошибки восстановления. Сжатие в схемах ДИКМ достигается за счет вычитания сиг- сигналов, поскольку разности имеют значительно меньший динами- динамический диапазон. Предположим, например, что исходное изобра- изображение передается методам ИКМ ,и для представления яркостей его точек нужны числа от 0 до 255. Тогда, если допустимая ошиб- ошибка равна единице младшего разряда, то необходимо квантование в 8-разрядные числа. Однако значения разностей яркостей сосед- соседних точек будут гораздо меньшими; если ipa-эности. (в том же мас- масштабе) будут изменяться от 0 до 7, то для получения ошибки, равной единице младшего разряда, достаточно квантования в 3-разрядные числа.
216 Глава 4 ___ Поскольку идея ДИКМ достаточно проста, то, как следует из схем рис. 4.8, характеристики системы сокращения избыточности изображений методом ДИКМ определяются порядком .предсказы- .предсказывающего устройства п, значениями коэффициентов прогнозирова- прогнозирования a.i, числом уровней квантования и их расположением. Порядок предсказывающего устройства зависит от статисти- статистических характеристик изображения. Как правило, если последова- последовательность отсчетов может быть промоделирована авторегрессион- авторегрессионным марковским процессом n-го порядка, то разности, полученные с помощью оптимального предсказывающего устройства п-то по- порядка, будут образовывать последовательность некоррелирован- некоррелированных чисел [i20]. Изображения, очевидно1, не являются марковски- марковскими процессами /г-го порядка, но опыт работы по сжатию изобра- изображений показывает, что корреляционные свойства изображений можно описать марковским процессом третьего порядка, а это приводит к предсказывающим устройствам третьего порядка (п=3) [22]. Аналогично при моделировании изображений было выяснено, что ДИКМ с предсказывающими устройствами более высоких порядков не дает большего выигрыша в качестве изо- изображения (как по субъективным, так и по объективным данным). Коэффициенты предсказания щ можно определить с помощью анализа средних квадратических ошибок. Пусть g(k) —отсчеты на строке развертки, a g(k) —предсказанные значения этих от- отсчетов. Необходимо, чтобы средняя квадратическая ошибка была минимальна, т. е. нужно найти min e=E «о всем к, а. Это 'известная задача, и если процесс g(k) стационарен, то ее ре- решение имеет вид [25] п V г(; л п —г (Л г — 1 9 п (A^Ti где r (i — l)~E\g Ф—/) g {k—i)\ D-23) обычно называется автокорреляционной функцией процесса g. Коэффициенты щ получаются решением системы уравнений D.22). Оптимальные значения коэффициентов предсказания зависят от взаимосвязей точек изображения, описываемых автокорреля- автокорреляционной функцией. Из определения D.20) видно, что в случае стационарных данных автокорреляционная функция отличается от вышерасомотренной функции на постоянную величину. При не- нестационарных данных функция г ,в уравнении D.23) зависит от
. . Цифровая обработка изображений 217 пространственных (Переменных и оптимальные .коэффициенты пред- предсказания должны изменяться в зависимости от пространственных координат. Это характерно для изображений. К счастью, неста- нестационарные статистические характеристики изображений обычно можно достаточно хорошо аппроксимировать стационарными функ- функциями, так что неперестраивающееся линейное устройство пред- предсказания дает вполне хорошие результаты. При сжатии видеоин- видеоинформации методом ДИКМ ошибки обычно появляются на грани- границах изображаемых предметов, где предположение о стационар- стационарности удовлетворяется в наименьшей степени, и на восстановлен- восстановленном изображении воспринимаются визуально как аномально-свет- I лые или темные точки. 1 Выбор числа уровней квантования и расположения порогов квантования является задачей отчасти количественной и отчасти качественной. Расположение порогов квантования можно найти количественными расчетами. В работе Макса [26] впервые было рассмотрено неравномерное квантование, зависящее от функции распределения квантуемого сигнала и ¦сводящее к минимуму среднее квадратическое значение ошибки, вызванной ограничен- ограниченностью числа уровней квантования. Алгоритм Макса позволяет найти оптимальное расположение точек перехода для заданного числа уровней квантования. Однако число уровней квантования выбирается исходя из субъективных 'качественных соображений. Минимальное число уровней квантования равно двум (одно- (одноразрядные числа) и соответствует такому квантованию изобра- изображений, при котором разность яркостей принимает ^фиксированное (положительное или отрицательное) значение. Этот способ обыч- обычно называют дельта-модуляцией; схему ДИКМ (рис. 4.8) можно упростить заменой квантователя на ограничитель, а предсказы- предсказывающего устройства га-го порядка на интегратор. При сокращении избыточности изображений методом дельта-модуляции наблюда- наблюдаются те же недостатки, что и при дельта-модуляции других сиг- сигналов, например речевых [27], а именно затягивание фронтов и искажения дробления. Однако если частота дискретизации изо- изображения выбрана намного больше частоты Найквиста, то сжа- сжатие методам дельта-модуляции приводит к малым (субъективно замечаемым) ошибкам. Если частота дискретизации приближает- приближается к частоте Найквиста, то на изображении в большей степени будут проявляться затягивания фронтов (на контурах изображе- изображений) и искажения дробления (на участках с постоянной яр- яркостью). Ка'к и яри сжатии речи [27], адаптивная дельта-модуля- дельта-модуляция позволяет уменьшить эти ошибки. Однако m целом при пере- передаче изображений дельта-модуляция оказалась менее эффектив- эффективной, что при передаче речи. Квантование с числом уровней, большим двух, позволяет при сокращении избыточности получить изображения более высокого качества. Система сжатия методом ДИКМ с 8-уровневым C-раз-
218 Глава 4 Рис. 4.9. Изображение, сжатое методом ДИКМ. Разрядность 3 бит/точка, пред- предсказывающее устройство 3-го порядка (разрядность исходного изображения 8 бит/точка). рядным) квантованием при оптимальном размещении порогов да- дает изображения, качество которых такое же, как в системе с ИКМ, имеющей разрядность от 6 до 8. Исключение составляют ошибки вблизи линий резкого изменения яркости. Сигнал с выхода устройства квантования, конечно, следует кодировать, поскольку распределение вероятностей квантованных разностей не является равномерным. При удачном выборе кода (например, кода Шеннона — Фано или Хаффмена) удается до- дополнительно понизить общую скорость создания информации. Прэтт [28] указывает, что при использовании кода Хаффмена в пределе удается понизить скорость создания информации до 2,5 бит/точка. Это дополнительное понижение скорости требуется сопоставить с увеличением стоимости и сложности запоминающе- запоминающего устройства, синхронизаторов и вспомогательных регистров па- памяти, необходимых для работы с кодами Хаффмена. На рис. 4.9 показана фотография, полученная в системе сжа- сжатия методом ДИКМ с З-разрядным квантованием и предсказыва- предсказывающим устройством третьего порядка. Исходное изображение бы- было квантовано в 8-разрядные числа, причем получившееся изо- изображение (рис. 4.9) визуально от него неотличимо. Выше обсуждались вопросы сжатия изображений с помощью ДИКМ при выборе элементов по строке (т. е. для прогноза бра- брались точки, лежащие на текущей строке развертки). В силу дву- двумерного характера изображений возможно (и целесообразно) рас- расширить метод ДИКМ так, чтобы при прогнозе учитывались яр- яркости в точках, лежащих не только на текущей, но и на пред- предшествующих строках развертки. Схемы сжатия методом ДИКМ с таким двумерным предсказанием основаны на тех же принци- принципах, что при одномерном предсказании. Поскольку для изобра- изображений характерно наличие двумерных статистических взаимосвя-
. Цифровая обработка изображений 219 зей, можно надеятыся, что двумерное предсказание даст лучшие результаты по сжатию изображений, так как декорреляция изо- изображений с помощью операций предсказания и вычитания будет производиться по двум координатам. Действительно, устройства с пространственным предсказанием дают более качественные изо- изображения. Хабиби [22] показал, что с помощью двумерного пред- предсказывающего устройства третьего порядка при 8-уровпевом C-разрядном) квантовании получались .изображения, которые ви- визуально не удавалось отличить от исходных фототра'фий, обрабо- обработанных методом ИК.М с 11-разрядными числами. Для изображений, состоящих из последовательных кадров, на- например телевизионных, идеи предсказания и вычитания, связан- связанные с ДИКМ, можно распространить на временную область. В по- подобных изображениях яркость многих точек от кадра к кадру не изменяется или изменяется медленно. Следовательно, можно по- построить систему сжатия методом ДИКМ, в которой яркость оче- очередной точки прогнозируется на основе яркостей двумерного на- набора точек текущего кадра и соответствующих точек предшест- предшествующих кадров. На практике порядок временного предсказания не может быть высоким, так как для каждого временного слагае- слагаемого необходимо иметь запоминающее устройство, где сохранял- сохранялся бы весь кадр. Моделирование с предсказывающим устройст- устройством третьего порядка, в котором для предсказания использова- использовались точки, расположенные в данном и предшествующем кадрах слева от рассматриваемой точки и 'вверх от нее, показало, что можно получить очень хорошие изображения при средней разряд- разрядности 1 бит/точка [28]. 4.3.3. Схемы сокращения избыточности изображений с обработкой в области преобразований i Для пояснения основных операций, выполняемых системой сжатия видеоинформации с обработкой в области преобразова- I ний, обратимся к ковариационной матрице, определяемой соотно- соотношением D.20). Матрица [Cg] описывает корреляцию отсчетов изображения в плоскости (х, у), являющейся координатной пло- плоскостью изображения. Важным методом многомерного статисти- статистического анализа служит исследование массива данных не только в их естественных координатах, но и в системах координат с бо- более удобными свойствами. В частности, весьма полезными оказа- оказались системы координат, основанные на собственных значениях и собственных векторах .ковариационной матрицы [c*Ma]IAIl<&F=|:vw, D-24) где |[Ф] — матрица, составленная из ортогональных собственных вектор-столбцов Ф,-, а [Л]—диагональная матрица собственных значений.
220 Глава 4 Преобразование координат, определяемое матрицей собствен- собственных векторов [Ф], обладает тем свойством, что оно производит .преобразование заданного массива чисел в другой с -некоррелиро- -некоррелированными элементами, причем получающиеся компоненты имеют убывающие дисперсии. Пусть собственные значения матрицы [Cg] расставлены в убывающем лорядке и пронумерованы так, что \>\>h> ¦ ¦ ¦ Ж"-' D-25> и пусть собственные векторы, связанные с ними, расставлены в том же порядке. Тогда матрица собственных векторов [Ф] об- обладает тем свойством, что умножение ее на вектор-изображение g (образованный лексикографической расстановкой) дает вектор G = f®]g, D.26) имеющий некоррелированные компоненты, причем компоненты вектора G оказываются расставленными в порядке убывания их дисперсий [29], что является свойством дискретного варианта раз- разложения Карунена— Лоэва, фактически описанного соотношения- соотношениями D.24) —D.26). Полезность преобразования Карунена—Лоэва (КЛ, или ко- ковариационного) для сокращения избыточности изображений оче- очевидна. Массив отсчетов изображения заменяется набором пере- переменных, имеющих различные статистические веса1'. Сжатие можно получить, отбрасывая переменные с малым статистическим весом и сохраняя остальные. Если, например', оставить M<cN2 компонент вектора G и передать их вместе со специальной инфор- информацией о том, какие компоненты сохранены, то можно сузить ши- ширину полосы в N2/M раз. В приемнике из принятых М чисел об- образуют Л^-компонентный вектор путем подстановки нулей вместо N2—M непереданных компонент. Из этого нового вектора, обозна- обозначенного как О', с помощью преобразования D.27) восстанавливается исходное изображение. В процессе сжатия воз- возникает средняя квадратичеокая ошибка особенность КЛ-преобразования состоит ъ том, что из всех линей- линейных преобразований именно оно обеспечивает минимальную ве- величину этой ошибки. Из соотношений D.25) и D.26) видно, что число операций, не- необходимых для выполнения КЛ-преобразования, пропорционально N4, так как исходный массив содержит N2 отсчетов. Для типич- типичных значений N (N=25Q или 512) такое число чрезмерно велико, '> Имеется в виду различие дисперсий этих переменных. — Прим. перев.
\ Цифровая обработка изображений 22} [Еще труднее вычислить собственные значения и собственные век- векторы ковариационной матрицы [Cg] размером A^X-W2- Экспери- Эксперименты показали, что очень многие элементы этой матрицы близки к нулю, т. е. коэффициент корреляции между отсчетами быстра стремится к нулю с увеличением расстояния между соответствую- соответствующими точками изображений. Расстояние, при котором коэффици- коэффициент корреляции между яркостями элементов изображения стано- становится настолько малым, что его можно приравнять нулю (напри- (например, 5 или 10% максимального значения), называется радиусом корреляции отсчетов; его можно выразить через целое число от- отсчетов. Зная это расстояние, все изображение можно разбить на блоки, размер которых больше радиуса корреляции, но сравним с ним. Если размер каждого блока равен Р, то можно вычислить, ковариационную матрицу всех блоков, имеющую размер^ Р2Х-Р2- Iе J = S Е №>~ где Q — N/P, a gi — вектор, построенный из отсчетов t'-го блока. Тогда, если [ФР] —матрица собственных векторов, связанных, с Р2 собственными значениями, расположенными так же, как в формуле 'D.25), то операции по сокращению избыточности для каждого из блоков выполняются ло формулам D.26) и D.27),. как для полного изображения, но матрица [Ф] заменяется на [ФР]. Как правило, радиус корреляции большинства изображе- изображений имеет такую величину, что Р=16 является разумным компро- компромиссом между размером ковариационной матрицы и скоростью». с которой коэффициент корреляции отсчетов приближается к ну- нулю '[30]. Длительность вычислений, выполняемых при сжатии- видеоинформации поблочно, пропорциональна Q2/P4. Хотя разложение изображения на блоки и делает сжатие ви- видеоинформации методом КЛ-преобразования реально осуществи- осуществимым процессом, но эффективность его остается недостаточной. Большой объем вычислений препятствует использованию подоб- подобных методов для обработки изображений типа телевизионных. Создание алгоритмов быстрых преобразований (Фурье, Ада- мара и т. д.) существенно повлияло на [многие области примене- применения цифровой обработки сигналов. Аналогичным образом она сказалось и на методах сокращения избыточности изображений. Любое линейное преобразование, подобное разложению Каруне- на — Лоэва, переводит изображение в новую систему координат.. В силу свойств КЛ-преобразования случайные компоненты изо- изображения в новых координатах оказываются некоррелированны- некоррелированными. Резонно спросить: будут ли другие преобразования, особенно- быстрые типа БПФ, обладать такими же полезными свойства- свойствами? К счастью, ответ оказывается положительным. Хотя быстрые преобразования и не приводят к полной некоррелированности
222 Глава 4 компонент, как в случае КЛ-преобразования, но see же они дают очень хорошие результаты. Их достоинства, связанные с быстро- быстротой вычислений, полностью компенсируют некоторое понижение эффективности сжатия, характерное для них. Схемы сжатия на основе 'быстрых преобразований можно опи- описать примерно так же, как и схемы с КЛ-рреобразованием. До- Дополнительным достоинством быстрых алгоритмов является их разделимость, так что двумерные преобразования можно 'выпол- 'выполнить с помощью одномерных операций. Кроме того, дх проще опи- опирать математически. Если матрица [W] соответствует оператору ортогонального унитарного одномерного преобразования (как, на- например, матрицы ядер преобразований Фурье, Адам ар а и т. д. [31]), то «поворот» изображения в новую систему координат вы- выполняется то формуле [0]=[^Ш1П D-30) \ё\—исходная матрица отсчетов изображения размером N a [G]—преобразование матрицы [g]. Нетрудно заметить, что формула D.30) описывает двухэтажное преобразование: сна- сначала по строкам изображения, а затем по столбцам преобразо- преобразований от строк. Записывая преобразование D.30) в явном виде через элементы матриц, получим N—l iV-l G(m, «) = ?] 2^^"' k)w(m> n' i> k) = (n,kJ,g(j,k)w(m,j), D.31) где второе равенство является следствием разделимости ядра преобразования. Свойством разделимости обладает ядро преоб- преобразования Фурье, наиболее часто применяемого на практике: w(m, n, j, &) = ехр — -^- (mj + пЩ 1 = L N \ D.32) а также ядра менее известных преобразований, таких, как пре- преобразования Адамар'а и Хаара. Более подробно этот вопрос рас- рассмотрен в работе Эндрюса [31]. Собственные значения А<, получаемые методом КЛ-преобразо- вания, соответствуют фактическим величинам дисперсий проекций вектора-изображения на координатные оси пространства, в ко- котором все компоненты изображения некоррелированы. В системах координат, получаемых при быстром преобразовании, коэффици- коэффициенты преобразования (т. е. элементы матрицы [G]) равны про-
Цифровая обработка изображений 223 екциям вектора-изображения на оси координат, полученным с по- помощью матрицы преобразования [W], но ,не являются дисперсия- дисперсиями. Однако как при КЛ-лреобразовании, так и в пространствах быстрых преобразований происходит концентрация энергии. В первом случае наибольшие дисперсии (и, следовательно, наи- наибольшие энергии) связаны с теми столбцами матрицы [Ф] или [Фр], которые соответствуют предпочтительным (или «естествен- «естественным») направлениям наибольшего изменения видеоинформации. Аналогично в пространстве быстрого преобразования наибольши- наибольшими являются коэффициенты, которые соответствуют предпочти- предпочтительным (или «естественным») направлениям вектора-изображения. С этой точки зрения сжатие в пространстве преобразований (как для преобразования Карунена — Лоэва, так и для быстрых преоб- преобразований) является по существу разложением изображения в ряд. «по базисным векторам (или базисным изображениям, так как каждый вектор должен описывать двумерную структуру) и таким усечением разложения, при котором ошибка мала, а число отбра- сываемых составляющих—большое. Усечение оказывается воз- возможным потому, что небольшое число компонент содержит основ- основную часть энергии изображения. Для иллюстрации рассмотрим схему сжатия в пространстве преобразований, основанную на преобразовании Фурье. Из соот- соотношений D.31) и D.32) видно, что (гп, п)-я коэффициент преоб- преобразования G(m,n) является проекцией исходного изображения g(j,k) на базисный вектор (или базисное изображение), образо- образованный при помощи (пг, п)-го значения ядра Фурье w{m, га) = exp f -^- mn j . D.33) Для типичных изображений характерно, что в области простран- пространственных частот элементы с малыми индексами велики по срав- сравнению с элементами с большими индексами. Таким образом,, структура изображения обычно имеет низкочастотный характер. Низкочастотные 'составляющие определяют контуры предметов,.. а также яркость и контрастность изображения. Высокочастотные- составляющие создают резкие линии и определяют общую чет- четкость изображения, но суммарная энергия их невелика. Так, 95% энергии типичного изображения может приходиться на низкочас- низкочастотные составляющие, занимающие 5% от общей площади дву- двумерной пространственно-частотной области преобразования Фурье. Сохраняя эти спектральные составляющие и достаточно- много высокочастотных компонент, чтобы резкость изображения была приемлема для человеческого глаза, можно- добиться суще- существенного уменьшения объема избыточной информации. После того как установлено, что основной принцип сжатия в пространстве преобразований заключается в избирательном со- сохранении коэффициентов разложения, задача создааия системы
224 Глава 4 __ сжатия изображений может показаться нетрудной. Сложность по- построения подобных схем кодирования обусловлена необходи- необходимостью сравнения свойств операторов различных преобразований и создания методов выбора коэффициентов преобразования, кото- которые следует оставить. Кроме того, задача усложняется квантова- квантованием выбранных коэффициентов и кодированием квантованных чисел. Ниже приведены краткие результаты исследований, посвя- посвященных этим вопросам. Был исследован ряд алгоритмов быстрого преобразования, та- таких, как преобразования Фурье, Адамара, Хаара {32], слэнт-лре- образавание [33], косинусное преобразование {34], преобразова- преобразование по дискретно-линейному базису [35]. Все алгоритмы сравни- сравнивались по эффективности сжатия с преобразованием Карунена— ¦Лоэва (оптимальным). Для выявления оптимального алгоритма необходимо сравнивать все преобразования в одинаковых усло- условиях — при одном и том же входном изображении и одинаковых параметрах схем выбора, квантования и кодирования коэффици- коэффициентов. Этого не было сделано; но приводимые в литературе дан- данные позволяют сделать следующие выводы. ¦1. Ни один из алгоритмов быстрого преобразования не обес- обеспечивает оптимальной эффективности сжатия изображения, ка- какая получается при использовании преобразования Карунена — Лозва. 2. По таким критериям качества, как средняя ивадратическая ошибка, ближайшим к преобразованию Карунена — Лоэва, оказы- оказывается слэнт-преобразование, а за ним следуют по порядку преоб- преобразования Фурье, Адамара и Хаара, причем сравнение выполня- выполнялось для изображений небольшого формата, например' 16X16 или •32X32 отсчета. 3. Разница между наилучшими показателями слэнт-преобра- зовавия и наихудшими показателями преобразования Хаар'а (как по субъективным, так и по объективным критериям) невелика. Коэффициенты преобразования, которые необходимо сохранить и передать, можно выбрать двумя способами. При пороговой дис- дискретизации устанавливается некоторый уровень (определяемый, как правило, на основе полной средней квадратической ошибки), и коэффициенты, его превышающие, сохраняются для передачи, а все остальные отбрасываются. При зонной дискретизации в про- пространстве преобразований размещается маска (трафарет) и эле- элементы, попавшие в нее, сохраняются, а остальные отбрасываются. Операции, выполняемые в ходе преобразования, обычно упорядо- упорядочиваются в соответствии с некоторым обобщенным индексом (час- (частотой или порядком базисной функции), и коэффициенты преоб- преобразования выстраиваются в ряд в порядке увеличения сложности (т. е. числа колебаний на единицу длины) базисных векторов, ¦причем энергия изображения концентрируется в области низких частот или малых порядков. Следовательно, зонная дискретиза-
Цифровая обработка изображений 225 ция эквивалентна обобщенной низкочастотной фильтрации изо- изображения. Пороговая дискретизация, напротив, позволяет выде- выделить значительные коэффициенты преобразования, расположенные ¦где-либо в пространстве преобразований. В результате оказалось, что пороговая дискретизация при одинаковом числе отброшенных коэффициентов дает более высокое качество восстановленного изображения, чем зонная дискретизация. К сожалению, в схемах с пороговой дискретизацией вместе с каждым отсчетам необходи- необходимо передавать 'и его местоположение ъ пространстве преобразо- преобразований. По этой причине объем передаваемой информации может заметно возрасти, если положения отсчетов передаются простыми кодами. Однако коды с переменной длиной дают возможность пе- передать адрес при небольшом увеличении числа разрядов кода [32]. Отсчеты, выбранные из пространства преобразований, необхо- необходимо квантовать. К сожалению, обычно они имеют гораздо1 боль- больший динамический диапазон, чем 'исходные отсчеты в пространст- пространстве преобразований, что подтверждает, например, опыт работы с преобразованием Фурье. Такое явление наводит на мысль об использовании чисел с переменной разрядностью, зависящей от значения коэффициента, но это значительно усложняет процесс ¦обработки. Кроме того, для создания устройства квантования, да- дающего минимальный шум квантования, необходимо знать 'плот- 'плотность вероятности значений отсчетов. Исследования плотности ве- вероятности отсчетов в пространстве преобразований [32, 33] по- показали, что наилучший компромисс м:ежду простотой и точностью обеспечивает квантование, основанное на гауссовской плотности, при фиксированной разрядности отсчетов. В этом случае удается получить высококачественные восстановленные изображения, если число уровней квантования составляет всего 64 (.6 разрядов) ['32]. По-видимому, это связано с тем, что операторы преобразо- преобразований линейны и дают взвешенные суммы, а сумма произвольных случайных величин распределена по закону, близкому к гауссов- скому. Способ кодирования коэффициентов разложений зависит от примененного алгоритма выбора коэффициентов. Как уже отме- отмечалось, при пороговой дискретизации необходимо, чтобы код со- содержал адрес отсчета в пространстве преобразования, причем на каждый отсчет отводится фиксированное число разрядов кодовой комбинации. При зонной дискретизации используется низкочас- низкочастотный характер изображения, т. е. тот факт, что коэффициенты разложения, соответствующие низким частотам (или малым по- порядкам 'базисных векторов), имеют большую величину, чем высо- высокочастотные коэффициенты. Этим можно воспользоваться, умень- уменьшая число разрядов кода, отводимых на отсчет, по мере перехода от низких частот к высоким {33]. Информацию о положении от- отсчетов передавать не нужно, поскольку форма зоны известна,
Рис. 4.10. а — исходное изображение; б — е — изображения, полученные при зонной дискретизации с преобразованием блоков аз 16X16 точек и средней разрядности (сжатого) изображения 1,5 бит/точка. Были применены следующие преобразования: Адамара (б), Хаара (в), ку;
Цифровая обработка изображений 227 а порядок выбора и передачи отсчетов внутри зоны может быть зафиксирован. В целом сокращение избыточности путем обработки в прост- пространстве преобразований (т. е. преобразование, выбор коэффици- коэффициентов, их квантование и кодирование) позволяет получить хоро- хорошие результаты. На рис. 4.10 сравниваются несколько разных преобразований. Изображения на рис. 4.9 и 4.10 'Состоят из 256Х Х256 точек, представленных 8-разрядными числами. Нетрудно видеть, что -сжатие путем обработки в пространстве преобразо- преобразований дает лучшие результаты, чем сжатие методом ДИКМ. 4.3.4. Другие аспекты задачи сокращения избыточности видеоинформации Поскольку часто изображения состоят из многих последова- последовательно появляющихся кадров (как, например, в телевидении) и изображение от кадра к кадру изменяется мало, то .в будущем, по-видимому, больше вынимания будет уделяться межкадровому сжатию (в отличие от внутри-кадрового). Как отмечалось ранее, схемы межкадрового сжатия методом ДИКМ уже изучались. Ока- Оказалось, что комбинация внутрикадрового и межкадрового кодиро- кодирования (в тех случаях, где это возможно сделать) может привести к уменьшению объема передаваемой информации в 30—50 раз. Интерес к цветным изображениям возрастает; уже проводи- проводились опыты по сокращению их избыточности методом ДИКМ и методом преобразования [33, 36]. Методы сжатия аналогичны рассмотренным выше, но их реализация усложняется из-за нали- наличия трех цветовых сигналов. В последнее время созданы гибридные системы сжатия. В них для сжатия по одной координате (обычно по строкам дискрета - зованного изображения, или по горизонтали) используется схема с преобразованием, а по другой координате (по столбцам, или по вертикали) —схема с ДИКМ. В результате получается более простая система (в ней не требуются двумерные преобразова- преобразования), но дающая такую же или лучшую эффективность кодирова- кодирования, чем системы с ДИКМ или с преобразованием ['20]. Отметим, наконец, что все рассмотренные выше схемы не яв- являются адаптивными, т. е. в них не изменяются в зависимости от -свойств изображения распределение кодовых разрядов, распо- расположение уровней квантования и т. д. Тешер [37] показал, что за счет адаптивности можно дополнительно повысить эффективность кодирования изображений. При одинаковом качестве восстанов- восстановленного непрерывного изображения ему удалось сократить объ- объем передаваемой информации почти вдвое по сравнению с дру- другими системами. 15*
'228 ^ Глава 4 - - -.. 4.4. Повышение резкости изображений Задача любой системы, формирующей изображение, 'состоит в создании резкого, 'чистого изображения, свободного от искаже- искажений. Это не всегда возможно сделать. Во-первых, каждая реаль- реальная система 'формирования изображений обладает определенны- определенными ограниченными возможностями; импульсный отклик реальной системы имеет конечную ширину, что приводит к неизбежному снижению разрешающей способности. Если на изображении не- необходимо выделить важные детали, размер которых близок к ши- ширине импульсного отклика, то необходимо бороться с потерями разрешения. Так, .например-, с межпланетных космических аппа- аппаратов приходят снимки замечательного качества (особенно, если учесть, откуда они получены), но ученые, изучающие планеты, всегда пытаются увидеть на них элементы поверхности планеты, искаженные в силу ограниченного разрешения фотокамер. Во-вто- Во-вторых, изображения могут быть испорчены из-за неудачного стече- стечения обстоятельств. Можно принять все меры предосторожности, чтобы получить высококачественные снимки, но какая-то часть их окажется испорченной либо за счет движения объекта .или каме- камеры, либо из-за плохой фокусировки и т. д. Среди плохих снимков всегда находятся столь важные или настолько редкие, что стоит пытаться их исправить. Устранение искажений относится к зада- задачам повышения резкости (или восстановления1^) изображений. ¦Ниже читатель увидит, что для решения задачи восстановле- восстановления (или повышения резкости) .изображения предложено несколь- несколько различных .методов. Для решения же рассмотренной в преды- предыдущем разделе задачи сокращения избыточности изображений бы- было представлено только два существенно различных метода. Как будет показано, восстановление изображений является задачей, не имеющей единственного решения, что и привело к многочислен- многочисленным попыткам найти лучший способ решения. 4.4.1. Важные аспекты задачи повышения резкости ;. изображений ) Как показано выше, основное уравнение формирования изо- изображения имеет вид g(x,y)=t f A(x — xv у — yjfixi, yY)dxxdtjv D.34) где g— сформированное изображение, h — импульсный отклик или аппаратная функция, а / — функция распределения яркости объ- 11 В предыдущих разделах под восстановлением (reconstruction) понималась задача создания непрерывного изображения, если дана матрица отсчетов. Здесь и ниже восстановление будет означать операцию уменьшения искажений, по ка- каким-то причинам появившихся в полученном изображении. — Прим. перев.
Цифровая обработка изображений 229 Зяспазиция = J Iodt Логари/рм _ * экспозиции ~ i ml hat) Рис. 4.11. а — зависимость оптической плотности от экспозиции; б—зависимость оптической плотности от логарифма экспозиции. екта. Конечно, непосредственно изображение g наблюдатель не получает; изображение существует в в.иде модуляции интенсив- интенсивности какого-то излучения, исходящего от объекта. Изображение становится известным только после того, как оно будет восприня- воспринято и записано некоторым образом (например, на фотопленке, сетчатке глаза, люминесцентном экране). В процессе 'восприятия и записи в изображение 'вносятся шумы, поскольку при любом способе записи сигналов присутствуют шумы записывающей си- системы. Весь процесс получения .изображения, т. е. формирование изображения, его восприятие и запись, был показан в виде блок- схемы на рис. 4.3. Таким образом, восстанавливать изображение приходится по записи, содержащей шум. Задача повышения резкости изображения усложняется особен- особенностями записывающей системы и ее собственным шумом. Как отмечалось в разд. 4.2, наиболее распространенная система для записи изображений, фотопленка, .имеет нелинейную характери- характеристику и вносит шум, модулированный сигналом. Типичная харак- характеристика фотопленки приведена на рис. 4.11, а, где показана за- зависимость оптической плотности, определенной выше, от 'Интен- 'Интенсивности падающего излучения, причем предполагается, что за время выдержки интенсивность не изменяется. Обычно такую ин- информацию приводят на графиках с логарифмическим масштабом по оси абсцисс (рис. 4.11,6); получающийся в таких координатах график зависимости D от log Е .имеет линейный участок. Вид этой кривой иногда порождает заблуждения относительно резкой нели- нелинейности характеристики фотопленки. Поскольку изображение за- записывается на пленке зернами серебра, а плотность серебряного слоя пропорциональна оптической плотности, то очевидно, что
'230 Глава 4 .процессы записи на фотопленку нелинейны по своей сути. Столь же сложны процессы, создающие шумы пленки. Дис- Дисперсия шума, вызванного случайным размещением зерен серебра на пленке, пропорциональна локальной плотности проявленных •¦серебряных зерен, прячем функция пропорциональности усложня- усложняется наличием степенного множителя [8]. Таким образом, шум лредставляет собой флуктуации оптической плотности записи изо- изображения, зависящие от сигнала. В общем случае задача цифро- цифровой обработки сигналов с шумом, зависящим от сигнала, еще не решена. .Немногочисленные известные результаты [10] указывают, что зависимость шума от сигнала может оказаться не слишком большой проблемой. Поэтому обычно предполагают, что шум со- создается независимыми от сигнала флуктуациями плотности. Од- Однако логарифмическая зависимость между оптической плотностью пленки, запечатлевшей изображение, и интенсивностью падающе- падающего на пленку излучения усложняет задачу. Даже если предполо- предположить, что флуктуации оптической плотности не зависят от сигна- сигнала, в свете, прошедшем через пленку, будет присутствовать муль- мультипликативный шум, зависящий от сигналя. Аналогичные эффек- эффекты наблюдаются в фотоэлектронных системах (типа телевизион- телевизионных и им подобных), характеристики которых описываются сте- степенным законом. € учетам вышеизложенного полная модель процессов форми- формирования и записи -изображения описывается соотношением g(x,y) = + ti(x, y), D.35) лде g—фактически записанное изображение, s — характеристика записывающего процесса, an — шум. Предполагается, что п не зависит от записанного изображения. Задача повышения резко- резкости (или восстановления) изображения заключается в определе- определении исходного распределения интенсивности излучения объекта f.(x, у) на основе записи g{x, у), содержащей шум. Формула D.35) позволяет оценить сложность задачи восста- восстановления изображения. Искажения исходного изображения изме- изменяют интенсивность экспонирующего света, а в нашем распоряже- распоряжении имеется только нелинейная функция от этих интенсивностей. Если избавиться от нелинейности с помощью преобразования, об-* ратного к s, то получим s-1[g(x,y)} = s'i{s[h(x, y)**f{x,y)\ + n(x,y)}, D.36) где знак ** означает двумерную свертку. Поскольку обратная г нелинейность воздействует на сумму и оператор этой нелинейно-, сти недистрибутивен по отношению к оператору сложения, то на-1 личие шумового слагаемого означает, что 1) получить точное об-
Цифровая обработка изображений ратное преобразование и исходные интенсивности невозможно,. 2) при преобразовании g с использованием характеристики, об- обратной к нелинейной характеристике системы записи, -будет по- получена нелинейная комбинация сигнала и шума. Решения уравнения D.36) в настоящее время не получены. На- практике при восстановлении изображений делают одно из двух: предположений. Пер,вое предположение состоит в том, что в соот- соотношении D.36) операцию s~l можно применить к слагаемым по отдельности, т. е. s-' {g (х, у)} да h (х, у) ** / (х, у) + s-1 (я (х, у)}, D.37) что эйвивалентнО1 замене шума .на новый шумовой процесс s-1 {n}. При (втором подходе данные обрабатываются в том виде, как они записаны, т. е. предполагается, что нелинейной функцией s можно пренебречь и g (х, у) да // (х, у) ** / (х, у)+п(х, у). D.38) Ра1венства D.37) и D.38) были бы справедливы, если бы удов- удовлетворялось любое из двух предположений: 1) функция s имеет слабую нелинейность и ее можно аппроксимировать линейной функцией или 2) сигнал g изменяется ib малых пределах (низко- (низкоконтрастное изображение) и операторы s и s~' близки к линей- линейным. Графики типа изображенных на рис. 4.11 доказывают, что нелинейность оператора s обычно нельзя считать слабой. При правильном выборе экспозиции диапазон изменения от черного к белому не соответствует предположению о вязкой контрастно- контрастности. Однако на практике изображение удается успешно восста- восстановить в пространстве яркостей, связанном с преобразованием D.37), или в пространстве плотностей, связанном с преобразова- преобразованием D.38), несмотря на теоретические трудности, возникающие при отбрасывании нелмнейностей. Даже при беглом взгляде на соотношения D.37) или D.38) видно, что восстановление изображений относится к задачам фильтрации с помощью инверсной свертки (т. е. к обработке за- записанной информации с помощью оператора h^1, который являет- является обратным по отношению к оператору двумерной свертки с функцией h). Эта задача сложна тем, что сводится к решению плохо обусловленных систем линейных уравнений [38]". При по- повышении резкости изображений задача усложняется за счет того, что для многих изображений аппаратная функция сингулярна, т. е. преобразование Фурье от нее имеет нули, что наблюдается, например, при дрожании съемочной камеры или плохой ее фоку- фокусировке. Поэтому при решении задач восстановления изображений >> Матрицу называют плохо обусловленной, если соответствующая ей обрат- обратная матрица неустойчива. — Прим. ред.
232 Глава 4 значительные усилия затрачиваются на преодоление трудностей, связанных с сингулярностью [2]. Для восстановления изображений цифровыми методами не- необходимо, чтобы .все уравнения были записаны для дискретизо- ¦ващных функций. Поэтому соотношение D.35) принимает вид ш—\ n—\ \ ^h\{i~p)Ax, (k-q)\y]X {jAx,kAy), D.39) Xf(pAx,qAy) тде знак приближения указывает, что дискретные суммы не явля- являются точным представлением исходных интегралов. Аналогичные выражения можно записать для формул D.37) и D.38). Интерес- Интересно отметить, что соотношение D.39) можно рассматривать как систему уравнений относительно неизвестных значений f. Если выполняются предположения, сделанные при .выводе соотношения D.38), то соответствующие дискретные уравнения (где без поте- р'и общности можно (положить Ах—Ау=\) превращаются в си- систему линейных уравнений относительно f(p,q): ?(/.*)-2 2 Ati-^ k~4)f(P> Я) + п{}, k). D.40) />=0 fj = 4 Формула D.40) подсказывает, что задача восстановления изображений сводится к решению системы линейных уравнений. Это действительно так, и для подтверждения можно представить соотношение D.40) в виде произведения матрицы на вектор. По- Поэтому значение цифровых методов обработки сигналов, таких, как линейная фильтрация и БПФ, состоит ,в том, что О'ни 'Являются средством для быстрого нахождения точного или приближенного решения очень больших (с Л/2 переменными) систем линейных уравнений. Такой подход очень важен для развития более совер- совершенных методов повышения резкости изображений, но обсужде- обсуждение его требует применения теории матриц в объеме, чрезмерно большом для данной книги. Подробнее связь между матричными представлениями 'И восстановлением изображений методом дис- дискретного преобразования Фурье описана в работах ['2, 39, 4G]. 4.4.2. Основные методы повышения резкости изображений Операция дискретной свертки, фигурирующая в формуле D.40), имеет аналог в пространстве дискретного преобразования Фурье (ДПФ). ДПФ соотношения D.40) имеет вид G(u,v)=H(u.v)F(u,v) + Nla.v), D.41)
Цифровая обработка изображений 233 где и, у = 0, 1, ..., N—1, а прописные буквы обозначают ДПФ величин, обозначенных в формуле D.40) 'соответствующими строч- строчными буквами. Так, функция н ^v) = 2 2h wexp f - 4г <'и+ представляет собой ДПФ от дискретизованной аппаратной функ- функции; аналогичные соотношения имеются для G, F и N. Обычно область ненулевых значений атпаратной функции по величине гораздо меньше, чем размеры исправляемого снимка. Следова- Следовательно, N гораздо больше числа ненулевых отсчетов функции. h(j,k) и перед преобразованием эта функция должна быть допол- дополнена соответствующим числом нулей (необходим также надлежа- надлежащий сдвиг по фазе). Как следует из теории, величину N следует выбирать достаточно большой, чтобы устранить нежелательные эффекты заворота изображения, связанные с периодичностью круговой свертки. На практике оказывается, что эти эффекты не очень существенны. Действительно, снимаемая сцена бесконечно велика по сравнению с размерами аппаратной функции и на кра- краях кадра искаженное изображение содержит вклад объектов, рас- расположенных «не кадра, но вносящих в кадр помехи sa счет сверт- свертки с аппаратной функцией. Краевые эффекты, возникающие в процессе инверсной фильтрации изображения на основе непол- неполной информации (о предметах, находящихся за кадром), более ¦важны, чем завороты. Бэистер [18] роказал, как можно частично исправить эти краевые искажения. При выборе N более важно предусмотреть возможность уменьшения заворотов и эффектов усечения, связанных не с самой аппаратной функцией h(j,k), а с .функцией, обратной к ней. Простейшим способом повышения резкости изображения явля- является обработка записи в лрсгстранслвеино-частотной области с по- помощью обратного фильтра. При этом получается оценка восста- восстановленного изображения F(u, v) = Ht(u, v) G(u, v)= jf±^-. D.43) Хотя это самый 'простой подход, при его использова'НИ'и встреча- встречаются наибольшие трудности. 1. Для многих видов искажений аппаратная функция такова, что ее ДПФ имеет нули. Например, для искажений, вызванных движением съемочной камеры в горизонтальном направлении, ДПФ аппаратной функции имеет вид ^ D.44); ¦паи где а — размер размытия, выражаемый числом отсчетов. Если* искажения сильные (а достаточно велико), так что нули функции;
234 Глава 4 D.44) попадают в найквистозский диапазон, то обратный фильтр является сингулярным. Аналогичная трудность возникает в слу- случае искажений, вызванных расфокусировкой камеры, когда за- запись содержит свертку истинного изображения с формой аперту- апертуры. Для большинства стандартных форм апертуры (круглой, квадратной и т. д.) соответствующие ДПФ имеют нули; если эти нули попадают в найквистовский диапазон, то обратный фильтр оказывается сингулярным. К сожалению, обычно так и бывает. 2. Столь же неприятно то, что аппаратные функции (даже ес- если они не (Приводят к сингулярности) обычно являются плохо обу- обусловленными, в частности, модуль их преобразования быстро уменьшается вблизи некоторых значений и и v (обычно в области высоких частот, .поскольку искажения связаны с медленными про- процессами), поэтому обратный фильтр 1/Я резко увеличивает влия- влияние шумовой составляющей, входящей в формулу D.41), что ухудшает изображение. ¦Несмотря на все трудности, обратные фильтры удается при- мейгить для восстановления изображений. На рис. 4.12 приведено цифровое изображение размером 512X512 точек, в которое с по- помощью ЭВМ были внесены 'искажения, эквивалентные свертке изображения с гауосовской аппаратной функцией. К искаженно- искаженному снимку был прибавлен шум и отношение сигнал/шум (С/Ш), измеряемое как отношение дисперсий сигнала и шума, стало рав- равным 2000 C3 дБ). Аппаратная функция не (содержит нулей, а от- отношение С/Ш велико, поэтому восстановление методом обратной фильтрации возможно. На рис. 4.13, а приведен результат обра- обработки снимка рис. 4.12 обратным фильтром, реализованным с по- помощью Б-ПФ. Однако если С/Ш уменьшается за счет роста мощ- мощности шума, то восстановление путем обратной фильтрации дает плохие результаты. На рис. 4.13,6 приведено изображение, вос- восстановленное обратной фильтрацией при С/Ш—200 B3 дБ). Раз- Размытое изображение при таком уровне шума выглядит так же, как снимок рис. 4.1.2, поскольку влияние шума трудно определить ви- визуально, если отношение С/Ш превышает 20 дБ. Шум был при- прибавлен в области плотностей, связанных с яркостями по логариф- логарифмическому закону; изображение искажалось в яркостной области, но восстанавливалось в области плотностей так, как описано в разд. 4.4.4. Рис. 4.12 и 4.13 иллюстрируют важную мысль: обратный фильтр может работать, но для этого требуется очень большое отношение сигнал/шум и малая степень искажений. К сожалению, нет определенных правил, которыми следует руководствоваться при восстановлении изображений. Но, с другой стороны, обрат- обратная фильтрация осуществляется настолько просто, что ее можно проводить, не имея заранее гарантий на успех, и это не приведет к большим затратам, если окажется, что шум или сингулярность воспрепятствуют ее выполнению.
Цифровая обработка изображений 235: Рис. 4.12. Изображение размером 512X512 отсчетов, искаженное аппаратной функцией в виде гауссовской кривой и шумом; отношение сигнал/шум равно 33 дБ. Влиянию помех и сингуляряостей менее подвержен другой ме- метод восстановления изображений — в'инеровская фильтрация. Как следует «з названия, такая фильтрация основана на теории оп- оптимальных оценок, предложенной Норбертом Винером. При 'Про- 'Проектировании фильтра ставится задача найти такую линейную оценку (где L—линейный оператор), что имеет минимальную величину. Структура устройства для полу- получения оценок была найдена многими исследователями. Примени- Применительно к обработке изображений первым в явном виде это сделал' Хелстром '[41] .разработавший пространственный и частотный ва~
236 Глава 4 Рис. 4.13. а—изображение (рис. 4.12), восстановленное обратной фильтрацией; когда отношение сигнал/шум равно 23 дБ. I— то же для случая, рианты устройства. При цифровой обработке изображений ис- используется вариант с обработкой ib частотной области. Цифровая фильтрация изображений выполняется фильтрам с передаточной функцией lj / \ Н* (и, v) .. ._. Hw (и, v) = : ,.. „ч- D.45) Фп<«, у) Щи, v) \" + F (и, v) = Hw (и, v) G (и, v), D.46) причем звездочка означает комплексное сопряжение, а Фп и Of — энергетические спектры шума и сигнала соответственно. Как и при обратной фильтрации, обработка производится на основе
Цифровая обработка изображений 237 двумерных БПФ и обратное преобразование от D.46) дает ис- п>раиленное изображение. Анализируя соотношение D.45), можно заметить следующие свойства винершского фильтра: 1. Если шум очень мал или отсутствует, так что Ф„—уО, то винеровсжий фильтр переходит ,в обратный. Таким образом, в про- пространственно-частотных областях с малым уровнем шума (как правило, это области низких пространственных частот) характе- характеристики винеравского и обратного фильтров совпадают. 2. Если мощность сигнала становится малой, так что Ф^—МЭ, то коэффициент передачи винеролокого фильтра стремится к ну- нулю. Этим решаются проблемы, связанные с сингулярностью ап- аппаратной 'функции и с особенностями плохо обусловленных си- систем уравнений яри отсутствии сингулярности. На рис. 4.14, а и 4.14,5 приведены результаты восстановления изображения, полученные с помощью в'инеровскрго фильтра при
238 Глава 4 таких же условиях, как на рис. 4.13, а и б. Снимки рис, 4114, а и рис. 4.13, а похожи, что указывает на эквивалентность .вин Юров- Юровского и обратного фильтров при малом уровне шума. Однако по качеству рис. 4.14,6 намного превосходит рис. 4.13,6; это свиде- свидетельствует о том, что БИ'неровский фильтр лучше подавляет шумы в областях с малым сигналом. Полосы на краях рис. 4.13 и вызваны краевыми эффектами свертки, рассмотренными ] и заворотами, связанными с аппаратной функцией обр 4.14 шее, ТНОГО фильтра. Внимательное сравнение рис. 4.13,6 и АЛА,б создает впечат- впечатление, что винеровский фильтр восстанавливает изображения с меньшим уровнем шума, чем метод обратной фильтрации, но, возможно, три этом несколько ухудшается резкость и теряются мелкие детали. Bice это можно объяснить двумя причинами: 1) критерий минимума средней нвадратической ошибки явля- является слишком строгим и его можно ослабить;
Цифровая обработка изображений 239 'О Рис. 4.14. а — изображение (рис. 4.12). восстановленное с помощью винерсшекого фильтра- б —то же для случая, когда отношение сигнал/шум равно 23 дБ. 2) нелинейные и адаптивные свойства человеческого зрения могут «не согласовываться» с критерием минимальной средней квадратической ошибки. В разд. 4.3.3 будет рассмотрен другой способ построения вос- восстанавливающего фильтра, в котором предъявляются меньшие тре- требования к априорной информации, чем при винеровскои фильтра- фильтрации. 4.4.3. Повышение резкости изображения «вслепую» и методом уравнивания энергетических спектров 'Кэннон [42] предложил метод, .позволяющий восстанавливать изображения лучше, чем с помощью мтеровского или обратного фильтров; это так называемый метод уравнивания энергетике-
240 1 лава 4 / ских спектров 'или метод гомоморфной фильтрации. (Сначала та- такой фильтр был спроектировав Коулом [21] таа основе теории го- гомоморфных систем, а затем Кэ'ннон нашел эквивалентную форму, пользуясь методом уравнивания энергетических спектров, который и будет описан ниже.) Передаточная функция фильтра опреде- определяется из итростого условия, гораздо более слабого, чем критерий минимума средней квадратичеокой ошибки в винеровюком фильт- фильтре. При проектировании фильтра отыскивается такая линейная оценка /(х, y) = L\g{x, y)\, (где L — линейный оператор), чтобы энергетический спектр оценки равнялся энергетическому спектру исходного изображения. Таким образом, условие имеет вид Ф/(и, у) = Ф/{и, v). D.47) Поскольку g(x, у) определяется из соотношений D.37) или D.38), то энергетический спектр оценки / равен Ф/(ц, ь)= 1L(и, v)\Ц\Н (и, v)|*Ф;(и, v) + Ф„(и, v)\. D.48) Его можно приравнять к. правой части соотношения D.47) и в яв- явной форме найти \L(u,v)\ —модуль пространственно-частотной характеристики линейного фильтра, уравнивающего энергетиче- энергетические спектры (уэс). В результате характеристика фильтра будет иметь вид Яуэс(ц, и)= \L (и, 0| = D.49) а из соотношения F{u, v) = Hy3C(a, v)G{u, v) D.50) определяются значения спектра восстановленного изображения. Для получения самого изображения эти значения нужно подверг- подвергнуть обратному преобразованию. Как и прежде, вычисления сле- следует производить с применением БПФ. Фильтр с уравниванием энергетических спектров обладает юле- дующими свойствами: 1. При малых шумах, когда Фп—>-0, характеристика фильтра сводится к модулю характеристики обратного фильтра. 2. При малых сигналах, когда Ф;—>-0, коэффициент передачи фильтра уменьшается до нуля. 3. В промежутке между этими экстремальными условиями ко- коэффициент передачи фильтра больше, чам Hw, но меньше, чем Hi. Это обусловлено отсутствием множителя Н* в числителе выра- выражения для Hw, а также свойствами операции извлечения квадрат- квадратного корня. Можно показать, что характеристика фильтра с урав- уравниванием энергетических спектров равна среднему геометриче-
цифровая обработка изображений 241 okoW от характеристик винаротского и обратного фильтров [21] Поскольку коэффициент передачи фильтра с уравниванием энергетических спектров больше, чем у виверотсжого фильтра но не приводит к увеличению шумов, как в обратном фильтре' то восстановленное изображение содержит большее число мелких деталей, связанных с высокочастотными составляющими которые винеровекий фильтр обычно подавляет. При этом уровень шума увеличивается, но человек обычно согласен мириться с увеличе- увеличением шума, если получает дополнительную полезную информацию о мелкой структуре изображения. На рис. 4.15, а и б показаны изображения, исправленные фильтром с уравниванием энергетических спектров при условиях соответствующих рис. 4.13, а я б. Снимки «а рис. 4.13, а, 4.14, а и 4.15, а похожи; это указывает «а то, что три слабых шумах этот фильтр имеет те же свойства, что и обратный. Результат восста- а Рис. 4.15. а — изображение (рис. 4.12), восстановленное методом уравнивания энергетических спектров,-
242 Глава 4 Ь Рис. 4.15. б—то же для случая, когда отношение сигнал/шум равно 23 дБ. новлдаия изображения при сильном шуме представлен на рис. 4.15,6. Сравнение его с рис. 4.13,6, рис. 4.14,6 и с исходным изо- изображением на рис. 4.12, а показывает преимущество данного ме- метода павышения резкости изображений. Соотношение D.49) задает только модуль передаточной функ- функции, но можно построить фильтры, ов которых задается также оп- определенная фазовая характеристика. Для многих видов искаже- искажений (например, для расфокусировки или смазывания изображе- изображений при движении) фазовая характеристика имеет значения 0 или ±п. Фильтр, описываемый соотношением D.49), можно допол- дополнить устройством, вносящим необходимый сдвиг фазы; в резуль- результате получается восстанавливающий фильтр, корректирующий в изображении как амплитудные, так и фазовые искажения. Кэн- нон [42] показал, что подобный метод повышения резкости
Цифровая обработка изображений 243 лучше чисто амплитудной коррекции (как и следует из общих принципов). ¦Метод уравнивания энергетических спектров проясняет весьма важные особенности задачи восстановления «вслепую», т. е. пу- путем оценивания параметров, необходимых для восстановления искаженного изображения по этому же искаженному изображе- изображению. При винеровской фильтрации необходимо заранее знать ве- величины Фп, cpf и Я. Аналогичное требование можно сформулиро- сформулировать и для случая фильтрации методом уравнивания энергетиче- энергетических спектров. Однако внимательный анализ шектров, фигури- фигурирующих в соотношении D.49), позволяет заметать, что оценки всех необходимых величин можно найти на основе искаженного изображения. Рассмотрим изображение g(x,y), формируемое по законам, описываемым формулами D.37) и D.38) или им подобными. Ра- Разобьем изображение на части размером МУ(М, где М велико по сравнению с размерами аппаратной функции, «о мало по сравне- сравнению с размером исходного изображения Ny(N. Типичным значе- значением является М = 64, Отдельные части изображения могут пере- перекрываться. Если пренебречь краевыми эффектами, то каждую часть изображения можно описать сверткой аппаратной функции с соответствующей областью полного первоначального распреде- распределения яркости объекта. Тогда соотношение + ni(x,y) D.51) аппроксимирует закон формирования изображения в каждой из частей gi. После дискретизации gi путем взятия М\М отсчетов можно найти энергетический спектр каждой части изображения, равный Ф^ (и, v) «1 Я (и, v) р Ф< (ц, v) + Ф1п(и, v), D.52) где верхний индекс i обозначает номер части изображения. Если предположить, что изображение и шум можно аппроксимировать стационарными случайными процессами, то Ф| и Ф'п будут вы- выборками из двух функций, описывающих два энергетических спектра. Поэтому суммирование по i приведет к сглаживанию случайных 'отклонений в энергетических спектрах каждой из час- частей изображения. Таким образом, = \Н(и, v)\2$f(u, о) + Фя(», о). D.53) где Q = NjM, а % и Фп — оценки энергетических спектров сигна- сигнала и шума соответственно.
244 Глава 4 . i i . r -:-; r Рис. 4.16. a — снимок, полученный горизонтально-перемещающейся камерой; б — снимок, восстанов- восстановленный методом уравнивания энергетических спектров (оценка параметров аппаратной функ- функции искажений сделана «вслепую»). . Значение равенства D.53) определяется следующими сообра- соображениями: 1. Квадрат модуля ^преобразования Фурье от размытой аппа- аппаратной функции приводит к появлению характерных особенностей
Цифровая обработка изображений 245 в усредненном энергетическом «центре частей изображения. Для таких видов искажений, как расфокусировка и 'Смазывание при сдвиге, в спектре остаются характерные признаки, позволяющие установить тип искажения и определить шее его существенные параметры, как, например, размер «размазанного» изображения точии и пер-иод обращений фазы [42]. 2. Знаменатель передаточной функции фильтра, с уравнивани- уравниванием энергетических спектров полностью совпадает с правой частью равенства D.53), и если уже нам известна оценка Ф/, то можно выполнять операцию восстановления изображения. Оценку Of можно получить несколькими способами. Во-первых, можно взять неискаженные изображения, подобные восстанавливаемому, и оп- определить Ф/ по ним, таи как было показано [21], что большинст- большинство изображений имеет очень похожие энергетические спектры. Или же можно на основе исправляемого изображения получить оценку Фл (обычно это удается сделать на однородных участках изображения), а также определить значения Я по его характер- характерным признакам и решить уравнение D.53) относительно Qf. На рис. 4.16, а приведен снимок, сделанный камерой, двигав- двигавшейся в процессе съемки. Камера двигалась в горизонтальном на- направлении, и хорошо заметно, что из-за этого мелкие надписи стали совершенно неразличимыми. На рис. 4.16,6 показан тот же снимок после восстановления вышеописанным методом; сма- смазывание за счет сдвига оставило в энергетическом спектре харак- характерные признаки, которые были автоматически распознаны и при- применены при создании фильтра, восстанавливающего изображение методом уравнивания энергетических спектров. После восстанов- восстановления текст стал вполне разборчивым. Дальнейшие сведения об этом методе восстановления изображений можно найти в рабо- работе [42]. 4.4.4. Замечания о восстановлении изображений в яркостной и плотноетной областях Все рассмотренные образцы изображений были искажены в пространстве яркостей либо моделированием характеристиче- характеристической 'Кривой пленки на ЭВМ, либо при проведении стационарной ¦съемки в реальных условиях, как снимок рис. 4.16. Однако вос- восстановление изображений проводилось в пространстве плотностей, ¦связанных с яркостями логарифмической зависимостью, как было показано выше. Во-первых, это, очевидно, связано с предполо- предположением о линейности, выраженным в виде равенства D.38). Во- вторых, из практических соображений, относящихся к качеству изображений, восстановление изображений удобнее проводить в пространстве плотностей, а не в пространстве яркостей, где не- необходимо учитывать соотношение D.37). Диапазон изменения яр- яркости составляет обычно 2—3 порядка, и в тех местах изображе-
246 1 лава 4 нвя, где яркость изменяется резко, могут просматриваться боко- боковые лепестки характеристики восстанавливающего фильтра. Ди- Динамический диапазон изменения плотности гораздо меньше одно- одного порядка, и подобный эффект здесь не столь опасен. В обшир- обширных работах Кэниона [42] и Коула [21] показано, что изображе- изображения, восстановленные в пространстве плотностей, обладают бла- благоприятными для зрения свойствами. Таким образом, предположе- предположение о линейности, связанное с равенством D.38), из практических соображений оказывается более предпочтительным. 4.4.5. Нелинейные методы восстановления изображений С позиций цифровой обработки сигналов все рассмотренные методы сводятся к линейной фильтрации сигналов с применением быстрых .преобразований Фурье. Из этого, конечно, не следует, что построение эффективной системы обработки сигналов являет- является тривиальной или несложной задачей. При оптимизации мето- методов фильтрации сигналов и соответствующих машинных .программ может потребоваться много труда и изобретательности. Тем не менее основополагающие принципы фильтрации относятся к об- области линейной обработки сигналов, и их легко найти в работах по классической цифровой обработке сигналов. / Практические исследования, однако, показывают, что линейная обработка имеет недостатки. Во-первых, реальные изображения обладают рядом свойств, которые не учитываются при линейной обработке. Например, яркости точек изображения всегда положи- положительны, а в схеме с линейной обработкой могут появляться от- отрицательные числа, связанные с боковыми лепестками характе- характеристики восстанавливающего фильтра. Во-вторых, линейная об- обработка является лишь приближением к оптимальной обработке, так как средства для записи изображений, такие, как киноплен- кинопленка, в принципе нелинейны. Поэтому представляют интерес методы повышения резкости изображений, в которых учитывается такая нелинейность. При нелинейном восстановлении изображений (как почти во всех операциях, связанных с нелинейностями) основная трудность заключается в объеме вычислений. В нелинейных системах эффек- эффективность вычислений не такая высокая, как при линейной обра- обработке методом БПФ. В силу этого из всех предлагавшихся мето- методов нелинейного восстановления изображений лишь немногие когда-либо применялись для обработки крупных изображений, так как при большом количестве отсчетов число вычислительных опе- операций чрезмерно возрастает. Решения подобных проблем, по-ви- по-видимому, в большей степени связаны с математическим анализом, чем с цифровой обработкой сигналов, и поэтому данный раздел будет довольно коротким.
Цифровая обработка изображений. 247 Один из практически реализуемых нелинейных методов отно- относится к восстановлению изображений в пространстве плотностей с учетом предположений, связанных с равенством D.38). Если яркости искаженного изображения перевести в плотности путем логарифмирования, а затем скорректировать изображение с по- помощью БПФ и результат пропотенцировать, то получится систе- система с нелинейными характеристиками, но реализованная на осно- основе БПФ. К тому же яркости конечного изображения здесь всегда положительны. Теоретическим основанием подобного метода яв- являются теория гомоморфной обработки сигналов, а также муль- мультипликативная модель процеоса формирования изображения [19]. Логарифмическая пространственная фильтрация, по-видимому, со- согласуется с .моделью системы человеческого зрения, представлен- представленной iB первом разделе главы. Метод Фридена [43] также гарантирует отсутствие отрица- отрицательных значений яркости в (восстановленном изображении, кото- которое определяется путем решения системы нелинейных уравнений = h(J, й)**ехр[—1+Л(/, *)•* Ц/, ?) + !*] + + е.{р[ —1 + Ц/, k)\, 1 + А(/, k)**\{j, А) + |х], D.54) а исправленное изображение описывается равенством 1+А(/, *)**>.(/. A)-fixl, 1 . D.55) где символ ** обозначает двумерную дискретную свертку, а Р — полная энергия исходного изображения. Таким образом, решение оказывается положительным и ограниченным по величине. Однако решить эту систему непросто. Вычисление сверток, фигурирующих в соотношениях D.54) % D.55), методом БПФ не очень помота- помотает, поскольку основная трудность заключается .в решении системы уравнений относительно неизвестных %{\,k) и \а (множителей Лагранжа в задачах оптимизации). Данный метод был опробован на очень малых изображениях (размером 50X50 отсчетов) в слу- случае разделимых аппаратных функций, причем для решения нели- i нейных уравнений применялась итерационная процедура Ньюто- ' на — Рафсона. При увеличении размеров шимка решение нели- нелинейных уравнений связано с большими трудностями. Был также предложен, но не реализован практически метод прямой оптими- оптимизации [2]. Метод 'нелинейного восстановления изображений, предложен- предложенный Фриденом, исходит из предположений о положительности и ограниченности отсчетов изображения. Нелинейные (Методы могут также основываться «а анализе нелинейности записывающих средств. В работах [40, 44] описай байесовский подход к восста- восстановлению изображений, записанных с помощью -нелинейных устройств. Результат обработки получается в виде решения нели-
248 Глава 4 нейного матричного уравнения. Определение этого решения при большом числе (переменных, описывающих ювантшан'ное 'Изобра- 'Изображение, связано с выполнением множества вычислений, а роль цифровой обработки сигналов сводится к выполнению операций свертки i[44]. Такой (метод применялся для коррекции изображе- изображений размерами до 512X512 отсчетов. Задача восстановления изображения в общем случае, т. е. с учетом нелинейности записи и условия, что отсчеты яркости должны быть ограниченными и положительными, сводится к за- задаче нелинейного программирования [2]. Однако возможности современной техники не позволяют решить в общем случае зада- задачу нелинейного 'Программирования при том числе переменных, ко- которое характерно для изображений, представленных в цифровом виде. Были разработаны и опробованы на (маленьких изображе- изображениях (размером, например1, 32X32 отсчета) специальные алгорит- алгоритмы, основанные на симплексном методе и относящихся к нему понятиях математического программирования. К большим сним- снимкам эти алгоритмы еще не применялись. Вообще повышение рез- резкости нелинейными методами является той областью цифровой обработки изображений, еде далеко не все сделано. 4.4.6. Повышение резкости изображений с характеристиками, изменяющимися в пространстве В предыдущих разделах была показана роль, которую 'игра- 'играют при восстановлении изображений 'операции свертки и двумер- двумерная цифровая фильтрация. Во всех методах требовалась, чтобы законы формирования изображения обладали свойством прост- пространственной инвариантности. Бели же процесс формирования 'изо- 'изображения не является пространственно-инвариантным, то форму- формула D.34) принимает вид g (х, y)= j j h {x, х„ у, у{) /(%!, уг) dxidyy D.56) и при обращении ее в дискретную форму в ней не появится дис- дискретной свертки. К сожалению, <в ряде интересных случаев фор- формирование изображений подчиняется пространствешт-нестацио- нарным уравнениям, как, например, при неравномерном движе- движении камеры или при наличии оптических аберраций. Рассмотрим, например, одномерные искажения по .горизон- .горизонтальной ООН, когда искажения минимальны в левой части снимка и линейно увеличиваются до максимума в правой части. Вели изо- изображение дискретизовать по равномерной сетке, то отсчет, взя- взятый в правой части, будет содержать вклады от большего числа соседних точек, чем отсчет в левой части снимка. Один из шосо- бов устранения этого недостатка состоит в увеличении интервала
Цифровая обработка изображений 249 Фильтр с характеристиками, изменяющимися в пространстве f(X) h(u,x) Фильтр с пространствето-инзариант- ными характеристиками f(X) ' Геометрическое искажение у = Ьм h(z~ v) Геометрическое искажение х~ c(z) ff(u)- Обратный срильтр с характеристиками, в пространстве Фильтр с пространственно-инвариант- пространственно-инвариантными характеристиками Обратнае искажение z =с~'(х) —> h~'{z-v) Обратное искажение ' Восстанавливающая система Рис. 4.17. Структурная схема процесса восстановления изображения с простран- пространственно-зависимыми искажениями. между отсчетами при движении слева направо так, чтобы каж- каждый отсчет содержал взвешенную сумму яркостей одинакового числа соседних точек. Фактически это является преобразованием координат, делающим искажения пространственно-инвариантны- пространственно-инвариантными. После 'коррекции исходное изображение восстанавливается с помощью преобразования 'координат, обратного к первому. Савчук '[46] показал, что этот общий метод можно (применять для .нескольких 'видов искажений, вызванных оптическими абер- аберрациями или неравномерным сдвигом во время съемки. Обобщен- Обобщенная схема процесса коррекции показана на рис. 4.17. Пространст- Пространственно-нестационарные искажения представляются в виде двух геометрических искажений. Сначала снимок переводится в 'коор- 'координаты, где искажения оказываются пространственно-инвариант- пространственно-инвариантными, а затем осуществляется переход от пространственно-инва- Р'иантных координат к координатам, 1зависящим от положения де- деталей изображения. Система для восстановления изображения основывается на преобразованиях, обратных к этим двум, и фак- фактическое восстановление выполняется путем линейной обработки в пространстве, где искажения являются пространственно'-'инвари- антными. При этом для быстрой обработки больших 'изображений можно применять свертку и БПФ, а сами операции преобразова- преобразования 'координат требуют малого или приемлемого числ:а вычисле-
?50 Глава 4 ний. Подобная обработка успешно применялась для 'Исправления аберраций типа комы [47] и искажений, вызванных пространст- пространственно-неравномерным сдвигом [46]. Атмосферная турбулентность обусловливает смазывания изо- изображений, изменяющиеся с течением времени, 'поскольку темпе- температурные градиенты в воздушных слоях ;влияют на -случайные фа- фазовые задержки в волновых фронтах потоков света, несущих изо- изображение. В силу усреднения за время экспозиции эти флуктуа- флуктуации создают искажения изображений, аппаратная функция ко- которых приближается к гаусеовской я стацио-нарна. В ряде случаев делались попытки повышения резкости таких изображений [48]. Но, как правило, искажения оказывались достаточно сильными, и восстановление изображений (было малоэффективным. Недавно Нокс предложил новый метод коррекции атмосферных искаже- искажений изображения [49]. В любой момент времени изображение, проходящее сквозь турбулентную атмосферу, формируется под -воздействием случай- случайной аппаратной функции. При наблюдении за одним и тем же объектом можно получить набор1 снимков, описываемых 'соотно- 'соотношениями типа gt(x, y)= j J А|(х — д:,, y — yi)f{xv yl)dx1dyi = y), D.57) в которых аппаратная функция искажений рассматривается как пространственно-инвариантная, но изменяющаяся во времени от момента к моменту (т. е. по переменной i). Усредняя снимки D.57) то времени, получаем < gi (х, У)> = < А,(х, у) > •* / (х, у), D.58) причем сложение hi со случайными фазами создает столь широ- широкую усредненную аппаратную функцию, что большая часть высо- высокочастотных составляющих f(x у) теряется. Беля же перед усреднением изображения подвергнуть преоб- преобразованию Фурье и возвести спектры в квадрат, то получается другой результат. В этом случае < Gt(u, v) G* (и, v) > = < Я;(и, ь) Н* (a, v) > х х F(u, v)F*(u, v), D.59) где звездочка означает комплексное сопряжение. Возведение в квадрат «защищает» 'высокочастотную информацию, уничтожаю- уничтожающуюся при усреднении фаз в равенстве D.58). Если в наблюдае- наблюдаемом секторе находится точечный (источник, то можно найти сред- среднюю квадр^тическую аппаратурную функцию <lHiH\~> и вы- выполнить восстановление изображения. Однако в формуле D.59)
Цифровая обработка изображений 251 теряется фазовая информация, и восстановленное изображение равно обратному преобразованию от квадратного корня из энер- энергетического спектра исходного изображения f(x, у). Другой, но весьма близкий способ обработки состоит в вычис- вычислении 'статистической автокорреляционной функции спектра 'изо- 'изображения: (u, v)F*(u + uit v + vt). D.60) Можно заметить, что при ui = Vi=0 равенства D.60) и D.59) полностью совпадают. Бели, как и прежде, имеется точечный ис- источник, то Bv)Gr(«+B1i/+»)> = F(n, v)F'-{it-\-ux, v + v,), D.61) поскольку с помощью точечного источника можно найти комплекс- комплексную автокорреляционную функцию усредненного по (времени спектра аппаратной функции. Рассмотрим результат деления обе- обеих частей равенства D.61) 'Н,а их модули: <Gj(H,t/)Gfr(«+a11 i/+w,)> |<Я,(я, v)H*(u-\- иг, v+ ^ ¦ X F(u,v)F*(u+al,v+vl) =exp \i Ф (u, v) — \F(u,v)t*{u+u1,v+vi)\ i)], D.62) где Ф — фазовая характеристика спектра ^-изображения, рас- рассматриваемая на двумерной плоскости фурье-преобразО'Вания. В правой части ааписано двумериое разностное уравнение отно- относительно фазовой характеристики, а слева фигурируют только измеренные величины. Интегрирование этого разностного урав- уравнения по всей плоскости преобразования Фурье даст фазовую ха- характеристику, а в сочетании с модулем F, полученным из равен- равенства D.61), —спектр восстановленного изображения. Моделирование [Метода Нокса — Томпсона показало, что он может значительно улучшить разрешение при наблюдениях сквозь турбулентную атмосферу. На рис. 4.18 этот процесс иллю- иллюстрируется с помощью изображения астероида, полученного мо- моделированием на ЭВМ. На рис. 4.18, а приведен1 оригинал, иа рис. 4.18,6 показаны четыре отдельных снимка с атмосферными искажениями, а на рис. 4.18, в — восстановленное изображение, причем фазовая информация была получена в соответствии с фор- формулой D.62) путем обработки 100 снимков, подобных приведен- приведенным на рис. 4.18,6.
я —исходное изображение; 6 — четыре кадра жение! восстановленное на основе 100 кадров, Рис. 4.18. полученных при моделировании атмосферных искажений исходного изображения; в - изобра- подобных приведенным на рис. 4.18, б.
Цифровая обработка изображений 253 4.5. Воспроизведение изображений по проекциям Открытие проникающей радиации (рентгеновских лучей, ней- нейтронных пучков и т. д.) дало возможность получать изображе- изображения объектов, ранее недоступных 'или доступных только с по- помощью грубых и зачастую нежелательных средств; примером та- такого объекта могут служить внутренние участии мозга. Подобные изображения имеют очень важное значение для развития меди- медицины. Усиление контроля за качеством элементов больших конст- конструкций обусловило важность таких изображений для «еразруша- ющ.их методов контроля. Однако изображения, полученные пу- путем просвечивания с пО'Мощью проникающего излучения, -имеют недостаток: они являются двумерными теневыми проекциями трехмерных объектов. Важные особенности пространственного рас- расположения внутренних частей объекта в процессе проектирования в лучшем случае искажаются, ,а >в худшем — теряются -вообще. При хирургических операциях (например, при опухолях мозга) незнание 'внутренней структуры может оказаться, очевидно, ро- роковым обстоятельством. Задаче воспроизведения внутренней структуры объекта по его проекциям в последнее время уделяется большое 'внимание, и ме-. тоды цифровой обработки сигналов оказали заметное влияние на ее решение. Предложен ряд методов воспроизведения изображе- изображения по проекциям; список литературы по этому вопросу дан в статье Мерсеро и Оппеигейма [50]. Ниже будет рассмотрена за- задача воспроизведения изображения по проекциям и дано ее ре- решение методом, характерным для цифровой обработки сигналов, а именно, с помощью преобразования Фурье. 4.5.1. Образование проекций -Изображения, получаемые с помощью проникающей радиации, образуются за счет ослабления луча в исследуемом веществе. Чем плотнее вещество, тем слабее интенсивность луча, прошед- прошедшего через вещество. Таким образом, изображение, наблюдаемое в проходящих лучах, определяется интегральным влиянием неко- некоторой характеристики вещества объекта на интенсивность луча. Пусть f(x\, x2, х3) описывает распределение вещества в прост- пространственных координатах (хи х2, х3). Допустим, -что просвечива- просвечивающий луч направлен -вдоль оси хх, как на рис. 4.19. Тогда рас- распределение интенсивности проникающего излучения в плоскости {х2, хз) пропорционально функции g, определяемой соотношением g (х2, х3)= j / (Xi, х2, х3) dxj. D.63)
254 Глава 4 Важное свойство проекций, задаваемых формулами типа D.63), можно заметить при анализе преобразования Фурье от функции 8{х2, хй): Ь (да,, w3) a, x3) exp [ — t ( *3. D.64) Трехмерное преобразование Фурье от исходного распределения имеет 1вид F(wvw2,ws) = j j j / {xv xt, x3) exp [ -i (Wlxx + ш2х2-f w^)}X X dx^Xidx^ D.65) Сравнивая G и F, видим, 'что G(w2, щ) = F(wlt w2, ws) \W^Q. D.66) Таким образом, преобразование от проекции равно .преобразова- .преобразованию Фурье от распределения вещества в объекте при Wi — Q. Та- Такую функцию называют сечением преобразования Фурье, посколь- Объект f(Xi,xz, Источник наллимированного лучпа параллельных лучей Плоспость /изображения Рис. 4.19. Геометрические соотношения при воспроизведении изображения по проекциям. ку она образуется сечением исходного трехмерного преобразова- преобразования вдоль двумерной плоскости. Очевидно, что аналогичными свойствами обладают также про- проекция меньших размерностей. Предположим, что проникающее излучение направлено в виде плоского луча (т. е. луч имеет бес- бесконечно малый размер вдоль оси х3 и перпендикулярен ей, при- причем вдоль оси х2 его интенсивность одинакова, а ширина больше размеров объекта). Луч с координатой х3 будет проектировать
Цифровая обработка изображений 255 все элементы внутреннего строения объекта, лежащего в сечении, совпадающем с плоскостью луча. Если распределение вещества в сечении с координатой х3 описывается функцией 1з{х\, Хг), то одномерная проекция двумерного сечения имеет вид Js(*i, x2)dxlt D.67) и соотношение G(afs)=/7,(a;1, oye)|w=Ot D.68) как и -прежде, описывает 'связь между преобразованиями проек- проекции и оригинала. Предположим теперь, что плоский луч проникающего излуче- излучения остается перпендикулярным оси х$, а источник излучения вращается вокруг некоторого центра, находящегося в объекте, так что угол между направлением луча и осью х\ равен не нулю, а некоторой величине 0 (см. рис. 4.20). Очевидно, можно сделать преобразование 'координат так, чтобы ось щ была параллельна* направлению проектирующего луча. Это преобразование имеет вид [иЛ_Г cos8 sinBj pq] UA L—sinB cosGj [xj ' Равенства D.67) и D.68) остаются справедливыми и в новой си- системе координат (щ, «г), что позволяет сформулировать следую- следующую теорему о проекции и сечении: одномерное преобразование Фуръе от проекции под углом 6 равно преобразованию Фурье ис- исходного двумерного распределения вещества в двумерной плоско- плоскости спектральных .переменных вдоль линии, направленной под уг- углам 10, т. е. является сечением спектра под углом 0й. С игамощью этой теоремы на основе проекций трехмерного те- тела можно воспроизвести изображение внутренней структуры тела. Бели источник плоского луча расположить в точке с координатой хь, как показано на рис. 4.20, и изменять угол в в интервале 0<6<л;, то, как показано в следующем разделе, из набора од- одномерных проекций можно воспроизвести структуру тела в сече- сечении с координатой х$. Затем координата х3 изменяется и тем же ¦> Иначе говоря, если проекция получена с помощью плоского луча, то спектр ее является функцией одной переменной и совпадает с двумерным спектром объекта, измеренным вдоль определенной прямой, проходящей в плоскости спект- спектральных переменных через начало координат. Если направление просвечивающе- просвечивающего луча совпадает с одной из осей пространственных координат, то вышеупомя- вышеупомянутая прямая перпендикулярна соответствующей оси спектральных координат. Если просвечивающий луч повернуть в плоскости пространственных координат, то линия, на которой получается спектр проекции, поворачивается в плоскости спектральных переменных вокруг начала координат в том же направлении и на тот же угол. — Прим. перев.
256 Глава 4 Объект Одномерный коллектор Источник плоского лут Рис. 4.20. Геометрические соотношения при вращении источника вокруг точки, зафиксированной в объекте, и схема получения двумерных проекций. способом получается новое сечение. Процесс продолжается до тех пор, пока не -будет получен полный набор сечений, показывающих внутреннюю структуру объекта в трех измерениях. Теоретически, конечно, можно воспроизвести структуру трех- трехмерного объекта по его двумерным проекциям без 'использования вспомогательных одномерных .проекций и 'связанных с ними сече- сечений, как описано в предыдущем абзаце. На практике, однако, вы- выгоднее .пользоваться 'методом плоских сечений, хотя и связанным с повторением одинаковых операций, но зато не требующим тако- такого огромного числа вычислений, как прямое воспроизведение трех- трехмерной структуры. Поэтому задачу воспроизведения будем в ос- основном рассматривать как задачу выделения двумерной .инфор- .информации из одномерных проекций. Ниже описываются методы циф- цифровой обработки сигналов, позволяющие воспроизвести изобра* жение. 4.5.2. Методы воспроизведения изображений Основная операция при .воспроизведении изображения по про- проекциям следует .из теоремы о проекции и сечении. Преобразова- Преобразование Фурье от проекции дает значения преобразования Фурье от исходного распределения вещества в некотором его сечении. Если получить достаточно плотный набор таких сечений, то все прост- пространство спектров будет заполнено сечениями и с помощью об- обратного преобразования Фурье можно завершить процесс воспро- воспроизведения изображения.
Цифровая обработка изображений 257 Рис. 4.21. Отсчеты в пространстве преобразований Фурье, полученные из набора проекций. Каждая точка представляет значение F(wt, w2), полученное вычислением ДПФ проекции g(u) под углом 9. Эта операция достаточно просто описывается, но для фактиче- фактического ее выполнения необходимы весьма сложные и трудоемкие исследования. При воспроизведении изображения на основе сече- сечений спектра важными являются следующие положения: 1. При вращении источника плоского луча для каждого из уг- углов 6 получается своя проекция. Число проекций, необходимых для достаточно полного заполнения пространства преобразований Фурье, очевидно, зависит от формы преобразования Фурье вос- воспроизводимого распределения. Однако чем меньше шаг по углу, тем плотнее заполняется пространство спектров (см. рис. 4.21). На практике число проекций ограничивается двумя факторами: 1) увеличением объема вычислений, связанным с обработкой до- дополнительных проекций; 2) увеличением дозы облучения при по- получении дополнительных проекций (что очень важно в медицин- медицинских приложениях метода). 2. Сечения спектрального пространства образуют равномерную сетку в той системе координат, где на одной из осей откладыва- откладывается угол поворота 0. Однако размещение отсчетов спектра в каж- каждом из сечений не согласуется с обычными двумерными преобра- преобразованиями. Двумерное ДПФ вычисляется на прямоугольной сетке отсчетов, образующих строки и столбцы, а точки, в которых изве- известны ДПФ сечений, образуют полярный растр, показанный на рис. 4.21. Поэтому необходимо с помощью интерполяции перейти к прямоугольному растру, что несложно с точки зрения теории,
258' Глава 4 но нетривиально на практике, поскольку каждый отсчет, находя- находящийся на концентрической полярной сетке, перед интерполяцией необходимо перевести в соответствующую прямоугольную систему координат. Такое преобразование двумерных координат и интер- интерполяцию можно несколько упростить, пользуясь методом так на- называемого концентрично-прямоугольного растра, но зато при этом интервалы дискретизации будут не одинаковыми [50]. 3. Как видно из рис. 4.21, двумерное пространство преобразо- преобразований Фурье очень плотно заполняется в области низких частот,, а высокие частоты представлены гораздо реже. Поэтому для вос- воспроизведения крупноструктурных элементов, описываемых низко- низкочастотным спектром, требуется небольшое число проекций, напри- например 25—30. Для достаточно четкого представления высокочастот- высокочастотных составляющих необходимо большое число проекций A00 и более). Если число проекций ограничено, то¦ можно воспользо- воспользоваться имеющимися проекциями и более плотно заполнить про- пространство спектров путем интерполяции. Это несколько улучшает результаты воспроизведения, но возможности данного метода ог- ограничены, поскольку результаты интерполяции могут не соответ- соответствовать реальным значениям спектров. Качество и детали изо- изображения определяются именно теми спектральными составляю- составляющими, которые нельзя предсказать путем интерполяции. Другой метод воспроизведения изображений, в котором при- применяется цифровая обработка сигналов, называется методом свертки или «размазывания». Для пояснения метода рассмотрим две взаимно перпендикулярные проекции. Если каждую из проек- проекций «размазать» (т. е. образовать двумерную функцию, не изме- изменяющуюся по одной оси и совпадающую с исходной одномерной проекцией по второй оси) и значения обеих функций сложить как ортогональные векторы, то получится очень грубая аппроксима- аппроксимация исходного объекта. Читатель может проверить это, взяв для примера квадрат и построив проекции в направлениях, перпенди- перпендикулярных его сторонам. В общем представляется возможным по- получить изображение «размазывая» проекции (это можно сделать путем свертки с подходящей функцией) и образуя сумму после соответствующего взвешивания отдельных слагаемых. Такой метод можно реализовать с помощью цифровой обработки, а также оп- оптическими средствами. Однако данный метод крайне чувствите- чувствителен к помехам, поскольку операции свертки и взвешивания влия- влияют на обрабатываемые сигналы примерно так же, как дифферен- дифференцирование. Как образец результатов, получаемых при воспроизведении изображений цифровыми методами, на рис. 4.22 показано сечение человеческого мозга, полученное с помощью серийного рентгенов- рентгеновского аппарата для воспроизведения изображений внутреннего строения головы,
Цифровая обработка изображений 259 Рис. 4.22. Изображение сечения мозга, полученное на сканирующем рентгено- графе. Этот краткий обзор не исчерпывает всех вопросов, связанных с воспроизведением изображений на основе проекций. С другими методами можно познакомиться по работам, указанным в списке литературы, составленном Мерсеро и Опеенгеймом [50]. 4.6. Повышение качества изображений Цель процесса повышения качества изображения состоит в том, чтобы снимок «выглядел лучше». Неудивительно поэтому, что если цель намечена так туманно, то и методы, применяемые для повышения качества изображений, оказываются весьма разнооб- разнообразными. Субъективные суждения о том, что изображение «выг- «выглядит лучше», связаны также с критериями, зависящими от пред- предназначения изображения (изображение должно «выглядеть луч- лучше» применительно к определенной задаче). Если использование изображения связано с точным анализом или количественными измерениями, то радикальные операции, приводящие к значитель- значительному изменению пространственных или яркостных соотношений в изображении, могут оказаться неприемлемыми. С другой стороны, если изображение применяется только для субъективных целей, то допустимы операции, существенно изменяющие пространствен- пространственные или яркостные соотношения или же и те и другие, но в целом 17'
260 Глава 4 улучшающие субъективное восприятие изображения. Следователь- Следовательно, для повышения качества изображения можно применять ши- широкий круг методов; пригодность каждого из них зависит от це- целей повышения качества данного изображения. 4.6.1. Повышение качества изображения путем пространственно-частотной фильтрации Для улучшения изображений часто используется пространст- пространственно-частотная фильтрация. Если даже снимок не имеет явных дефектов, можно применить фильтр с небольшим подъемом ха- характеристики на верхних частотах, и снимок будет выглядеть бо- более резким. Столь же полезна режекция постоянной составляю- составляющей, когда подавляются или ослабляются некоторые (или все) составляющие, расположенные вблизи нулевой частоты. В резуль- результате снижается насыщенность больших черных и белых пятен, а изменение масштабов яркости улучшает различимость мелких де- деталей. На рис. 4.23, а я б приведен пример повышения качества рентгенограммы тепловыделяющего элемента ядерного реактора с помощью пространственно-частотной фильтрации. На улучшен- улучшенном снимке стало заметно гораздо больше деталей, а также видны ядерное топливо и оболочка элемента. Особенно интересный метод повышения качества основан на мультипликативной модели формирования изображения в сочета- сочетании с гомоморфной фильтрацией [19]. Согласно законам'поверх- законам'поверхностного отражения, изображение образуется из двух компонент: i(x,y)=ir(x,y)r(x,y), D.69) где V — распределение освещающего пучка, а г — коэффициент от- отражения освещаемого объекта. Как правило, освещающая ком- компонента образуется из низкочастотных пространственных состав- составляющих, для которых коэффициент отражения приближается к зеркальному и богат деталями. Если прологарифмировать выра- выражение D.69): log / (х, у) = log /' (х, у) + log r (х, у), D.70) то связь между коэффициентом отражения, освещением и изобра- изображением будет выражаться не произведением, а суммой. При фильтрации логарифма изображения режекторным фильтром, на- настроенным на нулевую частоту, освещающая компонента будет подавлена, а связанный с этим подъем высоких частот улучшит различимость мелкомасштабных элементов. При потенцировании сигнал возвращается в пространство яркостей и образуется изоб- изображение, не содержащее отрицательных яркостей. Заметим также, что логарифмирование обусловливает фильтрацию в пространстве плотностей пленки; это является еще одним доводом, дополняю- дополняющим соображения о предпочтительности обработки в пространст-
Цифровая обработка изображен. ий 261 * — исходное изображение; б — тот же Рис. 4.23. Частот' улучшеиный пУтем Фильтрации верхних о восстановлении изображений^' ВЫСКазанНЫе Ранее в На рис. 4.24, а, б приведен пример повышения качества изо- оражения методом гомоморфной обработки. Заметим, что изобпа- жение стало более резким и на нем лучше различаются предмет ты, расположенные в тени под крышей
Глава 4 Рис. 4.24. а - исходное изображение; б - тот же снимок, улучшенный с помощью гомоморфной обра- обработки. * 4,6.2. Повышение качества изображений с помощью точечных операций Метод повышения качества изображений, основанный на про- пространственно-частотной фильтрации, можно противопоставить дру- другим методам, в которых воздействие не распространяется на неко- некоторую область (как для свертки), а все операции являются то- точечными отображениями. Это значит, что точки корректируемого изображения преобразуются в точки нового изображения незави- независимо друг от друга. Точечные операции можно сгруппировать сле- следующим образом. Преобразования контрастности. Улучшение изображения про- происходит за счет изменения его контрастности, что достигается не- нелинейным преобразованием яркостей. Если, например, корректи- корректируемое изображение содержит участки, недодержанные при съем-
Цифровая обработка изображений 263 ЗУ с возобновлением информации (оиск) Г ЗУ корректирующих З Селектор ЗУ лсевдоцвета (ПЗУ) ке, то можно воспользоваться преобразованием, «растягиваю- «растягивающим» область малых яркостей и переводящим ее в интервал яркостей, более удобный для зрения. Наглядными примерами, в которых требуется подобное преобразование, служат операции коррекции неправильно экспонирован- экспонированных пленок, а также линеаризации характеристик устройств демонстра- демонстрации изображения, рассмотренные в первом разделе. Улучшение на основе статистичес- статистических данных. Выбор закона преоб- преобразования контрастности можно час- частично автоматизировать, воспользо- воспользовавшись для подбора его параметров статистическими характеристиками изображения (например, средним зна- значением или дисперсией яркости). Пре- Предельным случаем является метод вы- выравнивания гистограмм. В теории ин- информации показано, что равномерная гистограмма соответствует сообще- сообщению с максимальной информацией. Поэтому, если гистограмма квантован- квантованного изображения (дающая число от- отсчетов, попадющих на каждый из уровней квантования) после преобра- преобразования контраста становится равно- равномерной (т. е. все уровни квантования Проявляются с равной вероятностью), То изображение должно содержать максимальное количество информа- информации. Данный метод обычно дает наи- наилучшие результаты при квантовании йркостных изображений, гистограммы которых, как правило, отличаются наибольшей неравномерностью [13]. Рис. 4.25. Блок-схема устрой- В результате можно довольно просто ства отображения, обеспечи- получить значительное улучшение вающего поточечное улучшение изображения [511. изображений с непосредствен- г? ' J , ч ным участием оператора. Оконтуривание (препарирование) изображений. При использовании всех рассмотренных методов решается задача повышения качества Изображения без существенного его изменения. Если же цель обработки состоит в том, чтобы облегчить восприятие определен- определенной информации, то очень часто применяют методы оконтури- Ьания, когда возможно заметное искажение яркостных и (или) Пространственных соотношений. Наиболее распространенным Селектор ЦАП Высококачественное цветное устройство ¦ отображения
264 Глава 4 является метод псевдоцвета, в котором различным яркостям про- произвольно сопоставляются разные цвета. Демонстрируемое изобра- изображение будет содержать отчетливые контуры, проходящие по гра- границам цветных полос. В результате может либо произойти четкое выделение важных деталей, либо получится обманчивое смешение пятен, скрывающее изображение, либо может образоваться за- забавная цветная картинка, ничего не выделяющая и ничего не скрывающая. В другом методе производится оконтуривание гра- границами черного и белого цвета путем уменьшения числа уровней квантования (обычно до 10 и менее). Отбрасывание от одного до трех старших разрядов также создает контуры, причем картина, получаемая при выделении деталей таким образом, может ока- оказаться очень живописной. Весьма -интересными применительно к точечным операциям по- повышения качества изображений являются последние образцы цифровых устройств отображения информации (рис. 4.25), позво- позволяющие оперативно корректировать изображение. С помощью быстродействующих постоянных запоминающих устройств (ПЗУ) удается изменять яркости точек изображения при передаче их из ЗУ на электронно-лучевую трубку. Исходное же изображение, за- записанное на диске, при этом остается неизменным. Таким образом, загрузив в ПЗУ различные функции, описывающие закон измене- изменения яркостей, можно очень быстро переходить от одного способа преобразования яркости к другому. Нужно видеть такое устрой- устройство, чтобы полностью оценить его гибкость в улучшении конт- контрастности, коррекции ошибок экспонирования, подстановке псев- псевдоцвета и т. д. Подобные цифровые устройства отображения прев- превращают точечные операции в эффективное и удобное средство улучшения изображений, обеспечивающее возможность взаимо- взаимодействия человека с,машиной. Автор хотел бы выразить признательность д-ру Томасу Г. Сток- хэму мл., который внимательно прочитал рукопись и сделал за- замечания. Автор также глубоко благодарен всем, кто оказал лю- любезность, предоставив приведенные выше снимки: д-ру Вильяму К. Пратту из Университета штата Южная Каролина (рис. 4.9 и 4.10 в разделе о сокращении избыточности изображений), д-ру Т. М. Кэннону из Лос-Аламосской научной лаборатории (рис. 4.16, а, б я 4.22), д-ру Т. Г. Стокхэму (мл.) и д-ру Б. Бэкстеру из Уни- Университета шт. Юта (рис. 4.23,а, б), а также д-ру Е. Баррету из фирмы ЕСЛ (рис. 4.18,а—в). ЛИТЕРАТУРА 1. Goodman J. W., An Introduction to Fourier Optics, McGraw-Hill, New York, 1968. [Имеется перевод: Гудмен Дж. Введение в фурье-оптику. — М.: Мир, 1970.] 2. Andrews Н. С, Hunt В. R., Digital Image Restoration, Prentice-Hal!, Engle- wood Cliffs, N. J., 1977.
Цифровая обработка изображений 265 3. Mees С. Е. К-, The Theory of the Photographic Process, Macmillan, New York, 1954. 4. American Institute of Physics Handbook, McGraw-Hill, New York, 1972. 5. Biberman L. M, Nudelman S., Photoelectronic Imaging Devices, 1, 2, Plenum, New York, 1971. 6. Glasford G. M., Fundamentals of Television Engineering, McGraw-Hill, New York, 1955. 7. Mandel L., Fluctuations of Photon Beams: The Distribution of the Photoele- ctrons, Proc. Phys. Soc, London, 74, 233—243 A959). 8. Huang T. S., Some Notes on Film-Grain-Noise, Appendix 14, Restoration of Atmospherically Degraded Images, NSF Summer Study Report, Woods Hole, Mass., 1966, pp. 105—109. 9. Falconer D. G., Image Enhancement and Film-Grain-Noise, Opt. Ada, 17, 693— 705 A970). 10. Walkup J. F., Choens R. C, Image Processing in Signal Dependent Noise, Opt. Eng., 13, 258—266 A974). 11. Oppenheim A. V., Schafer R. W., Digital Signal Processing, Prentice-Hall, Englewood Cliffs, N. J., 1975. [Имеется перевод: Оппенхейм А., Шафер Р. Цифровая обработка сигналов. — М.: Связь, 1980.] 12. Hunt В. R., Breedlove J. R., Sample and Display Considerations in Processing Images by Digital Computer, IEEE Trans. Computers, 24, 848—853 A975). 13. Stockham T. G., Jr., Image Processing in the Context of a Visual Model, Proc. IEEE, 60, 828—842 A972). [Имеется перевод: Стокхэм Т., мл. Обработка изображений в контексте моделей зрения. — ТИИЭР, 1972, т. 60, № 7, с. 93— 108.] 14. Hurvitch L. M., Jameson D., The Perception of Brightness and Darkness, Allyn and Bacon, Boston, 1966. 15. Cornsweet T. N., Visual Perception, Academic Press, New York, 1970. 16. Baudelaine P. C, Digital Picture Processing and Psychophysics: A Study of Brightness Perception, Ph. D. Dissertation, University of Utah, Department of Computer Science, Salt Lake City Utah, 1973. 17. Mannos J., Sakrison D. L, The Effects of a Visual Fidelity Criterion on the Encoding of Images, IEEE Trans. Inform. Theory, 20, 525—536 A974). 18. Baxter В., Image Processing in the Human Visual System, Ph. D. Disserta- Dissertation, University of Utah, Department of Computer Science, Salt Lake City, Utah, 1976. 19. Oppenheim A. V., Schafer R. W., Stockham T. G., Jr., Nonlinear Filtering of Multiplied and Convolved Signals, Proc. IEEE, 56, 1264—1291 A968). [Имеет- [Имеется перевод: Оппенгейм А. В., Шефер Р., Стокхэм Т., мл. Нелинейная фильтра- фильтрация сигналов, представленных в виде произведения и сверки. — ТИИЭР, 1975» ¦ т. 56, № 8, с. 5—34.] 20. Habibi A., Robinson G., A Survey of Digital Picture Coding, Computer, 7, 22—35 (May 1974). 21. Cole E. R., The Removal of Unknown Image Blurs by Homomorphic Filtering, Ph. D. Dissertation, University of Utah, Department of Computer Science, Salt Lake City, Utah, 1973. 22. Habibi A., Comparison of nth Order DPCM Encoder with Linear Transforma- Transformations and Block Quantization Techniques, IEEE Trans. Commun. TechnoL, 19, 948-956 A971). 23. Stockham T. G., Jr., Intra-frame Encoding for Monochrome Images by Means of a Psychophysical Model Based on Nonlinear Filtering of Signals, Proc. 1969 Symp. on Picture Bandwidth Reduction, Gordon and Breach, New York, 1972. 24. Berger Т., Rate Distortion Theory, Prentice-Hall, Englewood Cliffs, N. J., 1971. 25. Makhoul J., Linear Prediction: A Review, Proc. IEEE, 63, 561—580 A975). ' [Имеется перевод: Макхол. Линейное предсказание. Обзор. —ТИИЭР, 1975, т. 63, № 4, с. 20—45.]
2S6 Глава 4 ,26. Мах Т., Quantizing for Minimum Distortion, IRE Jrans. Inform. Theory, 16, 7—12 A970). 27. Schafer R. W., Rabiner L. R., Digital Representations of Speech Signals, Proc. IEEE, 63, 662—677 A975). [Имеется перевод: Шефер, Рабинер. Цифровое представление речевых сигналов. — ТИИЭР, 1975, т. 63, № 4, с. 141—160.] 28. Pratt W. К., Digital Image Processing, Wiley, New York, 1977. 29. Fukunaga K., Introduction to Statistical Pattern Recognition, Academic Press, New York, 1972. 30. Wintz P. A., Transform Picture Coding, Proc. IEEE, 60, 809—820 A972). [Имеется перевод: Уинтц П. А. Кодирование изображений посредством пре- преобразований. — ТИИЭР, 1972, т. 60, № 7, с. 69—84.] 31. Andrews H. С, Computer Techniques in Image Processing, Academic Press, New York, 1968. [Имеется перевод: Зндрюс Г. Применение вычислительных машин для обработки изображений. — М.: Энергия, 1977.] 32. Pratt W. К., Andrews Н. С, Transform Image Coding, USC Report 387, Uni- University of Southern California, Department of Electrical Engineering, Los An- Angeles, 1970. 33. Chen W., Slant Transform Image Coding, USC Report 441, University of Southern California, Department of Electrical Engineering, Los Angeles, 1973. 34. Ahmed N., Natarayan Т., Rao K. R-, Discrete, Cosine Transform, IEEE Trans. Computers, 23, 90—93 A974). 35. Haralick R., Shanmugam K-, Comparative Study of a Discrete Linear Basis for Image Data Compression, IEEE Trans. System Man Cybernetics, 4, 16—28 A974). 36. Pratt W. K., Spatial Transform Coding of Color Images, IEEE Trans. Com- mun. Technol., 19, 980—992 A971). 37. Tescher A. G., The Role of Phase in Adaptive Image Coding, USC Report 510, University of Southern California, Department of Electrical Engineering, Los Angeles, 1973. 38. Hunt B. R., A Theorem on the Difficulty of Numerical Deconvolution, IEEE Trans. Audio Speech Signal Processing, 20, 94—95 A972). 39. Hunt B. R., The Application of Constrained Least-Squares Estimation to Image Restoration by Digital Computer, IEEE Trans. Computers, C-22, 805—812 A973). 40. Hunt B. R., Digital Image Processing, Proc. IEEE, 63, 693—708 A975). [Имеется перевод: Хант. Цифровая обработка изображений. — ТИИЭР, 1975, т. 63, № 4, с. 177—195.] 41. Hellstrom С. W., Image Restoration by the Method of Least Squares, I. Opt. Soc. Amer., 57, 297—303 A967). 42. Cannon Т. М., Digital Image Deblurring by Nonlinear Homomorphic Filtering, Ph. D. Dissertation, University of Utah, Department of Computer Science, Salt Lake City, Utah, 1974. 43. Frieden B. R., Restoring with Maximum Likelihood, University of Arizona, Opti- Optical Sciences Center Tech. Rept. No. 67, Tucson, Ariz., 1971. 44. Hunt B. R., Bayesian Methods of Nonlinear Digital Image Restoration, IEEE Trans. Computers, C-26, 219—229 A977). 45. Macadam D. P., Digital Image Restoration by Constrained Deconvolution, /. Opt. Soc. Amer., 59, 748—752 A969). 46. Sawchuk A. A., Space-variant Image Motion Degradation and Restoration, Proc. IEEE, 60, 854—961 A972). [Имеется перевод: Савчук. Пространственно- зависимые искажения изображений, вызванные движением, и реставрация изображений. —ТИИЭР, 1972, т. 60, № 7, с. 124—134.] 47. Robbins G. М., Huang Т. Е., Inverse Filtering for Linear Shift-variant Imaging Systems, Proc. IEEE, 60, 862—871 A972). [Имеется перевод: Роббннс Дж. М., Хуанг Т. С. Принципы обратной фильтрации для линейных пространственно- зависимых систем отображения,-—ТИИЭР, 1972, т. 60, № 7, с. 134—145.] 48. Horner J. L., Optical Restoration of Images Blurred by Atmospheric Turbulen- Turbulence Using Optimal Filter Theory, Appl. Opt., 9, 167—171 A970).
Цифровая обработка изображений 267 49 Кпох К., Diffraction-limited Imaging with Astronomical Telescopes, Proc. In- ' tern. Opt. Computing Conf., IEEE/SPIE, Washington, D. C, April 1975, 94—97. 50 Mersereau R. M., Oppenheim A. V., Digital Reconstruction of Multidimensional Signals from Their Projections, Proc. IEEE, 62, 1319—1338 A974). 51 Andrews H. C, Tescher A. G., Kruger R. P., Image Processing by Digital Com- ' puter, IEEE Spectrum, 9, 20—32 (July 1972). 52. Comtal Corp., Product Information Literature, Series 5000 Display System, Pasadena, Calif., 1974.
Глава 5 ПРИМЕНЕНИЯ ЦИФРОВОЙ ОБРАБОТКИ СИГНАЛОВ В РАДИОЛОКАЦИИ Дж. X. Макклелан, Р, Дж. Пурди " 5.1. Введение За несколько последних десятилетий радиолокация преврати- превратилась в самостоятельное и развитое техническое направление. По- Поэтому довольно неожиданной оказалась наблюдавшаяся в послед- последние годы значительная активность в создании новых радиолока- радиолокационных систем и модернизации существующего оборудования, В немалой степени это связано с широким внедрением в радио- радиолокационные системы быстродействующей цифровой техники, что вызвано рядом причин. Во-первых, цифровая техника оказалась весьма универсальной — используя ограниченный набор микросхем, можно реализовать множество различных функций. Во-вторых, с еа помощью оказалось возможным достичь очень высоких точно- точностей радиолокационных станций путем простого увеличения раз- разрядности чисел. В-третьих, быстродействие современных цифровых микросхем способно удовлетворить жестким требованиям, предъ- предъявляемым к ним радиолокационными системами. Наконец, в-чет- в-четвертых, цифровые системы становятся экономически все более выгодными. В настоящей главе сначала приводятся общие сведе- сведения об устройствах обработки! радиолокационных сигналов, а за- затем рассматриваются некоторые современные специализирован- специализированные цифровые системы. Общая структурная схема большой радиолокационной системы представлена* на рис. 5.1. Она включает систему обработки дан- данных (СОД), обеспечивающую управление радиолокационной си- системой в целом и принятие решения, устройство управления, пред- предназначенное для декодирования команд и общей синхронизации работы радиолокатора, генератор сигналов, антенны для излуче- излучения и приема радиосигналов, а также устройство, обработки сиг- Балов, в котором производится согласованная фильтрация приня- принятых сигналов, вычисляются все необходимые характеристики цели и, как правило, уменьшаются объем данных и скорость их поступ- поступления до величин, приемлемых для СОД. •' J. H. McClellan, Massachusetts Institute oi Technology, Cambridge, Mass 02139; R. J. Purdy, M. I. T. Lincoln Laboratory, Lexington, Mass. 02173.
fl 1 1 1 .1 * 1 1 1 'енератор сигналов АЦП Устройство управления 1 1 Согласован- Согласованный а?ильтр Обнаружитель Устройство вторичной обработки Устройство обработки сигналов Сист обработки Рис. 5.1. Блок-схема современной большой радиолокационной системы.
270 Глава 5 В первых радиолокаторах все устройства строились только на базе аналоговой аппаратуры (функции СОД выполнял оператор индикатора). Однако по мере увеличения размеров и усложнения радиолокационных систем возникла необходимость ввести в их состав большую универсальную вычислительную машину, осуще- осуществляющую общее управление и контроль. Таким образом, на не- некотором этапе обработки сигналов в радиолокационной системе аналоговую информацию пришлось преобразовать в цифровую. Гибкость и универсальность цифровой техники в первую очередь позволили применить ее на завершающих этапах обработки, где необходимость в быстродействии наименее ощутима, поскольку операции по сокращению объема данных в основном выполняют- выполняются на предыдущих этапах. Однако в дальнейшем по мере услож- усложнения как самих радиолокационных сигналов, так и методов их обработки необходимость в универсальности, присущей цифровой технике, стала все сильнее ощущаться на всех этапах обработки сигналов. В то же время в радиолокаторах начали использовать- использоваться более широкоплосные сигналы, что существенно усложнило уст- устройства обработки сигналов, которые должны были обладать и высоким быстродействием, и достаточной универсальностью. Од- Однако с появлением высокоскоростных и постоянно удешевляю- удешевляющихся цифровых микросхем становится вполне реальным созда- создание устройств обработки сигналов, полностью удовлетворяющих обоим требованиям на всех этапах обработки. Таким образом, в современной радиолокационной системе аналого-цифровое преоб- преобразование выполняется между приемником и устройством обра- обработки сигналов. 5.1.1. Краткая историческая справка Физический принцип, на котором основана работа радиолока- ционной системы, впервые был продемонстрирован Герцем в 80-х годах прошлого века. В своих экспериментах он показал, что элек- электромагнитные волны отражаются от металлических предметов точно так же, как свет отражается от зеркал. Однако, несмотря на то что первое практическое устройство, предназначенное для предотвращения столкновений судов, было продемонстрировано и запатентовано немецким инженером Кристианом Халсмейером еще в 1904 г., к созданию действующих радиолокационных устано- установок по-настоящему приступили лишь в 30-х годах, когда для во- военных целей стало особенно важным обнаружение самолетов в условиях ограниченной видимости. Работы велись в Германии, Франции, Великобритании и США, причем наибольшую извест- известность приобрели английские разработки. Цепочка расположенных вдоль английского побережья Ла-Манша радиолокационных стан- станций обнаружения, работавших в режиме непрерывного излучения, идею которых предложил Роберт Уотсон — Уатт в 1935 г., исполь-
Применение ЦОС в радиолокации 271 зовалась для обеспечения обороны Британских островов во время воздушных налетов в 1940 г.1' Развернувшиеся во время войны ро многих странах интенсивные исследования привели к созданию новой микроволновой техники и новых методов обработки сигна- сигналов. В 50-х годах появились более сложные радиолокационные сис- системы. Примером может служить система SAGE (полуавтоматиче- (полуавтоматическая наземная система ПВО США), в которой впервые в качест- качестве электронного «мозга» радиолокационной системы были исполь- использованы большие универсальные вычислительные машины, заменившие человека. Необходимость такого усложнения была обус- обусловлена высокими тактико-техническими характеристиками само- самолетов и ракет, поскольку человек-оператор в отличие от заменив- заменившей его машины был не в состоянии достаточно быстро и точно реагировать на изменяющуюся обстановку. В 50-е годы методы обработки сигналов в радиолокационных ¦системах были усовершенствованы. Так, фирмой Bell Laboratories была разработана методика сжатия импульсов [22], позволившая за счет увеличения продолжительности излучаемого импульса обеспечить большую энергию сигнала, а за счет укорочения им- импульса после сжатия получить высокую разрешающую способ- способность радиолокатора по дальности. Исследование функции неоп- неопределенности, проведенное Вудвордом, раскрыло сущность общей проблемы выбора радиолокационного сигнала и стимулировало большое количество работ в этой области. В последние годы радиолокация нашла применение в много- многочисленных системах военного назначения, а также в таких обла- областях, как управление полетами самолетов, морская навигация, метеослужба и служба контроля скорости движения на автостра- автострадах. 5.1.2. Состав радиолокационной системы Во всех радиолокационных системах параметры цели (в том числе ее координаты) измеряются посредством облучения цели электромагнитной энергией и последующей обработки отражен- отраженного от цели радиосигнала. В общем случае для получения сведе- сведений об облучаемой цели необходимо, чтобы излучаемый сигнал имел «структуру», поэтому выбор вида сигнала и способа его об- обработки может оказаться достаточно сложной проблемой. Так, например, несложно измерить либо расстояние до цели, либо ее скорость, но одновременно измерить обе эти величины непросто. 11 В СССР первые успешные опыты по радиолокационному обнаружению са- самолетов в режиме непрерывного излучения были проведены в 19'34 г., а дейст- действующий макет импульсного радиолокатора создан в лаборатории Ю. Б. Кобзаре- ¦ ва в Ленинградском электрофизическом';институте в- 1957 г.^Прим. nepeei
272 Глава 5 Более того, для детального исследования формы цели может по- потребоваться весьма сложная обработка. В состав большой современной радиолокационной системы, представленной на рис. 5.1, входит много подсистем. К ним отно- относятся генератор сигналов (он может быть цифровым), модулятор, в котором сигнал преобразуется в радиосигнал соответствующей частоты и усиливается, антенна для излучения высокочастотной энергии в направлении цели, антенна для приема радиосигнала, отраженного от цели, демодулятор, служащий для преобразования принятого сигнала к основной полосе1' радиолокатора, устройство обработки сигналов, предназначенное для фильтрации сигнала и выполнения над ним необходимых операций, а также большая универсальная вычислительная машина (СОД), с помощью кото- которой координируется работа всех составных частей радиолокацион- радиолокационной системы. Команды, вырабатываемые в СОД, определяют выбор вида ко- колебания, синтезируемого генератором сигналов, положения ан- антенны радиолокатора и алгоритма, используемого при обработке сигналов. Данные с выхода устройства обработки сигналов вво- вводятся в СОД, где над ними выполняются операции в соответствии с принятыми алгоритмами (например, калмановская фильтрация при сопровождении цели, распределение ресурсов системы или планирование работы радиолокатора). Выполнение этой обработ- обработки в СОД особенно важно с точки зрения решения основной зада- задачи радиолокационной системы — принятия решений относительно наблюдаемых целей. Круг всех этих вопросов достаточно широк, но ниже они рассматриваться не будут, поскольку непосредствен- непосредственно не связаны с устройством обработки сигналов. Существенное отношение к обработке сигналов имеет генера- генератор сигналов, так как в нем формируются как излучаемое колеба- колебание, так и эталонные, используемые в устройстве обработки. Ниже в данной главе будет рассмотрена структура генератора сигналов, полностью построенного на элементах цифровой техники. И в этом случае цифровая техника обеспечивает радиолокатору необходи- необходимую универсальность, так как в зависимости от условий наблюде- наблюдения за целью могут потребоваться самые разнообразные сигналы. 5.1.3. Операции обработки сигналов Б общем случае можно выделить три основные операции, вы- выполняемые при обработке сигналов в современном радиолокаторе: 1) сжатие сигнала (согласованная фильтрация); 2) уменьшение скорости поступления данных (пороговый анализ); 3) формирова- формирование метрики цели (оценка углового положения, дальности и ско- скорости цели). ]> Основная полоса размещается у нулевой частоты, — Прим. перев.
Применение ЦОС в радиолокации 273 Если обработка радиолокационных сигналов производится в цифровой форме, то для подключения устройства обработки обя- обязательно должны быть использованы предварительный аналого- аналоговый фильтр и аналого-цифровой преобразователь. Блок-схема уст- устройства цифровой обработки сигналов дана на рис. 5.1. Необходи- Необходимо подчеркнуть, что в конечном счете устройство обработки обес- обеспечивает сжатие полосы. Оно принимает данные, следующие с большой информационной скоростью (полоса радиолокационных сигналов может составлять 10—100 МГц), и обрабатывает их та- таким образом, что скорость выдачи данных в СОД оказывается сравнительно низкой. Но эти данные весьма информативны, так как содержат только существенные характеристики целей. 5.2. Параметры, измеряемые радиолокатором Рассмотрим более детально параметры цели, которые могут быть измерены с помощью радиолокатора. К ним относятся угло- угловое положение цели (азимут и угол места), дальность, скорость и отражательная способность (эффективная площадь рассеяния ЭПР). Чтобы измерить любой из этих параметров, необходимо об- облучить цель радиосигналом с достаточной энергией, при которой" интенсивность отраженного сигнала превышала бы некоторый ми- минимальный уровень, когда еще возможно проведение обработки. Взаимосвязь между мощностями излучаемого (Рт) и принимаемо- принимаемого (Ря) сигналов, дальностью до цели (R), усилением антенны и уровнем потерь в тракте радиолокатора описывается основным1 уравнением радиолокации, которое имеет много различных форм, но чаще всего записывается следующим образом: где коэффициент пропорциональности К учитывает усиление обе- обеих антенн, ЭПР цели и т. п. Мощность принимаемого сигнала об- обратно пропорциональна четвертой степени расстояния до цели, по- поэтому, чтобы удвоить дальность действия радиолокатора, необхо- необходимо увеличить излучаемую мощность в 16 раз. Именно эта силь- сильная зависимость излучаемой мощности от дальности заставила обратиться к разработке методики сжатия импульсов с примене- применением согласованной фильтрации. 5.2.1. Угловое положение Самый простой способ нахождения углового положения связан с применением антенны с очень узкой диаграммой направленно- направленности (ДН). Ширина ДН прямо пропорциональна длине волны Я.
274 -n: . ¦¦ Глава 5 излучаемого колебания и обратно пропорциональна линейному размеру антенны, т. е. Ширина ДН ~ -j-. E.2) Следовательно, хорошее угловое разрешение можно получить, ис- используя либо радиолокатор с высокой несущей частотой, либо большую антенну. В более сложных системах для улучшения уг- углового разрешения используются специальные методы обработки сигналов (примером могут служить рассматриваемые ниже радио- радиолокаторы с синтезированием апертуры). 5.2.2. Дальность В радиолокаторе измерение дальности сводится к измерению временного интервала. Пусть в момент ? = 0 излучается бесконечно короткий импульс. Если цель находится на расстоянии R, то эхо- сигнал будет принят в момент t=T, соответствующий времени рас- распространения импульса до цели и обратно, т. е. Т= — , E.3) с где с — скорость света. Разрешающая способность радиолокатора по дальности Rr пропорциональна разрешению по времени, кото- которое для монохроматического импульса равно его длительности й: ^ = ~. E.4) Если облучаются две цели, то должен быть взят более корот- короткий излучаемый импульс для того, чтобы обеспечить разделение отражений от каждой из целей. Однако укорочение импульса мо- может оказаться серьезной проблемой, если передатчик радиолока- радиолокатора имеет ограниченную пиковую мощность, поскольку энергия излучаемого импульса пропорциональна его длительности. В ре- результате при использовании простого монохроматического импуль- импульса увеличение разрешающей способности радиолокационной стан- станции по дальности будет сопровождаться уменьшением дальности ее действия. Одним из достижений теории обработки сигналов является принцип сжатия импульсов, который заключается в следующем. Для обеспечения разрешения радиолокационной станции по даль- дальности используются широкоплосные сигналы большой длительно- длительности, например импульсы с линейной частотной модуляцией (ЛЧМ- импульсы). Большая длительность сигнала позволяет лзлучить энергию, достаточную для работы радиолокатора на больших дальностях, а за счет широкой полосы сигнала обеспечивается вы- высокое .разрешение по дальности, так как при согласованной фильт-
Применение ЦОС в радиолокации 275 рации оно обратно пропорционально полосе сигнала. Вопросы построения цифровых согласованных фильтров, в которых для вы- вычисления высокоскоростной свертки используется алгоритм быст- быстрого преобразования Фурье (БПФ), и составляют наиболее суще- существенную часть остального материала настоящей главы. 5.2.3. Скорость Для определения скорости цели измеряется смещение частоты отраженного сигнала относительно частоты излучения. Если излу- излучаемый узкополосный сигнал имеет центральную частоту f0, а от- отражающий обьект движется с постоянной скоростью, радиальная составляющая которой равна о, то принимаемый эхо-сигнал будет смещен по частоте на величину^ пропорциональную /о. Смещение частоты /о, называемое доплеровским, рассчитывается по сле- следующей формуле: ^=*L. E.5) Для измерения доплеровского смещения можно использовать спектральный анализ, причем разрешение радиолокационной стан- станции по скорости будет определяться тем минимальным частотным смещением двух сигналов относительно друг друга, при котором их еще можно различить. Так как ширина полосы монохромати- монохроматического сигнала уменьшается при увеличении его длительности,. то разрешение по скорости пропорционально длительности излуча- излучаемого сигнала. Более подробно этот вопрос будет рассмотрен при анализе функции неопределенности. В заключение отметим, что- увеличение разрешения радиолокатора по скорости может быть достигнуто соответствующим увеличением несущей частоты /о. (или, что то же самое, уменьшением длины волны X). Эффектив- Эффективность применения цифровых методов обработки сигналов при оп- определении углового положения, дальности и скорости цели станет понятной несколько позже, после рассмотрения общей теории об- обработки сигналов (она изложена в разд. 5.4) и некоторых конкрет- конкретных радиолокационных систем. 5.3. Импульсные радиолокаторы В современных мощных радиолокационных системах излучает- излучается последовательность одиночных, не обязательно одинаковых им- импульсов. Временные интервалы для таких радиолокаторов в пре- пределах одного периода повторения импульсов показаны на рис. 5.2. Импульс длительности Т излучается в момент t = 0. Через интервал А излучается следующий такой же или, возможно, другой импульс; А — период повторения импульсов, \/А-—частота их повторения. В мощных радилокационных системах, где каждый из излучаемых
276 Глава 5 импульсов может быть предназначен для проведения измерений ¦определенного вида, в том числе дальности до цели, период по- повторения может меняться. Если для излучения и приема исполь- используется одна и та же антенна, то начать прием раньше момента t = T невозможно. Возможный интервал приема начинается при t=T, а заканчивается при / = Л. Он включает в себя интервал при- Ваэмажный интервал приема L Пальнр- Ал j A \ мерный - ' Г \ шнтервал при\ ема' Дли- \ ема \ | ^Интервал приема | i i /яелемость имлульоа Период повторения (й) Рис. 5.2. Временные интервалы в импульсном радиолокаторе. ¦ема и дальномерный интервал приема1*. Дальности радиолокаци- 'Онного наблюдения за всеми представляющими интерес целями ог- ограничены некоторыми пределами /?„„„ и #МакС, определяющими дальномерный интервал приема, начинающийся в момент ti = = 2RmiH/c и заканчивающийся в момент ^2 = 2^макс/с. Для сжатия импульсов с помощью согласованной фильтрации, обычно выполняемой в устройстве обработки сигналов, необходи- необходимо принимать эхо-сигнал на интервале, превышающем дальномер- дальномерный на величину длительности импульса Т (его называют интер- интервалом приема). Эти временные интервалы представлены на рис. 5.2. Длительность интервала приема относится к числу важных параметров обработки, особенно в цифровых системах, для кото- которых этот интервал определяет объем информации, который дол- должен быть обработан на каждом периоде повторения, а также ем- емкость накопителя и скорость вычислений. 5.3.1. Неоднозначность Необходимо отметить, что использование последовательности импульсов с постоянным периодом повторения приводит к неодно- неоднозначности в измерениях дальности.. Эхо-сигналы, отраженные от целей, дальность до которых превышает R1 = cA/2,. будут приняты на последующих периодах повторения, что может привести к не- неоднозначности. Так, например, в момент / = 2Г+Д могут быть при- приняты эхо-сигналы сразу от двух целей: импульс, излученный в мо- момент (=0и отраженный от цели на дальности R= (с/2) BГ+Л), " Иногда используется более сложный режим работы, заключающийся в че- чередовании излучения и приема пачек импульсов.
Применение ЦОС в радиолокации 277 а также импульс, излученный в момент / = Д и отраженный от це- цели на дальности R = cT. Однозначное измерение дальности будет обеспечено, если дальномерный интервал ограничить соседними импульсами излучения. Исключить неоднозначность можно, также меняя период повторения импульсов, с тем чтобы сместить отно- относительно друг друга моменты появления наложенных эхо-сигна- эхо-сигналов, и выделяя затем с помощью сравнительно несложных алго- алгоритмов эхо-сигналы от различных целей. Выше при рассмотрении процесса измерения скорости по ве- величине доплеровского смещения предполагалось, что излучается непрерывный монохроматический сигнал. Допустим теперь, что этот сигнал имеет несущую частоту f0, промодулирован импульс- импульсной последовательностью, причем каждый импульс пачки начина- начинается с нулевой фазы, и что дальность до цели на протяжении мно- многих периодов повторения меняется мало (по сравнению с величи- величиной разрешения по дальности). Покажем, что в таком импульсном радиолокаторе дискретизуется синусоидальное колебание, частота которого равна доплеровскому смещению, так что измерение ско- скорости сводится к спектральному анализу непрерывного во времени сигнала после его дискретизации. Отметим, что дискретный харак- характер спектрального анализа не зависит от того, является устройст- устройство обработки сигналов аналоговым или цифровым. В момент / = 0 начинается излучение сигнала s(t) = p(t)ei2ltfot. Эхо-сигнал от дви- движущейся цели, находящейся на дальности Ro, принимается в мо- момент t=T0. Он будет иметь вид При повторном излучении в момент t = A цель переместится по дальности на величину vA, так что фазы отраженных сигналов в моменты t=To и t=Ta-\-A будут различными. Эхо-сигнал от вто- второго излученного импульса будет иметь вид r(t)=s(t-A-(T0-2vA/c)), и в момент t=T0-{-A он будет равен г (То + А) =р Bv А/с) е'М* ^'м-с\ E.6) тогда как эхо-сигнал от первого импульса в момент i=To был ра- равен r(To) = S(ro-Tu) = s@) = l. E.7) В общем случае в моменты t = T0-\-nA эхо-сигнал принимает зна- значения г (То + п А) = <?/4*отд/я., E.8) и, следовательно, он действительно представляет отсчеты синусо- синусоидального колебания с частотой, равной доплеровскому смещению /D = 2oA, взятые в моменты времени t = nA. Для измерения /D мож-
278 Глава 5 но, предварительно накопив N отсчетов эхо-сигнала, выполнить дискретное преобразование Фурье этих отчетов с использовани- использованием, например, алгоритма БПФ. Так как отсчеты представляют дискретизованный сигнал, то частотный спектр будет иметь перио- периодическую структуру с периодом /ъ=1/Д. Итак, измерениям ско- скорости в импульсном радиолокаторе также свойственна неоднознач- неоднозначность, которую, как и в измерениях дальности, можно исключить, меняя частоту повторения излучаемой импульсной последователь- последовательности. 5.3.2. Поточная обработка Радиолокатор, излучающий пачки коротких импульсов, естес- естественным образом приспособлен к поточной организации обработ- обработки сигналов. Напомним, что устройство цифровой обработки ра- радиолокатора (см. рис. 5.1) должно включать три подсистемы: цифровой согласованный фильтр, обнаружитель цели и устрой- устройство вторичной обработки. Данные проходят через все три подси- подсистемы последовательно. Один из вариантов организации обработ- обработки заключается в том, что все данные, поступающие на каждом интервале приема, полностью обрабатываются до начала следую- следующего интервала. Однако при такой организации каждая из под- подсистем будет простаивать в среднем одну треть времени. Полная занятость подсистем обеспечивается при поточной организации обработки. Если считать, что продолжительность обработки одного массива данных (относящегося к одному интервалу приема) оди- одинакова у всех трех подсистем, то для организации поточной обра- обработки достаточно между подсистемами ввести буферные накопи- накопители, так что на каждом периоде повторения все подсистемы бу- будут обрабатывать массивы данных, относящиеся к разным интер- интервалам приема1^. При такой организации все три подсистемы могут работать одновременно. Последовательность выполнения опера- операций яри поточной обработке показана на рис. 5.3. После излучения первого импульса ИО следует интервал при- приема эхо-сигналов ИПО, на котором отсчеты эхо-сигнала накапли- накапливаются в быстродействующей буферной памяти БП1. Частота по- поступления данных в БП1, согласно критерию Найквиста, должна, как минимум, вдвое превышать наибольшую частоту спектра эхо- сигнала в основной полосе. Полоса радиолокационного сигнала составляет в среднем 10—60 МГц, поэтому для построения буфера БП1 на существующей элементной базе может потребоваться мультиплексирование блоков памяти с меньшим быстродействи- быстродействием, а также соответствующая, достаточно сложная схема управ- управления. Создание такого буфера — вполне разрешимая задача. '' В некоторых системах обнаружитель не выделяется в отдельную подсисте- подсистему в общей поточной структуре, а объединяется с согласованным фильтром.
Вход- Входные дан- данные Входное 6yipepH0 ЗУШ63У1) Согласо- Согласованный (рилыпр ИО ил о ВБЗУ2 Обнару- Обнаружитель ВВЗУЗ Устройство вторичной обра- обработки ВБЗУЬ СОД И'/7/ 1Я ИП2 I ИЗ | ИПЗ И4- И5 Согласованная фильтрация Процесс обнаружения Вторичная обработка СР.О СР1 CPZ СРЗ ПО О Л01 Л02 -Н ВО О ВО 1 Обработка g COM ОСОД Рис. 5.3. Поточная организация цифровой ебрабвтки сигналов в импульсном радиолокаторе.
280 Глава 5 После окончания интервала приема ИПО накопленный первый. массив отсчетов сигнала обрабатывается в согласованном фильтре. Массив считывается из буфера БП1 с частотой, зависящей от ско- скорости обработки в фильтре. Отметим, что частота дискретизации' на входе и частота поступления данных в согласованный фильтр не зависят друг от друга, однако согласованный фильтр должен обладать быстродействием, достаточным для завершения обработ- обработки всего массива отсчетов сигнала, сформированного на интервале- ИПО, за один период повторения. Интересно отметить, что в прин- принципе обработка в согласованном фильтре может выполняться за время, меньшее длительности интервала приема, т. е. быстрее реального времени. Отметим также, что как буфер БП1, так и все последующие буферные блоки памяти должны дублироваться, что- чтобы можно было выводить данные из БП1 в согласованный фильтр на интервале СФО и в то же самое время принимать в БП1 но- новый массив отсчетов следующего интервала приема ИП1. Выход- Выходные результаты согласованного фильтра накапливаются в буфере БП2, откуда они затем вводятся в блок обнаружения для после- последующей обработки. В конце интервала приема ИП1 работает только одно звено поточной системы обработки, поскольку она еще должна заполниться данными. С этого момента может на- начаться обработка массива данных, относящихся к интервалу при- приема ИПО, в блоке обнаружителя. В согласованном фильтре на* участке СФО будет обрабатываться массив отсчетов, принятых на интервале ИП1, а на входе будет накапливаться массив интерва- интервала приема ИП2. После окончания интервала ИП2 начнут рабо- работать все три подсистемы одновременно, обрабатывая массивы данных, относящиеся к различным интервалам приема, и в сис- системе установится поточный режим. Итак, один массив данных обрабатывается за три периода по- повторения, однако пропускная способность поддерживается доста- достаточной для обеспечения обработки сигналов в реальном времени.. Это означает, что на одном периоде повторения один массив ис- исходных отсчетов вводится в устройство обработки, а один массив результатов выводится и передается в СОД. Описанное распреде- распределение вычислительных операций в устройстве обработки сигналов позволяет раздельно проектировать его отдельные подсистемы.. Можно, например, поставить задачу предельного упрощения схе- схемы согласованного фильтра при условии, чтобы продолжитель- продолжительность фильтрации была меньше периода повторения. Взаимосвязь между тремя подсистемами осуществляется с по- помощью блоков буферной памяти, которые обеспечивают поступле- поступление данных в каждую из подсистем. Из рис, 5.3 следует, что каж- каждый буфер должен быть рассчитан на два массива данных, один из которых поступает в буфер из предыдущего устройства, а дру- другой считывается из буфера и поступает на обработку в подсисте- подсистему, следующую за ним. В некоторых случаях (например, в радио-
Применение ЦОС в радиолокации 281 .локаторах с синтезированием апертуры или при обработке пачек импульсов) приходится перед началом обработки, заключающей- заключающейся в интегрировании или когерентном накоплении, накапливать от- отсчеты эхо-сигналов на большом числе периодов повторения, по- поэтому объем буферной памяти устройства цифровой обработки должен быть значительно увеличен. Из последующего рассмотре- рассмотрения станет ясно, что быстродействующая память большой емкости используется не только в блоках буферной памяти, но и во внут- внутренней памяти устройства обработки. Объем памяти является важ- важной характеристикой устройств цифровой обработки радиолока- радиолокационных сигналов; выигрыш от распределения вычислительной нагрузки с целью проведения обработки на всем периоде повто- повторения часто превалирует над проигрышем из-за усложнения па- памяти. 5.4. Теория обработки радиолокационных сигналов Для любой радиолокационной системы важным является во- вопрос, какие сигналы следует излучать и обрабатывать. Хорошим примером, иллюстрирующим эффективность теории преобразова- преобразования Фурье, является исследование радиолокационных сигналов с использованием введенной Вудвордом функции неопределенности [45]. Ниже будет рассмотрена функция неопределенности только для дискретных сигналов, так как применительно к непрерывным сигналам она уже была неоднократно описана ![7, 9]. Отметим, в частности, что для цифровых систем проблема выбора сигналов более актуальна, чем для аналоговых, так как благодаря своей универсальности цифровое устройство обработки дает возмож- возможность использовать в радиолокаторе зондирующее колебание прак- практически любой формы, тогда как в аналоговых системах обычно1' применяются одни и те же по существу простейшие колебания, такие, как монохроматические или ЛЧМ-импульсы. 5.4.1. Теория согласованной фильтрации В основе работы всех импульсных радиолокаторов лежит про- простой принцип: излучается сигнал и измеряется время его распро- распространения до цели и обратно. Так как мощность эхо-сигнала уменьшается пропорционально четвертой степени расстояния до цели, то принимаемый сигнал оказывается, как правило, очень слабым. В первых радиолокаторах для улучшения отношения сиг- сигнал/шум использовались фильтры, подавляющие аддитивные шу- шумы. Фильтр, оптимизирующий пиковое значение отношения сиг- сигнал/шум при приеме в присутствии аддитивного белого гауссов- ского шума, называется согласованным [27]. >> Исключение составляют корреляционные фильтры поверхностной акусти- акустической волны.
282 Глава 5 Позже было показано, что согласованный фильтр — это уст- устройство обработки радиолокационных сигналов, оптимальное с точки зрения максимизации вероятности обнаружения цели [46]. Этот критерий оптимальности представляет больший интерес и яв- является более фундаментальным, поскольку он соответствует одно- одному из назначений радиолокационной системы, а именно обнаруже- обнаружению цели. В данном разделе рассматриваются вопросы реализа- реализации согласованных фильтров методами цифровой фильтрации, причем то обстоятельство, что фильтрации подвергаются дискрети- зованные сигналы, приводит, как и следовало ожидать, к некото- некоторым интересным особенностям. Классическим средством для описания работы согласованного фильтра в случае, когда отраженный сигнал имеет некоторое за- запаздывание и доплеровское смещение, является хорошо извест- известная функция неопределенности радиолокатора [7, 9, 36]. Приводи- Приводимый ниже вывод основывается главным образом на работе Блэн- кеншипа и Хофштеттера [3]. Обозначим комплексную огибающую зондирующего сигнала через s(t). Тогда комплексная огибающая для принятого сигнала будет описываться выражением г {i)= s(t — T) erW e-o, E.9) где т — относительное, запаздывание, a f — относительное допле- доплеровское смещение. Предположим сначала, что фильтр, в котором производится обработка принятого сигнала, в точности согласо- согласован с зондирующим сигналом. Импульсная характеристика такого фильтра представляет собой инвертированный во времени комп- комплексно-сопряженный зондирующий сигнал s*(—t) (без учета ко- конечной задержки, необходимой для того, чтобы фильтр был физи- физически реализуемым). Отклик согласованного фильтра y(t) равен свертке эхо-сигнала r(t) с импульсной характеристикой этого фильтра s*(—t), т. е. у (/) = j' s*(—u)s it—u—z) е-!**/V-*--.) du E.10) или после замены переменной 00 y(t) = e->2w-^ f s*(v)s(v + (t—i))e-'2*fvdv. E.11) ¦ oo Так как этот отклик- просто задержан на величину т, то, сместив на х начало координат, получим более простое выражение Aa(t, /) Д^(/, /)= j s* (v)s(v + t) e-W"dv, E.12)
Применение ЦОС в радиолокации 283 в котором опущен фазовый сомножитель, поскольку, как правило, интерес представляет лишь модуль, т. е. огибающая, отклика фильтра. Полученная функция — хорошо известная функция неопределен- неопределенности1'. Она интерпретируется просто как временная функция, по- получаемая после прохождения сигнала через фильтр, согласованный с этим сигналом. Эта функция обладает рядом важных интерес- интересных свойств, позволяющих проектировщику выбрать тот или иной сигнал в зависимости от целевой обстановки. Этот вопрос подроб- подробно рассмотрен во многих книгах по радиолокации [7, 36, 39]. При реализации согласованного фильтра в цифровой форме принятый сигнал прежде всего дискретизуется с периодом Ts се- секунд, что дает отсчеты Импульсная характеристика цифрового согласованного фильтра равна s*(—nTs). Таким образом, цифровая функция неопределен- неопределенности, как легко убедиться, определяется следующим образом: ^ -W»Ts. E.13) Существует простое соотношение, связывающее аналоговую и циф- цифровую функции неопределенности любого заданного сигнала. Оно в точности совпадает с соотношением между преобразованиями Фурье аналогового сигнала и этого же сигнала после дискретиза- дискретизации. Если ] E.14) Gd(F) = fj Gd{nTs)er-w*Tsi E.15) П~-- OQ ТО со Ц?) EЛ6> Искомое соотношение между аналоговой и цифровой функциями неопределенности непосредственно вытекает из сопоставления фор- формул E.14) и E.15) с E.12) и E.13): 53 4(и + ?) EЛ7) f '> Существуют и другие формы функции неопределенности, отличающиеся лишь знаком f и выполнением операции комплексного сопряжения.
284 Глава 5 Соотношение E.17) особенно полезно для определения влияния частоты дискретизации на структуру цифровой функции неопреде- неопределенности (при этом аналоговая функция неопределенности счита- считается известной). Рассмотрим в качестве примера ЛЧМ-колебание, описываемое функцией . wt* 1 где '¦1 при \t\<T, EЛ9) О при других /, Т—длительность сигнала, a W — девиация частоты. Аналоговая функция неопределенности такого колебания равна rsin[ K(Wt—fT)(l— ~]\ г 11 ¦ " < т E.20) при n(WJt — fT) 0 при других t, причем фазовый сомножитель, как обычно, опущен. Для оценки структуры функции неопределенности проще всего использовать контурную диаграмму, изображенную применительно к ЛЧМ-сиг- налам на рис. 5.4. Область на плоскости (t, f), внутри которой Аа (t, f) существенно больше нуля, заштрихована. Для построения контурных диаграмм цифровой функции не- неопределенности ЛЧМ-сигнала можно использовать соотношение E.17). Две такие диаграммы построены на рис. 5.5, а, б. Первая из них соответствует дискретизации с частотой Найквиста (Ts=l/W), а вторая — случаю, когда частота дискретизации недостаточна (Ts=2/W). Напомним, что спектр комплексной огибающей ЛЧМ- сигнала сконцентрирован в основном в полосе частот, равной де- девиации сигнала W, так что дискретизация комплексной огибающей в основной полосе на выходе двух квадратурных каналов с часто- частотой, равной W, действительно соответствует теореме отсчетов Най- Найквиста1*. Из диаграммы на рис. 5.5,6 ясно видно, что при недоста- недостаточной частоте дискретизации функция неопределенности стано- становится неприемлемой, так как помимо основного отклика в точке t — О она содержит ложные отклики в точках t= + Tj2. Если же частота дискретизации равна частоте Найквиста, то, как следует из рис. 5.5, а, функция неопределенности оказывается вполне при- приемлемой (по крайней мере в сечении вдоль временной оси). Дей- Действительно, ложные отклики начинают появляться в точках t=+T, если только эхо-сигнал имеет ненулевое доплеровское смещение. ') В отечественной литературе она широко известна как теорема Котельни- кова. — Прим. перев.
Применение ЦОС в радиолокации Рис. 5.4. Контурная диаграмма функции неопределенности ЛЧМ-сигнала (за- (заштрихована область, в пределах которой функция неопределенности существенно» , _ _ , больше нуля). Рис. 5.5. Контурная диаграмма цифровой функции неопределенности ЛЧМ-сиг— нала. о—частота дискретизации равна частоте Найквиста; б — частота дискретизации вдвое- меньше частоты Найквиста.
286 Глава 5 На практике частоту дискретизации следует, как правило, выби- выбирать равной сумме ширины полосы сигнала и максимального из возможных значений доплеровского смещения. 5.4.2. Сжатие ЛЧМ-импульса Хотя контурные диаграммы позволяют ориентировочно оценить поведение цифровой функции неопределенности ЛЧМ-импульса, целесообразно найти ее точное аналитическое выражение. С по- помощью формулы E.13) его получить несколько проще, чем из со- соотношений E.17) и E.20). Предположим, что излучаемый ЛЧМ-сигнал описывается фор- формулами E.18) и E.19), а принимаемый сигнал дискретизуется с периодом Т/М секунд, где М — целое. Ровно М отсчетов принято- принятого сигнала будут ненулевыми. Пусть t=(k-\-p)(T/M), где k — це- целое, а 0<р<1 — момент времени, относящийся к какому-либо од- одному периоду дискретизации. Вычислим величину E.13), соответ- соответствующую этому моменту: ,W-1—ft ._ _W_ = S l л j p т \ m) p { m ) f I E.21) Здесь '0<&<(М— 1). Если — (М— 1)<й<0, то верхний и ниж- нижний пределы суммы E.21) следует заменить соответственно на —k и (М—1). При \k\ > (ЛГ—1) имеем Ad{t, f) =0. После довольно длительных, хотя и несложных алгебраических преобразований выражение для модуля E.21) может быть пред- ставл-ешэ м следующем виде: Sin т: \k-V- р — v — М \ ^' N 1\ M N { М sin ти — \k-\- о — — v ,\k\<M, E.22) где N=TW и v=fT. Аналогично можно получить выражение и для фазы E.21), но в данном случае она не представляет интереса. Проще всего изучить свойства функции E.22) на конкретных примерах. Так, на рис. 5.6, а, б изображена функция |ЛсгG, 0)| ЛЧМ-сигнала с базой (произведением длительности сигнала на его полосу), равной 512. Сигнал дискретизуется с частотой Най- жвиста (M=iV=512), а относительное смещение между отсчетами сигнала и согласованного фильтра р равно 0 и 0,5 соответственно.
Применение ЦОС в радиолокации 287 Рис. 5.6. Моделирование работы согласованного ЛЧМ-фильтра без взвешивания. Частота дискретизации равна частоте Найквиста, база сигнала составляет 512. Относитель- Относительное смещение между отсчетами сигнала и фильтра равно 0 (а) и 0,5 (б). Обе функции получены путем прямого вычисления выражения E.22) с помощью программы, моделирующей прохождение ЛЧМ- импульса через согласованный фильтр. В центральной части от- отклика на рис. 5.6, а виден большой пик, состоящий из единствен- единственного отсчета на уровне 0 дБ, который окружен боковыми лепест- лепестками очень низкого уровня (—40 дБ). Всем, кто имел дело с ана- аналоговой обработкой ЛЧМ-импульсов, этот результат может пока- показаться странным, так как хорошо известно, что при согласованной1 фильтрации без взвешивания уровень боковых лепестков состав- составляет —13 дБ. Отсутствие на рис. 5.6, а боковых лепестков с уров- уровнем —13 дБ объясняется тем, что при р=0 отсчеты \Ad(t, 0)\ находятся вблизи нулей функции неопределенности. При р=0,5 не- нецентральной области функции неопределенности заметны боковые- лепестки с уровнем —13 дБ [рис. 5.6,6]. Как видно из рис. 5.6, а,. б, основное различие между цифровой и аналоговой функциями неопределенности состоит в том, что у цифровой функции неопре- неопределенности не наблюдается монотонного уменьшения боковых ле- лепестков при увеличении \t\; напротив, при приближении \t\ к краям отклика они снова увеличиваются. Причина заключается в; периодичности цифровой функции неопределенности ЛЧМ-им- пульса [см. рис. 5.5,а]. При увеличении частоты дискретизации различие между цифровым и аналоговым случаями становится ме- менее заметным. Так, изображенная на рис. 5.7, а и б цифроваяг функция неопределенности, соответствующая Af = 2A'=1024 (т. е- частоте дискретизации, вдвое превышающей частоту Найквиста),. практически не отличается от аналоговой функции неопределенно- неопределенности ЛЧМ-импульса.
288 Глава 5 а Рис. 5.7. Моделирование работы согласованного ЛЧМ-фильтра без взвешивания. Частота дискретизации вдвое превышает частоту Найквиста, база сигнала равна 512. От- Относительное смещение между отсчетами сигнала и фильтра р равно 0 (а) и 0,5 (б). Закончим рассмотрение зависимости цифровой функции неоп- неопределенности от частоты дискретизиации еще одним примером, представленным на рис. 5.8, а и б, который соответствует М= = 0,5iV = 256, т. е. случаю, когда частота дискретизации вдвое мень- меньше частоты Найквиста. Ясно видны ложные отклики, наличие ко- которых можно ожидать, исходя из контурной диаграммы на рис. .5.5, б. Уровень боковых лепестков функции неопределенности ЛЧМ- импульса можно понизить, если использовать несогласованный •фильтр с частотной характеристикой, представляющей собой про- произведение частотной характеристики согласованного фильтра и не- некоторой весовой функции, например функции Хемминга вида На рис. 5.9, а и б представлены сечения функции неопределенно- -стн вдоль временной оси для случая, когда частота дискретиза- дискретизации равна частоте Найквиста, а в приемнике радиолокатора про- производится взвешивание в частотной области с использованием ве- весовой функции Хемминга. По обе стороны от главного максимума для случая р = 0 четко видны два отсчета высокого уровня, обус- .ловленные расширением главного лепестка функции неопределен- неопределенности. Уровень ближайших боковых лепестков понизился с —13 дБ, как это было на рис. 5.6,6, до —42 дБ {рис. 5.9,6]. Кроме того, взвешивание по Хеммингу привело также к ослаблению боковых .лепестков вблизи краев отклика при |?| = Г, что с первого взгля- взгляда может показаться странным. Причина этого ослабления заклю- заключается в том, что структура боковых лепестков вблизи |^1 = Г оп-
Применение ЦОС в радиолокации 289 Рис. 5.8. Моделирование работы согласованного ЛЧМ-фильтра без взвешивания. Частота дискретизации вдвое меньше частоты Найквиста, база сигнала равна 512. Относи- Относительное смещение между отсчетами сигнала и фильтра р равно 0 (а) и 0,5 (б). ределяется в основном наложенной (вследствие дискретизации) областью главного максимума функции неопределенности, поэто- поэтому они будут такими же, как боковые лепестки вблизи |^|=0. Так как весовая функция Хемминга была введена специально для по- подавления ближайших к главному максимуму боковых лепестков, то нет ничего удивительного в том, что уровень имеющих ту же структуру боковых лепестков вблизи |^| =Т также будет понижен за счет взвешивания. Рис. 5.9. Моделирование работы согласованного ЛЧМ-фильтра со взвешиванием по Хеммингу. Частота дискретизации равна частоте Найквиста, база сигнала составляет 512. Относитель- Относительное смещение между отсчетами сигнала и фильтра р равно 0 (а) и 0,5 (б).
290 Глава 5 Из числа параметров, описывающих функцию неопределенно- неопределенности E.22), еще не был рассмотрен только один — доплеровское. смещение v = fT. Из формулы E.22) следует, что влияние v ана- аналогично влиянию р, так как оба эти параметра фигурируют только в виде суммы; величина v не ограничена пределами 0 и 1, как р. Из рис. 5.5, а нетрудно заметить, что при больших положительных I jy|/ / / /——7^ Время Рис. 5.10. Равномерная пачка из ЛЧМ-импульсов. v вблизи t = T должен появиться ложный отклик высокого уровня. Правда, для большинства ЛЧМ-систем девиация, как правило, во много раз превышает возможные значения доплеровского смеще- смещения, поэтому случаи большого v не представляют интереса. 5.4.3. Обработка пачки импульсов Функцию неопределенности ЛЧМ-импульса относят к классу «ножевидных» функций неопределенности, учитывая, что ее значе- значения, существенно превышающие нуль, занимают узкую область, вытянутую вдоль линии f=(W/T)t. Выше уже было отмечено, что эффекты доплеровского смещения и временного запаздывания (смещения по дальности) одинаковы, т. е. для ЛЧМ-импульса ха- характерна неопределенность между дальностью и доплеровским смещением частоты. Используя пачку импульсов, можно обеспе- обеспечить одновременное измерение дальности и доплеровского смеще- смещения. Рассмотрим функцию неопределенности пачки импульсов. На рис. 5.10 изображена пачка из N ЛЧМ-импульсов, следую- следующих через равные интервалы (равномерная пачка). Длительность и девиация частоты каждого импульса соответственно равны Т и W; А — период повторения импульсов. Пачка может быть описа- описана следующим образом: JV—1
Применение ЦОС в радиолокации 291 где aT(t) =Bei^wI1"*12 при 0<ii<zT. Аналоговая функция неопреде- неопределенности1' равна \A(pA+t',f)\ ={N-\p\)Ea Ag(t',f) Er. sin я/(Л'— |p|)A (N— \p |)/ E.24) Здесь целое число р используется для обозначения номера про- просматриваемой дальностной полосы, Еа = В2Т — энергия каждого импульса пачки, а функция неопределенности ЛЧМ-импульса Aa(t, f) равна sinjiWT \-f — ' kWT (-y — - ¦ E.25) Контурная диаграмма функции неопределенности равномерной пачки ЛЧМ-импульсов E.24) представлена на рис. 5.11. Функция E.24) относится к широко известным функциям неопределенности типа «борона» с пиками, расположенными вдоль наклонной линии, характерной для ЛЧМ-импульса. Отметим, что функция неопре- неопределенности вдоль частотной оси заключена, в пределах +1F, так как при доплеровских смещениях, превышающих W, эхо-сигнал и зондирующий сигнал становятся некоррелированными. Правда, в реальных ситуациях значения доплеровского смещения гораздо меньше, и пачка ЛЧМ-импульсрв обычно выбирается таким обра- образом, чтобы доплеровское смещение не превышало одного интер- интервала однозначного измерения частоты. Кроме того, вдоль наклон- наклонного гребня функции неопределенности размещаются TW пиков неопределенности, причем, согласно формуле E.25), на большей части гребня их амплитуда уменьшается по линейному закону. Для изучения эффектов, связанных с дискретизацией и цифро- цифровым способом обработки, воспользуемся выражением E.17). При дискретизации сигнала с частотой Найквиста (Ts = l/W) контур- контурная диаграмма рис. 5.11 будет периодически повторяться и добав- добавляться, как это показано на рис. 5.12. Итак, при заполненной пач- пачке (А=Т) крайние по частоте пики функции неопределенности (при f=±W) накладываются на главный пик, но так как фактиче- фактически они равны нулю, то главный пик останется неизменным. Ана^ логично вторые с края пики функции неопределенности [при /= = + {W—Л/Л)] накладываются на первый пик. Оба накладывае- накладываемых пика ненулевые, но первый пик ниже главного, поэтому сум- сумма после наложения будет примерно постоянной. Отметим, что ес- если пачка незаполненная, то накладываемые пики по частоте не будут совмещаться, что приведет к появлению дополнительных пи- пиков функции неопределенности по дальности. Таким образом, из формулы E.17) следует, что при дискретизации сигнала и выпол- Предполагается, что скважность пачки больше 2.
292 Глава 5 Ряс. 5.11. Контурная диаграмма функции неопределенности равномерной пачки ЛЧМ-импульсов. пУРпимр ФУНКЦИИ неопределенности заполненной (А=Т) пачки ЛЧМ-импульсов, иллюстрирующая периодичность вдоль ча- стотной оси.
Применение ЦОС в радиолокации 293 нении согласованной фильтрации в цифровой форме сечение по временной оси и первый интервал однозначного измерения по ча- частоте останутся практически неизменными. Однако на последую- последующих частотных интервалах функция неопределенности будет не- несколько искажена, если пачка незаполненная. Вид функции неопределенности типа «борона» указывает на возможность использования пачки импульсов для разрешения и по дальности, и по скорости одновременно. Правда, при этом в -f\\/I /I // > Рис. 5.13. Неравномерная пачка ЛЧМ-импульсов с постоянной девиацией. функции неопределенности и по дальности, и по скорости появля- появляются новые пики. Однако если пики функции неопределенности по скорости могут быть далеко от области ожидаемых скоростей (путем соответствующего выбора параметров пачки), то разме- разместить пики по дальности вне области ожидаемых дальностей часто не удается. В этом заключается недостаток равномерных пачек импульсов, вызывающий трудности, для преодоления которых тре- требуется дополнительная обработка. Однако возможность одновре- одновременного измерения дальности и скорости, а также подавления эхо-сигналов от целей, движущихся со скоростями, не представ- представляющими интереса, оказывается подчас более веским аргументом в пользу применения равномерных пачек, нежели возникающие при этом проблемы неопределенности. Можно сформировать пачки с неравномерно следующими им- импульсами. Соответствующая им функция неопределенности отно- относится к типу «кнопочных» функций — третьему типу функций неоп- неопределенности [9]. Неравномерная пачка из N импульсов показана на рис. 5.13. Основная цель использования неравномерных пачек— устранение взаимной корреляции между импульсами по дально- дальности, за счет чего исчезает неопределенность по дальности и функ- функция неопределенности становится кнопочной. Может показаться, что получение функции неопределенности кнопочного типа явля- является решением проблемы выбора радиолокационного сигнала, так как эта функция обеспечивает возможность одновременного изме- измерения дальности и скорости (опять предполагая, что пики по ско- скорости функции неопределенности обычно могут быть размещены вне области ожидаемых скоростей). Однако это достигается за счет значительного увеличения уровня мешающего фона, распре-
294 i/ Глава 5 деленного по большой площади [9].. Важно отметить, что увеличе- увеличение базы сигнала приводит к ослаблению этого эффекта. 5.5. Реализация согласованного фильтра Перейдем к детальному обсуждению способов реализации циф- цифровых согласованных фильтров, причем основное внимание уде- уделим способу, связанному с применением алгоритма быстрого пре- преобразования Фурье для выполнения операции высокоскоростной свертки. Такой способ реализации согласованного фильтра не яв- является единственно возможным (фильтр может быть специализи- специализированным устройством), однако он позволяет создать фильтр с практически любыми характеристиками. Так как зондирующие сиг- сигналы радиолокатора обязательно ограничены во времени, то опе- операция согласованной фильтрации эквивалентна нерекурсивной фильтрации с конечной импульсной характеристикой (КИХ-фильт- ром). Например, после дискретизации ЛЧМ-сигнала, имеющего длительность Т и девиацию W (т. е. базу TW), с частотой, в е раз превышающей частоту Найквиста, образуется дискретный сигнал длиной L = zTW отсчетов. В результате выполнения над этими от- отсчетами операций временной инверсии и комплексного сопряже- сопряжения получается импульсная характеристика согласованного КИХ- фильтра. Основным аргументом использования цифрового способа реализации согласованного фильтра является универсальность по- получаемого фильтра, которая обеспечивается тем, что отсчеты им- импульсной характеристики фильтра накапливаются в оперативной памяти. При такой структуре фильтра его характеристики можно легко изменять, обеспечивая, например, обработку сигналов раз- различного типа или взвешивание в частотной области с целью по- подавления боковых лепестков. Кроме того, имеется возможность адаптации фильтра к изменяющейся целевой обстановке в реаль- реальном времени. 5.5.1. Высокоскоростная свертка Высокоскоростная свертка — это весьма эффективный алгоритм реализации цифрового КИХ-фильтра [41]. С помощью этого ал- алгоритма, представленного на рис. 5.14, вычисляется свертка в ча- частотной области. Сначала находятся дискретные преобразования Фурье (ДПФ) X(k) и H(k) последовательностей х(п) и h(n) дли- длины N, которые затем перемножаются, а обратное ДПФ от их про- произведения Y(k) дает выходную последовательность фильтра у(п). Эффективность этого метода обеспечивается использованием для выполнения всех ДПФ алгоритма БПФ. При больших N выиг- выигрыш в объеме вычислений по сравнению с прямым методом вы- вычисления свертки во временной области может оказаться весьма значительным. Так как свертка, вычисляемая с помощью ДПФ, оказывается круговой [30], то в каждом выходном массиве из 7V отсчетов толь-
Применение ЦОС в радиолокации 295 ко JV—L+1 оказываются правильными (здесь L —длина импульс- импульсной характеристики фильтра). Отметим, что если радиолокатор работает в режиме многократного измерения, то нет необходимо- /г (/г) Прямое ДПТ Прямое ДПР Х(к) У (к) Обратное ДП<Р Рис. 5.14. Блок-схема алгоритма вычисления свертки с помощью ДПФ. Алгоритм является высокоскоростным за счет использования БПФ для выполнения всех ДПФ. сти выполнять согласованную фильтрацию непрерывно. На каж- каждый период повторения требуется получить только один массив отфильтрованных отсчетов (относящихся к одному далыюмерному 1000 100 ? Рис. 5.15. Кривые для выбора размера преобразования. Размер дальномерного интервала 30 км, частота дискретизации равна частоте Найквиста. интервалу). Таким образом, вся информация, полученная в тече- течение одного интервала приема, однократно обрабатывается в быст- быстродействующем свертывателе (рис. 5.14), причем из всего выход-
296 Глава 5 _^___ ного массива сохраняются только правильные отсчеты. При длине дальномерного интервала R общее количество отсчетов, заключен- заключенных внутри этого интервала, будет равно M = 2ReW/c, так что не- необходимый размер преобразований составит l. E.26) На рис. 5.15 приведены графики зависимости размера преоб- преобразований от длительности сигнала и ширины его полосы для 30-километрового дальномерного интервала. Например, для сиг- сигнала с базой 2048 и полосой 10 МГц (при дискретизации с час- частотой Найквиста) требуемый размер преобразования равен 4096, если дальномерный интервал приблизительно составляет 30 км, 5.5.2. Время обработки ¦• ' Уменьшение общего количества операций при переходе от пря- прямой формы реализации КИХ-фильтра к использованию алгоритм? высокоскоростной свертки с применением БПФ значительно лишь при больших базах сигнала. Однако полоса радиолокационных сиг- сигналов, как правило, настолько широка (обычно 10—100 МГц), что даже при использовании БПФ требования, предъявляемые к бы- быстродействию цифрового свертывателя, оказываются весьма жест- жесткими. На каждом периоде повторения формируется большое коли- количество отсчетов, для обработки которых приходится выполнять ог- огромное количество операций. Рассмотрим этот, вопрос подробнее, предположив, что используется алгоритм БПФ по основанию 2, а размер преобразования N равен 2п. На рис. 5.16 представлена схема реализации базовой операции алгоритма БПФ по основа- основанию 2 с прореживанием по времени. Эта операция включает в се- себя одно комплексное умножение и два комплексных сложения. Чтобы оценить объем вычислений при выполнении БПФ, рассмот- рассмотрим общее количество базовых операций, приходящееся на одно преобразование. Для jV-точечного БПФ по основанию 2 эта вели- величина равна (N12) log2JV, так как преобразование включает в себя Xog^N этапов, на каждом из которых выполняются N/2 базовых операций. Этот результат для случая N = 8 иллюстрируется па рис. 5.17. При вычислении высокоскоростной свертки с помощью БПФ необходимо выполнить два преобразования и перемножить два iV-точечных массива (считается, что ДПФ характеристики фильт- фильтра найдено заранее, занесено в табличную память и использует- используется только при умножении на спектр сигнала). Следовательно, вре- время выполнения свертки равно , E.27) где Тв — время выполнения одной базовой операции, а Тм — вре- время выполнения одного комплексного умножения. В предположе-
Применение ЦОС в радиолокации 297 Рис. 5.16. Схема реализации базовой операции алгоритма БПФ по основанию 2 с прореживанием по времени. х{0)о-* Этап О Этап! Этап Z Рис. 5.17. Блок-схема алгоритма 8-точечного БПФ с прореживанием по времени и прямым порядком исходных данных.
298 . Глава 5 нии, что обе эти величины примерно равны (так как основная до- доля времени тратится на комплексное умножение), получаем следу- следующее приближенное выражение для времени вычисления свертки: Tc&N(l+\ogaN)TM. E.28) Условие, что вычисление свертки должно проводиться в пределах одного периода повторения зондирующих импульсов, накладыва- накладывает ограничение на минимальную скорость выполнения комплекс- комплексного умножения. Предположим, например, что частота повторения импульсов составляет 1 кГц (т. е. период их следования равен 1 мс), а размер преобразования равен 4096 = 212. Для проведения обработки в реальном времени необходимо, чтобы комплексное умножение выполнялось менее чем за 20 не. Этому требованию в настоящее время трудно удовлетворить при использовании суще- существующих цифровых умножителей. В действительности оно ока- оказывается еще более жестким, если учесть все дополнительные опе- операции, необходимые для обеспечения обработки. Из приведенного примера может даже показаться, что существует определенный предел аппаратурной реализации высокоскоростной свертки, но на самом деле это| не так. В приведенных выше рассуждениях предполагалось, что все операции выполняются последовательно. Такая структура вычислений характерна для универсальной вычи- вычислительной машины с одним процессором. Положение, однако, улучшается при использовании методов параллельной обработки. В частности, скорость обработки можно существенно увеличить, применив поточное устройство для выполнения БПФ [18, 29], при- причем аппаратура управления в такой структуре довольно простая. Ниже поточная структура рассматривается более детально. 5.5.3. Поточная структура При разработке поточной структуры БПФ был учтен тот факт, что еще до окончания всех базовых операций на данном этапе можно начинать вычисления на последующих этапах. Так, из блок-схемы 8-точечного БПФ по основанию 2 (см. рис. 5.17) вид- видно, что верхнюю базовую операцию на этапе 1 можно начать сра- сразу после окончания выполнения первых трех (сверху) базовых операций этапа 0. Аналогично верхнюю базовую операцию на этапе 2 можно выполнить сразу после завершения первых двух (сверху) базовых операций этапа 1. Таким образом, при исполь- использовании алгоритма БПФ по основанию 2 можнй построить более эффективную структуру, содержащую log^N параллельно работа- работающих арифметических устройств (АУ). Следует отметить, что на каждое АУ данные должны посту- поступать в определенном порядке, поэтому между всеми АУ необхо- необходимо ввести блоки памяти для перестановки данных. Более под- подробно особенности построения поточной структуры будут рассмот- рассмотрены ниже, а сейчас оценим сокращение времени выполнения
Применение ЦОС в радиолокации 299 БПФ по основанию 2, которое обеспечивается при переходе к это- этому виду параллельного выполнения операций. Рассмотрим реализацию одного ДПФ в поточной структуре БПФ. В лучшем случае можно ожидать сокращения времени пре- преобразования в \og2N раз. Однако поскольку выполнение базовых Загрузка таблицы N-точечнов ВЛФ, основание г, прореживание па времени N-точечное, обратное ЕЛФ, основание г, прореживание по времени Память коэффи- коэффициентов Умножение на таблицу г! 3 Память коэффи- коэффициентов Рис. 5.18. Блок-схема цифровой фильтрации с каскадно соединенными поточными блоками БПФ, работающими по основанию г. операций нельзя начать на всех этапах одновременно, то, как бу- будет показано ниже, время преобразования уменьшится всего в У2 1 log2^V раз. Но при многократном вычислении ДПФ задержка вы- вычислений будет иметь место только в начале, так что преобразова- преобразования будут выполняться приблизительно в log2^V раз быстрее (см. разд. 5.6.6). Итак, общее время получения высокоскоростной сверт- свертки при использовании /V-точечных преобразований составит м- Предположив снова, что ТвжТм, получим Тп « 3NTM. E.29) E.30) Применительно к рассмотренному выше примеру это означает, что комплексное умножение должно быть выполнено за 83 не, т. е. за время, которое может быть обеспечено на быстродействующих се- сериях существующих микросхем. Общая структура поточного свертывателя, работающего по основанию г (алгоритм БПФ с прореживанием по времени) даад на рис. 5.18. Исходные отсчеты поступают в первый поточный блок
300 Глава 5 преобразователя по г входам (на каждый вход поступает N/r от- отсчетов). В поточном блоке прямого преобразования выполняется ^-точечное БПФ по основанию г над отсчетами, следующими в прямом порядке. После преобразования их в частотную область каждая группа из Njr чисел умножается на соответствующие от- отсчеты частотной характеристики фильтра, а образующиеся произ- произведения поступают во второй поточный блок, где выполняется об- обратное БПФ. Порядок поступления данных в блок обратного пре- преобразования разрядно-инверсный (система счисления номеров r-ичная), а выходные отсчеты следуют в прямом порядке. Таким образом,, разрядная инверсия номеров отсчетов, возникшая после прямого преобразования, устраняется на этапе обратного преоб- преобразования. 5.6. Пример системы цифровой обработки радиолокатора При проектировании системы цифровой обработки радиолока- радиолокатора приходится учитывать характеристики и возможности изго- изготовления многих подсистем. В данном разделе будет описана си- Память для взвешивания во времени 7024- Регистры задержки Управление I Рис. 5.19. Блок-схема поточного устройства для выполнения прямого БПФ по основанию 4.
Применение ЦОС в радиолокации 301 Табличная помять Управление ПЗУ иоэсрри- ' тентов 1OZ4- Рис. 5.20. Блок-схема поточного устройства для выполнения обратного БПФ по основанию 4. стема, разработанная за последние несколько лет в лаборатории Линкольна Массачусетского технологического института. Основной ее частью является поточный согласованный фильтр с алгорит- алгоритмом БПФ по основанию 4. Рассмотрим сначала особенности этой системы. На рис. 5.19 и 5.20 изображены блок-схемы1' поточных уст- устройств для выполнения соответственно прямого и обратного 4096- точечных БПФ по основанию 4. Оба устройства включают* шесть каскадов, каждый из которых состоит из модулей памяти на ре- регистрах задержки, обеспечивающих неодинаковую временную за- задержку, АУ и постоянного запоминающего устройства (ПЗУ) по- поворачивающих коэффициентов. В свою очередь каждое АУ содер- содержит три устройства поворота векторов и один четырехточечный матричный Фурье-преобразователь. Каскады устройств прямого и '' В настоящее время на основе этих устройств фирмой General Electric no техническому заданию лаборатории Линкольна разрабатывается система цифро- цифровой обработки данных со следующими характеристиками: размер преобразова- преобразования 16 384, основание алгоритма 4, тактовая частота 30 МГц. Следовательно, круговая свертка 16 384-точечных массивов может быть вычислена за 136 мкс.
¦302 Глава 5 i__ ^ обратного, БПФ отличаются лишь порядком, в котором хранятся поворачивающие коэффициенты, и в некоторой степени внутренни- внутренними связями в матричных Фурье-преобразователях. Регистры памяти, обеспечивающие неодинаковую временную задержку, содержат групповой переключатель и набор сдвиговых регистров, длина которых зависит от номера каскада (она указа- указана на рис. 5.19 и 5.20). Эти регистры предназначены для упорядо- упорядочения данных в процессе выполнения преобразований с тем, чтобы в каждый момент времени на входы АУ поступали соответствую- соответствующие отсчеты. Хранящаяся в табличной памяти частотная характеристика оп- определяет вид реализуемого фильтра. Адресация табличной памя- памяти должна быть разрядно-инверсиой в соответствии с разрядно- инверсным порядком следования результатов прямого БПФ. 5.6.1. Формат данных Способ представления данных в цифровом согласованном филь- фильтре во многом определяет сложность устройства и точность обра- обработки, поэтому он должен быть выбран на начальном этапе про- проектирования системы обработки, Возможны различные способы представления данных: с фиксированной запятой, со стандартной плавающей запятой и с гибридной плавающей запятой, а также в дополнительном, обратном или прямом кодах. Если в согласован- согласованном фильтре, предназначенном для сжатия импульсов, использу- используется представление чисел с фиксированной запятой, то разряд- разрядность чисел должна быть большой, так как уровень сигнала в про- процессе фильтрации возрастает в TW раз. В этом смысле более под- подходящим является представление чисел с плавающей запятой, хотя в действительности можно ограничиться некоторым приближе- приближением к нему, а именно гибридной плавающей запятой, поскольку порядок чисел имеет тенденцию к росту только в положительном направлении. Эта форма представления считается наиболее удач- удачной, так как структурно она реализуется сравнительно просто, а соответствующая ей точность фильтрации, как показали результа- результаты моделирования, достаточно высока. Все арифметические операции при использовании формата дан- данных с гибридной плавающей запятой выполняются над правильны- правильными дробями в дополнительном коде. Комплексные операнды пред- представляются двумя дробными мантиссами* с общим порядком сле- следующим образом: *t E.31) где. тг и rrii — мантиссы действительной и мнимой частей соответ- соответственно. Для представления обеих мантисс используется одинако- одинаковое число разрядов. Общий порядок Ъ является положительным целым числом, начальное значение которого, соответствующее
Применение ЦОС в радиолокации 303 входному сигналу, равно нулю. Учитывая возможное усиление сигнала в процессе БПФ, можно показать, что для представления порядка Ь достаточно нескольких бит- (например, 5 бит при раз- размере преобразования, равном 16 К). Выбор же разрядности ман- мантисс достаточно трудоемок; для решения этой задачи лучше всего воспользоваться моделированием. Ниже будут рассмотрены неко- некоторые результаты обработки с помощью системы, в которой ман- мантиссы представляются 9- или 11-разрядным кодом. 5.6.2. Структура арифметического устройства Структура АУ для алгоритма БПФ по основанию 4 с прорежи- прореживанием по времени приведена на рис. 5.21. Исходные данные, пред- представляющие собой комплексные слова, одновременно поступают на четыре входа АУ, причем мантиссы и порядки поступают раз- раздельно. Мантиссы подаются на поворачивающие схемы, где умно- умножением на, поворачивающие коэффициенты Wk изменяются фазы входных сигналов. Отметим, что верхний из четырех входных от- отсчетов (рис. 5.21) не поворачивается: Операция поворота может быть выполнена либо посредством комплексного умножения, либо с помощью итеративного алгоритма CORDIC [11, 44], рассматри- рассматриваемого ниже1). Для преобразования данных из формата с плавающей запятой к представлению с фиксированной запятой проводится анализ по- порядков чисел. Результаты анализа используются для управления Контроль переполнения р матриинь/п фурье- преобрвзователь (разрядности слов увеличивается на 2 fiuma) Коррекция лвряд- ,1 и ! *>Л10 Рис. 5.21. Блок-схема АУ с модифицированной плавающей запятой для БПФ по основанию 4. 1> В литературе он широко известен как алгоритм Волдера. — Прим. перев.
304 Глава 5 работой четырех пар выравнивающих сдвиговых схем, так как приходится масштабировать мантиссы и действительной и мнимой, частей входных отсчетов. Взвешенные при масштабировании четы- четыре комплексных отсчета поступают на дальнейшую обработку. После выравнивания порядков четыре комплексные мантиссы совместно обрабатываются в четырехточечном матричном Фурье- преобразователе, имеющем два уровня суммирования. На каждом уровне к мантиссам добавляется дополнительный разряд, чтобы избежать возможного переполнения. Поэтому после прохождения через матричный преобразователь разрядность чисел увеличивает- увеличивается на 2 бита. Заключительной операцией, выполняемой в АУ, является пре- преобразование данных из формата с фиксированной запятой в фор- формат с плавающей запятой. Так как в процессе обработки в АУ существуют три возможности для переполнения (одна при поворо- поворотах и две в матричном преобразователе), то необходимо подсчи- подсчитать, сколько разрядов, следующих за знаковым, совпадает с ним (число разрядов может составлять от 0 до 3). Разность между 3 и этим числом дает количество сдвигов вправо, обеспечивающее приведение мантиссы к выбранной разрядной сетке. После этого для каждого комплексного выходного отсчета вычисляется свой порядок как сумма наибольшего из порядков входных отсчетов (который находится на этапе выравнивания порядков) и числа сдвигов вправо при приведении мантисс. S.6.3. Операция поворота вектора В специализированном устройстве БПФ существенная доля все- всего оборудования используется для выполнения операции поворота вектора. Рассмотрим два метода: комплексное умножение и ите- итеративный алгоритм CORDIC, причем особый интерес для нас пред- представляет второй метод, так как он позволяет уменьшить объем оборудования АУ. Исходные комплексные отсчеты представлены в алгебраичес- алгебраической форме, поэтому для поворота с помощью комплексного умно- умножения можно использовать комплексную экспоненту вида E.32) Для перемножения комплексного отсчета и Wh требуются четыре умножителя действительных чисел, сумматор и вычитатель. Для быстродействующих радиолокационных систем умножители дей- действительных чисел можно построить по матричной схеме [32]. Однако такой комплексный умножитель обладает большими возможностями, чем это необходимо для БПФ, а именно с его по- помощью можно изменять и амплитуду, и фазу отсчетов. Для вы- выполнения алгоритма БПФ достаточно изменять только фазу. Су-
Применение ЦОС в радиолокации 305 ществуют алгоритмы, предназначенные только для поворота векторов. Один из них — алгоритм CORDIC, аппаратурная реали- реализация которого несколько проще по сравнению с комплексным ум- умножителем [11, 44]. Пусть задан вектор (x-\-jy), который требуется повернуть на угол 0. Итеративный алгоритм поворота CORDIC определяется следующим образом: %i=*j—У«(а»2-'). E.33а) И+1 = И+-Ма*2-<), E.336) причем хо = х, уо=у и i=0, 1, ..., М—1. Коэффициенты а* находят- находятся из итеративной формулы Е,+1 = Е{—а,Д0„ E.34a) где go = 0, E.346) A8j —arctgB-/) (арктангенсная система счисления) E.34в) и 1 — 1 при Ег<0. Число итераций М определяет точность выполнения операции по- поворота на угол 9, причем ошибка угла поворота ограничена ве- величиной 8AI<arctgB-^+1). E.35) Так как этот алгоритм сходится только на правой полуплоскости, то предварительно необходимо выполнить операцию приведения исходного вектора к первому и четвертому квадрантам, поскольку угол поворота 8 может соответствовать любому квадранту. Эта предварительная операция заключается просто в изменении зна- знака х. Алгоритму CORDIC свойствен нежелательный эффект увеличе- увеличения модуля числа, хотя это увеличение и не зависит от В, а опре- определяется исключительно числом итераций М и описывается фор- формулой E-36) ?=0 При Af>4 коэффициент Км. асимптотически стремится к величине, приблизительно равной 1,65. Так как повороту подлежат только три из четырех входных отсчетов АУ (рис. 5.21), то действитель- действительную и мнимую части не поворачиваемого отсчета необходимо про- 20—359
306 Глава 5 пустить через два умножителя на Км- Другими словами, нет не- необходимости компенсировать коэффициент усиления Км внутри каждого АУ; можно допустить последовательное, от каскада к каскаду, усиление в Км раз. Это не приведет к каким-либо не- неприятным последствиям, если только результаты не выйдут за пределы динамического диапазона всей системы, использующей формат данных с гибридной плавающей запятой. Отметим также, что умножитель на фиксированный коэффициент Км ~ 1,65 доста- достаточно прост и компактен. 5.6.4. Требования к объему памяти Для построения поточного свертывателя с использованием ал- алгоритма БПФ требуются запоминающие устройства следующего типа: 1) межкаскадные регистры задержки; 2) ЗУ для хранения частотной характеристики фильтра; 3) ЗУ для хранения поворачивающих коэффициентов. Эти си- системы памяти имеют различную структуру и характеристики, по- поэтому лучше всего рассмотреть их отдельно. Каждые два соседних АУ соединены между собой через блок, содержащий регистры задержки и групповой переключатель; ти- типичная структура блока изображена на рис. 5.22. Она включает регистры задержки длины Lk, 2Lh и 3Lft. Разрядность регистров равна количеству бит, используемых для представления комплекс- комплексных чисел. Функционально регистры задержки работают как сдви- сдвиговые регистры, но в действительности они часто выполняются на ¦основе запоминающих устройств с произвольным доступом, кото- которые адресуются соответствующим образом. Величина _ь зависит от их положения в общей поточной схеме и от порядка поступления данных (он может быть прямым или разрядно-инверсным). Так, например, в поточном устройстве БПФ, работающем по основанию 4 с разрядно-инверсным порядком сле- следования входных отсчетов, длина регистров от каскада к каскаду увеличивается в 4 раза. Групповой переключатель обеспечивает перестановку данных при переходе от этапа к этапу в соответствии с алгоритмом БПФ по основанию 4 с прореживанием по времени. Он представляет со- собой систему из четырех сблокированных переключателей вращаю- вращающегося типа с распределением контактов, представленным на рис. 5.22. Методика управления переключателями в такой схеме очень простая. Она заключается в том, что все четыре ротора переклю- переключаются на одно положение против часовой стрелки через каждые Lk тактов системы, где Lk определяет длину регистров задержки, соединенных с переключателем. Объем табличной памяти должен быть достаточным для хра- хранения частотных характеристик реализуемых фильтров. Запоми-
От АУК., -I к- Рвгистр задерж- задержки Регистр задержки Регистр задержпи Управление Регистр задерж- задержки 1X5 —сю КАУ* —to -СО Рис. 5.22. Типичная структура из регистров задержки и группового переключа- переключателя.
308 Глава 5 нающее устройство должно иметь четыре выхода, которые обслу- обслуживают одновременно все четыре потока данных в общей поточ- поточной схеме. Если размещение информации во всех блоках таблич- табличной памяти соответствует разрядной инверсии порядка следования выходных результатов прямого БПФ, то для обеспечения адреса- адресации табличной памяти достаточно одного счетчика. К каждому АУ подключено ЗУ, в котором хранятся соответст- соответствующие коэффициенты (в форме комплексной экспоненты W или величины угла поворота 6). При заданных алгоритме БПФ и его размере совокупность операций поворота, выполняемых на каждом из этапов БПФ, полностью определена, так что ЗУ может быть построено на элементах постоянной памяти. Если операции пово- поворота выполняются с помощью комплексных умножителей, то в табличные ПЗУ должны быть записаны отсчеты cos'6 и sin9. При использовании алгоритма CORDIC в ячейки ПЗУ должны быть занесены значения угла поворота 8 в арктангенсной системе счис- счисления1* [см. формулы E.34)], непосредственно управляющие ите- итерациями алгоритма CORDIC. 5.6.S. Сопоставление алгоритмов с разными основаниями При выборе основания алгоритма БПФ на этапе проектирова- проектирования поточного свертывателя приходится учитывать много различ- различных факторов. Один из них — объем аппаратуры, характеризуе- характеризуемый числом поворачивающих умножителей или совокупной дли- длиной всех регистров задержки. Другие факторы, такие, как типы используемых микросхем, характеристики проектируемого устрой- устройства и особенности его согласования с предшествующими и после- последующими устройствами системы, учитываемые на этапе оконча- окончательного выбора основания, зависят от, характеристик системы и их труднее оценить. Поэтому начнем с сопоставления числа умно- умножителей. На рис. 5.23 изображены блок-схемы арифметических уст- устройств, работающих по основанию 2,4 и 8. В АУ с основанием 2 используются сумматор, вычитатель и один поворачивающий ум- умножитель. На этих же элементах, но иначе скомпонованных, по- построены АУ с основаниями 4 и 8. Правда, во внутренней части АУ с основанием 8 появились поворачивающие умножители на фикси- фиксированные коэффициенты (это характерно и для АУ с основанием, превышающим 8), которых нет в АУ с основанием 4. Количество умножителей и сумматоров для АУ с различными основаниями, приходящееся на одно АУ, сведено в табл. 5.1. Несмотря на то что в АУ с основанием 4 используется в три раза больше умно- умножителей, чем в АУ с основанием 2, общее количество АУ при за- !) То есть для каждого 6 табулируется последовательность оазрядов at, г = 0,1,..., М—1. — Прим. перев.
Применение ЦОС в радиолокации 309 л0 At (Sb- 2 1 Aa W Рнс. 5.23. Блок-схема АУ, работающих по основанию 2, 4 и 8 (последние два собраны из узлов АУ по основанию 2).
310 Глава 5 данном размере БПФ сокращается вдвое, так что умножителей для алгоритма БПФ по основанию 4 оказывается в 1,5 раза боль- больше. Пересчитав, однако, объем оборудования к одному преобразо- преобразованию, найдем, что переход от основания 2 к основанию 4 приво- приводит к фактическому сокращению числа умножителей, так как ско- Таблица 5.1 Основание 2 Основание 4 Основание 8 Число умножителей 1 3 9 (включая внут- внутренние) Число сумматоров 2 8 24 рость поступления данных для алгоритма БПФ по основанию 4 может быть вдвое больше, чем при использовании основания 2. Чтобы показать это, напомним, что в поточном JV-точечном устрой- устройстве БПФ по основанию 2 входные отсчеты разделяются на два массива по N/2 отсчетов и подаются на оба входа АУ первого каскада. Таким образом, вся преобразуемая последовательность будет введена в поточное устройство БПФ, работающее по осно- основанию 2, за N/2 тактов. В то же время при использовании основа- основания 4 входные отсчеты делятся на четыре массива по N/4 отсчетов, поэтому для ввода всей преобразуемой последовательности пона- понадобятся только JV/4 тактов. Аналогично для основания 8 потребу- потребуются N/8 тактов. Итак, переход от основания 2 к основаниям 4 или 8 позволяет увеличить пропускную способность устройства или при заданной пропускной способности понизить его тактовую час- частоту. В заключение отметим, что вышесказанное справедливо лишь при условии, что все входные отсчеты подготовлены для непосред- непосредственного ввода в поточную структуру БПФ, т. е. операция упо- упорядочения выполнена с помощью буферного ЗУ, предшествующего блоку БПФ. Значительную часть общего оборудования, объем которой так- также зависит от выбора основания, составляют межкаскадные ре- регистры задержки. Как показали Голд и Байели [16], общая дли- длина этих регистров приближенно равна (/•+!)¦ E.37> Это выражение учитывает также размер входного буфера, равный {N12) {г—1), поэтому совокупная длина внутренних регистров за- задержки приблизительно равна jV и не зависит от основания алго- алгоритма в отличие от длины входного буфера, которая приблизи-
Применение ЦОС в радиолокации 3U тельно пропорциональна г. Пересчитав снова совокупную длину регистров к одному преобразованию, найдем, что объем обору- оборудования будет примерно одинаковым для алгоритмов БПФ с раз- различными основаниями, так как схемы с большим основанием об- обладают пропорционально большей пропускной способностью. В следующем разделе при обсуждении некоторых других схем построения фильтров снова будет рассмотрено влияние выбора ос- основания на характеристики получаемых фильтров. 5.6.6. Высокопроизводительные свертыватели В предыдущих разделах были рассмотрены основные факторы и параметры, существенные для реализации быстродействующего •фильтра-свертывателя, в котором приходится выполнять прямое БПФ, умножение на частотную характеристику и обратное БПФ. В данном разделе будут описаны четыре способа построения бы- быстродействующих свертывателей, причем для каждого из них бу- будет найдена оценка времени вычисления свертки. Во всех четырех •случаях будет предполагаться, что для выполнения БПФ исполь- используется поточная схема, а не итеративная (с одним АУ).. Поточная схема по сравнению с итеративной обладает большим быстродей- быстродействием, но она более громоздкая. Первый, наиболее непосредственный способ построения быстро- быстродействующего фильтра-свертывателя представлен на рис. 5.24, а. Оба БПФ по основанию г, прямое и обратное, реализуются аппа- ратурно, а вся система, как и оба устройства БПФ, является по- поточной. Если по-прежнему считать, что упорядочение данных на входе осуществляется с помощью входного буферного ЗУ, то ввод всех N преобразуемых отсчетов по г линиям произойдет за N/r тактов. Задержка при прохождении через поточное устройство БПФ равна (N—г)/г да N/r тактов (задержка, связанная с выпол- выполнением вычислений в АУ, мала по сравнению с N/r и не учиты- учитывается). Назовем временной интервал, состоящий из N/r тактов, перио- периодом. Из рис. 5.24, б видно, через сколько периодов массив отфиль- отфильтрованных отсчетов появится на выходе системы рис. 5.24, а. На первом периоде в устройство выполнения прямого БПФ вводится первый входной массив (он обозначен цифрой /). На втором пе- периоде результаты преобразования первого массива выводятся из устройства выполнения прямого БПФ и проходят через умножи- умножители. Если пренебречь небольшой задержкой данных в умножите- умножителях, то можно считать, что ввод данных в устройство выполнения обратного БПФ и вывод результатов из устройства прямого БПФ будут происходить одновременно. Еще один период потребуется на вывод результатов обратного преобразования. Устройство пря- прямого БПФ в это время может заполняться вторым массивом, ко- который обозначен цифрой 2. Сразу же после окончания ввода пер-
312 Глава 5 Табличная ламять tagzN каскадов Входное буферное ЗУ Линии '. tog, N каскадов Прямое SUP Ylepuod Выход блока, ппямлг/? 7зЛ*Р Вход блока обоатново ВП*Р Выход блона обратного E/IP a 2 7 J 3 1 2 z , t Обратное i i 3 , I 2 3 Рис. 5.24. Блок-схема согласованного фильтра с двумя поточными устройствами БПФ. а — блок-схема; б — временная диаграмма. вого массива второй массив будет перемещаться по всей поточной системе вслед за первым. Таким образом, фильтрация первого массива будет завершена за три периода, а затем на каждом из последующих периодов будет появляться по одному отфильтрован- отфильтрованному массиву. Последовательность выполнения вычислений во времени графически показана на рис. 6.25. Система с двумя устройствами БПФ может быть использова- использована при фильтрации входных массивов различными фильтрами. (Характеристики фильтров считываются из табличной памяти.) Однако во многих радиолокационных системах требуется, чтобы один и тот же входной массив был обработан несколькими различ- различными фильтрами. Прямое преобразование в этом случае достаточ- достаточно выполнить только один раз, а затем нужно сделать несколько обратных преобразований. Поэтому в данном случае целесооб- целесообразно исключить из приведенной на рис. 5.2, а блок-схемы фильт- фильтра одно из двух поточных устройств БПФ, что позволит значитель- значительно уменьшить объем оборудования. На этом подходе и основаны другие три способа реализации фильтра-свертывателя.
Применение ЦОС в радиолокации 313 12 3 4 Число о/трильтроваш/ых массивов Рис, 5.25. Временные характеристики четырех схем построения согласованного фильтра, использующих два поточных устройства БПФ, одно устройство прямого БПФ, одно устройство обратного БПФ и перестраиваемое устройство БПФ. О два поточных БПФ; % одно прямое БПФ; ? одно обратное БПФ; X перестраиваемое БПФ. Блок-схема второго варианта согласованного фильтра пред- представлена на рис. 5.26, а. Для упрощения чертежа вместо г линий передачи данных изображена одна линия, однако следует не за- забывать, что она соответствует г линиям. В этой схеме сначала вы- выполняется прямое БПФ, а его результаты накапливаются в про- промежуточной памяти. Затем они умножаются на частотную харак- характеристику фильтра и выполняется обратное БПФ. Такая схема поз- позволяет многократно считывать результат прямого преобразования из промежуточной памяти и, умножая его на характеристики раз- различных фильтров, обрабатывать один и тот же входной массив этими фильтрами, причем отфильтрованные массивы будут появ- появляться на выходе последовательно. Рассмотрим некоторые особенности схемы, представленной на рис. 5.26, а. Прежде всего порядок следования результатов прямо- прямого БПФ разрядно-инверсный. В рассмотренной выше схеме с дву- двумя устройствами БПФ это не создавало проблемы, так как уст- устройство обратного БПФ было специально рассчитано на поступ- поступление входных отсчетов с разрядной инверсией их номеров, при- причем порядок следования выходных результатов при этом оказы- оказывался прямым1'. В схеме на рис. 5.26, а используется только одно " Предполагается, что рассматриваемая система с одним устройством прямо- прямого БПФ строится по схеме, приведенной на рис. 5.19. Возможна также реализа- реализация устройства обратного БПФ с прямым порядком поступления входных дан- данных, однако его схема будет отлична от схемы рис. 5.20.
314 Глава' 5 Таблич- Табличная память Входное бушерное ЗУ Прямой порядок Прямой порядок , г Промежуточ- Промежуточная память с ра зря дно- имеерсной адресацией Разрядно- инверсный порядок Сдвоенное выходное буферное ЗУ Прямой -поря- дох Вход блока прямого БЛ<Р I Выход блока прямого ШФ Вход промежуточной памяти\г Выход промЕжг/шчной памяти Вход блока обратного 1 2 1 2 3 1 1 3 | Выход блока обратного Вход первого выходного бу/рерноео ЗУ Вход второго выходного бурернога ЗУ Выход первого выходного буферного 31/ Выход второго вь/ходного буферного ЗУ б Рис. 5.26. Согласованный фильтр с одним устройством прямого БПФ. а — блок-схема; б — временная диаграмма. устройство БПФ, на вход которого данные должны поступать в прямом порядке. Для устранения разрядной инверсии достаточно результаты первого преобразования считывать из промежуточной памяти, используя разрядную инверсию их номеров. При этом в устройстве прямого БПФ будет выполняться второе преобразова- преобразование над данными, снова следующими в прямом порядке. Резуль- Результаты второго преобразования размещаются в выходном буферном ЗУ. При считывании из этого' ЗУ снова необходимо использовать разрядную инверсию адресов, чтобы устранить разрядную инвер- инверсию номеров выходных отсчетов второго БПФ. Выходное буфер- буферное ЗУ дублируется для того, чтобы иметь возможность на каж- каждом периоде выводить последовательные отфильтрованные мас- массивы.
Применение ЦОС в радиолокации 315 Табличная память РазряЗно- чверсшй лоряЗоп Входное буферное ЗУ Разрядяо- инверснь/й порядок Промежуточная память с раз рядно - инверсный адресацией Прямой поряден а Вход блока прямого БЛФ Выход блома прямого ^'Вход промежуточной памяти] Выход промежуточной памяти Вход блоха обратного Выход блока обратного 1 2- Рис. 5.27. Согласованный фильтр с одним устройством обратного БПФ. а — блок-схема; б — временная диаграмма. Поскольку в устройствах прямого и обратного БПФ использу- используются комплексные экспоненты с разными знаками в показателе степени и в рассматриваемой схеме оба преобразования выполня' ются в одном и том же устройстве прямого БПФ, над результа- результатами прямого и обратного преобразований, а также над отсчета- отсчетами частотной характеристики фильтра необходимо выполнить опе- операцию комплексного сопряжения. Временная диаграмма работы фильтра с одним устройством прямого БПФ приведена на рис. 5.26, б. Вывод первого отфильтро- отфильтрованного массива заканчивается через пять периодов, а затем на последовательных периодах выводятся последующие массивы (рис. 5.25). Третья блок-схема фильтра-свертывателя приведена на рис. 5.27, а, В ней используется одно устройство для выполнения об-
316 Глава 5 Табличная память Входное буферное ЗУ Промежуточная память Прямой порядок Разрядно- —инверс- —инверсный порядок Прямой порядок. Вход блока прямого ВПФ Выход блока прямого БПФ Вход промежуточной, памягт^ 1 Бь/ход промежуточной памяти Вход блока обратного ff/TP выход блока обратного Б/793 I ; 121 Рис. 5.28. Согласованный фильтр с перестраиваемым устройством БПФ. а — блок-схема; 6 — временная диаграмма. ратного БПФ, причем отсчеты обрабатываемого массива считы- ваются из входного буферного ЗУ в разрядно-инверсном порядке. Результаты преобразования накапливаются в прямом порядке в промежуточной памяти, откуда затем считываются в разрядно- инверсном порядке, после чего выполняется обратное БПФ. Как и в предыдущей схеме, после каждого преобразования необходимо выполнять операцию комплексного сопряжения (это относится и к частотной характеристике фильтра, хранящейся в табличной па- памяти). Из временной диаграммы рассматриваемой схемы (рис. 5.27, б) следует, что вывод первого отфильтрированного массива заканчивается через четыре периода после начала обработки. Входное буферное ЗУ рассматриваемой схемы должно допус- допускать разрядно-инверсную адресацию. Так как во многих системах объем буферного ЗУ весьма велик (намного больше объема про- промежуточной памяти), то удовлетворить этому требованию на прак- практике бывает непросто. От этого недостатка, а также от необходи-
Применение ЦОС в радиолокации 3j_7 мости в разрядно-инверсной адресации промежуточной памяти свободна четвертая схема с перестраиваемым устройством БПФ (рис. 5.28, а), в котором межкаскадные задержки коммутируются таким образом, что обеспечивается выполнение и прямого, и об- обратного преобразований. Блок-схема такого перестраиваемого уст- устройства, предназначенного для преобразований массивов из 16 К отсчетов с использованием алгоритма БПФ по основанию 4, при- приведена на рис. 5.29. При выполнении прямого преобразования дан- данные пропускаются через межкаскадные регистры задержки в на- направлении уменьшения их длины, а при выполнении обратного пре- преобразования— в направлении увеличения. Указанные на рис. 5.29 числа соответствуют совокупной длине регистров задержки каж- каждого из каскадов. Следует отметить, что для прямого и обратного преобразований порядок считывания коэффициентов из ПЗУ бу- будет неодинаковым. Временная диаграмма работы схемы с перестраиваемым уст- устройством БПФ приведена на рис. 5.28,6. Как и в третьей схеме (с одним устройством для выполнения обратного БПФ), вывод первого отфильтрованного массива заканчивается через четыре периода после начала обработки. С первого взгляда может пока- показаться, что один период можно было бы исключить из общей за- задержки, если появляющиеся на выходе результаты прямого БПФ сразу же подавать на выполнение обратного преобразования, ми- минуя промежуточную память. Однако, поскольку при выполнении обратного преобразования данные проходят сначала через меж- межкаскадные регистры задержки наименьшей длины, они быстро «догонят» отсчеты, над которыми все еще выполняется прямое преобразование. Чтобы избежать этой ситуации, достаточно по- подождать, когда поточное устройство БПФ полностью освободится, завершив прямое преобразование (на что затрачивается один пе- период), а затем начать выполнение обратного БПФ. Поэтому об- общая задержка в фильтре оказывается равной четырем периодам. Отметим также, что в принципе обратное преобразование можно1 начать несколько раньше, не дожидаясь, пока прямое преобразо- преобразование завершится полностью, что позволит сократить общую за- задержку на некоторую небольшую долю периода (на рис. 5.28, б эта возможность не отражена). Сопоставим описанные выше четыре схемы построения фильт- ров-свертывателей, воспользовавшись их временными характери- характеристиками, приведенными на рис. 5.25. Наибольшее быстродействие имеет схема с двумя поточными устройствами БПФ, но она наи- наиболее громоздка. Схема с одним устройством обратного БПФ об- обладает лучшим быстродействием, чем схема с одним устройством прямого БПФ, и к тому же в ней нет необходимости использовать сдвоенное выходное буферное ЗУ. Такое же быстродействие име- имеет схема с перестраиваемым устройством БПФ, но в ней не тре- требуется разрядно-инверсная адресация ни выходного буферного ЗУ,
318 Глава. 5 Bxoff Выход Ламять коэффи- коэффициентов АУ Память коэффи- коэффициентов т г © АУ Память коэффи- коэффициентов Рис. 5.29. Перестраиваемая структура БПФ для выполнения 16 384-точечных преобразований по основанию 4.
Применение ЦОС в радиолокации ¦319. 24-00 2300 - 2200 - 2100 2000 МО 1800 1700 1600 1500 | 1400 # 1300 | 1200 ¦f иоо ¦§ 1000 900 800 700 600 S00 400 300 200 100 О ЮООг ПООг 1500- -1400 1300 - 1200 1100 -1000 900 - 800 700 - 600 500 - 400 300 - 200 100 о 1100 - 1000 - 800 - 900 800 700 - воо 500 400 - 300 200 100 О Г 800 900 - 700 600 500 Ш 300 200 то о 700 600 -¦500 4К- точечное BfTP Рис. 5.30. Зависимость продолжительности обработки в схеме с перестраиваемым устройством БПФ от основания алгоритма БПФ. Тактовая частота равняется 10,. 15, 20, 25 и 30 МГц. ни промежуточной памяти. Более того, за счет увеличения началь- начальной задержки всего на один период объем оборудования сокраща- сокращается по сравнению с первой схемой на целое поточное устройство- БПФ. Таким образом, схема с перестраиваемым устройством БПФ наиболее подходит, когда один и тот же массив приходится мно- многократно обрабатывать различными фильтрами, что часто имеет место в современных радиолокационных системах. Целесообразно оценить время, затрачиваемое на обработку в. системе с перестраиваемым устройством БПФ при использовании различных оснований, и пропускную способность системы, если ориентироваться на выпускаемые в настоящее время микросхемы. Эти характеристики для размера преобразования 4К приведены на рис. 5.30. Время обработки взято из рис. 5.25 с учетом того, "что период содержит N/r тактов. Данные на рис. 5.30 соответству- соответствуют нескольким значениям тактовой частоты. Отметим, что выбор
320 Глава 5 тактовой частоты 10 МГц является вполне обоснованным. Более того, в настоящее время создается система, рассчитанная на 16 384-точечное преобразование и имеющая тактовую частоту 30 МГц. Выше уже было отмечено, что увеличение основания при за- заданной тактовой частоте приводит к сокращению времени обра- обработки, а при заданной продолжительности обработки позволяет понизить тактовую частоту системы. Последнее существенно с точ- точки зрения уменьшения объема оборудования, так как появляется возможность упростить его и, кроме того, использовать серии мик- микросхем более высокого уровня интеграции. 5.6.7. Моделирование обработки ЛЧМ-сигналов При разработке поточного устройства БПФ всегда приходится решать проблему выбора разрядности. Если разрядность слиш- слишком мала, возникающий шум будет искажать отклик согласован- согласованного фильтра; если же она слишком велика, объем аппаратуры устройства БПФ может стать недопустимо большим. Таким обра- образом, необходимо выбрать оптимальную разрядность, совместно учитывая и необходимый объем оборудования, и характеристики системы, которые нужно уметь оценивать. Часто задача выбора разрядности решается с помощью моделирования, так как работу цифрового устройства можно точно воспроизвести на вычисли- вычислительной машине. В данном разделе представлены некоторые ре- результаты моделирования обработки ЛЧМ-сигналов и рассмотрены эффекты, с которыми приходится сталкиваться при выполнении вычислений с конечной точностью. Во всех приводимых ниже примерах использовались ЛЧМ-сиг- налы, поскольку их просто генерировать. База ЛЧМ-сигнала во всех случаях составляет 2048, частота дискретизации равна часто- частоте Найквиста, причем при обработке используется согласованный фильтр со взвешиванием по Хеммингу. Тем не менее результаты, связанные с подавлением боковых лепестков и шумами обработ- обработки, справедливы и для сигналов другого типа. На рис. 5.31 показано сечение идеальной функции неопреде- неопределенности ЛЧМ-сигнала вдоль временной оси. Вообще в нем долж- должно быть 4096 ненулевых отсчетов, но здесь показана только цент- центральная четверть сечения, содержащая 1024 отсчета. Входные отсчеты смещены относительно характеристики фильтра на полови- половину элемента разрешения по дальности, т. е. р = 0,5, поэтому цент- центральный пик отклика согласованного фильтра оказался посредине между двумя отсчетами, образующими главный максимум на рис. .5.31. На рис. 5.32 и 5.33 проиллюстрированы два вида искажений. Эффект квантования входного сигнала иллюстрируется на рис. 5.32 (рассматривается 8-разрядный АЦП), причем снова изобра-
Применение ЦОС в радиолокации 321 жена только центральная четверть сечения функции неопределен- неопределенности. Этот пример важен тем, что позволит дать сравнительную оценку другим видам искажений, обусловленным конечной точно- Рис. 5.31. Сечение идеальной функции неопределенности ЛЧМ-сигнала вдоль временной оси (показана центральная четверть сечения). База сигнала TW-5048, в согласованном фильтре используется взвешивание по Хеммингу, относительное смещение между отсчетами сигнала и фильтра р=0,5. стью систем обработки. Данные на рис. 5.33, а к б соответствуют двум длинам слов, используемых в АУ схемы БПФ. Сечения функ- Рис. 5.32. Отклик идеального согласованного ЛЧМ-фильтра со взвешиванием по Хеммингу и 8-разрядным АЦП на входе. ции неопределенности на рис. 5.33, а и б соответствуют 11-разряд- 11-разрядной и 9-разрядной мантиссе. Очевидно, что в последнем случае наблюдается больше ложных откликов. Из сопоставления сечений, изображенных на рис. 5.32 и 5.33, а, следует, что при использова-
322 Глава 5 Рис. 5.33. Отклик согласованного ЛЧМ-фильтра со взвешиванием по Хеммингу, 8-разрядным АЦП на входе и конечной разрядностью слов. а — П-разрядные манти;сы; 6 — 9-разрядные мантиссы. Рис. 5.34. Отклик согласованного ЛЧМ-фильтра со взвешиванием по Хеммингу, 8-разрядным АЦП на входе и конечной разрядностью слов. Отношение сиг- сигнал/шум на входе равно—16,29 дБ. ¦; о—11-разрядные мантиссы; б — 9-разрядные мантиссы. (
Применение UUC в радиолокации 323 нии 11-разрядной мантиссы система оказывается почти идеальной, а искажения отклика в основном обусловлены 8-разрядным АЦП. Однако в сечении функции неопределенности системы с 9-разряд- 9-разрядной мантиссой (см. рис. 5.33,5) появляется много ложных откли- откликов, превышающих уровень —60 дБ, которые являются результа- результатом уменьшения разрядности мантиссы с 11 до 9 бит. В приведенных выше примерах предполагалось, что входной ¦сигнал занимает весь диапазон преобразования 8-разрядного АЦП, поэтому отношение сигнал/шум на входе получается большим. Од- Однако на практике значительно чаще оно составляет—16,29 дБ, а ¦при этом расчетное отношение сигнал/шум на выходе идеального •согласованного фильтра со взвешиванием по Хеммингу оказыва- ¦ется равным 15,48 дБ. Соответствующие сечения функции неопре- неопределенности для 11- и 9-разрядной мантисс представлены на рис. 5.34, а и б. Считается, что дисперсия входного шума о2 такова, что •alq=\, где q — шаг квантования АЦП. Основания для выбора именно такого отношения a/q рассматриваются в разд. 5.8. Отме- Отметим, что, если даже амплитуда входного сигнала намного меньше шага квантования АЦП, после сжатия импульса можно наблюдать главный максимум на уровне 0 дБ и два других отсчета на глав- главном лепестке, которые будут выше уровня шумов на рис. 5.34, а я б. 5.6.8. Обнаружитель" Во всех радиолокационных системах данные с выхода согла- согласованного фильтра поступают в обнаружитель, предназначенный для уменьшения объема данных. В обнаружителе выходные от- отсчеты согласованного фильтра сравниваются с некоторым поро- порогом, причем возможные отклики целей (т. е. те, которые превы- превышают порог) отмечаются, а остальные отсчеты вообще могут быть опущены. Общая блок-схема одного из обнаружителей изображе- изображена на рис. 5.35. На входе обнаружителя приближенно рассчиты- рассчитывается амплитуда (т. е. модуль) комплексного отсчета сигнала по ¦его мнимой и действительной частям / и Q. Затем оценивается пи- пиковое значение этого модуля по трем соседним отсчетам амплиту- амплитуды. В блоке стабилизации вероятности ложной тревоги (СВЛТ) находится оценка уровня фонового шума (или уровня помехи от местных предметов), которая используется для автоматического поддержания на постоянном уровне вероятности ложной тревоги. В блоке формирования порога выбирается и устанавливается один из нескольких возможных пороговых уровней, с которым сравни- сравнивается оценка пикового значения амплитуды сигнала. После каж- каждого сравнения формируется и передается по двоичному каналу для дальнейшего анализа одноразрядное число, указывающее, пре- 11 Материал этого раздела основан на работе А. Е. Филипа. 21*
324 Глава 5 От согласо- согласованного'- фильтра Вычисление модуля Оценивание амплитудб! СВЛТ Одноразрядный канал НФ Сравнение Постоянные интегрирования Формиравание порога Выбор порога Управление Дешифратор команд Рис. 5.35. Блок-схема обнаружителя радиолокационной системы. (СВЛТ—блок стабилизации вероятности ложной тревоги.) вышает ли значение пика амплитуды сформированный пороговый уровень. Рассмотрим работу обнаружителя подробнее. Для точного вычисления амплитуды комплексного отсчета тре- требуется выполнение операции извлечения корня, которая довольно сложно реализуется аппаратными средствами. Поэтому для на- нахождения амплитуды используются приближенные, но более про- простые формулы [13]. Одна из них заключается в выборе макси- максимального из следующих четырех значений: 1/1, -2-1/l-h-g-IQU IQI. E.38) Ошибка определения амплитуды по этой формуле не превышает 2,98% ее истинного значения. При оценке пика амплитуды часто используется трехточечная параболическая интерполяция. Оценке подлежат значение пика и его положение. Оценка пика амплитуды нужна для того, чтобы избежать уменьшения пика (максимум на 1,75 дБ, а в среднем на 0,5 дБ), которое может иметь место при согласованной фильтра- фильтрации ЛЧМ-сигнала со взвешиванием по Хэммингу и дискретизаци- дискретизацией с частотой Найквиста. Расчетные формулы для определения по-
Применение ЦОС в радиолокации 325 ложения а пика амплитуды по дальности и его величины А имеют следующий вид: 2 У1~ где г/г — используемые при интерполяции значения амплитуды. От- Отметим, что можно не использовать для оценивания пика амплиту- амплитуды довольно сложное устройство из четырех сумматоров, одного умножителя и одного делителя, а просто на 0,5—1,0 дБ снизить пороговый уровень, но при этом иметь в виду, что вероятность ложной тревоги возрастет в 8—12 раз. Автоматическое формирование порогового уровня по среднему значению амплитуды принятого сигнала производится с помощью интегратора блока СВЛТ. Цель автоматического' формирования порога заключается в том, чтобы уменьшить вероятность ложной тревоги из-за медленных флуктуации уровней фанового шума или помех от местных предметов. Порог, вычисляемый о помощью блока СВЛТ, является функцией выбранной вероятности ложной тревоги (Рлт) и среднего квадратического значения уровня сигна- сигнала на некотором участке интервала приема. В предположении, что эхо-сигнал обрабатывается при наличии аддитивного белого гаус- совского шума, выражение для порога, формируемого после ин- интегратора блока СВЛ1, записывается в следующем виде: E.41) Множитель в квадратных скобках — константа, которую можно вычислить заранее и хранить в памяти. Другой множитель \xs(n) представляет собой среднее значение амплитуды принятого сиг- сигнала. Оно равно свертке последовательности отсчетов амплитуды с единичной прямоугольной весовой функцией конечной длитель- длительности, задержанной соответствующим образом. Выбор прямоуголь- прямоугольной весовой функции является очевидной, но далеко не единствен- единственной возможностью. Отметим, что интегратор блока СВЛТ имеет конечное время установления, только по прошествии которого формируемый порог может быть использован. Если порог обна- обнаружителя рассчитывается с помощью блока СВЛТ, то время ус- установления должно быть учтено* при выборе интервала приема в системе обработки данных. По двоичному каналу к устройству вторичной обработки пере- передается информация, показывающая, какие отсчеты амплитуды на интервале приема превысили пороговый уровень. Такой способ сжатия объема данных используется для того, чтобы упростить и, -следовательно, ускорить выполнение операции вторичной обра-
.326 Глава 5 ¦ . «-ботки в режимах поиска и измерений* Кодирование информации, -передаваемой по двоичному каналу, элементарное: i-e двоичное "-число равно 1, если i-я оценка пикового значения амплитуды пре- превышает ?-е значение порогового уровня. Последовательность пере- пережданных двоичных чисел и вычисленные значения порога накапли- накапливаются в выходном буферном накопителе. Все комплексные отсчеты ^массивы / и Q) обычно также заносятся в выходное буфер- буферное ЗУ независимо от того, превышают ли полученные путем ин- интерполяции пики амплитуды порог. Таким образом, сохраняются все данные с тем, чтобы их можно было (при необходимости) ис- использовать при вторичной обработке, в частности когда для улуч- улучшения точности измерений вблизи порога обнаружения приходит- приходится использовать сложные алгоритмы. При этом в систему прихо- приходится вводить дополнительную память, что с аппаратурной точки зрения оказывается вполне приемлемым. 5.6,9. Вторичная обработка1' В предыдущих разделах были рассмотрены основные этапы об- обработки сигналов — фильтрация и пороговое обнаружение — и опи- описаны способы их реализации в цифровой форме. Следующий этап обработки, выполняемый практически во всех радиолокационных системах после фильтрации и обнаружения, обычно называют вто- вторичной обработкой. В общем случае на этом' этапе по выходным результатам согласованного фильтра и обнаружителя находятся метрика целей и количественная информация (дальность, скорость, угловое положение, ЭПР и т. д.). Кроме того, в тех случаях, когда обнаружитель выявил большое количество целей или когда в пре- пределах просматриваемого пространства принимаются интенсивные помехи от местных предметов, также требуется5 специальная вто- вторичная обработка, которая может заключаться просто в опреде- определении границ области размещения целей или в сопоставлении эхо-сигналов от нескольких зондирующих импульсов, чтобы вы- выявить, какие превышения порога соответствуют реальным целям. Для решения этих задач в устройстве вторичной обработки нужно накапливать большие массивы данных, причем алгоритмы их об- обработки могут быть весьма сложными, а продолжительность обра- обработки достаточно большой. Во многих радиолокационных системах информация для вторичной обработки передается в большие уни- универсальные системы обработки данных (СОД). Правда, СОД все в большей степени загружаются решением задач общего управле- управления радиолокатором, поэтому для вторичной обработки желатель- желательно им<еть специализированное устройство, которое обеспечило бы выполнение операций отображения целевой обстановки, формиро- ') Материал этого раздела заимствован у Д. М. Франковича.
Применение ЦОС в радиолокации 327 вания метрики целей и уменьшения объема и скорости поступле- поступления данных в СОД. Аппаратурное устройство вторичной обработки может вклю- включать набор блоков, каждый из которых выполняет определенную функцию. Однако в последнее время все чаще используются про- программируемые устройства, что позволяет реализовать различные алгоритмы обработки, пользуясь одним и тем же оборудованием. Часто в сложных радиолокационных1 системах приходится приме- применять целый набор взаимосвязанных алгоритмов, поэтому в каче- качестве устройства вторичной обработки желательно иметь неболь- небольшую, но быстродействующую универсальную вычислительную ма- машину. В данном разделе будут рассмотрены программируемые устройства вторичной обработки; будут приведены характеристики серийно выпускаемых, а также специально разработанных уст- устройств. В настоящее время имеется множество универсальных мини- ЭВМ, оперирующих с малоразрядными словами (обычно 16 бит), которыег могут выполнять команды с частотой ~ 1 МГц. В неко- некоторых системах они довольно успешно применялись, так как для задач обработки сигналов не требуется большая длина слов. Бы- Было создано также несколько универсальных мини-ЭВМ, специаль- специально предназначенных для обработки сигналов, в которых на базе микросхем эмиттерно-связанной логики (ЭСЛ) или транзисторно- транзисторной логики (ТТЛ) с диодами Шоттки частота выполне- выполнения команд была доведена до 10 МГц. Ключевым моментом при разработке таких машин является создание быстродействующего умножителя, так как операция умножения используется во многих алгоритмах обработки. Однако высокое быстродействие должно быть обеспечено также и по вводу-выводу, поскольку через систе- систему вторичной обработки проходит большой объем данных. Кроме того, разработаны многопроцессорные машины с процессорами, подключенными к общей шине, которые можно использовать для вычисления пика амплитуды и обеспечения ввода-вывода, разгру- разгрузив таким образом систему обработки данных [23]. Ниже некото- некоторые из перечисленных вычислительных машин будут рассмотрены подробнее. В последние годы началось серийное производство вычисли- вычислительных машин, предназначенных специально для обработки сиг- сигналов. Кроме того, были разработаны машины, предназначенные для военных и научно-исследовательских целей. Все эти машины используют малоразрядные слова, но каждая из них имеет) свою особую структуру, которая выбиралась таким образом, чтобы до- добиться в каждом конкретном случае максимально возможной ско- скорости вычислений за счет жесткой синхронизации работы блоков памяти и арифметических устройств. Серийное производство вычислительных машин для1 обработки сигналов было начато в конце 60-х годов. Использование в них
328 ^первых ТТЛ-микросхем памяти средней интеграции) и логики ма- малой интеграции позволило уменьшить длину тактового интервала до 300 не. Объем памяти, которую можно было; собрать на этих микросхемах, ограничен, поэтому для ее расширения использова- использовались ферритовые кубы. За счет специальной организации прохож- прохождения данных и команд через блоки быстродействующей памяти обработка сигналов выполнялась значительно быстрее, чем на обычных универсальных мини-ЭВМ. Важной характерной особен- особенностью этих машин было включение в их структуру файла регист- регистров хранения (содержащего до 32 и более регистров) в микро- микросхемном исполнении {17], что позволяло оперировать с большим числом операндов, не пересылая их в основную память и обрат- обратно. Из вышеизложенного видно, каким образом первые микросхе- микросхемы средней интеграции начали использоваться для обработки сигналов. В последние годы разработка универсальных вычислительных машин развивалась в направлении использования новых микро- микросхем еще более высокого уровня интеграции. Кроме того, струк- структурно машины разбивались на несколько блоков, что позволяло ускорить выполнение операций за счет распараллеливания. Так, например, в одной из последних вычислительных машин [1] пересылка данных обеспечивается блоком ввода-вывода, а для выполнения операций используются два блока — арифметический и индексный. В арифметическом блоке производятся вычисления, относящиеся к фильтрации или вторичной обработке. Назначени- Назначением индексного блока является управление пересылками данных в пределах отдельных небольших блоков оперативной памяти с произвольным доступом (ОЗУ) и постоянной памяти (ПЗУ), соб- собранных на микросхемах и содержащих некоторые программы и массивы данных. Арифметический блок имеет поточную побайт- побайтную (а не пословную) структуру, выбранную для того, чтобы со- согласовать требования к быстродействию и объему оборудования. Вся логика собрана на ТТЛ-микросхемах с диодами Шоттки. Для такой вычислительной машины время выполнения базовой опера- операции БПФ по основанию 2 равно 1 мкс, причем одновременно осу- осуществляется ввод-вывод. В другой серийно выпускаемой вычисли- вычислительной машине это время составляет 7г мкс. ЭСЛ-микросхемы логики и памяти средней интеграции были созданы несколько позднее аналогичных микросхем серии ТТЛ. Первые вычислительные машины, в которых они использовались, были в основном мощными или сверхмощными с очень высоким быстродействием '[43]. Такие машины приходилось строить на дискретных компонентах и ЭСЛ-микросхемах малой интеграции; позже стали использоваться микросхемы средней и большой ин- интеграции. Интересно отметить, что эти сверхмощные вычислитель- вычислительные машины, так же как и первые машины для обработки сигна- сигналов, относились к числу ЭВМ с последовательным выполнением
" Применение ЦОС в радиолокации 329 команд и последовательной обработкой данных, в которых высо- высокая производительность достигалась главным образом за счет быстродействия и высокого уровня интеграции применяемых ком- компонент, а также благодаря некоторым усовершенствованиям в общей организации вычислительного процесса. В более поздних вычислительных машинах для обработки сигналов команды об- обработки начали разделять таким образом, чтобы организовать од- одновременное выполнение нескольких команд; так, выполнение уп- управляющих команд программы было перенесено на дополнитель- дополнительный управляющий процессор, работающий одновременно с ариф- арифметическим процессором. В быстродействующем цифровом процессоре FDP (Fast Digi- Digital Processor), разработанном в лаборатории Линкольна Масса- чусетского технологического института и предназначенном для научных исследований, был использован другой подход к обеспе- обеспечению высокой производительности при обработке сигналов [15]1'. За счет четырехкратного распараллеливания в арифметическом устройстве и соответствующей организации ЗУ данных с парал- параллельным доступом была создана вычислительная машина с после- последовательным выполнением команд, но с параллельной обработкой данных, которая позволяла при решении задач обработки сигна- сигналов достичь исключительно высокого для малых ЭВМ быстродей- быстродействия. Собранный главным образом на логических ЭСЛ-микросхе- мах малого уровня интеграции и микросхемах памяти этой же се- серии средней интеграции процессор FDP имеет время выполнения команды 150 не. Однако вследствие применения выпускавшихся в то время микросхем серии ЭСЛ II и необходимости распарал- распараллеливания арифметических операций размеры этой машины оказа- оказались довольно большими. В следующей, более поздней разработке лаборатории Линколь- Линкольна — цифровой вычислительной машине для исследования звуков [4], также предназначенной для решения задач обработки сиг- сигналов,— были широко использованы ЭСЛ-микросхемы средней ин- интеграции. Эта вычислительная машина была создана главным об- образом для анализа речевых сигналов в реальном времени, однако после соответствующей модификации ее оказалось возможным ис- использовать и для обработки радиолокационных сигналов. Она име- имеет раздельные ОЗУ данных и программ с одновременным обра- обращением к ним, собранные на ЭСЛ-микросхемах большой интегра- интеграции; среднее время выполнения команд равняется 55 не. Команды и данные обрабатываются последовательно; ЭВМ имеет быстро- быстродействующий умножитель, построенный на ЭСЛ-микросхемах сред- средней интеграции, а также специальный набор команд, обеспечива- ]) Подробно этот процессор описан в книге Л. Рабинера и Б. Гоулда «Теория и применение цифровой обработки сигналов». — М.: Мир, 1978. —Прим. перев.
330 Глава 5 ющих высокое быстродействие при решении задач обработки сиг- сигналов. Распараллеливание арифметических операций, использо- занное в процессоре FDP и других вычислительных машинах для того, чтобы достичь высокого быстродействия при выполнении ЪПФ, здесь не применялось, что привело к значительному сокра- сокращению объема и стоимости оборудования, а также к упрощению программирования. Попытки использовать различные универсальные мини-ЭВМ, а также более мощные машины в тех или иных устройствах радио- радиолокационной системы для обработки сигналов предпринимались неоднократно, однако успешными они были только в тех случаях, когда требовалось небольшое быстродействие. В противном слу- случае необходимо увеличить производительность ЭВМ. Один из под- подходов заключается в том, чтобы подключить к ней периферийное специализированное устройство, которое может выполнять опера- операции умножения и сложения, используемые при фильтрации. Аппа- Аппаратурная реализация этого устройства не будет ограничена допол- дополнительными требованиями, характерными для обычных универсаль- универсальных ЭВМ. При построении специализированного устройства мож- можно максимально использовать новейшие микросхемы для получе- получения большого быстродействия и выбрать разрядность и формат данных так, чтобы они наилучшим образом подходили для каж- каждого конкретного применения. Периферийные устройства этого ти- типа уже начали выпускаться серийно. Одновременно с первыми мини-ЭВМ появились специализированные устройства, названные процессорами для обработки массивов. С помощью типового про- процессора массивов быстро и эффективно могут быть выполнены та- такие операция, как обращение матрицы или фильтрация. Если ¦Центральная ЭВМ процессора массивов не принимает участия в обработке данных,.то фактически этот процессор представляет со- собой специализированную вычислительную машину для обработки сигналов, для которой центральная ЭВМ является управляющей. Часто оказывается, что рассмотренные выше процессоры либо не могут быть непосредственно использованы для выполнения ал- алгоритмов вторичной обработки, либо имеют недостаточное быст- быстродействие. Единственное, что остается в этом случае, это, учи- учитывая специфику обработки сигналов в радиолокации и используя методы распараллеливания и соответствующие микросхемы, раз- разработать новое устройство, которое удовлетворило бы предъявля- предъявляемым требованиям. Создание такого устройства, обеспечивающего и нужную производительность, и возможность простого програм- программирования, является интересной, но не простой задачей. Удовлет- Удовлетворить обоим требованиям удается далеко не всегда; в последние годы в этой области ведутся интенсивные работы, направленные прежде всего на создание специализированных микросхем и но- новых структур вычислительных машин. :
Применение ЦОС в радиолокации 331 5.6.10. Генератор сигналов Чтобы в полной мере использовать ту гибкость, которая, свой- свойственна цифровым устройствам обработки, необходимо обеспечить генерацию самых разнообразных радиолокационных сигналов, в том числе ЛЧМ-импульсов, равномерных и неравномерных пачек и т. д. Блок-схема цифрового генератора сигналов изображена на рис. 5.36. Он состоит из следующих пяти основных подсистем: ЗУ Репурренгп- ный гене- генератор в I и Q Комми-\ &. та/пор | Таблич- Табличная па- память Sin 9 Cosd il Комму- Коммутатор I ив ЦАП, Аналога вый ПреобраА зоеатель\ уас/лоты\ Рис. 5.36. Блок-схема цифрового генератора сигнала. 1) ЗУ и рекуррентного генератора, 2) табличного ЗУ, 3) цифро- аналогового преобразователя (ЦАП), 4) аналогового фильтра для сглаживания выходного сигнала ЦАП и 5) смесителей для пере- перенесения спектра сигнала на соответствующую промежуточную частоту. ЗУ, рекуррентный генератор и табличное ЗУ используются для генерации отсчетов сигнала, спектр которого размещен в основной полосе. Для нахождения отсчетов можно воспользоваться двумя способами: либо непосредственно считывать из памяти оба отсче- отсчета квадратурных колебаний / и Q и подавать на ЦАП, либо (ес- (если зондирующее колебание модулировано только по фазе) рекур- рентно вычислять значения фазы или считывать их из ЗУ, а за- затем по этим значениям из табличной памяти выбирать отсчеты синуса и косинуса в качестве I я Q. Ввиду исключительно широкого распространения ЛЧМ-сигна- лов, как правило, целесообразно ввести в состав генератора блок изменения фазы по квадратичному закону. Алгоритм работы этого блока — рекурсия 2-го порядка — описывается следующими фор- формулами: додэ вя=ея.1+Ав„, n= E.42) =о, N^eTW.
332 Глава 5 Здесь TW —база ЛЧМ-сигнала, е — коэффициент превышения ча- частоты дискретизации над шириной полосы W, (N-\-l) —число формируемых отсчетов сигнала. Полученная последовательность значений фазы Qn = (TW/N2). (п—N)n представляет собой результат дискретизации сЬункции, юписывающей фазу непрерывного ЛЧМ-жюлебаиия в моменты вре- времени tn = nTjN, n = 0, 1, ..., N. Мгновенная частота непрерывного колебания 6 (t) равна —!-. E.43) -Она меняется по линейному закону от —W/2 до -f-W/2 на интер- интервале О^^^Г. Чтобы сформировать излучаемое колебание со спектром в ос- основной полосе, нужно использовать обе квадратурные компоненты комплексного сигнала. Поэтому по, значению фазы ?) необходимо •найти косинус и синус (например, выбрав их из табличной памя- памяти) . Из результатов моделирования следует, что для ЛЧМ-сигна- . лов с базой, равной 2048, 10-разрядное представление фазы и зна- значений косинуса и синуса дает практически идеальный результат. Цифро-аналоговый преобразователь (ЦАП) служит для преоб- преобразования последовательности дискретных отсчетов в аналоговое колебание. В идеальном случае ЦАП представляет собой просто . схему задержки, однако на практике в моменты смены отсчетов наблюдаются выбросы, причем они существуют конечное время (время установления ЦАП). Один из методов борьбы с этим яв- явлением заключается в том, чтобы после окончания процесса уста- установления в ЦАП отстробировать выходной сигнал коротким им- импульсом. В результате будет получена последовательность анало- аналоговых импульсов, амплитуда которых пропорциональна значениям .отсчетов, подаваемых на ЦАП. Поскольку частотный спектр периодической последовательно- последовательности аналоговых импульсов, как и последовательности дискретных отсчетов, является периодическим, то необходимо отфильтровать один из периодов спектра с помощью аналогового фильтра. Заклю- Заключительная операция — перенесение спектра сигнала на промежу- промежуточную частоту, используемую в передатчике радиолокатора,— выполняется в смесителе. ^ .5.7. Цифровые интегральные микросхемы При решении любых вопросов, связанных с цифровой обработ- обработкой радиолокационных сигналов, всегда возникает задача выбора какого-либо одного или нескольких типов интегральных микро- микросхем (ИС), поэтому целесообразно привести их основные харак- характеристики (на 1976 г.), ограничившись наиболее широко использу- используемыми сериями ИС с полным набором номенклатуры. Некоторые ИС не будут рассматриваться (в частности, ИС инжекционной ло-
Применение ЦОС в радиолокации 333 гики и схемы памяти объемом 65К на приборах с зарядовой связью), так как к настоящему времени они либо не имеют пол- полной номенклатуры, либо выпускаются в ограниченных количест- количествах. Не будут рассматриваться также уникальные цифровые ИС, разработанные специально для какой-либо конкретной задачи, по- поскольку они не являются микросхемами общего применения. Цифровые ИС делятся на две основные категории: ИС памяти и логические ИС. В табл. 5.2 приведены основные характеристики нескольких типов ИС обеих категорий, причем выбраны ИС памя- памяти наибольшей емкости. Отметим, что при уменьшении емкости ИС памяти в пределах одного и того же типа ее быстродействие, как правило, увеличивается. Таблица 5.2 Память Тип ИС Объем, вид доступа Время цикла чтения или записи, не Мощность рассеяния на корпус, мВт лзс MRU (статиче- (статические) .МДП (динамиче- (динамические) ТТЛ ЭСЛ 10К 16К, последовательный 4К, произвольный 4К, произвольный 1К, произвольный 1К, произвольный 4 Mm1* 400 300 90 35 200 450 430 550 520 Логика Тип ИС МДП ТТЛ ТТЛ (с низким потреб- потреблением мощности) ТТЛ (с диодами Шотт- ки) ТТЛ (с низким потреб- потреблением мощности и диодами Шоттки) ТТЛ (с высоким потреб- потреблением мощности) ЗСЛ 10К ЭСЛ Ш ЭСЛ 100К 4 4 4 4 4 4 4 4 5 схемы 2И — схемы 2И - схемы 2И - схемы 2И- схемы 2И - схемы 2И - -НЕ -НЕ -НЕ -НЕ -НЕ -НЕ схемы 2 ИЛИ —НЕ схемы 2 ИЛИ — НЕ схем 2 ИЛИ —НЕ Задержка распростране- распространения, НС 30г> 10 33 3 10 6 2 1 0,75 Мощность рассеяния на корпус, мВт 6»> 40 4 76 8 88 1004) 9404) 2504> ') Скорость передачи. 3) При тактовой частоте 2 МГц. !) Ci=15 пф, ^ном = '" "" ^ ^а исключением предельных частот.
334 Глава 5 Быстродействие ИС характеризуется задержкой распростране- распространения в вентиле. Сопоставляемые микросхемы (ИЛИ — НЕ и И— НЕ) приблизительно эквивалентны по сложности для всех типов ИС. Так, все они содержат по четыре вентиля в одном корпусе- (исключение составляют ИС ЭСЛ 100К, у которых в одном кор- корпусе размещено пять вентилей). Приводимая в таблице мощность- рассеяния и для ИС памяти, и для логических ИС относится к одному корпусу. Наиболее широко и часто используются ТТЛ ИС, которые вы- выпускаются с низким и высоким1 потреблением мощности, а также с диодами Шоттки. Они позволяют получить высокое быстродей- быстродействие при небольшом значении мощности рассеяния. Различные серии МДП ИС памяти имеют высокий уровень интеграции, что связано с малой величиной мощности рассеяния в них. Они ши- широко используются при создании блоков памяти. В настоящее- время выпускаются ИС памяти емкостью 4К бит в корпусе11. МДП ИС памяти могут быть либо статическими, либо динамиче- динамическими. Это определяет необходимость периодической регенерации содержимого памяти. В общем случае предпочтительнее статиче- статические ИС памяти, так как схемы управления ими намного проще. Преимущество динамических ИС заключается в более высоком, уровне интеграции и, как правило, большем быстродействии. При- Приборы с зарядовой связью (ПЗС) начали использоваться для соз- создания блоков цифровой памяти совсем недавно, но уже сейчас выпускаются ПЗС ИС динамической памяти емкостью 16К бит. Технология ПЗС позволяет достичь еще большего уровня инте- интеграции; так, в настоящее время разрабатываются ПЗС ИС емко- емкостью 64К бит. ЭСЛ ИС обладают очень высоким быстродействием, но потреб- потребляют большую мощность. Преимуществом этих ИС является то,, что они имеют прямые и инверсные выходы и почти постоянную мощность рассеяния. ЭСЛ 10К ИС имеют наиболее полную но- номенклатуру, и круг их применений постоянно расширяется. ЭСЛ Ш и ЭСЛ 100К ИС обладают еще большим быстродействием, но имеют менее полную номенклатуру. Обычно для сопоставления различных типов ИС используют произведение их быстродействия на мощность рассеяния. На рис. 5.37 представлена зависимость задержки распространения от мощ- мощности рассеяния (на один вентиль, а не на корпус, как в табл. 5.2) для всех рассмотренных выше типов ИС [37, 42]. Уменьшение- мощности рассеяния сопровождается, как правило, пропорциональ- пропорциональным ухудшением быстродействия, причем величина мощности рас- рассеяния оказывает существенное влияние на уровень интеграции в: пределах одного типа- ИС. Данные, представленные на рис. 5.37,. !) В ближайшее время начнется серийный выпуск ИС памяти емкостью 16К бит.
Применение ЦОС в радиолокации с. 35 «Г I 1 I' '0,1 ТТЛ с низким потреблением мощности ТТЛ • с низ пум потреблени- потреблением и Вцодам и Шоттки ТТЛ • ТТЛ с высоким потреблением \ ТТЛ с диодами Шотгппи •ЭОЛ 10К ЭСЛ '/// 100К* _1_1_LJ_LJ-L I'M 10 Мощности рассеяния, мог 100 Рис. 5.37. Сопоставление некоторых типов логических ИС по задержке распро- распространения и мощности рассеяния. являются ориентировочными; точные максимальные, минимальные и типовые значения этих параметров разработчик может найти в справочных материалах по каждой из используемых ИС. 5.8. Аналого-цифровые преобразователи При обработке в радиолокационной системе цифровыми мето- методами имеют место ограничения, которых нет в тех случаях, когда аналого-цифровое преобразование производится после окончания обработки сигнала. Так, сумма сигнала и шума должна быть до- достаточно большой для того, чтобы обеспечить изменение хотя бы младшего разряда АЦП, и в. то же время не слишком большой, чтобы избежать ограничений в АЦП. Так как эхо-сигнал обычно намного слабее шума (сжатие импульса осуществляется после АЦП), то существенную роль играет соотношение между уровнем шума и шагом квантования АЦП. С другой стороны, нежелатель- нежелательные сигналы (например, помехи от местных предметов) могут быть настолько интенсивными, что важным является также и со- соотношение между уровнем этих сигналов и диапазоном преобра-
336 Глава 5 зования АЦП. Эти соотношения, а также некоторые соображения, касающиеся выбора АЦП и использования их в радиолокационных системах, рассматриваются в данном разделе. Прежде всего здесь исследуется взаимосвязь между отношением сигнал/шум и дина- динамическим диапазоном, выраженным через отношение alq, а имен- именно через отношение среднего квадрэтического значения входного- шума а к величине шага квантования q. Например, если <т велика по сравнению с q, то характеристика преобразования АЦП приб- приближается к линейной, а ошибки квантования становятся достаточ- достаточно малыми и их можно не учитывать. Однако реальные АЦП в- выходном слове имеют конечное число разрядов и, следовательно, ограниченный динамический диапазон. Выбор больших значений а по сравнению с q приводит, с одной стороны, к уменьшению шу- шума квантования, а с другой — к сужению диапазона возможных изменений уровня сигнала, в результате чего АЦП будет работать с ограничениями, которые приведут к потере информации. Поэто- Поэтому, чтобы динамический диапазон, был как можно больше, целе- целесообразно, насколько это возможно, уменьшать отношение alq. Правда, чрезмерное уменьшение этого отношения, как будет по- показано ниже, также приведет к потере информации. 5.8.1. Выбор уровней квантования АЦП" АЦП можно рассматривать как нелинейный элемент с переда- передаточной характеристикой (по напряжению), изображенной на рис. 5.38. Выходной отсчет АЦП равен сумме истинного значения входного колебания в момент дискретизации и отсчета шума кван- квантования, т. е. E.44) где Si, rii n et — отсчеты входного сигнала, шума приемника и шума квантования соответственно. Предполагается, что шум приемника представляет собой белый гауссовский шум с нулевым средним и средним квадратическим значением, равным ст. Если считать, что шум квантования представляет собой случайный процесс, некорре- некоррелированный с сигналом и шумом приемника, то АЦП можно рас- рассматривать как второй источник шума, обусловленного исключи- исключительно квантованием. Для количественной характеристики шума квантования проде- проделаем следующий эксперимент: подадим на вход АЦП белый гаус- гауссовский шум с известным распределением (N{0, а)) и, измерив среднее квадратическое значение на выходе АЦП, сопоставим его с сг, а затем рассмотрим, что будет происходить при изменении отношения alq. Превышение измеряемой величины над а свиде- свидетельствует о наличии уровня шума квантования. Предположим " Материал к этому разделу основан на работе П. Е. Блэнкеншипа.
Применение ЦОС в радиолокации 337 ЗНа-- Кб-- -3Кб -Me Г Ке ---за с, ЗКе 5Кв Рис. 5.38. Характеристика преобразования идеального АЦП.. для простоты, что значения ei в формуле E.44) представляют со- собой случайные величины, некоррелированные друг с другом и с отсчетами входного шума щ, равномерно распределенные на ин- интервале от —q/2 до -\-q/2. Легко подсчитать, что дисперсия ег- рав- равна <72/12. При некоррелированных отсчетах дисперсия на выходе АЦП Go определяется по формуле <7г/12. E.45) Следовательно, среднее квадратическое значение выходных от- отсчетов АЦП, отнесенное к а, будет равно E.46) где параметр K={alq)~l. Соотношение E.46) графически пред- представлено на рис. 5.39. Его иногда относят к, так называемой ли- линейной модели, поскольку оно получено в предположении, что ис- источник шума квантования является аддитивным и независимым. Из рис. 5.39 следует, что при уменьшении отношения o/q уровень шума квантования неограниченно возрастает, причем динамичес- динамический диапазон можно довести до любой желаемой величины за счет соответственного изменения чувствительности. К сожалению, на некотором уровне линейная модель становится неприемлемой и для более точного количественного описания работы АЦП требуется более детальный анализ. Воспользуемся методом, основанным на получении точного вы- выражения для плотности вероятности выходных отсчетов АЦП, ко- которое можно будет затем использовать для определения выходной дисперсии и исследования зависимости дисперсии от отношения GJq. Ясно, что искомая плотность вероятности будет дискретной
338 Глава 5 -ю -ш -12 -to -в -в. -4 -г о г ¦ е в ю к; <х ¦¦¦ >']•'¦ V1 л- j Рис. 5.39. Зависимость шума квантования АЦП от величины отношения среднего „квадратического значения входного шума приемника к шагу квантования АЦП. р. ¦К -гк Р_ ¦ЗК -sk -w -эк -гк -ко к гк зк х Г5К А. sk И Рис. 5.40. Дискретная плотность вероятности выходных отсчетов АЦП. ^.
Применение ЦОС в радиолокации 339' функцией, как показано на рис. 5.40. Из рис. 5.40 непосредственно следует, что 1 Р0 = Рг[\Х\^К/2] E.47) к Для удобства принято, что а=1, a X представляет собой отсчет белого гауссо'вокого случайного процесса, так чтч> формулу E.48) можно переписать следующим образом: erf B) Л —т=г er-^h dx. E.49) , У 2л о ^тов АЦП равно ао/а= 2 y\{iKfPiK I 2- E.50) L 1=1 J Выражение E.50) может быть переписано в более удобной для вычислений форме, если учесть, что для тауссоеекого распределе- распределения плотность вероятности за пределами ±5о от среднего значе- значения практически равна нулю. Если целое N выбрано таким обра- образом, что (n+-t)k>5> <5-51) то о^КУ2 \N2etf /W-j~W— 2]Bi + l)erf fi-f—j)k '¦ E.52) Соотношение E.52) также графически представлено на рис. 5.39. Видно, что линейную модель можно считать справедливой только при о/^^'/г (—6 дБ), так как в области меньших значений o/qt среднее квадратическое значение выходных отсчетов начинает быстро уменьшаться, что противоречит линейной модели. Это объ- объясняется достаточно просто: при а/д^'/г уровень входного сиг- Нала становятся настолько слабым, что если он и пересекает гра- границы соседних уровней квантования, то очень редко. Поэтому вы- выходные отсчеты почти все время равны нулю, а АЦП становится Нечувствительным к входному воздействию. Из кривых на Р'Ис. 5.39 следует, что в принципе можно допустить минимально On.
,840 Глава 5 возможную величину отношения cjq, равную '/г, при (Которой ухудшение отношения сигнал/шум составляет 1,16 дБ, однако АЦП будет работать в существенно -нелинейной области зависи- зависимости шума квантования of a/q. Кроме того, из рис. 5.39 видно, что если установить <y/q=l, то будет достигнут вполне приемле- приемлемый режим, характеризующийся, с одной стороны, небольшим уменьшением динамического диапазона (по сравнению с предель- предельно достижимым), а с другой — работой в линейной области «с ухудшением 'чувствительности на 0,34 дБ. 5.8.2. Разрядность АЦП Разрядность АЦП определяется двумя факторами: допустимым уровнем шума квантования и выбранным динамическим диапазо- диапазоном. Для оценки эффектов 'квантования .можно воспользоваться ¦.результатами анализа, проведенного в предыдущем разделе, .а также моделированием работы АЦП. В этом разделе рассмат- рассматриваются требования, предъявляемые к АЦП с точки зрения ди- динамического диапазона. Необходимо помнить, что в полностью цифровой системе об- обработки данных аналого-цифровое преобразование предшествует операции сжатия импульсов. Если цель точечная, то динамиче- динамический диапазон определяется отношением наибольшего ожидаемо- то уровня эхо-сигнала до его сжатия к уровню шума1). Однако •если цель распределенная, то эхо-сигналы накладываются еще <до сжатия и ожидаемый уровень сигнала возрастает. Рассмотрим этот случай подробнее. Найдем уровень сигнала до сжатия, считая, что после отра- отражения зондирующего сигнала s(t) от совокупности целей эхо- сигналы будут .иметь амплитуды щ и задержки т,-. Принятый сиг- !нал как функция времени описывается выражением *40=2o«s<'-T«>- E-53) v Если предположить, что отражатели, как это обычно бывает, не- независимы, то мощность принятого сигнала будет равна r*(t)=2Ja!\s(t-xl)\\ E.54) Перепишем это выражение в недискретизованйой форме (x)\s{t-x)\*dxt E.55) " Здесь и далее предполагается, что минимально допустимый входной уро- уровень АЦП устанавливается по уровню шума и соответствует величине 6/G= 1, при которой соотношение между уровнями теплового шума приемника и шума кван- квантования становится вполне приемлемым.
Применение ЦОС в радиолокации 341 где С(т) —плотность ЭПР (т. е. величина ЭПР на единицу (рас- (расстояния;. Если функция С (г) постоянна и равна Со, a s(t) — импульс длительности Т и амплитуды А, то E.56) Величина мощности шума .в полосе сигнала W равна N0W, где No — спектральная плотность мощности шума (постоянная в пре- пределах полосы сигнала). Следовательно, динамический диапазон равен D = (A*C0)T/(N0W), E.57) т. е. произведению мощности сигнала, отнесенной к единичному интервалу времени, «а длительность сигнала, деленному на про- произведение мощности шума, отнесенной к единичной полосе, на ши- ширину полосы оигнада. Поэтому требуемое число разрядов АЦП равно fi=(l/2)logaD-f-l. E.58) Отметим, что при увеличении энергии сигнала требуемое число разрядов возрастает, так 'как амплитуда принятого сигнала будет увеличиваться (в тощ числе за счет наложения большого числа эхо-сигналов). Но с увеличением полосы сигнала требуемое число разрядов уменьшается, поскольку уровень шума три этом возра- возрастает, а величина o/q поддерживается на постоянном уровне, рав- равном 1. Использование модели отражения с постоянной плотностью ЭПР С(т) позволило легко вычислить мощность принятого сигна- сигнала E.55) и затем с помощью соотношения E.57) проанализиро- проанализировать некоторые взаимосвязи. В общем случае для каждой конк- конкретной системы с учетом возможной целевой обстановки нужно ввести свою модель отражения С{%) .и определить требуемое чис- число разрядов АЦП. Подобное .моделирование работы радиолокато- радиолокатора проводилось неоднократно и показало, что для полос сигналов 10—50 МГц требуемая разрядность АЦП обычно составляет 8— 12 бит. Рассмотрим подробнее некоторые из предположений, исполь- использовавшихся выше при анализе разрядности АЦП. Прежде всего предполагалось, что минимальный шаг квантования АЦП равен среднему квадратическому значению входного шума, т. е. o/q=l. Возникает .вопрос, следует ли "выбирать его таким же при наличии помех от местных предметов. При уменьшении этого отношения шум не будет превышать одного шага квантования, поэтому, если на одном и том же интервале кроме помех от 'местных предметов будет принят эхо-сигнал низкого уровня (до сжатия более сла- слабый, чем шум), то часть энергии (или даже вся энергия) этого эхо-сигнала .будет потеряна. Таким образом, важно, чтобы неза- независимо от уровня помех от местных предметов флуктуации шума
342 Глава 5 выходили за пределы по крайней мере одного уровня квантова-.i ния. Отметим также, что если шум будет флуктуировать в преде- . лах большего числа уровней квантования, то это приведет к со- сокращению динамического диапазона. В предыдущем разделе уже было показано, что .выбор а/<7=1 приводит к небольшому ухуд- ухудшению отношения сигнал/шум, но при проектировании радиоло- радиолокационной системы приходится учитывать даже эти незначитель- незначительные потери. Еще одним параметром, входящим в отношение а/д, является уровень шума а. В некоторых радиолокационных системах для сокращения требуемого динамического диапазона вводят допол- дополнительный аддитивный шум. Это оказывается возможным лишь при достаточно большом отношении сигнал/шум, так как при та- таком «етоде сокращения динамического диапазона омо понижает- понижается. Однако (во многих случаях отношение шгкал/шум оказывает- оказывается достаточно большим, поэтому метод введения аддитивного шу- шума вполне -может быть использован (,и он уже неоднократно ис- использовался) на практике. 5.3.3. Характеристики современных АЦП В радиолокационных системах обычно используются широко- широкополосные сигналы (от 1 до 100 МГц), причем условия, т которых этш системы работают, требуют большого динамического диапа- диапазона (превышающего возможности 8-разрядного АЦП). Следова- Следовательно, к характеристикам АЦП предъявляются очень .высокие 10 - 1 L L 0 \ 1 о Разрабаты- Разрабатываются о I 6 0 10 100 Частота преобразования * /О*слоба/с Рис. 5.41. Уровень развития (на 1976 г.) серийно выпускаемых АЦП. требования, поэтому целесообразно привести характеристики обычно используемых АЦП (на 1976 г.). Они представлены на рис. 5.41. Специализированные АЦП, разработанные для конк- конкретных применений, не учитывались; представлены только серий- серийно выпускаемые АЦП.
Применение ЦОС в радиолокации 343 5.9. Радиолокаторы с селекцией движущихся целей В ряде случаев, в частности в радиолокаторах управления воздушными полетами, очень полезной оказалась идея селекции .движущихся целей (СДЦ). Наличие доллеровского смещения час- частоты позволяет отделять движущиеся цели от стационарных объ- объектов, поэтому, выполнив соответствующую обработку, можно вы- выделить цели, скрытые помехами от местных предметов ('интерфе- ('интерферирующими с сигналам), которые могут быть .на несколько поряд- порядков интенсивнее полезного сигнала. В аэродромных радиолокато- радиолокаторах кругового обзора помехи создаются главным образом за счет отражений от Земли и от метеообразований. К счастью, спектр помех от местных предметов сконцентрирован около -нулевой час- частоты, поэтому, воспользовавшись фильтрами, имеющими хорошую .избирательность и .настроенными на доплеровокие частоты целей, можно выделить эхо-сигналы, одновременно подавив помехи от местных предметов. В действительности спектр этих помех будет занимать некоторую область частот, примыкающую к нулевой ча- частоте, поскольку он расширяется вследствие движения антенны (если в локаторе используется вращающая антенна), а также за счет ветра и дождевых облаков. Поэтому н.а практике вводят не- некоторые предположения относительно энергетического спектра по- помех от местных предметов, которые используются затем при про- ектироваоаии эффективного устройства обработки радиолокатора, обеспечивающего СДЦ. Ниже будет сначала рассмотрена простая методика построения подавителя, устраняющего местные помехи, а затем будут описаны структуры оптимального и подоптималь- ного подавителей. 5.9.1. Подавители местных помех Ввиду характерной для функции (неопределенности одиночного ЛЧМ-импульса взаимосвязи между дальностью я доплеровским смещением (см. разд. 5.4.2) для обеспечения доплеровекой фильт- фильтрации приходится использовать пачку импульсов, учитывая, ко- конечно, возникающую при этом возможность неоднозначного из- измерения дальности и скорости. Как уже отмечалось выше, пачка меет периодический доплеровский спектр с периодом, равным ча- . готе повторения импульсов в пачке. Расчет фильтра для'подав- для'подавления местных помех сводится к расчету цифрового КИХ-фильт- ра с полосами непропускания для подавления спектральных ком- компонент местных помех. Если предположить, что все помехи сконцентрированы только на нулевой частоте, то значения помех для жаждой дальностной полосы будут постоянными, и помехи можно устранить, если вычислять разности между отсчетами, по- полученными «а последовательных периодах повторения. Такой про- простейший фильтр называется двухимпульсным подавителем. Его
344 Глава 5 блок-схема изображена на рис. 5.42. Если считать, что схема за- задержки на А является схемой единичной задержки, .и найти z-npe- образования входной и выходной последовательностей, то переда- передаточная функция двухгампульсного подавителя окажется равной A—z~l). Это означает, что двухампульсный подавитель гаред- Вхад Задержка (Л) -Выход Рис. 5.42. Двухимпульсный подавитель помех от местных предметов. ставляет собой цифровой двухточечный КИХ-фильтр с амплитуд- амплитудно-частотной характеристикой вида sin (со/2), которая изображена на рис. 5.43 (значения частоты нормированы относительно часто- частоты повторения импульсов -в пачке). Нуль характеристики в точке « = 0 соответствует полному подавлению постоянной составляю- составляющей помех от местных предметов. ш. ш Рис. 5.43. Частотные характеристики двухимпульсного и трехимпульсного пода- подавителей. На практике энергетический спектр местных помех занимает некоторую частотную полосу, прилегающую к нулевой частоте. При этом двухи'мпульсный подавитель не будет обеспечивать пол- полного устранения местных помех, хотя и ослабит низкочастотные составляющие. Если последовательно с первым двухимпульсньш подавителем включить еще один, то получится трехимпульсный подавитель, который будет представлять собой КИХ-фильтр с пе- передаточной функцией (О.б+г-'+'О.бг-2). Особенностью трехим- трехимпульсного подавителя является то, что он в большей степени ос- ослабляет низкочастотные составляющие спектра, так как его ам- амплитудно-частотная характеристика (пунктирная линия на рис. 5.43) имеет вид sinz(<»/2). Существует, однако, несколько ме- методов расчета оптимальных подавителей, каждый из которых ис- используется при определенных допущениях относительно помех от местных предметов и вида зондирующего сигнала. Так, Делонг и Хофштеттер [10] разработали метод максимизации отношения сигнал/интерферирующие помехи для заданной доплеровской час-
Применение ЦОС в радиолокации 345 тоты при условии, что форма энергетического спектра помех из- известна. Полученный ими результат 'является обобщением теории согласованной фильтрации в том смысле, что если местные поме- помехи имеют (вид белого гауссовокото шума, то оптимальное линей- линейное устройство обработки оказывается обычным согласованным ¦фильтром. В общем случае его можно рассматривать как схему из двух 'последовательно соединенных 'фильтров, один из которых ¦«отбеливает» энергетический спектр местных помех, а другой яв- является согласованным фильтром. Выше предполагалось, что ин- интенсивность местных помех .постоянна на всех представляющих .интерес дальностях, .но методика Делонга и Хофштеттера пригод- пригодна и для моделей местных помех более общего вида с интенсив- интенсивностью, зависящей от дальности. Другой подход к расчету подавителя 'сводится к расчету 'экви- 'эквивалентного КИХ-фильтра. При таком подходе предполагается, что частотные полосы, в которых находится доплероеский спектр по- помех от местных предметов, не перекрываются с полосой полезных эхо-сигналов (отраженных от движущихся целей). Если спектр местных помех сконцентрирован вблизи нулевой частоты, то зада- задача сводится к расчету фильтра верхних частот, у .которого полоса непропускания перекрывает частотные полосы, занимаемые мест- местными помехами, а полоса пропускания обеспечивает выделение полезных сигналов. При проектировании таких фильтров можно пользоваться любым из хорошо известных алгоритмов расчета цифровых КИХ-фильтров ;['2О]. За фильтром верхних частот сле- следует ввести гребенку узкололосных фильтров, настроенных на ¦ожидаемые значения доплеровокого смещения частоты. В общем случае фильтр для подавления помех от местных предметов строятся следующим образом. Его ¦выходной сигнал находится как линейная комбинация отсчетов эхо-сигналов, соот- соответствующих одной и той же дальностной полосе (эти отсчеты смещены на один и гот же отрезок времени относительно начала Вход ¦Ъо' Задержка Ш V Задержка (Л) ь Задержка (Л) V Задержка ВыхоР Рис. 5.44. Обобщенный цифровой фильтр для СДЦ. зондирующего импульса). Во времени комбинируемые отсчеты эхо-сигнала отстоят друг от друга на период повторения А, .по- .поэтому при построении такого фильтра приходится использовать линию задержки с отводами на Л, как показано на рис. 5.44. Так как обычно на каждом периоде повторения просматривается большое количество дальностных полос, то в качестве схем за-
346 Глава 5 ^ держжи «а Д целесообразно использовать сдвиговые регистры на- число слов, равное количеству просматриваемых дальностных по- полос. При построении оптимального линейного подавителя -с N отво- отводами в прямой форме для получения каждого выходного отсчета' приходится 1выполнить N умножений. Для каждого доплер овского- канала требуется свой, отличный от других оптимальный пода- подавитель, поэтому для каждого канала используется определенный набор весовых коэффициентов. Можно построить гораздо более^ простой подоптимальный подавитель, последовательно -соединив тр-ехимпульсный подавитель я гребенку полосовых фильтров (реа- (реализуемую с помощью алгоритма «скользящего» БПФ). Так как» в трехкмпульсном подавителе вообще не требуется выполнять ум- умножений (за счет того, что он имеет простые одноразрядные ко- коэффициенты), а в iV-точечном БПФ используется N\og2hr умно- умножений, то на каждый доплеровский канал приходится всего log2 M: умножений. Это означает, что аппаратурная реализация подави- подавителя существенно упростится, но все его характеристики сохра- сохранятся. В следующем разделе будет описана система СДЦ, ис- использующая именно такой подоптимальный подавитель. 5.9.2. Пример системы СДЦ1» В качестве примера, иллюстрирующего применение цифровой; системы СДЦ, рассмотрим цифровое устройство, разработанное- за несколько последних лет в лаборатории Линкольна. Это уст- устройство, названное обнаружителем движущихся целей (ОДЦ)',. предназначено для оптимизации характеристик аэродромных ра- радиолокатор-о-в кругового обзора, 'входящих в автоматизированную^ систему Федерального авиационного управления США. ОДЦ представляет собой специализированное цифровое уст- устройство, способное обеспечить обработку сигнало^в при обзоре пространства по азимуту «а 360°, а по дальности около 90 км. с разрешением 120 <м. Блок-схема ОДЦ представлена на рис. 5.45.. Он подключается к выходу приемного устройства с большим ди- динамическим диапазоном, работающего в линейном режиме прак- практически во всем диапазоне преобразования АЦП. Требование ли- линейности приемника является в данном случае (но вообще далеко не всегда) весьма важным, так как иначе произойдет расширение спектра помех от земной поверхности. В результате спектр помех попадет в доплеровские фильтры и характеристики системы СДЦ будут ухудшены. Отметим, что жесткое ограничение сигнала, ча- часто применяемое в радиолокаторах с СДЦ, при использовании трехимпульсного-подавителя приводит к увеличению порога об- обнаружения на 20 дБ. 1} Материал к этому разделу основан на работах С. И. Мьюиг Л.. Карадиджа и Р. О. Доннела [25, 26, 28]. !
¦ Комплексная огибающая аз радиоло- радиолокатора АЦП Феррита - Ban память Фильтр нулевой скорости Трехимпульс- ный подавитель 8~ точечное ДПФ Блок села/кивания и расчета j огиВающеи Елок порогового анализа Рекурсивный срильтр К СОД III Радиолокационная карта помех (на диске) Рис. 5.4". Блок-схема обнаружителя движущихся целей.
348 Глава 5 ____ Принятый сигнал преобразуется к основной полосе, чтобы по- получить его комплексную огибающую. После аналого-цифрового» преобразования 11-разрядные отсчеты с выходов обоих квадра- квадратурных каналов накапливаются в ферритовой памяти объемом" 8000 слов. Сначала на 'Некоторой частоте повторения импульсов для «аждой из 768 дальностных полос накапливаются 10 отсче- отсчетов. После этого частота повторения изменяется примерно на 20%, и процесс накопления отсчетов повторяется. Во -время повторного- накопления 10 отсчетов данные, полученные на первом этапе на- накопления, считываютея из памяти. Все 10 отсчетов, относящихся к любой дальностной полосе, считываютея последовательно и mo- ступают на обработку, после этого считываются 10 отсчетов, от- относящихся к следующей дальностной полосе, и т. д. Все 10 от- отсчетов, относящихся к одной дальностной полосе, поступают в трехимпульсный подавитель, после чего выполняется 8-точечное ДПФ. Одновременно те же отсчеты пропускаются через фильтр- нулевой скорости. Описанная совокупность фильтров обеспечива- обеспечивает хорошее приближение к оптимальному обнаружителю '[10], ра- работающему при наличии помех от земной поверхности. На рис. 5.46, а я б приведены характеристики двух действующих под- оптимальных обнаружителей, в которых для режекции местных помех используется трехимпульсный подавитель, а гребенка доп- леровских фильтров реализуется посредством ДПФ. Для умень- уменьшения уровня боковых лепестков доплеровских фильтров, реали- реализуемых с помощью алгоритма ДПФ, используется сглаживание, при этом из всех выходных отсчетов доплеровских фильтров вы- вычитаются отсчеты смежных фильтров, деленные на 4. Эта опера- операция, очень простая в реализации, эквивалентна умножению от- отсчетов во -временной области на весовую функцию, имеющую вид смещенной вверх косинусоиды. Схема подоптимального обнаружителя намного проще схемы оптимального обнаружителя. Если число доплеровских фильтров равно 8, то в оптимальной схеме потребовалось бы обеспечить вы- выполнение 64 операций умножения комплексных чисел для каждо- каждого элемента разрешения в координатах дальность — азимут. Все эти умножения должны быть завершены приблизительно за 8 мке, так что требуемая скорость перемножения комплексных чисел равна 8 млн. умножений в секунду, а действительных чисел — 32 млн. умножений в секунду. В то же время для подоптимальной схемы при использовании алгоритма БПФ требуется выполнить всего четыре простых умножения на 1/]/2. Эти умножения сводят- сводятся к умножению на константу вида A/2+1/8+1/1б+1/б4+1/25в), ко- которое реализуется с помощью четырех сумматоров. Остальная часть схемы ОДЦ также строится таким образом, чтобы избежать выполнения операций умножения. Экспериментальное исследование помех от земной поверхности показывает, что уровень помех заметно меняется от одного зле-
Применение ЦОС в радиолокации 349 200 400 600 800 ДоплероВския частота цели, Гц 1000 200 W0 600 800 ДоплероВская частота цели, Гц б 1000 Рис. 5.46. Выигрыш в отношении сигнал/шум для подоптимального ОДЦ, ис- использующего трехточечный подавитель и 8-точечное ДПФ. а — фильтр настроен на частоту 200 Гц; 6 — фильтр настроен на частоту 400 Гц,
•350 Глава 5 мента разрешения к другому. В частности, существует много об- областей с низкой интенсивностью помех, в которых возможность обнаружения самолета зависит только от отношения оитнал/шум. Для того чтобы провести пороговый анализ, с помощью которого можно было бы найти наилучшую оценку уровня помех от зем- земной поверхности и максимизировать вероятность обнаружения самолета, в ОДЦ формируется радиолокационная карта помех от земной поверхности, снимаемая с высоким разрешением (рис. 5.45). По азимуту вся просматриваемая радиолокатором зона разби- разбивается на 480 интервалов -когерентной обработки, каждый из ко- которых соответствует половине ширины диаграммы направленно- направленности антенны. На одном из интервалов когерентной обработки из- излучаются 10 импульсов, имеющих постоянную частоту повторения. ¦На следующем когерентном интервале используется другая часто- частота повторения. Радиолокационная карта местных помех накапли- накапливается на магнитном диске, где хранятся 480X768=368 640 от- отсчетов уровня помех, по одному на каждый элемент разрешения по дальности внутри каждого из интервалов когерентной обработ- обработки. Отсчеты уровней местных помех хранятся в формате 10-раз- 10-разрядных чисел с плавающей запятой, чтобы обеспечить достаточно большой динамический диапазон представления помех. Для построения радиолокационной карты помех от местных предметов используется рекурсивная фильтрация, которая заклю- заключается в том, что при каждом сканировании Ув выходных отсчетов фильтра нулевой скорости добавляется к 7/в уже накопленных значений карты помех. Чтобы получить средние значения отсче- отсчетов карты, достаточно накопить результаты 10—20 сканирований. Для построения более точной радиолокационной карты местных помех требуется регистрировать уровни помех при вполне опреде- определенных положениях антенны. При этом вся зона обзора по ази- азимуту (что соответствует 4096 импульсам изменения азимута) раз- разбивается на 240 азимутальных элементов, каждый из которых проходится за 17 или 18 импульсов изменения азимута. Каждому .азимутальному элементу соответствуют два интервала когерент- когерентной обработки. На каждые два азимутальных элемента (т. е. че- через 34 или 36 импульсов изменения азимута или приблизительно через 44 мс) приходится одно обращение к диску, во время кото- которого с диска считываются и записываются на него отсчеты мест- местных помех, соответствующие четырем когерентным интервалам. Время доступа к диску не превышает 18 мс. Входные данные, под- подлежащие обработке в ОДЦ, предварительно заносятся в буфер- буферную память, состоящую из двух блоков объемом по 3000 слов на МДП ИС. Отсчеты радиолокационной карты помех от 'местных предме- предметов умножаются на константу и используются при формировании пороговых уровней. Для фильтра нулевой скорости @) «опользу-
Применение ЦОС в радиолокации 35? ется умножитель на коэффициенты от 4 до 8, а для двух смежных с ним фильтров A и 7), в которых расчетный уровень попадаю- попадающих туда помех от земной поверхности равен —40 дБ, использу- используется другой умножитель. Коэффициенты всех этих умножителей равны степени 2 или сумме двух степеней 2, поэтому они строятся на базе схем сдвига и сумматоров. 5.9.3. Экспериментальная проверка обнаружителя движущихся целей Обнаружитель движущихся целей был включен в состав аэро- аэродромного радиолокатора кругового обзора национального феде- федерального Научно-исследовательского центра авиационного управ- управления США в г. Атлантик-Сити, шт. Нью-Джерси, где были про- проведены многочисленные испытательные полеты с целью определе- определения его характеристик. Для сравнения попользовалась обычная. аэродромная радиолокационная станция ASR-7, оборудованная цифровой системой СДЦ и современным цифровым обнаружите- обнаружителем со скользящим взвешиванием. Обе сопоставляемые радиоло- радиолокационные системы были подключены к общей антенне, чтобы об- обрабатываемые в них эхо-сигналы от самолета и местные помехи- соответствовали одному моменту времени. Мощности передатчи- передатчиков и чувствительности приемников были подобраны таким обра- образом, чтобы чувствительности обеих систем по отношению к уров- уровню шума были одинаковы с точностью до 1 дБ. Ниже будут при- приведены лишь некоторые результаты многочисленных эксперимен- экспериментальных исследований. Уровень помех от земной поверхности в районе Научно-иссле- Научно-исследовательского центра авиационного управления был сравнительно- небольшим. Наиболее интенсивные отражения наблюдались от больших зданий города Атлантик-Сити, расположенного в 15 км юго-восточнее Центра. Уровень местных помех был переменным и в некоторых направлениях превышал уровень шума на 45 дБ. В качестве испытательной цели использовался небольшой са- самолет типа Piper Cherokee, пролетавший на высоте 300 м. На рис. 5.47 показаны изображения, получаемые на выходе устройст- устройства сопровождения целей в том виде, как они выводятся на экран индикатора после проведения 56 сканирований (следует обратить внимание на условные обозначения). Характерно, что обнаружи- обнаружитель движущихся целей позволил получить почти стопроцентную вероятность обнаружения в присутствии помех от земной поверх- поверхности, тогда как при использовании обнаружителя со скользя- скользящим взвешиванием во многих случаях эхо-сигнал от цели терялся,, так что несколько раз только наличие на самолете радиоответчи- радиоответчика позволило избежать срыва слежения. На рис. 5.47 показана также трасса самолета без радиоответ- Чика, построенная по радиолокационным данным. Отметим, что, когда самолет имел только тангенциальную составляющую скоро-
352 Глава 5 Обнаружитель движущихся целей Обнаружитель со сколь- гяиним взвешиванием Обнаружитель движущихся нелеп Обнаружитель со сколь- скользящим взвеши&аныелг * Радиолокатор и О Только радиолокатор в Только радиоотеелу/и/т ." ? Берез , Рис. 5.47. Результаты испытания обнаружителя движущихся целей в присутст- присутствии помех от земной поверхности. (Линии окружностей отстоят друг от друга на 3,6 км.) а с наложенными помехами от земной поверхности; б — только трассы самолета. по отношению к радиолокатору, при использовании обнару- обнаружителя со скользящим взвешиванием .происходил срыв слежения. Этот результат иллюстрирует полезность использования в ОДЦ радиолокационной карты помех от земной поверхности при наблю- наблюдении за самолетом, движущимся в тангенциальном 'направлении, особенно если учесть весьма большое значение ЭПР самолета с бокового направления (от 100 до 1000 м2). Отметим также, что
Применение ЦОС в;радиолокации 353 Обнаружитель движущихся целей Обнаружитель со сколо- зящим взвешиванием Обнаружитель движущихся целей Обнаружитель an споль - взвешиванием 6 * Радиолс/яатор ирлдиоятветцигг О Только радиолокатор В Только радиоответчик ? Берег Рис. 5.48. Результаты испытания обнаружителя движущихся целей в присутствии помех от дождя. (Линии отстоят друг от друга на 3,6 км.) а — результаты 80 сканирований, поступающие в устройство сопровождения; б — выход устройства сопровождения. в обычных современных радиолокаторах с СДЦ спектральная компонента, соответствующая нулевой скорости, подавляется пол- полностью, поэтому обнаружение самолетов, движущихся только в тангенциальном направлении, невозможно. На рис. 5.48 иллюстрируются наблюдения .в условиях сильно- сильного дождя. Видно, что при использовании ОДЦ обнаружение са- самолета при .наличии дождя не вызывает никаких трудностей; трас-
354 : Глава 5» сы самолета, не оборудованного радиоот.ветчакоим,, прослежива- прослеживаются в дождь так же хорошо, как и в ясную погоду. Однако, как. видно на ряс. 5.48, в системе со скользящим взвешиванием нали- наличие дождя (может привести к потере цели (¦напомним, что точки В соответствуют обнаружению самолета только но радиоответчику). Система со скользящим взвешиванием давала возможность до- достаточно хорошо управлять вероятностью ложной тревоги, так как в ней измерялись интенсивность ,и корреляционные свойства помех, обусловленных дождем, и соответствующим образом уве- увеличивался пороговый уровень. Это увеличение порога и препятст- препятствовало обнаружению самолета. Таким образом, при наблюдениях в условиях сильного дождя будут иметь место срывы сопровожде- сопровождения самолетов, не оборудованных радиоответчиками. 5.10. Радиолокатор с синтезированной апертурой В радиолокаторе с синтезированной апертурой (РСА) за счет специальной методики обработки сигналов достигается улучше- улучшение разрешения в азимутальном направлении .по сравнению с раз- разрешением, которое обеспечивается шириной диаграммы направ- направленности антенны, используемой в радиолокационной системе. Ес- Если длина раскрыеа антенны в азимутальном направлении равна L, то обеспечиваемое диаграммой антенны- разрешение по азимуту определяется фор!мулой = -^, E.59) где R — расстояние от антенны до цели, а X— длина волны зон- зондирующего высокочастотного сигнала. Ясно, что разрешение оп- определяется произведением ширины диаграммы направленности антенны на расстояние до цели. Для его улучшения, нужно уве- увеличить либо раскрыв антенны, либо несущую частоту излучаемого сигнала. Методика обработки сигналов в РСА может рассматри- рассматриваться как средство создания искусственного раскрыв а антенны, гораздо большего, чем ее физический раскрыв L. Искусственный раскрыв образуется в результате перемещения антенны радиоло- радиолокатора во времени и когерентной обработки эхо-сигналов, приня- принятых на временном интервале, в течение которого антенна смеща- смещается на расстояние, равное длине синтезируемого раскрыва. В ре- результате разрешение по азимуту в РСА может быть значительно улучшено. По сравнению с разрешением реальной антенны суще- существуют два варианта РСА: радиолокатор с фокусированным син- синтезом апертуры для полосовой съемки и телескопический радио- радиолокатор с фокусированным синтезом апертуры. В данном разделе при некоторых упрощениях будут рассмотрены сначала сигналы, с которыми обычно приходится ям.еть дело, в РСА,, а затем. — осо- особенности их цифровой обработки.
Применение ЦОС в 355 5.10.1. Общие положения Рассмотрим представленные из грис, 5,49 типичные геометри- геометрические соотношения, характерные для использования РСА в ре- режиме полосовой съемки. Самолет с установленной на нем антен- антенной, физический раскрыв которой равен L, летит по прямой линии с постоянной скоростью v на высоте h. С помощью антенны, электрическая ось которой обычно ориентирована перпендикуляр- перпендикулярно направлению полета, облучаются цеди, расположенные на по- Ширина диаграммы направленности антенны г-Область Рис. 5.49. Геометрические соотношения при съемке с помощью РСА. верхиоети Земли. Прлнятые сигналы накапливаются, а затем под- подвергаются обработке, цель которой — построить радиолокацион- радиолокационное изображение поверхности. Кроме того, возможно (и часто используется на практике) смещение электрической оси антенны в направлении полета, как показано на рис. 5.49. В телескопи- телескопическом режиме РСА положение антенны непрерывно подстраива- подстраивается таким образом, чтобы облучалась одна и та же область на поверхности и обеспечивалась радиолокационная съемка этой об- области с очень высоким разрешением. Чтобы выявить особенности алгоритмов обработки сигналов РСА, рассмотрим упрощенную геометрию съемки, сведя ее к дву- двумерному случаю за счет пренебрежения высотой (рис. 5.50). Предположим, что излучается непрерывный монохроматический сигнал, а отражение создается единственной целью с координата- координатами (х\, z\). Правда, такой зондирующий сигнал не обеспечит раз- разрешения на дальности; (Вопросы разрешения по дальности будут рассмотрены позднее. Так как ширина диаграммы направленно- направленности физической антенны РСА равна K/L, то щель будет облучать- облучаться, когда антенна находится между точками Xi=X\—Xzj/2L и Xf = =X\-\-Xz\l2L. За счет относительного движения цели и антенны 23 s
356 Глава 5 принятый сигнал будет иметь доплеровское смещение. Именно доплердаское смещение используется для того, чтобы, выполнив когерентную обработку, улучшить разрешающую способность по азимуту. Так как время распространения сигнала от антенны до цели и обратно составляет 2R(t)lct то принятый сигнал равен E.60) Будем считать, что, пока цель облучается, амплитуда принятого сигнала a(t) остается постоянной. На самом деле при смещении антенны амплитуда будет изменяться соответственно диаграмме положение локатора (х = vtj {Направление сно/хквш) Цель R(t)=v(vt-x,)ir'(t) Рис. 5.50. Упрощенная геометрия съемки для РСА. направленности, причем в точках Xi и х/ мощность сигнала умень- уменьшится вдвое. Однако это изменение амплитуды является система- систематическим и заранее известно, поэтому его можно учесть на этапе обработки. Мгновенная частота принятого сигнала равна производной от его фазы по времени, т. е. = соо -—(vt—x-^Rr1^). E,61) Второй член представляет собой доплеровское смещение частоты. Разложив R{t) в ряд Тейлора в окрестности точки t\=X\lv, мож- можно получить линейную аппроксимацию доллеровского смещения. Так как E.62)
Применение ЦОС в радиолокации 357 ТО Следовательно, частота эхо-сигнала от точечной цели, принимав-- мого в РСА, меняется приблизительно по линейному закону. Ско;- рость изменения частоты этого. ЛЧМ-сигнала равна 2со0и2/2ясгь. длительность XzJvL, девиация частоты 2v/L, а база ZkzJL2. От- Отсюда следует, что для определения положения цели в азимуталь- азимутальном направлении можно воспользоваться методикой сжатия при- принимаемого ЛЧМ-сигнала с помощью согласованной фильтрации. Получаемое при этом разрешение по азимуту пропорционально длительности импульса после сжатая. Напомним, что длитель- длительность ЛЧМ-импульса после сжатия равна 1/W, где W-—девиация, частоты несущей ЛЧМ-импульса. Пересчитав разрешение по вре- времени к» разрешению по азимуту, получим PA3&3 = vBv/L)-l = L/2. Итак, для рассмотренного идеализированного случая на разреше- разрешение по азимуту, достигаемое с помощью радиолокатора с фокуси- фокусированным синтезам апертуры, теоретически не влияют ни даль- дальность до цели, ни длина волны. Важно отметить, что база ЛЧМ- импульса зависит от Z\, так что. для различных дальностей потре- потребуются разные согласованные фильтры. В результате обработка сигналов в РСА оказывается очень сложной и связана с выпол- выполнением весьма 'большого количества операций. Как и при обычной согласованной фильтрации, рассмотренной выше (см. разд. 5.4.2), сжатие импульса можно дополнить взве- взвешиванием и уменьшить таким образом уровень боковых лепест- лепестков за счет некоторого расширения главного лепестка. В общем случае принятый сигнал является результатом суперпозиции- большого количества эхо-сигналов с различными амплитудами,. поэтому уровень суммарной энергии в боковых лепестках оказы- оказывает существенное влияние на величину динамического диапазо- диапазона итоговой радиолокационной карты. Несмотря на то что почти вое предположения, использованные в проведенном выше анализе, на практике справедливы лишь при- приблизительно, основные идеи обработки сигналов РСА все же ос- остаются в силе. Рассмотрим введенные предположения более под- подробно. Прежде всего аппроксимация R{t), основанная на разло- разложении этой функции в ряд Тейлора, которая привела к ЛЧМ-мо- дуляции в азимутальном направлении, справедлива лишь при ма- малых t в окрестности точки t\ = X\lv. Иначе говоря, использование при обработке iM-етодики сжатия именно ЛЧМ-И'Мпульсов приво- приводит к ограничению предельного размера синтезируемой апертуры. Кроме того, важно, чтобы при перемещении антенны РСА вдоль отрезка пути, равного размеру синтезируемой апертуры, цель ?>етавалась в пределах одной и той же дальностной полосы, так
'358 ; Глава 5 как сжатие импульса в азимутальном направлении выполняется для фиксированной дальности. Таким образом, в 'реальной си- системе не удается достичь теоретического значения предельного разрешения по азимуту, равного L/2. Большая практическая трудность заключается в том, что при полете самолета трудно поддерживать постоянными скорость и направление движения, вследствие чего эхо-сигнал будет отличаться от идеального ЛЧМ- импульса. Если в этих условиях требуется получить радиолока- радиолокационную карту с высоким разрешением, то необходимо при съем- съемке произвести измерения трассы полета, используя высокочувст- высокочувствительную инерциальную ¦навигационную систему, а затем пр>и обработке до сжатия импульса по азимуту скорректировать фазу принятого сигнала. Выше предполагалось, что излучается непрерывный монохро- монохроматический сигнал. Он не обеспечивает разрешения по второй координате — дальности, а 'без этого невозможно, используя РСА, получить радиолокационную карту. Поэтому обычно в качестве зондирующего сигнала используется пачка импульсов. Эхо-сигна- Эхо-сигналы, соответствующие одной и той же дальностной пол-осе, накап- накапливаются на нескольких последовательных периодах излучения, а затем совместно обрабатываются, шричецл эхо-сигналы от раз- различных дальностей обрабатываются раздельно. Частота повторе- повторения излучаемых импульсов в пачке должна удовлетворять двум требованиям,, вытекающим из условий однозначного разрешения по дальности и по доплеровскому смещению (т. е. ,в азимутальном направлении). Чтобы обеспечить однозначное разрешение по даль- дальности, нужно выбрать период повторения импульсов короче 2-/?макс/с. С другой стороны, так как эхо-сигналы, получаемые при излучении коротких импульсов, эквивалентны отсчетам ЛЧМ.- сигнала, принимаемого после отражения от точечной цели, нужно, чтобы частота дискретизации была достаточно большой и соот- соответствовала теореме Найквиста, гарантирующей отсутствие нало- наложений распределенных по азимуту доллеровских спектров. По- Поскольку ширина полосы ЛЧМ-сигнала равна 2v/L, то частота по- повторения импульсов 1/А должна удовлетворять следующим усло- условиям: 2v/L <~l< c/2RMaKc. E.64) Выше предполагалось, что разрешение по дальности обеспечива- обеспечивается за счет излучения коротких импульсов. Однако для этой же цели можно использовать и основанную на согласованной фильт- фильтрации операцию сжатия импульса, которая должна предшество- предшествовать сжатию импульса тю азимуту. Отметим, что операции сжа- сжатия импульса по дальности и по азимуту независимы.
Применение ЦОС в радиолокации 359* 5.10.2. Объем вычислений Методика обработки сигналов РСА, описанная в предыдущем разделе, предполагает выполнение согласованной фильтрации по двум переменным — дальности и азимуту. Обычно, чтобы спра- справиться с 'большим объемом данных, которые приходится накап- накапливать и обрабатывать в системах РСА, использовались методы оптической обработки .сигналов. При этом оптическая обработка выполнялась, как правило, не в реальном времени: данные пред- предварительно регистрировались на фотопленке. Для проведения об- обработки использовалась очень сложная оптическая система. Оп- Оптические системы имеют существенные недостатки. Они очень- дорогие и, кроме того, ограничивают возможности проведения по- полосовой съемки при движении по не совсем прямолинейной траек- траектории, причем практически нельзя скорректировать это движение,, поскольку оптическая обработка не является универсальной. Конечно, с точки зрения универсальности обработки и возмож- возможности ее выполнения в реальном времени предпочтение следует отдать цифровым методам, однако при их использовании сталки- сталкиваются с трудностями, связанными с широкой полосой обраба- обрабатываемых сигналов, большим требуемым объемом памяти и ог- огромным количеством операций, которые приходится выполнять- при картографировании с высоким разрешением. Структура устройства цифровой обработки сигналов РСА в значительной степени будет определяться используемыми элементами. Ниже рассматриваются требования, предъявляемые к объему памяти для хранения данных и быстродействию устройства обработки. В РСА для каждого зондирующего импульса приходится на- накапливать данные, относящиеся ко всем интересующим нас даль- дальностям. Если для обеспечения разрешения по дальности исполь- используется сжатие импульсов с помощью согласованной фильтрации,. то этот вид обработки может быть выполнен непосредственно над. входными данными. Для получения разрешения по азимуту необ- необходимо накопить данные по большому числу зондирований. Если накапливаемые данные размещаются в виде матрицы (рис. 5.51), элементы которой упорядочены по дальности и по времени, то заполнение матрицы производится по столбцам. При сжатии сиг- сигналов по азимуту необходима совместная обработка отсчетов, раз- размещающихся на одной строке. Для хранения накапливаемых от- отсчетов требуется память весьма большого объема. Кроме того,, достаточно громоздкой оказывается и сама обработка, так как для каждой дальноютной полосы требуется свой, отличный от дру- других фильтр, обеспечивающий сжатие импульсов по азимуту. Приведем конкретный пример. Пусть разрешающие способно- способности по азимуту и по дальности равны, причем общий диапазон.' просматриваемых при съемке дальностей равен Аг. Тогда в каж- каждом столбце матрицы на рис. 5.51 будут содержаться Az/(L/2) =
-360 Глава 5 = 2AzlL=M отсчетов, а в каждой строке будет находиться N(zi)=2kzi/L2 отсчетов (предполагается, что частота дискрети- дискретизации равна частоте Найквиста). Итак, требуемый объем памяти составляет 2Аг СЛОВ. E.65) Объем вычислений определяется совокупным количеством опе- операций, которые выполняются в М параллельно работающих ка- каналах сжатия импульсов по азимуту. В каждом из этих каналов 2Xz, отсчетаВ- отсчетов -Данные РСА, относящиеся к наклонной, вольности Zi Время Рис. 5.51. Размещение накапливаемых данных, подлежащих обработке в РСА, в виде двумерной матрицы. 1 производится согласованная фильтрация по N'(zi) =2Xzi/'L2 от- отсчетам, так что при прямом вычислении сверток количество опе- операций, отнесенное к одному периоду повторения зондирующих им- импульсов, ограничивается величиной 2MKRMaKa/L2 умножений. E.66) Если рассмотреть типовые характеристики РСА, то можно убе- убедиться, что предъявляемые требования исключительно высоки. При Аг=10 км, Х = 3 см, /?макс=10 км, L = 2 м и d = 400 м/с) время умножения не должно превышать 1,67 не (что соответству- соответствует 6-Ю8 умножениям в секунду), а память должна обеспечивать накопление 1,5-106 комплексных слов. Требование к быстродействию можно снизить, если использо- использовать алгоритм высокоскоростной свертки с применением БПФ и распараллеливание операций, но даже при этом необходимая скорость вычислений остается все еще слишком высокой. Более того, объем памяти на самом деле требуется увеличить, так как необходимо промежуточное накопление данных. При работе РСА в телескопическом режиме применение алгоритма БПФ создает дополнительные возможности сокращения требуемого быстродей- быстродействия и практической реализации устройства обработки сигналов РСА.
Применение ЦОС в радиолокации 361 5.10.3. РСА в телескопическом режиме Тот факт, что частота принимаемого сигнала при изменении азимута цели меняется ло линейному закону, позволяет создать устройство, в котором с помощью алгоритма БПФ выполняется обработка, эквивалентная сжатию импульса. Она включает ЛЧМ- демодулядию и спектральный анализ. При зтсш разрешение по азимуту обеспечивается за счет того, что различные цели имеют неодинаковые значения доплеровского смещения частоты. Рассмотрим эхо-сигналы от двух целей, находящихся на од- одной й той же дальности гь но смещенных по азимуту так, что для одной из .них х=Х\, а для другой х=х2. Если, как и ра-нее, огра- ограничиться предположением, что частота зхо-сигналов меняется по линейному закону, то принятый сигнал будет равен сумме двух ЛЧМ-сигналов, т. е. г^е-'^'-^+е-'^^. E.67) Приняв Х\ за начало отсчета и, умножив r(t) на сигнал, комп- комплексно-сопряженный с ЛЧМ-сигналом, принятым от цели с ази- азимутом х=Х\, получим 1-*11. Eб8) Эта операция, заключающаяся в устранении члена с квадратич- квадратичным изменением фазы, иногда называется ЛЧМ-демодуляцией. После выполнения этой операции разделение эхо-сигналов от обеих целей может 'быть выполнено с помощью спектрального анализа. Эхо-сигнал от цели, находящейся в точке начала отсчета x=xi, будет размещаться на нулевой частоте, а от цели с азиму- азимутом х—х2 — на частоте 2cuo^(*i—x2)/czi. Таким образом, устрой- устройство 'Цифровой обработки сигналов РСА может содержать умно- умножитель для ЛЧМ-демодуляции с последующим выполнением БПФ. Использование именно алгоритма БПФ принципиально не- необходимо для того, чтобы можно было создать устройство обра- обработки, работающее в реальном времени. Возможность использования алгоритма БПФ ограничена не- небольшой областью, сконцентрированной вокруг точки начала от- отсчета х=х\, так как только вблизи нее справедливо предполо- предположение о линейном изменения частоты. Следовательно, описанный метод обработки сигналов естественно подходит для использова- использования РСА в телескопическом режиме. Съемка отдельных неболь- небольших областей вокруг точки начала отсчета производится незави- независимо, а затем из малых радиолокационных «а;рт составляется од- одна большая карта.
362 Глава 5 Еще один вопрос, с которым (приходится сталкиваться при формировании радиолокационной карты с помощью алгоритма БПФ, касается ширины полосы частот, в которой выполняется спектральный анализ после операции ЛЧМ-демодуляции. За счет импульсного характера излучаемого колебания эхо-сигнал, соот- соответствующий одной и той же дальности, будет дискретизован, при- причем частота дискретизации оказывается больше частоты девиации .ЛЧМ-сигналов, .принимаемых после отражения от отдельных то- точечных целей, размещающихся в пределах области, облучаемой диаграммой антенны. Поэтому, как это обычно имеет место, ши- ширина полосы частот, ов которой выполняется спектральный анализ с помощью алгоритма БПФ, -может быть взята намного меньше частоты дискретизации («а .практике ограничением является ап- аппроксимация частотного хода линейным законом). Поэтому целе- целесообразно сначала ограничить полосу сигнала, относящегося ж постоянной дальности, до допустимой величины и лишь после этого выполнить БПФ, <но меньшего размера. В РСА эту опера- операцию называют предварительным суммированием, так 'как одна из ее возможных реализаций заключается в простом сложении не- нескольких последовательных отчетов. С точки зрения цифровой обработки сигналов эта операция заключается в прореживании отсчетов по времени и понижении таким способом частоты дис- дискретизации. Для того чтобы избежать наложений спектров в вы- выделяемой полосе частот, необходимо использовать цифровой фильтр нижних частот. Элементарный подход, заключающийся в суммировании последовательных отсчетов, эквивалентен исполь- использованию фильтра нижних частот с прямоугольной импульсной ха- характеристикой, частотная характеристика которого пропорцио- пропорциональна sin Л/со/Л^ sin со. Использование операции предварительного суммирования при обработке сигналов телескопического РСА по- позволяет во (много раз уменьшить объем вычислений. Для подавле- подавления в частотной области -больших боковых лепестков, характерных для фильтра с прямоугольной импульсной характеристикой, мож- можно использовать другие импульсные характеристики или, возмож- возможно, оптимальный фильтр нижних частот. Очевидно, что с аппара- аппаратурной точки зрения их /реализация будет более сложной, так как в фильтре с 'прямоугольной импульсной характеристикой не ис- используются умножения, а выполняются только сложения. Отметим еще одно преимущество, связанное с использованием алгоритма БПФ при обработке сигналов телескопического РСА. Так как эхо-сигналы, относящиеся к одной и той же дальности, умножаются на эталонный сигнал, соответствующий точке начала отсчета, то можно просто построить схему компенсации движения за -счет такого изменения эталонного сигнала, которое учитывало бы фактическую траекторию отолета. Если траектория является прямой, то эталонный сигнал представляет собой ЛЧМ-сигнал, в противном случае необходимо обеспечить модуляцию эталонно-
Применение ЦОС в радиолокации 363 го сигнала по фазе, которая выполняется с помощью инерциаль- ной навигационной системы и предназначена для коррекции от- отклонений траектории полета от прямой линии и непостоянства скорости полета. Эта коррекция движения особенно важна при. съемке с высокой разрешающей способностью. Благодаря прису- присущей цифровым' методам универсальности имеется возможность коррекции движения в реальном времени в процессе приема дан- данных. 5.11. Заключение В данной главе было рассмотрено применение цифровых ме- методов обработки сигналов в радиолокационных системах несколь- нескольких типов. Основные преимущества цифровых устройств обработ- обработки заключаются в их универсальности я высокой точности, кото- которую они могут обеспечить. Благодаря универсальности этих устройств можно реализовать множество самых разнообразных алгоритмов обработки и легко приспосабливаться к изменяющей- изменяющейся целевой обстановке. Для разработчика системы точность обра- обработки является параметром, изменяя который можно найти при- приемлемый компромисс между характеристиками системы т объемом ее оборудования, который возрастает при увеличении разрядно- разрядности слов. Анализ различных радиолокационных систем показал, что ал- алгоритм БПФ играет важную роль при реализации как высокоско- высокоскоростной свертки, так и спектрального анализа. На примере поточ- поточного -согласованного фильтра, основанного на алгоритме БПФ, проиллюстрирован один из подходов к построению систем с очень высокой производительностью, связанный с распараллеливанием операций и применением быстродействующих схем. При разработке цифровых систем радиолокатора или в случае каких-либо других применений всегда приходится выбирать эле- элементную базу. Среди серийно выпускаемых интегральных микро- микросхем имеются ИС самых различных типов, начиная с ИС высокой интеграции, но невысокого быстродействия и кончая быстродейст- быстродействующими ИС более низкого уровня интеграции. До недавнего вре- времени при разработке высокопроизводительных цифровых систем наблюдалась тенденция к применению быстродействующих типов ИС. Однако с появлением больших ИС, причем интеграция ИС и в настоящее время продолжает повышаться, целесообразно также проанализировать и другой вариант построения системы с тем же быстродействием, использующий распараллеливание. Продолжающийся прогресс в технологии производства ИС позво- позволит в будущем разработать и создать цифровые системы, способ- способные обрабатывать сигналы, принимаемые в более широких поло- полосах и на более продолжительных временных интервалах,, чем это | возможно в настоящее время.
364 Глава 5 Замечание Настоящая работа была выполнена по заказу министерства ВВС, .министерства обороны и Федерального авиационного управ- управления США. Однако мнения и .выводы, приведенные здесь, выра- выражают точку зрения авторов и не должны .рассматриваться ни как официальная точка зрения, ни как прямо «ли косвенно выражен- выраженная позиция правительства США. ЛИТЕРАТУРА 1. Allen J., Computer Architecture for Signal Processing, Proc. IEEE, 63, 4, 624— 633 A975). 2. Berkowitz R. S., ed., Modern Radar: Analysis, Evaluation, and System Design, John Wiley and Sons, Inc., New York, 1965. [Имеется перевод: Современная радиолокация под ред. Берковица Р. С. — М.: Сов. радио, 1969.] 3. Blankenship P. E., Hofstetter E. M., Digital Pulse Compression via Fast Con- Convolution, IEEE Trans. Acoust. Speech and Signal Proc, ASSP-23, 189—201 A975). 4. Blankenship P. E., LDVT: High Performance Minicomputer for Real-Time Speech Processing, EASCON 75 Record, IEEE Pub. 75 CHO 99805 EASCON, pp. 215A-G. : 5. Brown W. M., РогсеЦо L. J., An Introduction to Synthetic Aperture Theory, IEEE Sped., 52—62 A969). 6. Camp W. W., Axelbank M., Lynn V. L, Margolin J., ALCOR-A High Sensiti- Sensitivity Radar with 0,5 m Range Resolution, IEEE 1971 Intern. Conv. Digest, March 1971, pp. 112—113. 7. Cook С. Е., Bernfeld M., Radar Signals, An Introduction to Theory and Appli- Application, Academic Press, Inc., New York, 1967. [Имеется перевод: Кук Ч., Бернфельд М. Радиолокационные сигналы. Теория и применение. — М.: Сов. Радио, 1971.] 8. Cutrona L. J., Synthetic Aperture Radar, Chapter 23 in Radar Handbook, M. I. Skolnik, ed., McGraw-Hill, New York, 1970. [Имеется перевод: Катрона Л. Радиолокационные станции с синтезированием апертуры, гл. 8 в книге «Спра- «Справочник по радиолокации», под ред. М. Сколника, т. 2. — М.: Сов. радио, 1977.] 9. Deley G. W., Waveform Design, Ch. 3 in Radar Handbook, M. I. Skolnik, ed., McGraw-Hill, New York, 1970. [Имеется перевод: Дилей Г. Теория радиоло- радиолокационных сигналов, гл. 3 в книге «Справочник по радиолокации», под ред. М. Сколника, т. 1. — М.: Сов. радио, 1976.] 10. Delong D. F., Hofstetter E. M., On the Design of Optimum Radar Waveforms for Clutter Rejection, IEEE Trans. Info. Theory, IT-13, 454—463 A967). 11. Despain A. M., Fourier Transform Computers Using CORDIC Iterations, IEEE Trans. Comput., C-23, 10, 993—1001 A974). 12. DSP Committee IEEE ASSP Society, Selected Papers in Digital Signal Pro- cessin, II, IEEE Press, New York, 1976. 13. Filip A. E., A Baker's Dozen Magnitude Approximation and Their Detection Statistics, IEEE Trans. Aerospace and Electronic Systems, AES-12, 1, 87—89 A976). 14. Gold В., Rader C, Digital Processing of Signals, McGraw-Hill, New York, 1969. [Имеется перевод: Гоулд Б., Рэйдер Ч. Цифровая обработка сигна- сигналов.— М.: Сов. радио, 1973.] 15. Gold В., Lebow I. L., McHugh P. G., Rader С. М., The FDP, A Fast Program- Programmable Signal Processor, IEEE Trans. Comput., C-20, 1, 33—38 A971). 16. Gold В., Bially Т., Parallelism in Fast Fourier Transform Hardware, IEEE Trans. Aud. and Electroacoust., AU-21, 5—16 A973).
Применение ЦОС в радиолокации 365 17. Graham D. N.. FFT Algorithm, Proc. of the 1971 IEEE Intern. Comput. So- city Conf., IEEE Pub. No. 71C41-C, pp. 11—12. 18. Groginsky H. L., Works G. A., A Pipeline Fast Fourier Transform, IEEE Trans. Comput., C-19, 1015—1019 A970). 19. Harger R O., Synthetic Aperture Radar Systems Theory and Design, Academic Press, N. Y. 1970. 20. Houts R. C, Burlage D. W., Design Procedure for Improving the Usable Band- Bandwidth of a MTE Radar Signal Processor, 1976 IEEE Intern. Conf. ASSP, Apr. 12—14, 1976, pp. 745—748. 21. Kirk J. C, A Discussion of Digital Processing in Synthetic Aperture Radar, IEEE Trans. Aerospace and Electronic Systems, AES-11, 3, 326—337 A975). 22. Klauder J. R., Price A. C, Darlington S., Albersheim W. J., The Theory and Design of Chirp Radars, Bell System Tech. J., 39, 4, 745—808 A960). 23. Lundh Y. G., Multi-Processor Systems for High Capacity Signal Processing, Record of the International Conference on Computer Communications, Stock- Stockholm, Sweden, Aug. 1975, pp. 325—329. 24. Marcum J. I., Swerling P., Studies of Target Detection by Pulsed Radar, IRE Trans., IT-6, 59—308 A960). 25. Muehe С E., Cartledge L., Drury W. H., Hofstetter E. M., Labitt M., McCori- son P. В., Sferrino V. J., New Techniques Applied to Air-Traffic Control Ra- Radars, Proc. IEEE, 62, 6, 716—723 A974). [Имеется перевод: Мюэ Ч., Карт- ледж Л. и др. Новые технические решения в радиолокационных станциях службы движения.— ТИИЭР, 1974, т. 62, № 6, с. 77—86.] 26. Muehe С. Е., Advances in Radar Signal Processing, presented at Electro'76, 11—14 May 1976. 27. North D. O., An analysis of the Factors Which Determine Signal — Noise Discrimination in Pulsed Carrier Systems, RCA Lab. Rept., PTR-6C, June 1943; Proc. IEEE, 51, 1016—1027 A963). [Имеется перевод: Hope Д. Анализ фак- факторов, определяющих обнаружение сигнала на фоне шумов в системах с им- импульсной модуляцией несущей. — ТИИЭР, 1963, т. 51, № 7, с. 1016—1030.] 28. O'Donnell R. М., Muehe С. Е„ Labitt M., Drury W. H., Cartledge L, Advanced Signal Processing for Airport Surveillance Radars, EASCON 74 Record, p. 71A —71F. 29. O'Leary G. C, Nonrecursive Digital Filtering Using Cascade Fast Fourier Transforms, IEEE Trans. Aud. And Electracoust, AU-21, 5—16 A973). 30. Oppenheim A. V., Schafer R. W., Digital Signal Processing, Prentice-Hall, Englewood Cliffs, N. J., 1975. [Имеется перевод: Оппенгейм А., Шафер Р. Цифровая обработка сигналов.—М.: Связь, 1980.] 31. Oppenheim A. V., Weinstein С. J., Effects of Finite Register Length in Digital Filtering and the Fast Fourier Transform, Proc. IEEE, 60, 957—975 A972). [Имеется перевод: Оппенгейм А., Вайнштейн Г. Влияние конечной длины ре- гистра при цифровой фильтрации и быстром преобразовании Фурье. — ТИИЭР, 1972, т. 60, № 8, с. 41—65.] 32. Pezaris S. ?>., A 40-ns 17-Bit Array Multiplier, IEEE Trans. Comput., C-20, 4, 442—447 A971). ¦33. Purdy R. J. et al., Digital Signal Processor Designs for Radar Applications, MIT, Lincoln Laboratory, Lexington, Mass., T. N. 1974—58, Vols. 1 and 2, 31 Dec. 1974. 34. Rabiner L. R., Gold В., Theory and Application of Digital Signal Processing, Prentice-Hall, Englewood Cliffs, N. J., 1975. [Имеется перевод: Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов. — М.: Мир, 1978.] 35. Rabiner L. R., Rader С. М., Selected Papers in Digital Signal Processing, IEEE Press, N. Y., 1972. •36. Rihaczek A. W., Principles of High-Resolution Radar, McGraw-Hill, New York, 1969. 37. Semiconductor Data Library, Volume 4, MECL Integrated Circuits, Motorola Semiconductor Products Inc., 1974.
366_^^, „. Глава 5 38. Skolnik M. L, Introduction to Radar Systems, McGraw-Hill, 1962. [Имеется пе- перевод: Скольник М. Введение в технику радиолокационных систем. — М.: Мир, 1965.] 39. Skolnik M. I., ed., Radar Handbook, McGraw-Hill, New York, 1970. [Имеется перевод: Справочник по радиолокации, под ред. М. Сколника, т. 1—4.'—М.: Сов. радио, 1976—1979.] 40. Special Issue on Modern Radar Technology and Applications, Proc. IEEE, 62, 6 A974). [Имеется перевод: Тематический выпуск «Современная радиоло- радиолокационная техника и ее применение». — ТИИЭР, 1974, 62, № 6.]; 41. Stockham T. G., High Speed Convolution and Correlation, 1966 Spring Joint Comput. Conf., AFIPS Conf. Proc, vol. 28, Spartan Books, New York, 1966, pp. 229—233. 42. The TTL Data Book for Design Engineers, Texas Instruments, Inc., 1973. 43. Thornton J. E., Parallel Operation in the Control Data 6600, AFIPS Conf. Proc., Vol. 26, Part 11, 1964 Fall Joint Comput. Conf., pp. 33—40. 44. Voider J. E., The CORDIC Trigonometric Computing Technique, IRE Trans. Elect. Comput., EC-8, 330—334 A959). 45. Woodward P. M., Probability and Information Theory, With Applications to Radar, Pergamon Press, Elmsford, N. Y., 1953. [Имеется перевод: Вудворд П. Теория вероятности и теория информации с применениями в радиолокации. —¦ М.: Сов. радио, 1955.] 46. Wozencraft J. M., Jacobs I. M., Principles of Communication Engineering, John Wiley and Sons, N. Y., 1965. [Имеется перевод: Возенкрафт Дж., Джекобе И_ Теоретические основы техники связи.'—М.: Мир, 1969.],
Глава 6 ОБРАБОТКА СИГНАЛОВ В ГИДРОЛОКАЦИИ А. Б. Бэггероуер^ *6.1. Введение Во всех современных гидролокационных системах обработка сигналов относится к числу наиболее важных операций. В соче- сочетании с операциями, выполняемыми акустическим преобразовате- преобразователем, она дает возможность получить информацию об окружающем .пространстве в океане. Чтобы убедиться в этом, достаточно про- проследить за развитием гидролокационных систем. В первых систе- системах использовались простые фильтры и антенные решетки. Вско- Вскоре выяснилось следующее: для того, чтобы понимать, что именно наблюдается с помощью гидролокатора, необходимо намного луч- лучше знать свойства водной среды -и особенности распространения в ней акустических сигналов. После того как было оценено влия- влияние водной среды на распространение акустических сигналов, стала возможной разработка методов анализа сигналов акустиче- акустических преобразователей. Наблюдается непрерывный прогресс в раз- развитии гидролокационных систем: улучшение характеристик устройств обработки требует более глубокого понимания особен- особенностей распространения акустических волн в водной ореде, а усо- усовершенствование акустических моделей стимулирует разработку более сложных методов обработки сигналов. .После того как были созданы акустические модели и соответ- соответствующие устройства обработки сигналов, сразу же выяснилось, что универсальность, которой они должны обладать, чтобы их можно было использовать в гидролокацнонных системах, превы- превышает возможности всех аналоговых систем, включая наиболее сложные из них. Требования универсальности естественным обра- образом привели к внедрению цифровых систем. Сначала это были либо специализированные устройства, в частности устройства, ис- тюльзующие жесткое ограничение сигналов, либо универсальные вычислительные машины, особенно при исследованиях 'новых ал- алгоритмов. Прежде всего начали применять специализированные цифровые устройства, однако в настоящее speiMH, как и во мно- Ч А. В. Baggeroer, .Massachusetts Institute of Technology, Cambridge, Mass. 02139. 367
368 Глава 6 гих других областях техники, наблюдается тенденция к использо- использованию микропроцессоров и мини-ЦВМ. Цель настоящей главы заключается в том, чтобы дать основ- основные принципы обработки гидролокационных сигналов, причем ос- основное внимание уделяется акустическим моделям, а также опе- операциям, используемым в процессе обработки сигналов. При этом особенности построения конкретных систем рассматриваться не Активная гидролокация Картографирование и профилирование Пассивная гидролокация^ Рис. 6.1. Примеры использования гидролокационных систем. будут; читателю, интересующемуся этими вопросами, следует об- обратиться к гл. 5 по радиолокации, в которой вопросам реализации систем обработки сигналов уделяется больше внимания. Во мно- ¦ гих случаях, и в частности при построении согласованных фильт- фильтров, общий подход и способы реализации оказываются оо-сущест- ву аналогичными. Рассмотреть все вопросы, касающиеся гидролокационных си- систем, было бы затруднительно, 'поэтому ограничимся несколькими наиболее важными из них, схематично представленными на рис. 6.1. Раньше наибольшее внимание уделялось активным и пассивным гидролокаторам военного назначения. Результаты обширных исследований, проведенных во время второй мировой войны, опубликованы в серии работ {!]. В настоящее время гид- гидролокационным системам, предназначенным для мирных приме- применений, уделяется все больше внимания [2], поскольку в боль- большинстве случаев гидролокатор является единственно возможным средством получения информации о водной среде. Материал данной главы распределен следующим образом. В разд. 6.2 рассмотрены наиболее важные характеристики рас- распространения акустического сигнала в толще воды. Изложение является далеко не исчерпывающим, а скорее иллюстративным; здесь преследуется цель показать, каким образом учитываются свойства водной среды .при создании 'моделей распространения акустических сигналов и какое влияние водная среда оказывает
Обработка сигналов в гидролокации 369* яа обработку сигналов. Понять это очень важно, поскольку вод- водная среда накладывает весьма серьезные ограничения на распро- распространение сигналов гидролокатора. Более подробно эти вопросы рассмотрены в фундаментальных работах {3—6]. Отметим также,, что новые результаты постоянно публикуются в нескольких жур- журналах, из которых ведущим является the Journal of the Acousticat Society of America. Раздел 6.3 посвящен активным гидролокационным системам. В этих системах генерируется (или излучается) акустическая энергия. Прошедшая через водную среду и отраженная от цели волна анализируется. Так как продолжительность излучения из- известна, то всегда можно с учетом характеристик водной среды по- подобрать сигналы, наилучшим образом подходящие для каждого- конкретного случая. Областями применения активной гидролока- гидролокация являются обнаружение и определение местоположения целей,, связь, навигация, картографирование и профилирование дна.. С точки зрения используемых методов и устройств обработки сиг- сигналов активные гидр о локационные системы имеют много общего с обычными радиолокаторами и системами радиосвязи, поэтому в данной главе часто 'будут встречаться также ссылки на работы, посвященные системам этих двух типов. При изложении многих, теоретических положений соответствующие математические вы- выкладки опущены из-за ограниченного объема книги; при необхо- необходимости можно воспользоваться работами, в которых подробно рассмотрены различные теоретические вопросы [7—10]. В разд. 6.4 описаны пассивные гидролокационные системы. С помощью этих систем осуществляется «прослушивание» сигна- сигналов, излучаемых теми или иными источниками акустической энер- энергии, находящимися в водной среде. Некоторые из источников, та- такие, как ветер, землетрясения, подводные обитатели, являются естественными, однако наибольший интерес представляют искусственные источники — торговые суда и военные корабли.. К числу наиболее важных пассивных гидролокационных систем относится система подводного наблюдения. Здесь обсуждаются лишь общие принципы действия систем; рассмотреть особенности их работы более детально не 'представляется возможным. Наибо- Наиболее важными видами обработки сигналов в пассивных гидролока- гидролокаторах являются спектральный анализ и совместная обработка массивов. В тексте неоднократно встречаются ссылки на источни- источники, посвященные этим двум видам обработки, причем часто они не имеют непосредственного отношения к гидролокационным си- системам. Спектральный анализ—давно определившаяся область у техники, претерпевающая в настоящее время значительные изме- I нения за счет усилий, направленных на использование цифровых "вычислительных машин. Много полезного можно найти в книгах [11—-13], однако основной материал по спектральному анализу содержится в журнальных публикациях. Аналогично обстоит дело- 24—359
370 Глава 6 и с совместной обработкой массивов.. Классические методы обра- обработки массивов описаны в нескольких работах, приводимых в биб- библиографии; попытки приспособить для обработки массивов циф- цифровые универсальные вычислительные машины привели к созда- созданию большого числа новых алгоритмов, которые опять-таки можно найти только в журнальных публикациях [44—16]. Прежде чем перейти к изложению материала, необходимо от- отметить, что читателю должны быть хорошо известны основы тео- теории обработки сигналов, и прежде всего теория линейных систем и преобразований. Достаточно широко используются здесь основы теории случайных процессов. В силу необходимости приводимый ниже материал носит обзорный характер и ориентирован лишь на ознакомление с основными теоретическими положениями и приме- применяемыми методами. Основное внимание уделено моделям и си- системам, которые обычно используются в процессе обработки сиг- сигналов. Часть из описываемых систем уже реализована, другие же, основанные на применении высокопроизводительных и универ- универсальных систем цифровой обработки сигналов, .появятся несколь- несколько позднее. Некоторые конкретные 'Приложения гидролокации будут описаны в данной главе только в качестве иллюстративных примеров, причем многие из них были выбраны лишь потому, что хорошо знакомы автору. 6.2. Характеристики распространения гидролокационных сигналов ' '¦ Характеристики распространения акустических волн в водной среде играют решающую роль при проектировании гидролокаци- гидролокационных систем. Описание гидроакустического канала усложняется возможностью многолучевого распространения, за счет которого могут существовать самые разнообразные виды волн и трассы пе- передачи энергии от точки к точке. Кроме того, всегда присутству- присутствует несколько факторов, искажающих сигналы, в том числе шумы. Таким образом, сама водная среда накладывает ряд серьезных ограничений на платформы и устройства, используемые для пере- передачи и приема акустических сигналов. Все эти ограничения были и ino-прежнему остаются предметом многочисленных исследова- исследований. Основным стимулом развития этих исследований было ис- использование гидролокаторов в военных целях, однако важную роль сыграли .и такие области применения, как океанография, поиски месторождений нефти, навигация, изучение прибрежной зоны. При изложении материала ставилась задача дать краткое опи- описание только тех эффектов, которые учитываются и при построе- построении моделей распространения, и при разработке методов анализа сигналов. В процессе изложения будут рассмотрены наиболее важные модели .распространения акустических сигналов, окру-
Обработка сигналов в- гидролокации 37.К жающий шум и шум реверберации,! влияние границ сред вода — дно и вода — воздух на сигналы, когерентность и флуктуации: сигналов, а также некоторые ограничения, накладываемые .на: платформы и устройства. Будет сделана попытка показать, ка- каким образом все эти факторы учитываются в алгоритмах обработ- обработки сигналов гидролокационных систем. Ясно, что по мере расши- расширения объема сведений обо всех этих факторах и увеличения: быстродействия и универсальности устройств обработки сигналов- будут создаваться новые, все более совершенные алгоритмы. 6.2.1. Распространение звука в толще воды При разработке гидролокациоиных систем 'приходится учиты- учитывать средующие три основных явления, которые наблюдаются при распространении звука: расширение фронта, поглощение и ъол- новодное распространение. Расширение фронта представляет со- собой чисто геометрическое ослабление звуковой волны, хотя за счет особенностей водной среды модель ослабления может быть- не такой, как для распространения в свободном пространстве. По- Поглощение акустической волны в воде может быть удивительно ма- малым, особенно по сравнению со случаями распространения звука в атмосфере и электромагнитных волн в воде. Тем не менее не- необходимо учитывать частотную зависимость поглощения, которая: может играть важную роль. Кроме того, важно отметить, что, хо- хотя в некоторых местах океан имеет очень большую глубину, в це- целом водный покров представляет собой довольно тонкий слой на. поверхности Земли. Поэтому даже на сравнительно небольших, расстояниях от .излучателя по горизонтали могут возникать явле- явления, связанные с волноводным распространением акустических, волн. Для моделирования расширения фронта звуковой волны ис- используется либо сферическая геометрия распространения в сво- свободном пространстве, приводящая к ослаблению энергии сигнала, по закону 1/г2, либо горизонтально-слоистая геометрия с ослабле- ослаблением, пропорциональным 1/г. На малых расстояниях от излуча- излучателя обычно более подходящей оказывается сферическая модель,. в остальных случаях лучше подходит цилиндрическая модель. Ес- Если на .распространение звука существенное влияние оказывает дно (при распространении на мелководье), то, согласно экспери- экспериментальным данным и теоретическим расчетам, энергия гидроаку- гидроакустических волн будет уменьшаться по закону 1/г3/2. Основной вы- вывод сводится к тому, что зависимость энергии волн от расстояния является алгебраической (не степенной); эту зависимость следу- следует применять только в случае, когда расстояния малы и ослабле- ослабление, обусловленное поглощением, еще несущественно. На больших расстояниях от источника акустических волн в во- воде, как правило, основную роль играют потери энергии за счет
<372 Глава ¦10' 10'' 1,, W W час/77о/ла,кГе{ Рис. 6.2. Объемное поглощение с учетом процессов релаксации [122]. А — поглощение с учетом соединений бора; Б — влияние Mg"SO4 на поглощение; В — струк- структурное поглощение; Г—поглощение за счет сдвиговой вязкости. S = 35, 7 = 4 °С, Р=300 аты. поглощения, изменяющиеся с расстоянием по экспоненциальному закону. Для их иллюстрации на рис. 6.2 приведена частотная за- зависимость коэффициента поглощения звука в воде (в дБ) на рас- расстоянии 1 км. Видно, что на некоторых участках диапазона час- частот наблюдается квадратичная зависимость коэффициента погло- поглощения а от частоты (пологие участки кривых на рис. 6.2 обусловлены явлениями релаксации на частичках соли, растворен- растворенной в морской воде). Эта частотная зависимость а оказывает ¦существенное влияние на некоторые характеристики устройств обработки сигналов гидролокационной системы. Чтобы получить высокое угловое разрешение и иметь возмож- возможность использовать широкополосные сигналы, в активных гидро- локацнонных системах приходится переходить на высокие часто- частоты. При приемлемых мощностях излучения максимально возмож- возможная частота сигнала определяется потерями за счет поглощения. Как правило, активные гидролокационные системы работают
Обработка сигналов в гидролокации 373 в частотном диапазоне 2—40 кГц, прячем наиболее распростра- распространенными являются частоты 3,5; 12 и 25 кГц, в расчете на которые выпускается 'много оборудования. На более высоких частотах потери вследствие иоглощения становятся слишком (большими, на- например Ю.дБ/км на частоте 50 кГц. (Правда, эхолоты измерения "глубины для любителей-подводников работают на значительно более высоких частотах, например1 200 кГц; поглощение в этом -случае позволяет многим подводникам иопользоеать один .и тот же частотный диапазон, не создавая помех друг другу.) На более низких частотах потери на поглощение уменьшаются, но одновре- одновременно ухудшаются характеристики устройств обработки сигналов и более сложным становится процесс распространения. Все эти факторы приводят к тому, что дальность действия большинства активных гидролокационных систем ограничивается диапазоном 10—100 км. Пассивные гидролокационные системы работают в низкочас- низкочастотном участке спектра только потому, что более высокочастот- высокочастотные составляющие сильно ослабляются за счет поглощения в тол- толще воды. Низкочастотные сигналы могут распространяться на очень большие расстояния. Проведено много экспериментов, под- подтвердивших .возможность распространения гидроакустических волн на большие расстояния [17]. Эта возможность обеспечива- обеспечивается двумя факторами: низким уровнем потерь на поглощение и слоистой структурой океана, за счет которой акустическая энер- энергия распространяется по различным трассам и каналам. Таким образом, именно низкий (уровень поглощения в водной среде, с од- одной стороны, делает возможным создание пассивных гидролока- гидролокаторов, а с другой —вызывает повышенный интерес к низкочастот- низкочастотной части спектра акустических сигналов. Волноводное распространение акустической энергии является результатом того, что водные пространства и их внутренние слои имеют сравнительно небольшую толщину. Типичный батиметриче- батиметрический профиль океана без увеличения масштаба по вертикали приведен на рис. 6.3. Там же для удобства сопоставления пока- показана зависимость длины волны от частоты сигнала в акустиче- акустическом диапазоне. Глубина океана, начиная с относительно неболь- небольших значений порядка 100 м и меньше на континентальном шель- шельфе, постепенно увеличивается и достигает обычно 4—5 км в бас- бассейне океана. Видно, что на мелководье глубина сравнима с дли- длиной волны низкочастотных колебаний. На глубоководье она, как правило, намного больше длины волны, хотя слоистая структура ¦океана, из-за которой скорость распространения звука оказывает- оказывается зависящей от глубины погружения, вызывает рефракцию и дей- действует как волновод. Вообще при изучении распространения аку- акустических волн в водной среде в любом конкретном направлении длина волны является весьма важным факторам. Так, если раз- размер акустического волновода в водной среде соизмерим с длиной
374 Глава 6 волны, то в модели, используемой при обработке сигналов, в пер- первом (приближении нужно учесть только явления, сопровождающие передачу энергии сигнала через воду, такие, как дисперсия и су- существование различных типов собственных волн. Проиллюстрируем несколькими примерами особенности рас- распространения звука на мелководье и на большой глубине. Для 400км 450 нм Континентальный шельр 550км Шин т Континентальный сллан Глубоководная равнина Ю 1001К f№) Рис. 6.3. Батиметрическое сечение вдоль George Bank без увеличения масштаба по вертикали (из работы [18]). моделирования распространения на мелководье в работе Пекериса использовался волновод, в котором существенное влияние на соб- собственные волны оказывает граница раздела вода—.морское дно. Эта модель изображена на рис. 6.4; обычно водный бассейн от- Водная поверхность. 1 Водный слойA465-ISIOm/c) Приемник Осас/очнь/й слой Рис. 6.4. Модель акустического волновода для распространения звука на мелко- мелководье, ограниченного осадочным слоем (предложена Пекерисом). носится к мелководью, если его глубина в 10 раз ^меньше длины волны акустического колебания, но это деление не является стро- строгим. Решение волнового уравнения Гельмтольца методом разделе- разделения переменных с граничными условиями на поверхности океана и морском дне выражается суммой собственных волн, яеренося-
Обработка сигналов в гидролокации 375 щих акустическую энергию. На рис. 6.5 приведены графики зави- зависимости волнового числа вдоль горизонтального направления от частоты и кривые дисперсии групповой скорости для нескольких собственных волн. Следовательно, при излучении широкополосно- широкополосного импульсного сигнала, например при ударе или взрыве в воде, энергия сбудет распространяться следующим образом. Излученная энергия селективно расфильтровьивается на нормальные волны. Для каждого из типов волн первой принимается низкочастотная компонента (так называемая групповая волна), которая частично распространяется в данном слое с максимальной скоростью; затем принимаются высокочастотные компоненты (водная волна), рас- г Шнло/f Вираждетие моЯы 12 3 4- 5 6 7 v/h ( Волновое vuc/ro/ Глубина канала а \/77'3 (Г Рис. 6.5. ь—волновые характеристики волновода Пекериса — графики зависимости нормированной Частоты от нормированного волнового числа для первых четырех типов волн: б — зависи- зависимость групповой скорости от частоты для первых трех типов волн в волноводе Пекериса.
376 Глава 6 пространяющиеся в волноводе со скоростью, близкой к скорости- звука в однородной воде; последней принимается компонента на- одной из средних частот, распространяющаяся с минимальной групповой скоростью. Цри проведении любого эксперимента всег- всегда приходится находить свертку 'возбуждающего колебания с им- импульсной характеристикой канала, чтобы рассчитать, как возбуж- возбуждается каждый из типов волн. Кроме того, необходимо учесть по- поглощение компонент более высокой частоты, приводящее к относительному увеличению отклика на более низких частотах, особенно для рефракционных трасс распространения. Что касает- касается обработки сигналов, то из приведенного примера должно быть ясно, что распространение звука на мелководье по многим 'много- 'многолучевым частотно-зависимым трассам является довольно слож- сложным процессом. Если даже законы распространения известны, особенно за счет перехода в частотную область и использования спектрографического анализа, любая действующая гидролокаци- гидролокационная система должна обеспечивать точное выявление эффектов распространения путем соответствующего выбора сигнала пере- передатчика и обработки сигналов в приемнике. Распространение акустических волн на глубоководье в значи- значительной степени определяется распределением скорости распро- распространения звука по глубине. Несколько типичных глубинных про- профилей скорости и трасс распространения для различных широт и времен года приведены на рис. 6.6. Много глубинных профилей скорости можно найти в соответствующих атласах '[19]. Зависи- Зависимость скорости распространения акустической волны от темпера- температуры и давления воды является причиной того, что профили ско- скорости имеют, как правило, два относительных минимума. Хотя разработано несколько очень сложных методов расчета тр'асс рас- распространения акустических волн, на основании простого анализа закона Снеллиуеа можно заключить, что акустические волны за счет рефракции отклоняются в направлении этих минимумов, так что между каждым из двух слоев воды с минимальными акусти- акустическими скоростями и водной поверхностью образуются волново- волноводы (или каналы) акустической энергии. Один из них является подводным звуковым каналом (ПЗК), иногда называемым кана- каналом СОФАР (SOFAR), а другой — приповерхностным волновод- ным каналом. ПЗК постоянно возникает в мировых океанах, обычно на глубине ~ 1 км, хотя на высоких широтах не исклю- исключено его появление и у поверхности. Энергия акустических волн, попадающая в этот канал, может распространяться на очень большие расстояния, особенно на низких частотах, для которых потери, обусловленные поглощением, незначительны. Это явление имеет большое значение для пассивных гидролокационных систем, ¦поэтому многочисленные исследования, а также многие системы обработки сигналов тесно связаны с рассмотренным видом рас- распространения акустической волны {17, 20—22].
Обработка сигналов в гидролокации 377 с, м/с 1500 1480 15.20 С -юоо__оа_ Глубина, \'м \ Трасса с зонами сходимости Устойчивая да стииеспая тра -2000 Подводный звуковой канал Наклон* 0,015 (м/с)/м Экваториальные широты Ось. звукового начала с,м/с' 1500 1540 1480 1520 Трасса, соглраокениемотвна Приповерхностный канал — -^se звукового канала Подводный звуковой канал с м/с i500 1540 /400 1520 -/000 -2000 -3000 \ Припоаерхностный звуковой канал Приполярные широты Рис. 6.6. Примеры глубинных профилей скорости распространения акустической волны на различных широтах и некоторые возможные трассы распространения. Большое влияние рефракционных эффектов в ПЗ'К на распро- распространение звука иллюстрируется на рис. 6.7, где изображены не- некоторые лучевые трассы звука, характерные для средних широт, лри различных глубинах погружения передатчика. Во-первых, •бросается в глаза искривление лучей ,в направлении минимума ¦скорости звука в акустическом канале, т. е. его оси, поэтому энер- тия непрерывно направляется обратно к этой оси. Во-вторых, ког- когда передатчик смещается от оси, все лучи фокусируются, или со- •бифаютея, в разнесенные через 60—70 км узлы концентрации, иа- зы-ваемые зонами конвергенции или дальними зонами акустиче- акустической освещенности. В-третьих, могут возникнуть новые трассы распространения, если имеют место отражения от дна (трассы
378 Глава 6 500- О 18 36 50D: 500- —г 54- п Г"—I 1 1 ^=1 г 72 90 108 126 144- 152 180 193 Расстояние, км О 18 36 72 30 108 126 144- 182 180 198 Расстояние, км 2250м О 18 36 Я 72 90 108 126 14-4 !62 180 198 Расстояние, паз . 3600м О 18 36 72 90 108 126 Рассглоянс/е, км 14-4 162 180 /98 Рис. 6.7. Диаграммы лучевых трасс в океане при четырех различных глубинах погружения передатчиков (взято из книги «Principles of Underwater Sound for Engineers», by Urick, McGraw-Hill, 1967, с разрешения издательства).
Обработка сигналов в гидролокации 379 1 -во Ч 10 Paccmoswi/e, км 20 30 40 50 60 Ю Расстояние, км 20 30 4-0 5060 Рис. 6.8. а — время распространения звука в воде на большие расстояния. А —¦ вторая трасса с отражением от дна; Б — первая трасса с отражением от дна; В — прямая трасса; Г — трассы с рефракцией в придонном слое; Д — прямые трассы (плюс многолучевость). б — ослабление звука низкой частоты на больших глубинах. Л — трассы с рефракцией в придонном слое; Б — потери на прямой трассе; В — первая трасса с отражением от дна; Г — расширение фронта и поглощение; Д — усиление в зоне конвергенции прямой волны. с отражением от дна) или рефракционные искривления лучей вблизи дна. Все эти эффекты представлены на рис. 6.8 для слу- случая взрывного сигнала на мелководье. Из общей структуры трасс нидно, что между передатчиком и приемником возможно много- многолучевое распространение, а из кривых зависимости потерь на трассе от расстояния можно найти соотношение между энергия- энергиями, «принятыми по разным трассам. Хотя изменения геометрии системы передатчик —приемник, профиля акустического канала, а также характеристик донлого слоя и оказывают некоторое влия- влияние на общую картину многолучевого распространения, в целом характер распространения сигнала на глубоководье остается не- неизменным. Второй важный минимум скорости звука .наблюдается очень близко от водной поверхности. Он имеет значительно худшую стабильность, так как подвержен сильному влиянию местного климата, и проявляется в дневное время. Сильная зависимость скорости звука от климата и времени дня объясняется тем, что
380 ¦ Глава 6 _ они влияют на температуру водной поверхности, за счет которой и образуется канал. Для активных гидролокационных систем, ра- работающих вблизи поверхности, такой канал может играть очень важную роль, так как из-за него может создаваться область за- затенения, в которой излученная энергия вследствие рефракции 'на- 'направляется обратно к поверхности. В результате, если даже по- погруженные цели находятся на небольших расстояниях, они могут не быть обнаружены из-за того, что канал препятствует проник- проникновению акустической волны 'на заметную глубину. С другой сто- стороны, если такой канал создается в обширной области океана,, появляется возможность распространения звука на очень большие расстояния (вдоль водной поверхности. Многолучевое распространение акустических волн относится к числу наиболее важных факторов воздействия окружающей среды, учитываемых при обработке сигналов в гидролокационной системе. Именно поэтому большое внимание всегда уделялось физике распространения и созданию моделей обработки сигналов, которые полностью соответствовали бы особенностям распростра- распространения акустических волн в воде. 6.2.2. Шум Присутствие шума в конечном счете ограничивает возможно- возможности любой системы обработки гидролокационных сигналов даже при наличии очень качественной информации об окружающей водной среде, которую можно использовать для прогнозирования характеристик распространения акустических волн. В общем слу- случае шумы делятся на внешние, собственные и реверберационные. Внешний шум является фоновым, как правило аддитивным .и об- образуется многочисленными посторонними источниками акустиче- акустической энергии, не представляющими интереса для оператора гид- гидролокатора. Его можно наблюдать в пассивном режиме без из- излучения энергии. Собственный шум представляет собой шум ближней зоны, /поступающий -в гидролокационную систему при движении судна. Он может состоять из машинных, кавитацион- ных или струйных шумов, возбуждаемых двигательной установ- установкой и гидродинамическими силами. Реверберациоиный шум соз- создается в активной системе за счет ложных отражателей, или це- целей. Чтобы наблюдать реверберационный шум, нужно излучить энергию, поэтому характеристики этого шума сильно зависят от вида излучаемого колебания. При описании внешнего шума основное внимание уделяется пространственной и временной зависимостям этого шума. Хотя при измерениях в различные времена года и в разных географи- географических районах наблюдаются заметные вариации шумов, в целом характер зависимостей для различных источников шумов изучен уже достаточно хорошо. Для описания частотной зависимости
Обработка сигналов в- гидролокации 381' 120 -20 Прерывистые ujwbe I I |ПИ явления к Землетрясения екие ис Осадки- -Kopaffnu, индустриальные источники Мор с/тай мес?- \ Принятые обозначения —•—¦ Гранины преобладающего u/t/s-ra \ —— Влияние ветра на шум от лузь/рьков \ и брь/зг <$$$дл(/яние ветра на hi/эпо- \ частотную компоненту на мешо - водье Сильные осадки водье:. Сильные осадки — С иль ни и шум am транслор/па ~ ШёОБышш щмвц транс/гарта намел- де ^=0бЫ1/нб!п wum отщансл Общая шарма спектра игулга от землетрясений и ejpmcs Э ло шкале /7рео~д~лаоаюл7 шумы 'турбулентности ю /О2 Ю3 Vacmcma, Гц Рис. 6.9. Спектр внешнего шума в океане [23]. акустических шумов часто используется обобщенный трафик Вен- Венца [23], изображенный на рис. 6.9. В диапазоне 1—10 Гц внеш- внешний шум часто обусловлен турбулентностью в океане и сейсмиче- сейсмической активностью океанического дна. В диапазоне 10—300 Гц ос- основными источниками шума являются корабли, причем за пос- последние годы в связи с возросшей интенсивностью судоходства;
.382 Глава 6 средний уровень шума .на таких частотах возрос. Форма спектра в этом диапазоне очень сильно зависит от близости к судоходным линиям и может соответствовать тональным сигналам, так как -основная часть шумов возбуждается вращающимися частями дви- двигательных установок. В качестве примера отметим, что в любой момент времени в Северной Атлантике одновременно находится приблизительно две-три тысячи судов. На частотах выше 300 Гц важную роль начинают играть воздействие ветра и поверхностные волнения, поэтому шум в данном диапазоне подвержен влиянии погоды. Наконец, на высоких частотах (порядка 100 кГц), рас- расположенных за пределами частотного диапазона большинства (хотя и не всех) гидролокационных систем, преобладает тепловой шум молекул воды. Что касается пространственной зависимости внешнего шума, т. е. его направленности, то в открытой печати этот вопрос под- подробно не освещается. Однако принято считать, что на низких час- частотах максимум интенсивности ориентирован по горизонтали, так как основными источниками шума ib этом диапазоне являются :корабли, находящиеся на большом удалении. На более высоких частотах максимум интенсивности шума направлен по вертикали, поскольку сам шум является .результатом воздействия погодных факторов на водную поверхность [24—26]. Если прием произво- производится /вблизи судов, то зачастую по акустическим шумам судов удается определить как направления на отдельные суда, так и спектры их шумов. Описание пространственной структуры внеш- внешнего шума возможно в спектральной области; обычно для этой цели используется волновая векторная (функция от волнового числа. Свойства этой функции аналогичны свойствам спектров временных функций. Оценки временной и пространственной структур поля внешнего шума через его энергетический спектр ,и(или) функцию волнового числа имеют особенно важное значе- значение для пассивных гидролокационных систем. Ниже этот вопрос будет рассмотрен значительно подробнее. Реверберационный шум образуется за счет того, что анергия, излучаемая активной системой, отражается от посторонних объек- объектов, отличных от представляющих интерес целей. С точки зрения происхождения реверберационный шум часто подразделяют на граничный и объемный. Объемная реверберация создается за счет рассеяния на частицах или пузырьках, содержащихся в воде. Су- Существует несколько источников объемного рассеяния в воде. Чаще всего приходится иметь дело с глубинным рассеивающим слоем, пузырьками воздуха и взвешенными частицами. Глубинное рас- рассеяние имеет биологическое происхождение. В течение дня глу- глубинный рассеивающий слой перемещается на 200—1000 км; в диа- диапазоне частот 1,5—25 кГц он имеет несколько селективных резо- иансов. Пузырьки воздуха образуются ib ,воде за счет работы двигателей судов и турбулентности поверхностного слоя воды.
Fr_ Обработка сигналов в гидролокации 383 Хотя доля пузырьков воздуха в воде очень незначительна, созда- создаваемое ими рассеяние достаточно велико за счет того, что их плотность сильно отличается от плотности воды. Пузырькам воз- воздуха также свойственны ярко выраженные резонансные эффекты, обусловленные колебаниями пузырьков. Кроме того, в воде содер- содержится большое количество различных взвешенных частиц, начи- начиная с больших, таких, как рыбы, и заканчивая малыми — типа планктона, причем все они могут рассеивать энергию. Главный вывод заключается в том, что объемная реверберация существу- существует всегда и может сильно ограничить возможности гидролокаци- гидролокационных систем. Причиной граничной реверберации является наличие отраже- отражений от водной поверхности и дна океана. На больших расстояни- расстояниях по горизонтали от источников звука граничная реверберация вообще начинает играть преобладающую роль, так как акустиче- акустическая волна распространяется посредством многократных отраже- отражений от границ водной среды. Характеристики этих границ оказы- вают существенное влияние на характер распространения акусти- ческих сигналов, поэтому ниже они будут рассмотрены отдельно. : Хотя для понимания природы реверберации важно знать ее 'истинные механизмы, с точки зрения обработки сигналов нас бу- будет прежде всего интересовать, как акустическая энергия, рассе- рассеянная при реверберации, связана с дальностью, доплеровским смещением частоты и направлением в пространстве. В качестве модели реверберационного рассеяния удобнее всего использовать линейный фильтр со случайными коэффициентами, зависящими от времени и, возможно, от направления в пространстве. Для ста- статистического описания таких фильтров, моделирующих ревербе- рационное рассеяние, часто применяются функции рассеяния. С помощью этих функций или подобных им и применяя статисти- статистический подход, делается попытка количественно описать рассея- рассеяние акустической энергии в среде в зависимости от дальности и доплеровского смещения частоты. Эти функции играют важную роль при выборе эффективных сигналов активных гидролокацион- гидролокационных систем, поэтому они будут рассмотрены ниже в разделе, по- посвященном активным системам. 6.2.3. Взаимодействие гидроакустических сигналов с границами При простейшем описании влияния поверхности океана и его дна на акустические волны считается, что обе эти границы удер- удерживают энергию акустических волн в пределах некоторого водя- водяного столба. Поверхность океана, например, часто рассматрива- рассматривается как граница свободного пространства с коэффициентом от- отражения, равным —1, а дно—-как граница раздела с частично' твердым грунтом, для которой коэффициент отражения составля- составляет, как правило, 0,01—0,3 (т. е. от —40 до —10 дБ). Хотя во
^84 Глава 6 многих случаях такое описание границ является вполне достаточ- достаточным, на самом деле происходящие на границах процессы носят намного более сложный характер, поэтому необходимо их рас- рассмотреть более подробно. Дно можно описать, указав, как оно отражает акустическую энергию (основной характеристикой является отражательная спо- способность) и как рассеивает (или «размывает») энергию во вре- времени. И отражательная способность, и временное рассеяние энер- энергии являются частотно-зависимыми характеристиками. Для изу- изучения отражательной способности дна было проведено множество экспериментов, которые позволили установить следующее [27— 30]. Наибольшие отражения наблюдаются от скалистого дна, по- покрытого сильно уплотненным мелким песком, а наименьшие — от илистого или грязевого дна. Важную роль играет также и топо- топографический рельеф дна; если характерные размеры рельефа превышают одну восьмую длины звуковой волны, то может иметь место интерференция отраженных волн, которая приводит к уси- усилению или ослаблению отражения от дна. Особенно сильным бу- будет влияние топографического рельефа на высоких частотах (т. е. на коротких волнах), где не требуется, чтобы размеры рельефа были большими. К числу важных параметров относится также и угол скольжения звуковой волны, через который записывается обычно аппроксимируемая законом Ламберта индикатриса рас- рассеяния, имеющая в этом случае вид sin2 0, где 0 — угол скольже- скольжения. При малых углах скольжения эта зависимость сглаживает- сглаживается за счет влияния рефракции. Степень временного рассеяния (размытия) акустической энер- энергии от дна сильно зависит от частоты сигнала. На высокой часто- частоте (например, при частоте глубиномера 12 кГц) обычно наблю- наблюдается размытие, не превышающее 10 мс (оно соответствует рас- распространению по двум трассам и эквивалентно расстоянию 8 м). На частоте 3,5 кГц, чаще всего используемой в гидролокации, вре- время проникновения волны составляет 50—150 мс, т. е. глубина про- проникновения приблизительно равна 100 м. Для изучения ближай- ближайшего к воде донного слоя можно воспользоваться эхолотом, ра- работающим на частоте 3,5 кГц. Так как сейсмические сигналы име- имеют спектральные компоненты на частотах ниже 100 Гц, то они могут проникать глубоко под дно океана. Современные сейсмиче- сейсмические системы обеспечивают обнаружение отражений от сейсмиче- сейсмических границ в недрах Земли на глубинах 10—20 км и рефракций на глубинах 30—50 км (подробнее об этом см. гл. 7). Важной •особенностью работы гидролокационных систем, когда часть аку- акустической энергии распространяется под дном океана, является то, что высокочастотные компоненты акустического сигнала силь- сильно затухают в земных породах. Часто это затухание описывается произведением af, причем а может принимать значения в диапа-
__ Обработка сигналов в гидролокации 385 зоне 0,5—10 дБ/км-Гц [30]. В результате, (Несмотря на то что воз- возможно проникновение акустических колебаний на очень большую глубину под дном океана, основная доля энергии отраженных волн, используемая в гидролокаторах, соответствует неглубокому проникновению акустической волны. На рис. 6.10 для иллюстрации сопоставлены отражения от морского дна, наблюдавшиеся в од- одном и том же месте на разных частотах. При отражении акустической волны от водной поверхности также возникают эффекты, имеющие важное значение в гидроло- гидролокационных системах. Отражательная способность границы вода — воздух велика просто из-за большой разницы акустических импе- дансов обеих сред. Кроме того, за счет неровностей водной по- поверхности может наблюдаться временное размытие сигнала, а из-за движения волны его спектр будет иметь доплеровское размытие. При малых углах скольжения могут сказываться и реф- рефракционные эффекты. Вообще характер рассеяния акустической волны водной поверхностью определяется главным образом сле- следующими тремя параметрами: скоростью ветра, углом скольже- скольжения и частотой сигнала. Основное влияние на частотную зависи- зависимость отраженной волны оказывает степень шероховатости по- поверхности, на которую падает акустическая волна. Если средняя высота волн водной поверхности, отнесенная к длине акустиче- акустической волны, меньше чем sin(8)/8, то можно считать, что поверх- поверхность гладкая и является зеркально отражающей. Для более коротких длин волн и меньших углов скольжения можно воспользоваться многочисленными публикациями, посвященными теории рассеяния волн шероховатыми поверхностями {31—33]. Если гидролокационная система имеет широкую диаграмму на- направленности и работает на высоких частотах, необходимо учи- учитывать также временное размытие сигнала, обусловленное раз- различными задержками за счет многолучевого распространения че- через водную среду с неровной поверхностью. Общее влияние эффектов, возникающих на границах водной среды, на обработку сигналов может быть очень значительным. В активных системах они часто обусловливают наибольшее раз- размытие (или рассеяние) энергии акустических волн. Для пассив- пассивных систем все эти эффекты, как правило, не так важны, хотя в некоторых случаях влияние границ на затухание акустических волн вдоль трассы распространения от источника к приемнику мо- может оказаться очень существенным. 6.2.4. Флуктуации и когерентность акустических сигналов Так как за последние несколько лет существенно повысились универсальность и эффективность оборудования и программ, при- применяемых для обработки гидролокационных сигналов, возникла необходимость оценить влияние водной среды на предельные па-
386 Глава 6 pa метры гпдролокационных систем. Так, например, не следует рассчитывать на использование узкополосных фильтров со сколь угодно узкой полосой пропускания или на интегрирование с боль- большой постоянной времени. Точно так же нельзя строить очень большие антенные решетки и при этом надеяться на получение чрезвычайно высокого углового разрешения. В тамом деле, на трассах распространения всегда имеет место некоторое перемеще- перемещение воды, которое приведет к размытию спектра сигнала по час- частоте, и, кроме того, в условиях многолучевого распространения всегда появятся такие дополнительные трассы, которые ослабят корреляцию волнового фронта вдоль раскрыва антенной решетки. Основным источником временных флуктуации являются; как предполагается, внутренние волны, вызывающие изменение ско- скорости распространения акустической волны. Частотный диапазон внутренних волн простирается от инерцнальных и приливных частот, равных одному периоду в день, до частоты Вяйсяля, обыч- обычно имеющей величину порядка нескольких периодов в час. Изло- Изложение физических основ возникновения внутренних волн в океане можно найти в ряде работ; однако в целом влияние внутренних волн сводится к возбуждению флуктуации тональных сигналов VE--1,.
Обработка сигналов в гидролокации 387 2200 33*394 ¦ ! ZSQ0 б < 12 Рис. 6.10. Примеры отражений от морского дна в одном и том же месте на нескольких частотах. , а — сейсмические сигналы, частоты 0—100 Гц; 6 — измерение эхолотом на частоте 3.5 кГц; в—измерение фазометром на частоте 12 кГц (KNORR, маршрут № 31, линия № 3 Океано- Океанографического института в Вудс-Холле, фотографии предоставлены Дж. Остином). 25*
388 Глава 6 при распространении их в океане на большие расстояния [34— 36]. Так как тональные сигналы представляют особый интерес для пассивных гидролокационных систем, то в последнее время изучению внутренних волн уделялось особое внимание. Создавае- Создаваемые ими флуктуации обычно имеют частоту порядка десятков миллигерц, так что длительность импульсных характеристик мо- моделирующих фильтров составляет сотни секунд. На более высо- высоких частотах приходится учитывать влияние турбулентности и движения водной поверхности на размытие спектра сигнала. По-прежнему предметом активных исследований остается про- пространственная когерентность акустических сигналов. Обычно зна- значения расстояния когерентности (для случая плоской акустиче- акустической волны) составляют 10—100 длин волн для разнесения в горизонтальном направлении и менее 10 длин волн для разне- разнесения в вертикальном направлении {37]. С учетом слоистости океана наличие этой анизотропии представляется вполне нормаль- нормальным явлением. Степень пространственной когерентности оказыва- оказывает существенное влияние на характеристики системы обработки сигналов антенной решетки гидролокатора. Уменьшение корре- корреляции плоской акустической волны вдоль раскрыва антенной ре- решетки приводит к ограничению предельно достижимого разреше- разрешения независимо от размера решетки; помимо этого, приходится использовать новые, нетрадиционные алгоритмы обработки сиг- сигналов, отличные от прямых алгоритмов синтеза диаграммы на- направленности. _ _ 6.2.5. Платформа и водная среда Независимо от того, где находится судно, на поверхности или в погруженном состоянии, водная среда всегда оказывает суще- существенное влияние на все его механизмы и устройства. Поэтому требуется тщательное проектирование даже сравнительно простых передающих и приемных гидролокационных систем. Многочис- Многочисленные экспериментальные исследования, в которых использова- использовались очень сложные, а иногда и уникальные методы обработки сигналов, заканчивались неудачей только в результате того, что системы, предназначенные для работы в океане, имели недоста- недостаточную механическую прочность. Этому вопросу посвящено не- несколько соответствующих работ, и ниже он рассматриваться не будет; изложим лишь некоторые соображения, существенные с точки зрения обработки сигналов {38]. Любая система акустического преобразования будет в конце концов всегда подвергаться механическому воздействию со сторо- стороны волн, образующихся на поверхности океана или вблизи нее. Шум, возникающий при обтекании гидрофонов движущейся плат- платформы, может быть очень существенным. В процессе проведения наблюдений точность систем ограничивается акустическими шу-
Обработка сигналов в гидролокации 389 мами, вибрацией и неопределенностью положения антенны. Одна из наиболее тяжело преодолимых трудностей при работе в океа- океане— огромное давление. Внешнее давление возрастает на 1 атм при погружении на каждые 10 м, поэтому оборудование для ра- работы на больших глубинах должно выдерживать давления, пре- превышающие 350 Па. Кроме того, такие высокие давления приво- приводят к ухудшению чувствительности приборов. В заключение от- отметим, что водная среда обусловливает интенсивную коррозию металлов, поэтому должна быть предусмотрена специальная ан- антикоррозийная защита. Таким образом, для водной среды, как ни для какой другой, нельзя создать идеальные преобразующие системы. Кроме того, из-за огромных давлений большие глубины остаются практически недоступными (исключение составляют специальные эксперимен- эксперименты, связанные с погружениями), поэтому приходится использо- использовать очень дорогостоящие системы дистанционного управления гидролокаторов. Непременным условием успешной работы систе- системы обработки сигналов является учет всех перечисленных огра- ограничений, вносимых водной средой. Одним из существенных пре- преимуществ развиваемых в настоящее время цифровых систем яв- является их универсальность, что позволяет приспособить их к осо- особенностям водной среды и компенсировать влияние этой среды с точностью, недоступной для аналоговых систем. 6.3. Цифровая обработка сигналов в активных гидролокационных системах При освоении океана в экономических, научных или военных целях основной метод получения информации о нем основан на применении активных гидролокационных систем, осуществляющих излучение акустической энергии в воду и последующую обработку принимаемых эхо-сигналов. Ниже будут рассмотрены два взаим- взаимно связанных вопроса обработки сигналов активной гидролокаци- гидролокационной системы: во-первых, необходимость обработки принятых сигналов, используя наиболее эффективные алгоритмы, и выделяя необходимую информацию и, во-вторых, выбор таких зондирую- зондирующих сигналов, чтобы представляющие интерес параметры прием- приемной системы можно было оптимизировать. В данном разделе анализируются особенности обработки сиг- сигналов в активных гидролокационных системах. Относящиеся сю- сюда вопросы указаны в табл. 6.1. Горизонтальное направление со- соответствует обычному порядку прохождения данных в гидролока- гидролокационной системе. Сначала выполняется первичная обработка при- принятых колебаний. Как правило, первичная обработка заключает- заключается в реализации согласованной фильтрации того или иного вида или комбинации разных видов фильтрации. Затем выполняется обработка, предназначенная для учета водной среды. На этом эта-
'390 Глава 6 Таблица 6.1 Материал, относящийся к разделу, посвященному цифровой обработке сигналов в активных гидролокационных системах Первичная обработка Учет окружающей среды Обработка последо- последовательности импуль- импульсов Теория и моде- модели Примеры реа- реализации Примеры прп- »*менений Корреляторы, со- согласованные фильт- фильтры, функции неопре- неопределенности Системы временно- временного сжатия, цифровые КИХ-фильтры, осно- основанные на алгорит- алгоритмах БПФ Точечные отража- отражатели, размытие по дальности и допле- ровской частоте за счет водной среды, функция рассеяния и двухчастотная кор- корреляционная функция Линии задержки с отводами, обработка в частотной, области Модели Свер- лннга, алгоритмы сопровождения и калмановские фильтры Интеграторы импульсов, мини- ЦВМ, микропро- микропроцессоры Обнаружение цели и измерение дальности и (или) допле- ¦ровекого смещения, сопровождение и навигация, связь, про^ филирование и картографирование пе исходными отсчетами являются результаты первичной обработ- обработки, а учитываются такие эффекты водной среды, как многолуче- вость и доплеровское размытие. На заключительном этапе про- производится анализ целей. Информация, полученная после обра- обработки последовательности импульсов, анализируется для оценки структуры цели и параметров ее движения. По вертикали в табл. 6.1 выделены три уровня реализации системы. Первый (сверху) соответствует теории и моделям, используемым при выборе структуры системы и ее построении. Далее следует уровень реа- реализации соответствующих теоретических положений; здесь неиз- неизбежно приходится искать некоторое компромиссное решение, так как теоретическое «оптимальное» устройство может быть реали- реализовано на практике только в редких случаях. Для сравнительной оценки подоптимальных систем используется теория, позволяю- позволяющая количественно оценить потери в той или иной структуре. За- Заключительный этап — применения. Он должен объединять как теоретические положения, так и вопросы реализации, относящие- относящиеся к каждому из этапов обработки, чтобы была обеспечена воз- возможность создания системы в целом. В процессе изложения материала будут последовательно рас- рассмотрены все горизонтальные ряды табл. 6.1. Сначала будет дан краткий обзор теории и моделей, используемых при проектирова- проектировании устройств обработки гидролокационных сигналов, а затем
Обработка сигналов в гидролокации 391 описаны наиболее важные и широко распространенные модели. В заключение будут рассмотрены некоторые системы обнаруже- обнаружения, определения дальности и доплеровского смещения, а также системы сопровождения п навигации. aj 6.3.1. Сигналы активных гидролокационных систем. . Корреляторы и согласованные фильтры. • Функции неопределенности ., Выбор той или иной формы сигнала для активной гидролока- гидролокационной системы в значительной мере определяется имеющейся аппаратурой, используемой в передатчике для генерации и в при- приемнике для обработки. Несмотря на то что аппаратура непрерыв- непрерывно совершенствуется, общая структура системы, основанная на корреляционном анализе, по существу остается неизменной. Ос- Основные усилия направлены на создание такой эффективной про- процедуры синтеза сигналов, чтобы ее можно было реализовать на существующей аппаратуре и чтобы она позволяла улучшить кор- корреляционные свойства сигналов. Простейшая гидролокационная система включает лишь пре- преобразователь, возбуждаемый приблизительно на резонансной ча- частоте (передатчик), и узкополосный обнаружитель энергии (при- (приемник). В более сложных системах в передатчиках используются программируемые адаптивные модуляторы с многоэлементными управляемыми антенными решетками, а в приемниках — микро- микропроцессоры и мини-ЦВМ в качестве устройств цифровой обра- обработки. Проектирование приемно-передающих систем и выбор зонди- зондирующих колебаний направлены на решение двух задач: 1) обна- обнаружение целей и 2) дпределение дальностей до целей, пеленгов целей и доплеровского смещения принятых сигналов. Эти задачи имеют много общего в отношении синтеза эффективного сигнала и выполнения обработки в приемнике. На рис. 6.11 представлена система первичной обработки приемного устройства, а также ее главные компоненты, включая соответствующим образом выбран- выбранный зондирующий сигнал, акустический канал, квадратурный кор- коррелятор для демодуляции эхо-сигналов (по причинам, которые будут рассмотрены ниже, его часто называют согласованным фильтром), устройство с квадратичной характеристикой (может быть также пороговое устройство для обнаружителя) и индика- индикаторы дальности, пеленга и доплеровского смещения. В данном разделе будут рассмотрены некоторые из наиболее широко ис- используемых сигналов, особенности выполнения операции корре- коррелирования, а также характеристики системы, описываемые струк- структурой функции неопределенности используемых сигналов. В настоящее время существует всего несколько элементарных видов колебаний, или сигналов, несмотря на то, что теория син- , теза сигналов разработана весьма детально. Процесс совершенст-
392 Глава 6 I Приемник Мовуля- тор лереоот чин ^1 Щ I (перенос спелтра I номпленс I сигнала) f(t): Амплитудная f(t): 'Р од ш Рис. 6.11. Блок-схема первичной обработки гидролокационных сигналов, основан- основанной на квадратурной согласованной фильтрации. вования акустических сигналов имеет много общего с развитием радиолокации, поэтому читателю, интересующемуся этими вопро- вопросами, следует обратиться к гл. 5 {39—41]. В простейшем случае сигнал — это просто отстробированное непрерывное гармониче- гармоническое колебание, описываемое следующим образом: St (f)= cosBп/с0 при 0 < t < Т, при других tt F.1) где Et — излучаемая энергия, Т — длительность импульса, fc — центральная частота. Длительность сигнала может составлять от долей миллисекунды до 1—2 с, а центральная частота — от не- нескольких сотен герц до десятков килогерц в зависимости от на- назначения системы. Несколько примеров гидролокационных сигна- сигналов представлено на рис. 6.12. Импульс может генерироваться посредством либо простого стробирования, либо ударного воз- возбуждения преобразователя, хотя реальный сигнал, распространя- распространяющийся в воде, оказывается при этом несколько иным за счет ограниченной ширины полосы преобразователя. Поэтому правиль- правильнее в качестве модели излучаемого сигнала использовать колеба- колебание вида I n P-a(t)cosBnfct), t<0, F.2) где a(t) — коэффициент модуляции, обусловленный конечной по- полосой передатчика. Ниже будет показано, что использование эле-
Обработка сигналов в гидролокации 393 %=3,5кГц, Т=Юмс, М/ЧООЩ Т= Ю мс, &Т=1,4мс, W** 700Гц О" 180" I 0° 0' 4,2 5,6 8,5 Ю t,MC fc=3,u, T=K>md,WT=10, 3 <f ^4кГц Рис 6 12 Примеры типичных гидролокационных сигналов с центральной частотой fc=3,5 кГц. а — прямоугольный монохроматический импульс; б — кодированный импульс; е — ЛЧМ-им- пульс; г — кодированные импульсы со ступенчато изменяющимися частотами. ментарного отстробированного гармонического колебания накла- накладывает ряд ограничений, хотя технически его генерация наиболее проста. Следующий класс образуют сигналы в виде последовательно- последовательности отстробироваиных гармонических импульсов, полярность ко- которых (а в общем случае их фаза) модулируется в соответствии с тем или иным алгоритмом синтеза сигналов. Чаще всего для модуляции используется псевдослучайная или псевдослучайная шумовая последовательности. Их преимущества станут ясными при анализе функций неопределенности. Один из примеров ис- использования псевдослучайной последовательности импульсов при- приведен на рис. 6.12,6. К классу сигналов, обеспечивающих разрешение гидролокато- гидролокатора по дальности, а также достаточно просто генерируемых, отно- относятся сигналы, модулированные по частоте (ЛЧМ-сигналы). В об- общем виде эти сигналы описываются формулой St (() = a (i) cos \2nfJ-t-q> (/)], F.3)
394 : Глава б t" где ф(^)=2лц-2". i-i — скорость изменения частоты, а ф@—ис- ф@—используемая фазовая модуляция. Так как по определению мгновен- мгновенная частота равна производной от фазы, то легко увидеть, что при данном виде модуляции частота сигнала на интервале излу- излучения изменяется по линейному закону [см. рис. 6.12, в]. Кроме ЛЧМ могут быть использованы и другие виды фазовой модуля- модуляции, например по закону гиперболического косинуса или со сту- ступенчатым изменением частоты с помощью программируемого син- синтезатора частоты. Во всех случаях наиболее важными парамет- параметрами сигналов являются ширина полосы и скорость изменения частоты. В некоторых наиболее совершенных системах акустической связи могут применяться частотно-кодированные сигналы, осно- основанные на использовании в частотной области двоичных псевдо- псевдослучайных последовательностей. Для сигналов этого класса со- сообщение, а также соответствующая ему избыточность, если только она используется, кодируются в виде набора гармонических со- составляющих с различными частотами, которые излучаются одно- одновременно. Вид колебаний этого класса во временной области мо- может показаться слишком сложным, но в частотной области им соответствует набор взвешенных гармонических компонент, име- -•гощих конечную длительность и разнесенные частоты. Эти коле- колебания описываются следующим образом: N st(t)=a(t) ^ ancos[2n(k + nAf)/|. F.4) Один из примеров колебания этого класса представлен на рис. 6.12, г. При описании активных гидролокационных систем целесооб- целесообразно различать широкополосные и узкополосные системы. В ши- широкополосных системах приходится использовать прямое пред- представление сигналов в основной полосе, тогда как в узкополосных системах более удобным оказывается квадратурное (т. е. комп- комплексное) представление. Различие между широкополосными и уз- узкополосными системами является, вообще говоря, довольно про- произвольным. Удобнее всего пользоваться следующим критерием уз- кополосности: ширина полосы системы не должна превышать 10% несущей (т. е. центральной) частоты. Комплексное (или квадра- квадратурное) представление узкополосных сигналов очень удобно для описания доплеровского и фазового смещений, обусловленных эффектами распространения и отражения. Поскольку большинст- большинство активных систем узкополосные, то ниже будет использоваться именно комплексное представление. При комплексном представлении вводятся две квадратурные компоненты относительно центральной частоты сигнала. Они мо-
Обработка сигналов в гидролокации 395 гут быть получены посредством демодуляции узкополосного сиг- сигнала по отношению к опорным косинусоидальному и синусоидаль- синусоидальному колебаниям центральной частоты (рис. 6.13). Легко убедить- диться в том, что исходный узкополосный сигнал может быть вос- восстановлен следующим образом: f(t) =fc (t) cos Bn/c/) + /s @ sin Bnfct). F.5) Для описания как обеих квадратурных компонент, так и узкопо- узкополосного сигнала удобно пользоваться так называемой комплекс- комплексной огибающей, определяемой так, что ], F.6a) 0- F-66) Ясно, что модуль комплексной огибающей совпадает с истинной огибающей самого сигнала, а ее фаза равна фазовому сдвигу уз- узкополосного сигнала относительно косинусоидального опорного колебания центральной частоты. Отсюда следует, что комплекс- комплексную огибающую сигнала часто можно найти непосредственно из его аналитического выражения. Так, для ЛЧМ-сигнала F.3) stif)^=\/W^[st{t)emict], F.7) где Использование комплексного представления упрощает запись многих алгоритмов первичной обработки сигналов активных гид- ролокациопных систем. Наиболее важным из них является, по-ви- по-видимому, алгоритм коррелирования двух узкополосных сигналов. Легко показать, что если условие узкополосности выполняется, то §x(t)y(t) dt= -~ Re [fx* (t) y(t) dt]. F.8) Следует также отметить особенности аппаратурной реализации при использовании комплексного представления. Комплексная огибающая •— это низкочастотное колебание, поэтому частота дис- дискретизации при реализации обработки в цифровой форме может быть взята намного меньшей, чем при непосредственной дискрети- дискретизации принятого сигнала. Именно поэтому при построении неко- некоторых активных гидролокационных систем используются изобра- изображенная на рис. 6.13 схема квадратурной демодуляции, а также комплексное представление для записи алгоритмов обработки. Форма сигнала, который принимается приемным устройством после излучения зондирующего сигнала, также в сильной степени определяется условиями распространения и отражения акустиче-
396 Глава 6 Ума полосный сигнал •Л cosi2iffct) Фазовый \fIslnBTTfct) -W W <РНЧ -w w () c()js Комплексный квадратурный ' сигнал в основной полосе \Щ argf.it) 5 t,MC 10 180 artjftt) О -180 д то m о -180 Ю , / \ы б t,MC 180 .argf(t) -180 лммп 10 6 Рис. 6.13. а — квадратурный демодулятор; б — комплексные огибающие (амплитуда и фаза)' акусти- акустических сигналов, изображенных на рис. 6.12. : 1
Обработка сигналов а гидролокации 397 ских волн. Для учета этих условий вводятся модели канала разной сложности, причем даже для простейшей из них, соответст- соответствующей точечной, медленно флуктуирующей цели, необходимо об- обращаться к основной, а именно к корреляционной структуре при- приемника. В рамках этой модели предполагается, что принимается задержанная и смещенная по Доплеру копия зондирующего сиг- сигнала в присутствии белого (т. е. широкополосного) шума. Кроме того вводятся случайные ослабления и фазовый сдвиг, причем ста- статистическое распределение ослабления является рэлеевским, а распределение фазы —¦ равномерным. Итак, принятый сигнал записывается следующим образом'); e [aef% (t~T)ei2*f<i'е''2я^} +w(t). F.9) Причинами задержки и доплеровского смещения сигнала являют- являются конечная скорость акустической волны и перемещение цели. Коэффициент ослабления акустической волны определяется не- несколькими эффектами, такими, как потери при распространении акустической волны и эффективное поперечное сечение рассеяния (ЭПР) цели. Случайная фаза учитывает неопределенность знания расстояния до цели в пределах длины волны. Эта модель из всех применимых является, по-видимому, наиболее простой. Чтобы пе- !рейти от нее к более сложным моделям, необходимо ввести поня- понятия функций рассеяния, а также случайных каналов и целей. Изменение сигнала в пространстве и соответствующая обра- обработка сигналов антенной решетки для активной системы гидроло- гидролокации в значительной мере такие же, как и для пассивной систе- системы, поэтому здесь отметим лишь, что пространственная обработка заключается в формировании диаграммы направленности антен- антенны; более подробно она будет описана в разд. 6.4, посвященном особенностям обработки сигналов антенной решетки. Операция, выполняемая в корреляционном приемнике, в зна- значительной мере является интуитивной, однако ее можно теорети- теоретически обосновать несколькими способами. Важно, однако, разли- различать два неодинаковых критерия построения приемника: для об- обнаружения цели и для определения дальности до нее и доплеров- доплеровского смещения. При решении задачи обнаружения с помощью корреляционного приемника получается достаточный статистиче- статистический материалу используемый затем для порогового анализа и принятия решения при условии, что цель размещается по даль- дальности и доплеровскому смещению в пределах некоторой опреде- определенной области. Для описания работы приемника обычно исполь- используют его рабочую характеристику, представляющую собой зависи- ¦> Диапазон задержек можно найти, если учесть, что скорость звука равна 1490—1500 м/с; доплеровское смещение для случая распространения до цели и обратно составляет 0,68—0,69 Гц/(узел-кГц) (скорость изменения дальности вы- 'ражена в узлах, несущая частота — в килогерцах).
398 Глава 6 мость вероятности обнаружения от вероятности ложной тревоги. При оценке с помощью корреляционного приемника находится статистика, являющаяся функцией возможных значений дально- дальности и доплеровского смещения цели. Затем статистика максими- максимизируется по этим значениям, что и дает оценки определяемых ве- величин. Для описания работы измерителя берется, как правило, дисперсия полученных оценок. При анализе работы измерителя обычно пользуются следующими двумя параметрами: дисперсией оценки при больших отношениях сигнал/шум и вероятностью то- того, что оценка является неоднозначной или глобально аномаль- аномальной. Первый из них описывается линейными методами (с исполь- использованием границ Рао — Крамера) и учитывает поведение функ- функции неопределенности сигнала вблизи начала координат, а второй - определяется структурой боковых лепестков функции неоп- неопределенности. Более подробно эти вопросы будут рассмотрены ниже после анализа функции неопределенности. Теория обнаруже- обнаружения и оцеики параметров детально описано в [7, 10]. Основная форма записи операции корреляции в том виде, как она используется в большинстве работ по обработке сигналов, имеет следующий вид: оо оо l = jr(t)s (t) dt = j" R* (/) S (/) df, F.10) — oo —CO причем для того, чтобы связать соотношения во временной и час- частотной областях, была использована теорема Парсеваля. По- Поскольку в большинстве случаев применяемые акустические сиг- сигналы имеют случайную фазу, необходимо вычислять корреляцию для обеих квадратурных компонент сигнала. Чтобы показать, что наличие случайной фазы вынуждает выполнять операцию корре- корреляции в комплексной форме, проще всего воспользоваться для представления квадратурных компонент комплексной огибающей. Различные методы, основанные на разных критериях работы при- приемника, приводят к одному и тому же результату, заключающе- заключающемуся в том, что в процессе первичной обработки в приемном уст- устройстве должна быть выполнена следующая операция: F-11) / = | jr* @ s(t, a) dt [ = | j R* (/) S(f, a) df где r(t) —комплексная огибающая принимаемого сигнала, s(t,a) — копия излученного сигнала, в которой с помощью параметра а учитывается любое искажение сигнала, обусловленное эффектами распространения и отражения, и, в частности, задержка распро- распространения и доплеровское смещение. В системе обнаружения под- подбором параметра а устанавливаются ожидаемые значения даль- дальности и доплеровского смещения. Если же они неизвестны или,
Обработка сигналов в гидролокации 399 в более общем случае, если нужно найти оценки этих параметров, то результат корреляции F.11) рассматривается в функции пара- параметра а, учитывающего неизвестные дальность и доплеровское смещение (помимо них в а могут быть включены и другие пара- параметры). Рассмотрим, каким образом выполняются операции F.11) в процессе первичной обработки в приемнике, изображенном на рис. 6.11. Скачала сигнал поступает в квадратурный демодулятор, где формируются обе его компоненты (и, кроме того, подавляют- подавляются шумы вне полосы сигнала). Следующая операция — вычисле- вычисление обычной функции корреляции в комплексной форме для каж- каждой из квадратурных компонент. В заключение находится корень из суммы квадратов. Рассмотрим еще несколько вопросов, имеющих отношение к аппаратурной реализации приемников гидролокаторов. Прежде всего анализ сигналов возможен либо непосредственно на их не- несущей частоте либо на какой-либо другой частоте, получаемой в процессе гетероднрования сигналов. Он основан на использова- использовании полосового коррелятора, за которым следует детектор оги- огибающей с квадратичной характеристикой. По-видимому, такая схема наиболее удобна для аналоговой реализации, тогда как при цифровой обработке она невыгодна из-за высокой частоты дис- дискретизации, которую в этом случае приходится использовать. Понятие согласованной фильтрации тесно связано с понятием корреляционного приема. По существу согласованный фильтр — это удобное аппаратурное средство для выполнения операции корреляции в рамках линейной системы с постоянными парамет- параметрами. В качестве импульсной характеристики такой системы ис- используется проинвертированныи по времени зондирующий сигнал, ¦с которым должен коррелироваться принимаемый сигнал. Исполь- Использование согласованной фильтрации становится особенно полез- полезным, когда находится оценка дальности. Из алгоритма работы приемного устройства F.11) следует, что коэффициент корреля- корреляции должен вычисляться в функции задержки для всех интере- интересующих нас дальностей. Легко показать, что на выходе согласо- согласованного фильтра в интервале, равном интересующему нас диапа- диапазону задержек, и получается именно эта функция, имеющая вид I (f) = j ? (t) s] (/- t)dt=j ?¦ (t) h(f -0 dt, F.12) причем A(/)=s,(-0. Этот же подход можно применить и в частотной области, реали- реализовав в ней согласованный фильтр и просматривая с его по- помощью весь интересующий нас доплеровский интервал частот. Относительно' характеристик согласованных фильтров необходимо
400 Глава 6 сделать несколько важных замечаний. Прежде всего при решении задачи обнаружения точечной цели с известными дальностью и доплеровским смещением в присутствии белого фонового шума отношение сигнал/шум определяется только средним значением отношения принятой энергии к спектральной плотности мощности шума, которое не зависит от формы сигнала. Форма сигнала ста- становится существенной лишь при наличии реверберации, которая будет рассмотрена ниже, и при нахождении оценок дальности и доплеровского смещения цели. В обоих случаях влияние формы зондирующего сигнала описывается его функцией неопределенно- неопределенности, вид которой в свою очередь сильно зависит от того, какой может быть взята база сигнала (т. е. произведение длительности сигнала на ширину его полосы). Функция неопределенности равна (с точностью до постоянного коэффициента) отклику приемного устройства, изображенного на рис. 6.11 при условии, что эталонное колебание, с которым выпол- выполняется корреляция, сдвигается по дальности и по доплеровскому смещению, причем входной шум отсутствует. Таким образом, Е И (Т, fd)] |2ТОлько сигнала -2Et<ffi {Т, 7\, fd, fd{), F.1 За) где Tt, fat -- фактические значения задержки и доплеровского смещения цели, f, fd— перебираемые оценки задержки и допле- доплеровского смещения, а е (t, Tt, fd,fd) ~ | J4 (' -Tt) St (t -t) е/2л( F.136) представляет собой функцию неопределенности. Функция неопре- неопределенности по определению нормируется таким образом, что при равенстве перебираемых и фактических значений дальности и доп- доплеровского смещения она равна единице. В случае такого норми- нормирования удобнее всего пользоваться энергией зондирующего сиг- сигнала, выделяя ее в отдельный коэффициент при описании сиг- сигнала. Общий вид функций неопределенности для некоторых из рас- рассмотренных выше сигналов показан на рис. 6.14. Они изображены в зависимости от перебираемых параметров Т и fd и показывают, какими будут значения сигнала на выходе согласованного фильт- фильтра при оценивании дальности и доплеровского смещения цели. Рассмотрим основные свойства функций неопределенности. Во- первых, у простого отстробированного импульса вдоль оси даль- дальности она простирается на интервале, определяемом длитель- длительностью сигнала Т, а вдоль доплеровской оси ее протяженность определяется величиной, обратной длительности. Ясно, что, рас- располагая только одной степенью свободы, нельзя добиться одинз-
Обработка сигналов в гидролокации 401. Рис. 6.14. Функции неопределенности некоторых акустических сигналов. а — прямоугольный импульс; б — кодированный импульс; в—ЛЧМ-импульа. ково хорошего разрешения и по дальности, и по доплеровска- му смещению. Для этой цели можно воспользоваться кодирова- кодированием импульса, подобрав соответствующим образом псевдослу- псевдослучайную последовательность с тем, чтобы на достаточно большом временном интервале она имела вид широкополосного шума. Если такая последовательность подобрана, то за счет широкой полосы будет обеспечена малая протяженность функции неопределенно- неопределенности вдоль оси дальности, а за счет большой продолжительности сигнала с постоянной амплитудой — малая протяженность вдоль доплеровской оси. Известен ряд алгоритмов синтеза, или кодиро- кодирования, таких сигналов {42, 43]. Одним из важных вопросов синтеза сигналов является конт- контроль за появлением боковых лепестков, функции неопределенно- неопределенности, образующих ложные отклики. Так, на рис. 6.14,6 показан об,-
402 Глава 6 щий вид функции неопределенности псевдослучайной последова- последовательности. Отметим, что разрешение по дальности определяется величиной, обратной ширине полосы сигнала, а по доплеровскому смещению — величиной, обратной его длительности, тогда как средний уровень боковых лепестков при условии, что последова- последовательность подобрана удачно, определяется величиной, обратной «базе сигнала. Функция неопределенности частотно-модулирован- частотно-модулированного сигнала при использовании линейного закона изменения час- частоты представляет собой укороченную функцию неопределенности немодулированного сигнала. На рис. 6.14, в изображена функ- функция неопределенности прямоугольного ЛМЧ-импульса. Важно отметить, что она имеет на плоскости дальность — доплеров- ское смещение наклонную полосу неопределенности, причем угол наклона определяется скоростью изменения частоты. Пре- Преимуществом ЛЧМ-импульсов, как и импульсов, кодированных псевдослучайной последовательностью, является то, что они ос- основаны на модуляции фазы, поэтому при заданной пиковой мощности появляется возможность увеличить энергию излучаемо- излучаемого сигнала. Эта возможность важна для большинства активных гидролокацнонньгх систем, так как пиковые мощности отдельных гидрофонов преобразователей часто не совпадают. При введении ¦частотной модуляции растянутая вдоль дальностной оси область неопределенности исчезает, но возникает наклонная полоса неоп- неопределенности, отмеченная выше. В результате разрешение по дальности улучшается только в том случае, если доплеровское смещение цели заранее известно. К счастью, именно так чаще всего и обстоит дело. Отметим, что протяженность функции не- неопределенности ЛЧМ-импульса вдоль дальностной оси равна ве- величине, обратной ширине полосы сигнала. Рассмотренные выше функции неопределенности относятся к сигналам, наиболее часто используемым в активных гидролока- цпонных системах. Была проведена большая работа по оптими- оптимизации сигналов, однако основными всегда остаются следующие положения: разрешение по дальности определяется главным об- образом величиной, обратной полосе сигнала, а по доплеровскому смещению — величиной, обратной его длительности; кроме того, необходимо контролировать уровень боковых лепестков, посколь- поскольку общий объем под поверхностью функции неопределенности фиксирован >[39]. Покажем, каким образом можно аналитически описать все эти характеристики, используя функцию неопреде- неопределенности. При рассмотрении разрешающей способности гидроакустиче- гидроакустических систем по дальности и доплеровскому смещению необходимо различать случаи больших и малых значений отношения сигнал/ /шум. При больших отношениях разрешающая способность си- систем определяется поведением функции неопределенности вблизи
I Обработка сигналов в гидролокации 403 начала координат (т. е. там, где истинные параметры цели равны оценочным значениям). Для количественного описания ее пове- поведения можно использовать понятия средних квадратических зна- значений длительности и ширины полосы зондирующего сигнала. Вос- Воспользовавшись границами Рао — Крамера из теории оценок, мож- можно показать, что дисперсии оценок задержки и доплеровского смещения описываются формулами [41] где u\= Var [Т-Т,] 2o\Et 2olEt F.14a) F.1.46) dt* dfdfd _ dfddf dj2d _ dt dt причем символ |0. обозначает, что функция неопределенности на- находится для истинйых значений параметров цели Tt, fdt- Когда недиагональные элементы матрицы равны нулю; получаются за- зависимости, отмеченные выше, а именно, протяженность функции неопределенности вдоль дальностной оси действительно опреде- определяется величиной, обратной ширине полосы сигнала (подтверж- (подтверждается и вывод относительно протяженности вдоль доплеровской оси). Если же недиагональные члены не равны нулю, как это име- имеет место для частотно-модулированного импульса, обе оценки становятся взаимно связанными. При малых отношениях сигнал/шум важную роль начинают играть боковые лепестки функции неопределенности. Если уро- уровень шума высок, то в процессе корреляционного анализа при пе- переборе параметров цели на плоскости дальность — доплеровское смещение могут возникнуть ложные пики. При наличии большого бокового лепестка за счет шума может сформироваться пик, пре- превышающий основной отклик в начале координат. Таким образом, наличие больших боковых лепестков в функции неопределенности может привести к грубым ошибкам при нахождении оценок даль- дальности и доплеровского смещения, если отношение сигнал/шум не- невелико. В таком случае особо важное значение приобретает на- наличие априорной информации о возможных значениях дальности и доплеровского смещения, так как это позволяет автоматически отбросить ложные отклики от боковых лепестков, если они нахо- находятся в области заведомо недопустимых значений дальности и доплеровского смещения.
404 ' Глава 6 4,3.2. Обработка, учитывающая особенности водной среды. Каналы с размытием и протяженные цели. ; Функции рассеяния Распространение акустических сигналов в воде сопровожда- сопровождается высоким уровнем реверберации, ярко выраженной многолу- чевостью и доплеровским размытием. Физические основы этих явлений уже были рассмотрены выше. Однако для целей обра- обработки важно уметь их моделировать. В данном случае нас интересует возможность моделирования явлений двух типов (явления третьего типа, имеющие отношение к обработке сигналов антенной решетки, будут рассмотрены в разд. 6.4). Явления первого типа связаны с многолучевостью и наличием ложных целей, распределенных по дальности; они ¦называются размытием по дальности. В результате после излуче- излучения короткого импульса на приемник поступает сигнал в течение некоторого времени. Причиной может быть то, что звук в воде от дели или отражателей вблизи нее распространяется по разным трассам. Явления второго типа связаны с размытием по дально- дальности и обусловлены отражением звука от движущихся целей или распространением его через движущуюся среду. Эти явления на- называются доплеровским размытием, так как после излучения тармонического сигнала принятая энергия оказывается распреде- распределенной в некотором диапазоне частот. Основной способ описания акустических каналов с размытием заключается в моделировании их с помощью фильтра, параметры которого изменяются во времени случайным образом. Элемент случайности вводится потому, что редко имеются достаточно под- подробные сведения об акустических свойствах окружающей среды и относительной геометрии передатчика, канала, цели и приемни- приемника, чтобы можно было использовать детерминированное описа- описание. В результате при моделировании каналов или целей- прихо- приходится вводить элемент случайности и пытаться описать средние характеристики размытия. Для этого обычно используется: функ- функция рассеяния или, например, двухчастотная корреляционная функция {41, 44—47]. Функция рассеяния характеризует стати- статистическое распределение энергии после излучения импульса по дальности и доплеровскому смещению, а двухчастотная корреля- дионная функция — коэффициент корреляции между компонента- компонентами на смежных частотах при условии, что излучается гармониче- гармонический сигнал. : , . Модель канала или цели, в которой учитывается размытие сигнала, описывается выражением . . (t, kjst{t — l)dk, F.15) где st(t)—излучаемыйсигнал, Et — энергия излучаемого сигнала (по-прежнему целесообразно проводить нормирование по энергии
Обработка сигналов в гидролокации 405 сигнала), sr(t) —принятый сигнал, b(t,K) —случайная и изменя- изменяющаяся во времени импульсная характеристика канала. (Отме- (Отменим, что как Т, так и А, соответствуют переменным дальность — задержка.) Предположение о линейности, как правило, оказыва- оказывается справедливым, так как давление акустической волны сигна- сигнала мало по сравнению со статическим давлением со стороны среды. Длительность импульсной характеристики канала опреде- определяется многолучевой структурой океана и тем, в какой мере эта структура используется гидролокационной системой; временные вариации учитывают наличие любых доплеровских эффектов, воз- возникающих в процессе распространения и отражения акустических сигналов. Вследствие неопределенности предсказания задание им- импульсной характеристики b(t, l) является весьма сложной зада- задачей; поэтому эта характеристика рассматривается как случайный процесс и описывается первым и вторым моментами. (Отметим, что поскольку характеристика представляется гауссовским слу- случайным процессом, то описание ее с помощью моментов является полным.) Первый момент, т. е. с'реДнее, как правило, равен нулю вследствие фазовой неопределенности. Второй момент, называе- называемый функцией ковариации, содержит важную информацию, отно- относящуюся к статистической природе канала; обычно для описания второго момента используется функция рассеяния, Метод описания случайных каналов и среды распространения, основанный на использовании функции рассеяния, применялся многими исследователями в различных областях техники [44— 50, 41, 51—53]. Тем не менее, несмотря на существенные различия описываемых сред, в целом используемые при этом предположе- предположения имеют много общего (наиболее общий подход описан в рабо- работе [47]). К числу наиболее важных относятся предположения о стационарности и некоррелированности рассеяния. Предположе- Предположение о стационарности означает, что рассеяние (или отражение) в дальностном интервале представляет собой стационарный слу- случайный процесс (в частности, он может быть постоянным,- если в канале не создается доплеровского размытия). Предположение о некоррелированности означает, что рассеяние (или отражение) некоррелировано по дальности. Используя оба эти предположе- предположения, запишем следующее выражение для ковариации ревербера- ционного сигнала: F.16) где К~ — ковариация рассеяния как функция задержки распро- распространения X, Кь — ковариация наблюдаемой реверберации или рассеяния. В общем случае удобнее пользоваться энергетическим спектром отраженных сигналов как функцией расстояния (запаз-
406 Глава 6 дывания); в этом случае функция рассеяния записывается: в виде ЗД 4=^Kb (т, X)e~mhex. F.17> Физический смысл этой функции заключается в следуншшм: ома дает статистическое описание перераспределения энергии по даль- Сещядм i ' ' I I I I j ал о,з о,2 a,f 04 0,20,3 а} Рис. 6.15. Функция рассеяния моря, типичная для летних условий и глу^инв- 0,6—1,2 м (из [53]). ности и доплеровскому смещению, Если выполнить преобразова- преобразование Фурье по запаздыванию, то будет получена двухчастотная корреляционная функция Она описывает корреляцию сигналов после рассеяния как функ- функцию частоты. Акустический канал создает в основном размытие по дально- дальности, хотя может быть существенным и размытие по доплеровско- доплеровскому смещению, обусловленное водной поверхностью и движущими- движущимися целями. Существует сильная связь между методом использо- использования капала и типом трасс распространения акустических волн. В последние годы было проведено много экспериментов с целью- измерения функций рассеяния акустических сигналов. Некоторые' результаты, относящиеся к сравнительно небольшим дальностям при однолучевом распространении акустических волн, в качестве иллюстрации представлены на рис. 6.15. При использовании мо- моделей функция рассеяния для проектирования системы обработ- обработки сигналов активного гидролокатора следует учитывать несколь- несколько важных моментов. Необходимо, чтобы и модель рассеяния ме- мешающего реверберационного шума, и модель отражения от цели
Обрао>атка сигналов в гидролокации 407 были описаны достаточно строго. Кроме того, проектирование гiпровокационных систем, предназначенных для обнаружения це- целей, измерения дальностей до них и доплеровского смещения, а также систем связи требует в каждом случае особого подхода. На рис. 6.16 представлены алгоритмы обработки сигналов для перечисленных выше случаев, учитывающие модели среды. Если для обнаружения медленно перемещающейся цели в при- присутствии реверберационного шума используется коррелятор или согласованный фильтр, представляющий собой, как правило, под- оптимальное устройство, то отношение сигнал/шум описывается формулой , Сигнал/шум = —— , F.19) где Sb(f, л)—функция реверберационного рассеяния, JVo— уро- уровень белого фонового шума, Ei— излученная энергия, а?—ЭПР Ш'ли и 8—-функция неопределенности зондирующего сигнала. Из этой формулы можно сделать несколько выводов относительно методики синтеза эффективных сигналов и характеристик гидро- локадионных систем, работающих в водной среде с реверберацией. Прежде всего можно выделить два случая. Если значение инте- интеграла в знаменателе намного меньше единицы, то считают, что в этом случае возможности системы ограничены фоновым (или белым) шумом. С физической точки зрения это означает, что ре- реверберация не оказывает существенного влияния на процесс об- обнаружения, для которого решающую, роль играет принимаемая энергия. Если же этот интеграл значительно превышает единицу, то возможности системы ограничиваются реверберацией. В по- последнем случае увеличение излучаемой энергии приведет просто к росту и сигнала, отраженного от цели, и реверберационного шу- шума, так что не будет достигнуто никакого улучшения отношения сигнал/шум. Для улучшения характеристик системы в этом слу- случае может быть использована только методика синтеза эффектив- эффективных сигналов, что является вторым важным выводом. Характе- Характеристики системы определяются тем, как перекрываются функция неопределенности, смещенная в соответствии с дальностью п доп- леровекгш смещением цели, и функция рассеяния. Методика син- синтеза эффективного сигнала как раз и ориентирована на миними- лацию перекрытия. Для этого сигнал подбирается таким образом, чтобы его функция неопределенности была очень узкой либо вдоль далыюстной осп, что соответствует сгробированию по даль- дальности, либо вдоль доплеровской оси, что обеспечивает стробиро- вание по доплеровскому смещению (рис. 6.17). Легко убедиться Т\ тпи итгл ТТГШ ПЯЙПТР П ГП^ЛЙ С ПРРРПЙРПЯГШР.Й ИГ.ПШТК.ЧПВЯНИР ЧЯ-
408 Глава 6 Квадратурный Земо^лираеанный сигнал Корреляииоитгй лриемних Детектор, огибающей с квадратичной харантермстит Н, г, "° Порогоеь/й анализ Квадратурт/й сигнал r(t) Пороговый анализ Корреляционные приемники для каждой разреи/аемай Суммирование со взешива- трасш 'мем по всем трассам Квадратурный- д сигнал г It) /?рие^ни/г \оля протяженной цели и сигнала У/ Приемни/t J &ля протяженной цели и сигнала y<s .Приемник аш протяженной цели и сигнала //М Оценка Рис. 6.16. Блок-схемы приемников некоторых гидролокационных систем. |2 — для обнаружения точечных целей; б — для обнаружения протяженных целей в присуг* ствии реверберации; в — связной приемник.
Обработка сигналов в гидролокации 409 ' Наклону (спорость изменения частоты) ±Bf ¦Bf/ец 100,0 Рис. 6.17. а — перекрытие функции рассеяния с функциями неопределенности монохроматического и ЛЧМ-импульсов при реверберации, распределенной по дальности: б — ухудшение характеристик для случая, соответствующего а, в зависимости от отношения полос сигна- сигнала и шума реверберации (из [42]). ET/N0 эффективная реверберация, отнесенная к мощности сигнала. стотно-модулированных сигналов имеет определенные преимуще- преимущества. Так, на рис. 6.17, а сопоставлены области перекрытия для монохроматического импульса и ЛЧМ-импульса одинаковой дли- длительности. Для ЛЧМ-импульса уменьшение перекрытия примерно пропорционально базе ЛЧМ-импульса \хТ2. Ухудшение характери- характеристик за счет реверберации в зависимости от отношения полос ЛЧМ-импульса и шума реверберации показано на рис. 6.17,6. За счет большой девиации ЛЧМ-импульса влияние реверберации
410 Глава 6 можно свести к минимуму. Однако частотно-модулированные сиг- сигналы не всегда имеют преимущества. Действительно, если между эхо-сигналом от цели и реверберационным сигналом имеется доп- леровское смещение, целесообразно, чтобы функция неопределен- неопределенности была узкой вдоль доплеровской оси, как это имеет место для сигналов без частотной модуляции. Более подробно задача оптимизации сигнала рассмотрена в >[41]. При обнаружении распределенных целей, а также в системах подводной акустической связи требуется несколько более слож- сложная обработка, чем простой корреляционный прием, используемый применительно к точечным целям. В этих случаях приемник, близкий к оптимальному, включает корреляционные приемники для каждого из разрешаемых элементов дальность — доплеров- ское смещение. Общий выходной сигнал представляет собой сум- сумму выходных сигналов всех корреляционных приемников. Разре- Разрешающую способность и число разрешаемых элементов можно найти, используя функцию рассеяния и двухчастотную корреля- корреляционную функцию зондирующего колебания. Коэффициент кор- корреляции между выходными сигналами двух согласованных фильт- фильтров (т. е. корреляторов), соответствующих координатам (Ль fa) и (Я.2, fd.,) на плоскости дальность — доплеровское смещение, опи- описывается выражением К fdl, f№*(KA fj2, f)dfdl. F.20) Структура приемника, выполнящего обработку, соответствую- соответствующую этому выражению и учитывающую влияние водной среды, представлена на рис. 6.16,6. Здесь проводится элементарное не- некогерентное сложение выходных сигналов фильтров всех разре- разрешаемых дальностно-доплеровских элементов, взвешенных с уче- учетом интенсивностей рассеяния в этих элементах. Затем для при- принятия окончательного решения выполняется пороговый анализ. Как в системах обнаружения протяженных целей, так и в си- системах подводной акустической связи для описания влияния цели и среды распространения на акустический сигнал приходится учи- учитывать все возможные трассы распространения. Различие между системами этих двух типов проявляется в основном в способах использования канала и выявления трасс распространения. В си- системах обнаружения излучается один и тот же сигнал, а задача сводится к выявлению только тех разрешаемых элементов (кор- (корреляционных приемников), сигнал которых обусловлен энергией, отраженной от цели. В системах связи излучаются различные сиг- сигналы, соответствующие разным сообщениям и отличающиеся, как правило, частотами, а задача сводится к выявлению всех трасс распространения сигнала.
Обработка сигналов в гидролокации. 411 Нетрудно убедиться в том, что, выбрав подходящие сигналы, можно существенно улучшить характеристики систем обнаруже- обнаружения и связи. Для систем обнаружения в общем случае наиболее подходящими оказываются сигналы, обеспечивающие разрешение целей по максимальному числу отличительных признаков. Не- Несколько сложнее обстоит дело с системами связи, для которых задача синтеза наилучших сигналов сводится к обеспечению оп- оптимальной различимости в канале. Это означает, что при задан- заданной излучаемой энергии существует оптимальное число разрешае- разрешаемых трасс (детально вопросы оптимальной различимости рассмот- рассмотрены в работах {41, 48]). Количественный анализ характеристик систем и вычисление отношения сигнал/шум или вероятностей ошибок могут быть весьма трудными задачами. Для большинства систем они сводятся к анализу х2-распределений, для которых оп- определяющую роль играет число степеней свободы; кроме того, де- детально разработаны и другие более сложные методы [41, 48]. Прежде чем перейти к особенностям обработки последова- последовательностей импульсов, описываемой в разд. 6.3.3, рассмотрим об- обработку сигналов с учетом окружающей среды в системах изме- измерения дальности до цели и доплеровского смещения сигнала от цели. Задачи измерения и обнаружения имеют много общего. Пы- Пытаясь определить координаты цели, оператор, как правило, про- проводит поиск по всей дальностно-доплеровской плоскости. Задача сводится к выявлению отражений от цели с использованием лю- любых отличительных признаков, связанных с отражениями. После ¦этого решается задача разделения сигнала, отраженного от цели, и реверберационного сигнала, с тем чтобы можно было опреде- определить дальностно-доплеровские координаты и ЭПР цели. Для вы- выделения отличительных признаков цели необходимо использовать сигналы, обеспечивающие высокую разрешающую способность. К сожалению, в случае протяженных целей решение перечислен- Таблица 6.2 Классификация моделей цели Сверлинга для случая совместной обработки последовательности импульсов Скорость флук- флуктуации Малая Большая Распределение вероятностей выходного сигнала приемника при приеме одиночного импульса экспоненциальное Случай 1. Цель с постоян- постоянной ЭПР и малой протяжен- протяженностью по сравнению с длиной волны сигнала Случаи 2. Цель с флуктуи- флуктуирующей ЭПР и малой протя- протяженностью по сравнению с длиной волны сигнала Рэлея Случай 3. Цель с постоян- постоянной ЭПР и большой протяжен- протяженностью по сравнению с длиной волны сигнала Случай 4. Цель с флуктуи- флуктуирующей ЭПР и большой про- протяженностью по сравнению с длиной волны сигнала
412 Глава 6 ных задач значительно сложнее, так как для них неприменимы методы анализа сигналов от медленно движущихся точечных це- целей, основанные на использовании границ Рао — Крамера и функ- функции неопределенности сигналов. В заключение подчеркнем, что акустическая среда действи- действительно накладывает ряд существенных ограничений на решение задач гидроакустики. В большинстве случаев ее влияние оказыва- оказывается весьма сложным и к тому же заметно изменяется во време- времени, поэтому необходимо, чтобы устройства обработки с учетом влияния среды были как можно более универсальными. Уже сей- сейчас для обеспечения этой универсальности все более широко ис- используются цифровые устройства обработки сигналов. 6.3.3. Обработка последовательностей импульсов Рассматривавшиеся до сих пор алгоритмы обработки сигна- сигналов относились к случаю излучения только одного импульса. Од- Однако в реальных активных 'гидролокационных системах почти не применяется режим однократного наблюдения; в них осуществля- осуществляются непрерывное зондирование среды и анализ принимаемых сигналов, так что практически всегда имеются данные ряда по- последовательных наблюдений, которые обрабатываются с помощью цифровых устройств. Прежде чем перейти к описанию режима многократных наблюдений, необходимо отметить, что для обра- обработки последовательностей импульсов разработано больше алго- алгоритмов, чем для одиночных импульсов, причем почти во всех из них используются машинные программы. Основное внимание бу- будет уделено некоторым алгоритмам, связанным с обработкой сиг- сигналов, хотя следует подчеркнуть, что они составляют небольшую долю всех разработанных алгоритмов. При обнаружении целей обработка последовательности им- импульсов обычно заключается в суммировании откликов на каждый импульс на выходе коррелятора (или квадратных корней из этих откликов). Поскольку рассматривают два основных параметра цели, возможны четыре различных варианта суммирования от- откликов коррелятора; обычно их называют моделями целей Свер- линга [54]. По этой классификации целей рассматриваются две различные модели распределения вероятностей ЭПР цели и флук- флуктуации принимаемых после отражения импульсов. Во всех слу- случаях предполагается, что фаза каждого из импульсов является равномерно распределенной случайной величиной, статистически независимой от импульса к импульсу. В табл. 6.2 представлены модели Сверлинга для различных статистических характеристик отклика коррелятора. Распределение вероятностей первой м-оделН соответствует отражению от большого числа малых рассеивате- лей, а второй — наличию единственной зеркальной компоненты со случайной фазой, которая принимается вместе с отражениями от
. Обработка сигналов в гидролокации 413> большого числа малых рассеивателей. Модель медленных флук- флуктуации соответствует случаю, когда модуль отклика коррелятора является постоянной, хотя и случайной величиной, а модель. быстрых флуктуации соответствует случаю, когда отклик корре- коррелятора флуктуирует случайным образом, причем независимо or импульса к импульсу. Оптимальный алгоритм совместной обра- обработки откликов коррелятора можно записать, используя транс- трансцендентные функции, но в большинстве случаев они могут просто суммироваться [41]. Составлено много таблиц, содержащих ха- характеристики систем для различных моделей целей, которые мож- можно использовать для предсказания характеристик во многих встре- встречающихся на практике случаях. Особенности анализа не играют особой роли в случае актив- активных гидролокационных систем, поэтому рассмотрим некоторые- более важные вопросы и в первую очередь следующие два из них, касающиеся совместной обработки импульсов: модель отклика' корреляционного приемника и уровень флуктуации от импульса» к импульсу. При решении задачи обнаружения активными гидро- гидролокационными системами совместная обработка импульсов по- последовательности заключается в нахождении каким-либо спосо- способом среднего отклика коррелятора, с тем чтобы достичь требуе- требуемого отношения сигнал/шум за счет усреднения. Если окружаю- окружающая среда и отражатель полностью стационарны, а средства об- обработки обладают достаточной производительностью для того,, чтобы осуществить поиск по всем элементам разрешения на даль- ностно-доплеровской плоскости и для всех импульсов большой' импульсной последовательности, то в принципе можно построить, приемник с любыми рабочими характеристиками. Такая возмож- возможность реализуется не часто, и обычно ограничиваются случаем совместной обработки определенного числа импульсов, как пра- правило, не более 10—100. Кроме того, для значительно более эф- эффективного выполнения совместной обработки импульсов с при- применением ЗУ намного меньшего объема можно вместо точного усреднения использовать усреднение на памяти с затуханием,, причем при этом ухудшение характеристик приемника оказыва- оказывается незначительным. При совместной обработке последовательности импульсов в ак- активных гидролокационных системах с целью определения даль- дальности до цели и доплеровского смещения отраженного сигнала' широко используются современная теория оценок и возможности- •цифровых схем. Существенно, что для прослеживания трассы це- цели приходится сглаживать последовательность оценок дальности- и доплеровского смещения, получаемых на выходе коррелятора.. Это сглаживание должно производиться с учетом динамики дви- движения цели, в том числе взаимосвязи между доплеровским сме- смещением и последовательностью дальностных оценок, а также лю- любых известных ограничений, касающихся цели, таких, как макси-
414 Глава 6 малыше значения скорости или ускорения. Чаще всего для сгла- сглаживания используются алгоритмы, основанные на методе наи- наименьших квадратов. Так, простейшим из них является полиноми- полиномиальная аппроксимация с теми или иными дополнительными огра- ограничениями. Один из наиболее сложных методов основан на моде- моделировании движения цели, которая рассматривается как динами- динамическая система, находящаяся под воздействием неизвестных воз- возбуждающих сил и шума, вызывающего искажение дальностно- доплеровских измерений. Для математического описания этого метода удобнее всего пользоваться уравнениями состояния мо- модели следующего вида.: l)=f(x(n), n ,п)и (п) (уравнение состояния), (уравнение измерения), F.21) причем матрицы состояния (f, g, h) учитывают динамику траекто- траектории и особенности метода измерения, а случайные процессы (и, w) используются для моделирования неопределенностей траекто- траектории цели и ее координат. Для простейшей модели, например, можно иметь Х\ —¦ положение в направлении север — юг, Хч — скорость в направлении север — юг, х3 — положение в направлении восток — запад, х4 — скорость в направлении восток — запад, Ух — измеренная дальность, г/2 — измеренная скорость изменения дальности, уъ — измеренный пеленг, f(x) = О О О т 0 0 0 0 0 1 0 о- 0 AT 0_ g 1 ' 0 - 1 0 _ 1 _ arctg (xvx3) Преимущества описанного метода моделирования заключаются в том, что все ограничения, связанные с динамикой и неопреде- неопределенностью измерений, могут быть введены непосредственно в ал- алгоритмы оценивания, причем сами алгоритмы оценивания оказыва- оказываются в результате принципиально рекуррентными, что очень удоб- удобно с точки зрения их реализации с помощью цифрового вычисли- вычислительного устройства. Трудность же использования этого метода связала с тем, что уравнения оценок нелинейные; поэтому невоз-
Обработка сигналов в гидролокации 415 южно получить аналитические выражения для их решения. Кро- ie того, к настоящему времени не поняты все особенности алго- алгоритмов оценивания; в частности, не изучены общий подход и ха- характеристики алгоритмов при малых отношениях сигнал/шум. Тем- Темке менее несколько работ по исследованию этих алгоритмов, со- |ержащих результаты многочисленных моделирований, уже опу- опубликовано [55—57]. В большинстве этих работ используется нелинейная теория рценок того или иного типа, ориентированная на алгоритм "кал- 1ановской фильтрации. Чтобы учесть нелинейности, применяют шеаризацию вблизи найденной оценки траектории цели; этот шроцесс называют алгоритмом обобщенной калмановской фильт- фильтрации. Если отношение сигнал/шум достаточно велико и выполня- выполняется некоторые ограничения динамического моделирования (свя- шные с возможностями измерений), то применение некоторых этих алгоритмов для обработки данных по дальности и доп- poBCKOMy смещению, как показала практика, может быть до- гаточно успешным. Однако при сравнительно плохих характери- гиках измерительного устройства линеаризации на результаты Сильно влияет шум, в результате чего эффективность всех алго- v ритмов сильно ухудшается. Описываемые фильтры дискретного времени (осуществляю- (осуществляющие последовательную обработку отсчетов) обычно не относят к цифровым фильтрам, хотя из-за их рекурсивного характера они могут рассматриваться как обобщение цифровых фильтров с бес- бесконечными импульсными характеристиками. Основное различие этих фильтров заключается в том, что матрицы коэффициентов: цепи обратной связи не постоянны, а являются функциями вре- времени и, возможно, наблюдаемых и оцененных величин. В данном случае вопросы практической реализации систем, на решение ко- которых направлена теория цифровой обработки сигналов, а также- вопросы создания алгоритмов обработки, основные с точки зре- зрения теории оценок, начинают пересекаться, так что приходится решать общую задачу разработки эффективных и точных алго- алгоритмов и систем сопровождения целей. Выше были коротко описаны две особенности обработки по- последовательностей отраженных импульсов в активных гидролока- гидролокационных системах. В некоторых из упоминавшихся при этом си- системах импульсные последовательности также обрабатываются совместно. Подробное рассмотрение всех деталей этой обработки заняло бы слишком много места, поэтому ограничимся лишь кратким описанием наиболее важных ее особенностей. В системах связи сообщение часто кодируется и передается с помощью последовательности посылок. Причины использования именно такого способа передачи заключаются в следующем. Во- первых, при кодировании обеспечивается более эффективная связь с точки зрения затрат энергии на двоичную единицу инфор-
416 Глава 6 мации, а также увеличивается надежность за счет введения из- избыточности в кодовую лоследовательность. Во-вторых, кодирова- кодирование с использованием криптографических методов обеспечивает повышение засекреченности сообщений. Кроме того, при практи- практической реализации систем с кодированием оборудование, обеспе- обеспечивающее обработку сигналов в передатчике и приемнике, оказы- оказывается сравнительно несложным. В передатчике должно обеспе- обеспечиваться выполнение алгоритма кодирования, а в приемнике — декодирования последовательности принимаемых данных с тем, чтобы вероятность ошибки при распознавании сообщения была минимальной. В настоящее время разрабатываются и новые, бо- .лее совершенные алгоритмы, основанные на использовании тео- теории кодирования и теории информации. Картографирование и профилирование морского дна произво- производятся с использованием оценок глубины, получаемых при после- последовательных зондированиях дна. Информация, обеспечиваемая однократным зондированием, совершенно недостаточна для по- построения топографического рельефа (построение рельефа — цель •большинства измерений); необходимо иметь двумерный массив данных измерений. Методы обработки, используемые при этом, могут быть самыми разнообразными, начиная с простейших, за- заключающихся в учете конечной ширины диаграммы направленно- направленности акустической системы, и заканчивая более сложными, осно- основанными на накоплении двумерного массива данных измерений, их интерполировании и построении контурной карты рельефа дна. Обработка сигналов может быть проведена только с помощью вы- высокопроизводительных вычислительных средств. Завершив на этом краткое ввиду недостатка места описание теории и моделей, лежащих в основе обработки сигналов актив- активных гидролокационных систем, перейдем к вопросам аппаратур- аппаратурной реализации некоторых операций обработки. Им посеящены ¦последующие разделы данной главы. 6.3.4. Реализация корреляционных приемников и согласованных фильтров Использование корреляционных приемников и согласованных ¦фильтров превратилось в важную проблему с тех пор, как была выявлена роль, которую играет обработка сигналов в гидролока- гидролокации. Необходимо, однако, учитывать, что согласованный фильтр является оптимальным приемником только при выполнении некото- некоторых условий, и в частности, если интерферирующий шум во всей интересующей нас полосе частот является практически белым. Тем не менее, когда с помощью такого фильтра выполняется также и обработка с учетом влияния среды, как было описано в разд. 6.3.2, он становится важной составной частью многих практически ¦оптимальных гидролокационных приемников.
Обработка сигналов в гидролокации 4Г7 Проще всего корреляционный приемник для монохроматических мпульсов можно построить на основе полосового фильтра, дент- дентальная частота и постоянная затухания которого согласованы с астотой и длительностью сигнала. После того, как были выявле- ы преимущества сигналов с большими базами (к ним относятся, апример, псевдослучайные последовательности и частотно-моду- ированные сигналы), была проделана большая работа по созда- ию приемников, которые позволили бы использовать эти преиму- 1ества. Сначала были созданы приемники для обработки во вре- енной области ввиду того, что выполнение преобразования Фурье ад сигналами с большими базами в реальном времени считалось евыгодным. В одной из первых и наиболее распространенной системе ис- ользован принцип временного сжатия на линии задержки [58, 9]. Для тех полос, которые имеют сигналы типовых активных дролокаторов, выполнение свертки с использованием линий за- ержки (ЛЗ) с отводами может быть реализовано полностью «рровыми средствами. Линии задержки с рециркуляцией исполь- уются для сжатия узкополосных акустических сигналов большой родолжительности и превращения их в кратковременные широко- олосные сигналы. Блок-схема описываемой системы приведена а рис. 6.18, а. Общее время задержки ЛЗ равно (N—1) ДГ екунд; время задержки между соседними отводами составляет секунд. Период дискретизации входного сигнала равен NAT ce- унд. Полученный очередной отсчет сигнала сдвигается вдоль всей 13 и затем рециркулирует таким образом, что оказывается на ;ыходе второго отвода ЛЗ к тому времени, когда будет взят сле- ;ующий отсчет. После этого процесс повторяется, и в конце кон- ,ов на отводах ЛЗ будут находиться последние (N—1) отсчетов игнала. С приходом каждого нового отсчета данные в ЛЗ сдви- аются за счет перезаписи содержимого первого каскада ЛЗ. Систему с временным сжатием на ЛЗ можно использовать для ыполнения операции корреляции. Для этого нужно объединить е такие системы и добавить умножители и шину суммирования, ак показано на фиг. 6.18,6. Обе рециркулирующие ЛЗ, верхняя нижняя, содержат коррелируемые массивы, а операция корреля- ии выполняется с помощью схемы умножение — суммирование, ели один из сигналов эталонный, как это обычно имеет место активных гидролокационных системах, то одна из ЛЗ модифи- ируется таким образом, что этот сигнал непрерывно рециркули- ует после подачи его на ЛЗ. При таком подходе схема умноже- ие — суммирование представляет собой дискретный вариант сог- асованного фильтра. В принципе описанную систему можно было бы реализовать олностью в аналоговой форме. Однако очень быстро выяснилось, то системы с жестким ограничением сигналов имеют ряд преиму- еств, так что фактически функция корреляции ищется по сово-
418 Глава 6 ¦X(t) X(t)=sgn(X(t)) Огра- ничи-. тель-\— Дискретиза- цня/Хранвние fs -10 AT) Ts = NAT Низкочастотный 4 сигнал W<-pf / А записбюается на место 3 А Ш-J) А Широкополосная ЛЗ с отводами 1 1 I V н IV и ¦ [¦ i ., Частота дискретизации^ X(.i) X(t-Z) Выходные сигналы с omeoffae A3 после временного сжагт/я а Приемник с еременньш сжатием на A3 Выходной сигнал колреля.^ тора жестко ограничен- шх сигналов Схема совпадения опаков Рециркулирумщая A3 с о/сестт ограниченным опорным сигналом для коррелятор? Рис. 6.18. а — блок-схема системы с временным сжатием на ЛЗ; б — вычисление коэффициентов имиой корреляции в системе с временным сжатием на ЛЗ. купности знаков сигналов. Характеристики такого коррелятора за- зависят от свойств окружающей среды, но в большинстве случаев преимущества использования коррелятора оказались намного бо- более существенными. При цифровой реализации коррелятора не нужно вводить схем формирования, устраняющих искажения в процессе рециркуляции, а схема умножение — суммирование зна- значительно упрощается; на этапе совершенствования систем эти факторы сыграли важную роль. Преимуществом использования жесткого ограничения является также то, что система становится нечувствительной к величине динамического диапазона сигнала, который, как станет ясно ниже, является важным фактором при практической реализации устройств обработки сигналов в гидро'" локаторах.
Обработка сигналов в гидролокации 419 Во многих работах рассматривался вопрос о степени ухудшения характеристик систем за счет жесткого ограничения и делались по- попытки определить, сколько уровней квантования нужно иметь в действительности [60—62]. В большинстве из них установлено, что если система работает в присутствии белого фонового шума и отно- отношение сигнал/шум превышает порог, то уровень потерь по отноше- отношению к идеальной линейной системе составляет 2 дБ. Рассматрива- Рассматривались и другие частные случаи; так, оказалось, что при работе в присутствии узкополосной мешающей помехи уровень потерь со- составляет У2 дБ на каждый децибел отношения сигнал/интерфери- сигнал/интерферирующая помеха. Получены и другие результаты, однако пользо- пользоваться ими следует с большой осторожностью. Исследование эф- эффектов квантования при числе уровней, превышающем 2, показало, что в большинстве случаев можно ограничиться 4-разрядным кван- квантованием, достаточным для полного представления динамического диапазона. Естественно, что после появления недорогих быстродействую- быстродействующих цифровых микросхем отношение к системам обработки с вре- временным сжатием на ЛЗ изменилось. В настоящее время такие структуры на ЛЗ с отводами рассматриваются как фильтры с ко- конечной импульсной характеристикой (КИХ-фильтры). Для того чтобы можно было обрабатывать отсчеты сигнала с числом разря- разрядов, обеспечивающим любую заданную и реализуемую на прак- практике точность, используются многоразрядные сдвиговые регистры, а для обеспечения динамического диапазона применяются схема адаптивного усиления и представление чисел в формате с плаваю- плавающей запятой. На рис. 6.19 изображена блок-схема корреляционного приемника, основанная на новом подходе. Появление алгоритма быстрого преобразования Фурье (БПФ) оказалось для гидролокации таким же мощным стимулирующим толчком, как и для многих других областей техники. Наиболее ярко преимущества активных гидролокационных систем выявляют- выявляются при использовании сигналов с большими базами, т. е. именно тогда, когда применение алгоритма БПФ позволяет существенно сократить объем вычислений. Обычно граничный размер массива, начиная с которого оказывается более эффективной (с точки зре- зрения количества операций) обработка в частотной области, равен 32, т. е. величине, заведомо меньшей базы сигналов в системах, разрабатываемых в настоящее время. Подробно вопросы аппара- аппаратурной реализации алгоритма БПФ были описаны в гл. 5. Первичная обработка гидролокационных сигналов, обязатель- обязательная при определении дальности и доплеровского смещения цели, была значительно усовершенствована за счет использования опера- операций высокочастотной свертки, выполняемых на существующей эле- элементной базе. В процессе поиска эхо-сигналов на дальностно-до- Плеровской плоскости операция корреляции должна выполняться Для каждого элемента разрешения и по всем интересующим нас
420 Глава 6 lit)* rut) uucupemu\wUj затор wHi I —ь*Шоррелятар О wi Jti<wopp?jjsiim>p / т t t '¦" t t V-/ Щ ФНЧ и Дискреты- зато/ Ajfappp/Htmop M< -^»j Коррелятор. ¦ t ¦ •" tt *// I -^*\Корреля!пор-] tu... u Сдвиговый регистр для влерного сигнала Рис. 6.19. Пример цифровой реализации согласованной фильтрации на совреме ной элементной базе (взято из [62]). направлениям. Проще всего для решения этой задачи использова набор из весьма большого числа корреляторов. На рис. 6.20 прс ставлены два варианта схемы, обеспечивающей поиск цели дальностно-доплеровской плоскости. В одной из них использует набор доплеровских преобразователей частоты (или устройст временного сжатия, если система широкополосная), за которьп следуют корреляторы (или согласованные фильтры). Для реалнэ ции корреляторов может быть применен алгоритм БПФ, но кош ный результат обязательно должен быть получен во временной о ласти, так как искомой величиной является оценка дальности цели. В ряде случаев, используя некоторые свойства зондирующе сигнала, можно исключить набор доплеровских преобразователе так, при работе с ЛЧМ-импульсами и при условии, что цель оть сится к числу узкополосных отражателей, за счет нескомпенсир ванного доплеровского смещения будет наблюдаться сдвиг цели дальности. Вторая схема связана с первой, так как с помощ! теоремы Парсеваля операция двухчастотной корреляции, выпо няемая в процессе первичной обработки, переводится в частотщ область. В этой схеме применяется алгоритм БПФ, использует набор фазосдвигателей с линейным изменением фазы, с помош,! которых учитывается временная задержка на время распростран ния акустического сигнала, и выполняется операция корреляци причем для ее реализации также может быть использован алг ритм БПФ (с соответствующим переходом во временную облает! Выходной сигнал является функцией от доплеровскаго смещеш
Обработка сигналов в гидролокации 421 Комплексное лреоВразооание ооплвровспой частоты Линия, задержки, для иомпленсноео. сигнала Квадратурная демодуляция ~ 2MN умножений - сложений, М»N fA = ПИ AT) Сумматор Выходной сигнал коррелятора Квадратурная демодуляция Дискрети- эатор AT ЗУ для хранения М слое 2АТ МАТ Преобразование доплеровспой частоты -, Умножение в частотной М-точечное обратное ВПср \ \ \ \\ \ Выходной сигнал коррелятора ис. 6.20. Реализация операции корреляции при первичной обработке во времен- временной (а) и частотной (б) областях. ля каждой дальностной задержки. Любая из этих схем дальност- о-доплеровской измерительной системы, работающей в режиме опека, может быть эффективнее другой в зависимости от числа >азрешаемых элементов вдоль обеих координат, т. е. соотношения ежду размерами элемента разрешения и областью неопределен- ости, в пределах которой должен быть произведен поиск. Б большинстве дальностно'-доплеровских измерительных уст- рйств вслед за операцией поиска сигнала должна выполняться
422 Глава 6 операция нахождения положения максимума функции корреляции; на этом этапе используется априорная информация как о положе- положении цели, так и об особенностях окружающей среды. Еще один вопрос, существенным образом влияющий на структу- структуру устройства первичной обработки, заключается в том, выполня- выполняется ли обработка сигнала на центральной частоте гидролокатора или же его квадратурных компонент в основной полосе частот после демодуляции. При цифровой реализации использование демо- дулированных сигналов обладает рядом преимуществ ввиду того, что требуемая частота дискретизации понижается. При выполне- выполнении первичной обработки на несущей частоте необходимо, чтобы частота дискретизации была в четыре раза больше центральной частоты, в результате чего массивы данных оказываются слишком большими. Для сравнения отметим, что при демодуляции сигнала в основную полосу в полосе сигнала дискретизуются обе квад- квадратурные компоненты, так что объем памяти для хранения масси- массивов данных уменьшается в fJW раз. С точки зрения алгоритма формирования диаграммы направленности антенной решетки тре- требуется, чтобы даже при работе в основной полосе с использовани- использованием квадратурной демодуляции частота дискретизации превышала часто'ту Найквиста в 4—5 раз. Отметим несколько задач, которые приходится решать при вы- выполнении первичной обработки сигналов активных гидролокаторов. К двум наиболее важным из ;них относятся сокращение динамиче- динамического диапазона и компенсация доплеровского смещения, обуслов- обусловленного движением судна. Для сокращения динамического диапа- диапазона используются схемы автоматической регулировки усиления (АРУ) того или иного вида, схемы с изменяющимся во времени усилением либо логарифмические усилители. Это особенно важно для аналоговых систем обработки, а также для систем, использую- использующих представление чисел с фиксированной запятой; динамический диапазон таких систем меньше диапазона, необходимого для пред- представления эхо-сигналов гидролокаторов. После того как системы цифровой обработки с плавающей запятой получат широкое рас- распространение, проблема динамического диапазона станет менее ак- актуальной, хотя с ней по-прежнему придется считаться ввиду того, что нужно выравнивать уровни сигналов элементов антенной ре- решетки, а также в связи с необходимостью предварительного умень- уменьшения разрядности выходных данных перед выдачей их на боль- большинство существующих устройств отображения. Компенсация доплеровского смещения состоит просто в выполнении операции преобразования частоты, которое проводится, как правило, на рабо- рабочей, т. е. центральной, частоте сигнала, но может также осуществ- осуществляться и в цифровой форме над отсчетами сигнала, дискретизован- ного в основной полосе.
Обработка сигналов в гидролокации 423 • 6.3.5. Реализация алгоритма обработки, учитывающего влияние окружающей среды Обычно процессы распространения и отражения сигнала в аку- акустическом канале настолько сложны, что для их моделирования применяют фильтры и функции рассеяния со случайными пара- параметрами, которые были рассмотрены выше. Эффективность обра- Гботки сигнала с использованием подобных моделей окружающей ¦среды зависит от того, насколько точно известна функция рассея- рассеяния или какая-либо эквивалентная ей характеристика, а также от степени универсальности системы обработки сигналов, которая не- необходима для адаптации системы к неизбежным изменениям ок- :ружающей среды. Часто для получения оценки функции рассеяния :можно использовать метод, основанный на определении океаногра- океанографических переменных, таких, например, как профили скорости [распространения звука (их можно либо взять из имеющихся таб- •лиц, либо; получить из измерений), и применении адаптивной об- обработки соответствующего типа. Полученную информацию о про- процессе рассеяния акустической волны необходимо представить в форме, необходимой для обработки сигналов в приемнике. Сказать еще что-либо о задаче обнаружения затруднительно, так как ее решение слишком сильно зависит от конкретных условий; ведутся интенсивные работы в направлении разработки универсальных методов решения этой задачи. Поэтому ограничимся тем, что крат- кратко обрисуем, как может осуществляться обработка сигналов при наличии реверберации. При этом основное внимание будет уделено особенностям алгоритма обработки и перспективам его развития. Во-первых, отметим, что такие параметры, как длительность сигнала Т, продолжительность реверберации L, ширина полосы сигнала W и ширина спектра доплеровского размытия В, связаны между собой определенными соотношениями и подчиняются ряду ограничений. Кроме того, в акустическом канале за счет преобла- преобладания некоторых трасс распространения рассеяние часто имеет концентрированный характер. Во-вторых, по каналам с размытием имеется много литературы, причем она относится не только к гид- гидролокации, но и к радиолокации, радиолокационной астрономии, к системам ионосферной и тропосферной связи. В некоторых из указанных областей техники эти вопросы проработаны более де- детально, чем в гидролокации. Во многих случаях обработка гидроакустических сигналов с учетом окружающей среды выполняется с использованием модели, имеющей вид фильтра со случайными параметрами, которая опи- описывается соотношением F.15) и базируется на линии задержки с отводами. Если полоса сигнала ограничена величиной W, а дли- длительность реверберации — величиной L, то для моделирования при- принимаемого сигнала при наличии реверберации можно использо-
424 Глава 6 вать блок-схему, изображенную на рис. 6.21, а [63—65]. Сигнал, формируемый в такой схеме, имеет вид 2WL+1 i=\ 2W }' где bi(t)—набор случайных, изменяющихся во времени коэффи- коэффициентов усиления по отводам, которые следуют через интервалы времени, обратные ширине полосы излучаемого сигнала. Исполь- Используя несколько слабых ограничений, можно показать, что коэффи- коэффициенты усиления в отводах ЛЗ представляют собой некоррелиро;- ванные стационарные случайные процессы, энергетические спект- спектры которых пропорциональны сечениям функции рассеяния по дальности Sb(f, i/2W), соответствующим K = i/2W (рис. 6.21, б). От- Отметим далее, что после Фурье-преобразования значений коэффици- коэффициентов усиления в отводах на интервале приема данных получается блок-схема модели, которая очень удобна для представления ревер- берационного сигнала. Следовательно-, целесообразно рассмотреть f(t) f(t- '/г Ws) 7(t). УгЩ'АЩ ,2^y. Сечения срушщиирассеяния Спептр bL(t) Ось доплеповской " частоты fd б Рис. 6.21. а-модель канала с размытием на ЛЗ с B^1+1) отводами через I/2W ; б ~ спектры на- наборов весовых коэффициентов для отводов ЛЗ, рассматриваемые как сечения функции
Обработка сигналов в гидролокации 425 Линия эаоержпи с отво- отводами^ Овин из выводов A3 г(П (функционал от •/*} ± Аналогичные входы т Сумматор Л1Т Рис. 6.22. Упрощенная блок-схема приемника акустических сигналов для малых значений отношения сигнал/шум и среды с размытием за счет реверберации. алгоритмы, с помощью которых при построении приемника можно !было бы находить значения коэффициентов усиления в отводах. Прежде чем перейти к описанию методики использования мо- модели на ЛЗ с отводами в некоторых приемниках, целесообразно сделать несколько замечаний. Если моделируемые канал или отра- отражатель не создают доплеровского1 размытия (или оно пренебрежи- пренебрежимо мало), как это часто имеет место в гидролокации, то значения коэффициентов усиления в отводах остаются постоянными и с до г статочной точностью представляют собой дискретные отсчеты им- импульсной характеристики канала. Было предпринято несколько попыток измерить эту импульсную характеристику [66—68]. Кроме гого, очевиден и еще один связанный с описанным способ пред- представления модели канала, который основан на преобразовании Фурье сигналов и предполагает использование передаточной ,функции. Существует большое количество приемников, построенных на основе представления реверберационного сигнала с помощью ЛЗ с отводами. Так, на рис. 6.22 в качестве иллюстрации приведена блок-схема приемника для обнаружения протяженных целей и оп- определения дальности и доплеровского смещения. При построении этого приемника использовались некоторые модельные допущения, ^оэтому его нельзя применять для обработки любых ревербера-
426 Глава 6 . ционных сигналов. В блоке приемника, предназначенном для учета влияния окружающей среды, имеются два входа. На один из них поступают выходные результаты коррелятора-согласованного фильтра, соответствующие разным значениям доплеровского сме- смещения, которые затем подаются на отводы ЛЗ. По второму входу вводятся оценки функций рассеяния, описывающих и цель, и шум реверберации. Для получения этих оценок следует воспользовать- воспользоваться либо известными сведениями об окружающей среде, либо тем или иным алгоритмом адаптивного оценивания. Амплитуды вы- выходных сигналов с отводов ЛЗ возводятся в квадрат и взвешива- взвешиваются в соответствии с отношениями, зависящими от функций рас- рассеяния цели и шума, а также от уровня внешнего фонового'шума. После взвешивания производится суммирование; полученный ре- результат представляет собой сигнал на выходе обнаружителя, кото- который может подаваться на индикатор или вводиться в устройство обработки последовательности импульсов. Эту же систему можно использовать и в качестве измерителя, если выходные значения находить, перебирая дальностно-доплеровские координаты цели (т. е. изменяя в зависимости от ожидаемых параметров цели весо- весовые коэффициенты для выходных сигналов ЛЗ с отводами). Главная цель, которая преследуется при введении в эти систе- системы именно цифровой фильтрации, заключается в том, чтобы вы- выходные сигналы корреляционного приемника обрабатывались сов- совместно с информацией об окружающей среде; при этом система работает нормально. В результате требуется, чтобы система об- обработки была весьма универсальной, особенно если учесть, что ха- характеристики и каналов, и целей могут изменяться. Представляет- Представляется, что такая универсальность может быть достигнута только с по- помощью цифровых устройств обработки. При моделировании обработки с учетом влияния окружающей среды возможны и некоторые другие способы описания каналов (например, основанные на использовании двухчастотных корреля- корреляционных функций). Выше была рассмотрена только одна модель, весьма удобная при выполнении обработки в цифровой форме, хотя каналам с размытием посвящено большое количество публи- публикаций. Отметим, что в одном отношении почти все модели каналов идентичны: при описании их случайной природы делаются попыт- попытки вводить случайные параметры или процессы, для определения которых используются корреляционные свойства излучаемых сиг- сигналов. Таким образом, именно возможность быстрого выполнения операции корреляции на этапе первичной обработки сигналов ока- оказывается особенно важной. 6.3.6. Обработка последовательностей импульсов Во многих активных гидролокационных системах особенно важ- важную роль играют мини-ЦВМ и микропроцессоры, хотя методика их использования в гидролокации не содержит ничего необычного.
Обработка сигналов в гидролокации 427 В большинстве случаев применяются ЦВМ с длиной слова в 16 или 24 двоичные единицы и объемом памяти 32К, причем про- программы пишутся либо в машинных кодах, либо на языках Фортран или Алгол. Часто ЦВМ оснащаются дисковой памятью. Кроме того, мини-ЦВМ оказались весьма полезными и удобными для оператора, работающего с дисплеями в интерактивном режиме. В данном разделе будет описано несколько ситуаций, когда ис- использование мини-ЦВМ для обработки последовательностей им- импульсов оказывается особенно удачным. Часто при обнаружении цели или определении дальности до нее и доплеровского смещения импульсы приходится обрабаты- обрабатывать совместно, чтобы увеличить отношение сигнал/шум. Для этого можно использовать различные алгоритмы совместной обработки импульсов, в том числе суммирование амплитуд или их квадратов, а также низкочастотная фильтрация последовательности, соответ- соответствующей некоторому дальностно-доплеровскому элементу разре- разрешения. Важной особенностью обработки этого типа является на- накопление текущих статистических характеристик, таких, как ма- математическое ожидание, дисперсия и, возможно, гистограмма распределения выходного сигнала детектора. Эти характеристики можно использовать при адаптивной установке пороговых уровней для борьбы с ложными выбросами, т. е. с аномалиями в выходных данных, а также при накоплении последовательности результатов обработки импульсов в процессе как обнаружения цели, так и оп- определении ее дальностно-доплеровских координат. В системах сопровождения и навигации, как правило, использу- используются решения систем довольно' сложных уравнений. Ряд алгорит- алгоритмов применяется для описания движения цели; все более широко используются нелинейные методы оценивания, такие, например, как калмановская фильтрация. Важно, что объем вычислений при выполнении этих алгоритмов сравнительно невелик, поэтому после того, как начали использоваться мини-ЦВМ, появилась возмож- возможность обходиться без больших универсальных вычислительных ма- машин. В системах связи как для повышения достоверности передачи, так и для обеспечения секретности передачи сообщений использу- используется кодирование. Алгоритмы декодирования часто оказываются сложными и оперируют с большими последовательностями импуль- импульсов, однако и в этом случае требуемый объем вычислений оказы- оказывается сравнительно небольшим. С целью повышения эффективно- эффективности систем подводной связи могут быть использованы различные алгоритмы кодирования и декодирования, в том числе алгоритм Витерби. В заключение отметим, что в системах картографирования и профилирования приходится накапливать огромное количество дан- данных и выполнять затем весьма громоздкую обработку, прежде чем будет получена окончательная карта или поосЬиль дна. ГТ
428 Глава 6 довательности импульсов должны быть обработаны таким образом, чтобы устранить ложные эхо, учесть гесЫетрию взаимного распо- расположения источника и приемника, привязать измерения к навига- навигационной системе координат и построить контурные линии. Без мини-ЦВМ практически было бы невозможно обработать эти ог- огромные последовательности импульсов, используемые в современ- современных системах картографирования [123]. 6.3.7. Примеры устройств обработки гидролокационных сигналов В предыдущих разделах были рассмотрены некоторые вопросы обработки сигналов активных гидролокационных систем, относя- относящиеся как к теории и моделям, так и к аппаратурной реализации. В данном разделе будет кратко описано несколько наиболее харак- характерных современных систем активной гидролокации. Ввиду описа- описательного характера материала более сложные системы не будут приведены. Ниже рассматриваются следующие три примера: 1) один из современных активных гидролокаторов военного на- назначения для обнаружения и сопровождения целей с антенной ре- решеткой, установленной на корпусе корабля; 2) система навигации и определения местоположения для сопровождения подводного ис- исследовательского аппарата; 3) система связи. На этих примерах будут показаны последовательность проведения обработки сигна- сигналов и взаимосвязь между различными операциями. Одной из основных задач активной системы обнаружения и со- сопровождения является определение местоположения и курса под- подводных лодок. При этом в зависимости от свойств окружающей среды используются самые разнообразные трассы распростране- распространения— прямая, с отражением от дна, с зоной сходимости, припо- приповерхностный канал. На рис. 6.23, а приведена блок-схема относи- относительно недорогой и простой системы активной гидролокации типа DE-1160-AN/SQS-SQ, разработанной фирмой Raytheon Сомрапу [68]. Перечислим некоторые особенности этой системы. Обработка сигналов проводится в следующей последовательно- последовательности. Во-первых, оператор (или блок управления) выбирает подхо- подходящий зондирующий сигнал, учитывая особенности окружающей среды и условия реверберации, трассы распространения сигналов до цели, а также предпочтительный режим работы системы. Затем перед подачей сигналов на преобразователи антенной решетки, установленной на корпусе судна и предназначенной для формиро- формирования диаграммы направленности, их задерживают, умножают на весовые коэффициенты и усиливают. Если система работает в режиме поиска, то главный лепесток диаграммы можно смещать (или покачивать) от посылки к посылке с тем, чтобы обеспечить сканирование по всей интересующей нас области. Излучаемая энергия поступает в акустический канал, а затем отражается от цели и возвращается обратно к антенной решетке (как и энергия,
. , Обработка сигналов в гидролокации 429 обусловленная реверберацией). Преобразователи антенной решет- решетки переключаются в режим приема. Выходные сигналы преобразо- преобразователей поступают в предварительные усилители, пропускаются через полосовые фильтры, а затем через схемы компенсации уси- усиления, с помощью которых учитываются условия приема сигналов Далее, для формирования диаграммы направленности при приеме сигналы задерживаются, умножаются на весовые коэффициенты и суммируются. Этот вид обработки сигналов выполняется в блоке «Обработка при активном поиске и (или) сопровождении» Более подробно эта часть системы представлена на рис'б 23 б Прежде всего выполняется операция согласованной фильтрации (т. е. корреляционный прием). Обработка производится в основной полосе частот путем квадратурной демодуляции с последующими дискретизацией и аналого-цифровым преобразованием Операция коррелирования выполняется в функции дальности после предва- предварительной компенсации до-плеровского смещения, обусловленного движением судна; одновременно может быть учтено и доплеров- ское смещение, связанное с движением цели. Если система рабо- работает в режиме поиска, то выходные сигналы корреляторов возво- возводятся в квадрат и усредняются по всей последовательности импульсов с учетом диаграммы направленности антенны. Число им- импульсов при усреднении зависит от стационарности окружающей водной среды. Если система работает в режиме сопровождения выходное напряжение коррелятора максимизируется в зависимо- зависимости от расстояния и доплеровского смещения и поступает на вход устройства определения параметров движения цели Некоторые весьма интересные применения алгоритмов обработ- обработки сигналов для решения задач сопровождения и навигации свя- связаны с техникой, предназначенной для определения местоположе- местоположения подводных платформ (или погружаемых аппаратов). Известно несколько океанографических систем, в которых используется эта техника; к ним относятся система управления положением буровых станков при бурении в море или океане, созданная в рамках про- программы по глубоководному бурению, а также система сопровожде- сопровождения аппарата «Элвин» для подводных исследований. Применяемая в них методика коренным образом отличается от методики слеже- слежения за подводными лодками противника, основанной на наблюде- наблюдении за отражениями; в данном случае действия объекта наблю- наблюдения скоординированы с работой группы приемопередатчиков В этих системах для построения линий положения сопровождаемо- сопровождаемого подвижного объекта или платформы используются группы из трех или более приемопередатчиков. Геометрические соотношения характерные для системы слежения за положением надводного или подводного судна, в которой применяется ряд приемопередат- приемопередатчиков, показаны на рис. 6.24, а [69]. В этой системе используются два режима работы: импульсный и доплеровский. В импульсном оежимр г пл^Атми „„,;,„,„
430 Глава 6 Генератор зондирующего сигнала I диаграммы направленности и апертура I I 36 усилитемейр^ мощности Мсточник литания Управление системой, синхронизация, управление режимами, стабилизация, автосопровожде- автосопровождение, настройка, отображение Эбцепей коммутации ширины диаграммь/па вертикали ¦-»¦ дблинееп по д элемен- элементов в каж- каждой 36 а/гтиеных лредусилите- лейсрилш- ром Согласование с внешними системами typ Спорость Крен У огнем Хранение данных "I ванны. формирователь Зиаграммыдля активноеореща- ма и 36предва- 36предварительно стор- сторнированных диаграмм ¦-> Зб-яаналбный приемник для активно- активного обзора 54¦ предусили- теля для лас- саем. режима Формирова- Формирователь аиа г- пассивного режима ЗУиндика- тораобзора 18-канальный приемник для пассивного режима йвихканальный приемник сопровождения ЗУ индика- индикатора соп- ровожде- ровождения Пульт оператора Индикаторы Индикатор обзора Т" ¦*¦ Электронный, регистратор вмюрдаяатах пеленг-время Индикатор сопровождения Мвухканальнь/и приемник звуковых сигналов Линамигги Наушники Рис. 6.23. а-блок-схема гидролокационной системы Raytheon DE/1160-AN/SQS-56; б - важнейшие опе- операции обработки сигналов в активной части гидролокационной системы Raytheon
7. Подготовка сигнала-Збпредусилитлеи суммы, фильтрация и у плен ив . , , , i Суммирование и предусиление Полосовые фильтры на 6,7, 7,бив,4-нГц Усиление Сигналы^ к 36линейкам решетки 288 выходных сигналов гидросронав по б от каждой линейпи „ т ¦ - \зб предварительно 2. Формирование диаграммы направленности - За предварительно сформированных диаграмм \ сфрмированных i i i i г^ : i i г ~* ^yl АЦП Цифровая задержка Взвешивание (uvem затенения) и линеаризация Суммирование для формирования диаграмм Частота дискретизации Временная задержка, МАкГц, 5 двоичных знаков- управляемая ЭВМ геометрический признак А д 4-разрядное квантование коэффициентов, кфрц, учитывающих затенение Ыг LJS'i Is /I /ISM  t/Ui i 1*1 M f IJJMtS/f irt/i. и 4 двоичных знака-амплитуда 3. Согласованная фильтрация (первичная обработка только для обнаружения (поиска)) -35-канальный приемник частотно-модулированных монохромати- монохроматических сигналов для активного режима, обработка для сжатия импульса, 38вь/г.сиг-1/7„..,„„„„ \сЧМ по ступенчатому заколу направ- _». Уленности смещен,- \ \ныхна/д° \ \3управляемые диаг- N граммы шириной/А-'' \по горизонтали и/0° [по вертикали Приемник сигналов со ступен- ступенчатой частотной, """'">*- ¦ цией налов от кажой ди- диаграммы t Регулироя к а усиления с yve/пом дал&насми 22двоичные единицы- ]2двоичнь1Х единиц Обработка ЧМмонохрома- ЧМмонохроматических сигналов Сведение к нул?о соб- собственного боплероо ского смещения и гетеродинирояание Демодуляция к основной полосе+ЗООГц 8 полосовых рильтров с полосой №Щ 38 квадратурных компонент от каж- каждой диаграммы 8 детекторов [возведение в квадрат и ин- интегрирование) \3адержкаи jp. суммирова- суммирование на ин- интервале дли- длительно- длительности сигнала Злаковый коррелятор -Выходы3 детекторов Обработка сигнала с учетом окружающей ?ильтрация (суммирование по дальности) Пороговый уровень Дисплеи для накоплен нвазвокое
432 Глава 6 Приемопередатчик Приемопередатчик Импульсная система Доплеровская система а Доплеровская система Подготовка сие мала Согласованный /рильтр Г Предуси- литель Полосовой фильтр Демодулятор с полосой 1500 Гц Квадратурная демодуляция для канала Гидроазоны на обшивке судна Маян Цифровая схема а оценки разы АЦП Цифровой фазовый детектор Логическое иисрровое устройство накопления Квадратурные выходные сигналь! Квадратурные выходные сигналы маяка Алгоритм определения местоположения Нахождение линий положения Определение местоположения Параметр состояния Оконча- Окончательное значение оценки Рис. 6.24. й — акустическая навигационная система Океанографического института в Вудс-Холле (им- (импульсные приемопередатчики и доплеровские маяки установлены на одних и тех же яко- якорях); б — обработка сигналов в акустической навигационной системе Океанографического института в Вудс-Холле (взято из [69]). всенаправленное колебание. Это колебание принимается приемо- приемопередатчиками, в каждом из которых сигнал преобразуется в си- сигнал с новой частотой и ретранслируется обратно на платформу. После этого каждый из преобразованных по частоте сигналов под-
Обработка сигналов в гидролокации 433 вергается обработке с помощью корреляционного приемника, цель которой — получить оценки времени распространения колебаний от платформы до каждого из приемопередатчиков и обратно. Эти дан- данные используются для построения линий положения, а по сущест- существу— поверхностей положения, поскольку система работает в трех- трехмерном пространстве. На основе полученной информации опреде- определяется истинное положение платформы относительно каждого приемопередатчика. Как и следовало ожидать, точность этой си- системы сильно зависит от того, с какой погрешностью определяется время распространения в прямом и обратном направлениях; по- поэтому необходимо обеспечить точное оценивание дальности и до- плеровского смещения. Для получения этих данных используется корреляционный приемник (см. рис. 6.24, б). В некоторых системах описываемого типа достигнутая точность составляла примерно ~2—3 м, когда взаимное положение приемопередатчиков было из- известно с высокой точностью. В режиме доплеровского! сопровождения от каждого приемо- приемопередатчика в направлении платформы излучается монохромати- монохроматический сигнал. Каждый из сигналов в системе обработки на плат- платформе демодулируется и поступает на схему цифровой фазовой ав- автоподстройки, где наблюдаемые значения доплеровского смещения интегрируются, что дает оценку разности фаз между сигналами платформы и приемопередатчика. Эти разности фаз далее исполь- используются для построения поверхностей положения, по которым и на- находится местоположение платформы. В такой системе необходимо устанавливать начальные значения разностей фаз, поэтому она ис- используется совместно с импульсной системой. Кроме того, система может работать только при достаточно больших отношениях сиг- сигнал/шум, чтс?бы не было перескока фазы в схемах фазовой авто- автоподстройки, так как в противном случае будут наблюдаться сме- смещения линий положения. Согласно публикации [69], такие системы обеспечивают точность порядка нескольких сантиметров. Данная система в значительной степени ориентирована на при- применение именно цифровой обработки сигналов. При проведении подводных исследований используются навигационные алгоритмы, реализуемые в реальном времени с помощью мини-ЦВМ, разме- размещенной на погружаемом судне. В импульсном режиме для получе- получения дальностных оценок используется цифровая техника; в долле- ровском режиме важную роль при определении оценок разностей фаз, возникающих за счет распространения сигналов по разным трассам, играет цифровая система фазовой автоподстройки. При работе с этой системой необходимо особенно тщательно учитывать влияние окружающей среды, поскольку помимо прямой трассы распространения возможны также трассы с отражением от водной поверхности или от дна. Все эти факторы должны учитываться в алгоритмах оценивания дальности и доплеровского смещения.
434 Глава 6 Системы подводной связи могут быть либо очень простыми, либо чрезвычайно сложными в зависимости от предъявляемых к ним требований и особенностей окружающей среды. При малых дальностях и вертикальных трассах распространения подводная связь может легко обеспечить передачу речи и данных с низкой скоростью; так, например, скорость передачи 2,5 кбит/с можно по- получить при мощности передатчика всего в несколько ватт. Для построения такой системы достаточно иметь усилитель-преобразо- усилитель-преобразователь того или иного типа, с помощью которого энергия речевых сигналов преобразуется в воде в акустическую энергию. Модуля- Модуляция несущей частоты необязательна, так как в полосе частот, со- соответствующей голосу человека, звук распространяется очень хо- хорошо; однако она может быть использована для формирования направленного излучения, при котором за счет более эффективной передачи появляется возможность работать с небольшими преоб- преобразователями. Труднее всего обеспечить подводную связь при высоких скоро- скоростях передачи данных на большие расстояния. Реверберация, мно- многолучевое распространение, а также сильное ослабление сигналов на высоких частотах в воде приводят к ограничению полосы про- пропускания канала связи и размытию сигналов, зависящему от рас- расстояния. Следствием этого является ограничение скорости кодиро- кодирования при передаче речи или данных в цифровых системах связи на большие расстояния. В наиболее эффективных цифровых системах связи обычно ис- используются модели канала с размытием сигнала, и реверберацион- ное размытие сигнала, зависящее от дальности, определенным об- образом учитывается при выборе как сигналов, так и структуры при- приемника. Кроме того, может учитываться и доплеровское размытие сигнала, но для обычно используемых длительностей импульсов оно намного менее существенно, чем размытие за счет ревербера- реверберации. На рис. 6.25 иллюстрируются некоторые наиболее важные осо- особенности системы подводной связи, основанной на манипуляции сдвинутых по частоте сигналов. (Во многих ситуациях, когда канал обеспечивает кратковременную фазовую стабильность, с успехом может быть применена дифференциальная фазовая манипуляция.) На рис. 6.25 иллюстрируются некоторые моменты по обработке сигналов, которые необходимо учитывать на этапе разработки си- систем подводной связи. При передаче часто бывает целесообразно применять перекодировку последовательности двоичных единиц сообщения в набор передаваемых сигналов. Это делается для того, чтобы ввести в передаваемые сигналы некоторую избыточ- избыточность, оптимизировать их различимость и обеспечить, если требу- требуется, нужную степень секретности. Для большинства используемых каналов подводной связи функция рассеяния имеет малое доплеровское размытие, но боль- большое размытие, определяемое расстоянием распространения гидро-
Обработка сигналов в гидролокации 435 Доплеровспое ^ m Кодирование ¦I переда щ сообщений 1 Акустичес- Акустический канал Предусилишлг?, регулировка усиления, формирование диаграммы Функция рассеяния I Ква&ратурная демодуляция ±2 пГи : 100 Гц, Т: 20Мс М : Z0 Узкополосная гребенчатая Взвешивание преде/лек/т/ршннй/х вьаоднь/х сигналов в соответствии с срун/гиией рассеяния (по оремени) Декодер сообщений т Энергия (по vacmome) , Рис. 6.25. Структура системы связи с частотной манипуляцией. акустического сигнала. Поэтому целесообразно строить набор сиг- сигналов на основе узкополосных элементов. Кроме того, при сильном размытии сигналов приходится вводить сдвиги по частоте, чтобы избавиться от присутствующей в канале реверберационной энер- энергии. Именно сочетание функции рассеяния и набора сигналов, оп- определяющее различимость в канале, следует оптимизировать для того, чтобы получить систему с наилучшими характеристиками. Оптимальная различимость является функцией отношения скоро- скорости передачи сигналов и пропускной способности канала. Таким образом, часто целесообразно использовать ту или иную методику адаптивного оценивания функции рассеяния канала. При приеме первичная обработка выполняется с помощью набора корреляци- корреляционных приемников (или согласованных фильтров), назначение ко- которых— получить оценки энергии, поступившей в каждый из раз- разрешаемых дальностно-доплеровских элементов. Выходные отсчеты после разрешения поступают на входы набора линий задержки с отводами. Выходные сигналы этих линий задержки взвешиваются в соответствии с тем, как разрешается по дальнрстно-доплеров- ским элементам функция рассеяния; таким образом, опять ока-
436 Глава 6 зывается целесообразным обеспечить некоторое адаптивное изме- измерение этой функции, с тем чтобы получаемое на выходе приемника распределение значений принятой энергии было оптимальным. Ес- Если характеристики многолучевого канала описаны недостаточно точно, используемые дальностно-доплеровские элементы разреше- разрешения будут неверны, что приведет, очевидно, к ухудшению характе- характеристик системы. На конечном этапе обработки выходные отсчеты разрешенных трасс взвешиваются, и выполняется операция возве- возведения в квадрат, что дает статистику, используемую для принятия решения о том, какое именно сообщение было передано; это озна- означает, что сформированные одним и тем же способом выходные сигналы, соответствующие всем возможным сообщениям, сравни- сравниваются между собой для принятия оптимального решения (с точ- точки зрения минимума вероятности ошибки). На всех этапах обработки сигналов в такой системе широко используются цифровые методы, без которых реализация этой си- системы, по-видимому, была бы невозможна. Это относится ко всей системе, начиная с согласованной фильтрации, обеспечивающей выполнение первичной обработки, и кончая сложной логикой коди- кодирования и декодирования, для которых принципиально необходима универсальность цифровых устройств. На этом закончим рассмотрение примеров построения систем активной гидролокации. Выше были описаны структуры несколь- нескольких систем, разработанных в последнее время. Наибольшее внима- внимание уделено принципам их действия, а не особенностям построения. Как и во многих других областях техники, возможности цифровой обработки в гидролокации использованы еще далеко не полностью. Однако сочетание универсальности, которая необходима для учета влияния водной среды, с такими преимуществами цифровой тех- технику как быстродействие, малые вес и потребление, а также не- небольшая стоимость, является залогом того, что в будущем подав- подавляющее большинство систем будет строиться на основе цифровой техники. 6.4. Пассивные гидролокационные системы и цифровая обработка сигналов В пассивных гидролокационных системах обязательно прихо- приходится иметь дело с оцениванием как временной, так и пространст- пространственной структур наблюдаемого поля сигналов, используя при этом в основном спектральный анализ и (или) анализ волновой вектор- векторной функции в той или иной форме. Наиболее важное применение пассивная гидролокация находит в военных системах наблюдения, предназначенных для обнаружения и сопровождения подводных лодок, поэтому подробное рассмотрение этих систем затруднитель- затруднительно ввиду секретного характера материала. Известны, правда, и другие применения пассивной гидролокации, например для изуче-
Обработка сигналов в гидролокации 437 ния подводных землетрясений или при построении некоторых нави- навигационных систем. Для приема данных в пассивной гидролокации используются самые разнообразные системы, преобразующие гидроакустические сигналы в электрические и обратно. Тип и структура этих систем -определяют, какой должна быть обработка сигналов и каковы ее возможности. На рис. 6.26 приведены некоторые системы, нашед- нашедшие применение в пассивной гидролокации. Вообще известны два класса преобразующих систем: одиночные чувствительные к уль- ультразвуку элементы и антенные решетки. Примерами одиночных чувствительных элементов служат ненаправленные или направ- направленные гидрофоны, устанавливаемые на судне, а также акустиче- акустические буи, разбрасываемые с воздуха или с корабля. К антенным решеткам относятся решетки из акустических преобразователей, смонтированные на корабле, установленные на якорях или букси- буксируемые. Одиночные чувствительные элементы позволяют выпол- выполнить временной анализ внешнего волнового поля, поэтому с ними используются только методы спектрального анализа. Антенные ре- решетки дают возможность провести как пространственный, так и временной анализ, поэтому в этом случае применяется как спект- спектральный анализ, так и анализ волновой векторной функции. Ча- " Поверхность моря Поверхность моря Подворная ' лодка Гидрофоны Антенная реше ) из гидрофонов -^ на якорях Радиоканал связи с устройством обработки Гидророн ¦ 8 * Рис. 6.26. Примеры некоторых пассивных гидролокационных систем. а - антенные решетки из гидрофонов, установленных на судне; б — антенные решетки, установленные на якорях; а-системы с акустическими буями; г - буксируемая антенная решетка.
438 Глава 6 сто, однако, эти две задачи удается разделить, выполняя некото- некоторую обработку сигналов антенной решетки (или анализ волновой векторной функции) в узкой полосе частот. Вопросы, рассматриваемые в данном разделе, указаны в табл. 6.3. Горизонтальное направление соответствует последова- последовательности изложения материала. Прежде всего рассматриваются основы теории, а также модели, используемые для представления Таблица 6.3 Вопросы, рассматриваемые в разделе, посвященном цифровой обработке сигналов в пассивных гидролокационных системах Временной анализ Пространственный анализ Теория и модели Примеры методов об- обработки и их реализа- реализации Примеры применений Спектральные пред- представления, свойства спектров сигналов пас- пассивного гидролокатора Методы спектрального анализа — косвенные (Блэкмена — Тьюки), прямые (БПФ) и адап- адаптивные Анализ микроземлетря- микроземлетрясений методами пассив- пассивной гидролокации Волновые векторные пред- представления, обработка сиг- сигналов антенной решетки, пространственная фильтра- фильтрация и формирование диа- диаграмм направленности Формирование диаграмм направленности — фиксиро- фиксированное, предварительное, адаптивное и мультиплика- мультипликативное; оценка волновой векторной функции — обыч- обычная и адаптивная Пассивные гидролокато- гидролокаторы сигналов и их обработки. Дается обзор некоторых положений спек- спектрального анализа и его использования в пассивной гидролокации. В первую очередь это касается спектрального представления и свойств типичных энергетических спектров, с которыми приходится иметь дело в гидролокации. Далее рассматриваются волновые век- векторные представления, а также алгоритмы обработки сигналов ан- антенных решеток. Волновые векторные представления обобщают понятия спектров временных рядов, а целью обработки сигналов антенной решетки являются пространственная фильтрация сигна- сигналов и формирование диаграмм направленности решеток. После этого рассматриваются некоторые методы обработки и их реали- реализация при определении спектров и волновых векторных функций. Кратко описывается несколько наиболее определившихся методов оценивания спектра временных рядов и дается обзор некоторых из разработанных в последнее время адаптивных методов. Что каса- касается пространственного анализа, то сначала рассматриваются об-
^ Обработка сигналов в гидролокации 439 депринятые методы оценивания (обнаружения) мощности сигнала как функции пеленга, или волнового вектора, а затем обсуждается несколько адаптивных методов, разработанных в последнее время. Классификация всех этих методов основана на том, используется или нет обратная связь при их конкретной реализации. В заклю- заключение очень сжато рассматриваются некоторые применения пас- пассивных гидролокационных систем. 4.4.1. Представления энергетических спектров сигналов пассивных гидролокационных систем В пассивных гидролокационных системах обычно пытаются об- обнаружить и отождествить различные источники внешнего шума в водной среде. В некоторых спектральных полосах интенсивная шумовая компонента создается кораблями, причем определенная часть ее энергии сконцентрирована в тех участках спектра, для ко- которых возможно дальнее распространение. Спектры внешнего шума обычно содержат две главные компоненты [3]. Одна из них представляет собой широкополосную компоненту в диапазоне 100—1000 Гц, обусловленную кавитацией от гребных винтов и гидродинамическими силами, действующими при движении судна. Другая компонента включает узкополосные тональные линии, со- создаваемые за счет вибрации и вращения движителя судна. Эти узкополосные компоненты часто синхронизированы между собой, поскольку они возбуждаются от одного и того же источника, хотя могут и не быть гармониками одного колебания. В результате при излучении они сдвинуты по частоте на величину, являющуюся функцией скоростей вращения, причем за счет относительного дви- движения источника и приемника могут возникнуть дополнительные доплеровские смещения частот. Тональные компоненты распреде- распределены по довольно широкой полосе, поэтому следует учесть пропор- пропорциональность доплеровских смещений частотам компонент. Часто такая тональная структура имеет вполне определенный вид, харак- характерный для каждого из типов судов из-за идентичности конструк- конструкций их силовых установок. Кроме того, тональные линии часто оказываются высокостабильными и имеют очень узкие полосы, так как их источники имеют большие размеры и вес и, следовательно, весьма инерционны. В силу именно такой структуры спектра сигналов пассивного гидролокатора выполнение спектрального анализа с высокой раз- разрешающей способностью и сопровождение тональных линий свя- связаны с большими трудностями. По этой причине начали приме- применяться адаптивные алгоритмы спектральных оценок и алгоритмы сопровождения с обратной связью, приемлемая реализация кото- которых возможна только с использованием цифровой техники. Ввиду того что в пассивных гидролокационных системах основ- основным алгоритмом является спектральный анализ, целесообразно рассмотреть наиболее существенные особенности спектрального ме-
440 Глава 6 тода представления сигналов. Энергетический спектр стационар- стационарного в широком смысле случайного процесса определяется как преобразование Фурье автокорреляционной функции процесса, т. е. со ^i2nfrx, F.23) где Rx(t)—автокорреляционная функция процесса. Автокорреля- Автокорреляционная функция и энергетический спектр определяются по мно- множеству (ансамблю) выборочных функций для некоторой принятой модели сигналов гидролокатора. Для нахождения их оценок при- приходится оперировать с наблюдаемыми данными, используя ту или иную форму усреднения по времени, причем оно может осуществ- осуществляться либо непосредственно во временной области, либо косвенно в частотной области. Далее нужно определить, сходятся ли в не- некотором вероятностном или статистическом смысле найденные вре- временные средние к средним по ансамблю, соответствующим приня- принятой модели. Фактически надо ответить на вопрос, соответствует ли используемая реальная модель эргодической гипотезе. Обычно эти вопросы не исследуются, однако ясно, что на некоторых ограни- ограниченных временных интервалах сигналы могут рассматриваться как стационарные, так что основные соотношения теории эргодичности автоматически считаются справедливыми. Наиболее важным аспектом спектральной теории применитель- применительно к пассивной гидролокации является то, что она обеспечивает некоррелированное представление сигналов. Это означает, что не- неперекрывающиеся участки спектра стационарного случайного про- процесса являются статистически независимыми, так что после преоб- преобразования в частотную область (например, с помощью алгоритма БПФ) результирующие данные будут статистически некоррелиро- ваны. Некоррелированное представление сигналов имеет важные преимущества, так как позволяет рассматривать каждый участок спектра отдельно от других и, в частности, обрабатывать их па- параллельно, не принимая во внимание эффектов взаимной корреля- корреляции между неперекрывающимися участками. При обработке сигналов в пассивных гидролокационных систе- системах часто используются также некоторые другие свойства энерге- энергетических спектров, связанные с входными и выходными сигналами линейных, инвариантных относительно времени систем. Для авто- автокорреляционных функций и энергетических спектров эти соотноше- соотношения имеют вид = j ( J ^x-t) dx, F.24a) Syif) =\H(f) 125x@, F.246) где h(t) и //(/)—:.импульсная характеристика и передаточная функция линейной системы соответственно.
Обработка сигналов в гидролокации Соотношение между спектрами является особенно важным, так -как из него следует, что спектры временных сигналов можно сфор- сформировать, пропуская широкополосный белый шум, т. е. шум с по- постоянной спектральной плотностью, через соответствующий фильтр. Следовательно, имеется еще одна возможность представления про- процесса с использованием характеристики формирующего фильтра. 6.4.2. Представления сигналов пассивной гидролокационной системы в волновой векторной форме и обработка сигналов антенной решетки При пространственной обработке сигналов полезно ввести представление, аналогичное тому, которое используется в частотной области для представления сигнала, являющегося функцией вре- времени. Для этого необходимо обобщить понятие энергетического спектра плотности мощности стационарных процессов, введя вол- волновую векторную функцию пространственно однородных процес- процессов. Определим пространственно-временную корреляционную функцию пространственного процесса следующим образом: E[X(tb гг)Х{и, 22)]=ЗД, /2; zv z2). F.25a) .Если пространственно-временная корреляционная функция зави- зависит только от разности времен и пространственного разнесения аргументов процесса, то такой процесс считают стационарным и (или) однородным. Во многих случаях акустические поля пас- , сивных гидролокаторов достаточно хорошо моделируются с ис- , пользованием предположения об их однородности в некоторой ограниченной области. Основное положение волнового векторного . представления сводится к тому, что стационарный однородный процесс может быть выражен в виде суммы некоррелированных плоских волн, распределение мощности которых описывается вол- волновой векторной функцией [70—72]. Следовательно, X(t, Z)=SX(fv)/^-v-2), F.256) /. v где E[\X(f, v)\*]~Px(f, v). Волновая векторная функция Px(f, v) определяется посредством последовательности преобразований Фурье пространственно-вре- пространственно-временной корреляционной функции. Пространственно-временная корреляционная функция, преоб- преобразованная относительно временной переменной, является взаим- взаимно-спектральной ковариационной функцией. Если эта функция найдена для всех узлов антенной решетки, то она задает взаимно- ¦ спектральную матрицу выходных сигналов антенной решетки. Эта матоииа ппелставляет собой основную хапактеоистику многих
442 Глава 6 адаптивных алгоритмов обработки сигналов антенной решетки, так как в некоторых из них используются оценки этой матрицы. Если далее выполнить преобразование также и относительно про- пространственной переменной, то в результате будет получена волно- волновая векторная функция. S*,(/; zx—z2) = = Rx(x; ъх—z2)e ' n%d% спектральная ковариационная функция, F.26a) Px(ft v)= I Sx(f; z)e dz волновая векторная функция. F.266) Все характерные черты энергетического спектра присущи и этой функции, которая играет аналогичную роль в пространственной фильтрации. Однако наиболее важной особенностью рассматри- рассматриваемого представления является то, что неперекрывающиеся об- области волновой векторной функции некоррелированы, поэтому каждая ее область может быть обработана независимо от других. Это, как правило, согласуется с физикой процессов генерации сигналов. Неперекрывающиеся области волновой векторной функ- функции соответствуют различным направлениям на источники, при- причем источники редко бывают взаимно связанными. Единственным очевидным исключением является случай, когда имеет место кор- коррелированное многолучевое распространение [73]. Так как волновая векторная функция имеет большое значение для излагаемых ниже методов обработки сигналов, то полезно описать некоторые ее свойства. Обычно текущая частота / и мо- модуль волнового вектора |v| связаны дисперсионным ограничиваю- ограничивающим соотношением, вытекающим из волнового уравнения для сре- среды, в которой распространяется сигнал [4, 5]. Часто это огра- ограничение может быть использовано для уменьшения требуемого объема обработки, поскольку некоторые области частотно-волно- частотно-волнового векторного пространства соответствуют сигналам, физи- физически не реализуемым в данных условиях распространения. Наибольший интерес представляют сигналы от точечных источ- источников, излучающих в одном направлении. В идеальном случае та- такие сигналы имеют импульсную волновую векторную функцию, и их спектральная ковариационная функция постоянна. Однако в действительности за счет микроструктуры океана и многолучево- многолучевого распространения акустических сигналов всегда наблюдается некоторое пространственное размытие импульсов. Вследствие сложной структуры водной среды пространственное размытие волнового вектора в вертикальном направлении, как правило, больше, чем в горизонтальном [37]. Для заданной текущей частоты все распространяющиеся в водной среде сигналы имеют волновую векторную Функцию с ог-
Обработка сигналов в гидролокации 443 раниченной полосой пространственных частот. Это обусловливает осциллирующий характер спектральных ковариационных функций ;[74, 75]. Во многих опубликованных работах приведены резуль- результаты измерений ковариации внешнего шума, а в настоящее время ее измерения включены в программу текущих измерений адап- адаптивных систем. Наиболее часто используется ковариационная функция изотропного шума, спектральная ковариационная функ- функция которого имеет вид sin (х)/х, где х=2п | v | Д. Поле сигналов может быть недостаточно однородным; при этом возникают такие же трудности, как и при анализе нестацио- нестационарных процессов. По-видимому, наиболее часто встречающиеся примеры неоднородности поля сигналов соответствуют случаю, когда фронт волны искривлен относительно апертуры антенной решетки и звук в виде нормальных волн распространяется в под- подводном звуковом канале. Нормальные волны играют существенную роль при распространении звука на мелководье, а также в глубо- глубоководных .районах, если сигнал f низкочастотный [124]. При этом элементы антенной решетки обычно распределяют на большом пространстве, с тем чтобы обеспечить возможно большую кривиз- кривизну относительно сферического фронта. Кривизна фронта может понадобиться для того, чтобы использовать алгоритмы фокусиров- фокусировки и измерения распределения по дальности в пассивном режиме, но неоднородность поля звуковой волны обязательно должна быть точно учтена при обработке сигналов. Теперь, после описания метода пространственного представ- представления сигналов, перейдем к рассмотрению основных вопросов об- обработки сигналов антенной решетки в пассивных гидролокацион- гидролокационных системах. Во многих ситуациях акустическая среда, а также цели и ис- источники звука могут обладать высокой направленностью, так что с успехом могут быть использованы методы пространственной фильтрации и совместной обработки сигналов антенной решетки. В простейшем виде пространственная фильтрация заключается в введении задержек на выходах преобразователей с тем, чтобы можно было учесть относительные задержки распространения сиг- сигнала для всех направлений источник — элемент, а затем просум- просуммировать результаты. Сигналы, приходящие с интересующего нас направления, суммируются когерентно (т. е. синфазно), а сигналы с других направлений — некогерентно и, следовательно, ослабля- ослабляются. Обычно, однако, используется более сложная обработка с неодинаковым взвешиванием и сдвигом фаз на выходах всех пре- преобразователей антенной решетки. Часто все эти операции в гидро- гидролокаторах выполняются адаптивно при обработке сигналов с уче- учетом получаемых данных. Два основных метода формирования ди- диаграммы направленности иллюстрируются на рис. 6.27.
Выходные сигналы гидрофонов Лредусители.дкш тры срегулируе - мым (/си/гением о/гя выравнива- выравнивания АЦП (%) Временная область Блок цифровой задержки Дискретизация в широкой полосе Адресуемое ЗУ или сдвиговые регистры Частотная область Блок учета за- затенения или взвешивания Сумма- Сумматор Цифровой фильтр Один набор весовых коэффициентов на диаграмму Детектор К системе сопровождения БП<Р блок тазового сдвига и взвешивания Один набор весовых и фазоедвигающих коэффициентов па диаграмм;/ Сумма- Сумматор Цифровой фильтр Детектор ОБПЧ3 4 -I! Рис 6 27 Основные методы формирования диаграмм направл:нности пассивных (и активных) гидролокационных систем во ' временной и частотной областях.
Обработка сигналов в гидролокации 445 В алгоритмах обработки сигналов антенных решеток, осно- основанных на представлении сигналов с помощью плоских волн, при- применяется преобразование Фурье, которое связывает весовые коэф- коэффициенты преобразователей с формой диаграммы направленности антенной решетки. Оно имеет следующий вид: Stf-'HSO,^, ¦ F-27) где Gi(f) — весовые коэффициенты для каждого из преоб- преобразователей антенной решетки, размещающихся в точках г\ (в функции частоты); $ (f; v) — отклик антенной решетки на прохо- проходящую через нее плоскую волну с волновым вектором v и часто- частотой f. Видно, что соотношение F.27) по существу представляет собой дискретное преобразование Фурье. Диаграмму направлен- направленности решетки на заданной частоте можно получить, положив мо- модуль волнового вектора равным величине, определяемой диспер- дисперсионным соотношением, которое описывает среду распростране- распространения, например открытый океан, и затем вычислив, согласно F.27), значения волнового векторного отклика при различных направле- направлениях прихода плоской волны. Изфурье-преобразования F:27) следует, что взаимосвязь меж- между физическим размером антенной решетки и шириной ее диаграм- диаграммы направленности имеет вид соотношения неопределенностей, так что чем больше размер антеиной решетки, тем уже ее диаграмма. Но на практике размеры антенной решетки ограничены. Кроме то- того, свойства среды распространения, влияющие на когерентность сигналов, накладывают ограничения на максимальные размеры ан- антенных решеток. Из вышеизложенного и того факта, что модуль волнового вектора уменьшается при увеличении частоты звука, следует необходимость применения как можно более высоких ча- частот для получения узких диаграмм направленности решеток. К сожалению, влияние среды распространения и, в частности, поглощение звука ограничивают эту возможность. Из фурье-преобразования F.27) также следует, что, подобрав весовые коэффициенты, можно получить диаграммы направленно- направленности, удовлетворяющие различным критериям. Этот метод имеет много общего с методом расчета фильтра, имеющего конечную- импульсную характеристику, особенно если антенная решетка ли- линейная, а ее элементы размещены на одинаковом расстоянии друг от друга. При синтезе диаграмм направленности решеток можно использовать ряд критериев, таких, как минимальная ширина диаграммы, определенный уровень боковых лепестков и положе- положение нулей диаграммы. Впервые антенные решетки с минимальной шириной диаграммы (совместно с процедурой оптимизации по критерию минимальной средней квадратической ошибки) были введены Притчардом в одной из ранних работ по обработке гид-
446 Глава 6 _____ ролокационных сигналов [76]. Управление уровнем боковых ле- лепестков в сущности аналогично синтезу фильтра Чебышева, при- причем методика Дольфа-Чебышева подробно описана в работах [77,3]. Так как в гидролокации часто приходится иметь дело с сильными направленными шумовыми полями [78], то особый ин- интерес представляют процедуры управления положением нулей диаграммы. Эти процедуры будут рассмотрены ниже в разделе, посвященном вопросам построения систем. На рис. 6.28 проиллю- проиллюстрировано несколько методов расчета антенных решеток, осно- основанных на различных алгоритмах обработки сигналов антенной решетки. Во многих случаях при обработке не удается охватить весь геометрический раскрыв антенной решетки. Так, согласно прост- пространственной трактовке теоремы дискретизации, максимальное раз- разнесение элементов антенной решетки составляет половину длины волны; поэтому при больших геометрических размерах решетки число преобразователей в решетке может быть настолько велико, что требуемый объем обработки превысит возможности любых процессоров. В связи с этим часто используются прореженные ан- антенные решетки. Они могут быть составлены из сконцентрирован- сконцентрированных в нескольких областях групп элементов или из отдельных эле- элементов, удаленных друг от друга на значительные расстояния. Про- Прореженные антенные решетки по сравнению с заполненными ре- решетками того же размера обеспечивают хорошее разрешение, но они имеют серьезные недостатки, проявляющиеся в высоком уров- уровне боковых лепестков. Если элементы в решетке отстоят друг от друга на одинаковых расстояниях, то лепестки диаграммы обра- образуют периодическую структуру. В противном случае возрастает средний уровень боковых лепестков, причем лепестки большой ин- интенсивности могут возникнуть в направлениях, которые трудно предсказать аналитическими методами. В общем случае проекти- проектирование таких антенных решеток является трудной задачей. Од- Однако в этом направлении проделана очень интересная работа, ос- основанная на рандомизации аргументов [14]. Несколько наиболее важных вариантов использования в гидролокационных системах антенных решеток с нерегулярно и сильно разнесенными элемен- элементами представлено на рис. 6.29. Теория обработки сигналов антенной решетки, ориентирован- ориентированной на линейное взвешивание и фазовый сдвиг выходных сигна- сигналов преобразователей, в значительной мере базируется на фурье- анализе. Этот естественный результат вытекает из представления поля сигналов с использованием плоских волн. В ряде важных применений используются также операции коррелирования выход- выходных сигналов решетки. Основная идея метода хорошо иллюстри- иллюстрируется на примере коррелятора решетки с расщепленной диа- диаграммой направленности, блок-схема которого приведена на рис. 6.30. При такой обработке сигналов антенной решетки ее преоб-
Обработка сигналов в гидролокации 447 разователи разбиваются на две группы, каждая из которых рас- рассматривается как линейная антенная решетка. Выходные сигналы двух групп коррелируются. Принцип работы этой системы заклю- заключается в том, что если в направлении главного лепестка диаграм- диаграммы имеется источник сигнала, то он будет сфокусирован каждой из групп элементов и создаст идентичные (или похожие) выход- выходные сигналы, что обеспечит высокий уровень взаимной корреля- корреляции. Напротив, если в направлении главного лепестка диаграммы энергия в сигнальном поле отсутствует, выходные сигналы будут неодинаковы и слабо коррелированы. Хотя коррелятор с расщеп- расщепленной диаграммой используется достаточно часто, мультипли- мультипликативные антенные решетки (с перемножением) практически не применялись [79, 80]. Одним из главных недостатков этого мето- метода является то, что при небольших отношениях сигнал/шум на* выходах обеих решеток операция умножения изменяет некоторые пороговые характеристики системы. Операция умножения может также вызвать появление ложных боковых лепестков, которые яв- являются по существу пространственными аналогами результатов, модуляции. При обработке сигналов антенных решеток в гидролокацион- гидролокационных системах применяется множество различных алгоритмов и систем, хотя значительная часть этих алгоритмов базируется, всего на нескольких основных идеях. Аналогичная ситуация сло- сложилась в области анализа временных функций, где также созда- создано много методов обработки сигналов, но основой большинства из них являются спектральные представления и теория линейных си- систем. Ниже будет рассмотрена возможность применения этих ме- методов при обработке сигналов антенных решеток, основанная на установлении взаимосвязи между спектральными представлени- представлениями волнового вектора и формой диаграммы направленности. Отклик антенной решетки гидролокатора на сигнал в виде- одиночной плоской волны описывается соотношением Фурье F.27). Легко показать, что отклик антенной решетки на поле сигналов общего вида может быть выражен через спектральную- ковариацию поля и весовые коэффициенты антенной решетки, следующим образом: N N <&ф= 2 2 G?(/)Sxtf; zit zJGjif). F.28> i=\ /=i Если поле сигналов является к тому же однородным, то возможно представление в волновой векторной форме, имеющей следующий, вид: j , v)dv, F.29) где Рх—волновая1 векторная функция, описывающая распределе- распределение энергии в поле сигналов; $— волновой векторный отклик
Задержки(фазирование) ~аКт\ Суммирование а ч> —^ [Пеленг) Af= f-fT Линии Задержки f 2ДГ I Усилители Гидросроны. Сумматор1 Весовые коэффициенты Дельсра-Чебышееа или Притчарда — Лельщ-Чебышев — Притчард
Временные задержки для Т Гидрофоны | (Цель) \ Дополнительные задержки Т (Помеха) Обычный (рормирова it Ait г/ииеримми о. Детектор -*- § б Разность сигналов от диаграмм (сигнал ошибки) Суммарная у диаграмма \ Разностная •диогромма Обратная связь для коррекции W Суммарная диаграмма {с нормированием) (Пеленг) Рис. 6.28. Примеры формирования диаграмм направленности в нескольких гидролокационных системах. а—антенная решетка с постоянными весовыми коэффициентами и фазированием (для управления диаграммой); б — антенная решетка с затенением (т. е. со взвешиванием); в — устройство обработки с регулированием положения нулей (взято из 1105]); г —размещение нулей для системы с расщепленной диаграммой, используемой для сопровождения.
450 Глава 6 Плоские антенные решетка п Береговая станция обработки Побережье материка S5 Радиосвязь дм переда- передачи не обработку Якорные буи на поверхности моря Гидрсхрот, погружаемые на глубину в Рис. 6.29. Примеры распределенных или сильно разнесенных систем пассивной гидролокации. а — три плоские антенные решетки, расположенные на больших расстояниях друг от друга вдоль подводной лодки (используются для измерения кривизны волнового фронта с целью определения дальности в пассивном режиме); б — неравномерно расположенные антенные решетки системы обнаружения, установленные на дне с помощью якорей; в— антенные решетки, распределенные по буям. антенной решетки. Этот результат совпадает с отношением меж- между энергетическими спектрами на входе и выходе линейных сис- систем. Наиболее очевидным и в то же время важным следствием этой формулы является то, что интенсивность сигнала на выходе си- системы обработки сигналов антенной решетки определяется тем, насколько перекрываются волновая векторная функция сигналов и волновой векторный отклик антенной решетки. Значительная часть теории обработки сигналов антенной решетки основана на
Расщепленная диаграмма Коррелятор (линия задержки) ШлеишГпЛ ^ \Итзерж-. -> л т- Тсштрация] "п л-ст • ^^' Выход левого луча диаграммы 2 /С устройству регистрации в координатах пеленг-время Выход правого луча диаграммы дг-*-„^ Рис. 6.30. Устройство корреляционной обработки сигналов антенной решетки с расщепленной диаграммой направленно- направленности.
452 1 лава 6 использовании именно этой формулы. Так, например, во многих случаях одна компонента внешнего поля акустических сигналов представляет собой мешающий шум, а другая — сигнал от источ- источника, находящегося на определенном направлении. Эффективный алгоритм обработки сигналов антенной решетки обеспечивает минимизацию отклика на шумовую составляющую путем мини- минимизации перекрытия диаграммы направленности решетки с интен- интенсивными компонентами поля шумов и в то же время сохраняет направление диаграммы на цель (т. е, на источник сигнала). Все алгоритмы, обспечивающие эту минимизацию, должны быть весь- весьма универсальными ввиду того, что оценки акустических свойств окружающей среды следует находить в реальном времени. Сом- Сомнительно, чтобы все эти алгоритмы можно было реализовать, не применяя современной цифровой техники. 6.4.3. Методы обработки, используемые при временном анализе сигналов пассивных гидролокационных систем Большая часть методов обработки, используемых при анализе временной структуры сигналов пассивных гидролокационных си- систем сводится к спектральному анализу. В настоящее время в пассивных гидролокационных системах нашли применение (либо еще находятся на стадии разработки) следующие три группы ал- алгоритмов оценивания спектров: 1) «классические» косвенные ал- алгоритмы Блэкмена и Тьюки, 2) прямые алгоритмы в частотной области (быстрое преобразование Фурье), 3) адаптивные методы, учитывающие характер поступающих данных. Реализация всех этих алгоритмов сильно зависит от возможностей цифровых средств, таких, как специализированные устройства и микропро- микропроцессоры, а также от программного обеспечения обработки сигна- сигналов, выполняемой на мини-ЦВМ. Многие из алгоритмов, разра- разработанных в последнее время, и особенно те, которые относятся к третьей группе и обеспечивают высокую разрешающую способ- способность, вообще могут быть реализованы только цифровыми сред- средствами. При использовании спектрального анализа приходится прини- принимать компромиссное решение. Так как объем данных ограничен (это может быть связано с тем, что регистратор имеет конечную емкость, или с кратковременной стационарностью сигналов), то часто не удается достичь высокого разрешения (т. е. малого сме- смещения искомых оценок) и большой точности (т. е. малой диспер- дисперсии оценок спектра). При выборе алгоритма и его параметров нужно принимать компромиссное решение с учетом ограничений, накладываемых обрабатываемыми данными. Рассмотрим теперь коротко каждую из перечисленных групп алгоритмов, не останавливаясь на первых двух, поскольку они подробно описаны в литературе, посвященной обработке сигналов.
Обработка сигналов в гидролокации 453 Представляется, что вообще наибольшее число исследований, по- посвященных адаптивным алгоритмам спектрального анализа с вы- высокой разрешающей способностью, а также их реализациям, было выполнено применительно к обработке гидролокационных сигна- сигналов. Косвенный метод Блэкмена — Тьюки основан на определении энергетического спектра [81, 82]. Совокупность операций при об- обработке этим методом представлена на рис. 6.31, а. Сначала нахо- находится оценка автокорреляционной функции анализируемого сигна- сигнала, которая затем умножается на функцию временного «окна» (весовую функцию), вводимую для того, чтобы улучшить статисти- статистическую устойчивость искомых спектральных оценок. В заключение взвешенная автокорреляционная функция преобразуется, что дает оценку энергетического спектра. Во многих случаях имеет смысл выполнить предварительное «отбеливание» данных с тем, чтобы уменьшить попадание энергии из более интенсивных участков спектра во все остальные. (Часто эта процедура является итера- итеративной, причем для синтеза отбеливающего фильтра использует- используется оценка энергетического спектра; после этого данные обрабаты- обрабатываются повторно, и алгоритм нахождения оценки энергетического спектра выполняется второй раз.) Интерес представляют две характеристики — смещение оцен- оценки и ее дисперсия. При некоторых предположениях они описыва- описываются следующими формулами: Г Д§х(/)= J Sx(f— v)W(v)dx—SJf) (смещение), F.30а) 4@= Т [ J \Щх) \2dx\ Sl(f) (дисперсия). F.306) По этим двум выражениям легко проследить хорошо известную взаимосвязь между обеими характеристиками. Смещение будет малым, если преобразование Фурье весовой функции аппроксими- аппроксимирует импульс таким образом, что спектр не размазывается за счет свертки в частотной области. Требуемая для этого длитель- длительность весовой функции должна быть большой. В то же время для получения малой дисперсии необходимо, чтобы длительность этой функции была малой, насколько это возможно. Теоретически этот алгоритм (в частности, с точки зрения вы- выбора весовой функции) рассмотрен в литературе достаточно под- подробно. Для его реализации необходимо выполнение большого ко- количества операций обработки сигналов. Отбеливающий фильтр при большом диапазоне изменений уровней спектральных компо- компонент должен подстраиваться итеративно. Возможно, что для это- этого придется использовать какой-либо из известных методов син- | теза фильтров. Основная доля всех вычислений приходится на вы-
Косвенный метод Блекмена-Тьюки Сигнал от Взвешива- Взвешивание W(t) w(t) Преобразова- Преобразование Фурье Компенсация omtie/iucan-'js; Br(f) Прямой метод (о частотной сбласг,:и) Сигнал от tugpocpona X(t) Секциониро- Секционирование и по- подавление х краям Преобразова- Преобразование Фурье Усреднение спектра S"(f) Усреднение по п секциям SJf) Рис. 6.31. а — косвенный метод спектрального анализа Блэкмена — Тыоки; 6 — прямой метод спектрального анализа в частотной области.
Обработка сигналов в гидролокации 455 Это означает, что для ускорения обработки необходимо обеспе- обеспечить быстрое выполнение операций умножения и сложения. При отсутствии соответствующей специализированной аппаратуры об- обрабатываемый сигнал жестко ограничивается, после чего рассчи- рассчитывается знаковая корреляционная функция. Можно показать, что если сигнал представляет собой гауссовский процесс, то автокор- автокорреляционная функция ограниченного сигнала равна arcsin [R(t)/R@)]; она отличается от истинной корреляционной функции, как правило, на вполне приемлемую величину. Умножение на весовую функцию является сравнительно простой операцией, а заключительное преобразование в частотную об- область осуществляется сравнительно несложно с помощью алго- алгоритма БПФ. Быстрое преобразование Фурье (т. е. прямой метод нахожде- нахождения оценки спектра) иллюстрируется на рис. 6.31,6 [83, 84]. Спектр находится сразу, так как данные преобразуются в частот- частотную область непосредственно без предварительного вычисления оценки автокорреляционной функции. Преобразование в частотную область обеспечивает такое представление сигнала, при котором фурье-компоненты оказываются некоррелированными, поэтому каждый из участков спектра может быть проанализирован от- отдельно от других. Появление алгоритма БПФ сыграло очень важ- важную роль в развитии пассивной гидролокации; в настоящее время разрабатывается много систем обработки сигналов, основанных на БПФ, в частности систем, работающих в реальном времени. Известны две группы методов нахождения спектральных оце- оценок с помощью БПФ: с секционированием и без секционирования. В большинстве пассивных гидролокационных систем использует- используется алгоритм с модифицированным секционированием. При обра- обработке без секционирования данные просто преобразуются в пери- периодограммы, а квадраты модулей коэффициентов Фурье усредня- усредняются путем вычисления в частотной области свертки спектральных оценок с некоторой весовой функцией. Усреднение обеспечивает статистическую устойчивость измерений (т. е. их малую диспер- дисперсию), хотя оно приводит к ухудшению разрешения. При обработ- обработке с секционированием данные разбиваются по секциям (блокам), которые, как правило, перекрываются. Данные в этих секциях уменьшаются к краям для понижения уровня боковых лепестков и уменьшения корреляции, возникающей за счет наложения. Да- Далее над этими секциями выполняются БПФ меньшего размера, чем при работе без секционирования, и квадраты модулей коэф- коэффициентов Фурье усредняются по секциям для каждой частоты. Если требуются более надежные измерения, можно, кроме этого, произвести также усреднение по частоте. В системах, работаю- работающих в реальном времени, данные поступают непрерывно. В ре- результате в большистве систем разбиение данных на секции про- происходит непосредственно в процессе их поступления, а затем про-
<456 Глава в изводится усреднение результатов по нескольким соседним секци- секциям. Важную роль играет выбор продолжительности интервала ус- усреднения. При использовании коротких интервалов усреднения получаемые средние значения зашумлены, а временное разреше- разрешение будет высоким; при больших интервалах усреднения средние ^значения будут иметь малую дисперсию, но могут быть искажены за счет нестационарности окружающей среды. Между смещением оценок и их дисперсией при использовании алгоритмов БПФ существует такая же взаимосвязь, как и для кос- косвенных методов. Если учесть возможные весовые функции, а так- также способы усреднения, то станет ясно, что нахождение этой взаи- взаимосвязи в общем виде затруднительно. Проиллюстрируем это для следующего сравнительно простого случая: ASX (f) = 2 WnSx (/+ ~) - 5, (f) (смещение), F.31а) о| (/) = -! S*(/)jl | Wn |» (дисперсия), F.316) где Wn — набор коэффициентов для усреднения в частотной обла- области. До введения БПФ в большинстве пассивных гидролокацион- гидролокационных систем спектральные анализаторы имели вид узкополосно- узкополосного спектрографа. Узкополосный анализатор спектра просто ска- сканировал по интересующей спектральной области и вычерчивал уровень интенсивности спектральных компонент. Затем эта про- процедура повторялась и в конечном итоге формировалась картина зависимости спектра окружающей акустической среды от време- времени. Такие системы называются низкочастотными устройствами последовательного анализа и регистрации видеограмм. При об- обнаружении и классификации кораблей с использованием таких систем исследовалась главным образом структура тональных ком- компонент. Пример видеограммы, полученной с помощью системы, по- построенной на базе мини-ЦВМ, приведен на рис. 6.32 [125]. (То- (Тональные компоненты в спектрах создаются за счет работы меха- механизмов судна.) Для увеличения частотного разрешения сигнала в участках диапазона, представляющих особый интерес, можно использовать модификацию этого вида обработки, заключающую- заключающуюся в том, что интересующий участок демодулируется в основную полосу, после чего разрешение увеличивается за счет использова- использования в спектроанализаторе более узкого фильтра и соответственно более медленной развертки. Быстрое преобразование Фурье, или прямой метод спектраль- спектрального анализа, в значительной степени вытеснило низкочастотные анализаторы последовательного типа. Стандартная система, ис- использующая алгоритм БПФ, представлена на рис. 6.33. Она вклю- включает регулируемый усилитель сигнала, аналого-цифровой преоб-
Обработка сигналов в гидролокации 457 \] секунд 7-между линиями 40дб 60 Гц 375 Ги Рис. 6.32. Спектральный анализ шумов судна на последовательных временных интервалах. Заметно присутствие устойчивых пиков, соответствующих шуму движителя. (Куртезн, Р. Синейв, SACLANT, Center, 16 усредненных результатов БПФ, разрешение 1,5 Гц.) разователь, блок БПФ и блок усреднения квадратов модулей коэффициентов Фурье. Кроме того, дополнительно может быть использован спектральный «микроскоп», в котором сигнал какого- либо участка спектра сначала демодулируется, а затем выполня- выполняется преобразование Фурье, но на большем временном интервале, чтобы увеличить частотное разрешение. Продолжительность интер- интервала усреднения выбирается с учетом взаимосвязи между вели- величиной дисперсии, необходимой для обнаружения линии, и стаци- стационарностью окружающей среды. Для любого из методов спектрального анализа, используемых в пассивной гидролокации, достижение высокого частотного раз- разрешения связано с большими трудностями. В связи с этим значи- значительное внимание было уделено адаптивным алгоритмам, обеспе- обеспечивающим высокое разрешение, которые были разработаны в по- последнее время применительно к гидролокации и некоторым дру- другим областям техники [85—87]. Хотя известно несколько таких адаптивных алгоритмов, рассмотрим только три из них, пред-
Сигнал от Подготовка сигнала, сриль иривка у силе ния, АЦП I по взвешенным ссщиям Усреднение спектра по частоте Усреднение по преобра - зеваниям Усредненный результат t —= Усредненный результат snip Выполнение на мини-ЭВМ Усреднение на коротком интер- интервале при малой постоянной вре- времени и высоком gon/iepoecKOM разрешении Дисплей Усреднение на длинном интерва- интервале для обнаружений при малых отноше- отношениях сигнал/шум Рис. 6.33. Буйковая гидролокационная система, использующая алгоритм БПФ.
Обработка сигналов в гидролокации 459 Как косвенные, так и прямые методы спектрального анализа имеют несколько недостатков. Хотя в настоящее время они срав- сравнительно просто могут быть реализованы на нескольких серийно выпускаемых специализированных системах, им свойственны силь- сильное размытие за счет высокого уровня боковых лепестков и недо- недостаточное разрешение. Детально исследованы два метода: метод максимальной энтропии (или так называемая процедура авторег- авторегрессии) и метод максимального правдоподобия; кроме них начи- начинает привлекать внимание и третий метод, разработанный Писа- ренко. Метод максимальной энтропии (ММЭ) — по-видимому, наи- наиболее популярное название процедуры нахождения оценки спект- спектра, известной также как авторегрессионный анализ спектра, ли- линейное прогнозирование, обработка с отбеливанием. Считается, что термин «энтропия» ввел Берг, но еще раньше были предпри- предприняты попытки использовать это понятие [88—90]. Известно не- несколько разновидностей рассматриваемого метода, для одной из которых применяется следующее аналитическое описание спект- спектральной оценки: ммэ (Л= ъ1% (уравнение ММЭ), F.32) PE(N)—R(O)—rTh (ошибка предсказания), т Е (!) (передаточная функция), R{N — 1)ЛТ R(&T) R (WAT) = r (нормальное уравнение). Данный метод анализа спектра можно интерпретировать как пропускание сигнала через фильтр, с помощью которого делается , попытка отбелить наблюдаемые данные. Этот фильтр имеет толь- | ко полюсы. В соответствии с соотношением энергетических спект- спектров на входе и выходе фильтра [см. формулу F.24, б)] получае- ; мая оценка спектра оказывается обратно пропорциональной квад- грату модуля передаточной функции. Известны также и некоторые другие полезные интерпретации этого алгоритма. В отбеливаю- отбеливающем фильтре выполняется операция вычисления ошибки предска- предсказания, в процессе которой находится линейная комбинация из N
460 Глава 6 предшествующих отсчетов сигнала, которая используется для предсказания текущего отсчета, а затем найденная оценка вычи- вычитается из самого отсчета, что дает величину ошибки. Можно по- показать, что для предсказывающего фильтра Л/-го порядка все от- отсчеты сигнала ошибки, разнесенные более чем на N, будут некор- релированы. При анализе временных сигналов функция ошибки предсказания используется уже давно (начиная с оригинальных работ Колмогорова); она применяется в различных областях нау- науки и техники, например при обработке сейсмических сигналов и в теории информации. Однако только цифровая техника позволи- позволила по-настоящему использовать возможности этого мощного тео- теоретического аппарата. В настоящее время известно несколько способов нахождения оценки спектра с помощью ММЭ. При использовании одного из них, как и при косвенном методе измерения спектра, находят оценку автокорреляционной функции, записывают нормальное уравнение F.32), решают это уравнение относительно импульс- импульсной характеристики фильтра, в котором формируется ошибка предсказания, а затем, применяя формулу для ММЭ, по найден- найденным коэффициентам находят искомую оценку спектра. При таком подходе получается эффективный алгоритм расчета коэффициен- коэффициентов фильтра, известный как алгоритм Винера — Левинсона, если воспользоваться теплицевой формой записи нормального уравне- уравнения. Опубликовано также несколько модификаций этого алгорит- алгоритма, разработанных для получения эффективных и сходящихся решений нормальных уравнений. Другой подход к расчету коэф- коэффициентов фильтра ошибки предсказания заключается в рекур- рекуррентном вычислении их непосредственно по поступающим данным [91]. (Этот алгоритм предложен Бергом.) Наконец, непосредст- непосредственное применение понятия энтропии приводит к еще одному ме- методу, основанному на положительно определенных обобщениях ковариационных функций [88, 91, 92]. Метод максимального правдоподобия ММП первоначально был предназначен для обработки сейсмических сигналов, а также сиг- сигналов антенных решеток в гидролокации [93, 94]. Потом он при- применялся для анализа различных временных сигналов [87], и именно это его приложение будет рассмотрено ниже. Оценка спектра методом максимального правдоподобия определяется следующим образом: 5ммп(/)= 'ад E(f) . ; Х6.33) При использовании данного метода спектрального анализа искомая оценка спектра представляет собой мощность шума
Обработка сигналов в гидролокации 461 на выходе фильтра с конечной импульсной характеристикой, ко- который синтезирован таким образом, что его характеристика имеет единичное (т. е. неискаженное) значение на интересующей нас частоте и минимальное значение на всех остальных частотах, а спектр получается просто как оценка мощности шума в зависимо- зависимости от частоты. В этом случае находится оценка корреляционной функции входных данных, формируется корреляционная матрица Теплица, которая затем обращается, и вычисляется квадратичная форма в уравнении F.33) как функция частоты. Корреляционная функция может быть найдена любым из всех упоминавшихся вы- выше методов, и в частности перемножением и сложением задержан- задержанных сигналов, перемножением и сложением задержанных жестко ограниченных сигналов, а также методами БПФ; кроме того, мо- может быть использована корреляционная функция теплицевой фор- формы в обращенном виде. Однако большую часть вычислений со- составляет вычисление квадратичной формы. Из сравнения двух описанных алгоритмов, которые иллюстри- иллюстрируются на рис. 6.34, следует несколько существенных выводов [95, 96]. ММЭ обеспечивает лучшее частотное разрешение, одна- однако в спектре появляются ложные пики, что обусловлено большим уровнем боковых лепестков. Кроме того, получаемая оценка спектра зашумлена значительно сильнее, хотя, согласно опубли- опубликованным данным, стабильность измерений в окрестности тональ- тональных пиков вполне достаточная [86]. То, что оценка спектра со- состоятельная, можно доказать ее асимптотической несмещенностью при увеличении порядка фильтра и объема данных. Однако это свойство сильно зависит от стабильности частоты дискретизации, что ограничивает возможность распространения этого метода на случай обработки сигналов антенных решеток. При использова- использовании метода максимального правдоподобия получается намного более стабильная оценка спектра со значительно меньшим уров- уровнем ложных боковых лепестков. Однако этот метод обеспечивает худшее разрешение, чем ММЭ, причем оценка получается сме- смещенной, хотя смещение можно скомпенсировать подбором коэф- коэффициента, зависящего от длины характеристики фильтра. Метод Писаренко распространен не столь широко, как методы максимального правдоподобия и максимальной энтропии [86, 97, 98]. В некотором смысле он представляет собой комбинацию ММЭ и анализа собственных функций и является обобщением спектрального анализа. По существу предпринимается попытка найти долю аддитивного белого (т. е. некоррелированного) шума в автокорреляционной функции процесса, а затем вычесть эту до- долю. Такой подход может увеличить разрешение, обеспечиваемое методом максимума энтропии, однако важно, чтобы шум не был скомпенсирован слишком сильно, поскольку это может исказить положительно определенную корреляционную функцию. Здесь де- делается попытка выявить спектральный состав модифицированной
woo 100 WgB) {20gb) (OffS) a 90% м=юоо N1=100 I \S0% 30% - м=юоо 12 3 4 5, 0 12 3 4 О 1 2 3 4,5 '¦' Ч f, Гц Рис. 6.34. Српвнение метода максимальной энтропии и метода максимального правдоподобия спектрального анализа. (За- (Задержка коррелирования равна 2,4 с.) а — истинный спектр, состоящий из трех тональных линий на фоне белого шума; б — оценка методом максимальной энтропии; в ~~- оцснка методом максимального правдоподобия (из работы [96]),
Обработка сигналов в гидролокации 463 корреляционной функции в предположении, что она соответству- соответствует сумме тональных сигналов. Следует отметить, что до того, как метод Писаренко можно будет уверенно использовать хотя бы в исследовательских целях, необходимо подвергнуть его многочис- многочисленным проверкам. На этом завершается рассмотрение методов анализа во вре- временной области, используемых в пассивных гидролокационных системах, которые, как уже упоминалось выше, фактически отра- отражают историю развития спектрального анализа. При изложении этого материала учитывались достижения нескольких областей техники; в свою очередь исследования в области пассивной гид- гидролокации вносят значительный вклад в развитие спектрального анализа. Большая часть достигнутого в этой области обусловлена возможностями, предоставляемыми цифровыми средствами, по- поскольку они обеспечивают выполнение значительного объема опе- операций обработки. Рассмотрим теперь вопросы обработки сигна- сигналов антенных решеток в системах пассивной гидролокации, кото- которые в последние годы получили наибольшее развитие. 6.4.4. Методы обработки сигналов антенных решеток при пространственном анализе в пассивных гидролокационных системах В пассивных гидролокационных системах широко используют- используются антенные решетки и пространственная обработка сигналов. Ввиду того что системы, обеспечивающие высокое разрешение, должны иметь многоэлементные антенные решетки и работать в реальном времени, особую важность приобретает эффективная, высокоскоростная обработка. В пассивных гндролокащтонных си- системах отношение сигнал/шум зачастую невелико, поэтому для обнаружения представляющих интерес узкополосных направлен- направленных сигналов необходимо обеспечить высокое разрешение как во временной, так и в пространственной областях. Требование высо- высокого разрешения означает, что должно осуществляться сканирова- сканирование по большому числу направлений и частотных полос, и имен- именно средства обработки сигналов будут определять возможность обработки в реальном времени. В пассивной гидролокации применяется ряд систем обработки сигналов антенных решеток. В разд. 6.4.2 уже были введены по- понятия формирования диаграммы направленности и взвешивания сигналов элементов решетки с целью управления положением ос- основного лепестка диаграммы и её формой. Такой подход приво- приводит к простой реализации устройства формирования диаграммы направленности решетки, обеспечивающего задерживание и сум- суммирование со взвешиванием выходных сигналов преобразователей антенной решетки. При попытке сформировать диаграмму с не- сколькнаш лепестками возникают существенные трудности, так число элементов задержки может стать слишком
464 Глава 6 большим. Эти трудности стимулировали применение сдвиговых ре- регистров, а также формирователей диаграмм с клишированием сигналов, широко известных как системы с цифровым управлени- управлением многолучевой диаграммой направленности DIMUS. За послед- последние годы важное для пассивной гидролокации значение приобре- приобрели исследования по адаптивному формированию диаграммы. К адаптивным относятся различные системы, начиная со сравни- сравнительно простых, в которых осуществляется элементарное управле- управление положением нуля, и кончая полностью адаптивными система- системами, обеспечивающими нахождение оценки коэффициентов пространственной корреляции окружающей акустической среды и использующими эту информацию для выполнения оптимальной об- обработки того или иного вида. Прежде чем перейти к рассмотрению устройств обработки сиг- сигналов антенных решеток, целесообразно выделить два вида обра- обработки. Обработка первого вида заключается в простом управле- управлении положением главного лепестка диаграммы направленности и предназначена для пространственной фильтрации сигналов типа плоских волн, приходящих с заданного направления. Обработка этого вида называется формированием диаграммы направленности и может быть адаптивной. Обработка второго вида связана с на- нахождением оценки интенсивности излучения окружающей акусти- акустической среды как функции частоты и волнового вектора (или пе- пеленга). По своему характеру обработка этого вида сводится к за- задаче оценивания параметров; во многих отношениях она близка к задаче нахождения оценки спектра. Несколько систем, предназначенных для прямого формирова- формирования диаграммы направленности с использованием операций, за- задаваемых формулой F.27), изображено на рис. 6.35. Сигналы от всех элементов задерживаются (или сдвигаются по фазе), взве- взвешиваются и суммируются. Вообще весовые коэффициенты не за- зависят от частоты, поэтому такие системы, как правило, являются широкополосными. Взвешивание выполняется с таким расчетом,, чтобы получить нужную диаграмму направленности, например, как в схеме, изображенной на рис. 6.35, б, где реализуется ком- компромиссный вариант, учитывающий требования, предъявляемые к ширине диаграммы направленности, уровню ее боковых лепестков и положению нулей. Задержки могут вводиться либо путем меха- механической перестройки антенной решетки в соответствии с выбран- выбранным направлением, либо посредством электрического управления с помощью схем задержки или фазосдвигателей. Схемы с элект- электрически управляемой задержкой могут строиться несколькими способами. Можно использовать линию задержки. Изменять ве- величину задержки со скоростью, согласованной с темпом сканиро- сканирования по пеленгу, затруднительно, поэтому разработано много специальных переключающих схем для соединения выходов ан- антенной оешетки с. узлами суммиоования взвешенных сигналов.
Обработка сигналов в гидролокации 46& Эти переключения могут осуществляться механически или элект- электрически. Можно также использовать систему с предварительно сформированными диаграммами, в которой одновременно форми- формируется несколько диаграмм направленности, причем для каждой, диаграммы, соответствующей определенному направлению, ис- используется отдельный узел суммирования. Посредством наложе- наложения диаграмм и интерполяции можно перекрыть (т. е. просмот- просмотреть) весь сектор пеленга достаточным числом диаграмм. При другом способе построения системы, основанном на обработке & частотной области, производится преобразование последователь- последовательных секций сигналов, принятых элементами решетки, в частотную область (возможно, посредством многомерного БПФ) с последу- последующим суммированием сигналов на каждой частоте с соответству- соответствующими фазовыми сдвигами и весовыми коэффициентами. После этого может быть выполнено обратное преобразование, хотя ча- часто и всю дальнейшую обработку целесообразно производить & частотной области. В последнее время разработано несколько си- систем обработки сигналов антенной решетки, в которых может быть реализован именно такой способ формирования диаграммы: направленности [99, 100]. На рис. 6.35, в показано несколько по- подобных систем, формирующих диаграмму направленности. Наиболее широко распространенными системами электриче- электрического управления диаграммой направленности антенн являются- системы с цифровым управлением многолучевой диаграммой на- направленности [101—103]. В системе этого типа линия задержки с отводами подключается к каждому элементу антенной решетки,. Подвижная пластина для срор- мироеания диаграммы направ- направленности Элементы задержки Узел сумлшрсгеаиия На Входы гидрофонов Вращающаяся контакт- контактная пластина для выбора' нужного пеленга - Устройство сопряжения- Неподвижная пластина
466 Глава 6 J. лсчеты. Линии задержки ими адресуемое ЗУ Взвешивание и сумм ирование Отсчеты входных сигналов N -то- -точечное БПФ Результата частотного преобразования 03ило ее ы одно обратное 6ITP на каждую диаграмме/ 5 Рис. 6.35. — механическое управление цилиндрической (или сферической) антенной решеткой с ис- исользованием пластины для компенсации задержки; б —управление заранее сформированной *й Й (ОрМ^" Т4НПЙ ПеГПвТКИ
бтка сигналов в гидро'лбКации 46/ так что задержка, необходимая для любого выбранного направ- направления, может быть получена путем выбора соответствующего от- отвода. Операция управления заключается в подключении к нужно- нужному отводу. Поскольку один и тот же отвод может быть использо- использован неоднократно, появляется возможность сформировать диаг- диаграмму с необходимым числом лучей и обеспечить электрическое управление ими. Кроме того, при формировании выходного сиг- мала антенной решетки у одной и той же линии задержки можно использовать сразу несколько отводов, что позволяет получить частотно-селективную решетку; правда, при прямом формирова- формировании диаграммы этот способ, как правило, не используется. При построении систем основное внимание уделяется двум вопросам; конструкции линии задержки и схемам для подключения отводов. Линии задержки часто строились на базе систем с временным сжатием на линии задержки, описанных в разд., 6.3.4. При этом используется жесткое ограничение сигналов, и при выполнении операций, обеспечивающих формирование диаграммы направлен- направленности, учитываются лишь знаки выходных сигналов антенной решетки. Проигрыш по сравнению с линейной системой формиро- формирования диаграммы зависит от акустических свойств окружающей среды. В присутствии пространственно-белого фонового шума он не превышает 2 дБ, что вполне допустимо, если учесть те возмож- возможности, которые при этом предоставляются с точки зрения форми- формирования диаграмм. Правда, сильная направленная помеха при- приводит к намного большему проигрышу, вплоть до возможного «захвата» диаграммы. Для обеспечения задержек сигналов в на- настоящее время используются недорогие синхронно-тактируемые сдвиговые регистры. Обычно работа таких систем основана на жестком ограничении сигнала, но и построение многоуровневых систем становится все более реальным. Жесткое ограничение сни- снимает проблемы, связанные с обеспечением динамического диапа- диапазона и необходимостью выравнивания уровней откликов преобра- преобразователей антенной решетки. Последнее имеет особенно важное значение для систем с подвижными платформами типа подводных лодок. Схемы подключения отводов в системах с многолучевой ди- диаграммой могут быть очень сложными, поэтому следует стремить- стремиться к эффективной организации запоминающего устройства (т. е. сдвиговых регистров). Одна из систем с цифровым управлением многолучевой диаграммой направленности, в которой для форми- формирования этой диаграммы используется простая антенная решетка, изображена на рис, 6.36. Общее число схем подключения может быть весьма значительным. Например, если используются 12 вход- входных гидрофонов и формируются 10 диаграмм, то потребуется по крайней мере 120 отдельных схем подключения. На существую- существующей элементной базе построены системы с 256-элементными ре- Щетками и 80-лучевыми диаграммами [104]. Весьма часто цилин- цилиндрические и сферические антенные решетки изготавливаются
468 Глава 6 Регистр сдвига (системы сжатия на J15 с отводами) фиАШР &р~Ш- Фильтр Ограничи. (рильтр ограничи- ограничитель — \р к ! > s I \ / / 1/ J / / Симматор (счетчики) Выход 1 ХдиаграммЫ I Выход диаграммы2 Выход "[диаграммы N Рис. 6.36. Система с цифровым управлением многолучевой диаграммой направ- направленности. таким образом, что используются только элементы и соответст- соответствующие им линии задержки, которые расположены на той сторо- стороне, куда направляется лепесток диаграммы. Системы с цифровым управлением многолучевой диаграммой направленности и подоб- подобные им находят широкое применение. Нетрудно понять, что обра- обработка сигналов в таких системах в принципе может быть выпол- выполнена только цифровыми средствами. В адаптивных системах предусматривается возможность уп- управления весовыми коэффициентами с целью минимизации влия- влияния мешающего шума. Сущность адаптивной обработки сигналов антенной решетки выражена соотношением F.29). При такой об- обработке задача сводится к тому, чтобы минимизировать степень перекрытия диаграммы направленности (или волнового векторно- ного отклика) антенной решетки с волновой векторной функцией акустического шума окружающей среды. При минимизации дол- должны быть учтены ограничения, обусловленные геометрией антен- антенной решетки и ориентацией диаграммы направленности. При не- некоторых особенностях окружающей среды, например в случае на- наличия направленных источников мешающего шума, адаптивная обработка сигналов антенной решетки может иметь определенные преимущества и значительно улучшить характеристики системы. Хотя структуры с адаптивным формированием диаграммы на- направленности весьма разнообразны, условно их можно разделить
Обработка сигналов в гидролокации, 469 на три группы. К первой относятся системы, адаптируемые опера- оператором, который имеет возможность в процессе работы управлять весовыми коэффициентами, ориентируясь на свое восприятие шу- шумового поля окружающей среды. Управление непосредственно ве- весовыми коэффициентами недостаточно эффективно, поэтому чаще всего в системах рассматриваемого типа используется некоторый управляемый параметр, в частности положение совокупности ну- нулей диаграммы. Системы второй группы состоят из двух последо- последовательно соединенных подсистем, одна из которых предназначена для нахождения оценок структуры шумов окружающей среды, например, посредством измерения входящей в формулу F.28) спектральной ковариации 5Х (f; z{, Zj) сигналов в местах располо- расположения элементов антенной решетки, а во второй выполняется ал- алгоритм оптимального формирования диаграммы направленности. Системы этой группы являются системами без обратной связи, так как результат формирования не поступает через цепь обратной связи на схему управления формированием диаграммы. Кроме того, существуют и адаптивные системы с обратной связью. В этих системах выполняется один из вариантов стохастического градиентного алгоритма, назначение которого—итеративная оп- оптимизация некоторой количественной характеристики формирова- формирования диаграммы (например, минимизация средней квадратической ошибки или мощности шума на выходе системы) с соблюдением ограничений, накладываемых геометрией антенной решетки и ори- ориентацией решетки относительно цели. В случае итеративной опти- оптимизации используется характеристика устройства формирования диаграммы направленности для адаптивного управления весовы- весовыми коэффициентами антенной решетки в соответствии с применя- применяемым стохастическим градиентным алгоритмом. При описании оптимальных устройств формирования диаграмм и адаптивных антенных решеток часто путают две операции, ко- которые следует различать: операцию формирования диаграммы направленности и операцию нахождения оценки волновой вектор- векторной функции интенсивности при заданном пеленге. В ходе вы- выполнения операции формирования диаграммы необходимо полу- получить диаграмму, ориентированную в нужном направлении и мини- минимизирующую влияние источников мешающего шума. На выходе устройства формирования диаграммы образуется колебание, по- последующая обработка которого, как правило, заключается в про- проведении спектрального анализа того или иного вида. С точки зрения выполнения операций важно различать узкополосные и широкополосные системы. При выполнении операции нахождения оценки волновой векторной функции задача сводится к измере- измерению интенсивности акустического фона окружающей среды как функции частоты или волнового вектора (т. е. направления). Сиг- Сигнал на выходе устройства оценивания является функцией именно этих параметров, а не форм колебания.
470 Глава 6 В адаптивных системах, управляемых оператором, делается попытка улучшить или оптимизировать характеристику устройст- устройства формирования диаграммы на основе совокупности параметров, причем обычно используются положение и интенсивность направ- направленных источников мешающего шума. В качестве примера систем с адаптивными антенными решетками на рис. 6.37 представлена цифровая адаптивная система подавления помех DICANNE [105, 106]. В этой системе оператор ориентирует диаграмму в направ- направлении источника мешающего шума. Затем выходной сигнал уст- устройства сформирования диаграммы используется для вычитания оценки мешающей помехи из выходных сигналов всех элементов антенной решетки. Последующая операция — обычное формиро- формирование диаграммы, ориентированной на цель. При наличии несколь- нескольких направленных источников помех система работает совершен- совершенно аналогично. Структура такой системы является оптимальной с точки зрения обработки сигналов антенной решетки в присутст- присутствии направленных помех [78]. Наибольшую трудность представ- представляют нахождение оценок положения и интенсивности источников помех, а также создание требуемого числа схем задержки, кото- которое оказывается очень большим. Предложен ряд алгоритмов с обратной связью для автоматического получения оценки положе- положения источника и его сопровождения, позволяющих оператору обеспечивать непрерывное слежение за параметрами источника. Трудности с реализацией задержек сигналов привели к созданию систем, в которых используется жесткое ограничение; эти системы строятся на основе устройств с временным сжатием на линии за- задержки или сдвиговых регистров. В1 большинстве случаев такие устройства формирования диаграммы оказываются широкополос- широкополосными, и их выходные сигналы подвергаются спектральному ана- анализу. Системы с адаптивными антенными решетками без обратной связи могут быть использованы как для формирования оптималь- оптимальных диаграмм, так и для нахождения оценок волновой векторной функции. В этих системах сначала измеряются статистические моменты второго порядка акустического поля окружающей среды (чаще всего матрица спектральной ковариации элементов антен- антенной решетки), а затем найденные оценки используются для управ- управления устройствами формирования диаграммы и измерителем. Обычно эти системы работают в частотной области, для чего выполняется фурье-преобразование отдельных групп входных данных, причем чаще всего для этого используются алгоритмы параллельного вычисления БПФ, и, следовательно, можно счи- считать, что системы рассматриваемого типа состоят из набора па- параллельных узкополосных устройств обработки. Наиболее широко при обработке сигналов адаптивной антен- антенной решетки без обратной связи используются устройство форми- формирования диаграммы направленности, обеспечивающее несмещен-
Обработка сигналов в гидролокации 471 Элементы антенной решетки ' Оценка сигналов в диаграмме а Сигналы злементов после предварительной обработки 1 I I. I -'80° 4 кГц V \ \ - > : 1 . _1_.1 1_1 1__1 L 1 1 1 1 1 М 1 1 l ' i Г ЗкГн ^ f 2 кГц Г 1пГи ( II i i i i i i i I i i i i i i i i i_ -30° 90° 180е U \>- Рис. 6.37. а —блок-схема цифровой адаптивной системы подавления помех посредством управления положением нулей; 6 — размещение нуля диаграммы для источника шума с пеленгом 0° на четырех частотах (из работы [105]).
472 Глава 6 ные, т. е. неискаженные оценки с минимальной дисперсией, а так- также пространственный вариант метода максимального правдоподо- правдоподобия для получения оценки волновой векторной функции [107 — 111]. Задача оптимизации при такой обработке формулируется следующим образом: найти оптимальный набор весовых коэффи- коэффициентов, минимизирующий дисперсию на выходе устройства ли- линейного формирования диаграммы с единичным (т. е. неискажен- неискаженным) откликом в направлении на цель, т. е. F.35) ti J где Решение этой задачи записывается следующим образом: G(f)=S?-(f)[E(f,vT)]aG(f,vT) (устройствэ формирования диаграммы), F.36а) ос № ''г) = № (f,-'r) S~ (!)Е (/. ''г)] (Дисперсия на выходе). F.366) S Видно, что в оптимальном устройстве формирования диаграммы для управления используются только матрица спектральной ко- вариации и управляемый вектор и что дисперсия на выходе сов- совпадает с выражением для оценки волновой векторной функции, найденным методом максимального правдоподобия. Соответству- Соответствующая блок-схема обработки приведена на рис. 6.38. Она включа- включает следующие три составные части: 1) накопление матрицы спектральной ковариации; 2) формирование диаграммы с использованием найденной оценки матрицы; 3) использование метода максимального правдоподобия для нахождения оценки частотной волновой векторной функции аку- акустического поля окружающей среды. Для оценки волновой векторной функции было предложено еще несколько алгоритмов. Если элементы антенной решетки имеют равномерное пространственное распределение, как это ча- часто имеет место, то можно использовать пространственный ана- аналог метода максимальной энтропии. Проводятся интенсивные ис- исследования с целью обобщения этого метода на случай линейных решеток с неравномерным расположением элементов, а также на случай решеток с элементами, распределенными в пространстве по двум или трем координатам. Можно использовать метод разложе- разложения матрицы спектральной ковариации на собственные значения—¦
Обработка сигналов в гидролокации 473 а Фильтр и АЦП се щи ям данных Нахождение оценки матрица спект- спектральной ковариа- ции в зависимости от частоты f 4 1111 аи Входы Входы гидрофонов гидродюноб 6) ОРормирователь диаграмг мы с минимальной дисперсией . Метод максимального о) правдоподобия Формирователь диаграммы Sx(f): Обращение мстрицы 4 Выход формировате- формирователя с минимальной дисперсией —' P(f;v) Оценка методом максимального правдоподобия /E(f)- вахтер фазирования сигналов решетки на частот f,v- волновой вектор Рис. 6.38. Применение адаптивных методов обработки сигналов антенной решет- решетки для нахождения оценки частотной волновой векторной функции. му, или компонентному, анализу, используемому в некоторых дру- других областях знаний. Следует учитывать, что все эти алгоритмы имеют недостатки: при неблагоприятных условиях их эффективность может резко ухудшиться. Для того чтобы достичь предельных значений коэф- коэффициента усиления антенной решетки, которые определяются ал- •оритмом и особенностями акустики окружающей среды, необхо- ,имо располагать очень точными оценками статистических харак- характеристик, точно знать расположение элементов антенной решетки и производить обработку, ориентированную на получение высоко- высокого разрешения. Вопросы снижения эффективности алгоритмов в реальных ситуациях рассмотрены в работе [ИЗ]. В системах с адаптивными антенными решетками и обратной связью для обеспечения оптимального взвешивания при формиро- формировании диаграмм используются методы стохастической аппрокси- аппроксимации, с помощью которых решается уравнение Винера — Хопфа (или эквивалентное ему уравнение). В таких системах для описа- описания устройства линейного формирования диаграммы используется решение уравнения Винера — Хопфа (т. е. нормального уравне- уравнения), причем решается это уравнение с помощью градиентного алгоритма. Средние по ансамблю в этих уравнениях заменяются на оценки, получаемые из наблюдаемых данных, после чего гра-
474 Глава 6 7-1 /1иния задержки с отводами через . единичные задержки Управляемые весовые коэсрфициенть i Адаптивный алгоритм Ошибка а -* Выход Требуемый отклик Рис. 6.39. Блок-схема адаптивного устройства обработки, использующего метод наименьших квадратов (из [114]). диентный алгоритм применяется итеративно с использованием по- получаемых оценок. Для лучшего понимания этих алгоритмов целе- целесообразно представить структуру оптимального устройства фор- формирования диаграммы в виде набора линий задержки с отводами, как показано на рис. 6.39. При таком подходе для получения оценки искомого сигнала, соответствующего, как правило, опреде- определенной ориентации главного лепестка диаграммы, выходные сиг- сигналы антенной решетки после прохождения через линии задерж- задержки с отводами собираются в специальном блоке. Полученная оценка сравнивается с моделью искомого сигнала, и ошибка оцен- оценки поступает в схему обратной связи для управления весовыми коэффициентами. В последнее десятилетие предложено несколько алгоритмов стохастической аппроксимации для управления весовыми коэффи- коэффициентами [114—119]. Первым из них был разработан алгоритм
,_ Обработка сигналов в гидролокации . 47 на основе метода наименьших квадратов; он записывается сле- следующим образом: F.37) где G(N) — весовые коэффициенты при jV-й итерации, R(N) — выходные сигналы антенной решетки при vV-й итерации, a d(N) — модель искомого сигнала. Главная отличительная особенность более ранних алгорит- алгоритмов — привлечение модели искомого сигнала. В первом варианте алгоритма для имитации приема сигнала с определенного на- направления вводился опорный тональный сигнал; во втором алго- алгоритме применялась модель управляющего вектора, соответствую- соответствующего искомому сигналу [114, 115]. В более поздних вариантах алгоритмов использована идея задания отклика устройства фор- формирования диаграммы в определенных направлениях, что по существу эквивалентно использованию варианта метода макси- максимального правдоподобия на основе алгоритма стохастической ап- аппроксимации. На рис. 6.40 дан пример адаптации диаграммы при задании ее в некоторых направлениях. Из приведенной последова- последовательности диаграмм видно, что алгоритм адаптируется к шумо- шумовому полю путем размещения нулей диаграммы в направлении на сильные мешающие помехи; при этом отклик в направлении цели имеет единичное значение. Отметим еще несколько интересных моментов, имеющих отно- отношение к системам с адаптивными антенными решетками рассма- рассматриваемого типа. Скорость адаптации сильно зависит от некото- некоторого параметра алгоритма стохастической аппроксимации. Таким параметром является глубина обратной связи по сигналу ошибки. Сверху глубина обратной связи ограничена условиями устой- устойчивости системы, но при работе в области устойчивости сильная обратная связь обеспечивает быструю адаптацию флуктуирующе- флуктуирующего характера, а слабая — адаптацию плавного характера. В ре- результате приходится находить компромиссное решение, сопостав- сопоставляя характеристики системы со стабильностью акустических свойств окружающей среды. В большинстве известных систем на выходе каждого элемента антенной решетки используется лишь по одному отво- отводу, хотя алгоритм позволяет работать с несколькими отводами и создавать частотную избирательность системы. Кроме того, необ- необходимо различать системы, работающие либо в узкой, либо в ос- основной полосах. При работе в узкой полосе выходные сигналы антенной решетки преобразуются поблочно, и на входы линий за- задержки с отводами поступают коэффициенты Фурье, соответству- соответствующие определенной полосе частот. При работе в основной полосе выходные сигналы антенной решетки демодулируются, и на входы линий задержки поступают квадратурные компоненты демодули-
476 Глава 6 7=0 Заданное направление наблюдения (Направление на синусоидальные помеха Т=150 -моХ/ т=зо Ks=-opao5 100 200 300 400 500 600 700 Время Т (а триадах частоты fg) 6 Рис. 6.40. Изменение формы диаграммы направленности при адаптации системы с обработкой сигналов антенной решетки, основанной на методе наименьших
Обработка сигналов в гидролокации 477 Для реализации рассмотренных алгоритмов обработки сигна- сигналов адаптивной антенной решетки в основном использовались универсальные мини-ЦВМ. Со стороны алгоритмов к устройствам обработки предъявляются особенно серьезные требования в отно- отношении универсальности, хотя и объем цифровой обработки дол- должен быть весьма большим. Тем не менее интерес к этим алгорит- алгоритмам все время растет, и, как было недавно сообщено [120], он» же нашли применение в радиолокационных системах с адаптив- шми антенными решетками. 6.4.5. Примеры практического применения методов обработки сигналов пассивного гидролокатора Как уже упоминалось выше, пассивные гидролокационные си- системы, и особенно новейшие, как правило, используются в воен- щх целях. По этой причине весьма непросто привести примеры действующих систем и данные измерений. В данном разделе бу- ,ут кратко описаны два примера обработки сигналов пассивного идролокатора; отметим, однако, что по этим вопросам имеется >бширная закрытая литература. К одной из наиболее распространенных действующих систем обработки сигналов относится коррелятор антенной решетки с Гавань Относительный пеленг 000° /Травй/й борщ 'ис 6 41. Запись в координатах пеленг — время выходного сигнала знакового- коррелятора (из [121]).
478 Глава 6 многолучевой диаграммой направленности, описанный в разд. 6.4.2; блок-схема этого коррелятора приведена на рис. 6.30. По- Поскольку такая система осуществляет непрерывное сканирование по пеленгу, то результатом ее работы является акустическое изо- изображение окружающей среды. Использование такого коррелятора в системе с многолучевой диаграммой иллюстрируется на рис €.41, где приведено полученное изображение [121]. С помощью Входные сигналы гадродхмов лоске активных предусили- гпелей Фильтр для подготовки сигнала Диаграмма направ- направленности антенной ' решетка Цифровой фар- мирователь многолучевой диаграммы с электрическим цпаавлением '(DIMUS) Кратковремен- Кратковременное усреднение О/Вс) Система omoS- \ражения резуль- v татов кратковременого усреднения Liv Продолжитель- Продолжительное усреднение <2) 13заранее саюрмиав- ванных диаграмм ' об выходов от наполовину перекрывающихся диаграмм It II Многолучевая диаграмма, сопровождений, по пеленгу ¦ Оценка пеленга • Оценка отношения сигнал /шум Рис. 6.42. Блок-схема устройства обработки сигналов пассивной части гидроло- гидролокационной системы Raytheon-1160 (из [68]). линий положения целей, наблюдаемых на выходном изображении, можно проследить за изменением целевой обстановки. Для полу- получения оценок дальностей и пеленгов различных целей может быть проведен совместный анализ перемещения целей и данных нави- навигационной системы одного из своих кораблей. Кроме того, можно наблюдать появление и исчезновение некоторых целей, а также ситуации, соответствующие ложной тревоге. В большинстве пассивных гидролокационных систем исполь- используется набор чувствительных элементов и устройств обработки. На рис. 6.42 изображена общая структура системы [68]. Видно, что в ней предусматриваются различные возможности для выпол- выполнения как временного, так и пространственного анализа сигналов, причем выбор способа обработки зависит от характеристик чув- чувствительных элементов и от того, какая информация необходима операторам. Большинство отдельных узлов системы уже было рас- рассмотрено в данной главе. Дополнительная обработка сигналов может быть проведена с применением универсальных мини-ЦВМ- обеспечивающих управление прохождением сигналов в системе. Несомненно, что в будущем, когда некоторые из описанных в настоящей главе алгоритмов найдут [применение в действующих системах, цифровая обработка сигналов получит еще более широ- широкое распространение.
|| Обработка сигналов в гидролокации 479 Г ,6.5. Заключительные замечания В данной главе была сделана попытка дать обзор некоторых [наиболее важных вопросов, касающихся обработки сигналов гид- гидролокационных систем. Однако не следует забывать, что устрой- устройство обработки является лишь частью всей гидролокационной системы. Описав особенности водной среды, оказывающей реша- решающее влияние на обработку сигналов, мы в то же время исклю- исключили из рассмотрения преобразователи, устройства отображения, а также работу операторов, т. е. все то, что также тесно связано с вопросами обработки сигналов. Материал главы подобран таким образом, чтобы показать ос- основные принципы обработки акустических сигналов независимо от того, в какой форме — аналоговой или цифровой — они реали- реализуются. Правда, цифровые методы обработки сигналов раньше уже достаточно широко использовались в гидролокационных си- системах, однако полный эффект от применения современной цифро- цифровой техники еще должен проявиться в будущем. Целесообраз- Целесообразность изложения основополагающих идей и моделей основана на том, что только теперь имеется цифровая техника, возможности которой достаточны для их практического использования при об- обработке сигналов. По-видимому вскоре наступит момент, когда возможности обработки сигналов будут полностью отвечать боль- большинству применений гидролокационных систем. Тогда, объединив их с быстро накапливаемыми сведениями по акустике водной сре- среды, можно будет действовать значительно эффективнее в этой среде, занимающей свыше 70% земной поверхности. ЛИТЕРАТУРА 1. Principles and Applications of Underwater Sound, Summary Tech. Rept., Div. 5, National Defense Research Council, vol. 7; 2. Present and Future Civil Uses of Underwater Sound, Committee on Under- Underwater Telecommunication, National Research Council, National Academy of Sciences, Standard Book No. 309-01771-8, Washington, D. С 3. Urick R. J., Principles of Underwater Sound for Engineers, McGraw-Hill, New York, 1967. 4. Officer С. В., Introduction to the Theory of Sound Transmission, McGraw- Hill, New York, 1958. 5. Tolstoy I., Clay С S., Ocean Acoustics: Theory and Experiment in Under- Underwater Sound, McGraw-Hill, New York, 1966. 6. Albers V. O., Underwater Acoustics Handbook, Pennsylvania State Universi- University Press, University Park, Pa., 1960. 7. VanTrees H. L., Detection, Estimation, and Modulation Theory, Part I A969), Part II A970), Part III A971), Wiley, New York. [Имеется перевод: Ван Трис Г. Теория обнаружения, оценок и модуляции. — М.: Сов. радио, 1972, т. 1; 1975, т. 2; 1977, т. 3.] 8. Wozencraft J., Jacobs I., Principles of Communication Engineering, Wiley, New York, 1965. [Имеется перевод: Возенкрафт Дж., Джекобе И. Теоре- Теоретические основы техники связи. — М.: Мир, 1969.]
480 Глава 6 9. Skolnik M., Introduction to Radar Systems, McGraw-Hill, New York, 1962. [Имеется перевод: Сколник М. Введение в технику радиолокационных си- систем.— М.: Мир, 1965.] 10. Helstrom С. W., Statistical Theory of Signal Detection, Pergamon Press, Elmsford, N. Y., 1960. [Имеется перевод: Хелстром К. Статистическая тео- теория обнаружения сигналов. — М.: ИЛ, 1963.] !1. Blackman R. В., Tukey J. W., The Measurement of Power Spectra from the Point of View of Communications Engineering, Dover, New York 1958. 12. Jenkins G. M., Watts D. G., Spectral Analysis and Its Applications, Holden- Day, San Francisco, 1968. [Имеется перевод: Дженкинс Г., Ватте Д. Спек- Спектральный анализ и его приложения (вып. 1 и 2). — М.: Мир, 1971—1972.] 33. Brillinger D. R., Time Series Data Analysis and Theory, Holt, Rinehart and Winston, New York, 1975. .14. Steinberg B. D., Principles of Aperture and Array Systems Design, Wiley — Interscience, New York, 1976. 15. VanTrees H. L, Baggeroer А. В., Array Processing, 1977. 16. Horton C. W., Sr., Signal Processing of Underwater Acoustic Waves, U. S. Government Printing Office, Washington, D. C, 1969. 37. Frosch R. A., Underwater Sound: Deep-Ocean Propagation, Science, 146, 889—893 A3 Nov. 1964). 18. Emery K- O., Uchupi E., Western North Atlantic Ocean: Topography, Rocks, Structure, Water, Life and Sediments, American Association of Petroleum Geologists Memoir 17, 1972. 19. Ewing M., Worzel J. L., Long-Range Sound Transmission, in Propagation of Sound in the Ocean, Geological Society of America Memoir 27, 1948. 20. Urick R. J., Long-Range Deep Sea Attenuation Measurements, /. Acoust. Soc. Amer., 39, 904—906 A966). :21. Steinberg J. C, Clark J. G., DeFerrari H. A., Kronencold M., Yacoub K-, Fi- Fixed System Studies of Underwater Acoustic Propagation, /. Acoust. Soc. Amer., 1521—1536 A972). 22. Booda L. L., Top Level Defence Guidance in ASW Grows, Sea Technol., 16, № 11, 16—18 A975). 23. Wenz G. M., Acoustical Ambient Noise in the Ocean: Spectra and Sources, /. Acoust. Soc. Amer., 34, 1936—1956 A962). 24. Knudsen V. O., Alford R. S., Emling J. W., Underwater Ambient Noise, /. Marine Res., 17, 416—420 A948). 25. Fox G. R., Ambient Noise Directivity Measurements, /. Acoust. Soc. Amer., 36, 1537—1540 A964). 26. Axelrod E. H., Schoomer B. A., Von Winkle W. A., Vertical Directionality of Ambient Noise in the Deep Ocean at a Site Near Bermuda, /. Acoust. Soc. Amer., 40, 205—211 A966). •27. Urick R. J., Saling D. S., Backscattering of Sound from the Deep-sea Bed, /. Acoust. Soc. Amer., 34, 158—160 A961). •28. Hastrup O. F., Digital Analysis of Acoustic Reflectivity in the Tyrrhenian Abyssal Plain, /. Acoust. Soc. Amer., 47, 181—190 A970). ¦29. Bucher H. P. et al., Reflection of Low Frequency Sonar Signals from a Smooth Ocean Bottom, /. Acoust. Soc. Amer., 37, 1037—1051 A965). 30a. Hamilton E. L., Geoacoustical Models of the Sea Floor, in Physics of Sound in Marine Sediments, L. Hampton, ed., Plenum, N. Y., 1974, pp. 181 — 223. 306. Bucher H. P., Sound Propagation Calculation Using Bottom Reflection Fun- Functions, ibid., pp. 223—240. 30b. Lonsdale P. F., Tyce R. C, Speiss F. N., Near Bottom Acoustic Observations of Abyssal Topography and Reflectivity, ibid., pp. 293—318. 30r. Bell D. L., Porter W. J., Remote Sediment Classification of Reflected Acoustic Signals, ibid., pp. 319—337.
Обработка сигналов в гидролокации 481 ЗОд. Clay С. S., Leong W. К., Acoustic Estimates of the Topography and Roughness Spectrum of the Seafloor Southwest of the Iberian Peninsula, ibid., pp. 373—446. 30e. Akal Т., Acoustical Characteristics of the Sea Floor: Experimental Techniques and Some Examples from the Mediterranean Sea, ibid., pp. 447—480. ЗОж. Goodman R. R., Robinson A, Z., Measurements of Reflectivity by Explosive Signals, ibid., pp. 537—564. 31. Eckart C, Scattering of Sound from the Sea Surface, /. Acoust. Soc. Amer., 25,566—570 A953). 32. Marsh H. W., Schulkiij M., Kneale S. G., Scattering of Underwater Sound by the Sea Surface, /. Acoust. Soc. Amer., 33, 330—334 A961). 33. Clay C. S., Medwin H.,' Dependence of Spatial and Temporal Correlation of Forward Scattered Underwater Sound on the Surface Statistics, Pt. I, Theo- Theory, Pt. II, Experiments, J. Acoust. Soc. Amer., 47, 1412—1429 A970). , 34. Dyer I., Statistics of Sound Propagation in the Ocean, /. Acoust. Soc. Amer., 48, 337-345 A970). 35. Dyson F., Munk W., Zetler В., Interpretation of Multipath Scintillation \ Eleuthera to Bermuda in Terms of Internal Waves and Tides, /. Acoust. Soc. [ Amer., 59, 1121 — 1133 A976). 36. Williams R. E., Wei С. Н., Spatial and Temporal Fluctuation of Acoustic Signals Propagated over Long Ocean Paths, J. Acoust. Soc. Amer., 56, 1299— 1309 A976). 37. Williams R. E., Wei С. Н., The Correlation of Acoustic Wavefront and Signal Time-Base Instabilities in the Ocean, /. Acoust. Soc. Amer., 59, 1310—1316 A976). 38. Brahtz J. F., ed., Ocean Engineering, Wiley, New York, 1968. 39. Woodward P. M., Probability and Information Theory, McGraw-Hill, New York, 1953. [Имеется перевод: Вудворд П. Теория вероятностей и теория информации с применениями в радиолокации. — М.: Сов. радио, 1955.] 40. Siebert W. M., A Radar Detection Philoshy, IRE Trans. Inform. Theory, IT-2, 204—221 A956). 41. VanTrees H. L., Detection Estimation and Modulation Theory, Pt. Ill, Wiley, New York, 1971. [Имеется перевод: Ван Трнс Г. Теория обнаружения, оце- оценок и модуляции. — М.: Сов. радио, 1977, т. 3.] 42. VanTrees IT. L., Optimum Signal Design and Processing for Reverberation Limited Environments, IEEE Trans. Military Electron., MIL-9, 212—229 A965). 43. Kennedy R. S., Lebow I. L., Signal Design for Dispersive Channels, IEEE Spectrum, 231—237 A964). 44a. Green P. E., Jr., Radar Measurements of Target Scattering Properties, in Radar Astronomy, J. V. Evans, T. Hagfors, eds., McGraw-Hill, New York, 1968. 446. Price R., Detectors for Radar Astronomy, pp. 547—614. 45. Westerfield E. C, Prager R. II., Stewart J. L., Processing Gains Against Re- Reverberation (Clutter) Using Matched Filters, IRE Trans. Inform. Theory, IT 6, 342—348 A960). 46. Bello P., Characterization of Randomly Time-Variant Linear Channels, IEEE Trans. Communi. Systems, CS-11, 360—393 A963). 47. Middleton D., A Statistical Theory of Reverberation and Similar First-Order Scattered Fields, Parts I and II. IEEE Trans. Inform. Theory, 1T-13, 372—414 A967). 48. Kennedy R. S., Fading Dispersive Communication Channels, Wiley, New- York,11969. 49. Kailalh Т., Measurements in Time-Variant Communication Channels, IRE Trans. Inform. Theory, IT-8, 229—236 A962). 50a. Laval R., Sound Propagation Effects on Signal Processing, in Signal Pro- Processing, J. W. R. Griffiths, P. Stocklin, С Van Schoonveld, eds., Academic
482 Глава 6 ___^ 506. Thomas R. S., Moldon J. C, Ross J. M., Shallow Water Acoustics Related to Signal Processing, ibid., pp. 281—297. 50u. Moose P. H., Signal Processing in Reverberant Environments, ibid., pp. 413— 428. 51a. Wasiljeff A., «The Influence of Time and Spase Variant Random Filters on Signal Processing», Proceeding of the NATO Advanced Study Institute on Signal Processing''with Emphasis on Underwater Acoustics, paper No Reidel Publishi hing Co., Dordrecht, The Netherlands, 1976. 516. Laval R., Some Remarks on Sound Propagation in a Variable Ocean, ibid, No. 4. 52. Spindel R. C, Schulteiss P. M., Acoustic Surface-Reflection Characterization Through Impulse Response Measurements, /. Acoust. Soc. Atner., 51, 1812— 1818 A972). 53. DeFerrari H. A., Nghiem-Phu L., Scattering Function Measurements for a 7-NM Propagation Range in the Florida Straights, /. Acoust. Soc. Atner., 56, 45—52 A974). 54. Swerling P., Probability of Detection for Fluctuating Targets, IRE Trans. Inform. Theory, IT-6, 269—308 A960). 55. Moura J. M. F., VanTrees H. L., Baggeroer А. В., Spase-Time Tracking by a Passive Observer, Proceedings of the 4th Symposium on Nonlinear Estima- Estimation Theory and Its Application, San Diego, Calif., 1973. 56. Gallop M. A., Nolte L. W., Bayesian Detection of Targets of Unknown Loca- Location, IEEE Trans. Aerospace Electron. Systems, AES-10, 429—435 A974). 57. Pryor C. N., An Adaptive Kalman Filter for Multimode Range-Doppler So- Sonar, Proceedings of the NATO Advanced Study Institute on Signal Processing with Emphasis on Underwater Acoustics, paper No. 36, Reidel Publishing Co., Dordrecht, The Netherlands, 1976. 58. Anderson V. C, Deltic Correlator, Harvard Acoust. Lab. Tech. Memo. No. 37, Jan. 5, 1956. 59. Allen W. В., Westerfield E. C, Digital Compressed-Time Correlators and Matched Filters for Active Sonar, J. Acoust. Soc. Atner., 36, 121 — 139 A964). 60. Marcum J. I., A Statistical Theory of Target Detection by Pulsed Radar, IRE Trans. Inform. Theory, IT-6, 145—267 (I960). 61. Bello P., Higgins W., The Effect of Hard Limiting on the Propabilities of Incorrect Dismissal and False Alarm at the Output of an Envelope Detector, IRE Trans. Inform. Theory, 1T-7, 60—66 A961). 62. Turin G., An Introduction to Digital Matched Fillers, Proc. IEEE, 64, 1092— 1112 A976). [Имеется перевод: Турин. Введение в теорию цифровых со- согласованных фильтров. — ТИИЭР, 1976, т. 64, № 7, с. 85—105.] 63. Kailath Т., Sampling Models for Linear Time-Variant Filters TR-352, Re- Research Laboratory of Electronics, MIT, Cambridge, Mass., May 1959. 64. Price R., Green P. E., Jr., A Communication Technique for Multipath Chan- Channels, Proc. IEEE, 46, 555—570 A958). 65. Lerner R. M., A Matched Filter Detection System for Complicated Doppler Shifted Signals, IRE Trans. Inform. Theory, IT-6, 380—385 A960). 66. Lucky R. W., Techniques for Adaptive Equalization of Digital Communication Systems, Bell System Tech. J., 255—286 A966). 67. Groginsky H. L., Wilson L. R., Middleton D., Adaptive Detection of Statisti- Statistical Signals in Noise, IEEE Trans. Inform. Theory, IT-12, 337—348 A966). 68. Skitzki P., Modern Sonar Systems, Raytheon (description of the Raytheon DE 1160 Destroyer Sonar system, частное сообщение R. Т. Karon, Raythe- Raytheon Co.). 69. Spindel R. C, Porter R. P., Marquet W. M., Durham J., A High Resolution Pulse-Doppler Underwater Acoustic Navagation System, IEEE J. Oceanic Eng., OE-1, 6—14 A976). 70. Yaglom A. M., Second Order Homogeneous Random Fields, Proceedings of the 4th Berkeley Symposium on Mathematical Statistics and Probability, 2, Б93К9П MQfin
Обработка сигналов в гидролокации 483 71. Wong E., Stochastic Processes in Information and Dynamical Systems, Ch. 7, McGraw-Hill, New York, 1971. 72. Baggeroer А. В., Space-Time Processes and Optimal Array Processing, Tech- Technical Publication 506, Navy Undersea Center, San Diego, Calif., Dec. 1976. 73. Owsley N. L., Adaptive Space-Time Processor Performance Considerations Proceedings of the NATO Advanced Study Institute on Signal Processing with Emphasis on Underwater Acoustics, paper No. 42, Reidel Publishing Co., Dordrecht, The Netherlands, 1976. 74. Cron B. F., Sherman С. Н., Spatial Correlation Functions for Various Noise Models, J.Acoust. Soc. Amer. 34, 1732—1742 A962). 75. Cox H., Spatial Correlation in Arbitrary Noise Fields with Application to Am bient Siea Noise, /. Acoust. Soc. Amer., 54, 1289—1301 A973). 76. Pritchard R. L., Optimum Directivity Patterns for Linear Point Arrays, /. Acoust. Soc. Amer., 25, 879—890 A953). 77. Dolph C. L., A Current Distribution of Broadside Arrays Which Optimizes the Relationship Between Beamwidth and Side-lobe Level, Proc. Inst. Radio Engr., 34,335—356 A946). 78. Anderson V. C, DICANNE, A Realizable Adaptive Process, /. Acoust, Soc. Amer., 45, 398—405 A969). 79. Berman A., Clay С S., Theory of Time-Average Product Arrays, J. Acoust. Soc. Amer., 29, 805—820 A957). 80. Fakley D. C, Time Averaged Product Array, J. Acoust. Soc. Amer., 31, 1307— 1310 A959). 81. Hannan E. J., Time Series Analysis, Methuen, London, 1961. [Имеется пере- перевод: Хеннан Э. Анализ временных рядов. — М.: Наука, 1964.] 82. Bendat J. S., Piersol A., Measurement and Analysis of Random Data, Wiley, New York, 1966; 1973. [Имеется перевод: Бендат Дж., Пирсол А. Измере- Измерение и анализ случайных процессов. — М.: Мир, 1971.] 83. Welch P. D., The Use of the Fast Fourier Transform for Estimation of Spectra: A Method Based Upon Averaging over Short, Modified Perio- dograms, IEEE Trans. Electroacoust., AU-15, 70—76 A967). . 84. Cooley J. W., Lewis P. A. W., Welch P. D., Historical Notes on the Fast Fourier Transform, IEEE Trans. Electroacoust., AU-15, 76—79 A967). 85. Frost O. L., Ill, Power Spectrum Estimation, Proceedings of the NATO Advanced Study Institute on Signal Processing with Emphasis on Under- Underwater Acoustics, paper No. 7, Reidel Publishing Co., Dordrecht, The Nether- Netherlands, 1976. 86. Lacoss R. Т., Data Adaptive Spectral Analysis Methods, Geophysics, 36, 661—675 A971). 87. Ulrych T. J., Bishop T. N., Maximum Entropy Spectral Analysis and Auto- repressive Decomposition, Reviews of Geophysics and Space Physics, 13, 1—19 A975). 88. Burg J. P., Maximum Entropy Spectral Analysis, presented at the 37th Meeting of the Society of Exploration Geophysicists, Oklahoma City, Okla., 1967. 89. Parzen E., Multiple Time Series Modelling, Multivariate Analysis, P. Krish- naiah, ed., Academic Press, New York, 1970, pp. 389—407. 90. Akaike H., Power Spectrum Estimation Through Autoregressive Model Fitting, Ann. Inst. Statist. Math. Tokyo, 1969, pp. 407—419. 91. Claerbout J., Fundamentals of Geophysical Data Processing, McGraw-Hill, New York, 1976. 92. Pusey L. C, The Role of the Stationarity Equation in Spectral Analysis and Wave Propagation, Ph. D. Thesis, MIT, Cambridge, Mass., 1976. 93. Capon J., High Resolution Frequency Wavenumber Spectral Analysis, Proc. IEEE, 57, 1408—1418 A969). [Имеется перевод: Кейпон Д. Пространствен- Пространственный и временной спектральный анализ с высоким разрешением. — ТИИЭР, 1969, т. 57, № 8, с. 69—79.] 94. Edelbute D. J., Fisk J. M., Kinnison G. L, Criteria for Optimum Signal De- Detection Theory for Arrays, /. Acoust. Soc. Amer., 41, 199—205 A967).
484 Глава 6 95. Capon ,1., Goodman N. R., Probability Distributions for Estimators of Frequen- Frequency Wave Number Spectra, Proc. IEEE, 58, 1785—1786 A970). ([Имеется пере- перевод: Кенпон Д., Гудмен Н„ Распределения вероятности оценок простран- пространственно-временного спектра. — ТИИЭР, 1970, 58, № 11, с. 81.| 96. Baggeroer А. В.. Confidence Intervals for Regression (MEM) Spectral Esti- Estimators, IEEE Trans. Inform. Theory, IT-22, 534—545 A976). 97. Brillinger D. R., Fourier Analysis of Stationary Processes, Proc. IEEE, 62, 1628—1642 A974). [Имеется перевод: Бриллинджер Д. Фурье-анализ ста- стационарных процессов.— ТИИЭР, 1974, т. 62, № 12, с. 15—33.] 98. Pisarenko V. «On the Estimation of Spectra by Means of Nonlinear Functions on the Covariance Matrix», Geophys. J. Roy. Astron Soc, vol 28 1972 pp. П11-531. 99. Texas Instruments, Л Description of the Array Transform Processor, Austin, Tex. 100. SPS —42, Users Manual, Signal Processing Systems, Waltham, Mass. 1974. 101. Anderson V. C, Digital Array Phasing, J. Acoust. Soc. Airier., 32, 867—870 A950). 102. Anderson V. С Rudnick P., Small Signal Detection with the D1MUS Array, /. Acoust. Soc. Amer., 32, 871—877 A960). 103. Remley W. R., Some Effects of Clipping in Array Processing, /. Acoust. Soc. Amer., 39, 702—707 A966). 104. Anderson V. C, Current Major .Projects of the Marine Physical Laboratory, by MPL Staff, Scripps Institute of Oceanography, San Diego, Calif., 1975. 105. Anderson V. C, DICANNE, A Realizable Adaptive Process, /. Acoust. Soc. Amer., 45, 398—405 A965). 106. Anderson V. C, Rudnick P., Rejection of a Coherent Arrival at an Array, /. Acoust. Soc. Amer., 45, 406—410 A969). 107. Bryn F., Optimum Signal Processing of Three Dimensional Arrays Operating on Gaussian Signals and Noise, /. Acoust. Soc. Amer., 34, 289—297 A962). 108. Mermoz H., Matched Filters and Optimum Use of an Array, Proceedings of the NATO Advanced Study Institute on Signal Processing with Emphasis on Underwater Acoustics, Grenoble, France, Sept. 1964. 109. Middleton D., Groginsky H., Detection of Acoustic Signals by Receivers with Distributed Elements, J.' Acoust. Soc. Amer., 38, 727—737 A965). 110. Lewis J. В., Schulteiis P., Optimum and Conventional Detection Using a Li- Linear Array. J. Acoust. Soc. Amer., 49, 1083—1091 A971). 111. VanTrees II. L., A Unified Approach to Optimum Array Processing, Pro- Proceedings of the 1966 Hawaii Symposium on Signal Processing. 112. Owsley N. L., A Recent Trend in Adaptive Spatial Processing for Sensor Arrays: Constrained Adaption, in Signal Processing, Academic Press, New York, 1973. 113. Cox IT., Resolving Power and Sensitivity to Mismatch of Optimum Array Processors, J. Acoust. Soc. Amer., 54, 771—780 A973). 114. Widrow В., Mantey P., Griffiths L., Goode В., Adaptive Antenna Systems, Proc. IEEE, 55, 2143—2159 A967). [Имеется перевод: Уидроу Б., Ман- тей П., Гриффите Л., Гуд Б. Адаптивные антенные системы. — ТИИЭР, 1967, т. 55, № 12, с. 78—95.] 115. Griffiths L. J., A Simple Algorithm for Real-Time Processing in Antenna Arrays, Proc. IEEE, 57, 1696—1704 A969). [Имеется перевод: Гриффите Л. Простой адаптивный алгоритм для обработки сигналов антенных решеток в реальном времени. — ТИИЭР, 1969, т. 57, № 10, с. 6—15.] 116. Frost О. L., Ill, An Algorithm for Linearly Constrained Adaptive Array Pro- Processing, Proc. IEEE, 60, 926—935 A972). 117. Chang J. H., Tuteur F. В., A New Class of Adaptiver Processors, /. Acoust. Soc. Amer., 49, 639—649. 118. Lacoss R. Т., Adaptive Combining of Wideband Array Data for Optimal Re- Reception, IEEE Trans. Geoscience Electron., GE-6, 78—86 A968).
Обработка сигналов в гидролокации 485 119. Applebaum S. P., Adaptive Arrays, Syracuse University Research Corp., Rept. SPL TR 66—1, 1966. 120. Gabriel W. F., Adaptive Arrays, An Introduction, Proc. IEEE, 64, 239—271 A976). [Имеется перевод: Гейбриел У. Введение в теорию адаптивных ан- антенных решеток. — ТИИЭР, 1976, т. 64, № 2, с. 55—88.] 121. Winder A. A., Sonar System Technology, IEEE Trans. Sonics Ultrasonics, SU-22, 291—329 A975). 122. Dyer I., Class notes for subject 13.85, Fundamentals of Underwater Acoustics, Mass. Inst. of Tech. 123. Farr H. K-, BO'SUN, A High Resolution Automatic Charting System for the Continental Shelf, Proc. of the IEEE OCEAN, 74 Conference, pp. 10—14, 1974. 124. Clay С S., Waveguides, Arrays, and Filters, Geophysics, 31, 501-505 A966). 125. Seynave R., SACLANT ASW Center, La Spezia, Italy, частное сообщение. 32—3E9
Глава 7 ЦИФРОВАЯ ОБРАБОТКА СИГНАЛОВ В ГЕОФИЗИКЕ Е. Робинсон, С. Трейтел1) 7.1. Введение В разведочной геофизике решаются две задачи: I)поиск новых месторождений нефти и минерального сырья и 2) разработка новых методов поиска. Прогресс в решении одной из задач зави- зависит от успехов в решении другой. Обмен идеями и взаимосвязи, необходимые для достижения успеха, зависят от создания и внед- внедрения достаточно гибких и универсальных научных моделей, по- позволяющих перебросить мост между этими двумя задачами. Гео- Геофизики, работающие и в поле, и в управлениях, и в научных лабораториях, имеют общие цели, поэтому каждому из них необхо- необходимо иметь широкую научную программу, являющуюся руковод- руководством в работе, и в то же время достаточную свободу и возмож- возможность развивать свою изобретательность и научное воображение. Рассмотрим некоторые основные понятия, связанные с постро- построением моделей. Во-первых, модель является представлением че- чего-то. Как правило, в -этом представлении отбрасываются детали, которые в рамках дальнейшего применения модели представля- представляются несущественными. Предполагается, что геофизические моде- модели описывают какие-то важные особенности нашей планеты. Од- Однако преимущество моделей состоит в том, что их проще изменять и изучать и, кроме того, они дают возможность лучше разобраться в строении Земли. Очевидно, что целью построения моделей не может быть точное копирование реальной планеты. В общем мо- модели являются (или должны быть) полезным заменителем того, что ими моделируется. Если между параметрами Земли и соответствующими парамет- параметрами модели существует определенная зависимость, то модель можно использовать для анализа фактических материалов о Земле и для решения геофизических и геологических задач. Модели можно описывать словами, графически, с помощью ма- математических функций и уравнений или изготавливать в виде фи- физических аналогов. Они также могут быть выполнены в форме программ для вычислительных машин. Одни виды моделей могут ') Е. A. Robinson, 100 Autumn Lane Lincoln, Mass. 01773, S. Treitel,.Amoco Production Company Tulsa, Okla, 74102.
Применение ЦОС в геофизике 487 оказаться более удобными, чем другие. Однако большинство моде- моделей можно представить в нескольких формах. Обзор моделей, представляющих интерес для геофизиков, сделан в работе Вуда и Трейтела [1]. В геофизике необходимо иметь несколько вариантов одной и той же модели, различающихся уровнем сложности. Модельный подход является гибким, и поэтому можно построить множество типов моделей. Модели самого высокого уровня, предназначенные как для геологии, так и для геофизики, должны быть связаны между собой. В моделях промежуточного уровня должны быть учтены все важные геофизические параметры с тем, чтобы геофи- геофизик имел возможность экспериментировать с моделью и приспо- приспосабливать ее к конкретным полевым условиям. На самом нижнем уровне модели должны опираться на прочную математическую и физическую базу, чтобы получаемые выводы имели строгое обос- обоснование. Создание моделей по существу является систематизированным объединением теоретических и эмпирических сведений в одну общую структуру. Важно различать, с одной стороны, гипотети- гипотетические предположения, составляющие теоретическую часть моде- модели, и, с другой стороны, эмпирические данные, которые модель должна объяснить. Эмпирические данные используются при пост- построении модели различным образом: на ранних этапах для накоп- накопления опыта и наблюдений независимо от того, построена экспе- экспериментальная модель или нет, на более поздних этапах для оцен- оценки параметров модели по результатам наблюдений и проверки согласия теоретической модели с эмпирическими результатами. Поисковое направление геофизики представляет собой раздел науки, где выполняются эмпирические исследования. В частности, партию, занимающуюся поисками нефти сейсмическими методами, можно считать научной группой, проводящей экспериментальное исследование структуры осадочных слоев. С другой стороны, ис- исследовательские геофизические работы имеют более теоретический характер. Экспериментальные и теоретические исследования (или поиск и исследования) до некоторой степени независимо вносят вклад в развитие геофизики. В некоторых задачах теоретические исследования оказываются впереди экспериментальных, а в дру- других — наоборот. Иначе говоря, теоретический подход не всегда имеет преимущество перед экспериментальным. Однако, когда нужно сообщить новые результаты исследований или представить обзорный материал в статьях и учебниках, часто бывает целесо- целесообразно сначала привести теоретические положения и только по- потом переходить к экспериментальным данным. Такая последова- последовательность может не отражать порядок событий, особенно в гео- геофизике, где экспериментальное развитие метода сейсморазведки в 20-х годах во многом опередило соответствующие теоретические
4fc8 Глава 7 ; 7.2. Метод прогнозирующей инверсной свертки Применение метода прогнозирующей инверсной свертки1) для обработки сейсмограмм [2, 3] является примером весьма успешного использования математического аппарата теории связи при реше- решении геофизических задач. В основу метода положено предполо- предположение о том, что сигналы, записанные на сейсмограммах, являют- являются статистическими функциями с минимальной задержкой; этот метод нашел широкое применение также в других областях тех- техники, как, например, при обработке речевых сигналов. Поэтому глава начинается с описания соответствующих теоретических по- положений. Существуют два основных подхода к обработке сейсмической информации: детерминистский и статистический. Детерминистский подход связан с созданием математических и физических моделей слоистой Земли, позволяющих лучше понять особенности распро- распространения сейсмических волн. В этих моделях отсутствуют слу- случайные факторы, и они являются совершенно детерминированны- детерминированными. Статистический подход связан с построением сейсмических моделей, содержащих элементы, влияющие на сейсмический сиг- сигнал случайным образом. Например, в статистической модели, ко- которая будет рассмотрена ниже, предполагается, что глубина за- залегания отражающих слоев и коэффициенты отражения сейсми- сейсмических волн от них имеют случайные распределения. Применение статистического подхода в сейсмической геофизике обусловлено главным образом тем, что приходится обрабатывать очень боль- большой объем информации; любые данные, когда их достаточно мно- много, приобретают статистический характер, если даже каждый из элементов сам по себе не является случайным. Модель, для которой применим метод прогнозирующей инверс- инверсной свертки, является статистической. Она опирается на две ос- основные гипотезы: 1) статистическую гипотезу, согласно которой амплитуды и моменты прихода сейсмических импульсов являются случайными величинами; 2) детерминистскую гипотезу, согласно которой сейсмический сигнал имеет минимальную задержку. Су- Существуют различные способы проверки соответствия модели ре- реальным физическим условиям. Метод прогнозирующей инверсной свертки оказался полезным во многих случаях при обработке результатов наземных и осо- особенно морских сейсмических измерений, когда сейсмические сиг- сигналы испытывали реверберацию, т. е. многократные отражения. Успешное применение данного метода показывает, что гипотезы ]) Прогнозирующая инверсная свертка (predictive deconvolution) означает свертку записи сигнала, полученного на выходе некоторого искажающего устрой- устройства (фильтра), с оператором, обратным к характеристике фильтра, т. е. с опера- оператором ошибки предсказания. В дальнейшем в этой главе иногда эта операция
Применение ЦОС в геофизике 489 о случайности событий и минимальности задержки оказываются справедливыми для широкого круга природных условий. Обозначим принимаемый сейсмический сигнал1' через %t (предполагается, что аппаратурные искажения, вносимые запи- записывающим устройством в %t, скорректированы с помощью неко- некоторого восстанавливающего фильтра). Принятый сейсмический сигнал Xt образован из многих глубинных отражений, каждое из которых создает последовательность импульсов bt. Однако все эти последовательности импульсов взаимно перекрываются в той или иной степени, и поэтому невозможно определить прямыми измерениями форму импульса bt. Как будет показано ниже, тот факт, что bt является сигналом с минимальной задержкой, поз- позволяет провести измерение его формы косвенными методами. Метод прогнозирующей инверсной свертки основан на следу- ющей статистической модели. Принятый сейсмический сигнал Xt (из которого выбран соответствующий участок путем селекции по времени) рассматривается как результат свертки колебания bt со случайной импульсной последовательностью %t, т. е. Xt = bt*et. Импульсная последовательность е* описывает процесс отражения от глубинных слоев в том смысле, что положение импульса на временной оси определяет время прихода отраженного сигнала, а амплитуда импульса представляет значение коэффициента отра- отражения. При обработке информации эту последовательность им- импульсов е< можно считать случайной и некоррелированной (т. е. белым шумом). Поэтому автокорреляционная функция принятого сейсмического сигнала Xt совпадает с автокорреляционной функ- функцией колебания bt с точностью до постоянного масштабного мно- множителя. Этот множитель не будет влиять на конечные результаты, и поэтому его можно не учитывать. Таким образом, автокорреля- автокорреляционную функцию колебания bt можно определить на основе при- принятой сеисмотрассы xt. Коэффициенты автокорреляции cpj вычисляются из отсчетов xt по формуле где суммирование проводится по всем временным индексам i, со- соответствующим выбранному участку записи. Поскольку q>_/=<p/, достаточно вычислить коэффициенты автокорреляции только для положительных значений индекса сдвига /. Часто бывает полезно умножить коэффициенты автокорреля- автокорреляционной последовательности на некоторый набор уменьшающихся ической тоассой.—-Прим. перев.
490 Глава 7 по величине весовых множителей Wj с тем, чтобы получить взве- взвешенные автокорреляционные коэффициенты Типичным набором весовых множителей являются весовые ко- коэффициенты, убывающие по закону 1—4г при |/ [=0,1,2,3 ,N, 0 при | Л = 1 Здесь N — значение временного индекса, на котором обрезается автокорреляционная последовательность; значение N должно быть задано отдельно. С помощью автокорреляционной функции можно найти для колебания bt оператор предсказания. Поскольку колебание bt имеет минимальную задержку, оператор предсказания с интерва- интервалом предсказания а будет предсказывать форму колебания на « единиц времени вперед. Таким образом, оператор предсказыва- предсказывает форму «хвоста» колебания от момента а и далее. (Это будет не так, если колебание не обладает свойством минимальной за- задержки; для иллюстрации этого принципа см. работу [4], стр. '90—91.) Задерживая предсказанное колебание на а единиц вре- времени, можно сопоставить его с соответствующим участком колеба- колебания bt; вычитая задержанный предсказанный «хвост» из колеба- колебания bt, получают ошибку предсказания. Поскольку задержанный предсказанный «хвост» гасит концевой участок колебания bt, •ошибка предсказания'будет представлять собой начальный уча- участок колебания bt. В силу этого оператор ошибки предсказания устраняет концевой участок колебания bt. Обозначим коэффици- коэффициенты оператора предсказания для моментов ^ = 0, 1,2,...,пг через ko, ki, ki, ..., km соответственно. Существуют различные методы определения коэффициентов этого оператора; при численных расчетах некоторые преимущест- преимущества имеет гауссовский метод наименьших квадратов. Согласно методу наименьших квадратов, оператор предсказания определя- определяется из условия получения наименьшей средней квадратической ошибки предсказания. Процесс минимизации приводит к системе линейных уравнений, называемых нормальными уравнениями, где фигурируют коэффициенты автокорреляции, которые были вычис- вычислены выше и считаются известными, и коэффициенты оператора предсказания, которые являются искомыми величинами. Нормаль- Нормальные уравнения имеют вид +V+ • • • +kmrm=--ra, karm-\-k,rm_t-\-k»rm_a4- . . . 4-&_/•„ = /
Применение ЦОС в геофизике 491 В этой системе уравнений положительное целое число а обозна- обозначает интервал предсказания; необходимо задать какое-то значе- значение а. Эти уравнения можно решить с помощью эффективной рекур- рекуррентной процедуры, предложенной Левинсоном [5]. Машинное время, необходимое для определения т коэффициентов цифрового фильтра с помощью этой процедуры, пропорционально т2, тогда как для обычных методов решения систем уравнений оно пропор- пропорционально т3. Еще одно достоинство указанного рекуррентного метода состоит в том, что для него требуется объем памяти, про- пропорциональный т, а не т2, как при обычных методах. Упрощенное описание рекуррентного метода, достаточное для составления ма- машинных программ, можно найти в статье [6]; оно также приведе- приведено в разд. 7.6 данной главы. Если коэффициенты k0, k\, k2, .-., km оператора предсказания вычислены, то фактически становятся известными и коэффици- коэффициенты оператора ошибки предсказания, поскольку при интервале предсказания а эти коэффициенты для моментов / = 0, 1,2,.,., а—1, а, а+1, а + 2, ..., а + т равны 1, 0, 0, ..., О, — k0, —k\, —k2, ..., —km со- соответственно. Обратный оператор, необходимый для инверсной фильтрации сейсмотрассы Xt, совпадает с оператором ошибки предсказания. Поскольку такой оператор линеен, им можно воз- воздействовать на принятый сейсмический сигнал xt = bt*ti, представ-" ляющий собой множество перекрывающихся колебаний, по форме повторяющих bt, причем их моменты прихода и амплитуды опре- определяются импульсной последовательностью е<. В результате подав- подавляются концевые участки всех колебаний bt, но сохраняются без изменения начальные участки и тем самым повышается разреша- разрешающая способность сейсмического метода. Если требуется получить более высокое разрешение, то интервалы предсказания можно уменьшить, что приведет к еще большей концентрации энергии колебания. Затем вычисляется свертка импульсной характеристики опе- оператора ошибки предсказания с сейсмическим сигналом Хи Вы- Вычисления проводятся по формуле дискретной свертки t/l=Xi K0X[^a k^Xi—а—i K^Xi—a—2 ¦ • • KmXi—a—nf В результате получается последовательность уь представляющая ошибку предсказания (при интервале предсказания а), или сей- сейсмический сигнал без переотражений. В частном случае, когда интервал предсказания а выбран равным единице, оператор ошибки предсказания, полученный с помощью метода наименьших квадратов, является обратным к колебанию (с минимальной задержкой) bt, а ошибка предсказа- предсказания совпадает со случайной последовательностью импульсов et (т. е. с последовательностью импульсов, определяемой моментами
492 Глава 7 _ прихода и коэффициентами отражения сигналов, отраженных от глубинных слоев) [3]. Точность описанного выше метода ограничивается случай- случайными ошибками, зависящими от помех, приближений в процессе вычислений, конечности анализируемой реализации сигнала Xt и ограничений, налагаемых моделью. Как уже отмечалось, успех применения описываемого метода определяется в основном спра- справедливостью основных гипотез о колебании bt (оно должно иметь минимальную задержку) и о случайном характере импульсной последовательности et. Достоинство метода предсказания состоит в том, что единственной информацией, необходимой для выполне- выполнения прогнозирующей инверсной свертки, является запись приня- принятого сейсмического сигнала. Для сглаживания полученной ошибки предсказания можно применить дополнительную фильтрацию. Этим дополнительным фильтром может служить какой-либо цифровой полосовой фильтр или же цифровой формирующий фильтр (см. разд. 7.5). Можно поступить по-другому, а именно объединить фильтр, предсказыва- предсказывающий ошибку, с дополнительным фильтром, а затем через полу- полученную комбинацию фильтров пропускать принятую сейсмотрас- су. В обоих случаях получится сглаженная сейсмотрасса, не со- содержащая реверберации (многократных отражений). 7.3. Метод динамической инверсной свертки При обработке сейсмотрасс методом прогнозирующей обрат- обратной свертки, который описан в предыдущем разделе, о слоистой структуре Земли делаются самые минимальные предположения. Однако иногда необходимо ввести явные количественные соотно- соотношения между коэффициентами отражения и пропускания, описы- описывающими слоистую среду, и особенностями идеальной сейсмотрас- сы, которая получается при зондировании в этой среде. Метод ре- решения задачи инверсной свертки в сейсморазведке, основанный на более детальном учете параметров слоистой структуры, называет- называется динамической инверсной сверткой (dinamie decovolution). В этом методе сейсмотрасса анализируется целиком, включая все первичные и повторные отражения, с тем, чтобы определить структуру подземных слоев. Рассмотрим плоскую волну, распро- распространяющуюся в вертикальном направлении через горизонтально- слоистую структуру, которая заключена между коренными поро- породами фундамента и воздухом. Потерями энергии будем пренебре- пренебрегать, т. е. будем полагать, что слоистая структура является иде- идеальной системой, в которой отсутствует поглощение энергии внутри слоев, а энергетические потери определяются только прохож- прохождением волны в фундамент и отражением ее в воздух. Слоистая система приводит к частотно-зависимому разделению энергии, подводимой с поверхности Земли, на энергию, уносимую прохо-
__ Применение ЦОС в геофизике 493 дящей в фундамент волной, и энергию, которая отражается ог слоев Земли в воздух. Таким образом, энергия единичного зон- зондирующего импульса, распространяющегося внутрь с поверхности Земли, разделяется на энергию волны, пропускаемой слоистой структурой в фундамент, и энергию волны, отражаемой системой слоев в воздух. Отраженная волна и является сейсмическим сиг- сигналом, который вызывается зондирующим единичным импульсом. С помощью измерений, проводимых на поверхности Земли, можно вычислить энергетический спектр зондирующего сигнала, кото- который предполагается равным единице на всех частотах, и энерге- энергетический спектр отрал-сенной волны, совпадающий со спектром сейсмотрассы. Но по закону сохранения энергии энергетиче- энергетический спектр зондирующего импульса равен сумме энергетических спектров прошедшей и отраженной волн. Итак, можно определить энергетический спектр прошедшей волны как разность энергетиче- энергетических спектров зондирующего импульса и отраженной волны. Слоистая система, формирующая проходящую волну, ведет се- себя как система с обратной связью, и поэтому проходящая волна является колебанием с минимальной задержкой. Таким образом, зная энергетический спектр проходящей волны, можно определить вид оператора ошибки предсказания, который сжимает проходя- проходящую волну в импульс. Слоистая структура при формировании от- отраженной волны, т. е. наблюдаемого сейсмического сигнала, дейст- действует как система, содержащая компоненты со связями назад к вперед. Более того, компонента, определяющая обратную связь, ¦ в точности совпадает с системой с обратной связью, формирующей «проходящую волну. Поэтому инверсную фильтрацию наблюдаемо- наблюдаемого сейсмического сигнала можно провести с помощью вышеупомя- вышеупомянутого оператора ошибки предсказания; в результате инверсной фильтрации остается колебание, определяемое только компонентой со связью вперед. Структура этой компоненты и определяет иско- искомую динамическую структуру многослойной системы, тогда как компонента со связью назад представляет нежелательные эффек- эффекты реверберации, возникающие в слоистой системе. Поскольку в процессе инверсной фильтрации выделяется искомая динамическая структура и подавляются мешающие колебания, связанные с ре- реверберацией, такой процесс называют динамической инверсной фильтрацией. Получающееся колебание, определяемое компонен- компонентой со связью вперед, представляет собой функцию, описывающую1 свойства подземной структуры. Для определения коэффициентов, отражения на границах между слоями полученное колебание сле- следует подвергнуть дальнейшей обработке. Рассмотрим теперь более подробно распространенную в гео- геофизике плоскослоистую модель строения Земли. Верхняя гори- горизонтальная линия на рис. 7.1 представляет поверхность Земли, а под поверхностью расположена слоистая среда, причем границы: слоев параллельны поверхности. Толщины слоев и скорости про-
Глава 7 дольных акустических волн в слоях различны. Большинство ис- исследователей нумеруют слои сверху вниз, но для упрощения обоз- обозначений в последующих рассуждениях здесь слои пронумерованы снизу вверх. Осадочная структура, состоящая из /V слоев конеч- - ной толщины Полупространство N+1 (воздух) Осадочный слой 1\1 Осадочный слой N-I Осадочный слой 1 Полупространство О (фундамент) Рис. 7.1. Слоистая структура. Граница /V Граница N-1 Граница N-2 Граница п Граница f Граница О Самый нижний слой, или фундамент, является полупростран- полупространством, обозначенным нулевым индексом. На фундаменте лежат N однородных слоев конечной толщины, образующих осадочную толщу пород. Индекс, обозначающий слои, изменяется от 1 (для нижнего слоя) до N (для верхнего слоя). Другими словами, первый слой является первым по геологическому времени и лежит глубже всех, а N-й слой появился последним по геологическому времени и представляет собой поверхностный слой. При изыска- изысканиях на море поверхностным слоем, конечно, будет вода. Самый верхний слой (воздух) является полупространством и обозначен индексом jV+1. Таким образом, слоистая система состоит из N осадочных слоев конечной толщины, лежащих между фундамен- фундаментом и воздушным полупространством. Термины «слоистая систе- система» и «осадочная система» обозначают систему из N слоев конеч- конечной толщины, в которую не включены фундамент и воздух. В системе имеется JV-f-1 горизонтальных границ раздела сло- слоев. Самая нижняя граница раздела обозначена индексом 0 и представляет собой поверхность нулевого слоя, т. е. поверхность фундамента. Самая верхняя граница обозначена индексом N и является поверхностью JV-ro слоя, т. е. поверхностью суши или во- воды в зависимости от места проведения изысканий. Можно принять, что га-я граница является поверхностью n-го слоя, причем цело- целочисленная переменная п изменяется от 0 до jV включительно. Ограничимся случаем распространения плоских продольных волн в направлении, нормальном к горизонтальным границам слоев. Чтобы удовлетворялись соответствующие граничные уело-
Применение ЦОС в геофизике 495 бия, в каждом слое должны существовать две плоские продоль- продольные волны, одна из которых распространяется вертикально вверх, а вторая движется ей навстречу. Для определенности будем ха- характеризовать распространение волн в слоях скоростями смеще- ния частиц пород. Если единичный импульс распространяется вниз и попадает сверху на п-ю границу, то коэффициент отражения от «ее гп Выходные сигналы Входной сигнал Единичный . Импульс, импульс идущий отраженный вниз р вверх Входной Выходные сигнал сигналы Импульс, прошедший и движущийся вверх \1 jr- я граница раздела. — Импульс, , прошедший и движущийся вниз Единичный импульс, идущий вверх п-я граница - раздела г' Импульс, отраженный вниз Рис. 7.2. Схема, поясняющая смысл коэффициентов пропускания и отражения сейсмических сигналов на границе раздела слоев. равен величине импульса, отразившегося от п-й границы и движущегося вверх, а коэффициент пропускания tn равен величи- величине импульса, прошедшего через эту границу и продолжающего двигаться вниз. Если единичный импульс, движущийся вверх, попадает на п-ю границу снизу, то коэффициент отражения г т равен величине импульса, отразившегося от границы и распрост- распространяющегося вниз, а коэффициент пропускания tn' равен величине импульса, прошедшего через границу и движущегося вверх (см. рис. 7.2). Три последних коэффициента можно выразить через первый следующим образом: г'п-— — Гп, Все коэффициенты являются действительными числами. Коэффи- Коэффициенты отражения всегда лежат в интервале (—1, 1) а коэффи- коэффициенты пропускания — в интервале @,2). Коэффициент пропус- пропускания при двукратном прохождении (туда и обратно) одного и того же импульса через n-ю границу раздела слоев равен tnt'n = = 1—rS. Предположим, что в слоистой структуре нет потерь энергии, т. е. такие эффекты, как поглощение в слоях, приводящее к за-
496 Глава 7 туханию сигнала, отсутствуют. Тогда энергия сейсмических сигна- сигналов, находящихся в слоистой системе, может теряться только за счет энергии волн, выходящих в воздух или в фундамент и не возвращающихся назад. Для упрощения выкладок удобно вводить в нужных местах структуры вспомогательные границы раздела с тем, чтобы сделать время двукратного прохождения через каждый слой одинаковым для всех слоев. Это время будем считать единицей отсчета време- времени. Понятно, что для всех таких вспомогательных границ коэф- коэффициенты отражения равны нулю, а коэффициенты пропускания— ¦¦единице. Пусть z обозначает оператор единичной задержки. Тогда лю- «бую последовательность импульсов а0, а,\, ai,...,as, где as обознача- обозначает амплитуду импульса, появляющегося в момент времени s (при- (причем s — целое число), можно представить с помощью производя- производящей функции A(z)-=ao^-aizJra2zi-\-. . . . Такую волновую последовательность часто будем для простоты называть волной А. Функция А (г), являющаяся г-преобразова- ,нием волновой последовательности а0, ах, а2,.-. и имеющая вид . часто'будет обозначаться через А, Другими словами, производя- производящая функция и соответствующее ей z-преобразование получают- (ея друг из друга заменой переменной z на z^1. .Всегда будет предполагаться, что зондирующий (входной) сиг- сигнал является единичным импульсом, приложенным к поверхности осадочной системы в нулевой момент времени и распространяю- распространяющимся от1 нее вниз. Поэтому выходную последовательность, отра- отраженную в верхнее полупространство, будем называть импульсным, откликом, (характеристикой) отражения, а колебание, проходящее в фундамент,— импульсным откликом (характеристикой) пропус- пропускания (рис. 7.3). Рассмотрим теперь осадочную систему из п—1 слоев, имею- имеющих коэффициенты отражения г0, гь ..., гп_ь Рассмотрим, кроме то- того, вторую осадочную систему из п слоев, коэффициенты отражения которых равны также г0, г\,..., rn_i, а последний слой имеет коэф- коэффициент отражения гп. Чтобы в обеих системах коэффициенты от- отражения совпадали, необходимо, чтобы и-й слой второй системы имел те же сейсмические свойства, что и п-е полупространство в первой системе, а все слои, лежащие в обеих системах под п-н границей, попарно имели одинаковые волновые сопротивления (рис. 7.4). Теперь нужно связать характеристику отражения Rn~i систе- системы из п—1 слоев с коэффициентом отражения гп таким образом, чтобы получилась Rn — характеристика отражения n-слойной си-
Применение ЦОС в геофизике 497 стемы. Из рис. 7.5 видно, что Rn состоит из бесконечного числа компонент, образующихся следующим образом: 1. Импульс гп получается при отражении зондирующего им- импульса от п-й границы вверх. 2. Последовательность импульсов inRn-iC получается при прохождении зондирующего импульса через п-ю . границу вниз, Входной сигнал Выходные сигналы Единичный импульс, распро- Характеристика страняющийся вниз отражения I' I Полупространств1 \Rn Система из п. слоев конечной • толщины полупространство О Характеристика пропускания Рис. 7.3. Схема, поясняющая смысл характеристик отражения и пропускания системы па п слоев конечной толщины. отражении его вверх от системы из п—1 слоев и прохождении че- через n-ю границу вверх. 3. Последовательность импульсов tnRn^r'n Rn-it'n получается, когда зондирующий импульс проходит через n-ю границу вниз, отражается вверх от системы из п—1 слоев, отражается вниз от n-й границы, повторно отражается вверх (от п—1)-слойной систе- системы и, наконец, проходит через п- границу вверх. Подобным же образом образуются другие компоненты беско- бесконечного ряда. Первый отраженный импульс появляется в момент поступле- поступления зондирующего импульса. Последовательность импульсов, описанная в п. 2, появляется с единичной задержкой (т. е. с за- задержкой на время прохождения импульса через n-й слой и обрат- обратно) . Последовательность, описанная в п. 3, проходит с задержкой на две единицы времени и т. д. Складывая все эти компоненты, получаем Это выражение можно представить в виде произведения
498 Глава 7 которое после суммирования геометрической последовательности, содержащейся в квадратных скобках, дает Учитывая вышеприведенные соотношения между коэффици- коэффициентами отражения и пропускания, можно получить D тп ~г Rn-\z Это соотношение, связывающее гп и Rn-u имеет тот же вид, что и формула сложения скоростей в теории относительности Эйнштей- на [7]. Коэффициенты отражения Полупространство п+1 Полупространство п Слой п Слой Слой Слой П-1 п-2 ! гп-1 гп-2 Г„-3 Слой п-1 Слой п-2 Слой Полупространство О Полупространство О Рис. 7.4. Две слоистые системы с одинаковыми коэффициентами отражения Го, Г\,..., г п-1. Система из л слоев имеет дополнительный коэффициент отражения г„. Характеристику пропускания Тп можно аналогичным образом выразить через коэффициенты отражения гп и пропускания tn на л-й границе и через характеристики отражения Rn-i и пропуска- пропускания Тп-1 системы, содержащей п—1 слой. Из рис. 7.6. видно, что характеристика пропускания Тп системы из п слоев состоит из бесконечного ряда компонент, таких как 1) последовательность импульсов tnTn-u 2) последовательность импульсов tnRn-irn'Tn-i; 3) последовательность импульсов tnRn-irnfRn-irn'Tn-i и т. д. Началом характеристики пропускания будем считать момент прихода первого отражения (т. е. появления первого импульса с ненулевой амплитудой). Первое отражение отстает от зондирую- зондирующего импульса на N/2 единиц времени (т. е. на время прохожде- прохождения импульса через систему слоев в одном направлении). При
Применение ЦОС в геофизике 499 Характеристика отражения /jj, Единичный Компонента Компонента Компонента импульс / 1 / 9 / ? на входе у у у ° —— Граница п \ п-й слой п Граница n-f Подсистема из п-1 слоев ~ Граница О Фундамент Рис. 7.5. Схема формирования характеристики отражения Rn. таком выборе иачала отсчета импульсная 'последовательность -п. 1 входит в характеристику пропускания без задержки; последова- последовательность, описанная в п. 2, входит с единичной задержкой; по- последовательность импульсов из п. 3 входит с задержкой на две единицы времени и т. д. Складывая все компоненты, находим После суммирования геометрической последовательности получа- получаем f т '»— 1 + гЛп^г * Заметим, что окончательные выражения для Rn и Тп имеют оди- одинаковые знаменатели. Единичный импульс на входе Граница а ¦ п-й мой \ / X / \ /n-и слои Граница n-f Подсистема из п-1'слоев Граница О ¦—— ^ s- ^ Фундамент \. ч Ч Компонента Компонента Кшпонентя 1 2 3 v Характеристика пропускания Тп^ Рис. 7.6. Схема формирования характеристики пропускания Т„- Теперь нужно определить последовательность полиномов Со, С\,..., CN, которые будем называть полиномами прямой связи, и последовательность полиномов Do, D\,...,DN, которые будем на- называть полиномами обратной .связи. Если система не солепжит
500 Глава 7 слоев конечной толщины, то характеристики отражения и пропу- пропускания имеют вид Г) _ 'Т1 J Эти характеристики можно выразить через полиномы Со и Do, яв- являющиеся многочленами нулевой степени, в виде соотношений с t в которых полиномы Со и Z)o удовлетворяют условиям Предположим, что для системы, содержащей п—1 слоев ко- конечной толщины, характеристики отражения и пропускания мож- можно выразить через полиномы (п—1)-й степени Сп-\ и Dn-i в виде причем полиномы удовлетворяют условиям С помощью формулы сложения скоростей находим или после преобразования Зададим полином прямой связи Сп (п-й степени) с помощью ре- рекуррентных соотношений Cn^rJ)^ + Cn_lZ, Dn =Dn_1 + rnCn_xz. Из них видно, что эти полиномы удовлетворяют условиям Сл@)=гя, Dn@)=l. Характеристика отражения Rn определяется дробью Rn = Cn/Dn. Аналогично характеристика пропускания равна т tnTn-i (tntn-i--.to)/Dn-i ИЛИ _ t\4n-\ ¦ ¦ ¦ ^0 *rtn-X ¦ . . tg 7= 1)z== Dn Поскольку Тп есть производящая функция для устойчивой одно- Физически оеализуемой') функции времени, то поли-
Применение ЦОС в геофизике ном Dn является функцией с минимальной задержкой. Но так как функция, обратная к функции с минимальной задержкой, также является функцией с минимальной задержкой, то этим же свой- свойством обладает и характеристика Тп. Будем называть функцию DnDn спектральной функцией поли- полинома обратной связи Dn, а функцию СпСп — спектральной функ- функцией полинома прямой связи Сп. Найдем выражение для разности этих спектральных функций. Пользуясь рекуррентными формула- формулами, приведенными выше, получим ОД-С„СЯ = A -rl) (D^A-i-C^C^). , Повторяя эту процедуру, приходим к соотношению Выражение, стоящее в правой части, является произведением коэффициентов двустороннего пропускания (через границу и об- обратно) всех п слоев конечной толщины. Обозначим это произве- произведение через Си2. Тогда разность между спектральными функциями полиномов прямой и обратной связи равна коэффициенту двусто- двустороннего пропускания n-слойной системы, т. е. Положим в этом выражении n=N и перепишем его в виде С/"* 2 1 N'-'N °N DNDN ~ DNDN ' что дает р р (.'JV • • • vv Поскольку oN=(tn . . .to)(tn, . . to), TO TnTn. G.1) Покажем теперь, что это равенство представляет собой закон со- сохранения энергии, т. е. разность между энергией сигнала на вхо- входе системы и энергией отраженного колебания равна энергии про- прошедшего колебания. Мгновенная мощность, которой обладает вол- волна, распространяющаяся в слое, пропорциональна произведению волнового сопротивления слоя на квадрат амплитуды волны, при- причем под амплитудой волны здесь подразумевается амплитуда ско- скорости частиц среды. Пусть Zo — волновое сопротивление фунда- фундамента, a Zam-i — волновое сопоставление воздуха. Допустим, что
502 Глава 7 в исходном состоянии система находилась в покое и к ее поверх- поверхности был приложен единичный импульс, распространяющийся вниз. На выходе системы появляются отраженный в воздух сиг- сигнал, определяемый характеристикой отражения RN, и прошедший е фундамент сигнал, определяемый характеристикой пропускания Тц. Поскольку принято, что осадочная система не вносит потерь (т. е. в слоях не происходит поглощения энергии), то вся входная энергия должна распределиться между двумя выходными сигна- сигналами RN и TN. Энергия входного импульса пропорциональна 2ц+и умноженному на единицу в квадрате. Энергия отраженной волны пропорциональна ZN+iRNRN, а энергия прошедшей волны пропорциональна Z0TNTN. Согласно закону сохранения энергии, энергия, подводимая к осадочной системе, должна равняться энергии, из нее уходящей, т.е. Характеристика отражения RN Совпадает с наблюдаемой сейсмо- трассой (включая все первичные и повторные отражения) и по- поэтому известна. Перенеся эту известную величину в левую часть предыдущего равенства, получим \~RNRN=Y*- TNTN. G.2) Найдем теперь выражение для Zo/Z^+u Хорошо известно, что ко- коэффициенты пропускания tn и i-'n выражаются через волновые со- сопротивления я-го и (я+1)-го слоев Zn и Zn+i (где (п-\-1)-й слой лежит на п-ш слое) как отсюда следует, что Zn+1 и поэтому получается *'n ¦ • ¦ t'^'o Zn Zx zn zn tjsf. . . * A z-n+i ' z<l zl Zx+1 Таким образом, отношение Z0/Zn+i равно отношению коэффициен- коэффициентов пропускания через осадочную систему вверх to'ti'...t\'r к коэф- коэффициентам пропускания сквозь всю осадочную систему вниз tN..:t\ta. Поэтому равенстваG.1) и G.2) совпадают и каждое из них представляет собой закон сохранения энергии.
Применение ЦОС в геофизике 503 Обозначим известную левую часть соотношения G.2) симво- символом Ф и будем называть ее спектральной функцией. Таким обра- образом, спектральная функция определяется как ! Ф=1-ад,, G.3) I ;И по закону сохранения энергии спектральная функция равна Далее получим выражение для TN. Известно, что при формиро- формировании проходящей волны осадочная система ведет себя как сис- система с обратной связью, поэтому величина TN обратно пропорцио- пропорциональна полиному iV-й степени DN. Если в этом полиноме старший коэффициент положить равным единице, то коэффициент пропор- пропорциональности будет равен коэффициенту пропускания вниз tN...t\U. Тогда проходящая волна описывается соотношением где за начало отсчета выбран момент прихода отраженного им- импульса от нулевой границы раздела и это первое отражение про- происходит с задержкой на N/2 единиц времени по отношению к мо- моменту поступления входного импульса (т. е. с задержкой на вре- время прохождения зондирующего импульса через осадочные слои в одну сторону). Поскольку TN является производящей функцией для односторонней (равной нулю при отрицательных значениях аргумента) устойчивой функции времени, то полином DN, находя- находящийся в знаменателе, должен быть функцией с минимальной за- задержкой. Отсюда следует, что и TN является функцией с мини- минимальной задержкой. Используя все приведенные выше результаты, находим, что спектральная функция равна Поскольку коэффициент двустороннего пропускания через осадоч- осадочную систему а2 определялся как то спектральная функция равна ЙЯ*
504 Глава 7 Таким образом, полином обратной связи DN и постоянная а^2 могут быть определены по известной спектральной функции Ф с помощью одного из методов спектральной факторизации сигналов с минимальной задержкой, таких, как метод Фейера—Волда, метод Колмогорова или метод нормальных уравнений. (Более подробное описание этих методов можно найти в работе [2].) Поскольку то полином DN является производящей функцией оператора ошиб- ошибки предсказания, который преобразует в импульс волну, про- прошедшую через осадочную систему и описываемую функцией с ми- минимальной задержкой. При образовании отраженной в воздух волны RN (т. е. прини- принимаемого сейсмического сигнала) осадочные слои ведут себя как система, имеющая компоненту со связью вперед и компоненту со связью назад. Более того, компонента со связью назад полностью совпадает с системой, имеющей обратную связь, которая форми- формирует проходящую волну. Поэтому производящая функция сейсмо- трассы имеет вид где полином iV-й степени Cn описывает компоненту со связью вперед, а полином DN той же степени описывает компоненту со связью назад и совпадает с полиномом DN, входящим в формулу для TN. Теперь принятый сейсмический сигнал можно подвергнуть инверсной фильтрации с помощью найденного выше оператора ошибки предсказания. Эта операция выполняется в виде умноже- умножения В результате инверсной свертки образуется компонента со связью вперед CN; эта компонента представляет искомую динамическую структуру осадочной системы (т. е. коэффициенты отражения), тогда как компонента со связью назад описывает нежелательные эффекты, вызванные реверберацией в многослойной осадочной сис- системе. Покажем, что компонента со связью вперед действительно описывает динамическую структуру. Запишем для этого См в яв- явном виде через коэффициенты отражения для случая N = 3. С по- помощью полученных выше рекуррентных формул находим С3(г)= г3 + (г2 + г//! -J- rjs^z -f- (rt Учтем теперь, что отраженные сигналы никогда не превышают единичного зондирующего импульса, а величины коэффициентов отражения на самом деле группируются около нуля, а не едини- единицы. Поэтому произведение трех или более коэффициентов отра-
Применение ЦОС в геофизике 505 жения, как правило, является величиной меньшего порядка, чем любой из коэффициентов отражения. Следовательно, приведенный выше полином прямой связи можно аппроксимировать соотноше- соотношением C3(z)«r3 + rtz + rt22 + roz3, или в общем случае для М-слойной осадочной системы CN(z)ssrlf + rif_1z + • ¦ .+riZN~l +rozM. Поскольку при проведении инверсной свертки получаются коэф- коэффициенты многочлена Си, этот процесс позволяет приближенно определять коэффициенты отражения, которые представляют ис- искомую динамическую структуру осадочной системы. Теперь можно описать сейсмотрассу равенством которое во временной области эквивалентно соотношению Сейсмосигнал= (Динамическая последовательность отражений)* * (Реверберационная функция с минимальной задержкой), где звездочка означает операцию свертки. Процесс инверсной свертки описывается соотношением (Сейсмосигнал) * (Оператор ошибки предсказания) = Динами- Динамическая последовательность отражений. Таким образом, при инверсной свертке выделяются параметры искомой динамической структуры и подавляются нежелательные эффекты, связанные с реверберацией. Поэтому данный процесс называется динамической прогнозирующей инверсной сверткой. Вычисления, выполняемые при динамической прогнозирующей свертке, проводятся для геофизической модели следующим обра- образом. Пусть наблюдаемый сейсмический сигнал (т. е. отраженная осадочной системой волна, вызванная зондирующим сигналом, которым является единичный импульс) образует временной ряд Xg, Xj, X2, Хд, .... (Примечание. Производящей функцией для этого ряда является Ru. Для обозначения коэффициентов RK следовало бы применить строчную букву г, но так как г уже обозначает коэффициенты от- отражения, то коэффициенты RN обозначаются через х.) На первом этапе вычисляется автокорреляционная функция г[ь по данным сейсмотрассы согласно формуле
506 Глава 7 затем находится автокорреляционная функция зондирующего сиг- сигнала, которая для единичного зондирующего импульса также яв- является единичным импульсом, и, наконец, вычисляется их раз- разность [см. формулу G.3)], которая является автокорреляционно функцией ф и определяется соотношением Ф5=— г|53 при s=?0. (Примечание. Производящей функцией автокорреляционной функ- функции <ps, очевидно, является спектральная функция Ф.) На втором этапе определяются коэффициенты оператора ошиб- ошибки предсказания (т. е. оператора инверсной свертки) do = l, d\, di,—> dfj путем решения системы нормальных уравнений Фо Ф1 Ф1 Фо 1 <?n-i Фо _ _ аы- _ ° _ где do = l, d2,-..,dN являются коэффициентами полинома обратной связи Dn- [Примечание. Приведенные нормальные уравнения можно полу- получить, записывая равенство G.4) в виде D^ = on2/Dn.] Поскольку DN является функцией с минимальной задержкой, то = а%(\ -J-Члены с отрицательными степенями г), причем в правой части нет членов с положительными степенями z. Если приравнять коэффициенты при нулевой и положительных степенях г, то получатся приведенные выше нормальные уравне- уравнения, где, в частности, двусторонний коэффициент пропускания On2 задается соотношением Третьим этапом является вычисление инверсной свертки сей- смотрассы по формуле N s=0 В результате получается набор коэффициентов полинома прямой связи, который в первом приближении представляет собой набор коэффициентов отражения, т. е. (Со, Ср . . . , CN) » (rN, rN_lt . . . , Го).
Применение ЦОС в геофизике 507 Первые и последние коэффициенты обоих наборов совпадают без погрешностей, т. е. со = Гк и см — г0. Если вышеуказанная аппроксимация (т. е. замена коэффициен- коэффициентов отражения на коэффициенты полинома прямой связи) нежела- нежелательна, то можно представить в виде ряда коэффициенты полино- полиномов обратной и прямой связи и получить точные значения коэффи- коэффициентов отражения. Покажем, как это сделать. На данном этапе вычислений коэффициенты со, С\,..., Cn поли- полинома прямой связи CN и коэффициенты d0, du ..., dN полинома об- обратной связи Бц уже найдены, и, чтобы разложить эти коэффи- коэффициенты в ряд по коэффициентам отражения, необходимо обратить приведенные ранее рекуррентные формулы. Если систему рекур- рекуррентных формул для Сп и Dn решить относительно Сп-\ и Dn-\, то получатся обратные рекуррентные формулы Кроме того, известно, что Д,@) = 1, С„@)=г„. После третьего этапа вычисления известны Сц, Dn и rN = CN(Q). С помощью обратных рекуррентных формул можно найти Сц-и Dn-\ и гц-\ = CV-i @). Повторно применяя обратные рекуррентные формулы, можно найти все полиномы и, следовательно, все коэф- коэффициенты отражения. Отметим, наконец, некоторые особенности метода сейсмическо- сейсмического зондирования. В настоящем разделе было показано, что сейсмо- трассу отраженного сигнала можно описать соотношением n _ CN причем коэффициенты многочленов Cn и Dn выражаются через коэффициенты отражения г0, ги г2,..., rN. Если, например, jV = 3, то С3=гз-Н>'2+'Уу-1+/у-1г0) z+fa + rjrjro-frjrjro) 22+г023, ?>з =1 + (Vo+Vi+V2) 2+(r2r0+r3rt + r^r^o) z2+r3r0z3. Во многих случаях, характерных для сейсморазведки, коэффи- коэффициенты отражения малы по величине. Поэтому в виде приближения можно пренебречь членами, содержащими произведения трех и более коэффициентов отражения, и записать Сз и D3 как где через v обозначены коэбсЬиииенты автокоппеляшш коэААипи-
508 __ Глава 7 ентов отражения. В общем случае подобная аппроксимация дает где ыг1> / = 1.2 ЛГ. Таким образом, сейсмотрассу можно описать выражением . . +rozN Эта дробь представляет сейсмосигнал в виде ряда первичных отра- отражений от слоев с коэффициентами отражения rN, rN-\,..., tq, каж- каждое из которых сопровождается реверберационным колебанием, описываемым функцией, обратной к полиному с коэффициентами 1, уь • • •, ум, стоящему в знаменателе дроби. Во многих геологических районах осадочные слои откладывались в совершенно случайном порядке, поэтому коэффициенты отражения образуют случайную последовательность типа белого шума; ее коэффициенты автокорре- автокорреляции малы: Yj ~0 при /=1,2, . . .,N. В подобных случаях сейсмотрасса описывается соотношением в котором сейсмосигнал представлен в виде ряда первичных отра- отражений с коэффициентами отражения rN, rN-U ..., г0. (Примечание. Как было принято выше, индекс N соответствует поверхности, а 0—-самой глубокой из границ раздела слоев.) Наш век можно назвать веком нефти, и большинство нефтя- нефтяных месторождений было открыто с помощью сейсморазведки. К методу сейсмического зондирования пришли эмпирическим путем в 20-х годах нашего столетия. Сейсмограммы отражений, получен- полученные при взрыве во многих районах Земли, обычно содержат только первичные отражения. Зная положение первичных отражений, можно на глаз интерпретировать сейсмограмму и таким образом составить схему залегания подземных слоев и найти нефть. Всегда было загадкой, почему на необработанной сейсмограмме видны только первичные отражения, если при взрыве имеет место очень много повторных отражений, которые на записи никак не проявля- проявляются. Если бы они были видны, то первичные отражения затеря- затерялись бы среди повторных и визуальная интерпретация необработан- необработанных сейсмограмм была бы невозможна. Это значит, что за 30-лет- 30-летний период (с 1930 по 1960 г.) было бы открыто мало новых
Применение ЦОС в геофизике 509 нефтяных месторождений. Результаты, приведенные выше, объяс- объясняют, почему эмпирический метод сейсморазведки оказался эффек- эффективным: коэффициенты отражения были случайны и малы по ве- величине. Начиная с 1960 г. поиски нефти успешно ведутся в райо- районах, где такие предположения не удовлетворяются; это стало воз- возможным благодаря использованию цифровых методов обработки сигналов, позволяющих устранять неслучайные многократные от- отражения, эффекты реверберации в слое воды и другие мешающие сигналы. 7.4. Свойство минимальной задержки оператора предсказания на единичный интервал предсказания При обработке геофизической информации было обнаружено эмпирически, что оператор ошибки предсказания на единичный ин- интервал обладает свойством минимальной задержки. Затем этот ре- результат был подтвержден математически. В данном разделе приве- приведено доказательство для многоканальной записи, которая, конечно, включает в себя как частный случай одноканальную запись. Пусть величины обозначают одностороннюю последовательность прямоугольных матриц размером MxN. Кроме того, допустим, что эта последова- последовательность является устойчивой (в том смысле, что коэффициент ее автокорреляции при нулевом сдвиге конечен), т. е. где символ Т обозначает операцию комплексного сопряжения с транспонированием. Коэффициенты автокорреляции этой последо- последовательности равны 1=0 Каждый из них является квадратной матрицей размером МхМ и удовлетворяет условию Оператор предсказания на единичный интервал предсказывает Xt по п известным xt-i, xt-2, ¦.., xt-n- Каждый из коэффициентов hi этого оператора является квадратной матрицей размером МхМ. Если ~xt — предсказанное значение xt, то искомый оператор пред- предсказания описывается соотношением
510 Глава 7 Сформулируем задачу предсказания другим способом. Предпо- Предположим, что требуется предсказать матрицу Xt, состоящую из эле- элементов Xt, xt-\,..., xt-n+i, исходя из матрицы Xt-\, состоящей в. свою очередь из элементов xt, xt-i, xt-2, ¦ ¦ •, Xt-n. Матрицы Xt и Xt-] имеют размеры nMXN. В такой постановке задачи искомая операция предсказания записывается в виде равенства <1 xt xt-l Xt-2 Xt-n+Z _ Xt-n+l- К I 0 0 0 h 0 1 0 0 к. 0 . 0 . 0 . 0 . • ¦ K- . . о . . 0 . . 0 . . / L К 0 0 0 0 xt-l Xt-2 Xt-3 xt-n+l -Xt-n _ где / — единичная матрица размером МхМ. Процесс предсказания можно представить таким способом по- потому, что все стоящие слева элементы, кроме первого, можно пред- предсказать с абсолютной точностью. В этой новой формулировке за- задачи данное равенство можно более просто записать в виде Xt—HXhi, где матрицы Xt и Xt-i имеют размеры nMXN, а матрица Н явля- является квадратной с размерами пМХпМ. Ошибка предсказания , Et=Xt—HXt_u где матрица Et имеет размеры nMXN. Согласно гауссовскому методу наименьших квадратов, средняя квадратическая ошибка предсказания будет минимальна тогда, когда матрица ошибок Et нормальна к предшествующим значени- значениям матрицы X(t—1). Отсюда получается нормальное уравнение где как в данном случае, так и далее до конца этого раздела все суммы берутся по t, изменяющемуся от нуля до бесконечности. В данном уравнении через 0 обозначена нулевая матрица разме- размером пМХпМ. Обозначим матрицу минимальной средней квадратической ошибки предсказания через а2, т. е. а2 является квадратной матри- матрицей размером пМХпМ. По определению Используя нормальное уравнение, найдем
Применение ЦОС в геофизике «Ш Полученный результат и нормальное уравнение можно переписать соответственно в виде или где коэффициенты автокорреляции R-\, Rq, Ri определяются как Rq—Ro = zj X-tXt > Ri =R—i ~2jXfXf.^ Каждый из этих коэффициентов автокорреляции представляет со- собой матрицу размером пМХпМ. С помощью нормального уравне- уравнения получается R^=RI=Rom. После подстановки этих величин в уравнение для а2 будем иметь Пусть с — собственный вектор-строка матрицы Я, имеющей размер 1 ХпМ, т. е. с удовлетворяет уравнению в котором X является собственным значением матрицы Я, соответ- соответствующим собственному вектору с. Аналогично справедливо урав- уравнение Нтст=стХ*, где звездочка обозначает комплексное сопряжение. Тогда уравне- уравнение для о2 можно преобразовать к виду ctfcT = cRocT — cHR0HTcT, что дает или, наконец, со"сг = A— XX*)cRocT. Левая часть этого уравнения неотрицательна, поскольку co2cT=c'5]EtEfcT=5] [cEt] [cEt]T ^ 0. Аналогично величина cRoCT, стоящая в правой части, также неот- неотрицательна, поскольку cRacT=c У! X.XJcT = У! \сХЛ \ сХЛт 3s 0.
512 Глава 7 _^__ Таким образом, вся правая часть должна быть неотрицательна,, и тем самым доказано, что 1—U*>0 или что модуль каждого из собственных значений матрицы Н меньше или равен единице, т. е. |А,|<1. Собственные значения X матрицы Н являются корнями характеристического многочлена матрицы Н, т. е. собственные значения X удовлетворяют характе- характеристическому уравнению det(X/—Я) = 0, где det обозначает детерминант (определитель) квадратной матри- матрицы. Найдем явное выражение для этого определителя. С помощьк> формулы для определителя блочной матрицы (см. [8], стр. 344) характеристическое уравнение можно свести к следующему виду: det[X«—АД» — ЯД"— . . .—й„_Д—А„] = 0. Поскольку данное уравнение является всего лишь другой формой записи характеристического уравнения, все его корни А по модулк> не превышают единицы. Рассмотрим теперь ошибки предсказания. Определим оператор ошибки предсказания на единичный интервал предсказания с по- помощью коэффициентов а,-, являющихся матрицами размером МхМ и равных соответственно ao-=I, a1 = ~hi, аг=—Ь.г, . . ., an--=—hn. Тогда ошибку предсказания можно вычислить с помощью свертки последовательности xt с опе- оператором ошибки предсказания, т. е. «/ = W+?ht • • ¦+«-„¦ ^-Преобразование оператора ошибки предсказания определяется как конечный матричный ряд Лорана, коэффициенты которого яв- являются матрицами размером МхМ, т. е. ЛB)=ао+а12-1+а2г-24- • ¦ .-\~апгп. Оператор обладает свойством минимальной задержки, если радиус- векторы точек расположения всех нулей определителя его z-преоб- разования det Л (г) по модулю не превышают единицы [4] (т. е. все нули лежат внутри единичной окружности на плоскости z). Тогда оператор ошибки предсказания на единичный интервал бу- будет обладать этим свойством, если все корни уравнения det [an
Применение ЦОС в геофизике 513 удовлетворяют неравенству [г|<1. Характеристическое уравнение» приведенное выше, можно записать через коэффициенты оператора ошибки предсказания или причем ранее было показано, что \%\ <1. Отсюда видно, что харак- характеристическое уравнение эквивалентно уравнению det Л (г) = О,, если переменные Лиг совпадают (т. е. если X = z). Поэтому все- нули уравнения Л(г)=0 удовлетворяют неравенству |г|<:1, а опе- оператор ошибки предсказания на единичный интервал обладает свой- свойством минимальности задержки. В настоящем разделе было показано, что для произвольного временного ряда оператор ошибки предсказания на единичный ин- интервал, использующий конечное число предшествующих точек и вычисленный методом наименьших квадратов, характеризуется тем, что нули его z-преобразования лежат внутри единичного кру- круга или что он обладает свойством минимальной задержки. Эквива- Эквивалентность этих двух свойств впервые установил Робинсон [2]. Юл [9] и Уолкер [10] ввели понятие авторегрессивных временных ря- рядов. Общее определение процесса авторегрессии дано Волдом .[11]; согласно этому определению, все нули z-преобразования соответст- соответствующего оператора должны лежать в единичном круге (т. е. про- процесс должен иметь только нули). Робинсон и Волд [12] доказали*, что оператор ошибки предсказания на единичный интервал, найден- найденный для произвольного временного ряда методом наименьших квадратов, обладает свойством минимальности задержки. Было по- показано в явной форме, что для любого из таких операторов су- существует соответствующий процесс авторегрессии. Доказательство' было проведено для случая одноканальных временных рядов, но в. статье отмечено, что теорема и ее доказательство распространяют- распространяются и на случай многоканальных сигналов. Итак, была установлена связь между z-преобразованием одно- одномерного процесса авторегрессии и поведением полиномов, ортого- ортогональных на единичной окружности, причем то, что нули таких орто- ортогональных полиномов лежат внутри единичного круга, является классическим фактом. В последние годы опубликован ряд других доказательств утверждения о минимальности задержки примени- применительно к одномерной задаче. В данном разделе было приведено доказательство многомерной теоремы в наиболее общей форме. Другими словами, было показано, что в матричном уравнении ал- алгоритма предсказания X(t+\)=HX(t) собственные значения опе- оператора Я, найденного методом наименьших квадратов, по модулю- не превышают единицы. Другое доказательство многомерной тео- прмм fibirrn ппинрлрип Ronmii T1Q1
514 Глава 7 7.5. Формирующие фильтры В конце разд. 7.2 было отмечено, что выходной сигнал предска- предсказывающего фильтра, как правило, нужно сглаживать и для дости- достижения этой цели удобно применять цифровые формирующие фильт- фильтры. Подобные фильтры можно проектировать, пользуясь как час- частотным, так и временным представлением, однако в геофизике наиболее удачные решения были найдены с помощью временного подхода. Задача формирования сигналов или колебаний настолько важна, что мы рассмотрим ее более подробно. Будет дана новая и более простая математическая формулировка задачи синтеза. Это позволит по-новому описать особенности взаимосвязей между требуемой формой выходного сигнала и получаемыми ошибками измерений. При цифровой обработке сигналов часто встречается следую- следующая задача: найти конечный оператор, преобразующий входной ¦сигнал конечной длительности в выходной сигнал заданной формы, имеющий конечную длительность. За исключением особых случаев, такое преобразование не может быть выполнено с абсолютной точ- точностью, т. е. сигнал, полученный с помощью оператора, представля- представляет требуемый сигнал с какой-то ошибкой. Задача состоит в том, чтобы найти такой оператор, который бы выполнял это преобразо- преобразование с минимально возможной средней квадратической ошибкой. Главной особенностью этой задачи является то, что все сигналы и оператор имеют конечную длительность. В вычислительных ма- машинах понятие о бесконечности не применяется. Входные и выход- выходные сигналы, а также все действия, выполняемые в машине, конеч- конечны в любом смысле. Однако во многих математических моделях, применяемых для описания реальных физических процессов, в той или иной форме участвует понятие о бесконечности и обычно мно- многие трудности, возникающие при анализе, в сущности сводятся к задаче согласования таких бесконечных моделей с реальными дан- данными и вычислениями. В связи с этим часто бывает гораздо проще и целесообразнее с самого начала заменить бесконечную модель конечной. Пусть b@), b(l) b(n) представляют собой входной сигнал конечной длительности, a dF), d(\),..., d(m+n) —требуемый вы- выходной сигнал конечной длительности1). Здесь m и п — неотрица- неотрицательные целые числа. Задача состоит в определении коэффициен- коэффициентов /@), f(l),..., f{m) действительного конечного оператора (фильтра), фактический выходной сигнал которого с@), сA),... ..., с(т+п) с минимальной средней квадратической ошибкой ап- аппроксимирует требуемый выходной сигнал. Фактический выходной сигнал равен свертке входного сигнала с оператором. Свертку мож- можно записать в матричной форме следующим образом. Определим
Применение ЦОС в геофизике 515 регрессорную матрицу В как прямоугольную матрицу размером (/я+ 1) X (т + п+ 1), строки которой образованы последовательной задержкой входного сигнала: ¦6@) Ь{\) . . .Ь(п) 0 . . .0 0 0 Ь@) . . .Ь(п—1) Ь(п) . . .0 0 в= 0 0 Ь(п) 0 0 0 b(n— 1) Ь(п). Определим коэффициент регрессии f как вектор-строку размером lX(m + \), составленную из коэффициентов оператора, т. е. /=Г/@), /A), .... Km)]. Определим вектор регрессии с как вектор-строку размером 1X Х(пг-\-п + 1), составленную из значений фактического выходного сигнала: и, наконец, определим регрессионал d как вектор-строку размером IX (m + n+1), составленную из значений заданного выходного сиг- сигнала, т. е. d = \d{0), d(l), . . ., d(m+n)]. Свертку входного сигнала с характеристикой оператора можно представить произведением матриц Разность между заданным и фактическим выходными сигналами равна d—с, а сумма квадратов ошибок v = (d — c)(d—c)T, где знаком Т отмечена транспонированная матрица. Уравнение ре- регрессии можно записать в виде d=:fB+(d~C). Из теории наименьших квадратов известно, что сумма квадратов, ошибок v минимальна тогда и только тогда, когда регрессорная матрица В нормальна к матрице ошибки d—c, т. е. тогда и только тогда, когда (d—c)BT =0. Это матричное уравнение представляет собой систему скалярных нормальных уравнений. Данное матричное нормальное уравнение можно записать в виде сВт =
516Глава 7 или При решении матричного уравнения получается искомый коэффи- коэффициент регрессии, или, другими словами, искомый оператор Пусть r(s) обозначает автокорреляционную функцию входного сиг- сигнала, т. е. п r(s)= 2b(t-\-s)(b(t), ?=1 a g(s) —взаимную корреляционную функцию требуемого выходно- выходного сигнала с входным сигналом, т. е. п g(s)= ? d(t^s)b(t). t=o , Тогда можно заметить, что матрица Б ?>т размером ( т+ 1) X (т+1) является автокорреляционной матрицей R входного сигнала, т. е. г@) гA) гB) . . .г(т) г( —1) г@) гA) . . . г(т-\) /-(-2) г(-1) г@) . . . г(т-2) г(-т) г(—/«Н-1) г(—т+2) . . . г@) ВВ? =R = а матрица dBT размером /Х("^+1) является вектор-строкой g, элементы которого являются коэффициентами взаимной корреля- корреляции входного и требуемого выходного сигналов, т. е. dBT =g=[g@), g(l), gB), . . ., g(m)]. В этих обозначениях матричное нормальное уравнение имеет вид Частным случаем формирующего фильтра является фильтр- ¦обостритель, требуемым выходным сигналом которого является единичный импульс. В этом случае в требуемом выходном сигнале d=[d@), d(l), .... d{m-\-n)\ какое-то одно из m + n+1 чисел представляет импульс и равно единице, а остальные числа равны нулю. Следовательно, в рамках данной модели можно получить т + п+1 различных фильтров-обо- стрителей — по одному фильтру-обострителю для каждого из т+
Применение ЦОС в геофизике 517 + п+\ возможных положений импульса. Предположим, что после- последовательность ао = [со(О), а„A), . . ., ао(т)] описывает оператор-обостритель при нулевой задержке заданного выходного импульса с10=Л1 0, 0 0]. Аналогично примем, что последовательность описывает оператор-обостритель при единичной задержке заданно- заданного выходного импульса <*! = [(), 1, 0, . . ., 0J и т. д. Таким образом, последовательность ¦ > ат+п' (in)} обозначает оператор-обостритель при задержке выходного импуль- импульса 4+,г-[0, о, о, . . .,1] на т +п единиц времени. Можно заметить, что эти последовательно запаздывающие им- импульсы составляют строки единичной матрицы / размером (пг + п+1)Х (т + п+1). Допустим, что строки матрицы А разме- размером {т-\-п-\-\)У,(т+-\) совпадают с операторами-обострителями при задержках от нуля до (т + п). Таким образом, матрица опера- торов-обострителей имеет вид «1 Тогда нормальные уравнения aR = dBT для каждого из операторов- обострнтелей можно объединить в одно общее уравнение AR=IBT или Допустим, что вектор-строка размером \Х{т+п+\) является фактическим выходным сигна- сигналом оператора-обострителя с нулевой задержкой аа. Пусть вектор-
518 Глава 7 строка С] размером lX(m-f«.+ l) является фактическим выходным сигналом оператора-обострителя с единичной задержкой и т. д. Тогда квадратная матрица С размером (т-\-п+ 1) X (т + п+ 1), имеющая вид С = называется матрицей фактических обостренных сигналов и удов- удовлетворяет уравнению Нормальное уравнение AR = BT можно записать в виде АВВ*г=Вт. Умножив обе части этого уравнения на матрицу АГ справа, полу- получим АВВТАТ=ВТАТ, что дает ССТ=СТ. Допустим, что Vi есть сумма квадратов ошибок для фильтра- обострителя с задержкой L Общая-сумма квадратов ошибок (т. е. сумма сумм квадратов ошибок всех операторов-обострителей) равна y=°e+fi+ ¦ • •+f«+«=tr[(/-C)(/-QrJ. где tr обозначает след квадратной матрицы (т. е. сумму ее диаго- диагональных элементов). Используя сочетательное свойство матрично- матричного умножения, получаем и поскольку СТ=ССТ, то V=tr(/— C)=tr/—trC. Если / является единичной матрицей размером (m+n+l)X Х{ш + п+\), то tr/ = m + n+l. Отсюда следует, что Vi=\—d(i), т. е. сумма квадратов ошибок, получающихся в фильтре-обостри- теле с задержкой i, равна единице, уменьшенной на величину фак- фактического выходного сигнала в момент времени i. Определим теперь tr С. Имеем
Применение ЦОС в геофизике SI6 Известно, что след произведения матриц не зависит от порядка расположения матриц, и это справедливо, если даже матрицы не являются квадратными, т. е. Тогда причем единичная матрица / имеет размер (т+ 1) X (т+ 1). Поэто- Поэтому и общая сумма квадратов ошибок равна i-f 1)—(/n-f 1)=я. Таким образом приходим к выводу, что общая сумма квадратов ошибок, получающихся в фильтрах-обострителях при всевозмож- всевозможных задержках, равна п, где п+\—длина входного сигнала Ь@), Ь(\),..., Ь(п). Кроме того, общая сумма квадратов ошибок V не зависит от длины характеристики фильтра т+1. Если бы суммы квадратов ошибок Vi были одинаковыми для всех задержек, то Vi = n/(m + n+l) для любого фильтра-обострителя а,-, где t = 0, 1, 2 т + п. Но, как правило, vt не получаются одинаковыми для всех фильтров. Максимально возможное значение Vi равно едини- единице, поскольку фильтр с нулевым выходным сигналом i>,= = [0, 0,..., 0] дает и, = 1, и для любого из фильтров, рассчитанных методом наименьших квадратов, сумма квадратов ошибок не мо- может превышать эту величину. Такая максимальная ошибка может получиться, например, в фильтре-обострителе с нулевой задерж- задержкой, если входной сигнал начинается с нулевого отсчета: Ь = = [0, Ьи Ь%,..., Ь„]. В этом случае правые части нормальных урав- уравнений равны нулю, и следовательно, сигнал на выходе фильтра бу- будет нулевым, а ошибка — максимальной. Рассмотрим другой слу- случай, когда все отсчеты входного сигнала, кроме последнего, равны нулю: Ь= @, 0, 0 0, />„). При этом первые п фильтров-обостри- телей создают максимальные ошибки d,-=1 (г = 0, 1,..., п—1). Сумма квадратов ошибок, получающихся в этих первых п фильт- фильтрах-обострителях, равна, таким образом, п. Но так как это число совпадает с общей суммой квадратов ошибок, то последние (т+1) фильтров-обострителей дают минимальную ошибку vi — = 0 {i=n, n+1,..., n + m). В любом случае существует некоторая задержка i, при кото- которой сумма квадратов ошибок у,- получается минимальной. Этот минимум может быть и не единственным. Значение i, при кото- котором Vi имеет минимальное значение, называется оптимальной за- задержкой или оптимальным положением выходного импульса, а со- соответствующий фильтр а,- — оптимальным фильтром-обострителем ЛЛЯ залЯННПГП пуплопгп ^„t^r.o-« и
520 Глава 7 При очень коротких характеристиках фильтра-обострнтеля об- общих правил оптимизации не существует. Однако при достаточно длинных характеристиках были замечены следующие особенно' стп: 1. Для входных сигналов с минимальной задержкой оптималь- оптимальная задержка равна минимально возможной, т. е. нулю. 2. Для входных сигналов .с .максимальной -задержкой оптималь- оптимальная задержка равна максимально возможной, т. е. т + п. 3. Для входных сигналов, не входящих в две предыдущие груп- группы (т. е. с промежуточной задержкой), оптимальная задержка ле- лежит между наибольшей и наименьшей. На практике эти правила можно применить для определения понятий минимальной, макси- максимальной и промежуточной задержек. Вернемся теперь к случаю формирующего фильтра / с произ- произвольным видом требуемого выходного сигнала d. Матричное нор- нормальное уравнение в этом случае записывается как Однако нормальное уравнение для обостряющего оператора с мат- матрицей А имеет вид AR = BT, поэтому Следовательно, характеристику формирующего фильтра f можно выразить через требуемый выходной сигнал d и матрицу А опера- тора-обострителя в виде f=dA, или f~[do,du . . . ,dm+n] Таким образом, формирующий фильтр f образуется как комбина- комбинация из обостряющих фильтров для всевозможных задержек, в каж- каждом из которых произведено взвешивание выходного сигнала, при- причем весовые коэффициенты равны значениям требуемого выходного сигнала в моменты времени, равные задержкам в соответствую- соответствующих фильтрах. Вспомним, что матричное нормальное уравнение для f можно представить в виде (d—c)BT=0. Умножив обе части его на fT, получим • —
Применение ЦОС в геофизике 521_ или \(d-c)Cr==O.] Следовательно, сумма квадратов ошибок равна v=(d— c)(d — c)T=(d— c)dT— {d — c)cT = (d — c)dT=ddT—cdT. Поскольку c = fB, сумма квадратов ошибок v=ddT—fBdT, что с учетом равенства g=dBT дает v = ddT— fgT. Таким образом, сумма квадратов ошибок, получающихся в фор- формирующем фильтре f, равна сумме квадратов значений заданного выходного сигнала, уменьшенной на величину скалярного произве- произведения характеристики фильтра с взаимно-корреляционной функци- функцией. Поскольку f = dA, g=dBT, C=AB, это скалярное произведение равно fgf=dABdT=dCdT. Таким образом, сумма квадратов ошибок формирующего фильтра выражается в виде квадратичной формы v = ddT—dCdT=d [I—С] dT, где матрица квадратичной формы равна /—С, т. е. матрице разно- разностей между заданными и фактическими выходными сигналами все- всевозможных обостряющих фильтров. Полученная формула дает минимальное значение квадратиче- ской ошибки v для требуемого выходного сигнала d, однако ошиб- ошибка не обязательно будет малой. В связи с этим важно найти класс выходных сигналов d, для которого ошибка v с гарантией будет небольшой. В дальнейших рассуждениях удобно оперировать с нормирован- нормированной квадратической ошибкой (НКО) v', которую можно задать соотношением T dd' dd Поскольку u'>0, матрица /—С является неотрицательно опреде- определенной. Рассмотрим матрицу С фактических выходных сигналов всевозможных фильтров-обострителей, имеющую размер {т+п+ + 1) X (т + п+1). Ранее было показано, что ССТ=СТ.
522 Глава 7 Транспонирование обеих частей равенства дает ССТ=С, откуда следует, что С=СТ (т. е. С является симметричной матри- матрицей) , а это в свою очередь означает, что С=ССТ=С\ Из условий ; С=СТ, С=С? следует, что С является симметрической идемпотентной матрицей ([14], определение 12.3.1). Кроме того, матрица I—C также явля- является симметрической идемпотентной ([14], теорема 12.3.5, часть 4),. и поэтому Ранг(/—С)=-ЛтA— С) (| 14], теорема 9.1.5). Но выше было показано, что tr (/—С) = V = — п, и поэтому Ранг(/—С) = п. Таким образом, /—С является симметрической идемпотентной мат- матрицей ранга п, а подобные матрицы имеют всего п ненулевых соб- собственных значений fa, каждое из которых равно +1, а остальные т+1 собственных значений равны нулю ([14], теорема 12.3.2). Представим нормированную квадратическую ошибку v' в виде где е,- обозначает ?-й ортонормальный собственный вектор-строку матрицы /—С, имеющий размер IX (пг+п-\-1). Все векторы ei ортогональны, так как матрица /—С симметричная. Приведенное выше разложение матрицы /—С по собственным векторам и собст- собственным значениям является прямым следствием ортогонального преобразования где матрица Е размерами (т+п+1) X (т + п+1) составлена из собственных вектор-строк еь а матрица Л диагональная и состав- составлена из собственных значений (fa, Ад, •.., km+n+i). Допустим теперь, что в качестве требуемого выходного сигна- сигнала d выбран один из собственных вектор-строк размером IX (т+ + п+\) (например, е;), соответствующий любому из т+1 нулевых собственных значений X/, т. е.
Применение ЦОС в геофизике 523 При этом получается (m+n+l \ поскольку Xj=O и eiej=8ij, причем _ |1 при t=/, w 10 при 1ф]. Это означает, что имеется т+l возможностей выбрать для форми- формирующего фильтра форму выходного сигнала d так, что НКО умень- уменьшается до минимума, т. е. до нуля. Интересно также рассмотреть случай, когда в качестве требуе- требуемого выходного сигнала d взят любой из собственных вектор-строк (например, <?/), соответствующий одному из я собственных значе- значений Я/, равных единице. При этом d=ep 1 < / < п, и нормированная ошибка v —- или V = поскольку А,/=1, а еуегг = бгу- Отсюда следует, что существует п ва- вариантов требуемого выходного сигнала d, для которых НКО до- достигает максимально возможного значения, равного единице. От- Отметим, что выполненный ранее анализ распределения ошибок для набора обостряющих фильтров, когда входным сигналом служила последовательность Ь=@, 0,..., Ьп), вполне объясняется и в рам- рамках вышеприведенных рассуждений. Важным частным случаем формирующего фильтра является предсказывающий фильтр, когда требуемый выходной сигнал сов- совпадает с входным, но опережает его во времени на некоторый ин- интервал а, называемый интервалом предсказания. Опережающий сигнал состоит из двух частей: неконтролируемой части Щ,
524 Глава 7 которая появляется до начала отсчета времени и поэтому не опре- определяется фильтром, и контролируемой части Ь(а), 6(а+1), . . ., Ь(п), находящейся в интервале действия фильтра. Таким образом, кон- контролируемая часть образует требуемый выходной сигнал фильтра,, имеющий вид (Ь=[Ь(а), 6(а+1) Ь(п), О 0], т. е. требуемым выходным сигналом является вектор-строка da размером IX (т+м+1). Характеристика предсказывающего фильтра с интервалом предсказания а имеет вид Сумма квадратов ошибок, получающихся за счет преобразования входного сигнала в контролируемую часть выходного сигнала, равна п va = da [/-С]<?= 2 b*(i) - Ошибка предсказания складывается из неконтролируемой части и ошибки, обусловленной разницей между контролируемой частью и фактическим выходным сигналом фильтра. Если обозначить сум- сумму квадратов ошибок предсказания через wa, то ^a=2 b*(l)+Va, причем первое слагаемое правой части описывает вклад неконтро- неконтролируемой части, а второе — вклад контролируемой части выходного сигнала. Пусть заданы входной сигнал b и оператор с характеристикой, имеющей длину т+\ отсчетов. Рассмотрим зависимость суммы квадратов ошибок предсказания от величины интервала предска- предсказания, т. е. проанализируем ша как функцию а. Для операторов с достаточно длинными характеристиками wa является монотонно возрастающей функцией а (где а=1, 2, 3,...). Для коротких опе- операторов это не обязательно. Неконтролируемая составляющая wa. определяется той частью энергии входного сигнала, которая сосре- сосредоточена в интервале от нуля до a—1, поэтому неконтролируемая составляющая является монотонно неубывающей функцией а. О контролируемой составляющей va нельзя сделать никаких об- общих заключений, кроме того, что она обращается в нуль, когда a превышает п. В результате кривая wa будет иметь минимум при
Применение ЦОС в геофизике 525 одном или нескольких значениях а; такое значение а называется оптимальным интервалом предсказания. Интересно отметить, что, тогда как оптимальная задержка сиг- сигнала (т. е. оптимальное положение выходного импульса) фунда- фундаментально связана с фазовыми свойствами сигнала (т. е. имеет ли сигнал минимальную, максимальную или промежуточную задерж- задержку), оптимальный интервал предсказания никоим образом не за- зависит от этих свойств сигнала. Это утверждение можно подтвер- подтвердить анализом нормальных уравнений, на основе которых составля- составляется оператор предсказания. Матричное нормальное уравнение имеет вид Правая часть уравнения содержит вектор взаимной корреляции сигнала с его контролируемой частью, т. е. ту часть автокорреля- автокорреляционной функции, которая обусловлена произведением d*BT=[r(a), r( причем подразумевается, что r(s)—0 при s~>n. В силу этого в нормальное уравнение для оператора предсказания /(а) входит только автокорреляционная функция входного колебания Ъ, и по- поскольку она не зависит от фазовых свойств сигнала, то от них не зависит и оператор предсказания. Поэтому оптимальный интервал предсказания не зависит от фазовых свойств входного сигнала Ь. Предсказывающему фильтру можно противопоставить «вспоми- «вспоминающий» фильтр, требуемый выходной сигнал которого равен вход- входному сигналу, задержанному на некоторый интервал времени, на- называемый интервалом вспоминания. Этот интервал можно обозна- обозначить как —а, где а — сугубо отрицательное число, т. е. интервал вспоминания можно рассматривать как отрицательный интервал предсказания. Нормальные уравнения для вспоминающего фильт- фильтра /а (где а — существенно отрицательное число) имеют вид Лх#=Иа), г(а+\), . . ., r(a+m)J. Предположим, что а = —m—1; это означает задержку на т+1 еди- единицу времени. Тогда для вспоминающего фильтра справедливо ра- равенство где Автокорреляционная функция действительных скалярных сигна- сигналов является четной, т. е. r(—k) = r(k). Следовательно, для вспо- вспоминающего фильтра выполняется соотношение , t(m), .... r(l)].
26Глава 7 Поскольку R — симметричная тёплицева матрица, в обоих век- вектор-строках можно записать элементы в обратном порядке и тем 'самым преобразовать предыдущее уравнение к виду .... r(m), r( Однако известно, что для оператора предсказания /i с интервалом предсказания а=1 справедливо равенство .. г(т), г(т-\-1)\. Поэтому оператор, полученный обращением оператора вспомина- вспоминания с интервалом вспоминания —а = т+1, идентичен оператору предсказания с интервалом предсказания сс=1. В более общем случае оператор, полученный обращением оператора вспоминания с интервалом вспоминания —a = m + k, оказывается ни чем иным, как оператором предсказания с интервалом предсказания a = k. 7.6. Рекуррентные способы решения нормальных уравнений, содержащих теплицевы формы Решение задачи об оптимальной инверсной фильтрации мето- методом наименьших квадратов сводится к решению системы уравне- уравнений, называемых нормальными уравнениями. В общем случае для каждого коэффициента фильтра составляется свое уравнение. Ма- Машинное время и объем памяти, необходимые для решения системы с помощью обычных стандартных программ для систем линейных уравнений, оказываются слишком большими (за исключением слу- случаев, когда число коэффициентов фильтра невелико). В данном разделе описаны более эффективные способы определения коэф- коэффициентов искомых фильтров. Эти способы позволяют при разумных затратах обработать большие объемы сейсмической информации; на практике ежеднев- ежедневно приходится решать не менее 5 млн. нормальных уравнений, мно- многие из которых содержат до 100 и более переменных1). При рас- рассматриваемом подходе применяется особая форма автокорреля- автокорреляционной матрицы R, в скалярном случае называемая тёплицевой формой, а в матричном случае 2> — блок-тёплицевой формой. Эту форму можно представить в виде матрицы r-i rO ri ... rm-i .Г-п '> G. M. Honchins, Amoco Production Company, частное сообщение, 1976 г. 2> Матричный случай встречается в разд. 7.7, где рассматриваются многока- многоканальные записи и многомерные процессы.
Применение ЦОС в геофизике 527 элементами которой могут быть скалярные величины или квадрат- квадратные матрицы. Отметим, что элементы, лежащие на одной и той же диагонали, одинаковы, т. е. матрица полностью определяется эле- элементами левого столбца и верхней строки. Согласно рекуррентному методу, сначала отыскивается фильтр с одним коэффициентом. Затем на основе этого фильтра находится фильтр с двумя коэффициентами и т. д., пока не будет найден фильтр с требуемой длиной характеристики. Основное преиму- преимущество рекуррентного метода состоит в экономии машинного вре- времени и памяти. Для решения системы уравнений стандартными способами необходимо машинное время, пропорциональное тъ, и объем памяти, пропорциональный т2. В рекуррентном методе требования к времени и объему памяти снижаются до т2 и т со- соответственно. Важным дополнительным достоинством данного метода явля- является то, что на каждом шаге вычислений можно находить диспер- дисперсию ошибки предсказания v. Это дает возможность определять по некоторому критерию нужную длину характеристики фильтра. С увеличением длины характеристики средняя квадратическая ошибка будет убывать и при некотором значении длины станет пренебрежимо малой. При описании рекуррентного метода будут применяться две группы обозначений: обычные алгебраические и набор векторных операторов (сокращенные обозначения). Прямая рекуррентная схема для скалярного процесса была впервые составлена Левинсоном [5]. Робинсон [15] обобщил ее на случай многоканальных записей и, наконец, Виггинс [16] распро- распространил скалярную схему на случай многомерной информации. Ре- Рекуррентная косвенная схема предложена Симпсоном [17]. В случае одноканальных сигналов нормальные уравнения имеют вид 2 игы=gi* i=~-°> !> • • •. п- 1=0 Здесь коэффициенты фильтра /,-, коэффициенты автокорреляции /¦j-j и величины gj, стоящие в правой части, являются скалярами. С этими нормальными уравнениями связаны нормальные уравне- уравнения для оператора с,- ошибки предсказания на единичный интервал предсказания: i=0 где ао=1, у —средняя квадратическая ошибка, а б/ —дельта-функ- —дельта-функция Кронекера, по определению равная 8/=1 при /=0 и б/ = 0 при МО.
/528 Глава 7 Приведенный здесь вариант рекуррентного метода, относящийся гк большим операторам, является доработанным вариантом метода Левинсона. Левинсон пользовался операторами предсказания, а не операторами ошибки предсказания. Кроме того, в первоначальном -алгоритме Левинсона на каждом этапе необходимо вычислять по- пожарные скалярные произведения трех векторов. Одно из скаляр- скалярных произведений используется для вычисления следующего зна- значения дисперсии ошибки предсказания v. Поскольку ошибки пред- предсказания могут становиться очень малыми, накопление ошибок округления может сделать вариант алгоритма, предложенный Ле- винсоном, неустойчивым. Как будет показано ниже, модификация алгоритма, предложенная Виггинсом и Робинсоном [18], позволяет обойти эту трудность при вычислении v. Эта модификация и ее значение рассматриваются также в работе Бёрга [13]. Оператор вспоминания «предсказывает» предыдущие значения временного ряда по его последующим значениям. В скалярном слу- случае матрица R симметрична, и поэтому оператор bj ошибки вспо- вспоминания на единичный интервал получается с помощью обращения оператора ошибки предсказания на единичный интервал, т. е. Рассмотрим способ, позволяющий преобразовать оператор (с коэффициентами а0, аи ..., а„) ошибки предсказания на единич- единичный интервал в новый оператор ошибки предсказания на единич- единичный интервал с коэффициентами ао\ а/,..., a'n+i, число которых при этом возрастает на единицу. В качестве первого шага введем в оператор а нулевой коэффициент в конце последовательности ко- коэффициентов оператора: К. • • -, аа, 0] \Г° ' " "^"Uttf, 0 0, и]. Величина и, равная определяет расхождение; при и = 0 расширенный оператор являет- является правильным. Но, как правило, расхождение получается ненуле- ненулевым, и поэтому следующий шаг состоит в таком изменении коэф- коэффициентов расширенного оператора, при котором расхождение об- обращается в нуль. Для этого к расширенному оператору ошибки предсказания прибавляется такой же расширенный оператор ошиб- ошибки вспоминания, но умноженный на некоторый весовой множи- множитель k. В результате получается [a0, ax-\-kan, . . ., ka0] ' '-n-l , 0 0, м+toj.
Применение ЦОС в геофизике _529 Чтобы найти множитель k, приравняем нулю сумму u-\-kv. Тогда Таким образом, k равно отношению расхождения и к дисперсии ошибки предсказания v, взятому с обратным знаком. Новый опера- оператор имеет вид а' = [а0, а^Ып, . . ., an-\-kau ka0], а новая дисперсия v' =v-\-ku Воспользуемся новым оператором ошибки предсказания для уве- увеличения числа коэффициентов фильтра f. Опять в качестве первого приближения к f добавим нуль в конец характеристики операто- оператора /. Тогда [/в. /i L °] L° ' '[n\ = lgo gn> Тя+il. V-n-i • • -r0 J где Если к расширенной характеристике фильтра прибавить взвешен- взвешенную характеристику нового оператора ошибки вспоминания, то по- получим [fo+V"+'« • • •» fn+kjdx, kfa'o\\ ° n+1 = i'-n-l • • • r0 J Выберем kf так, чтобы Тогда характеристика нового фильтра /' будет иметь вид fr = lfoJrkfa'n+u . . ., fn-\-kfa[, kfa'o]. Запишем результаты в сокращенных обозначениях: а = [а0, аи ..., ап] — данный оператор ошибки предсказа- предсказания, а'=[Яо. а{,..., пп+\] — новый оператор ошибки предсказания, b = [an, dn-i, ¦ ¦ ¦, йо] — данный оператор ошибки вспоминания, Ь' = [а'п+и а'п,..., с о] — новый оператор ошибки вспоминания, p = [rn+u rn,..., '"i — отрезок автокорреляционной последо- последовательности, /Н/о, !\, ¦¦¦, fn]— характеристика данного фильтра, f/ = \f'a, f\,..., fn] —хаоактеоистика Ъ
530 Глава 7 Прежде всего вычисляется расхождение в виде скалярного про- произведения и=а-р, ,а затем k в виде дроби со знаком минус: v Далее строится новый оператор ошибки предсказания а'=(а, 0)+&@, Ь) Я находится дисперсия новой ошибки предсказания v'=v + ku. (Данная операция характерна для прямого способа решения зада- задачи и является существенным отличием от метода Левинсона, где величина vr вычислялась в виде скалярного произведения v' = ) r_i+ ... +anr-n.) Новый оператор ошибки вспоминания Ь' получается путем рас- расстановки коэффициентов нового оператора ошибки предсказания в обратном порядке. Затем вычисляется скалярное произведение и постоянная Наконец, получается характеристика нового фильтра Г = (f, Q)+k,b'. На каждом этапе описываемого метода нужно вычислять два скалярных произведения а-р и f-p вместо трех ар, f-p и аого + ... ... +апг-п, как необходимо в методе Левинсона. Критические заме- замечания, относящиеся к точности метода Левинсона, часто вызваны ошибками, возникающими при вычислении этого третьего скаляр- скалярного произведения. При анализе многоканальных записей, когда имеется М вход- входных и L выходных каналов, каждый из коэффициентов автокорре- автокорреляции г,- является, матрицей размером МхМ, а все коэффициенты фильтра, операторов ошибки предсказания и ошибки вспоминания, а также правой части нормальных уравнений представляют собой матрицы размером LxM. Кроме того, в многоканальном случае оператор ошибки вспоминания является вполне самостоятельным оператором и его уже нельзя получить обращением на оси времени оператора ошибки предсказания; таким образом, имеем b = [bn, bn-i,..., Ьо] —данный оператор ошибки вспоминания, b' = [bn+i, Ъ'п,..., Ь'о] — новый оператор ошибки вспоминания.
Применение ЦОС в геофизике 531 В отличие от случая действительного скалярного сигнала авто- автокорреляционная функция здесь не является симметричной, и по- поэтому необходимо использовать два вектора: Р = 1Гп+Ъ Гп, . . . , Г4], С учетом этих изменений рекуррентный способ решения многока- многоканальной задачи состоит из тех же этапов, что и для скалярной за- задачи. В сокращенных обозначениях рекуррентный алгоритм выпол- выполняется следующим образом. Сначала вычисляются скалярные произведения иа=а-р, Для обычной многоканальной записи автокорреляционная матрица обладает симметрией вида г . —1> 1Г '-i—t';J > где символ Т обозначает операцию комплексного сопряжения с транспонированием. В этом случае вместо двух скалярных произ- произведений достаточно найти одно, так как они связаны соотношением Далее вычисляются весовые множители Затем составляются новые операторы a' = (a,0)+ka@,b), b'=(O,b)+kb(a,O) и определяются новые значения дисперсий После этого вычисляются скалярное произведение Vn+i=f-P и коэффициент k,^lZ,m—Y/.+iJfft-1. Наконец, получается новая характеристика фильтра f'=(f,O)-\-k,b'.
Ш Глава 7 Заметим, что на каждом этапе рекуррентного алгоритма харак- характеристика фильтра удлиняется на один коэффициент; для этого нужно вычислить два скалярных произведения а-р и f ¦ р. Однако •в частном случае, когда требуется находить только оператор а' .ошибки предсказания (или, что эквивалентно, оператор предсказа- ,ния), можно не проводить вычисления второго векторного произве- произведения f-p, а также коэффициента kf и характеристики f. Это при- приводит к сокращению объема вычислений щри определении оператора предсказания почти вдвое по сравнению с объемом вычислений общего оператора фильтра. 7.7. Двумерные формирующие фильтры До сих пор в основном рассматривалось применение цифровой •обработки сигналов при анализе скалярных геофизических данных. Однако развитие техники приводит к задачам, когда требуется об- обработка записей, полученных от решетки геофизических датчиков, причем анализируемые сигналы имеют векторный характер. Подоб- Подобные векторные сигналы иногда можно изучать теми же методами, что и многоканальные записи; иногда следует трактовать их как многомерные переменные, а часто приходится использовать оба подхода вместе. Ограниченный объем книги не позволяет углубить- углубиться в эту обширную область, так что ограничимся рассмотрением одного из методов проектирования фильтров, приводящего к созда- созданию двумерных формирующих фильтров, отвечающих критерию минимума средней квадратической ошибки. Во многих случаях двумерный формирующий фильтр удобнее всего реализуется в виде двумерного рекурсивного фильтра. Сейсмограмма состоит из набора записей, описывающих коле- колебания, происходящие в Земле, как функции времени. Это могут быть записи выходных сигналов отдельных датчиков или комбина- комбинации сигналов от группы датчиков, определенным образом разме- размещенных в пространстве. Если точное положение этих датчиков в явном виде учитывать не нужно, то единственной независимой пе- переменной является время. Если же пространственные координаты должны фигурировать в явном виде, то число независимых пере- переменных может дойти до четырех: это время и, возможно, три пространственных координаты. Будем считать, что размерность про- процесса равна числу независимых переменных, а его порядок-—чис- порядок-—числу зависимых переменных, описывающих процесс в каждой точке пространства. Так, например, совокупность сигналов, снимаемых с линейной решетки сейсмометров, измерявших колебания в Земле по трем осям, образует двумерный процесс третьего порядка. Бо- Более подробно эти вопросы рассмотрены в работе Виггинса [16]. С точки зрения техники порядок процесса эквивалентен числу каналов. Таким образом, л-дорожечная сейсмограмма, для которой единственной независимой переменной является время, представ-
Применение ЦОС в геофизике 533 ляет собой запись я-канального одномерного процесса. Следова- Следовательно, все многоканальные системы, рассмотренные в предыду- предыдущих разделах данной главы, являются одномерными. Однако во многих геофизических задачах необходимо в явной форме учиты- учитывать пространственные координаты сейсмометров. Тогда /г-доро- жечную сейсмограмму, полученную с помощью группы сейсмомет- сейсмометров, расположенных на одной прямой, можно рассматривать как реализацию двумерного процесса с двумя независимыми перемен- переменными: временем t и расстоянием х. Подобная двойственность ука- указывает на возможность отображения многомерного процесса в эк- эквивалентный одномерный многоканальный процесс. Виггинс [16] разработал математический аппарат, позволяющий выполнить та- такое отображение в самом общем случае, однако здесь будет рас- рассмотрена только двумерная (или планарная) задача. Рассматриваемую проблему лучше всего пояснить на простом примере. Рассмотрим свертку двумерных функций О' (время) Oil а12 Ьп * 1^ агг b2i X 'расстояние) bis cn 22 31 С12 С22 clg С23 ^33 «ЛИ А*В=С, где А и В являются двумерными числовыми массивами размерами BX2), составленными из элементов ац и Ьц, а С — массив разме- размером CX3) из элементов с,-> звездочка обозначает свертку. По осям абсцисс и ординат во всех массивах отложены соответствен- соответственно дискретное время t и дискретное расстояние х. Коэффициенты cij проще всего вычислить путем перемножения двумерных мно- многочленов: A(z,w)B{z,w)=C(z,w), где A(z, w), B(z, w) и C(z, w) являются двумерными (или пленар- пленарными) производящими функциями, a z и w обозначают операторы единичной задержки по осям t и х соответственно, так что B(z,w)=bH-\- blzz+b2iw -f b^zw. Поэтому С (z, w)^alib
534 Глава 7 cu=anbzi-\-a21bH, Однако можно также записать A (z, w) —(ап-\-апг)-\-(а21 что дает или где w--=at (z)+a2 (г) w, С (г, w) = [а, (г) +й2 B) w] [bt (г fll (г) 6t B)+[О! (г) 62 (г)+О, (г) ^ С (г, да) =сх (г)+с2 (г) ш-j-Cj (г) w] = о^ (г) Ьг (г) ша а L и G.5) [с, (г) =Oi (г) 62 (г) +«2 (г) 6t (г), G.6). Формула G.5) напоминает выражение для производящей функ- функции свертки двух одномерных последовательностей с тем отличием, что коэффициенты с; теперь являются не постоянными величинами,, а многочленами от г. С учетом этого замечания соотношения G.6). можно переписать в следующей форме: 1 B) О bz(z) 0 az(z) . сз или после транспонирования обеих частей имеем \г)аЛ^ с2(г) c3(z)}. {7.1} Ьг(г) О bdz) bt(z)_ В результате исходная задача создания двумерного фильтра свелась к эквивалентной задаче с многоканальным процессом. Предположим, что массив А размером BX2) описывает характе- характеристику фильтра, а массив В размером Bx2)—входной сигнал. Задача преобразуется так, что входной сигнал становится шести- канальным и создает массив с размерами Bx3): i (г) К (г) О О Ь< (г) К
Применение ЦОС в геофизике 535 причем два из этих каналов содержат нулевые составляющие, а фильтр становится одномерным двухканальным и его характери- характеристика имеет размеры AX2). Применяя метод математической индукции, получаем, что в об- общем случае, когда массив А размером (тхп) описывает фильтр, а массив В размером (jxXv) —входной сигнал, эквивалентная мно- многоканальная система характеризуется наличием 1) (тХ[т-\-р,— 1])-канального сигнала длительностью у, 2) одномерного m-канального фильтра с характеристикой дли- длиной п. Здесь уместно сделать несколько замечаний. Во-первых, матрица эквивалентного входного многоканального сигнала имеет в общем случае структуру вида Л (г) Ь3(г) ¦ ¦ ¦ Ы*) 0 ... О О Ьх{г) ¦ ¦ • V-i(z) *ii(z) 0 .0 ... bx(z) ... Mz т. е. является полиномиальной с размерами (/nX't^-j-JA—!])> при- причем из всех ее элементов только \х, независимы, а т(т-\-\1—1)—т\х,=т{т—1) элементов, расположенных вышеуказанным образом, равны нулю. Во-вторых, приведенное отображение не является единственно воз- возможным, поскольку можно записать А (г, в>)=(аи4-«2^)+ (а12+а22ш) z=a1(w)+a%(w) z, В (г, ay) = (bn+btiw) -f (Ьы+b^w) z=bt (w) +й2 (w) z, что приводит к эквивалентной многоканальной системе 0 1 _ где Ci (о/) =ot (сю) 54 (а;), с2 (да) =аа (ш) й2 (ш)+а2 (ш) ^ (ш), Если массивы А я В имеют размеры (тхп) и (ц,Хл>) соответст- соответственно, то в рассматриваемом случае эквивалентная многоканаль- многоканальная система состоит из
536 Глава 7 1) (nX[ti+v—1]-каналыюго входного сигнала длительностью fj,; 2) n-канального одномерного фильтра с характеристикой дли- длиной т. При этом эквивалентная матрица входного сигнала является полиномиальной с размерами (nX'[«+v—1]) и имеет в общем случае структуру вида ~Si(w) b2(w) • • ¦ bv(w) О ... О О Sl(w) ' • • &v—I {w) bv(w) ¦ • ¦ О _0 ... b±(w) • • • bv(w)_ причем только v полиномов являются линейно-независимыми, а n(n-j-v— 1)— nv=n(n—1) элементов равны нулю. Задачу создания дискретного двумерного фильтра методом на- наименьших квадратов можно поставить и решить в рамках задачи об эквивалентной многоканальной системе, описываемой уравне- уравнениями типа G.7) или G.8). Если воспользоваться уравнением G.7), то задача формулируется следующим образом: Требуемый выходной сигнал г^ г / ч /„ГМ2) М*) 0 1 G.9) [а, (г) я2 (г)] |^0 ^ (г) ^ B) |=[Cl (г) с2 (г) с3 (z)J. Характеристика Входное сигнал * Фактический выходной фильтра сигнал где di(z), i=\, 2, 3 — производящая функция для i-я строки иско- искомого выходного массива D размером CX3). Пользуясь описанны- описанными ранее многоканальными алгоритмами, можно найти фильтр с такой характеристикой [ах (z)пг (z)], что квадратическая ошибка будет минимальна. В этом выражении dc и с,- обозначают векторы, образуемые t-ми строками требуемого D и фактического С выход- выходных массивов соответственно, а символ Т обозначает транспониро- транспонирование. Если же воспользоваться уравнением G.8), то задача формули- формулируется следующим образом: Требуемый выходной сигнал ГО / ( V, ?"> / \1 L.1 1 *. [di (w) dz(w) d3(w)\ r. „ 7 \bx{w) 8%(w) 0 1 ГЛ Л Л п Хярактеристика Входной сигнал Фактический выходной фильтра сигнал
Применение ЦОС в геофизике 537 где d,-(w), /=1, 2, 3,— производящая функция (от переменной w) /-го столбца того же требуемого выходного массива D размером CX3). Как и выше, с помощью многоканальных алгоритмов мож- можно найти фильтр с характеристикой [di(w) аг(ау)], дающей мини- минимум квадратическои ошибки где dj и с/ — векторы, образованные /-ми столбцами требуемого D и фактического С выходных массивов соответственно. Если массивы А и В являются квадратными, то формулировки G.9) и G.10) с точки зрения эффективности вычислений оказы- оказываются равноценными. В более общем случае, когда массивы Л и В прямоугольные, более эффективной может оказаться та или другая формулировка в зависимости от конкретных размеров мас- массивов и особенностей математического обеспечения применяемой ЦВМ. Приведем небольшой численный пример, иллюстрирующий вы- вычисление двумерного фильтра методом наименьших квадратов. Пусть входной массив размером BX2) имеет вид в= 12 3 4 Необходимо получить фильтр Л с размером характеристики BX2), чтобы выходной массив С аппроксимировал заданный вы- выходной массив размером CX3): "О О О" О 1 О О О О с минимальной квадратическои ошибкой. Если воспользоваться формулировкой G.9), то так что полиномиальная матрица входных сигналов будет иметь вид ВB)=[1+2г 3+4г v ' О
.538 Глава 7 Автокорреляционная матрица R(z) для входной полиномиальной матрицы в этом случае равна l4Z-1 + 30+14z 6г-1 + И+ 4zj 42-! + 11+ дг Н^+ЗО + НгГ а взаимно-корреляционная матрица G(z)=D(z)Br(r1)=[i-\-3z 2+z]. Таким образом, искомые матричные коэффициенты автокорреля- автокорреляции размерами BX2) равны 0 Hi [14 4] .п зо| Г1~[б и]' а искомые коэффициенты взаимной корреляции размерами BX1) равны ?i=[4 2], gi=[3, 11. •Соответствующие нормальные уравнения, которые имеют вид [(аи а12) (а12 :можно решить с помощью многоканального блок-тёплицева алго- алгоритма, что дает ,10201 0,051381 0,02374 — 0,01019J' Фактический выходной сигнал ,10201 0,25540 0,11276" 0,32977 0,59965 0,18514 0,07122 0,06439 —0,04076 имеет нормированную среднюю квадратическую ошибку, равную 0,40035. Данный пример показывает, как двумерный фильтр, рассчитан- рассчитанный методом наименьших квадратов, выполняет роль двумерного .формирующего фильтра. Следует отметить, что нормальные уравнения для дискретного двумерного фильтра, дающего минимальную среднюю квадратиче- квадратическую ошибку, можно получить и непосредственно, не пользуясь отображением фильтра в многоканальную систему [16]. Однако это сделать довольно сложно, и при этом мало проясняется суще- существо основной проблемы. Весьма часто реализация двумерного формирующего фильтра .(рассчитанного методом наименьших квадратов) на основе прямого
Применение ЦОС в геофизике 539 вычисления свертки требует чрезмерно большого объема вычисле- вычислений. Эту трудность можно обойти, выполняя фильтр в двумерной рекурсивной форме (т. е. с обратной связью). Передаточную функ- функцию двумерного рекурсивного фильтра можно представить в виде k, i 2 Pip1®1 где P(z, до) и Q(z, w) —полиномы соответствующих степеней,, стоящие в числителе и знаменателе дроби. Степени этих полино- полиномов, а также числовые значения коэффициентов рц и дц зависят от метода расчета фильтра, использованного для решения конкрет- конкретной задачи. Как правило, рекурсивные фильтры с точки зрения объема вычислений оказываются более эффективными, чем их ана- аналоги, выполненные в прямой форме. Это выражается в том, что очень часто общее число коэффициентов рц и q-ц оказывается зна- значительно меньшим, чем общее число коэффициентов ац. В последнее время в литературе уделялось достаточно много внимания конструированию двумерных рекурсивных фильтров (см., например, [19 и 20]), поэтому здесь нецелесообразно детально по- повторять эти работы. Однако один из важнейших аспектов двумер- двумерных рекурсивных фильтров, а именно вопрос об их устойчивости, имеет отношение к рассмотренному выше двумерному фильтру, дающему наименьшую среднюю квадратическую ошибку. Так же, как и в одномерном случае, неустойчивые двумерные рекурсивные фильтры создают выходные сигналы, не ограниченные по величине. Многие из существующих способов расчета приводят к созданию таких фильтров, которые нуждаются в дополнительной стабилиза- стабилизации. Это означает, что знаменатель дроби G.11) [полином обрат- обратной связи] Q(z, до) не может обращаться в нуль, когда \z\ и |до| одновременно равны или меньше единицы, а из этого условия сле- следует, что функция Q(z, w) является минимально-фазовой. Разработан ряд методов стабилизации фильтров. В одном из них используется двумерный комплексный кепстр [21, 22], другой основан на вычислении двумерного преобразования Гильберта, свя- связанного с логарифмом модуля спектра Q(z, w) [23]. В обоих ме- методах стараются превратить знаменатель Q(z, w) в минимально- фазовую функцию, но в обоих случаях при реализации фильтра могут встретиться трудности. Еще один метод основывается на постулате [24], который вы- выполняется во многих случаях (хотя недавно найден [25] пример, в котором он несправедлив): если имеется произвольный конечный массив (матрица) X, составленный из действительных чисел, то двумерный массив (матрица), который с минимальной средней
540 глава 7 квадратической ошибкой аппроксимирует матрицу, обратную к X, является (по всей вероятности!) минимально-фазовым. Чтобы обеспечить устойчивость фильтра, необходимо выполнить .следующее: 1. Найти матрицу Q', которая с минимальной средней квадрати- 'ческой ошибкой аппроксимирует матрицу, обратную к матрице знаменателя передаточной функции фильтра, путем решения зада- задачи Требуемый результат »- D Q' • Q = С Характеристика фильтра Входной сигнал Фактический результат где D — матрица с единичным импульсом, имеющая вид  0 0 ... 0" ?> = о о о - - • о 0 0 0 0 В данной задаче входной сигнал Q является матрицей размерами ([j,Xv). Будем считать, что матрица Q', которая с минимальной средней квадратической ошибкой аппроксимирует матрицу, обрат- обратную к Q, и называется здесь характеристикой фильтра, имеет раз- размеры (тХп). Тогда требуемый результат D и фактический резуль- результат С образуют матрицы размерами ([m+ц—l]X[n+v—1]). Вы- Вышеупомянутый постулат позволяет предполагать, что матрица Q' является минимально-фазовой. 2. Затем следует найти матрицу, которая с минимальной сред- щей квадратической ошибкой аппроксимирует матрицу, обратную матрице Q', путем решения задачи Требуемый результат — >¦ D Q * Q' = с Характеристика Входной сигнал Фактический фильтра результат На данном этапе входным сигналом является матрица Q', имею- имеющая размеры (тХл). В общем случае желательно, чтобы матрица •Q, играющая здесь роль характеристики фильтра, имела те же раз- размеры, что и матрица Q, стоящая в знаменателе передаточной функ- функции стабилизируемого фильтра, т. е. (j^Xv). Тогда матрицы тре- требуемого результата D и фактического результата С опять должны иметь размеры ([m + \i— l]X[«+v—1]). Приведенный выше посту- постулат позволяет предполагать, что матрица Q минимально-фазовая. Поскольку матрица Q' с минимальной средней квадратической ошибкой аппроксимирует матрицу, обратную матрице Q, a Q — .матрицу, обратную Q', то можно сделать вывод, что Q — минималь-
^ Применение ЦОС в геофизике 54_1 но-фазовая матрица, аппроксимирующая матрицу Q, которая стоит в знаменателе передаточной функции стабилизируемого рекурсив- рекурсивного фильтра. Стабилизация достигается путем замены массива Q на его минимально-фазовую аппроксимацию Q. Такой метод дал положи- положительные результаты при решении широкого круга реальных задач, связанных с расчетом фильтров, однако существование примера, ¦опровергающего универсальность постулата, указывает на необхо- необходимость дальнейших исследований. Этот вопрос более подробно рассмотрен в статье [26]. В большинстве практических случаев желательно, чтобы рекур- рекурсивный фильтр имел нулевую фазовую характеристику. Поскольку равенство G.11) определяет передаточную функцию A (z, w) толь- только в первом квадранте (т. е. k, I, m, п>0), то устойчивый рекурсив- рекурсивный фильтр с нулевой фазовой характеристикой можно получить. если положить где As(z, w) —передаточная функция рекурсивного фильтра, в зна- знаменателе которой стоит минимально-фазовая функция Q(z, w). Подставив z = e-iat и w~iax, где шг и а>х— угловые частоты по осям tux соответственно, получим откуда следует, что Таким образом, G(a>t, a,x) имеет нулевую фазовую характеристику, а ее амплитудно-частотная характеристика равна квадрату ампли- амплитудной характеристики As(z, w). Ряд других способов синтеза фильтров с нулевыми фазовыми характеристиками описан в рабо- работе [20]. 7.8. Выводы В настоящей главе было показано, каким образом плоская го- горизонтально-слоистая модель Земли используется для разработки методов анализа сейсмической информации. Хотя такая модель и является упрощенной, но большинство методов обработки резуль- результатов сейсморазведки было создано на ее базе, и, кроме того, она является основой, на которой можно построить более сложные мо- модели. Поскольку в сейсморазведке приходится обрабатывать значи- значительные объемы информации, большинство сейсмических моделей должно быть статистическими. Данные, получаемые во время прак- практических поисков месторождений нефти и газа, должны быть про- анализипгтяны и 1?1мг>™ЛттпПпПм,,
542 Глава 7 Чтобы модель соответствовала практическим условиям измере- измерений, она должна отражать присутствие помех и неполную досто- достоверность данных, т. е. содержать статистические параметры. В 'большинстве (если не во всех) отраслях .науки, изучающих окру- окружающий нас мир, статистические данные и статистические методы используются очень широко, причем во многих областях челове- человеческой деятельности статистические методы оказываются совер- совершенно незаменимыми. В геофизике, как и в любой другой отрасли науки, научные методы неразрывно связаны с созданием моделей. После внедрения цифровых методов обработки больших объемов сейсмической информации широкое применение научных моделей стало просто необходимым. В результате при построении моделей были достигнуты значительные успехи, что позволяет пользоваться современными геофизическими моделями как в ходе поиска место- месторождений нефти и газа, так и для развития более совершенных методов поиска. В данной работе описан ряд математических моделей, которые нашли применение в практике обработки сейсморазведывательной информации. Список подобных моделей, однако, здесь никоим об- образом не исчерпан, скорее сделана попытка выделить модели, кото- которые могут представлять интерес для специалистов, занимающихся обработкой сигналов в других областях науки. Опущено, например, описание метода гомоморфной фильтрации [27], поскольку этот эффективный метод был создан применительно к обработке рече- речевых сигналов и рассмотрен в гл. 3. В этой главе описаны многие из применяемых в настоящее вре- время методов цифровой обработки сигналов. Рассмотрены как много- многомерные, так и многоканальные задачи, и, по-видимому, одним из наиболее важных приемов среди приведенных здесь является ме- метод преобразования многомерных задач в эквивалентные много- многоканальные, для решения которых можно пользоваться известными способами. Хотя существуют различные источники энергии, но автомобили, самолеты, поезда и корабли используют в качестве топлива нефте- нефтепродукты. Месторождения жидкой нефти располагаются глубоко под Землей и отыскивают их обычно с помощью сейсмического зондирования. В тех геологических районах, где коэффициенты отражения малы по величине и образуют случайные последова- последовательности, на сейсмограмме хорошо выделяются первичные отра- отражения и такие записи можно интерпретировать визуально. Так в большинстве случаев получалось в период с 1930 по 1960 г. Однако увеличение спроса на нефть привело к поискам в таких геологиче- геологических районах, где записи сейсмических сигналов не имеют столь благоприятного характера. Интерпретация записей из этих слож- сложных районов часто была невозможной, так как многократные от- отражения различных видов полностью скрывали полезные первич- первичные отражения. В частности, в эту категорию попадают оайоны
Применение ЦОС в геофизике 543 прибрежного шельфа, поскольку поверхности слоев воды и ила имеют большие коэффициенты отражения. Последнее приводит к многократным отражениям (или реверберации), называемым зво- звоном. В результате первичные отражения оказываются неразличи- неразличимыми. Чтобы обеспечить возможность сейсморазведки в таких «трудных» районах, и были разработаны цифровые методы, с по- помощью которых удается ослабить или полностью подавить мешаю- мешающие многократные отражения. Путем фильтрации, прямого сумми- суммирования записей и применения других методов подавления следов многократных отражений первичные записи превращают в обрабо- обработанные данные, которые поддаются интерпретации. В 60-е годы в нефтеразведке произошла «цифровая революция», и теперь резуль- результаты сейсморазведки практически полностью записываются в циф- цифровой форме. Далее их обрабатывают на ЦВМ, и получается ито- итоговая сейсмограмма, которую можно интерпретировать с целью оконтурирования подземных неоднородностей. В результате боль- большие геологические районы, ранее с трудом поддававшиеся изуче- изучению, стали доступными для активных поисков нефти и газа. ЛИТЕРАТУРА 1. Wood L. С, Treitel S., Seismic Signal Processing, Proc. IEEE, 63, 649—661 A975). [Имеется перевод: Вуд, Трейтел. Обработка сейсмических сигналов.— ТИИЭР, 1975, т. 63, № 4.] 2. Robinson E. A., Predictive Decomposition of Time Series with Applications to Seismic Exploration, Ph. D. Thesis, Department of Geology and Geophysics, MIT, Cambridge, Mass., 1954, см. также Geophysics, 32, 418—484 A967). 3. Peacock K. L., Treitel S., Predictive Deconvolution — Theory and Practive, Geophysics, 34, 155—169 A969). 4. Robinson E. A., Random Wavelets and Cybernetic Systems, Charles Griffin & Co. Ltd., London, 1962. 5. Levinson N., The Wiener RMS (Root Mean Square) Error Criterion in Filter Design and Prediction, /. Math. Phys., 25, 261—278 A947). 6. Treitel S., Robinson E. A., The Design of High-Resolution Digital Filters, IEEE Trans. Geosci. Electron.-, GE-4, 25—38 A966). 7. Lorentz H. A., Einstein A., Minkowski H., Weyl H., The Principles of Relati- Relativity, a Collection of Original Memoirs, Methuen, 1923; reprinted by Dover, New York, 1958. [Имеется перевод: Лоренц Г. А., Пуанкаре А., Эйнштейн А., Мин- ковский Г. Принцип относительности. Сборник работ классиков релятивиз- релятивизма.— м. — Л.: ОНТИ, 1935.] 8. Anderson T. W., An Introduction to Multivariate Statistical Analysis, Wiley, New York, 1958. [Имеется перевод: Андерсон Т. Введение в многомерный ста- статистический анализ. — М.: Физматгиз, 1963.] 9. Yule G. U., On a Method of Investigating Periodicities in Disturbed Series, with Special Reference to Wolfer's Sunspot Numbers, Phil. Trans., A 226, 267— 298 A927). 10. Walker G., On Periodicity in Series of Related Terms, Proc. Roy. Soc, A 131, 513—532 A931). 11. Wold H., A Study in the Analysis of Stationary Time Series, Almquist and Wiksells, Uppsala, Sweden, 1938. 12. Robinson E. A., Wold H., Minimum-Delay Structure of Least-Squares and Eo-Ipso Predicting Systems for Stationary Stochastic Processes, in Proceedings of the Symposium on Time Series Analysis, M. Rosenblatt, ed., Wiley, New York. 1963, oo. 192—196.
544 Глава 7 13. Burg J. P., Maximum Entropy Spectral Analysis, Ph. D. Thesis, Department of. Geophysics, Stanford University, Stanford, Calif., 1975. 14. Graybill F. A., Introduction to Matrices with Applications in Statistics, Wads- worth, Belmont, Calif., 1969. 15. Robinson E. A., Mathematical Development of Discrete Filters for the Dete- Detection of Nuclear Explosions, /. Geophys. Res., 68, 5559—5567 A963). 16. Wiggins R. A., On Factoring the Correlations of Discrete Multivariable Sto- Stochastic Processes, Ph. D. Thesis, Department of Geology and Geophysics, MIT, Cambridge, Mass., 1965, 17. Simpson S. M., Recursive Schemes for Normal Equations of Toeplitz Form, Chapter 4 of Scientific Report No. 7 of Contract AF 19 F04) 7378, ARPA Project VELA-UNIFORM, MIT, Cambridge, Mass., 1963. 18. Wiggins R. A., Robinson E. A., Recursive Solution to the Multichannel Filtering Problem, /. Geophys. Res., 70, 1885—1891 A965). 19. Mersereau R. M., Dudgeon D. E., The Representation of Two-dimensional Se- Sequences as One-dimensional Sequences, IEEE Trans. Acoust. Speech Signal Pro- Processing, ASSP-22, 320—325 A974). 20 Read R. R., Shanks J. L., Treitel S., Two-dimensional Recursive Filtering, To- Topics in Applied Physics, 6, Springer, New York, 1975, pp. 131—176. [Имеется перевод: Рид Р., Шенкс Дж., Трейтел С. Двумерная рекурсивная фильтра- фильтрация.— В кн.: Обработка изображений с цифровой фильтрацией./Под ред. Хуанга. —М.: Мир, 1979.] 21. Dudgeon D. E., Two-dimensional Recursive Filtering Ph. D. Thesis, Depart- Department of Electrical Engineering, MIT, Cambridge, Mass., 1974. 22. Pistor P., Stability Criterion for Recursive Filters, IBM J. Res. Develop., 18, 59—71 A974). 23. Read R. R., Treitel S., The Stabilization of Two-dimensional Recursive Filters via the Discrete Hilbert Transform, IEEE Trans. Geosci. Electron., GE-11, 153—160, 205—207 A973). 24. Shanks J. L., Treitel S., Justice J. H., Stability and Synthesis of Two-dimensio- Two-dimensional Recursive Filters, IEEE Trans. Audio Electroacoust., AU-20, 115—128 A972). 25. Genin Y., Kamp Y., Counter Example in the Least-Squares Inverse Stabilization of 2-D Recursive Filters, Electron. Letters, 11, 330—331 A975). 26. Jury E. I., Kolavennu V., Anderson B. D. O., Further Proof of Shanks' Conjectu- Conjecture for Low Degree Polynomial, Proc. IEEE, 1977. [Имеется перевод: Джу- ри Э. И., Колавенну В. Р., Андерсон Б. Д. О. Стабилизация некоторых дву- двумерных цифровых фильтров. — ТИИЭР, 1977, т. 65, № 7, с. 85—92.] 27. Oppenheim А. V., Schafer R. W., Stockham T. G., Nonlinear Filtering of Mul- Multiplied and Convolved Signals, Proc. IEEE, 56, 1264—1291 A968). [Имеется перевод: Оппенхейм А. В., Шефер Р., Стокхэм Т., мл. Нелинейная фильтра- фильтрация сигналов, представленных в виде произведения и свеотки. — ТИИЭР. 1968, т. 56, № 8, с. 5—34.]
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Автокорреляция при анализе речи 161, 172—179 — в сейсмологии при инверсной свертке 489, 490, 505—509 Адаптивная дельта-модуляция 43, 56—59 — импульсно-кодовая модуляция 59, 60 Активные гидролокационные системы калмановокая фильтрация 415, 427 — квадратурная демодуляция 391, 392, 396—399 — обнаружение целей 391, 398, 399, 407—410, 427 обработка импульсных по- последовательностей 411—416, 426— 428 — •— с учетом особенностей водной среды 404—410, 423—426 — • разрешение по дальности и скорости 391, 398—410, 421, 427 согласованная фильтрация 391—403 — — — широко- и узкополосные 394 Алгоритм адаптации шага 56 — Блэкмена — Тьюки 452, 453 Анализ речи гомоморфный 161-—169 кратковременная автокорре- автокорреляционная функция 161 кратковременный базис 149— 161 линейное предсказание 169— 179 модель 144 на основе z-преобразования с ЛЧМ-фильтрацией 153 примеры 138 синтез гомоморфный 163—169 линейное предсказание 169—179 модель 144 примеры 138 Аналоговая искусственная ревербе- рация 78—80 — линейная частотная модуляция (ЛЧМ) 388 — магнитозапись 74, 75 — функция неопределенности 291 Аналоговый монтаж 75—78 Аналого-цифровое преобразование адаптивная дельта-модуляция 43, 56—59 ИКМ 59, 60 дельта-модуляция 43, 52—56 ИКС с плавающей запятой 43, 49—52 линейная ИКМ 43—48 — — разрядность 340—342 — — уровни квантования 336—340 шаг квантования 323, 336, 338 Аппроксимация Падэ 184 Батиметрический профиль 373, 374 Блочный ход Хемминга 73 Быстродействующий цифровой про- процессор (БЦП) 329 Быстрое преобразование Фурье ¦ в системах активных 419 — — пассивных 455—457 для восстановления записей Кару зо 126 ¦ • — ¦ изображений 230, 246—249 ¦ исследования громкого- громкоговорителей 117—120 •— реконструкции изобра- изображений 194 Верность воспроизведения 206 Вероятность ложной тревоги 323 Взвешивание в эхо-подавителях 28, 29 Вибрирующее эхо 89 Винеровская фильтрация 235—239 Влияние турбулентности атмосферы на качество изображения 250—252
546 Предметный указатель Вокодеры гомоморфные 161—169 — канальные 161—169 — на основе линейного предсказа- предсказания 169—179 Восприятие изображения 198—203 Воспроизведение звуковых сигналов 39, 106-200 — изображений по проекциям 253— 259 с помощью теоремы о проек- проекции и сечении 256—258 Восстановление аналогового изобра- изображения 205 — записей Карузо 126—130 — изображений 194, 204—207, 253— 259 — — аналоговых 205 — — цифровых 205—207 Впечатление пространства 106 Временное разделение каналов 12— 16 Временной анализ в гидролокации 452—463 Время реверберации • моделирование на мини-ЭВМ 85—94 определение 83, 107 Выравнивание спектра 40 Генератор радиолокационных сигна- сигналов 331, 332 Гидролокационные сигналы 391—403 Гидролокационные сигналы в виде псевдослучайной последовательно- последовательности импульсов 393, 394 •— — — функция неоп- неопределенности 401, 402 Глубоководное распространение аку- акустических волн 373, 376—380 Голосовой тракт 139 модель речеобразования 139 импульсный отклик переходная характеристика 144, 164, 165, 170 частотный отклик 164, 165 Гомоморфная обработка в геофизике 542 — звукотехнике 120—130 для восстановления изображе- изображения 240 повышения качества изо- изображений 260—262 речи 161—169 Гомоморфный вокодер 167—169 График Венца 381, 382 Дальномерный интервал приема 276 Дальности о- доплеровское разрешение .491 ЯРЯ—410. 421. 427 Двумерный рекурсивный фильтр в. геофизике 539—541 Дельта-модуляция — АЦП звуковых сигналов 43, 52— 56 — для сжатия изображения 217 Детектирование тональных сигналов. 20—23 Динамическая инверсная свертка» 492—509 — прогнозирующая инверсная сверт- свертка 505—508 Дискретизация изображений 203,204- Дифференциальная импульсно-кодо- вая модуляция 212, 214—219 Доолеровский сдвиг в радиолокации. для разрешения по азимуту 356—358 — — измерение 275, 290 Доплеровское размытие 404, 425,435- Запись звука 39, 66—96 — изображения 198—203 Затягивание фронтов при дельта- модуляции 54 Звуковой динамический диапазон в музыкальных системах 56 при дельта-модуляции 56 • ИКМ с плавающей запя- запятой 49—51 магнитозаписи 67 регулировка слушателем 131 сжатие 40 Звуковые психоакустические факторы 60—65 Зрение человека 207—209 Изменение темпа речи 156 Импульсно-кодовая модуляция адап- адаптивная 59, 60 линейная 43—48 ¦ с плавающей запятой 43, 49— 52 Импульсные радиолокаторы 276—278- Инверсная свертка гомоморфная 165, 166, 180 — — динамическая 492—509 прогнозирующая 488—492 Интервал приема 276 Искажения, вызываемые наложением частот, 23—27 Искусственная реверберация 40, 78— 94 Калмановская фильтрация 415, 427 Квантование звуковых сигналов 45 — изображений 203, 204 — радиолокационных сигналов 335— 342
Предметный указатель 547 Кодирование в гидролокации 415, 427 — для сокращения избыточности изображений 219—221, 223—227 Компандеры для передачи звука 98—103 Компенсация с помощью обратной связи при дельта-модуляции 56 Корреляционный приемник 397—403, 420 Кратковременный анализ речи набо- набором фильтров 150 с помощью БПФ 150—152 Музыкальные эксперименты с по- помощью мини-ЭВМ 89—94 Неоднозначность по скорости в им- импульсных радиолокаторах 276—278 при обработке пачек им- импульсов 293 Неопределенная инверсная свертка в звукозаписи 123—130 Нечувствительность уха к фазе 165 Нули в спектре речи 145, 146, 179 •Линейная нмпульсно-кодовая моду- модуляция 43—48 Логарифмическая ИКМ 11, 59 Магнитофоны. См. также Цифровая магнитозапись — аналого-цифровое преобразование 68 — блочный код Хемминга 73 — коды с исправлением пакета оши- ошибок 73 — кольцевая буферная память 68— 70 — методы модуляции 71 .Маскировка вперед 63 — назад 63 Междугородный коммутатор 12 Межкадровое сжатие 227 Метод Колмогорова 504 — максимального правдоподобия 460—462, 472, 473, 475 — максимальной энтропии 459—462, 472, 473 — Нокса —Томпсона 250, 251 — нормальных уравнений 504 — Писаренко 4&1 — Фридена B47, 248 Мини-ЭВМ для экспериментов в му- музыке 89—94 Многолучевое распространение в гид- гидроакустике 379 Модель акустического волновода, предложенная Пекерисом 374—376 — голосового тракта только с полю- полюсами 170 — для звонких звуков 139 — на основе линий задержки с от- отводами 423—426 — речи 139—143 —¦ — ва основе передаточной функ- функции с нулями и полюсами 179— • 185 Модулятор Уивера 16—20 Модуляция наложения 23—27 Обнаружитель движущихся целей (ОДЦ) 346—354 Обработка импульсных последова- последовательностей в гидролокаторах 411 — 416, 426—428 — сигналов адаптивной антенной ре- решетки в гидролокаторах 470—477 антенной решетки в пассивной гидролокации 441—452, 463—477 Обратная фильтрация для повы- повышения резкости изображений 233— 236 Ограничители 24—26 Однополосная модуляция-демодуля- модуляция-демодуляция 16—20 Окоптуривание изображений 263 Окружающий шум в гидролокации 370, 371, 380—383, 425, 426 Оператор ошибки вспоминания 529 — — предсказания 492 Оператор предсказания при инверс- инверсной свертке 490, 509—511 формирование сейсмических сигналов 528—531 Осадочная система 494—609 Особенности обработки гидроакусти- гидроакустических сигналов 404—410, 423—426 Отражательная способность морско- морского дна 383—385 Оценка дальности — скорости в гид- гидролокации 398—410 Ошибки квантования импульсно-кодовая модуляция 45 квантование изображений 203 Пассивные гидролокационные систе- системы — векторная форма представ- представления сигналов 441—445 • — обработка сигналов антен- антенной решетки 441—452, 463—477 потери на поглощение 373 представление энергетиче- энергетических спектров 439—44-1
548 Предметный указатель — пространственный анализ 463—477 спектральный анализ 452— 463 Пачка импульсов 290—294 Передающие терминалы систем с ча- частотным разделением каналов (ЧРК) 16—20 Перестраиваемое БПФ 313, 316—319 Период повторения 276 Плотностное изображение 202 Повышение качества изображений на основе статистических данных 263 — — — пространственная фильтра- фильтрация 260, 261 точечные операции 262—264 — резкости изображений 228—251 винеровская фильтрация 235—239 ¦— меняющихся в пространстве 248—291 метод Нокса,— Томпсона 250, 251 — метод уравнивания энерге- энергетических спектров 239—245 — нелинейные методы 246— ¦248 ¦ обратная фильтрация 233— 236 Подавители — в радиолокаторах с селекцией движущихся целей 343—346 — звуковых эхо 123—125 — телефонных эхо 27—30 Подавление местных помех 343—346 Подводная связь 394, 410, 415, 427, 434—436 — система свяаи с частотной мани- манипуляцией 434, 435 Полная реверберация 84 Положение нулей диаграммы направ- направленности 445, 446, 471 Полосный вокодер 157—161 Помехи от земной поверхности 348— 354 Послоговый алгоритм 52 Построение геофизических моделей 486, 487 Потери на поглощение, гидролокация 371—380 Поточная обработка радиолокацион- радиолокационных сигналов 278—281 Преобразование Карунена — Лоэва 220—224 — контрастностей 262, 263 Преобразователи акустические 367, 388, 442—445 — звуковые 40, 41, 106—120 Приборы с зарядовой связью для го- гомоморфной обработки речи 169 кратковременного ана- анализа речи 153 Применения гидролокации 368—370, 428—436, 477, 478 Прогнозирующая инверсная свертка в сейсмологии 488—492 Программируемое устройство вторич- вторичной обработки 327—330 Программируемый процессор для; контрольных измерений канала» связи 33—36 Проекции изображения 253—1259 Пространственно-частотная фильтра- фильтрация для повышения качества изо- изображения 260, 261 Пространственный анализ в гидроло- гидролокации 463—477 Радиолокатор с селекцией движу- движущихся целей 343—346 синтезированной апертурой Различение глухой и звонкой речи 159—161 Разрешение по азимуту в радиоло- радиолокаторе с синтезированной аперту- апертурой 354—358 Разрешение по скорости в гидроло- гидролокации 391, 398—403 Разрешение по скорости в радиоло- радиолокаторах с селекцией движущихся целей 343—346 Раскачивающий шум 46 Распространение акустических вол» в воде 370—389 Реверберация в гидролокации 371, 372, 380, 382, 383, 425 — искусственная 40, 78—94 — концертных залов 106—110 Регистрация изображения 198—203 фотохимическая 198—200, 202 фотоэлектронная 200—202 Рекурсивный алгоритм Левинсона 178 Рыскание при дельта-модуляции зву- звуковых сигналов 54 Связные передающие терминалы временное уплотнение ка- каналов 13—16 частотное уплотнение кана- каналов 16—20 Сглаживание кепстра 165—167 Сейсмограммы 487, 532 Сжатие импульсов в падиолокаДЕй 257, 258, 274, 286—290 Сжатие спектра речи 138, 157
Предметный указатель 549 Сигналы гидролокационные 391—394, 400—403 — радиолокационные 284—290, 331— 332 Синтез речи гомоморфный 161—169 кратковременный 155, 156 Синтезаторы, воспроизводящие пере- передаточную функцию голосового тракта 144—146 Система временного сжатия на ли- ниях задержки 417—419 — зрения 207—209 Системы обработки данных в радио- радиолокации 268, 270—272 Системы с Г-несущей 10, 11 Слоистые структуры в геофизике 494 Собственный шум в гидролокации 380 Согласованная фильтрация в гидро- гидролокации 391—403, 416—422 радиолокаторах 278 Сокращение избыточности изображе- изображений 193, 209—227 Спектрограмма речи узкополоеная 142, 143 — — широкополосная 143 Стробироваиие по дальности 407 доплеровскому смещению 407 Структура поточного БПФ 298—300 Тастатурный набор 20—23 Телескопический режим в радиоло- радиолокаторе с синтезированной аперту- апертурой 361—363 Телефонные каналы 10 Теорема о проекции и сечении 255— 258 Тональное детектирование 20—23 Тональные сигналы 20—23 — 'фильтры 20—23 Точечные операции 262—264 Трановерсальные фильтры 29 Угол скольжения 384, 385 Улучшение линейности устройства отображения 206, 207 Умиожитель-демодулятор 25 Уравнение радиолокации 273 Устранение эхо — — звукотехника 123—1.25 телефония 27—30 Фильтры — калмановские 415, 427 согласованные 391, 403, 416— 422 — обработка изображений винеровокие 235—239 . обратные 233—236 пространственно-частотные 260' — предсказывающие 524—526 двумерные 532—541 — — обострителн 516—524 — радиолокация для подавления помех 345 согласованные 272, 281—286, 294—320, 358 — сейсмология вспоминающие 525, 526 — — формирующие 514—526 — связь вопросы проектирования 31—33 • тональные 20—23 — — трансверсальные 29 Фюрмантные частоты 140, 149, 176— 178 Формантный синтезатор 144—147 Формирование диаграммы направ- направленности 443—449, 463—477 — изображения 196—199, 201—203. Формирующие фильтры 492, 514— 541 Фотохимический метод получения изображения 198—,202 Фотоэлектронный метод получения изображения 198, 200—202 Фронтальная реверберация 106 Функция неопределенности аналоговая 291 «кнопочная» 293 типа «борона» 291 Характеристика отражения 496—501,, 503—505 — пропускания 496—503 Хранение звуковых сигналов 39 Цветные изображения 227 ЦВМ для исследования звуков, р а за- заработанная в Линкольновской ла- лаборатории 329 Цифровая аппаратура — — в системах связи 9, 10, 16, 30—33, 36 гидролокации 419, 420,425,. 436, 452, 478 — — для обработки изображений; 194, 210 звуковая 120, 130, 131 ¦ при обработке речи 153, 169 ¦ радиолокационная 260—270;. 327—330, 332—335, 363
550 Предметный указатель Цифровая коммутация 12, 13 — магнитозапись монтаж и редакция записей 75—78 преимущество перед аналого- аналоговой 74, 75 Цифровое управление многолучевой диаграммой направленности 464— 467 Частота Вяйсяля 386 — повторения импульсов 276, 277 Шум дробления в адаптивных дель- дельта-модуляторах 56—58 дельта-модуляторах 54 ¦ определение 46 — квантования в АЦП, радиолока- радиолокация 336—342 Эффект присутствия 106—ПО Яркостное изображение 203
ОГЛАВЛЕНИЕ Предисловие редактора перевода 5 Предисловие 7' Глава 1. Некоторые применения цифровой обработки сигналов в системах связи 9' 1.1. Введение 9 1.2. Обзор систем связи Ю 1.3. Цифровая передача 10 J.4. Цифровая коммутация 12 1.5. Цифровая обработка сигналов в передающих терминалах с им- пульсно-кодовой модуляцией 13 1.6. Цифровая обработка сигналов в передающих терминалах с ча- частотным разделением каналов 16 1.7. Детектирование тональных сигналов 20 1.8. Искажения из-за наложения частот, влияние нелинейности . . 23 1.9. Контроль эхо-сигналов 27 1.10. Особенности разработки элементов аппаратуры систем с цифро- цифровой обработкой сигналов . 30 1.11. Некоторые применения программируемого процессора цифровых сигналов 33 1.12. Заключение 36 Глава 2. Цифровая обработка звуковых сигналов 39 2.1. Введение 39 2.2. Основы аналого-цифрового преобразования 42 2.3. Звукозапись 66 2.4. Передача программ с помощью радиовещания и других средств 96 2.5. Прием электрических звуковых сигналов и преобразование их в акустические колебания 106 2.6. Проектирование громкоговорителей 112 2.7. Более совершенные методы обработки сигналов 120 2.8. Заключение 130 Глава 3. Цифровая обработка речевых сигналов 137 3.1. Введение |37 3.2. Модель речевого сигнала '39' 3.3. Речевые синтезаторы, воспроизводящие передаточную функцию голосового тракта, и синтезаторы—аналоги акустической трубки 144 3.4. Спектральный анализ на коротких интервалах времени н синтез речи 149 3.5. Гомоморфный анализ и синтез речевых сигналов J°' 3.6. Анализ — синтез методом линейного предсказания .... 1°9 3.7. Моделирование речи с применением передаточной функции, со- содержащей полюсы и нули |у9 3.8. Заключение 1°° Глава 4. Цифровая обработка изображений !•*"' 4.1. Введение 192 4.2. Основные понятия 195 4.3. Применение цифровой обработки для сокращения избыточности изображений 209 4.4. Повышение резкости изображений 228 4.5. Воспроизведение изображений по проекциям 2j.3 4.6. Повышение качества изображений 259»
Оглавление Глава 5. Применения цифровой обработки сигналов в радиолокации . . 268 5.1. Введение 268 5.2. Параметры, измеряемые радиолокатором 273 5.3. Импульсные радиолокаторы 275 5.4. Теория обработки радиолокационных сигналов 281 5.5. Реализация согласованного фильтра 294 5.6. Пример системы цифровой обработки радиолокатора . . . 300 5.7. Цифровые интегральные микросхемы . 332 5.8. Аналого-цифровые преобразователи 335 5.9. Радиолокаторы с селекцией движущихся целей 343 5.10. Радиолокатор с синтезированной апертурой 354 5.11. Заключение 363 Замечание 364 Глава 6. Обработка сигналов в гидролокации 366 6.1. Введение 366 6.2. Характеристики распространения гидролокационных сигналов 370 6.3. Цифровая обработка сигналов в активных гидролокационных системах 389 6.4. Пассивные гидролокационные системы" и цифровая обработка сигналов . 436 6.5. Заключительные замечания 479 • Глава 7. Цифровая обработка сигналов в геофизике 486 7.1. Введение 486 7.2. Метод прогнозирующей инверсной свертки 488 7.3. Метод динамической инверсной свертки 492 7.4. Свойство минимальной задержки оператора предсказания на еди- единичный интервал предсказания 509 7.5. Формирующие фильтры 514 7.6. Рекуррентные способы решения нормальных уравнений, содержа- содержащих тёплицевы формы 526 7.7. Двумерные формирующие фильтры 532 7.8. Выводы . ¦ 541 [Предметный указатель 545 п/р А. Оппенгейма ПРИМЕНЕНИЕ ЦИФРОВОЙ ОБРАБОТКИ СИГНАЛОВ Ст. научный редактор Л. П. Якименко. Младший научный редактор Н. А. Качинская. Художник В. И. Харламов. Художественный редактор А. Е. Безрученков. Технический ре- редактор Л. П. Бирюкова. Корректор Б. С. Соколов И Б № 2025 Сдано в набор 16.04.80. Подписано к печати 18.08.80. Формат 6OX90'/ie. Бумага типограф- типографская № 1. Гарнитура литературная. Печать высокая. Объем 17,25 бум. л. Усл. печ. л. 34,50. Уч.-изд. л. 36,62. Изд № 20/0441. Тираж 12 000 экз. Зак. 359. Цена 2 р. 90 к. Издательство «Мир». Москва, 1-й Рижский пер., 2, Московская типография № 11 Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли, Москва, 113105, Нагатинская аш., д. 1.